데이터 원본 계획

Tableau의 중심에는 데이터가 있습니다. 사용자나 다른 사용자가 모든 데이터를 사용하여 데이터를 탐색하고, 질문에 답하고, 비주얼리제이션을 작성하는 데 성공할 수 있는지 여부는 기초 데이터에 달려 있습니다.

목표가 일종의 빠른 탐색이나 임시 분석을 수행하는 것이라면 즉시 시작할 수 있으며 몇 가지 데이터에 연결하고 데이터를 끌어 놓아 몇 가지 비주얼리제이션을 작성하여 필요한 정보를 얻을 수 있습니다. 그러나 목표가 여러 번 사용되는 분석이나 데이터 원본을 만드는 것이라면 데이터 원본을 고려하여 계획을 수립하는 것이 최선입니다.

Tableau 데이터 원본

Tableau 데이터 원본은 원본 데이터와 Tableau 사이를 연결합니다. 이것은 근본적으로 데이터의 합계(라이브 연결 또는 추출 형식), 연결 정보, 데이터가 포함된 테이블 또는 시트의 이름 및 Tableau에서 작업하기 위해 데이터를 기반으로 작성한 사용자 지정의 결합입니다. 이러한 사용자 지정에는 데이터가 결합되는 방식 같은 항목과 계산, 이름이 바뀐 필드 및 기본 서식 지정과 같은 메타데이터가 포함됩니다.

Tableau 데이터 원본은 서로 다른 데이터베이스 또는 파일에 대한 여러 데이터 연결을 포함할 수 있습니다. 연결 정보에는 파일 이름 및 경로 또는 네트워크 위치와 같은 데이터의 위치에 대한 정보와 데이터베이스 서버 이름 및 서버 로그인 정보와 같은 데이터 연결 방법에 대한 세부 정보가 포함됩니다.

참고: 데이터 원본데이터 연결이라는 용어는 과거에 분별없이 사용되었으며 오래된 자료에서 명확하게 구분되지 않을 수 있습니다.

또한 Tableau 데이터 원본(데이터와 포함된 모든 사용자 지정에 대한 Tableau의 액세스)과 원본 데이터 자체(예: 데이터베이스 또는 Excel 스프레드시트) 사이의 차이점을 고려하는 것이 중요합니다. 데이터베이스 설계의 측면에서 데이터 원본 계획을 수립하는 것은 이 항목의 범위를 벗어납니다.

Tableau 데이터 원본은 원래 생성된 통합 문서에 내장된 상태로 유지하거나 별도로 게시할 수 있습니다. 게시된 데이터 원본을 사용하면 조정된 데이터 원본을 중앙 집중화하고 확장할 수 있습니다. 자세한 내용은 게시된 데이터 원본을 위한 최상의 방법을 참조하십시오.

Tableau 데이터 원본 고려 사항

무엇보다 먼저, 데이터 원본의 목적을 명확히 해야 합니다. 광범위한 질문이 있는 매우 다양한 사용자를 위해 포괄적인 데이터 원본을 만드는 경우 성능을 위해 최적화된 맞춤형 데이터 원본을 구성하는 경우와 다르게 처리해야 합니다. 시작부터 목표를 아는 것이 중요합니다.

이러한 목표를 염두에 두고, Tableau에서 데이터 원본을 작성하기 전에 고려하고 계획할 몇 가지 항목이 있습니다.

  • 위치 및 액세스
  • 모양 및 정확성
  • 데이터 모델 및 데이터 결합
  • 메타데이터 및 사용자 지정
  • 확장성, 보안성 및 검색 가능성
  • 성능 및 새로 고침

위치 및 액세스

데이터의 위치는 컴퓨터에 있는 단일 excel 파일이나 자신이 만든 Google 스프레드시트와 같이 간단한 것이거나 다양한 기술을 사용하는 다중 데이터베이스와 같이 복잡한 것일 수 있습니다. 또한 액세스에는 데이터베이스에 대한 특정 드라이버 또는 커넥터나 데이터베이스 서버에 대한 로그인 정보가 포함될 수 있습니다.

고려할 질문:

  • 올바른 Tableau 사용자에게 데이터 및 Tableau에 대한 액세스 및 사용 권한이 있습니까?
  • 데이터베이스에 로그인하는 데 사용되어야 하는 사용자 계정은 무엇입니까?
  • 사용자 필터링 또는 행 수준 보안이 필요합니까?
  • 원본 데이터가 온프레미스 또는 클라우드에 있습니까?
  • 지원되는 커넥터가 있습니까?
  • 해당 데이터베이스에 대한 제한 사항이 있습니까(사용하려는 모든 기능을 지원합니까)?

모양 및 정확성

조직에 이미 연결할 수 있는 잘 구조화된 데이터나 활용할 수 있는 ETL 프로세스가 있는 경우가 아니라면 Tableau Prep Builder를 통해 정리 및 변형 작업을 수행하여 데이터를 유용한 형식으로 만들어야 할 수 있습니다.

고려할 질문:

  • Tableau에서 사용할 수 있는 잘 구조화된 데이터가 있습니까?
  • Tableau Prep Builder 및 Tableau Prep Conductor를 사용하여 정리하고 데이터 준비 흐름을 자동화해야 합니까?
  • Tableau에서 기본적으로 가장 좋은 성능을 내는 계산이나 조작은 무엇입니까?
  • 불필요한 데이터가 있습니까? 누락된 데이터가 있습니까?

데이터 모델 및 데이터 결합

Tableau는 데이터 쿼리 방법을 알아야 하며, 이 정보는 Tableau 데이터 모델에 의해 전달됩니다. 데이터가 여러 테이블에서 제공되는 경우 데이터를 결합해야 합니다. 데이터 결합 방법에는 관계, 조인, 유니온 및 혼합이 포함됩니다.

고려할 질문:

  • 데이터가 여러 시스템에 분산되어 있습니까?
  • 각 데이터 테이블을 결합하는 최선의 방법은 무엇입니까?

메타데이터 및 사용자 지정

데이터는 다른 사람이 쉽게 사용하기 어렵게 저장되는 경우가 많습니다. 예를 들어 기본 필드명이 다루기 불편하거나, 사용자 지정 서식이 필요하거나, 약어 또는 코드 정의가 누락되었거나, 공통 계산이 기초 데이터에 없을 수 있습니다. 이러한 정보를 포함하는 메타데이터 계층을 만들면 데이터를 훨씬 쉽게 파악하고 사용할 수 있게 만들 수 있습니다.

고려할 질문:

  • 어떤 계산을 추가해야 합니까?
  • 테이블 및 필드의 이름을 쉽게 이해할 수 있습니까?
  • 필드의 기본 설정이 유용합니까, 아니면 사용자 지정해야 합니까?
  • 데이터에 질문(Ask Data) 또는 Tableau Catalog를 지원하기 위해 필요한 조정이 있습니까?
    지금은 데이터 설명이 다중 테이블 데이터 원본을 지원하지 않습니다.

확장성, 보안성 및 검색 가능성

데이터 원본은 원래 만들어진 통합 문서에 유지되거나(내장된 데이터 원본), 모든 분석과 독립적으로 Tableau Server 또는 Tableau Online에 고유한 콘텐츠 자산으로 게시될 수 있습니다. 이 게시된 데이터 원본을 중앙 집중화하면 여러 사용자가 일관된 데이터 원본에 액세스할 수 있어서 보안과 확장성에 추가적인 이점이 있습니다. 게시된 데이터 원본은 Tableau Catalog 및 추천 항목도 활용할 수 있으며 조직에 신뢰할 수 있는 단일 출처를 제공합니다.

고려할 질문:

  • 데이터 원본이 통합 문서에 내장되어야 합니까?

(다음 질문에서는 데이터 원본이 게시되었다고 가정합니다.)

  • 데이터 원본은 어디에 게시됩니까?
  • 누가 데이터 원본을 소유합니까?
  • 어떤 인증사용 권한이 필요합니까?
  • 인증됩니까?

성능 및 새로 고침

또한 Tableau 데이터 원본은 원본 데이터에 대한 라이브 연결이거나 새로 고침 가능한 추출로 복사할 수 있는 데이터일 수 있습니다. 추출은 분석 성능을 향상시키거나 데이터베이스 시스템의 리소스 누출을 방지합니다.

고려할 질문:

  • 데이터 연결이 라이브여야 합니까, 아니면 추출이어야 합니까?
  • 추출인 경우 새로 고침 일정이 있습니까? (Tableau ServerTableau Online
  • Tableau Online에 게시되는 경우 Tableau Bridge를 사용해야 합니까?

고품질 데이터 원본 작성

적절하게 설계되고 성능이 뛰어난 데이터 원본에는 많은 것이 필요합니다. 첫 번째 시도를 게시할 필요는 없습니다. 좋은 비주얼리제이션을 만드는 것처럼, 데이터 원본 작성은 지속적인 프로세스일 수 있습니다. 처음에는 필요하다고 생각하는 데이터를 결합하고 원하는 비주얼리제이션을 작성할 수 있는지 확인하십시오. 언제라도 뒤로 돌아가 새 계산을 작성하거나 다른 데이터 테이블을 가져올 수 있습니다. 몇 가지 사용자 테스트를 수행하고 동료에게 필드명이 쉽게 이해되는지 물어보십시오.

물론, 확신이 있는 데이터 원본만 게시하고 품질 보증을 통과한 데이터 원본만 인증하는 것이 최선입니다. 데이터 원본이 사용자에게 제공될 경우 사용자가 데이터 원본을 신뢰할 수 있어야 합니다.

데이터 결합

데이터가 단일 테이블에서 제공되는 경우 데이터에 연결하여 데이터 원본을 만들고 테이블을 캔버스로 끌어다 놓아 뷰 작성을 시작할 수 있습니다. 그러나 데이터가 여러 테이블(또는 여러 데이터베이스)에 분산되어 있는 경우 데이터를 결합해야 합니다. 데이터 결합은 데이터 원본 페이지에서 처리합니다.

단일 데이터베이스 다중 데이터베이스
  1. 데이터에 연결합니다. 데이터 원본이 만들어집니다.
  2. 데이터의 테이블 또는 시트를 캔버스에 끌어 놓습니다.
  3. 두 번째 테이블 또는 시트를 캔버스에 끌어 놓습니다. 자동 관계가 형성되었음을 나타내는 이음줄이 형성되거나 두 테이블을 연관시킬 필드를 선택하라는 메시지가 표시된 관계 편집 대화 상자가 열립니다.
  4. 계속 테이블을 추가합니다.
  1. 데이터에 연결합니다. 데이터 원본이 만들어집니다.
  2. 데이터의 테이블 또는 시트를 캔버스에 끌어 놓습니다.
  3. 첫 번째 데이터 테이블을 가져온 후 왼쪽 패널의 연결 머리글 오른쪽에 있는 추가 링크를 클릭합니다.
  4. 왼쪽 패널에서 데이터 연결을 전환한 다음 원하는 테이블을 캔버스에 끌어 놓습니다. 자동 관계가 형성되었음을 나타내는 이음줄이 형성되거나 두 테이블을 연관시킬 필드를 선택하라는 메시지가 표시된 관계 편집 대화 상자가 열립니다.
  5. 필요한 경우 데이터 연결을 전환하여 계속 테이블을 추가합니다.

참고: 서로 다른 데이터베이스 간에서 테이블을 연관시키려면 테이블을 새로운 데이터 원본이 아니라 동일한 데이터 원본 내의 데이터 연결로 추가해야 합니다. 데이터 연결은 왼쪽 패널의 추가 링크에서 추가됩니다. 아래 이미지에서 볼 수 있는 것처럼, 새 데이터 원본은 데이터 메뉴나 데이터 원본 이름 옆에 있는 아이콘의 드롭다운 메뉴에서 만들 수 있습니다.

데이터 결합 방법

관계는 Tableau에서 데이터를 결합하는 기본 방법입니다. 관계는 분석을 위해 여러 테이블에서 데이터를 결합하는 동적이고 유연한 방법입니다. 필요한 경우 테이블을 조인하거나 유니온할 수도 있습니다. 데이터 원본을 혼합할 수도 있습니다. Tableau에서 데이터를 결합할 수 있는 방법에 대한 옵션과 각 방법이 유용한 몇 가지 상황을 살펴보겠습니다.

 

관계 관련 필드를 기반으로 두 테이블 간의 조인에 대한 가능성을 설정합니다. 새로운 고정 테이블을 만들기 위해 데이터를 병합하지 않습니다. 분석 중에 자동으로 컨텍스트에 적합한 조인을 사용하는 관련 테이블을 쿼리하여 해당 분석에 대한 데이터의 사용자 지정 테이블을 생성합니다.

적절한 세부 수준을 유지하고, 데이터를 손실하지 않고, 적절한 집계를 유지하며, Null을 처리합니다.

조인 조인 절 및 조인 유형을 기반으로 두 데이터 테이블을 병합하여 새로운 고정 데이터 테이블을 형성합니다. 동일한 기본 행 구조 전체에 데이터의 새 열을 추가하는 데 자주 사용됩니다.

필드가 모든 테이블에 존재하지 않는 경우 일부 조인 유형에서 데이터 손실이 발생할 수 있습니다. 테이블이 서로 다른 세부 수준에 있는 경우 데이터 중복이 발생할 수 있습니다.

유니온 두 개 이상의 데이터 테이블을 병합하여 데이터의 새로운 고정 테이블을 형성합니다. 동일한 기본 열 구조 전체에 데이터(새 행)를 추가하는 데 사용됩니다.
혼합 둘 이상의 개별 Tableau 데이터 원본에서 작동합니다. 데이터는 분리된 상태로 유지됩니다. Tableau는 데이터 원본을 독립적으로 쿼리하여 뷰에서 해당 시트에 설정된 연결 필드를 기반으로 결과를 시각화합니다. Left 조인의 동작을 따르며 보조 데이터 원본에서 데이터를 필터링할 수 있습니다.

참고: 데이터를 사용자 지정 SQL로 결합하는 것도 가능합니다. 대부분의 경우 캔버스에서 직접 또는 데이터 혼합을 사용하여 데이터를 결합하는 것이 가장 좋습니다. 이렇게 하면 Tableau가 최적화할 수 있는 융통성이 가장 커집니다. 그러나 일부 시나리오에서 사용자 지정 SQL을 사용해야 할 이유가 있을 수 있습니다. 이 경우 Tableau가 사용자 지정 SQL 문을 작성된 대로 실행해야 하기 때문에 성능이 영향을 받을 수 있음에 주의하십시오.

관계

관계는 여러 테이블에서 테이블 간의 공유 필드(열)를 기반으로 데이터를 처리하는 방법입니다. 관계를 설정하여 Tableau에 테이블 간의 행을 연결하는 방법을 알립니다. Tableau는 해당 정보를 유지하지만 즉시 행을 가져오지는 않습니다. 대신 비주얼리제이션이 만들어질 때 관계를 통해 분석에 포함된 필드가 역으로 추적되고 원래 테이블에서 적절한 데이터가 반환됩니다.

비주얼리제이션의 컨텍스트를 벗어나는 단일 테이블로 전체 데이터를 가져오는 일이 없으므로 데이터가 서로 다른 세부 수준에 있는 경우 관계가 유용합니다. 예를 들어 한 테이블에서 일일 강우량에 대한 데이터를 처리해야 하지만 시간별 기온은 다른 테이블에 있을 수 있습니다.

Tableau는 동일한 데이터베이스에 있는 테이블 간의 관계와 서로 다른 데이터베이스에 있는 테이블 간의 관계를 지원합니다.

관계를 사용하여 테이블을 결합하는 방법에 대한 자세한 내용은 데이터 연관 및 다음 Tableau 블로그 게시물을 참조하십시오.

조인

조인은 공통 필드를 통해 관련 테이블을 결합하는 방법입니다. 조인을 사용한 데이터 결합 결과는 데이터의 열을 추가하여 가로로 확장되는 테이블입니다.

Tableau의 데이터 조인 방법에 대한 자세한 내용은 데이터 조인을 참조하십시오.

데이터 혼합

데이터 혼합을 사용하여 데이터를 결합하는 경우 주 데이터 원본이라고 하는 데이터를 하나 이상의 보조 데이터 원본에 있는 공통 필드와 결합합니다.

데이터 혼합은 시트 단위로 데이터 원본이 구성되는 방식을 변경해야 할 경우, 큐브 데이터 원본이나 게시된 데이터 원본과 같이 관계나 조인을 허용하지 않는

데이터베이스를 결합할 경우에 유용합니다.

데이터 혼합을 사용한 데이터 결합 결과는 데이터의 열을 추가하여 가로로 확장되는 가상 테이블입니다. 각 데이터 원본의 데이터는 공통 수준에서 집계된 후 비주얼리제이션에 함께 표시됩니다.

데이터 혼합 작동 방식과 Tableau에서 데이터를 혼합하는 방법에 대한 자세한 내용은 데이터 혼합을 참조하십시오.

유니온

유니온은 값(행)을 테이블에 추가하기 위한 방법입니다. 테이블의 열이 동일한 경우 테이블을 유니온할 수 있습니다. 유니온을 사용한 데이터 결합 결과는 열은 동일하게 유지되지만 데이터 행이 추가되어 세로로 확장되는 가상 테이블입니다.

테이블은 수동으로 유니온하거나 와일드카드 검색을 사용하여 유니온할 수 있습니다. Tableau에서 이러한 방법 중 하나를 사용하여 데이터를 유니온하는 방법에 대한 자세한 내용은 데이터 유니온을 참조하십시오.

이 섹션의 다른 문서

피드백을 제공해 주셔서 감사합니다!