교차 데이터베이스 조인을 위한 성능 향상

중요: 이 기능은 일시적으로 Tableau 외부로 데이터를 이동합니다. 연결되는 데이터베이스가 신뢰할 수 있는 출처에서 제공되었는지 확인하십시오.

단일 파일 및 단일 데이터베이스에서 데이터를 조인할 때 Tableau가 Hyper 대신 데이터베이스를 사용하여 조인을 수행할 수 있게 하여 성능을 향상시킬 수 있습니다. 이 옵션을 사용하도록 설정하면 Tableau가 가장 빠른 옵션(Hyper 또는 연결된 데이터베이스)을 선택합니다. Tableau가 연결된 데이터베이스를 사용하는 경우 파일 연결의 데이터가 데이터베이스의 임시 테이블로 이동되고 거기에서 조인이 수행됩니다.

기능 조건

이 옵션은 다음 조건이 충족되는 경우에만 사용할 수 있습니다.

  • 데이터 원본은 하나 이상의 파일 기반 연결과 단일 SQL 기반 연결로 구성됩니다.
  • 파일이 Microsoft Excel, PDF 또는 텍스트(.csv, .txt, .tsv 또는 .tab) 파일 유형입니다.
  • 연결된 데이터베이스는 다음 중 하나입니다.
    • Microsoft SQL Server
    • Oracle
    • PostgreSQL
    • Vertica
    • Teradata
  • 조인 유형은 Inner 조인입니다.
  • 웹 작성에서: 사용자가 웹 작성을 사용하도록 허용 옵션을 사용하도록 설정되어 있습니다.

기능 조건 재정의

관리자는 파일 크기, 조인 유형 및 단일 파일 연결 제한을 재정의하고 Tableau가 라이브 데이터베이스를 사용하여 조인을 수행하도록 지정할 수 있습니다. 이를 통해 최적의 성능 구성을 실험하고 결정할 수 있습니다. 단일 데이터베이스 연결 요구 사항은 계속 적용됩니다.

이 옵션을 사용하도록 설정하려면 명령줄에서 다음 정보를 입력합니다.

  • Tableau Desktop: tableau.exe -DForceAlternativeFederationEngine=true 명령을 입력합니다.
  • Tableau Server: tsm configuration 명령 tsm configuration set -k native_api.force_alternative_federation_engine -v true를 입력합니다.

    Tableau Server에서 구성 값을 설정하는 것에 대한 자세한 내용은 Tableau Server 도움말에서 tsm configuration set 옵션(링크가 새 창에서 열림)을 참조하십시오.

교차 데이터베이스 조인을 위한 성능 옵션 사용

  1. 첫 번째 데이터 원본에 연결합니다.
    • Tableau Desktop에서: 시작 페이지의 연결 아래에서 지원되는 파일 형식이나 지원되는 데이터베이스 형식에 연결합니다. 이 단계에서 Tableau 데이터 원본의 첫 번째 연결을 만듭니다.
    • 웹 작성에서: 또는 탐색 페이지에서 만들기> 통합 문서를 클릭하여 새 통합 문서를 시작하고 데이터에 연결합니다. 이 단계에서 Tableau 데이터 원본의 첫 번째 연결을 만듭니다.
  2. 연결하려는 파일 또는 데이터베이스를 선택한 다음 테이블을 두 번 클릭하거나 캔버스로 끌어 놓습니다.

  3. 왼쪽 패널의 연결에서 추가 단추(웹 작성의 )를 클릭하여 Tableau 데이터 원본에 두 번째 연결을 추가합니다.

    교차 데이터베이스 조인 옵션이 표시됩니다.

    참고: 이 옵션이 표시되지 않으면 지원되는 데이터 원본만 사용하고 있으며 데이터 원본이 두 개(파일 하나와 데이터베이스 유형 하나)인지 확인하십시오. 그렇지 않으면 사이트 관리자가 교차 데이터베이스 조인 구성 옵션을 Tableau만 해당으로 설정한 것일 수 있습니다.

  4. Tableau가 조인을 수행하는 방식을 변경하려면 교차 데이터베이스 조인 옵션 옆에 있는 편집을 클릭합니다.
  5. 교차 데이터베이스 조인 대화 상자에서 다음 옵션 중 하나를 선택한 다음 확인을 클릭합니다.
    • Tableau 또는 기존 데이터베이스 사용. 이 옵션을 사용하면 조인을 수행하는 가장 빠른 옵션(Hyper 또는 연결된 데이터베이스)이 Tableau에 의해 자동 선택될 수 있습니다.
    • Tableau만 사용. 이 옵션은 기본값이며 항상 Hyper를 사용하여 조인을 수행합니다.

    사용자가 선택한 항목에 따라 교차 데이터베이스 조인 옵션이 기본 옵션인 Tableau 사용(Hyper 사용)에서 새 옵션인 데이터베이스 사용으로 변경됩니다.

    중요: Tableau 또는 기존 데이터베이스 사용을 선택한 경우 Tableau가 조인을 수행할 때 가장 빠른 옵션을 선택합니다. 이 동작은 조인 유형을 비롯한 조건 집합에 따라 미리 결정됩니다. 예를 들어 Tableau는 Inner 조인이 아닌 조인에 대해 항상 Hyper를 선택합니다.

    Tableau가 Hyper를 사용하여 조인을 수행하는 경우 이 프로세스는 백그라운드에서 수행되며 조인이 수행된 위치를 식별하는 표시기가 나타나지 않습니다.

  6. 한 데이터 원본의 필드를 선택하고, 조인 연산자를 선택한 다음 추가된 테이블에서 필드를 선택하여 하나 이상의 조인 절을 추가합니다. 조인 절을 검사하여 원하는 테이블 연결 방식이 맞는지 확인합니다.

다중 연결 데이터 원본 작업 관련 정보

다중 연결 데이터 원본으로 작업하는 것은 이 섹션에서 설명하는 몇 가지 주의 사항을 제외하면 다른 데이터 원본으로 작업하는 것과 같습니다.

연결 안에서 데이터 유니온

데이터를 유니온하려면 동일한 연결에서 텍스트 테이블 또는 Excel 테이블을 사용해야 합니다. 즉, 서로 다른 데이터베이스의 테이블은 유니온할 수 없습니다. Tableau Desktop에서는 서로 다른 디렉터리에 있는 서로 다른 Excel 통합 문서와 파일 간에서 테이블을 유니온할 수 있습니다. 자세한 내용은 와일드카드 검색을 사용한 테이블 유니온(Tableau Desktop)을 참조하십시오.

서로 다른 데이터베이스의 데이터를 유니온해야 한다면 Tableau Prep(링크가 새 창에서 열림)을 사용하십시오.

데이터 정렬

데이터 정렬은 문자열 값을 비교하고 정렬하는 방식을 결정하는 데이터베이스의 규칙을 나타냅니다. 일반적으로 데이터 정렬은 데이터베이스에서 처리됩니다. 하지만 교차 데이터베이스 조인으로 작업할 때에는 데이터 정렬이 서로 다른 열을 조인할 수 있습니다.

예를 들어 교차 데이터베이스 조인에서 SQL Server의 대/소문자를 구분하는 열과 Oracle의 대/소문자를 구분하지 않는 열로 구성된 조인 키를 사용한다고 가정합니다. 이와 같은 경우 Tableau에서는 값을 잘못 해석하는 일을 최소화하기 위해 한 데이터 정렬을 다른 데이터 정렬에 매핑합니다.

교차 데이터베이스 조인에는 다음과 같은 규칙이 사용됩니다.

  • 한 열에서 ICU(International Components for Unicode)의 데이터 정렬 표준을 사용하는 경우 Tableau에서는 다른 열의 데이터 정렬을 사용합니다.
  • 모든 열이 ICU의 데이터 정렬 표준을 사용하는 경우 Tableau에서는 왼쪽 테이블의 열 데이터 정렬을 사용합니다.
  • ICU의 데이터 정렬 표준을 사용하는 열이 없으면 Tableau에서는 이진 데이터 정렬을 사용합니다. 이진 데이터 정렬에서는 데이터베이스의 로캘과 열의 데이터 유형에 따라 문자열 값을 비교하고 정렬하는 방식이 결정됩니다.

Excel 데이터의 대/소문자 구분 유지

조인을 수행할 때 Excel 데이터의 대/소문자 구분을 유지해야 한다면 데이터 메뉴에서 대/소문자 유지(Excel) 옵션을 사용하도록 설정하면 됩니다.

이 옵션을 선택하면 Tableau가 대/소문자를 유지하고 값을 결합하는 대신 대/소문자가 다른 값을 고유하게 식별하므로 행 수가 달라집니다.

예를 들어 한 워크시트에 'House'가 있고 다른 워크시트에 'house' 및 'HOUSE'가 있을 수 있습니다. 기본적으로 Tableau는 대/소문자를 무시하고 'house'의 세 가지 변형을 모두 동일한 것으로 간주합니다. 대/소문자 유지(Excel) 옵션을 사용하도록 설정하고 테이블을 조인하면 Tableau가 문자의 대/소문자 차이를 유지합니다. "House", "house" 및 "HOUSE"는 서로 다른 값으로 취급됩니다.

참고: 이 옵션은 모든 Tableau 지원 언어에서 사용할 수 있으며 사용 중인 운영 체제의 로캘에 종속되지 않습니다. 이 옵션은 Microsoft Excel 데이터 원본에만 사용할 수 있습니다.

계산과 다중 연결 데이터 원본

계산의 하위 집합만 다중 연결 데이터 원본에 사용할 수 있습니다.

  • Tableau Desktop의 경우: 다음 두 조건을 충족하는 경우 특정 계산을 사용할 수 있습니다.
    • 다중 연결 데이터 원본의 모든 연결에서 지원됩니다.
    • Tableau 추출에서 지원됩니다.
  • 웹 작성의 경우(Tableau Cloud 및 Tableau Server): 다중 연결 데이터 원본의 모든 연결에서 지원되는 특정 계산을 사용할 수 있습니다.

저장 프로시저

다중 연결 데이터 원본에는 저장 프로시저를 사용할 수 없습니다.

연결 안에서 데이터 피벗

데이터를 피벗하려면 동일한 연결에서 텍스트 열 또는 Excel 열을 사용해야 합니다. 즉, 서로 다른 데이터베이스의 열을 피벗에 포함시킬 수 없습니다.

추출 파일을 첫 번째 연결로 만들기(Tableau Desktop만 해당)

다중 연결 데이터 원본에서 추출 파일에 연결할 때 추출(.hyper) 파일에 대한 연결이 첫 번째 연결인지 확인하십시오. 그러면 기본 속성, 계산된 필드, 그룹, 별칭 등에 대한 변경 사항을 비롯한 추출에 속한 모든 사용자 지정이 보존됩니다.

참고: 다중 연결 데이터 원본에서 여러 추출 파일에 연결해야 하는 경우 첫 번째 연결의 추출에 포함된 사용자 지정만 보존됩니다.

파일 기반 데이터에 대한 연결이 포함된 다중 연결 데이터 원본의 추출(Tableau Desktop만 해당)

Excel 같은 파일 기반 데이터가 포함된 다중 연결 데이터 원본의 추출을 게시하는 경우 외부 파일 포함 옵션을 선택하면 파일 기반 데이터가 데이터 원본의 일부로 복사됩니다. 이 경우 파일 기반 데이터의 복사본을 다운로드할 수 있으며 다른 사용자가 해당 콘텐츠에 액세스할 수 있습니다. 파일 기반 데이터에 추출에서 의도적으로 제외한 민감한 정보가 있는 경우 데이터 원본을 게시할 때 외부 파일 포함을 선택하지 마십시오.

데이터 원본 게시에 대한 자세한 내용은 데이터 원본 게시를 참조하십시오.

쿼리 및 교차 데이터베이스 조인 정보

각 연결에 대해 Tableau는 조인의 데이터베이스에 대한 독립적인 쿼리를 보냅니다. 결과는 추출 파일의 형식으로 임시 테이블에 저장됩니다.

중요: 교차 데이터베이스 조인은 데이터베이스 간에 데이터를 이동할 수 있습니다. 조인하려는 데이터베이스가 신뢰할 수 있는 원본인지 확인하십시오.

예를 들어 두 테이블 dbo.listings 및 reviews$에 대한 연결을 만든다고 가정합니다. 두 테이블은 서로 다른 두 데이터베이스인 SQL Server와 Excel에 저장되어 있습니다. Tableau는 각 연결에서 독립적으로 데이터베이스를 쿼리합니다. 데이터베이스는 쿼리를 수행하고 필터 및 계산 같은 사용자 지정을 적용하며 Tableau는 각 연결의 결과를 임시 테이블에 저장합니다. 이 예제에서 FQ_Temp_1은 SQL Server에 대한 연결의 임시 테이블이고 FQ_Temp_2는 Excel에 대한 연결의 임시 테이블입니다.

SQL Server 테이블

Excel 테이블

교차 데이터베이스 조인을 수행하면 Tableau Desktop에서 임시 테이블이 조인됩니다. Tableau가 교차 데이터베이스 조인을 수행하려면 이 두 임시 테이블이 필요합니다.

테이블이 조인된 후 상위 N 필터를 적용하여 데이터 그리드에 처음 1,000개 행만 표시되도록 값 수를 제한합니다. 이 필터는 데이터 그리드의 응답성과 데이터 원본 페이지의 전체적인 성능을 유지기 위해 적용됩니다.

조인된 테이블

피드백을 제공해 주셔서 감사합니다!귀하의 피드백이 제출되었습니다. 감사합니다!