Tableau Catalog 사용

Tableau Catalog(링크가 새 창에서 열림)는 통합 문서, 데이터 원본, 시트, 메트릭 및 흐름을 포함하여 Tableau Cloud 사이트 또는 Tableau Server에 있는 모든 콘텐츠를 검색하고 인덱싱합니다. (레거시 메트릭 기능은 Tableau Cloud 2024년 2월에 사용 중지되었고 Tableau Server 버전 2024.2에서 사용 중지됩니다. 자세한 내용은 메트릭 만들기 및 문제 해결(사용 중지)을 참조하십시오.) 인덱싱은 콘텐츠에 대한 정보 또는 메타데이터라고 하는 콘텐츠의 스키마 및 계보에 대한 정보를 수집하는 데 사용됩니다. 그런 다음 Catalog는 메타데이터에서 Tableau Cloud 사이트 또는 Tableau Server의 콘텐츠에 사용되는 모든 데이터베이스, 파일 및 테이블을 식별합니다.

Catalog는 Data Management 라이선스로 사용할 수 있습니다. 자세한 내용은 Data Management 정보를 참조하십시오.

Catalog뿐만 아니라 Tableau Metadata API(링크가 새 창에서 열림) 및 Tableau REST API에서도 메타데이터 메서드(영문)(링크가 새 창에서 열림)를 사용하여 콘텐츠의 메타데이터에 액세스할 수 있습니다.

Catalog를 사용하도록 설정하기 이전

Tableau Server 관리자가 Catalog를 사용하도록 설정하기 이전과 이후에 Tableau Server 환경에서 Catalog 성능을 최적화하기 위해 고려해야 하는 몇 가지 사항이 있습니다.

필요한 버전

Catalog를 사용하도록 설정하기 전에 Tableau Server의 다음 버전 중 하나를 실행하고 있는지 확인하십시오.

  • 최소 Tableau Server 2019.3.4 이상
  • 최소 Tableau Server 2019.4.2 이상
  • 최소 Tableau Server 2020.1.0 이상
  • 최소 Tableau Server 2020.2.15 이상
  • Tableau Server 2020.3 이상

이러한 버전이 필요한 이유에 대한 자세한 내용은 Tableau 기술 자료를 참조하십시오.

Catalog를 사용할 때 예상되는 작업

Catalog를 사용하도록 설정하면 Tableau Server에 이미 존재하는 콘텐츠가 즉시 인덱싱됩니다.

초기 수집

인덱싱 프로세스는 두 주요 부분으로 구성되어 있으며, 그 중 하나가 초기 수집입니다. 초기 수집은 또 다시 두 추가 구성 요소로 나눌 수 있습니다.

  • 콘텐츠 백필
  • 계보 백필

콘텐츠 백필 및 계보 백필의 상태는 나중에 진행 상태를 모니터링하고 Catalog가 Tableau Server 환경에서 성공적으로 설정되어 실행되고 있는지 확인할 때 중요합니다.

초기 수집 속도

Catalog가 처음 콘텐츠를 인덱싱하는 데 걸리는 시간은 여러 요소에 따라 달라집니다.

  • Tableau Server에 있는 콘텐츠의 양: 콘텐츠의 양은 Tableau Server에 게시된 통합 문서, 메트릭, 게시된 데이터 원본 및 흐름의 총 수로 측정됩니다. 자세한 내용은 메타데이터를 저장하는 디스크 공간을 참조하십시오.

  • 비대화형 마이크로서비스 컨테이너의 수: Catalog는 비대화형 마이크로서비스 컨테이너를 활용하여 Tableau Server의 모든 콘텐츠를 인덱싱합니다. 자세한 내용은 비대화형 마이크로서비스 컨테이너의 메모리를 참조하십시오.

초기 수집에 영향을 주는 요소를 파악하면 환경에서 Catalog를 사용하도록 설정하고 실행하는 데 걸리는 시간을 예상하는 데 도움이 됩니다.

메타데이터를 저장하는 디스크 공간

초기 수집 중에 메타데이터가 생성되고 Tableau Server 리포지토리("관계" PostgreSQL 데이터베이스)에 저장됩니다. 메타데이터를 저장하는 데 필요한 디스크 공간의 양은 현재 리포지토리("작업 그룹" PostgreSQL 데이터베이스)가 사용하는 디스크 공간의 대략 절반입니다.

예를 들어 Catalog를 사용하도록 설정하기 전에 이 리포지토리가 50GB의 디스크 공간을 사용한다면 Catalog를 사용하도록 설정한 후 이 리포지토리가 최대 75GB의 디스크 공간을 사용할 수 있습니다.

비대화형 마이크로서비스 컨테이너의 메모리

초기 수집은 비대화형 마이크로서비스 컨테이너 내부에서 실행됩니다. 비대화형 마이크로서비스 컨테이너는 두 Tableau Server 마이크로서비스 컨테이너(링크가 새 창에서 열림) 프로세스 중 하나입니다. 기본적으로 백그라운더 프로세스가 설치되어 있는 노드마다 비대화형 마이크로서비스 컨테이너 프로세스의 인스턴스 하나가 추가됩니다.

기본적으로 비대화형 마이크로서비스 컨테이너의 단일 인스턴스에 대한 초기 수집은 백그라운더 노드에서 최대 4GB의 메모리를 사용할 수 있습니다. Tableau Server의 콘텐츠 수량이 10,000개를 넘는 경우 비대화형 마이크로서비스 컨테이너 프로세스가 백그라운더 노드에서 최대 16GB의 메모리를 사용할 수 있습니다. 따라서 Catalog를 사용하도록 설정할 경우 각 백그라운더 노드에 초기 수집 프로세스 중에 각 비대화형 마이크로서비스 컨테이너를 지원할 수 있는 사용 가능한 용량이 있는지 확인하십시오. 용량을 증가시켜야 하는 경우 비대화형 마이크로서비스 컨테이너의 JVM 힙 크기를 업데이트하여 백그라운더 노드에 최대 16GB의 메모리를 할당해야 합니다. 자세한 내용은 noninteractive.vmopts을 참조하십시오.

더 많은 비대화형 마이크로서비스 컨테이너를 추가하여 초기 수집 시간을 줄이려는 경우 먼저 필요한 총 컨테이너 수를 결정(아래의 2단계: 초기 수집에 걸리는 시간 예상 사용)한 다음 Tableau Server 환경에 모든 비대화형 마이크로서비스 컨테이너를 지원할 수 있는 충분한 용량이 구성되어 있는지 확인합니다. Tableau Server 환경이 구성되어 있는 방식에 따라, 초기 수집 시간을 줄이는 데 필요한 모든 추가적인 비대화형 마이크로서비스 컨테이너를 추가하지 못할 수 있습니다.

Catalog 사용을 위한 최상의 방법

초기 수집의 속도와 요구 사항은 각 Tableau Server 환경마다 다르기 때문에 Catalog를 사용하도록 설정할 때 다음 작업 중 하나 이상을 수행하는 것이 좋습니다.

  • Tableau Server 리포지토리에 초기 수집에서 생성되어 저장되는 추가적인 메타데이터를 지원하는 데 사용할 수 있는 충분한 디스크 공간이 있는지 확인합니다. 일반적인 규칙으로, 현재 리포지토리에서 사용된 디스크 공간의 50%가 리포지토리에 추가로 필요합니다. Tableau Server 디스크 사용량에 대한 자세한 내용은 서버 디스크 공간을 참조하십시오.

  • Tableau Server의 콘텐츠 양에 따라, 각 백그라운더 노드에 초기 수집 중에 비대화형 마이크로서비스 컨테이너의 각 인스턴스에 사용할 수 있는 4~16GB의 사용 가능한 메모리가 있는지 확인합니다.

  • 사용자들이 Catalog 기능을 사용하기 전에 초기 수집을 완료할 수 있도록 주말에 프로세스를 수행하십시오.

  • 먼저 프로덕션 콘텐츠를 사용하여 테스트 환경에서 프로세스를 수행합니다. 이렇게 하는 이유는 수집해야 하는 콘텐츠 유형이 수집 속도에 큰 영향을 미칠 수 있기 때문입니다.

Catalog를 사용하도록 설정하는 단계 요약

다음 단계는 Tableau Server에서 Catalog를 설정하고 실행하는 프로세스를 요약한 것입니다. 단계는 순차적으로 수행해야 합니다.

  1. Tableau Server의 콘텐츠 양 확인
  2. 초기 수집에 걸리는 시간 예상
  3. 초기 수집 시간 단축
  4. Data Management 라이선스 활성화
  5. Catalog 기능 해제
  6. tsm maintenance metadata-services 명령 실행
  7. 초기 수집 프로세스 모니터링 및 상태 확인
  8. SMTP 구성
  9. Catalog 기능 설정

참고: Tableau Sever에서 Tableau 콘텐츠에 대한 메타데이터 인덱싱은 Metadata API로 구동되므로 Catalog를 실행하고 사용하려면 Metadata API를 사용하도록 설정해야 합니다.

Catalog 사용

1단계: Tableau Server의 콘텐츠 양 확인

Tableau Server의 콘텐츠 양을 확인하려면 다음을 수행합니다.

  1. 관리자 자격 증명을 사용하여 Tableau Server에 로그인합니다.

  2. 탐색 페이지로 이동합니다.

  3. 최상위 프로젝트 드롭다운 메뉴를 클릭하고 모든 통합 문서, 모든 메트릭, 모든 데이터 원본모든 흐름 옆에 있는 숫자를 모두 더합니다. 이 합계가 Tableau Server에 있는 콘텐츠의 전체 양입니다.

2단계: 초기 수집에 걸리는 시간 예상

Catalog가 Tableau Server에서 처음 콘텐츠를 수집(초기 수집)하는 데 걸리는 시간을 예상하려면 사용 중인 Tableau Server 설치를 기준 Tableau Server 설치와 비교합니다.

다음과 같은 설치 상태인 Tableau Server에서 초기 수집이 완료되는 데 약 6시간이 걸립니다.

구성 요소기준 값
콘텐츠17,000개 통합 문서, 메트릭, 게시된 데이터 원본 및 흐름
비대화형 마이크로서비스 컨테이너10
수집약 6시간

사용 중인 Tableau Server 환경에 대략 절반의 콘텐츠가 있다면 초기 수집이 완료되는 데 절반의 시간이 걸릴 수 있습니다.

예: 8,500(통합 문서, 메트릭, 게시된 데이터 원본 및 흐름) + 10개의 비대화형 마이크로서비스 컨테이너 = 약 3시간(초기 수집)

사용 중인 Tableau Server 환경에 대략 두 배의 콘텐츠가 있다면 초기 수집이 완료되는 데 두 배의 시간이 걸릴 수 있습니다.

예: 34,000(통합 문서, 메트릭, 게시된 데이터 원본 및 흐름) + 10개의 비대화형 마이크로서비스 컨테이너 = 약 12시간(초기 수집)

3단계: 초기 수집 시간 단축

일반적으로, Catalog가 초기 수집을 수행하는 데 걸리는 시간과 비대화형 마이크로서비스 컨테이너 수는 상호 연관됩니다. 초기 수집 시간을 단축할 수 있도록 비대화형 마이크로서비스 컨테이너의 수를 늘릴 수 있습니다.

비대화형 마이크로서비스 컨테이너 수 늘리기

기본적으로 백그라운더가 있는 노드마다 비대화형 마이크로서비스 컨테이너가 하나씩 추가됩니다. 초기 수집 시간을 단축할 수 있도록 tsm topology set-process 명령을 사용하여 비대화형 마이크로서비스 컨테이너의 수를 늘리는 것이 좋습니다.

  1. 클러스터의 초기 노드(TSM이 설치된 노드)에서 관리자로 명령 프롬프트를 엽니다.

  2. tsm topology set-process --count <process_count> --node <node_ID> --process <process_name> 명령을 실행합니다.

    예를 들어 초기 노드에서 비대화형 마이크로서비스 컨테이너 수를 4개로 늘리려면 다음 명령을 실행합니다.

    tsm topology set-process --count 4 –-node node1 --process noninteractive

    명령 실행과 명령의 글로벌 옵션에 대한 자세한 내용은 tsm topology를 참조하십시오.

중요: 비대화형 마이크로서비스 컨테이너의 수를 늘리기 전에 다음을 검토하십시오. 

  • 비대화형 마이크로서비스 컨테이너 수 증가에 대한 추천 항목은 노드당 총 비대화형 마이크로서비스 컨테이너 수가 아니라 총 비대화형 마이크로서비스 컨테이너 수에 대한 것입니다. 예를 들어 노드 4개가 있을 때 비대화형 마이크로서비스 컨테이너 수를 8로 늘리려고 한다고 가정합니다. 이 경우 tsm 명령에서 사용하는 --count 값은 2입니다.

  • 비대화형 마이크로서비스 컨테이너 하나를 추가할 때마다 노드에서 4GB의 추가 메모리가 사용되고 Tableau Server 리포지토리(PostreSQL 데이터베이스)에 부하가 추가됩니다.

    • 비대화형 마이크로서비스 컨테이너 수는 Tableau Server 환경을 긴밀하게 모니터링하여 Tableau Server 리포지토리(PostgreSQL 데이터베이스)의 CPU 사용률과 관련된 문제를 방지하면서 한 번에 2개 이하로만 점진적으로 증가시키는 것이 좋습니다.

    • 너무 많은 비대화형 마이크로서비스 컨테이너를 추가하면 PostgreSQL 데이터베이스의 CPU 사용률이 급증하고 장애 조치가 발생할 수 있습니다. 감시할 증상에는 vizportal 로그의 SQLException 오류가 포함됩니다. 자세한 내용은 리포지토리 장애 조치(링크가 새 창에서 열림) 항목을 참조하십시오.

4단계: Data Management 라이선스 활성화

(Data Management 필요)

아직 활성화하지 않은 경우 Data Management를 활성화할 수 있습니다. 자세한 내용은 Data Management 라이선스를 참조하십시오.

5단계(선택 사항): 각 사이트의 Catalog 기능 해제

(Data Management 필요)

Data Management 활성화의 일부로 Catalog 기능이 기본적으로 해제됩니다. 인덱싱 프로세스와 완료에 걸리는 예상 시간으로 인해 각 사이트에서 Catalog 기능을 일시적으로 해제하는 것을 고려할 수 있지만, 이렇게 하면 Catalog가 준비되어 완벽하고 정확한 결과를 제공할 수 있게 될 때까지 Tableau Server 사용자가 Catalog 기능에 액세스할 수 없습니다.

  1. 관리자 자격 증명을 사용하여 Tableau Server에 로그인합니다.

  2. 왼쪽 탐색 패널에서 설정을 클릭합니다.

  3. 일반 탭의 Tableau Catalog에서 Tableau Catalog 설정 확인란의 선택을 취소합니다.

  4. Tableau Server에서 각 사이트에 대해 2~3단계를 반복합니다.

6단계: tsm maintenance metadata-services 명령 실행

tsm maintenance metadata-services 명령을 실행하여 Tableau Metadata API를 사용하도록 설정합니다. 이 명령을 실행하여 초기 수집을 시작합니다. Tableau Server에 Data Management 라이선스가 부여된 경우 이 명령을 실행하면 Catalog 기능(이전 단계에서 해제하지 않은 경우)도 설정됩니다.

  1. 클러스터의 초기 노드(TSM이 설치된 노드)에서 관리자로 명령 프롬프트를 엽니다.

  2. tsm maintenance metadata-services enable 명령을 실행합니다.

    tsm 명령을 실행하는 것에 대한 자세한 내용은 tsm maintenance(링크가 새 창에서 열림)를 참조하십시오.

참고: 이 명령을 실행할 때 다음 사항에 유의하십시오.

  • 이 명령은 Tableau Server에 사용되는 일부 서비스를 중지한 후 다시 시작하므로 추천 항목 기능 같은 특정 기능이 일시적으로 제공되지 않습니다.

  • 이 시점에 메타데이터의 새 인덱스가 만들어집니다. 이후에 이 명령을 실행하면 새 인덱스가 만들어지고 이전 인덱스를 대체합니다.

7단계: 초기 수집 프로세스 모니터링 및 상태 확인

위 tsm 명령을 실행하면 초기 수집 프로세스가 시작됩니다. 초기 수집 프로세스가 원활하게 진행되도록 백필 API를 사용하여 진행 상태를 모니터링할 수 있습니다. 자세한 내용은 초기 수집 상태 가져오기를 참조하십시오.

8단계: SMTP 설정 구성

Tableau Server에서 SMTP 설정을 구성하지 않은 경우 지금 구성하십시오. SMTP는 데이터 변경을 위해 연락해야 하는 소유자에게 이메일 보내기를 지원합니다. SMTP 구성에 대한 자세한 내용은 SMTP 설정 구성(링크가 새 창에서 열림)을 참조하십시오.

9단계(선택 사항): 각 사이트의 Catalog 기능 설정

(Data Management 필요)

위 절차 중 하나에서 Catalog를 사용하도록 설정하기 전에 Catalog 기능을 해제한 경우 Catalog를 설정하여 사용자가 해당 기능에 액세스할 수 있게 해야 합니다.

  1. 관리자 자격 증명을 사용하여 Tableau Server에 로그인합니다.

  2. 왼쪽 탐색 패널에서 설정을 클릭합니다.

  3. 일반 탭의 Tableau Catalog에서 Tableau Catalog 설정 확인란을 선택합니다.

  4. Tableau Server에서 각 사이트에 대해 2~3단계를 반복합니다.

Catalog 문제 해결

Catalog를 사용할 때 관리자 또는 사용자에게 다음 문제 중 하나가 발생할 수 있습니다.

시간 초과 제한 및 노드 제한 초과됨 메시지

많은 수의 결과를 반환해야 하는 Catalog 작업이 Tableau Server 시스템 리소스를 모두 차지하게 만들지 않으려면 Catalog가 시간 초과 및 노드 제한을 모두 구현해야 합니다.

  • 시간 초과 제한

    Catalog의 작업이 시간 초과 제한에 도달하면 관리자와 사용자에게 다음 메시지가 표시됩니다.

    Showing partial results, Request time limit exceeded. Try again later.(부분 결과를 표시하는 중입니다. 요청 시간 제한이 초과되었습니다. 나중에 다시 시도하십시오.)” 또는 TIME_LIMIT_EXCEEDED

    이 문제를 해결하려면 Tableau Server 관리자가 tsm configuration set –k metadata.query.limits.time 명령을 사용하여 시간 초과 제한을 증가시킬 수 있습니다. 자세한 내용은 tsm configuration(링크가 새 창에서 열림)tsm configuration set 옵션(링크가 새 창에서 열림) 항목을 참조하십시오.

    중요: 시간 초과 제한을 늘리면 더 긴 시간 동안 더 많은 CPU를 사용할 수 있기 때문에 Tableau Server에서 다른 프로세스의 성능이 영향을 받을 수 있습니다.

  • 노드 제한

    Catalog의 작업이 노드 제한에 도달하면 관리자와 사용자에게 다음 메시지가 표시됩니다.

    NODE_LIMIT_EXCEEDED

    이 문제를 해결하려면 Tableau Server 관리자가 tsm configuration set –k metadata.query.limits.count 명령을 사용하여 노드 제한을 증가시킬 수 있습니다. 자세한 내용은 tsm configuration(링크가 새 창에서 열림)tsm configuration set 옵션(링크가 새 창에서 열림) 항목을 참조하십시오.

    중요: 시간 초과 제한을 증가시키면 시스템 메모리가 영향을 받을 수 있습니다.

누락된 콘텐츠

  • 초기 수집 후 Catalog에서 콘텐츠가 누락되었다고 의심되는 경우 Eventing API를 사용하여 문제를 해결할 수 있습니다. Eventing은 초기 수집 후 Tableau Server에서 콘텐츠 인덱싱을 처리합니다. 자세한 내용은 Eventing 상태 가져오기를 참조하십시오.

  • 내장된 외부 자산과 다운스트림 Tableau 콘텐츠 간의 연결이 제거되면 카탈로그(또는 Tableau Metadata API)에 그대로 남아 매일 22:00:00 UTC(협정 세계시)에 실행되는 백그라운더 프로세스에 의해 자동으로 삭제됩니다. 예를 들어 처음에 통합 문서를 게시할 때 텍스트 파일 A를 내장했다가 텍스트 파일 B를 내장하여 다시 게시했다고 가정해 보겠습니다. 파일 A는 백그라운더 프로세스가 삭제할 수 있을 때까지 외부 자산으로 표시됩니다(또는 쿼리 가능).

    이러한 유형의 외부 자산을 제거하고 싶지 않거나 이 프로세스에 할당하고 싶지 않은 시스템 리소스가 소모된다고 생각되면 이 백그라운더 프로세스를 실행되지 않도록 설정할 수 있습니다. 또는 삭제된 외부 내장 자산의 수를 조정할 수도 있습니다. 자세한 내용은 features.DeleteOrphanedEmbeddedDatabaseAssetdatabaseservice.max_database_deletes_per_run을 참조하십시오.

    다음 두 가지 방법 중 하나로 이 프로세스를 모니터링할 수 있습니다.

    • 비추출용 백그라운드 작업 관리 뷰에서 논리 변경 작업 유형 정규화 후 기존 데이터베이스/테이블 자산을 다시 정규화하는 일회성 작업을 필터링합니다.

    • Tableau Server 로그 파일database_service_canonicalization_change 이벤트 또는 분리된 내장 데이터베이스 제거 완료를 참조하십시오.

초기 수집 후 성능

특정 콘텐츠가 매우 자주 업데이트되는 일부 Tableau Server 환경(예: 빈도가 높은 일정, 명령줄 또는 API 요청 사용)에서는 인덱싱 프로세스가 포화 상태가 될 수 있습니다. 이러한 경우 서버 관리자는 Catalog 성능을 보다 효율적으로 유지하기 위해 이벤트 조절을 사용하는 것이 좋습니다. 자세한 내용은 metadata.ingestor.pipeline.throttleEventsEnable을 참조하십시오.

참고: 이벤트 조절을 사용하도록 설정하면 사용자가 Catalog에서 콘텐츠를 변경할 때 의도된 지연을 경험할 수 있습니다.

메모리 부족 오류

일부 경우 복잡한 콘텐츠를 수집하는 문제로 인해 Tableau Server 메모리 부족 오류가 발생할 수 있습니다. 수집이 Tableau Server 메모리 부족 오류의 원인이라고 의심되는 경우 문제 해결에 도움이 되도록 metadata.ingestor.blocklist을 수집한 후 Tableau 지원 팀에 문의하여 도움을 받으십시오.

Catalog 사용 안 함

Tableau Server 관리자는 두 가지 방법 중 하나를 사용하여 Catalog를 사용하지 않도록 설정할 수 있습니다.

각 사이트의 Catalog 기능 해제

(Data Management 필요)

언제라도 Catalog 기능을 해제할 수 있습니다. Catalog 기능이 해제되면 데이터 품질 경고를 추가하거나 데이터베이스 및 테이블 자산의 사용 권한을 명시적으로 관리하는 기능과 같은 Catalog의 기능에 Tableau Server를 통해 액세스할 수 없습니다. 그러나 Catalog는 게시된 콘텐츠를 계속 인덱싱하며 메타데이터는 Tableau Metadata API 및 Tableau REST API의 메타데이터 메서드에서 액세스할 수 있습니다.

  1. 관리자 자격 증명을 사용하여 Tableau Server에 로그인합니다.

  2. 왼쪽 탐색 패널에서 설정을 클릭합니다.

  3. 일반 탭의 Tableau Catalog에서 Tableau Catalog 설정 확인란의 선택을 취소합니다.

Tableau Server에서 메타데이터 인덱싱 중지

Tableau Server에서 게시된 콘텐츠의 인덱싱을 중지하려면 Tableau Metadata API를 사용하지 않도록 설정할 수 있습니다. Metadata API를 사용하지 않도록 설정하려면 tsm maintenance metadata-services disable 명령을 실행합니다. 자세한 내용은 tsm maintenance(링크가 새 창에서 열림)를 참조하십시오.

피드백을 제공해 주셔서 감사합니다!귀하의 피드백이 제출되었습니다. 감사합니다!