Tableau Data Management
이 콘텐츠는 조직이 데이터를 사용하여 영향력을 높이는 방법을 분석 및 개선하는 데 도움을 주는 성숙도 프레임워크인 Tableau Blueprint의 일부입니다. 여정을 시작하려면 평가(링크가 새 창에서 열림)를 수행하십시오.
Tableau Data Management를 사용하면 분석 환경의 데이터를 더욱 효과적으로 관리할 수 있으므로, 의사 결정을 추진하는 데 항상 신뢰할 수 있는 최신 데이터의 사용이 보장됩니다. 데이터 준비부터 카탈로그 작성, 검색 및 거버넌스에 이르기까지 Tableau Data Management를 통해 데이터를 더욱더 신뢰할 수 있게 되어 셀프 서비스 분석 수용을 앞당길 수 있습니다. Tableau Data Management는 여러 기능의 모음으로 별도의 라이선스가 필요하며, Tableau 콘텐츠와 Tableau Server 및 Tableau Cloud의 데이터 자산을 관리하는 Tableau Prep Conductor 및 Tableau Catalog를 포함합니다.
Tableau Data Management란?
전반적으로, 조직은 Tableau Blueprint 외의 다른 곳에서 설명하는 데이터 거버넌스 및 데이터 원본 관리 접근 방식을 통해 이점을 얻을 수 있습니다. 이러한 방법론 외에도 데이터베이스, 데이터 분석 및 시각화 커뮤니티에서 데이터 관리라는 용어에 대한 일반적인 언급을 자주 듣게 됩니다. 그러나 이 용어는 Tableau Server 및 Tableau Cloud와 함께 사용하기 위한 기능 집합인 Tableau Data Management가 포함된 Tableau의 경우 좀 더 구체화됩니다. Windows 또는 Linux용 Tableau Server를 사용하든, Tableau Cloud를 사용하든 관계없이 Tableau Data Management의 기능은 대부분 동일합니다(일부 기능은 Tableau Cloud 또는 Tableau Server에서만 사용할 수 있음).
Tableau Data Management에는 조직의 데이터 관리자와 분석가가 Tableau 환경에서 데이터 관련 콘텐츠 및 자산을 관리하는 데 도움이 되는 일련의 도구가 포함되어 있습니다. 특히 Tableau Data Management를 구매하면 세 가지 추가 기능 집합이 더해집니다.
Tableau Catalog
Tableau Prep Conductor
가상 연결 및 데이터 정책
Tableau Catalog
Tableau Data Management의 기본 기능인 Tableau Catalog는 Tableau 데이터 원본에 대한 액세스, 이해 및 신뢰를 간소화하는 데 도움이 되는 기능을 제공합니다. 계보, 데이터 품질, 검색, 영향 분석 등의 영역에 초점을 맞춘 Tableau Catalog를 사용하면 데이터 관리자와 데이터 시각화/분석가가 Tableau Server 및 클라우드의 데이터 원본을 더 쉽게 이해하고 신뢰할 수 있습니다. Tableau Catalog에는 Tableau REST API의 메타데이터 메서드를 통해 사용할 수 있는 Tableau 개발자용 추가 기능이 포함되어 있습니다.
Tableau Catalog를 처음 사용하도록 설정하면 Tableau Server 또는 클라우드 사이트의 모든 관련 콘텐츠 항목을 검색하여 모든 관련 개체의 연결된 뷰를 작성합니다(Tableau Catalog에서는 이를 콘텐츠 메타데이터라고 함). 이는 단순한 데이터 연결을 넘어 검색 기능을 확장합니다. 데이터 관리자와 시각적 작성자는 열, 데이터베이스 및 테이블을 기반으로 검색할 수도 있습니다.
다른 개체가 종속되어 있는 개체를 실수로 수정하거나 삭제할 가능성(예: 프로덕션 통합 문서의 핵심인 데이터베이스 열의 이름을 바꾸거나 제거하는 경우)을 줄이기 위해 Tableau Catalog의 계보 기능은 메트릭, 흐름, 가상 연결을 포함하여 Tableau 사이트의 모든 콘텐츠 간에 상호 관계를 노출합니다. 이제 개체 간의 관계를 쉽게 확인하고 보류 중인 변경 사항을 적용하기 전에 그 영향을 분석할 수 있습니다.
Tableau 데이터 원본에 대한 신뢰도를 높이기 위해 Tableau Catalog는 확장된 데이터 관련 개체 설명, 데이터 세부 정보 뷰, 향상된 검색 유연성을 위한 키워드 태그와 같은 보조 정보를 제공합니다. 데이터 원본을 인증하면 데이터 원본 옆에 눈에 잘 띄는 아이콘이 표시되어 데이터 원본 소유자 또는 관리자가 데이터 원본을 신뢰한다는 것을 나타냅니다. 사용 중단되었거나 오래된 데이터 등 소비자의 우려를 야기할 수 있는 데이터 항목(데이터 원본, 열 등)에는 데이터 품질 경고가 지정될 수 있습니다. 데이터 품질 경고 옵션 외에도 민감한 데이터에는 민감도 레이블을 사용하여 특별히 플래그를 지정할 수 있습니다.
Tableau Prep Conductor
다른 여러 Tableau 고객과 마찬가지로, 여러 데이터 원본을 결합하고, 데이터를 변형하고, 열을 사용자 지정하고, 하나 이상의 원하는 데이터 형식으로 출력하는 정교한 데이터 준비 '흐름'을 만드는 데 Tableau Prep Builder의 이점을 발견하셨을 것입니다. 하지만 완벽한 Prep 흐름을 만든 후, 이를 자동화하여 일정에 따라 데이터 원본을 실행하고 전체를 업데이트하거나 점진적으로 업데이트하려면 어떻게 해야 할까요?
바로 이 지점에서 Data Management의 또 다른 기능인 Tableau Prep Conductor가 필요합니다. Tableau Prep Conductor를 사용하면 Tableau Prep Builder에서 Tableau Server 또는 Tableau Cloud 환경에 게시하든, Prep 흐름 웹 작성을 사용하여 브라우저에서 직접 만들든 관계없이 Tableau Prep 흐름의 일정을 유연하게 예약할 수 있습니다. 웹 기반 흐름을 테스트하는 것부터 시작하십시오. 흐름을 Data Management 없이 필요에 따라 수동으로 실행할 수 있지만, Prep Conductor에서 자동으로 실행되도록 예약하려면 Data Management를 구매해야 합니다. 흐름은 예약하기 전에 실행이 완료되어야 하며 오류 없이 원하는 출력 데이터 원본을 생성해야 합니다.
Tableau Server를 사용하는 경우 관리자(또는 적절한 사용 권한이 있는 사용자)가 '매일 자정', '일요일 정오' 등의 사용자 지정 일정을 만들어 추출 새로 고침에서 수행한 것과 마찬가지로 Prep 흐름을 실행할 수 있습니다.
Tableau Cloud를 사용하는 경우 미리 정의된 Prep 흐름 일정 집합이 기본적으로 설치됩니다. 이러한 일정 집합을 사용자 지정하거나 자신만의 Prep 흐름 일정을 만들 수는 없습니다.
동작 메뉴에서 실행할 흐름을 예약합니다. 단일 작업 일정을 사용하면 선택한 일정에 따라 선택한 Prep 흐름만 실행할 수 있습니다. 연결된 작업 일정을 사용하면, 여러 흐름을 특정 순서로 실행하도록 '체인' 연결하려는 경우(예: 하나의 데이터 원본 출력을 후속 흐름의 입력 데이터 원본으로 사용하는 경우) 선택한 흐름과 함께 순서대로 실행할 하나 이상의 추가 흐름을 선택할 수 있습니다. 이제 흐름은 예약된 시간에 실행되어 Tableau 통합 문서의 기반이 될 수 있는 데이터 원본을 자동으로 업데이트하거나 생성합니다.
흐름 예약 기능 외에도, Data Management 및 Tableau Prep Conductor에는 예약된 흐름의 성공/실패 모니터링, 흐름 일정이 성공하거나 실패할 때 이메일 알림 전송, Tableau Server/Cloud REST API로 프로그래밍 방식의 흐름 실행, 흐름 성능 기록을 모니터링하는 추가 관리 뷰 기능 활용 등의 옵션이 추가되었습니다.
모범 사례 권장 사항: Tableau Server에서 많은 수의 Tableau Prep Conductor 흐름을 실행할 계획이라면 서버 환경의 규모를 조정해야 할 수도 있습니다. 필요한 경우, 필요한 Prep 흐름 부하를 수용하기 위해 노드 또는 백그라운더 프로세스를 추가하여 Tableau Server 시스템의 성능을 조정합니다.
Tableau Cloud 정보 Prep 흐름 용량을 위해 Tableau Cloud의 아키텍처 변경을 고려할 필요는 없지만, 예약하려는 각 동시 Tableau Prep Conductor 흐름에 대해 하나의 리소스 블록(Tableau Cloud 컴퓨팅 용량의 단위)을 확보해야 합니다. 필요한 동시 흐름 일정 수를 결정하고 그에 따라 Tableau Cloud 리소스 블록을 구매하십시오.
가상 연결
그다음 Data Management 기능인 가상 연결에 대해 알아보겠습니다. 가상 연결은 데이터에 대한 중앙 액세스 지점을 제공합니다. 가상 연결에서 여러 데이터베이스의 다중 테이블에 액세스할 수 있습니다. 가상 연결을 사용하면 데이터 추출과 보안을 단일 위치에서 연결 수준으로 관리할 수 있습니다.
가상 연결이 유용한 경우
Tableau에서 여러 통합 문서와 데이터베이스 연결을 공유하는 전통적인 방법을 고려한다면 아마도 SQL Server 또는 Snowflake와 같은 데이터베이스 서버에 직접 연결하고, 데이터베이스 로그인 자격 증명을 제공하고, 하나 이상의 테이블을 추가 및 조인한 다음, 데이터 원본을 Tableau Server 또는 Tableau Cloud에 게시하는 것을 생각할 수 있을 것입니다. 이를 데이터에 대한 라이브 연결로 사용하도록 선택할 수도 있지만 연결된 통합 문서의 속도를 높이기 위해 데이터 원본에서 데이터를 추출하고 싶을 수도 있습니다.
예를 들어 설명하자면 서로 다른 테이블 또는 조인 집합을 수용하기 위해 이 작업을 여러 번 수행하여, 테이블/조인 요구 사항이 다르지만 모두 동일한 초기 데이터베이스를 사용하는 일련의 통합 문서에 사용되는 여러 게시된(그리고 추출된) 데이터 원본을 만들 수 있습니다.
이제 일련의 데이터 원본에서 참조되는 초기 SQL Server 또는 Snowflake 데이터베이스의 일부가 변경되면(예: 테이블 이름이 바뀌거나 필드가 더 추가되거나 데이터베이스 자격 증명이 변경되는 경우) 어떤 일이 발생하는지 생각해 보겠습니다. 이제 이전에 만든 각 데이터 원본을 열고, 데이터베이스 변경이 적용되도록 필요한 변경을 수행하고, 다시 게시(및 추출 새로 고침 일정 변경)하는 작업에 직면하게 되었습니다.
데이터베이스 서버 이름, 자격 증명 및 테이블 참조를 저장하는 하나의 초기 데이터 연결 '정의'만 만드는 것이 훨씬 더 간단할 수 있습니다. 그리고 더 큰 '정의'에서 데이터를 추출하는 것을 선호할 수도 있습니다. 그런 다음 테이블, 조인 등의 다양한 조합에 대해 다양한 데이터 원본을 만들어야 하는 경우 하나 이상의 데이터베이스 서버에 직접 연결하지 않고 초기 '정의'를 참조할 수 있습니다. 핵심 데이터베이스 구조가 변경되는 경우(예: 테이블 이름이 변경되거나 자격 증명이 수정되는 경우), 초기 '정의' 개체만 수정하면 모든 종속 데이터 원본이 자동으로 변경 사항을 상속합니다.
Data Management 기능은 가상 연결을 통해 이러한 공유 '정의' 기능을 도입합니다. 가상 연결은 데이터베이스 서버, 로그인 자격 증명 및 선택한 테이블을 저장한다는 점에서 표준 데이터 원본 연결과 유사합니다. 또한 기존 Tableau 데이터 원본과 마찬가지로, 가상 연결에는 각각 고유한 자격 증명 및 테이블 집합이 있는 둘 이상의 데이터베이스/데이터 원본에 대한 연결이 포함될 수 있습니다. 가상 연결에서는 일부 메타데이터 수정(예: 필드 숨기기 또는 이름 바꾸기)이 허용되지만, 테이블은 가상 연결 내에서 조인되지 않습니다. 나중에 가상 연결을 통합 문서의 직접 원본으로 사용하거나 추가로 게시된 데이터 원본의 연결 유형으로 사용하는 경우 테이블을 조인하고 데이터 원본에 대한 추가 사용자 지정을 수행할 수 있습니다.
가상 연결을 만들어 Tableau Server 또는 Tableau Cloud에 게시하고 적절한 사용 권한을 설정한 후에는 다른 데이터 원본과 마찬가지로 Tableau Desktop 또는 Tableau Server/Cloud에서 가상 연결에 연결할 수 있습니다. 그러나 데이터베이스 서버 위치를 지정하거나 자격 증명을 제공할 필요가 없으며, 즉시 테이블을 조인하고 데이터 시각화를 진행하거나 데이터 원본을 게시할 수 있습니다.
데이터 정책
앞에서 설명한 중앙 집중식 데이터베이스 연결 기능 외에도 Tableau Data Management 가상 연결은 데이터 정책을 통해 보다 간소화된 중앙 집중식 행 수준 보안 옵션을 제공합니다. 데이터 정책을 사용하여 가상 연결에 있는 하나 이상의 테이블에 행 수준 보안을 적용합니다. 데이터 정책은 데이터를 필터링하여 사용자에게 볼 권한이 있는 데이터만 표시합니다. 데이터 정책은 라이브 연결과 추출 연결에 모두 적용됩니다.
데이터 정책이 유용한 경우
많은 조직에서는 비주얼리제이션에 표시되는 데이터를 현재 사용자에게 적용되는 데이터로만 자동으로 제한하는 것이 일반적입니다. 예를 들어 크로스탭 개체에 주문 세부 정보가 포함된 공유 대시보드를 생각해 보겠습니다.
대규모 지역의 영업 관리자인 경우 세부 정보 크로스탭에 해당 지역의 모든 계정 책임자에 대한 주문이 표시됩니다.
그러나 개인 계정 책임자인 경우 세부 정보 크로스탭에는 해당 계정에 대한 주문만 표시됩니다.
이 시나리오에서는 Tableau 환경에 행 수준 보안을 구현해야 하며, 이를 위해 다음과 같은 여러 방법 중 하나를 사용할 수 있습니다.
데이터베이스의 행 수준 보안. 비주얼리제이션을 볼 때마다 열람자에게 자신의 자격 증명을 사용하여 기초 데이터베이스에 로그인하라는 메시지가 표시되거나 자격 증명이 Tableau 사용자 계정에서 상속됩니다. 결과 데이터 집합은 제공된 자격 증명에 따라 볼 수 있도록 허용된 데이터로만 제한됩니다. 각 열람자가 자신의 자격 증명을 유지 관리해야 하므로 번거로울 수 있을 뿐만 아니라 라이브 데이터 연결은 기초 데이터베이스에 큰 부담을 주어 성능에 영향을 미칠 수 있습니다. 또한 라이브 연결에 자격 증명을 전달하는 일부 옵션은 Tableau Cloud에서 제한될 수 있습니다.
Tableau 사용자 필터. 통합 문서 내에서 개별 워크시트를 만들 때 사용자 필터가 적용됩니다. 개별 Tableau 사용자 자격 증명 또는 하나 이상의 Tableau 사용자 그룹 멤버십의 조합을 지정하면 해당 사용자와 관련된 데이터만 표시하도록 개별 워크시트를 필터링할 수 있습니다. 통합 문서 내의 개별 워크시트마다 사용자 필터를 제공해야 하므로 번거로울 수 있으며, 하나의 프로세스로 대규모 통합 문서 그룹에 대해 사용자 필터를 지정할 방법이 없습니다. 또한 사용자에게 통합 문서에 대한 편집 권한이 실수로 부여된 경우, 간단히 사용자 필터를 필터 선반에서 끌어다 놓기만 하면 보기 권한이 없는 모든 기초 데이터를 볼 수 있습니다.
데이터 정책은 일부 Tableau 계산 언어를 사용하여 사용자 ID 또는 그룹 멤버십을 기반으로 가상 연결이 반환하는 데이터를 사용자 지정하고 제한하는 정교한 규칙(예: 데이터베이스의 관련 '자격 테이블' 사용)을 지정할 수 있습니다. 이렇게 하면 데이터 원본 수준에서 행 수준 보안이 유지될 뿐만 아니라(데이터 원본에 연결된 모든 통합 문서는 자동으로 보안을 상속하고 가상 연결 내에서 변경된 사항을 적용함), 원래 가상 연결에 대한 편집 권한이 있는 사용자만 데이터 정책을 수정할 수 있도록 제한하여 보안 계층을 더 강화할 수 있습니다.