웹에서 추출 만들기
Tableau Desktop을 사용하지 않고 웹에서 데이터 원본을 추출하여 데이터 원본 성능을 개선하고 추가 분석 기능을 지원할 수 있습니다. 데이터 원본을 추출하면 Tableau가 원격 데이터 저장소의 데이터를 Tableau Server 또는 Tableau Cloud으로 복사합니다. 데이터 추출의 이점에 대해 자세히 알아보려면 데이터 추출을 참조하십시오. 웹에서는 웹 작성 또는 콘텐츠 서버 상태에서 추출할 수 있습니다.
웹 작성에서 추출 만들기
기본 추출 설정을 사용하여 웹 작성에서 직접 추출을 만들 수 있습니다.
웹 작성에서 내장된 데이터 원본 추출
웹 작성에서 추출을 만들려면 다음 단계를 완료하십시오.
팁: 추출을 만들기 전에 데이터 모델을 마무리하는 것이 좋습니다. 추출 만들기에 시간이 오래 걸릴 수 있으며 새 논리적 테이블 추가와 같은 데이터 모델 변경으로 인해 추출이 무효화됩니다.
- 웹 작성 패널의 왼쪽 하단에 있는 데이터 원본 탭을 선택합니다. 새 통합 문서의 경우 데이터 원본 탭에서 시작합니다.
- 오른쪽 상단에서 연결 유형을 라이브에서 추출로 변경합니다.
- 추출 만들기를 선택합니다. 추출 만들기 대화 상자가 표시됩니다.
추출 만들기에는 시간이 오래 걸릴 수 있으며 추출이 만들어지는 동안 작성 세션을 닫을 수 있습니다. 추출 만들기가 손실되지 않도록 하려면 대화 상자에서 완료 시 나에게 알림을 선택하여 추출된 통합 문서를 저장할 위치를 지정합니다. 추출이 성공하면 통합 문서가 지정된 위치에 저장되고 웹 작성 세션을 계속할 수 있다는 알림이 표시됩니다.
추출 만들기가 실패하면 추출을 만들 수 없다는 알림이 표시되며 웹 작성에서 원래 통합 문서를 다시 열어 저장되지 않은 변경 사항을 복원할 수 있습니다.
추출 설정 정의
다음 옵션 중 하나 이상을 구성하여 Tableau에 추출을 저장하고, 추출에 대한 필터를 정의하고, 추출의 데이터 양을 제한하는 방법을 지정합니다.
추출 데이터를 저장하는 방법 결정
Tableau에서 두 가지 구조(스키마), 즉 논리적 테이블(비정규화된 스키마) 또는 물리적 테이블(정규화된 스키마) 중 하나를 사용하여 추출의 데이터를 저장하도록 선택할 수 있습니다. 논리적 테이블 및 물리적 테이블에 대한 자세한 내용은 Tableau 데이터 모델을 참조하십시오. 선택하는 옵션에 따라 필요한 사항이 달라집니다.
논리적 테이블
논리적 테이블은 원본의 논리적 테이블 하나마다 추출 테이블 하나를 사용하여 데이터를 저장합니다. 논리적 테이블을 정의하는 물리적 테이블은 병합되어 해당 논리적 테이블과 함께 저장됩니다. 예를 들어 데이터 원본이 단일 논리적 테이블로 구성된 경우 해당 데이터를 단일 테이블에 저장할 수 있습니다.
데이터 원본이 논리적 테이블 세 개로 구성되고 각 데이터 원본이 여러 물리적 테이블을 포함하는 경우 추출 데이터를 테이블 세 개(논리적 테이블마다 하나씩)에 저장할 수 있습니다.
추출 필터, 집계, 상위 N 또는 비정규화된 데이터가 필요한 기타 기능과 같은 추가적인 추출 속성을 사용하여 추출의 데이터 양을 제한하려는 경우 논리적 테이블을 선택합니다. 또한 데이터에서 통과 함수(RAWSQL)를 사용하는 경우에도 사용합니다. 단일 테이블이 Tableau가 추출 데이터를 저장하는 데 사용하는 기본 구조입니다.
추출에 조인이 포함된 경우 이 옵션을 사용하면 추출이 만들어질 때 조인이 적용됩니다.
물리적 테이블
물리적 테이블은 원본의 물리적 테이블 하나마다 추출 테이블 하나를 사용하여 데이터를 저장합니다.
추출이 하나 이상의 동일성 조인이 결합된 테이블로 구성되고 아래에 나와 있는 물리적 테이블 옵션 사용을 위한 조건을 충족하는 경우 물리적 테이블을 선택합니다. 이 옵션을 사용하는 경우 쿼리 시점에 조인이 수행됩니다.
이 옵션을 사용하면 성능이 향상될 수 있으며 추출 파일의 크기를 줄일 수 있습니다. Tableau가 물리적 테이블 옵션을 사용하도록 권장하는 방법에 대한 자세한 내용은 Tableau Desktop 도움말에서 물리적 테이블 옵션 사용을 위한 팁을 참조하십시오.
일부 경우 행 수준 보안을 위한 임시적인 해결책으로 이 옵션을 사용할 수도 있습니다. Tableau를 사용한 행 수준 보안에 대한 자세한 내용은 Tableau Desktop 도움말에서 데이터 행 수준에서 액세스 제한을 참조하십시오.
물리적 테이블 옵션 사용을 위한 조건
물리적 테이블 옵션을 사용하여 추출을 저장하려면 추출의 데이터가 아래에 나와 있는 모든 조건을 충족해야 합니다.
- 물리적 테이블 간의 모든 조인이 동일성(=) 조인이어야 합니다.
- 관계 또는 조인에 사용된 열의 데이터 유형이 동일해야 합니다.
- 통과 함수(RAWSQL)가 사용되지 않아야 합니다.
- 증분 새로 고침이 구성되지 않아야 합니다.
- 추출 필터가 구성되지 않아야 합니다.
- 상위 N개 또는 샘플링이 구성되지 않아야 합니다.
- 추출을 물리적 테이블로 저장하는 경우 그 뒤에 데이터를 추가할 수 없습니다.
- 논리적 테이블의 경우 둘 이상의 논리적 테이블이 있는 추출에 데이터를 추가할 수 없습니다.
참고: 논리적 테이블 옵션과 물리적 테이블 옵션 모두 추출의 데이터가 저장되는 방식에만 영향을 줍니다. 이 옵션은 추출의 테이블이 데이터 원본 페이지에 표시되는 방식에는 영향을 주지 않습니다.
추출할 데이터의 양 결정
추가를 선택하여 필드 및 해당 값을 기반으로 추출되는 데이터의 양을 제한하는 하나 이상의 필터를 정의합니다.
추출의 데이터 집계
측정값의 기본 집계를 사용하여 측정값을 집계하려면 표시된 차원에 대한 데이터 집계를 선택합니다. 데이터를 집계하면 행이 통합되며 추출 파일의 크기를 최소화하고 성능을 향상시킬 수 있습니다.
데이터 집계를 선택할 때 연도, 월 등의 지정한 날짜 수준으로 날짜 롤업을 선택할 수 있습니다. 다음 예는 선택할 수 있는 각 집계 옵션에서 데이터가 추출되는 방식을 보여줍니다.
원래 데이터 각 레코드가 별도의 행으로 표시됩니다. 데이터에는 7개 행이 있습니다. 표시된 차원에 대한 데이터 집계 (롤업 없음)
동일한 날짜와 지역의 레코드가 단일 행으로 집계되었습니다. 추출에는 5개 행이 있습니다. 표시된 차원에 대한 데이터 집계
(다음으로 날짜 롤업: 월)날짜가 월 수준으로 롤업되었으며 동일한 지역의 레코드가 단일 행으로 집계되었습니다. 추출에는 3개 행이 있습니다. 일부 데이터 원본은 샘플링을 지원하지 않습니다. 따라서 데이터 추출 대화 상자에 샘플링 옵션이 표시되지 않을 수 있습니다.
데이터 원본 페이지 또는 시트 탭에서 숨긴 필드는 추출에서 제외됩니다.
추출할 행 선택
추출하려는 행 수를 선택합니다.
모든 행 또는 상위 N개 행을 추출할 수 있습니다. 먼저 모든 필터와 집계가 적용된 다음 필터링 및 집계된 결과에서 해당 개수의 행이 추출됩니다. 행 수 옵션은 추출하는 데이터 원본의 유형에 따라 달라집니다.
참고:
증분 새로 고침 설정 구성
대부분의 데이터 원본은 증분 새로 고침을 지원합니다. 전체 추출을 새로 고치는 대신 이전에 데이터를 추출한 이후 새로 생성된 행만 추가하도록 새로 고침을 구성할 수 있습니다.
예를 들어 매일 새 매출 거래로 업데이트되는 데이터 원본이 있을 수 있습니다. 전체 추출을 매일 다시 작성하는 대신 그날 발생한 새 거래만 추가할 수 있습니다. 새로 고침을 예약할 때 증분을 옵션으로 사용하려면 먼저 설정을 정의해야 합니다.
주기적으로 전체 새로 고침을 수행하여 날짜 데이터를 최신 상태로 유지하는 것이 좋습니다.
참고: 원본 데이터의 데이터 구조가 변경된 경우(예: 새 열이 추가된 경우) 증분 새로 고침을 다시 시작하려면 먼저 전체 추출 새로 고침을 수행해야 합니다.
증분 새로 고침 설정
증분 새로 고침 확인란을 선택합니다.
새로 고칠 테이블을 선택합니다.
새 행을 식별하는 데 사용할 열을 선택합니다.
새로 고칠 최소 날짜 범위에서 하위 날짜 범위를 입력합니다. 이 필드 내에서 특정 시간 범위(일, 시간, 분 또는 초)를 선택할 수 있는 옵션이 있습니다.
아래 단계에 따라 증분 추출을 새로 고치도록 설정하려면 먼저 추출할 행 수로 모든 행을 선택했는지 확인합니다.
증분 새로 고침은 데이터베이스에 있는 모든 행을 추출하는 경우에만 정의할 수 있습니다. 샘플 추출에는 증분 방식을 사용할 수 없습니다.
예를 들어 Tableau에서 날짜 또는 날짜/시간 열을 선택하면 사용자는 새로 고침 날짜로부터 14일과 같이 지정된 기간 내의 추출 데이터를 새로 고칠 수 있습니다. 이 기능은 정의된 기간 내에 삽입 및 소급 수정을 허용하는 데이터 원본에 유용합니다. 증분 추출 새로 고침을 사용하면 사용자는 새 데이터와 함께 이러한 변경 사항을 효율적으로 확인할 수 있습니다.
게시된 데이터 원본을 참조하는 내장된 데이터 원본의 추출은 만들 수 없습니다. 해결 방법으로, 게시된 데이터 원본에서 직접 추출을 만드십시오. 자세한 내용은 콘텐츠 서버에서 게시된 데이터 원본 추출을 참조하십시오.
파일 기반 데이터 원본에 대한 추출을 만들 수 없습니다. 파일 기반 데이터 원본에는 이미 특수한 성능 향상 기능이 있으며 추출을 추가해도 성능 이점이 없습니다.
이 기능은 Tableau Cloud의 Bridge 기반 데이터 원본에 적용되지 않습니다.
사용자 지정 SQL 제한 사항: 사용자 지정 SQL 쿼리는 고급 설정에서 지원되지 않습니다. 사용자 지정 SQL을 사용하는 사용자가 증분 새로 고침에 고급 설정을 사용하려면 접근 방식을 조정해야 합니다.
고급 설정 사용
고급 설정을 확장하여 새 행을 검색하는 방법을 설정할 수 있습니다.
참고: 새로 고침에 최소 날짜 범위를 설정한 경우 고급 설정 기능에 액세스할 수 없습니다.
고급 설정을 사용하면 마지막으로 기록된 값과 같거나 더 큰 값을 새로 고쳐서 추가된 마지막 행을 바꾸거나, 추출을 새로 고침하여 추가된 마지막 행만 마지막으로 기록된 값보다 큰 값으로 유지할 수 있습니다.
첫 번째 접근 방식에서는 사용자가 날짜, 날짜/시간 또는 ID와 같은 고유하지 않은 키 열을 사용하여 추출을 증분식으로 새로 고칠 수 있습니다.
이 방법으로 증분 새로 고침을 수행하면 새로운 단계가 추가됩니다. Tableau는 먼저 추출에서 이전에 표시된 가장 높은 값과 동일한 행을 삭제합니다. 그런 다음 이전 최고 값보다 높거나 같은 모든 행을 쿼리하여 삭제된 모든 행과 새 행을 가져옵니다.
반대로, 마지막으로 추가된 행을 바꾸지 않고 마지막으로 기록된 값보다 큰 값의 행만 추가하도록 선택할 수도 있습니다.
완료하려면 추출 만들기를 선택합니다.
증분 새로 고침 수행 시 고려 사항
추출 편집:
기존 추출을 편집하는 경우 추출을 올바른 데이터로 업데이트하도록 마지막 새로 고침이 표시됩니다.
전체 새로 고침:
전체 새로 고침은 추출을 새로 고칠 때마다 모든 행을 원래 데이터 원본의 데이터로 바꿉니다. 전체 새로 고침은 오래 걸릴 수 있고 데이터베이스 공간을 많이 차지할 수 있습니다.
데이터 엔진:
Tableau가 추출을 만들기 위해 사용하는 기반 메커니즘인 데이터 엔진은 소수점 이하 3자리까지 정밀도로 시간 값을 저장합니다.
다음 열을 사용하여 새 행 식별에 날짜/시간 또는 타임스탬프 열을 지정하고 데이터베이스에서 Tableau보다 높은 정밀도를 사용하는 경우 증분 새로 고침 후에 중복 행이 나타날 수 있습니다.
예를 들어 데이터베이스에 날짜/시간 값이 2015-03-13 17:30:56.502352인 행과 날짜/시간 값이 2015-03-13 17:30:56.502852인 행이 있는 경우 Tableau는 두 행을 모두 날짜/시간 값 2015-03-13 17:30:56.502를 사용하여 저장하므로 중복 행이 생성됩니다.
제한 사항
콘텐츠 서버에서 추출 만들기
콘텐츠 서버에서 게시된 데이터 원본 추출
게시된 데이터 원본을 추출하려면 다음 단계를 완료하십시오.
- 관리자로 로그인하거나 데이터 원본의 소유자로 로그인합니다.
- 콘텐츠 탭에서 탐색을 선택하고 데이터 원본을 선택합니다.
- 데이터 원본 이름을 클릭하여 데이터 원본을 선택합니다.
- 화면 상단의 데이터 원본 이름 아래에서 라이브라고 표시된 드롭다운 메뉴를 선택합니다.
- 연결 유형을 라이브에서 추출로 변경합니다. 저장된 추출 암호화 기능이 사이트에서 사용되는 경우 암호화됨 또는 암호화되지 않음을 선택합니다.
- 내장된 자격 증명 관련 오류 메시지가 나타나는 경우 자격 증명을 데이터 원본에 내장합니다. 이 작업을 수행하려면 연결 편집을 선택합니다. '연결에 내장된 비밀번호'를 선택한 다음 저장을 선택합니다.
콘텐츠 서버에서 내장된 데이터 원본 추출
게시된 통합 문서에 내장된 하나 이상의 데이터 원본을 추출하려면 다음 단계를 완료하십시오.
- 관리자로 로그인하거나 데이터 원본의 소유자로 로그인합니다.
- 게시된 통합 문서로 이동합니다.
- 데이터 원본 탭으로 이동합니다.
- 하나 이상의 데이터 원본을 선택합니다.
- 동작 단추를 선택합니다.
- 추출을 선택합니다. 저장된 추출 암호화 기능이 사이트에서 사용되는 경우 암호화됨 또는 암호화되지 않음을 선택합니다.
제한 사항
- 연결 자격 증명이 데이터 원본에 내장되어 있어야 합니다.
- 게시된 데이터 원본을 참조하는 내장된 데이터 원본의 추출은 만들 수 없습니다. 해결 방법으로, 게시된 데이터 원본에서 직접 추출을 만드십시오.
- 파일 기반 데이터 원본에 대한 추출을 만들 수 없습니다. 파일 기반 데이터 원본에는 이미 특수한 성능 향상 기능이 있으며 추출을 추가해도 성능 이점이 없습니다.
- 이 기능은 Tableau Cloud의 Bridge 기반 데이터 원본에 적용되지 않습니다.
추출된 데이터를 최신 상태로 유지
데이터가 추출된 후 데이터를 최신 상태로 유지하기 위해 선택적으로 추출 새로 고침 일정을 설정할 수 있습니다. 자세한 내용은 일정에 따른 데이터 새로 고침을 참조하십시오.
추출 모니터링 및 관리
서버 관리자는 추출용 백그라운드 작업 관리 뷰에서 추출 만들기를 모니터링할 수 있습니다. 자세한 내용은 추출용 백그라운드 작업을 참조하십시오.
서버 관리자는 작업 페이지에서 추출을 관리할 수 있습니다. 자세한 내용은 Tableau Server의 백그라운드 작업 관리를 참조하십시오.
추출 새로 고침 작업과 같은 추출 만들기 작업에는 최대 쿼리 제한이 있으며, 이를 초과하면 작업이 시간 초과됩니다. 이 제한은 작업이 영구적으로 실행되어 무제한의 서버 리소스를 사용하는 것을 방지합니다. 추출 쿼리 제한 시간 초과는 TSM 명령줄 인터페이스 구성 설정 backgrounder.querylimit
를 사용하여 서버 관리자가 구성할 수 있습니다. 자세한 내용은 tsm configuration set 옵션을 참조하십시오.
서버 관리자는 웹 작성을 관리할 수 있습니다. 자세한 내용은 사이트의 웹 작성 액세스 설정 및 기능을 참조하십시오.