데이터 추출
데이터 추출은 원본 데이터 집합과 별도로 저장되는 정보의 하위 집합입니다. 추출은 성능 향상 목적과, 원본 데이터에서 사용할 수 없거나 지원되지 않을 수 있는 Tableau 기능 활용 목적이라는 2가지 목적으로 사용됩니다. 데이터 추출을 만들면 필터를 적용하고 기타 제한 사항을 설정하여 전체 데이터 볼륨을 효과적으로 줄일 수 있습니다.
데이터 추출을 만든 후 원래 원본의 최신 데이터로 새로 고칠 수 있습니다. 새로 고침 프로세스 중에 추출의 모든 기존 콘텐츠를 바꾸는 전체 새로 고침 또는 이전 새로 고침 이후의 새 행만 포함하는 증분 새로 고침 중에서 유연하게 선택할 수 있습니다.
참고: 버전 2024.1부터 Tableau에는 사용자가 고유하지 않은 키 열을 사용하여 추출에 증분 새로 고침을 수행할 수 있는 기능이 도입되었습니다.
추출의 장점
대규모 데이터 집합 처리: 추출은 수십억 행에 이르는 방대한 양의 데이터를 처리할 수 있습니다. 이를 통해 사용자는 광범위한 데이터 집합으로 작업을 효율적으로 진행할 수 있습니다.
성능 향상: 추출 데이터 원본을 활용하는 뷰와 상호 작용하면 원본 데이터에 직접 연결된 뷰에 비해 성능이 향상됩니다. 추출은 쿼리 성능을 최적화하여 데이터 분석 및 시각화 속도를 높여줍니다.
기능 향상: 추출은 원래 데이터 원본에서 사용할 수 없거나 지원하지 않을 수 있는 추가 Tableau 기능을 이용할 수 있게 합니다.
예를 들어, 사용자는 추출을 활용하여 고유 카운트를 계산할 수 있으므로 보다 고급 계산 및 분석이 가능합니다.
오프라인 데이터 액세스(Tableau Desktop): 추출을 사용하면 데이터에 오프라인으로 액세스할 수 있습니다. 즉, 원래 데이터 원본을 사용할 수 없는 경우에도 사용자가 로컬에서 데이터를 저장, 조작 및 작업할 수 있습니다.
추출 만들기
Tableau 워크플로우 내에서 추출을 만드는 데 사용할 수 있는 여러 옵션이 있지만 주요 접근 방식은 아래에 설명되어 있습니다.
데이터에 연결하고 데이터 원본 페이지에서 데이터 원본을 설정한 후 오른쪽 위에서 추출을 선택하고 편집 링크를 선택하여 데이터 추출 대화 상자를 엽니다.
데이터 저장소에서 논리적 테이블 또는 물리적 테이블 중 하나를 선택합니다. 이 단계에 대한 도움이 필요하면 데이터 저장소 섹션을 참조하십시오.
필터를 확장하여 필드 및 해당 값을 기반으로 추출되는 데이터의 양을 제한하는 필터를 설정합니다.
측정값의 기본 집계를 사용하여 측정값을 집계하려면 표시된 차원에 대한 데이터 집계를 선택합니다.
(선택 사항) 연도, 월 등과 같이 지정된 날짜 수준으로 날짜 롤업을 선택합니다.
추출하려는 행 수를 선택합니다. 모든 행, 샘플 또는 상위 N개 행을 추출할 수 있습니다.
증분 새로 고침 확인란을 선택한 다음 새로 고치려는 테이블을 지정하고, 데이터베이스에서 새 행을 식별할 열을 선택하고, 선택적으로 새로 고침을 위한 최소 날짜 범위를 설정합니다.
완료되면 설정 저장을 선택합니다.
시트 탭을 선택합니다. 그러면 추출이 만들어지기 시작합니다.
다음으로 추출을 저장할 위치를 선택합니다.
추출 파일 이름을 입력합니다.
저장을 선택합니다. 저장 대화 상자가 표시되지 않을 경우 추출 문제 해결 섹션을 참조하십시오.
추출 필드 설명
추출을 만들 때 다양한 필드를 구성할 수 있습니다. 이 섹션에서는 각 필드에 대해 설명합니다.
데이터 저장소
데이터 저장소에서 논리적 또는 물리적 테이블을 선택할 수 있습니다. 논리적 테이블은 데이터 원본의 논리적 테이블 하나마다 추출 테이블 하나를 사용하여 데이터를 저장합니다. 반면, 물리적 테이블은 데이터 원본의 물리적 테이블 하나마다 추출 테이블 하나를 사용하여 데이터를 저장합니다.
논리적 테이블
추출의 데이터 양을 제한하고 필터, 집계 또는 상위 N개와 같은 추가 추출 속성을 사용하려는 경우 논리적 테이블을 선택해야 합니다.
이 옵션은 데이터에 통과 함수(RAWSQL)가 포함된 경우에도 잘 작동합니다.
Tableau는 추출 데이터를 저장하는 기본 구조로 논리적 테이블을 사용합니다.
추출에 조인이 포함된 경우 이 옵션을 선택하면 추출이 만들어질 때 조인이 적용됩니다.
물리적 테이블
추출이 동등 조인으로 결합된 테이블로 구성되어 있고 물리적 테이블 옵션을 사용하기 위한 조건을 충족하는 경우 물리적 테이블을 선택해야 합니다. 이 옵션은 쿼리 시 조인을 수행하며 잠재적으로 성능을 개선하고 추출 파일의 크기를 줄일 수 있습니다.
물리적 테이블 옵션 사용 시 고려 사항이 있습니다. 물리적 테이블 옵션을 사용하여 추출을 저장하려면 추출의 데이터가 다음 조건을 모두 충족해야 합니다.
물리적 테이블 간의 모든 조인이 동일성(=) 조인이어야 합니다.
관계 또는 조인에 사용된 열의 데이터 유형이 동일합니다.
통과 함수(RAWSQL)가 사용되지 않아야 합니다.
증분 새로 고침이 구성되지 않아야 합니다.
추출 필터가 구성되지 않아야 합니다.
상위 N개 또는 샘플링이 구성되지 않아야 합니다.
추출을 물리적 테이블로 저장하는 경우 그 뒤에 데이터를 추가할 수 없습니다.
논리적 테이블의 경우 둘 이상의 논리적 테이블이 있는 추출에 데이터를 추가할 수 없습니다.
물리적 테이블 옵션 사용을 위한 팁
Tableau에서는 일반적으로 추출을 설정하고 작업할 때 기본 데이터 저장소 옵션인 논리적 테이블을 사용하도록 권장합니다. 추출 필터와 같이 추출에 필요한 일부 기능은 논리적 테이블 옵션을 사용하는 경우에만 사용할 수 있는 경우가 많습니다.
예상보다 큰 추출에 대한 물리적 테이블 옵션
물리적 테이블 옵션은 데이터 원본이 물리적 테이블 옵션 사용을 위한 조건을 충족하고 추출의 크기가 예상보다 큰 경우와 같은 특정 상황을 해결하기 위해서만 제한적으로 사용되어야 합니다. 추출이 예상보다 큰지 결정하려면 논리적 테이블 옵션을 사용하는 추출의 행 합계가 추출을 생성하기 전 결합된 모든 테이블의 행 합계보다 큰지 확인해야 합니다. 이 시나리오가 발생한 경우 물리적 테이블 옵션을 대신 사용해 보십시오.
물리적 테이블 옵션 사용 시 대체 필터링 제안 사항
물리적 테이블 옵션을 사용하는 경우 추출 필터, 집계, 상위 N 및 샘플링과 같이 추출에서 데이터를 줄이는 데 도움이 되는 다른 옵션을 사용할 수 없습니다. 물리적 테이블 옵션을 사용하는 추출에서 데이터를 줄여야 하는 경우 다음 제안 사항 중 하나를 사용하여 Tableau Desktop으로 가져오기 전에 데이터를 필터링하는 것이 좋습니다.
데이터에 연결 및 사용자 지정 SQL을 사용하여 필터 정의
데이터베이스 테이블에 연결하는 대신 사용자 지정 SQL을 사용하여 데이터에 연결합니다. 사용자 지정 SQL 쿼리를 만들 때 추출의 데이터를 줄이기 위해 필요한 적절한 수준의 필터링이 포함되어 있는지 확인합니다. Tableau Desktop의 사용자 지정 SQL에 대한 자세한 내용은 사용자 지정 SQL 쿼리에 연결을 참조하십시오.
데이터베이스에서 뷰 정의
데이터베이스에 대한 쓰기 액세스 권한이 있는 경우 추출에 필요한 데이터만 포함하는 데이터베이스 뷰를 정의한 다음 Tableau Desktop에서 해당 데이터베이스 뷰에 연결하는 것이 좋습니다.
추출이 포함된 행 수준 보안
행 수준에서 추출 데이터를 보호하려는 경우 물리적 테이블 옵션을 사용하는 것이 이 시나리오를 달성하기 위한 권장 방법입니다. Tableau의 행 수준 보안에 대한 자세한 내용은 '데이터 행 수준에서 액세스 제한'을 참조하십시오.
일반 테이블 고려 사항
논리적 테이블 옵션과 물리적 테이블 옵션 모두 추출의 데이터가 저장되는 방식에만 영향을 줍니다. 이 옵션은 추출의 테이블이 데이터 원본 페이지에 표시되는 방식에는 영향을 주지 않습니다.
예를 들어 추출이 물리적 테이블 3개를 포함하는 단일 논리적 테이블로 구성되어 있다고 가정합니다.
기본 옵션인 논리적 테이블을 사용하도록 구성된 추출(.hyper) 파일을 직접 열면 데이터 원본 페이지에 테이블 하나가 나열되는 것을 알 수 있습니다.
하지만 패키지 데이터 원본(.tdsx) 파일을 사용하는 추출을 열거나 데이터 원본(.tdsx) 파일과 해당하는 추출(.hyper) 파일을 함께 여는 경우 데이터 원본 페이지에 추출을 구성하는 3개 테이블이 모두 표시되는 것을 알 수 있습니다.
필터
필터를 사용하여 필드 및 해당 값을 기반으로 추출되는 데이터의 양을 제한하는 필터를 설정합니다.
집계
집계를 사용하면 측정값을 집계할 수 있습니다. 연도, 월 등의 지정한 날짜 수준으로 날짜 롤업을 선택할 수 있습니다. 아래 예제는 선택할 수 있는 각 집계 옵션에서 데이터가 추출되는 방식을 보여줍니다.
원래 데이터 | 각 레코드가 별도의 행으로 표시됩니다. 데이터에는 7개 행이 있습니다. | |
표시된 차원에 대한 데이터 집계 (롤업 없음) | 동일한 날짜와 지역의 레코드가 단일 행으로 집계되었습니다. 추출에는 5개 행이 있습니다. | |
표시된 차원에 대한 데이터 집계 (다음으로 날짜 롤업: 월) | 날짜가 월 수준으로 롤업되었으며 동일한 지역의 레코드가 단일 행으로 집계되었습니다. 추출에는 3개 행이 있습니다. |
행 수
모든 행 또는 상위 N개 행을 추출할 수 있습니다. 먼저 모든 필터와 집계가 적용된 다음 필터링 및 집계된 결과에서 해당 개수의 행이 추출됩니다. 행 수 옵션은 추출하는 데이터 원본의 유형에 따라 달라집니다. 일부 데이터 원본은 샘플링을 지원하지 않기 때문에 데이터 추출 대화 상자에 샘플링 옵션이 표시되지 않을 수 있습니다.
참고: 데이터 원본 페이지 또는 시트 탭에서 숨긴 필드는 추출에서 제외됩니다. 숨겨진 필드를 추출에서 제거하려면 사용되지 않은 필드 모두 숨기기 단추를 클릭합니다.
증분 새로 고침
대부분의 데이터 원본은 증분 새로 고침을 지원합니다. 전체 추출을 새로 고치는 대신 이전에 데이터를 추출한 이후 새로 생성된 행만 추가하도록 새로 고침을 구성할 수 있습니다.
예를 들어 매일 새 매출 거래로 업데이트되는 데이터 원본이 있을 수 있습니다. 전체 추출을 매일 다시 작성하는 대신 그날 발생한 새 거래를 추가할 수 있습니다.
증분 새로 고침 및 고급 설정 팁
이 섹션에서는 이러한 기능을 설정할 때 발생할 수 있는 오류를 방지하는 팁을 제공합니다.
증분 새로 고침:
행 수에서 모든 행을 선택해야 합니다.
집계를 사용하도록 설정하면 증분 새로 고침을 사용할 수 없습니다.
고급 설정:
고급 설정은 필터와 호환되지 않습니다.
추출 팁
통합 문서를 저장하여 추출에 대한 연결 유지
추출이 만들어진 후에는 데이터의 추출 버전이 통합 문서에 사용됩니다. 그러나 통합 문서를 저장하지 않으면 데이터의 추출 버전에 대한 연결이 저장되지 않습니다. 즉, 통합 문서를 먼저 저장하지 않고 닫은 경우 다음에 통합 문서를 열면 통합 문서가 원래 데이터 원본에 연결합니다.
샘플링된 데이터와 전체 추출 간 전환
대규모 추출로 작업할 때는 데이터의 작은 샘플을 만드는 것이 도움이 될 수 있습니다. 이렇게 하면 분석에 필드를 추가할 때마다 긴 쿼리를 실행할 필요 없이 뷰를 설정할 수 있습니다. 데이터 메뉴에서 적절한 옵션을 선택하면 샘플 데이터 사용과 전체 데이터 원본 사용 간에 쉽게 전환할 수 있습니다.
추출에 직접 연결하지 않음
추출을 컴퓨터에 저장하면 새 Tableau Desktop을 사용하여 추출에 직접 연결할 수 있습니다. 그러나 다음과 같은 몇 가지 이유로 권장되지 않습니다.
- 테이블 이름이 서로 다를 수 있습니다. 추출은 각 테이블에 고유한 이름을 부여하기 위해 특별한 이름을 사용하므로 이해하기 어려울 수 있습니다.
- 추출을 업데이트하거나 새로 고칠 수 없습니다. 추출에 직접 연결하면 Tableau는 추출을 복사본이 아닌 원래 데이터 원본으로 간주합니다. 즉, 원래 데이터 원본에 다시 연결할 수 없게 됩니다.
- 테이블 간의 구조와 관계가 손실됩니다. 테이블 간의 배열 및 연결은 .hyper 파일이 아닌 .tds 파일에 저장됩니다. 따라서 .hyper 파일에 직접 연결하면 이 정보가 손실됩니다. 추출에 논리적 테이블 저장소를 사용하는 경우 원래 물리적 테이블에 대한 참조가 표시되지 않습니다.
데이터 정책에서 사용자 함수가 있는 가상 연결에 연결하는 경우 추출을 사용하면 안 됨
가상 연결에 사용자 함수(링크가 새 창에서 열림)(예: USERNAME()
)가 포함된 데이터 정책이 있고 통합 문서 또는 데이터 원본에서 연결하여 추출을 만드는 경우 추출이 만들어질 시점에 가상 연결 데이터 정책과 일치하는 행만 추출에 포함됩니다. 데이터 정책에서 사용자 함수가 있는 가상 연결을 활용하려면 통합 문서 또는 데이터 원본에서 추출 대신 가상 연결에 대한 라이브 연결을 사용하십시오.
통합 문서에서 추출 제거
언제든지 데이터 메뉴에서 추출 데이터 원본을 선택한 다음 를 선택하여 추출을 제거할 수 있습니다. 추출을 제거할 때 통합 문서에서만 추출을 제거할지, 아니면 추출 파일을 제거 및 삭제할지를 선택할 수 있습니다. 후자의 옵션을 선택하면 하드 드라이브에서 추출이 삭제됩니다.
추출 기록 보기(Tableau Desktop)
데이터 메뉴에서 데이터 원본을 선택한 다음 을 선택하여 추출이 마지막으로 업데이트된 시간 및 기타 상세 정보를 볼 수 있습니다.
추출로 저장된 통합 문서를 열 때 Tableau가 추출의 위치를 찾지 못하면 추출을 찾을 수 없음 대화 상자에서 다음 옵션 중 하나를 선택합니다.
추출 찾기: 추출이 존재하지만 원래 Tableau에서 저장한 위치에 있지 않은 경우 이 옵션을 선택합니다. 확인을 클릭하여 파일 열기 대화 상자를 엽니다. 이 대화 상자에서 추출 파일의 새 위치를 지정할 수 있습니다.
추출 제거: 더 이상 추출이 필요하지 않은 경우 이 옵션을 선택합니다. 이 옵션은 데이터 원본을 닫는 것과 같습니다. 데이터 원본을 참조하는 모든 열려 있는 워크시트가 삭제됩니다.
추출 비활성화: 추출 대신 추출을 만든 원래 데이터 원본을 사용합니다.
추출 다시 생성: 추출을 다시 만듭니다. 원래 추출을 만들 때 지정한 모든 필터와 기타 사용자 지정이 자동으로 적용됩니다.
추출 문제 해결
추출을 만드는 데 시간이 오래 걸림: 데이터 집합의 크기에 따라 추출을 만드는 데 시간이 오래 걸릴 수 있습니다. 그러나 데이터를 추출하고 컴퓨터에 저장한 후에는 성능이 향상될 수 있습니다.
추출이 만들어지지 않음: 데이터 집합에 많은 수(예: 수천 개)의 열이 포함되어 있는 경우 Tableau가 추출을 만들지 못하는 경우도 있습니다. 문제가 발생하면 더 적은 수의 열을 추출하거나 기초 데이터를 다시 구성해 보십시오.
저장 대화 상자가 표시되지 않음 또는 .twbx에서 추출이 만들어지지 않음: 이전 절차에 따라 패키지 통합 문서에서 데이터를 추출할 경우 저장 대화 상자가 표시되지 않습니다. 패키지 통합 문서(.twbx)에서 추출이 만들어지면 추출 파일은 패키지 통합 문서와 연결된 파일의 패키지에 자동으로 저장됩니다. 패키지 통합 문서에서 만든 추출 파일에 액세스하려면 통합 문서의 패키지를 풀어야 합니다. 자세한 내용은 패키지 통합 문서를 참조하십시오.
추출 기능 업데이트
날짜 범위(하위 범위)
버전 2024.2부터 Tableau에는 증분 새로 고침을 위한 하위 범위 새로 고침이라는 새로운 기능이 추가되었습니다. 이 기능을 사용하면 사용자가 추출을 새로 고치는 최소 날짜 범위를 지정할 수 있습니다. 예를 들어 사용자는 새로 고침 날짜로부터 지난 14일 동안의 데이터를 새로 고치도록 선택할 수 있습니다. 이 기능을 활용하면 사용자는 추출 새로 고침 속도를 높이고 불필요한 전체 추출과 관련된 비용을 절약할 수 있습니다.
증분 새로 고침
버전 2024.1부터 Tableau에는 사용자가 고유하지 않은 키 열을 사용하여 추출에 증분 새로 고침을 수행할 수 있는 기능이 도입되었습니다. 이러한 고급 설정을 지원하는 새로운 UI가 있습니다.
이번 업데이트에서는 프로세스에 추가 단계가 도입되었습니다. 증분 새로 고침 중에 Tableau는 먼저 추출에서 이전에 기록된 최고 값과 일치하는 행을 제거합니다. 그 후 Tableau는 이전 최고 값보다 높거나 같은 값을 가진 모든 행을 쿼리합니다. 이 접근 방식을 사용하면 삭제된 행과 새로 추가된 행이 모두 반영됩니다.
웹에서 추출
2020.4 버전부터 웹 작성 및 콘텐츠 서버에서 추출을 사용할 수 있습니다. 이제 더 이상 Tableau Desktop을 사용하여 데이터 원본을 추출할 필요가 없습니다. 자세한 내용은 웹에서 추출 만들기를 참조하십시오.
논리적 및 물리적 테이블 추출
버전 2020.2에서 Tableau 데이터 모델에 논리적 테이블 및 물리적 테이블이 도입되어 추출 저장소 옵션이 단일 테이블 및 다중 테이블에서 논리적 테이블 및 물리적 테이블로 변경되었습니다. 이러한 옵션이 추출이 저장되는 방식을 더 정확하게 설명합니다. 자세한 내용은 데이터 추출을 참조하십시오.
.tde 형식 사용 중단
참고: 2023년 3월부터 Tableau Cloud, Tableau Public 및 Tableau Server(버전 2023.1.0)에서 .tde 형식을 사용하는 추출이 사용 중단되었습니다. 버전 2024.2는 .tde 형식 파일을 열 수 있는 마지막 버전입니다. 자세한 내용은 .hyper 형식으로 추출 업그레이드를 참조하십시오.
버전 10.5부터 추출을 만들면 .hyper 형식이 사용됩니다. .hyper 형식의 추출은 큰 데이터 집합에 대한 빠른 분석 및 쿼리 성능을 지원하는 향상된 데이터 엔진을 활용합니다.
또한 추출 관련 작업이 버전 10.5 이상을 사용하는 .tde 추출에서 수행되면 추출이 .hyper 형식 추출로 업그레이드됩니다. .tde 추출이 .hyper 추출로 업그레이드된 후에는 .tde 추출로 되돌릴 수 없습니다. 자세한 내용은 .hyper 형식으로 추출 업그레이드를 참조하십시오.
뷰의 값 및 마크 변경
효율성 및 확장성을 개선하기 위해 10.5 이상 버전에서는 10.4 이하 버전과 비교하여 추출의 값을 다른 방식으로 계산할 수 있습니다. 값이 계산되는 방식의 변화는 뷰의 마크가 채워지는 방식에 영향을 미칠 수 있습니다. 이 변화로 인해 뷰의 모양이 바뀌거나 빈 뷰로 표시되는 상황도 드물게 발생할 수 있습니다. 이러한 변화가 다중 연결 데이터 원본, 파일 기반 데이터에 대한 라이브 연결을 사용하는 데이터 원본, Google 스프레드시트 데이터에 연결하는 데이터 원본, 클라우드 기반 데이터 원본, 추출 전용 데이터 원본 및 WDC 데이터 원본에도 적용될 수 있습니다.
2022.4 버전을 사용하는 뷰에 나타날 수 있는 몇 가지 차이점을 살펴보려면 이 다음 섹션을 참조하십시오.
날짜 및 날짜/시간 값의 형식
10.5 이상 버전에서 추출은 날짜 문자열이 DATE, DATETIME 및 DATEPARSE 함수를 통해 해석되는 방식과 관련하여 보다 일관되고 엄격한 규칙을 따릅니다. 이 때문에 날짜가 구문 분석되는 방식이나 이러한 함수에 허용되는 날짜 형식 및 패턴이 영향을 받습니다. 보다 구체적으로, 이러한 규칙은 다음과 같이 일반화할 수 있습니다.
- 날짜는 행 기준이 아닌 열 기준으로 평가된 후 구문 분석됩니다.
- 날짜는 통합 문서가 열린 컴퓨터의 로캘이 아니라 통합 문서가 만들어진 위치의 로캘을 기반으로 평가된 후 구문 분석됩니다.
이러한 새로운 규칙은 추출의 효율성을 개선하며 상용 데이터베이스와 일치하는 결과를 생성할 수 있도록 합니다.
하지만 통합 문서가 만들어진 로캘이 통합 문서를 여는 로캘 또는 통합 문서를 게시하는 서버의 로캘과 다른 국제적인 시나리오에서는 이러한 규칙 때문에 1.) 날짜 및 날짜/시간 값이 다른 날짜 및 날짜/시간 값으로 변경되거나 2.) 날짜 및 날짜/시간 값이 Null로 변경될 수 있습니다. 날짜 및 날짜/시간 값이 다른 날짜 및 날짜/시간 값으로 변경되거나 Null이 되는 경우 기초 데이터에 문제가 있다는 의미인 경우가 많습니다.
버전 10.5 이상을 사용하는 추출 데이터 원본에서 날짜 및 날짜/시간 값이 변경되는 몇 가지 일반적인 이유는 다음과 같습니다.
날짜 및 날짜/시간 값이 변경되는 일반적인 이유 | null 값의 일반적인 이유 |
---|---|
|
|
날짜 시나리오 1
영어 로캘에서 만든 통합 문서에 .tde 추출 데이터 원본이 사용된다고 가정합니다. 이 다음 표에는 추출 데이터 원본에 포함된 문자열 데이터 열이 나와 있습니다.
10/31/2018 |
31/10/2018 |
12/10/2018 |
이 특정 영어 로캘에서는 날짜 열의 형식이 MDY(월, 일 및 연도)를 따릅니다. 다음 표에는 DATE 함수를 사용하여 문자열 값을 날짜 값으로 변환할 때 이 로캘을 기반으로 Tableau에 표시되는 내용이 나와 있습니다.
October 31, 2018 |
October 31, 2018 |
December 10, 2018 |
추출을 독일어 로캘에서 열면 다음과 같이 표시됩니다.
31 Oktober 2018 |
31 Oktober 2018 |
12 Oktober 2018 |
그러나 10.5 이상 버전을 사용하여 독일어 로캘에서 추출을 연 후에는 독일어 로캘의 DMY(일, 월 및 연도) 형식이 엄격하게 적용되고 이 값 중 하나가 DMY 형식을 따르지 않기 때문에 Null 값이 표시됩니다.
Null |
October 31, 2018 |
October 12, 2018 |
날짜 시나리오 2
영어 로캘에서 만든 또 다른 통합 문서에 .tde 추출 데이터 원본이 사용된다고 가정합니다. 다음 표에는 추출 데이터 원본에 포함된 숫자 형식 날짜 데이터 열이 나와 있습니다.
1112018 |
1212018 |
1312018 |
1412018 |
이 특정 영어 로캘에서는 날짜 열의 형식이 MDY(월, 일 및 연도)를 따릅니다. 다음 표에는 DATE 함수를 사용하여 숫자 값을 날짜 값으로 변환할 때 이 로캘을 기반으로 Tableau에 표시되는 내용이 나와 있습니다.
11/1/2018 |
12/1/2018 |
Null |
Null |
날짜 시나리오 3
.tde 추출 데이터 원본을 사용하는 통합 문서가 있다고 가정합니다. 다음 표에는 추출 데이터 원본에 포함된 문자열 데이터 열이 나와 있습니다.
2018-10-31 |
2018-31-10 |
2018-12-10 |
2018-10-12 |
날짜에 ISO 형식이 사용되므로 날짜 열은 항상 YYYY-MM-DD 형식을 따릅니다. 다음 표에는 DATE 함수를 사용하여 문자열 값을 날짜 값으로 변환할 때 Tableau에 표시되는 내용이 나와 있습니다.
October 10, 2018 |
Null |
December 10, 2018 |
October 12, 2018 |
참고: 버전 10.4 이하에서는 ISO 형식 및 다른 날짜 형식에서 통합 문서를 만든 로캘에 따라 다른 결과가 생성되었습니다. 예를 들어 영어 로캘의 경우 2018-12-10과 2018/12/10이 모두 December 12, 2018을 생성합니다. 그러나 독일 로캘에서는 2018-12-10이 December 12, 2018을 생성하고 2018/12/10은 October 12, 2018을 생성합니다.
정렬 순서 및 대/소문자 구분
추출은 정렬을 지원하므로 악센트가 있거나 대/소문자가 다르게 표시된 문자열 값을 보다 올바르게 정렬할 수 있습니다.
예를 들어 문자열 값의 테이블이 있다고 가정합니다. 정렬 순서의 측면에서 이제 Égypte와 같은 문자열 값이 Estonie 뒤와 Fidji 앞에 적절하게 나열된다는 것을 의미합니다.
Excel 데이터 정보:
대/소문자와 관련하여 Tableau가 값을 저장하는 방식이 버전 10.4(및 이전 버전)와 버전 10.5(및 이후 버전) 사이에서 변경되었다는 의미입니다. 그러나 값을 정렬하고 비교하는 규칙은 변경되지 않았습니다. 버전 10.4(및 이전 버전)에서는 "House," "HOUSE" 및 "houSe" 같은 문자열 값은 동일한 값으로 처리되고 하나의 대표 값으로 저장됩니다. 버전 10.5(및 이후 버전)에서는 동일한 문자열 값이 고유한 값으로 간주되므로 개별 값으로 저장됩니다. 자세한 내용은 값이 계산되는 방식의 변경 사항을 참조하십시오.
상위 N 쿼리에서 동점 해결
추출의 상위 N 쿼리가 순위의 특정 위치에 대해 중복 값을 생성하는 경우 10.5 이상 버전을 사용할 때 동점을 해결하는 위치가 다를 수 있습니다. 예를 들어 상위 3 필터를 만든다는 가정합니다. 위치 3, 4 및 5에 동일한 값이 있습니다. 10.4 이하 버전을 사용하는 경우 상위 필터가 1, 2 및 3 위치를 반환할 수 있습니다. 하지만 10.5 이상 버전을 사용하는 경우 상위 필터가 1, 2 및 5 위치를 반환할 수 있습니다.
부동 소수점 값의 정밀도
추출은 컴퓨터의 사용 가능한 하드웨어 리소스를 효율적으로 활용하므로 수학적 연산이 아주 평행한 방식으로 수행될 수 있습니다. 따라서 .hyper 추출에서는 실수가 다른 순서로 집계될 수 있습니다. 수가 다른 순서로 집계되면 집계가 계산될 때마다 소수점 뒤에 다른 값이 뷰에 표시될 수 있습니다. 이는 부동 소수점 덧셈 및 곱셈이 항상 결합인 것은 아니기 때문입니다. 즉, (a + b) + c가 반드시 a + (b + c)와 같지는 않습니다. 또한 부동 소수점 곱셈이 분배가 아닐 경우도 있기 때문에 실수가 다른 순서로 집계될 수 있습니다. 즉, (a x b) x c가 반드시 a x b x c와 같지는 않습니다. .hyper 추출에서 이러한 유형의 부동 소수점 반올림/반내림 동작은 상용 데이터베이스의 부동 소수점 반올림/반내림 동작과 유사합니다.
예를 들어 통합 문서에 부동 소수점 값으로 구성된 집계된 필드에 대한 슬라이더 필터가 포함된다고 가정합니다. 부동 소수점 값의 정밀도가 변경되었으므로 이제 필터는 필터 범위의 상한 또는 하한을 정의하는 마크를 제외할 수 있습니다. 이러한 값이 없으면 빈 뷰가 발생할 수 있습니다. 이 문제를 해결하려면 필터에 대한 슬라이더를 이동하거나 필터를 제거한 후 다시 추가합니다.
집계의 정확성
추출은 컴퓨터의 사용 가능한 하드웨어 리소스를 효율적으로 활용하여 큰 데이터 집합에 대해 최적화되므로 집계가 아주 평행한 방식으로 수행될 수 있습니다. 따라서 .hyper 추출을 통해 수행되는 집계의 결과는 통계 계산에 특화된 소프트웨어의 결과보다 상용 데이터베이스의 결과와 유사할 수 있습니다. 작은 데이터 집합을 사용하여 작업하거나 높은 수준의 정확성이 요구되는 경우 참조선, 요약 카드 통계 또는 테이블 계산 함수(예: 분산, 표준 편차, 상관 관계 또는 공분산)를 통해 집계를 수행하는 것이 좋습니다.
추출을 위한 지금 계산 옵션 정보
지금 계산 옵션이 이전 버전의 Tableau Desktop을 사용하는 .tde 추출에 사용된 경우 특정 계산된 필드가 구체화되고 미리 계산되어 추출에 저장됩니다. .tde 추출에서 .hyper 추출로 추출을 업그레이드하는 경우 추출에서 이전에 구체화된 계산은 포함되지 않습니다. 추출 업그레이드 후 구체화된 계산이 추출에 포함되게 하려면 지금 계산 옵션을 다시 사용해야 합니다. 자세한 내용은 추출에서 계산 구체화를 참조하십시오.
새 추출 API
추출 API 2.0을 사용하여 .hyper 추출을 만들 수 있습니다. 추출 게시와 같이, 이전에 Tableau SDK를 사용하여 수행한 작업의 경우 Tableau Server REST API 또는 Tableau Server 클라이언트 (Python) 라이브러리를 사용할 수 있습니다. 새로 고침 작업에도 Tableau Server REST API를 사용할 수 있습니다. 자세한 내용은 Tableau Hyper API를 참조하십시오.