데이터 추출

추출은 성능을 향상시키거나 원래 데이터에서 사용할 수 없거나 지원되지 않는 Tableau 기능을 활용하기 위해 사용할 수 있는 데이터의 저장된 하위 집합입니다. 데이터의 추출을 만들 경우 필터를 사용하고 다른 제한을 구성하여 총 데이터 양을 줄일 수 있습니다. 추출을 만든 후 원래 데이터의 데이터로 새로 고칠 수 있습니다. 데이터를 새로 고칠 경우 전체 새로 고침을 수행하여 추출의 모든 콘텐츠를 바꾸거나, 이전 새로 고침 이후 새로 추가된 행만 추가하는 증분 추출 새로 고침을 수행할 수 있습니다.

추출은 다수의 장점을 제공합니다.

  • 큰 데이터 집합 지원: 수십억 개 데이터 행이 포함된 추출을 만들 수 있습니다.

  • 성능 개선: 추출 데이터 원본을 사용하는 뷰와 상호 작용하는 경우 원래 데이터에 대한 연결에 기반하는 뷰와 상호 작용할 때보다 일반적으로 성능이 개선되는 것을 경험할 수 있습니다.

  • 추가 기능 지원: 추출을 사용하면 고유 카운트 계산 기능 등 원래 데이터에서 사용할 수 없거나 지원되지 않는 Tableau 기능을 활용할 수 있습니다.

  • 데이터에 대한 오프라인 액세스 제공: Tableau Desktop을 사용하는 경우 추출을 사용하면 원래 데이터를 사용할 수 없는 경우 데이터를 로컬로 저장하고 작업할 수 있습니다. 이 기능은 이동 중일 때 유용합니다.

최신 추출 변경 사항

웹에서 추출

2020.4 버전부터 웹 작성 및 콘텐츠 서버에서 추출을 사용할 수 있습니다. 이제 더 이상 Tableau Desktop을 사용하여 데이터 원본을 추출할 필요가 없습니다. 자세한 내용은 웹에서 추출 만들기를 참조하십시오.

논리적 및 물리적 테이블 추출

버전 2020.2에서 Tableau 데이터 모델에 논리적 테이블 및 물리적 테이블이 도입되어 추출 저장소 옵션이 단일 테이블 및 다중 테이블에서 논리적 테이블 및 물리적 테이블로 변경되었습니다. 이러한 옵션이 추출이 저장되는 방식을 더 정확하게 설명합니다. 자세한 내용은 추출 데이터를 저장하는 방법 결정을 참조하십시오.

.tde 형식 사용 중단

참고: 2023년 3월부터 Tableau Cloud, Tableau Public 및 Tableau Server(버전 2023.1.0)에서 .tde 형식을 사용하는 추출이 더 이상 사용되지 않습니다. 자세한 내용은 .hyper 형식으로 추출 업그레이드를 참조하십시오.

버전 10.5부터 새 추출을 만들 때 .hyper 형식이 사용됩니다. .hyper 형식의 추출은 큰 데이터 집합에 대한 빠른 분석 및 쿼리 성능을 지원하는 향상된 데이터 엔진을 활용합니다.

또한 추출 관련 작업이 버전 10.5 이상을 사용하는 .tde 추출에서 수행되면 추출이 .hyper 형식 추출로 업그레이드됩니다. .tde 추출이 .hyper 추출로 업그레이드된 후에는 .tde 추출로 되돌릴 수 없습니다. 자세한 내용은 .hyper 형식으로 추출 업그레이드를 참조하십시오.

뷰의 값 및 마크 변경

효율성 및 확장성을 개선하기 위해 10.5 이상 버전에서는 10.4 이하 버전과 비교하여 추출의 값을 다른 방식으로 계산할 수 있습니다. 값이 계산되는 방식의 변화는 뷰의 마크가 채워지는 방식에 영향을 미칠 수 있습니다. 이 변화로 인해 뷰의 모양이 바뀌거나 빈 뷰로 표시되는 상황도 드물게 발생할 수 있습니다. 이러한 변화가 다중 연결 데이터 원본, 파일 기반 데이터에 대한 라이브 연결을 사용하는 데이터 원본, Google 스프레드시트 데이터에 연결하는 데이터 원본, 클라우드 기반 데이터 원본, 추출 전용 데이터 원본 및 WDC 데이터 원본에도 적용될 수 있습니다.

2022.4 버전을 사용하는 뷰에 나타날 수 있는 몇 가지 차이점을 살펴보려면 아래의 섹션을 참조하십시오.

날짜 및 날짜/시간 값의 형식

10.5 이상 버전에서 추출은 날짜 문자열이 DATE, DATETIME 및 DATEPARSE 함수를 통해 해석되는 방식과 관련하여 보다 일관되고 엄격한 규칙을 따릅니다. 이 때문에 날짜가 구문 분석되는 방식이나 이러한 함수에 허용되는 날짜 형식 및 패턴이 영향을 받습니다. 보다 구체적으로, 이러한 규칙은 다음과 같이 일반화할 수 있습니다.

  1. 날짜는 행 기준이 아닌 열 기준으로 평가된 후 구문 분석됩니다.
  2. 날짜는 통합 문서가 열린 컴퓨터의 로캘이 아니라 통합 문서가 만들어진 위치의 로캘을 기반으로 평가된 후 구문 분석됩니다.

이러한 새로운 규칙은 추출의 효율성을 개선하며 상용 데이터베이스와 일치하는 결과를 생성할 수 있도록 합니다.

하지만 통합 문서가 만들어진 로캘이 통합 문서를 여는 로캘 또는 통합 문서를 게시하는 서버의 로캘과 다른 국제적인 시나리오에서는 이러한 규칙 때문에 1.) 날짜 및 날짜/시간 값이 다른 날짜 및 날짜/시간 값으로 변경되거나 2.) 날짜 및 날짜/시간 값이 Null로 변경될 수 있습니다. 날짜 및 날짜/시간 값이 다른 날짜 및 날짜/시간 값으로 변경되거나 Null이 되는 경우 기초 데이터에 문제가 있다는 의미인 경우가 많습니다.

버전 10.5 이상을 사용하는 추출 데이터 원본에서 날짜 및 날짜/시간 값이 변경되는 몇 가지 일반적인 이유는 다음과 같습니다.

날짜 및 날짜/시간 값이 변경되는 일반적인 이유

null 값의 일반적인 이유

  • 함수가 단일 열에서 여러 날짜 형식을 구문 분석해야 하는 경우. 날짜가 모호하고 여러 가지 다른 방식으로 해석될 수 있는 경우 날짜는 Tableau가 해당 열에 대해 결정한 형식에 따라 해석됩니다. 몇 가지 예에 대해서는 아래의 날짜 시나리오 1날짜 시나리오 2를 참조하십시오.
  • 함수에서 YYYY-MM-DD(ISO) 형식을 구문 분석해야 하는 경우. 예제는 날짜 시나리오 3을 참조하십시오.
  • 함수는 충분한 정보가 없어 시간을 유도할 수 없는 경우 시, 분, 초 및 밀리초에 대해 "0"을 사용하여 값을 "00:00:00.0"으로 해석할 수 있습니다.
  • 함수는 충분한 정보가 없어 날짜를 유도할 수 없는 경우 월에 대해 "1" 또는 "1월"로 값을 해석할 수 있습니다.
  • 함수는 연도를 구문 분석할 때 다음과 같이 해석합니다.
    • 연도 "07"은 "2007"로 해석합니다.
    • 연도 "17"은 "2017"로 해석합니다.
    • 연도 "30"은 "2030"으로 해석합니다.
    • 연도 "69"는 "2069"로 해석합니다.
    • 연도 "70"은 "1970"으로 해석합니다.
  • 함수가 단일 열에서 여러 날짜 형식을 구문 분석해야 하는 경우. Tableau가 날짜 형식을 결정한 후에는 형식에서 벗어나는 열의 다른 모든 날짜가 Null 값이 됩니다. 몇 가지 예에 대해서는 아래의 날짜 시나리오 1날짜 시나리오 2를 참조하십시오.
  • 함수에서 YYYY-MM-DD(ISO) 형식을 구문 분석해야 하는 경우. "YYYY" 또는 "MM" 또는 "DD"에 허용되는 값을 초과하는 값은 null 값이 됩니다. 예제는 날짜 시나리오 3을 참조하십시오.
  • 함수가 후행 문자를 포함하는 날짜 값을 구문 분석해야 할 경우. 예를 들어 "midnight"과 같은 표준 시간대 및 일광 절약 시간제 접미사 및 키워드는 Null 값을 발생시킵니다.
  • 함수가 유효하지 않은 날짜 또는 시간을 구문 분석해야 하는 경우. 예를 들어 32/3/2012는 null 값을 유발합니다. 또 다른 예로 25:01:61은 null 값을 유발합니다.
  • 함수가 모순되는 입력을 구문 분석해야 하는 경우. 예를 들어 패턴이 'dd.MM (MMMM) y'이고 입력 문자열이 '1.09 (August) 2017'이라고 가정합니다. 여기서 "9"와 "August" 모두 월입니다. 월 값이 같지 않기 때문에 결과는 null 값입니다.
  • 함수가 모순되는 패턴을 구문 분석해야 하는 경우. 예를 들어 그레고리오 연도 (y)와 ISO 주 (ww)를 혼합하여 지정한 패턴은 null 값을 유발합니다.
날짜 시나리오 1

영어 로캘에서 만든 통합 문서에 .tde 추출 데이터 원본이 사용된다고 가정합니다. 아래 표에는 추출 데이터 원본에 포함된 문자열 데이터 열이 나와 있습니다.

10/31/2018
31/10/2018

12/10/2018

이 특정 영어 로캘에서는 날짜 열의 형식이 MDY(월, 일 및 연도)를 따릅니다. 다음 표에는 DATE 함수를 사용하여 문자열 값을 날짜 값으로 변환할 때 이 로캘을 기반으로 Tableau에 표시되는 내용이 나와 있습니다.

October 31, 2018
October 31, 2018
December 10, 2018

추출을 독일어 로캘에서 열면 다음과 같이 표시됩니다.

31 Oktober 2018
31 Oktober 2018
12 Oktober 2018

그러나 10.5 이상 버전을 사용하여 독일어 로캘에서 추출을 연 후에는 독일어 로캘의 DMY(일, 월 및 연도) 형식이 엄격하게 적용되고 이 값 중 하나가 DMY 형식을 따르지 않기 때문에 Null 값이 표시됩니다.

Null
October 31, 2018
October 12, 2018
날짜 시나리오 2

영어 로캘에서 만든 또 다른 통합 문서에 .tde 추출 데이터 원본이 사용된다고 가정합니다. 아래 표에는 추출 데이터 원본에 포함된 숫자 형식 날짜 데이터 열이 나와 있습니다.

1112018
1212018
1312018
1412018

이 특정 영어 로캘에서는 날짜 열의 형식이 MDY(월, 일 및 연도)를 따릅니다. 다음 표에는 DATE 함수를 사용하여 숫자 값을 날짜 값으로 변환할 때 이 로캘을 기반으로 Tableau에 표시되는 내용이 나와 있습니다.

11/1/2018
12/1/2018
Null
Null
날짜 시나리오 3

.tde 추출 데이터 원본을 사용하는 통합 문서가 있다고 가정합니다. 아래 표에는 추출 데이터 원본에 포함된 문자열 데이터 열이 나와 있습니다.

2018-10-31
2018-31-10

2018-12-10

2018-10-12

날짜에 ISO 형식이 사용되므로 날짜 열은 항상 YYYY-MM-DD 형식을 따릅니다. 다음 표에는 DATE 함수를 사용하여 문자열 값을 날짜 값으로 변환할 때 Tableau에 표시되는 내용이 나와 있습니다.

October 10, 2018
Null
December 10, 2018
October 12, 2018

참고: 버전 10.4 이하에서는 ISO 형식 및 다른 날짜 형식에서 통합 문서를 만든 로캘에 따라 다른 결과가 생성되었습니다. 예를 들어 영어 로캘의 경우 2018-12-10과 2018/12/10이 모두 December 12, 2018을 생성합니다. 그러나 독일 로캘에서는 2018-12-10이 December 12, 2018을 생성하고 2018/12/10은 October 12, 2018을 생성합니다.

정렬 순서 및 대/소문자 구분

추출은 정렬을 지원하므로 악센트가 있거나 대/소문자가 다르게 표시된 문자열 값을 보다 올바르게 정렬할 수 있습니다.

예를 들어 문자열 값의 테이블이 있다고 가정합니다. 정렬 순서의 측면에서 이제 Égypte와 같은 문자열 값이 Estonie 뒤와 Fidji 앞에 적절하게 나열된다는 것을 의미합니다.

Excel 데이터 정보: 

대/소문자와 관련하여 Tableau가 값을 저장하는 방식이 버전 10.4(및 이전 버전)와 버전 10.5(및 이후 버전) 사이에서 변경되었다는 의미입니다. 그러나 값을 정렬하고 비교하는 규칙은 변경되지 않았습니다. 버전 10.4(및 이전 버전)에서는 "House," "HOUSE" 및 "houSe" 같은 문자열 값은 동일한 값으로 처리되고 하나의 대표 값으로 저장됩니다. 버전 10.5(및 이후 버전)에서는 동일한 문자열 값이 고유한 값으로 간주되므로 개별 값으로 저장됩니다. 자세한 내용은 값이 계산되는 방식의 변경 사항을 참조하십시오.

상위 N 쿼리에서 동점 해결

추출의 상위 N 쿼리가 순위의 특정 위치에 대해 중복 값을 생성하는 경우 10.5 이상 버전을 사용할 때 동점을 해결하는 위치가 다를 수 있습니다. 예를 들어 상위 3 필터를 만든다는 가정합니다. 위치 3, 4 및 5에 동일한 값이 있습니다. 10.4 이하 버전을 사용하는 경우 상위 필터가 1, 2 및 3 위치를 반환할 수 있습니다. 하지만 10.5 이상 버전을 사용하는 경우 상위 필터가 1, 2 및 5 위치를 반환할 수 있습니다.

부동 소수점 값의 정밀도

추출은 컴퓨터의 사용 가능한 하드웨어 리소스를 효율적으로 활용하므로 수학적 연산이 아주 평행한 방식으로 수행될 수 있습니다. 따라서 .hyper 추출에서는 실수가 다른 순서로 집계될 수 있습니다. 수가 다른 순서로 집계되면 집계가 계산될 때마다 소수점 뒤에 다른 값이 뷰에 표시될 수 있습니다. 이는 부동 소수점 덧셈 및 곱셈이 항상 결합인 것은 아니기 때문입니다. 즉, (a + b) + c가 반드시 a + (b + c)와 같지는 않습니다. 또한 부동 소수점 곱셈이 분배가 아닐 경우도 있기 때문에 실수가 다른 순서로 집계될 수 있습니다. 즉, (a x b) x c가 반드시 a x b x c와 같지는 않습니다. .hyper 추출에서 이러한 유형의 부동 소수점 반올림/반내림 동작은 상용 데이터베이스의 부동 소수점 반올림/반내림 동작과 유사합니다.

예를 들어 통합 문서에 부동 소수점 값으로 구성된 집계된 필드에 대한 슬라이더 필터가 포함된다고 가정합니다. 부동 소수점 값의 정밀도가 변경되었으므로 이제 필터는 필터 범위의 상한 또는 하한을 정의하는 마크를 제외할 수 있습니다. 이러한 값이 없으면 빈 뷰가 발생할 수 있습니다. 이 문제를 해결하려면 필터에 대한 슬라이더를 이동하거나 필터를 제거한 후 다시 추가합니다.

집계의 정확성

추출은 컴퓨터의 사용 가능한 하드웨어 리소스를 효율적으로 활용하여 큰 데이터 집합에 대해 최적화되므로 집계가 아주 평행한 방식으로 수행될 수 있습니다. 따라서 .hyper 추출을 통해 수행되는 집계의 결과는 통계 계산에 특화된 소프트웨어의 결과보다 상용 데이터베이스의 결과와 유사할 수 있습니다. 작은 데이터 집합을 사용하여 작업하거나 높은 수준의 정확성이 요구되는 경우 참조선, 요약 카드 통계 또는 테이블 계산 함수(예: 분산, 표준 편차, 상관 관계 또는 공분산)를 통해 집계를 수행하는 것이 좋습니다.

추출을 위한 지금 계산 옵션 정보

지금 계산 옵션이 이전 버전의 Tableau Desktop을 사용하는 .tde 추출에 사용된 경우 특정 계산된 필드가 구체화되고 미리 계산되어 추출에 저장됩니다. .tde 추출에서 .hyper 추출로 추출을 업그레이드하는 경우 추출에서 이전에 구체화된 계산은 포함되지 않습니다. 추출 업그레이드 후 구체화된 계산이 추출에 포함되게 하려면 지금 계산 옵션을 다시 사용해야 합니다. 자세한 내용은 추출에서 계산 구체화를 참조하십시오.

새 추출 API

추출 API 2.0을 사용하여 .hyper 추출을 만들 수 있습니다. 추출 게시와 같이, 이전에 Tableau SDK를 사용하여 수행한 작업의 경우 Tableau Server REST API 또는 Tableau Server 클라이언트 (Python) 라이브러리를 사용할 수 있습니다. 새로 고침 작업에도 Tableau Server REST API를 사용할 수 있습니다. 자세한 내용은 Tableau Hyper API를 참조하십시오.

추출 만들기

Tableau 워크플로우에는 추출을 만들 수 있는 여러 옵션이 있지만 기본적인 방법이 아래에 설명되어 있습니다.

  1. 데이터에 연결하고 데이터 원본 페이지에서 데이터 원본을 설정한 후 오른쪽 위에서 추출을 선택하고 편집 링크를 클릭하여 데이터 추출 대화 상자를 엽니다.

  2. (선택 사항) 다음 옵션 중 하나 이상을 구성하여 Tableau에 추출을 저장하고, 추출에 대한 필터를 정의하고, 추출의 데이터 양을 제한하는 방법을 지정합니다.

    • 추출 데이터를 저장하는 방법 결정

      Tableau에서 두 가지 구조(스키마), 즉 논리적 테이블(정규화된 스키마) 또는 물리적 테이블(정규화된 스키마) 중 하나를 사용하여 추출의 데이터를 저장하도록 선택할 수 있습니다. 논리적 테이블 및 물리적 테이블에 대한 자세한 내용은 Tableau 데이터 모델을 참조하십시오.

      선택하는 옵션에 따라 필요한 사항이 달라집니다.

      • 논리적 테이블

        데이터 원본의 논리적 테이블 하나마다 추출 테이블 하나를 사용하여 데이터를 저장합니다. 논리적 테이블을 정의하는 물리적 테이블은 병합되어 해당 논리적 테이블과 함께 저장됩니다. 예를 들어 데이터 원본이 단일 논리적 테이블로 구성된 경우 해당 데이터를 단일 테이블에 저장할 수 있습니다. 데이터 원본이 논리적 테이블 세 개로 구성되고 각 데이터 원본이 여러 물리적 테이블을 포함하는 경우 추출 데이터를 테이블 세 개(논리적 테이블마다 하나씩)에 저장할 수 있습니다.

        추출 필터, 집계, 상위 N 또는 비정규화된 데이터가 필요한 기타 기능과 같은 추가적인 추출 속성을 사용하여 추출의 데이터 양을 제한하려는 경우 논리적 테이블을 선택합니다. 또한 데이터에서 통과 함수(RAWSQL)를 사용하는 경우에도 사용합니다. 단일 테이블이 Tableau가 추출 데이터를 저장하는 데 사용하는 기본 구조입니다. 추출에 조인이 포함된 경우 이 옵션을 사용하면 추출이 만들어질 때 조인이 적용됩니다.

      • 물리적 테이블

        데이터 원본의 물리적 테이블 하나마다 추출 테이블 하나를 사용하여 데이터를 저장합니다.

        추출이 하나 이상의 동일성 조인이 결합된 테이블로 구성되고 아래에 나와 있는 물리적 테이블 옵션 사용을 위한 조건을 충족하는 경우 물리적 테이블을 선택합니다. 이 옵션을 사용하는 경우 쿼리 시점에 조인이 수행됩니다.

        이 옵션을 사용하면 성능이 향상될 수 있으며 추출 파일의 크기를 줄일 수 있습니다. Tableau가 물리적 테이블 옵션을 사용하도록 권장하는 방법에 대한 자세한 내용은 물리적 테이블 옵션 사용을 위한 팁을 참조하십시오. 일부 경우 행 수준 보안을 위한 임시적인 해결책으로 이 옵션을 사용할 수도 있습니다. Tableau 사용의 행 수준 보안에 대한 자세한 내용은 데이터 행 수준에서 액세스 제한을 참조하십시오.

        물리적 테이블 옵션 사용을 위한 조건

        물리적 테이블 옵션을 사용하여 추출을 저장하려면 추출의 데이터가 아래에 나와 있는 모든 조건을 충족해야 합니다.

        • 물리적 테이블 간의 모든 조인이 동일성(=) 조인이어야 함
        • 관계 또는 조인에 사용된 열의 데이터 유형이 동일해야 함
        • 통과 함수(RAWSQL)가 사용되지 않아야 함
        • 증분 새로 고침이 구성되지 않아야 함
        • 추출 필터가 구성되지 않아야 함
        • 상위 N개 또는 샘플링이 구성되지 않아야 함

        추출을 물리적 테이블로 저장하는 경우 물리적 테이블에 데이터를 추가할 수 없습니다. 논리적 테이블의 경우 둘 이상의 논리적 테이블이 있는 추출에 데이터를 추가할 수 없습니다.

      참고: 논리적 테이블 옵션과 물리적 테이블 옵션 모두 추출의 데이터가 저장되는 방식에만 영향을 줍니다. 이 옵션은 추출의 테이블이 데이터 원본 페이지에 표시되는 방식에는 영향을 주지 않습니다.

      예를 들어 추출이 물리적 테이블 3개를 포함하는 단일 논리적 테이블로 구성되어 있다고 가정합니다. 기본 옵션인 논리적 테이블을 사용하도록 구성된 추출(.hyper) 파일을 직접 열면 데이터 원본 페이지에 테이블 하나가 나열되는 것을 알 수 있습니다. 하지만 패키지 데이터 원본(.tdsx) 파일을 사용하는 추출을 열거나 데이터 원본(.tdsx) 파일과 해당하는 추출(.hyper) 파일을 함께 여는 경우 데이터 원본 페이지에 추출을 구성하는 3개 테이블이 모두 표시되는 것을 알 수 있습니다.

    • 추출할 데이터의 양 결정 

      추가를 클릭하여 필드 및 해당 값을 기반으로 추출되는 데이터의 양을 제한하는 하나 이상의 필터를 정의합니다.

    • 추출의 데이터 집계 

      측정값의 기본 집계를 사용하여 측정값을 집계하려면 표시된 차원에 대한 데이터 집계를 선택합니다. 데이터를 집계하면 행이 통합되며 추출 파일의 크기를 최소화하고 성능을 향상시킬 수 있습니다.

      데이터 집계를 선택할 때 연도, 월 등의 지정한 날짜 수준으로 날짜 롤업을 선택할 수 있습니다. 아래 예제는 선택할 수 있는 각 집계 옵션에서 데이터가 추출되는 방식을 보여줍니다.

      원래 데이터각 레코드가 별도의 행으로 표시됩니다. 데이터에는 7개 행이 있습니다.
      표시된 차원에 대한 데이터 집계

      (롤업 없음)

      동일한 날짜와 지역의 레코드가 단일 행으로 집계되었습니다. 추출에는 5개 행이 있습니다.
      표시된 차원에 대한 데이터 집계
      (다음으로 날짜 롤업: 월)
      날짜가 월 수준으로 롤업되었으며 동일한 지역의 레코드가 단일 행으로 집계되었습니다. 추출에는 3개 행이 있습니다.
    • 추출할 행 선택

      추출하려는 행 수를 선택합니다.

      모든 행 또는 상위 N개 행을 추출할 수 있습니다. 먼저 모든 필터와 집계가 적용된 다음 필터링 및 집계된 결과에서 해당 개수의 행이 추출됩니다. 행 수 옵션은 추출하는 데이터 원본의 유형에 따라 달라집니다.

      참고:

      • 일부 데이터 원본은 샘플링을 지원하지 않습니다. 따라서 데이터 추출 대화 상자에 샘플링 옵션이 표시되지 않을 수 있습니다.

      • 데이터 원본 페이지 또는 시트 탭에서 숨긴 필드는 추출에서 제외됩니다. 이 숨겨진 필드를 추출에서 제거하려면 사용되지 않은 필드 모두 숨기기 단추를 클릭합니다.

  3. 작업을 마쳤으면 확인을 클릭합니다.

  4. 시트 탭을 클릭합니다. 시트 탭을 클릭하면 추출 만들기가 시작됩니다.

  5. 이후 대화 상자에서 추출을 저장할 위치를 선택하고 추출 파일에 이름을 지정한 다음 저장을 클릭합니다.

    저장 대화 상자가 표시되지 않을 경우 아래 추출 문제 해결 섹션을 참조하십시오.

추출 작업에 대한 일반적인 팁

통합 문서를 저장하여 추출에 대한 연결 유지

추출이 만들어진 후에는 데이터의 추출 버전이 통합 문서에 사용됩니다. 그러나 통합 문서를 저장하지 않으면 데이터의 추출 버전에 대한 연결이 유지되지 않습니다. 즉, 통합 문서를 먼저 저장하지 않고 닫은 경우 다음에 통합 문서를 열면 통합 문서가 원래 데이터 원본에 연결합니다.

샘플링된 데이터와 전체 추출 간 전환

큰 추출로 작업하는 경우 데이터 샘플을 사용하여 추출을 만들면 시트 탭에서 선반에 필드를 배치할 때마다 긴 쿼리를 수행하지 않고 뷰를 설정할 수 있습니다. 그런 다음 데이터 메뉴에서 데이터 원본을 선택한 다음 추출 사용을 선택하여 추출(샘플 데이터가 포함된 추출) 사용과 전체 데이터 원본 사용을 전환할 수 있습니다.

추출에 직접 연결하지 않음

추출은 파일 시스템에 저장되므로 새로운 Tableau Desktop 인스턴스를 사용하여 직접 연결하는 것이 가능합니다. 하지만 직접 연결은 몇 가지 이유로 권장되지 않습니다.

  • 테이블 이름이 달라집니다. 추출에 저장된 테이블은 이름 고유성을 보장하기 위해 특수한 명명 규칙을 사용하며 사람이 인식하기 어려울 수 있습니다.
  • 추출을 새로 고칠 수 없습니다. 추출에 직접 연결한 경우 Tableau는 해당 파일을 기초 데이터의 복제가 아니라 실제 원본으로 취급합니다. 따라서 역으로 원본 데이터에 연관시킬 수 없게 됩니다.
  • 데이터 모델 및 관계가 손실됩니다. 데이터 모델과 테이블 간의 관계는 .hyper 파일이 아니라 .tds 파일에 저장되므로 .hyper 파일에 직접 연결하면 이 정보가 손실됩니다. 또한 추출이 논리적 테이블 저장소를 사용하는 경우 원래 기초 물리적 테이블에 대한 참조가 표시되지 않습니다.

통합 문서에서 추출 제거

언제든지 데이터 메뉴에서 추출 데이터 원본을 선택한 다음 추출 > 제거를 선택하여 추출을 제거할 수 있습니다. 추출을 제거할 때 통합 문서에서만 추출을 제거할지, 아니면 추출 파일을 제거 및 삭제할지를 선택할 수 있습니다. 후자의 옵션을 선택하면 하드 드라이브에서 추출이 삭제됩니다.

추출 기록 보기

데이터 메뉴에서 데이터 원본을 선택한 다음 추출 > 기록을 선택하여 추출이 마지막으로 업데이트된 시간 및 기타 상세 정보를 볼 수 있습니다.

추출로 저장된 통합 문서를 열 때 Tableau가 추출의 위치를 찾지 못하면 추출을 찾을 수 없음 대화 상자에서 다음 옵션 중 하나를 선택합니다.

  • 추출 찾기: 추출이 존재하지만 원래 Tableau에서 저장한 위치에 있지 않은 경우 이 옵션을 선택합니다. 확인을 클릭하여 파일 열기 대화 상자를 엽니다. 이 대화 상자에서 추출 파일의 새 위치를 지정할 수 있습니다.

  • 추출 제거: 더 이상 추출이 필요하지 않은 경우 이 옵션을 선택합니다. 이 옵션은 데이터 원본을 닫는 것과 같습니다. 데이터 원본을 참조하는 모든 열려 있는 워크시트가 삭제됩니다.

  • 추출 비활성화: 추출 대신 추출을 만든 원래 데이터 원본을 사용합니다.

  • 추출 다시 생성: 추출을 다시 만듭니다. 원래 추출을 만들 때 지정한 모든 필터와 기타 사용자 지정이 자동으로 적용됩니다.

물리적 테이블 옵션 사용을 위한 팁

Tableau에서는 일반적으로 추출을 설정하고 작업할 때 기본 데이터 저장소 옵션인 논리적 테이블을 사용하도록 권장합니다. 추출 필터와 같이 추출에 필요한 일부 기능은 논리적 테이블 옵션을 사용하는 경우에만 사용할 수 있는 경우가 많습니다.

예상보다 큰 추출에 대한 물리적 테이블 옵션

물리적 테이블 옵션은 데이터 원본이 물리적 테이블 옵션 사용을 위한 조건을 충족하고 추출의 크기가 예상보다 큰 경우와 같은 특정 상황을 해결하기 위해서만 제한적으로 사용되어야 합니다. 추출이 예상보다 큰지 결정하려면 논리적 테이블 옵션을 사용하는 추출의 행 합계가 추출을 생성하기 전 결합된 모든 테이블의 행 합계보다 큰지 확인해야 합니다. 이 시나리오가 발생한 경우 물리적 테이블 옵션을 대신 사용해 보십시오.

물리적 테이블 옵션 사용 시 대체 필터링 제안 사항

물리적 테이블 옵션을 사용하는 경우 추출 필터, 집계, 상위 N 및 샘플링과 같이 추출에서 데이터를 줄이는 데 도움이 되는 다른 옵션을 사용할 수 없습니다. 물리적 테이블 옵션을 사용하는 추출에서 데이터를 줄여야 하는 경우 다음 제안 사항 중 하나를 사용하여 Tableau Desktop으로 가져오기 전에 데이터를 필터링하는 것이 좋습니다.

  • 사용자 지정 SQL을 사용하여 데이터 연결 및 필터 정의: 데이터베이스 테이블에 연결하는 대신 사용자 지정 SQL을 사용하여 데이터에 연결합니다. 사용자 지정 SQL 쿼리를 만들 때 추출의 데이터를 줄이기 위해 필요한 적절한 수준의 필터링이 포함되어 있는지 확인합니다. Tableau Desktop의 사용자 지정 SQL에 대한 자세한 내용은 사용자 지정 SQL 쿼리에 연결을 참조하십시오.

  • 데이터베이스에서 뷰 정의: 데이터베이스에 대한 쓰기 액세스 권한이 있는 경우 추출에 필요한 데이터만 포함하는 데이터베이스 뷰를 정의한 다음 Tableau Desktop에서 해당 데이터베이스 뷰에 연결하는 것이 좋습니다.

추출이 포함된 행 수준 보안

행 수준에서 추출 데이터를 보호하려는 경우 물리적 테이블 옵션을 사용하는 것이 이 시나리오를 달성하기 위한 권장 방법입니다. Tableau의 행 수준 보안에 대한 자세한 내용은 데이터 행 수준에서 액세스 제한을 참조하십시오.

추출 문제 해결

  • 추출을 만드는 데 시간이 오래 걸림: 데이터 집합의 크기에 따라 추출을 만드는 데 시간이 오래 걸릴 수 있습니다. 그러나 데이터를 추출하고 컴퓨터에 저장한 후에는 성능이 향상될 수 있습니다.

  • 추출이 만들어지지 않음: 데이터 집합에 아주 많은 수(예: 수천 개)의 열이 포함되어 있는 경우 Tableau가 추출을 만들지 못하는 경우도 있습니다. 문제가 발생하면 더 적은 수의 열을 추출하거나 기초 데이터를 다시 구성해 보십시오.

  • 저장 대화 상자가 표시되지 않음 또는 .twbx에서 추출이 만들어지지 않음: 위 절차를 수행하여 패키지 통합 문서에서 데이터를 추출할 경우 저장 대화 상자가 표시되지 않습니다. 패키지 통합 문서(.twbx)에서 추출이 만들어지면 추출 파일은 패키지 통합 문서와 연결된 파일의 패키지에 자동으로 저장됩니다. 패키지 통합 문서에서 만든 추출 파일에 액세스하려면 통합 문서의 패키지를 풀어야 합니다. 자세한 내용은 패키지 통합 문서를 참조하십시오.

피드백을 제공해 주셔서 감사합니다!