추출 새로 고침
원래 데이터가 변경되면 Desktop의 데이터 메뉴에서 데이터 원본을 선택한 다음 을 선택하여 추출을 새로 고칠 수 있습니다. 추출은 완전히 새로 고치거나 증분식으로 새로 고치는 두 가지 방법으로 설정할 수 있습니다.
전체 새로 고침을 사용하면 추출의 모든 데이터가 원래 데이터 원본의 최신 정보로 바뀝니다. 증분식 새로 고침에는 두 가지 변형이 있습니다. 마지막 새로 고침 이후의 새 행만 추가하거나 새로 고침 날짜로부터 새로 고칠 기간을 정의하는 것입니다. 선택 사항인 두 번째 접근 방식은 이미 추출된 데이터가 데이터 원본에서 변경되었을 가능성이 있는 경우 추출을 업데이트해야 할 필요성을 해결합니다. 데이터를 추출하는 방법에 대한 자세한 내용은 데이터 추출을 참조하십시오.
참고: Tableau 데이터 추출 명령줄 유틸리티를 사용하여 추출 새로 고침을 자동화할 수도 있습니다.
추출을 새로 고치려면 추출 새로 고침을 수행하기 전에 추출의 파일 형식을 확인하십시오. 버전 2022.4 이상을 사용하여 .tde
추출의 새로 고침을 수행하면 추출이 자동으로 .hyper
추출로 업그레이드됩니다. .hyper
추출로 업그레이드하면 많은 이점이 있지만 이전 버전의 Tableau Desktop에서 추출을 열 수 없게 됩니다. 자세한 내용은 .hyper 형식으로 추출 업그레이드를 참조하십시오.
참고: .tde 파일은 Tableau 버전 2024.2 이후 어떤 형식으로도 더 이상 지원되지 않으며, 사용하려면 .hyper 형식으로 업그레이드해야 합니다.
기본적으로 추출은 전체 새로 고침으로 구성됩니다. 즉, 추출을 새로 고칠 때마다 모든 행이 원래 데이터 원본에 있는 데이터로 바뀝니다. 이 종류의 새로 고침을 사용하면 원래 데이터에 있는 데이터의 전체 복사본을 가질 수 있지만 전체 새로 고침은 추출 크기에 따라 작업 시간이 오래 걸리며 데이터베이스 비용이 증가할 수 있습니다. 추출이 증분 새로 고침으로 구성되지 않은 경우 추출 새로 고침을 선택하면 추출의 전체 새로 고침이 수행됩니다.
Tableau Server에 게시
추출을 데이터 원본으로 Tableau Server에 게시하려는 경우 게시하는 동안 추출 새로 고침 일정을 지정할 수 있습니다.
마찬가지로, 통합 문서의 추출을 Tableau Server에 게시하는 경우 게시하는 동안 추출 새로 고침 일정을 지정할 수 있습니다. 자세한 내용은 통합 문서를 게시할 때 추출 새로 고침 예약을 참조하십시오.
Tableau Cloud에 게시
추출을 데이터 원본으로 Tableau Cloud에 게시하려는 경우 데이터를 새로 고치는 옵션은 데이터 원본의 특성에 따라 달라집니다. 특정 데이터 원본의 데이터를 새로 고치는 것에 대한 자세한 내용은 데이터 원본별 추출 새로 고침 옵션을 참조하십시오.
대부분의 데이터 원본은 증분 새로 고침을 지원합니다. 전체 추출을 새로 고치는 대신 이전에 데이터를 추출한 이후 새로 생성된 행만 추가하도록 새로 고침을 구성할 수 있습니다.
예를 들어 매일 새 매출 거래로 업데이트되는 데이터 원본이 있을 수 있습니다. 전체 추출을 매일 다시 작성하는 대신 그날 발생한 새 거래를 추가할 수 있습니다. 그런 다음 매주 한 번 전체 새로 고침을 수행하여 날짜 데이터를 최신 상태로 유지할 수 있습니다.
증분 설정을 선택적으로 구성하여 기존 추출에서 모든 연결된 데이터를 제거하고 완전히 새로 고쳐서 해당 시간 범위의 마지막 새로 고침 이후의 모든 변경 사항이나 추가 사항을 가져오도록 하위 시간 범위를 정의할 수도 있습니다.
고유하지 않은 열
버전 2024.1부터 Tableau에는 사용자가 고유하지 않은 키 열을 사용하여 추출에 증분 새로 고침을 수행할 수 있는 기능이 도입되었습니다. 이번 업데이트에서는 프로세스에 추가 단계가 도입되었습니다.
증분 추출을 위한 하위 범위 새로 고침
Tableau 버전 2024.2 이상에서는 추가 기간을 지정하여, 그사이 발생한 모든 변경 사항이 반영되도록 이전에 추출한 데이터를 다시 추출할 수 있습니다. 이는 새로 고칠 최소 날짜 범위 필드를 사용하여 수행됩니다. 이는 예를 들어 데이터 원본이 정의된 기간 내에 삽입 및 소급 수정을 허용하는 경우에 유용합니다. 구성이 완료되면 증분 추출은 새로운 데이터와 설정된 시간 범위에서 이전에 추출된 데이터를 가져옵니다.
숫자(예: 2)와 기간(예: 개월)을 선택하면 아래의 도우미 텍스트가 선택 사항을 반영하여 업데이트됩니다('새로 고침 날짜 기준으로 지난 2개월 데이터가 항상 새로 고쳐집니다'). 시간 범위를 입력하지 않으면 기존 추출에 있는 것보다 최신인 콘텐츠만 가져옵니다.
하위 범위 새로 고침 이해
하위 범위 새로 고침을 가장 효과적으로 구성하는 방법은 추출 항목을 새로 고칠 빈도, 데이터 원본을 업데이트하는 빈도, 각 기간 동안 일반적으로 업데이트되는 데이터 양에 따라 다르게 구성하는 것입니다. Tableau가 선택된 추출 구성을 어떻게 해석하는지 이해하는 것은 추출에 예상한 데이터가 포함되도록 하는 데 중요합니다.
- 여러 개의 시간 단위가 입력되면 Tableau는 기존 시간 단위의 모든 데이터와 추가로 X 단위의 데이터를 가져오는 것으로 해석합니다. 예를 들어 3개월로 설정하면 현재 달의 모든 데이터와 이전 3개월 분의 데이터를 가져옵니다. 현재 날짜가 4월 1일이면 4월의 모든 데이터(이 경우 4월 1일의 데이터)와 1월, 2월, 3월의 모든 데이터, 즉 약 91일 분의 데이터를 가져옵니다. 4월 28일에 동일한 새로 고침을 실행하면 4월 28일 분의 데이터와 그 이전 3개월 분의 데이터, 즉 약 118일 분의 데이터를 가져옵니다.
- 세부적인 제어와 일관성을 위해 가장 좋은 방법은 데이터에 적합한 시간 단위 중 적용 가능한 가장 작은 단위(예: 일)를 사용하는 것입니다. 새로 고치는 날을 포함하여 이전 90일 분의 데이터를 항상 새로 고치려면 숫자로 90을 선택하고 기간으로 일을 선택하면 됩니다.
- Tableau에서는 레코드가 입력된 날짜/시간을 반영하는 날짜/시간 필드를 기반으로 추출을 작성하는 것이 좋습니다. 추출을 결정하는 데 사용되는 날짜 필드에 미래 날짜(예: '계획된 주문 배송 날짜')가 포함되어 있는 경우, 하위 범위 새로 고침 기능을 사용한 결과는 예상과 다를 수 있습니다. 예를 들어, 증분 새로 고침은 새로 고침 날짜로부터 이전 2개월 분의 데이터를 추출하도록 설정됩니다. 지금은 4월 1일이지만, 데이터베이스에는 이 날짜 필드에 최대 6개월 후인 9월 1일까지의 값이 포함된 레코드가 있습니다. 이 예에서 새로 고침이 발생하면 4월(현재 새로 고침 월)의 데이터와 이전 2개월의 데이터만 추출됩니다. 4월 이후의 미래 날짜와 관련된 행에 대해 데이터 원본에서 변경 사항이 발생하는 경우 해당 변경 사항은 업데이트되지 않습니다.
- 데이터 원본에 새로 고칠 새 데이터가 구성된 기간보다 많은 경우, 새 데이터를 사용할 수 있는 시점부터 추가 데이터 가져오기가 시작됩니다. 예를 들어, 이전 2일에 대해서만 하위 범위를 구성했지만 마지막 새로 고침이 10일 전에 발생한 경우, 전체 10일 분의 새 데이터와 이전에 추출된 2일 분의 추가 데이터가 모두 추출됩니다.
참고: 원본 데이터의 데이터 구조가 변경된 경우(예: 새 열이 추가된 경우) 증분 새로 고침을 다시 시작하려면 먼저 전체 추출 새로 고침을 수행해야 합니다.
다음 단계에 따라 증분 방식으로 새로 고칠 추출을 설정하거나, 증분 새로 고침을 사용하도록 기존 전체 추출을 편집합니다.
데이터 메뉴에서 데이터 원본을 선택한 다음 데이터 추출을 선택합니다.
데이터 추출 대화 상자에서 추출할 행 수로 모든 행을 선택합니다. 증분 새로 고침은 데이터베이스에 있는 모든 행을 추출하는 경우에만 정의할 수 있습니다.
참고: 샘플 추출에는 증분 방식을 사용할 수 없습니다.
증분 새로 고침 섹션을 확장하고 증분 새로 고침을 선택합니다.
새 행을 식별하는 데 사용할 데이터베이스의 열을 지정합니다.
예를 들어 데이터베이스에 행이 추가됨에 따라 단조롭게 증가하는 날짜 필드 또는 ID 열을 선택할 수 있습니다.
(선택 사항) Tableau에서 날짜 또는 날짜/시간 열을 선택하는 경우 특정 날짜 범위를 지정하여 추출 데이터의 부분 새로 고침을 수행할 수 있습니다. 일 수를 결정하고 날짜/시간 단위를 지정하여 새로 고침에 대한 최소 날짜 범위(예: 새로 고침 날짜로부터 14일)를 설정합니다.
(선택 사항) 최소 새로 고침 범위가 설정되지 않은 경우 고급 설정을 확장하여 새 행을 검색하는 방법을 설정합니다. 마지막으로 기록된 값과 같거나 더 큰 값을 새로 고쳐서 추가된 마지막 행을 바꾸도록 선택하거나, 마지막으로 기록된 값보다 큰 값으로 추출을 새로 고쳐서 마지막으로 추가된 행을 유지하도록 선택할 수 있습니다.
마치려면 설정 저장을 선택합니다.
참고: 집계를 사용하도록 설정하면 증분 새로 고침을 사용할 수 없습니다.
참고: 필터가 추가되면 증분 새로 고침에 대한 고급 설정이 회색으로 표시되고 기본 설정인 '추가된 마지막 행을 바꾸지 않음'이 적용됩니다. 이는 특정 필터 기준과 '추가된 마지막 행을 바꾸는' 고급 증분 새로 고침 논리 간에 발생할 수 있는 충돌을 방지하는 데 목적이 있습니다.
추출을 새로 고칠 때의 고려 사항
추출 편집
기존 추출을 편집하는 경우 추출을 올바른 데이터로 업데이트하도록 마지막 새로 고침이 표시됩니다.
전체 새로 고침
전체 새로 고침은 추출을 새로 고칠 때마다 모든 행을 원래 데이터 원본의 데이터로 바꿉니다. 전체 새로 고침은 오래 걸릴 수 있고 데이터베이스 공간을 많이 차지할 수 있습니다.
시간/날짜 정밀도 및 추출
Tableau가 추출을 만들기 위해 사용하는 기반 메커니즘인 데이터 엔진은 소수점 이하 3자리까지 정밀도로 시간 값을 저장합니다. 다음 열을 사용하여 새 행 식별에 날짜/시간 또는 타임스탬프 열을 지정하고 데이터베이스에서 Tableau보다 높은 정밀도를 사용하는 경우 증분 새로 고침 후에 중복 행이 나타날 수 있습니다. 예를 들어 데이터베이스에 날짜/시간 값이 2015-03-13 17:30:56.502352
인 행과 날짜/시간 값이 2015-03-13 17:30:56.502852
인 행이 있는 경우 Tableau는 두 행을 모두 날짜/시간 값 2015-03-13 17:30:56.502
를 사용하여 저장하므로 중복 행이 생성됩니다.
데이터 메뉴에서 데이터 원본을 선택한 다음 을 선택하여 추출을 새로 고친 시간의 기록을 확인할 수 있습니다.
추출 기록 대화 상자에는 각 새로 고침의 날짜 및 시간, 전체 또는 증분 추출인지 여부, 추가된 행 수 등이 표시됩니다. 파일에서 새로 고침을 수행한 경우 원본 파일 이름도 표시됩니다.