데이터 집합 구성

참고: 버전 2020.4.1부터 Tableau ServerTableau Online에서 흐름을 만들고 편집할 수 있습니다. 이 항목의 내용은 특별히 언급하지 않는 한 모든 플랫폼에 적용됩니다. 웹에서 흐름을 작성하는 것에 대한 자세한 내용은 웹에서의 Tableau Prep을 참조하십시오.

흐름에 포함할 데이터 집합의 양을 결정하려면 데이터 집합을 구성하면 됩니다. 데이터에 연결하거나 테이블을 흐름 패널에 끌어 놓으면 입력 단계가 자동으로 흐름에 추가됩니다. 입력 단계는 항상 흐름의 첫 번째 단계입니다. 입력 단계를 마우스 오른쪽 단추로 클릭하여 입력 단계의 이름을 바꾸거나 입력 단계를 제거할 수 있습니다. Excel 또는 텍스트 파일에 연결한 경우 입력 단계에서 데이터를 새로 고칠 수도 있습니다. 입력 단계에서 데이터를 새로 고치는 것에 대한 자세한 내용은 입력 단계에서 더 많은 데이터 추가(링크가 새 창에서 열림)를 참조하십시오.

입력 단계에서 데이터 집합의 세부 정보를 확인할 수 있습니다. 여기에서 필드를 검색하고, 샘플 값을 확인하고, 데이터 집합의 크기를 줄이기 위해 포함할 필드를 선택하거나, 작업할 데이터 샘플을 선택하거나, 선택한 필드 또는 행에 필터를 적용하는 등 다양한 작업을 수행할 수 있습니다. 또한 필드명을 변경하여 필드 속성을 구성하거나 텍스트 파일의 텍스트 설정을 구성할 수도 있습니다.

지원하는 데이터 연결의 경우 입력 단계에서 데이터 유형을 변경할 수도 있습니다. 여기에는 Microsoft Excel, 텍스트 및 PDF 파일, Box, Dropbox, Google Drive 및 OneDrive의 데이터가 포함됩니다. 다른 데이터 원본의 경우 정리 단계에서 데이터 유형을 변경할 수 있습니다. 자세한 내용은 데이터에 할당된 데이터 유형 검토를 참조하십시오.

참고: 대괄호를 포함하는 필드 값은 자동으로 중괄호로 변경됩니다.

사용자 지정 SQL 쿼리에 연결

데이터베이스가 사용자 지정 SQL 사용을 지원하는 경우 연결 패널의 하단에 사용자 지정 SQL이 표시됩니다. 사용자 지정 SQL을 두 번 클릭하여 사용자 지정 SQL 탭을 여십시오. 이 탭에서 데이터를 사전 선택하는 쿼리를 입력하고 원본별 작업을 사용할 수 있습니다. 쿼리에서 데이터 집합이 검색된 후 흐름에 데이터를 추가하기 전에 포함할 필드를 선택하거나, 필터를 적용하거나, 데이터 유형을 변경할 수 있습니다.

사용자 지정 SQL 사용에 대한 자세한 내용은 사용자 지정 SQL을 사용하여 데이터에 연결을 참조하십시오.

입력 단계에 정리 작업 적용

입력 단계에서는 정리 작업 중 일부만 사용할 수 있습니다. 입력 필드 목록에서 다음과 같은 변경을 수행할 수 있습니다. 변경 사항은 변경 패널에서 추적되고 흐름 패널의 입력 단계 왼쪽과 입력 필드 목록에 주석이 추가됩니다.

  • 필터: 툴바에서 값 필터링을 클릭하고 계산 에디터에 필터 조건을 입력합니다.

  • 필드명 바꾸기: 필드명 필드에서 필드명을 두 번 클릭하거나 Ctrl-클릭(MacOS)하고 새 필드명을 입력합니다.

  • 데이터 유형 변경: 필드의 데이터 유형을 클릭하고 메뉴에서 새 데이터 유형을 선택합니다.

  • 필드 제거: 흐름에 포함하지 않으려는 필드 옆에 있는 확인란을 선택 취소합니다.

흐름에 포함할 필드 선택

입력 패널에 데이터 집합의 필드 목록이 표시됩니다. 검색 필드를 사용하여 목록에서 필드를 찾은 다음 확인란을 사용하여 포함하거나 제외할 필드를 선택합니다. 모든 필드를 흐름에 포함하거나 흐름에서 제외하려면 그리드 왼쪽 상단에 있는 확인란을 전환합니다.

입력 단계의 필드에 필터 적용

필드를 필터링하려면 다음 작업을 수행합니다.

  1. 툴바에서 값 필터링을 클릭합니다.

  2. 계산 에디터에 필터 조건을 입력합니다.

계산 필터 유형은 입력 단계에서 사용할 수 있는 유일한 필터 옵션입니다. 다른 단계 옵션에서는 다른 필터 옵션을 사용할 수 있습니다. 자세한 내용은 데이터 필터링(링크가 새 창에서 열림)을 참조하십시오.

필드명 변경

필드명을 변경하려면 필드명 열에서 이름을 선택한 다음 필드에 새 이름을 입력합니다. 주석은 필드 그리드와 입력 단계 왼쪽에 있는 흐름 패널에 추가됩니다. 변경 내용은 변경 패널에서도 추적됩니다.

데이터 유형 변경

필드의 데이터 유형을 변경하려면 다음 작업을 수행합니다.

  1. 필드의 데이터 유형을 클릭합니다.

  2. 메뉴에서 새 데이터 유형을 선택합니다.

    흐름에서 다른 단계 유형의 필드에 대한 데이터 유형을 변경하거나 필드 값의 유효성을 확인하는 데 도움이 되는 데이터 역할을 할당할 수도 있습니다. 데이터 유형 변경 또는 데이터 역할 사용에 대한 자세한 정보는 데이터에 할당된 데이터 유형 검토(링크가 새 창에서 열림)데이터 역할을 사용하여 데이터 유효성 확인(링크가 새 창에서 열림)을 참조하십시오.

필드 속성 구성

텍스트 파일로 작업하는 경우 연결을 편집하고 텍스트 파일의 필드 구분 기호와 같은 텍스트 속성을 구성할 수 있는 설정 탭이 표시됩니다. 연결 패널에서 파일 연결을 편집하거나 증분 새로 고침 설정을 구성할 수도 있습니다. 흐름에 대한 증분 새로 고침을 설정하는 것에 대한 자세한 내용은 증분 새로 고침을 사용하여 흐름 데이터 새로 고치기를 참조하십시오.

텍스트 또는 Excel 파일로 작업하는 경우 흐름을 시작하기 전이라도 잘못 유추된 데이터 유형을 수정할 수 있습니다. 흐름을 시작한 후에는 프로필 패널의 후속 단계에서 언제라도 데이터 유형을 변경할 수 있습니다.

텍스트 파일의 텍스트 설정 구성

텍스트 파일을 구문 분석하는 데 사용되는 설정을 변경하려면 다음 옵션 중에서 선택합니다.

  • 첫 번째 행이 머리글 포함(기본값): 첫 번째 행을 필드 레이블로 사용하려면 이 옵션을 선택합니다.

  • 필드명 자동 생성: Tableau Prep Builder가 필드 머리글을 자동으로 생성하게 하려면 이 옵션을 선택합니다. 필드 명명 규칙은 Tableau Desktop과 동일한 모델을 따릅니다. 예를 들어 F1, F2 등이 사용됩니다.

  • 필드 구분 기호: 열을 구분하는 데 사용할 문자를 목록에서 선택합니다. 사용자 지정 문자를 입력하려면 기타를 선택합니다.

  • 텍스트 한정자: 파일에서 값을 둘러싸는 문자를 선택합니다.

  • 문자 집합: 텍스트 파일 인코딩을 설명하는 문자 집합을 선택합니다.

  • 로캘: 파일 구문 분석에 사용할 로캘을 선택합니다. 이 설정은 사용할 소수 자릿수 및 1000단위 구분 기호를 나타냅니다.

데이터 샘플 크기 설정

최대 성능을 유지하기 위해 Tableau Prep은 기본적으로 흐름에 포함되는 데이터를 데이터 집합의 대표적인 샘플로 제한합니다. 데이터 샘플은 데이터 집합의 총 필드 수와 해당 필드의 데이터 유형을 기반으로 최적의 행 수를 계산하여 결정합니다. 그런 다음 Tableau Prep은 가능한 한 빨리 계산된 양에 해당하는 행 수를 위부터 읽어들입니다.

샘플이 계산되고 반환되는 방식에 따라 결과 데이터 샘플에 필요한 모든 행이 포함되거나 포함되지 않을 수 있습니다. 필요한 데이터가 보이지 않는 경우 데이터 샘플 설정을 변경하여 쿼리를 다시 실행할 수 있습니다.

웹에서 흐름을 만들거나 편집할 때 흐름에 포함할 수 있는 데이터의 양에 제한이 적용되며 데이터 샘플을 변경하는 데 사용할 수 있는 옵션은 Tableau Prep Builder에서 작업할 때와 약간 다릅니다. 자세한 내용은 샘플 데이터 및 처리 제한을 참조하십시오.

참고: 데이터가 샘플링된 경우 프로필 패널에 샘플링됨 배지가 표시되고 추가하는 모든 단계에서 유지됩니다. 수행한 모든 변경 사항은 흐름에서 작업하는 샘플에 적용됩니다. 흐름을 실행하면 전체 데이터 집합에 모든 변경 사항이 적용됩니다.

데이터 샘플 설정을 변경하려면 입력 단계를 선택한 다음 데이터 샘플 탭의 다음 옵션 중에서 선택합니다.

  • 기본 샘플 양(기본값): Tableau Prep이 반환할 총 행 수를 계산합니다.

  • 모든 데이터 사용(Tableau Prep Builder만 해당): 크기에 관계없이 데이터 집합의 모든 행을 검색합니다. 이 설정을 사용하면 성능이 저하되거나 Tableau Prep Builder가 시간 초과될 수 있습니다.

    참고: 성능을 유지하기 위해 이 설정을 선택하더라도 집계 및 유니온 단계 유형에는 1백만 개 행의 데이터 샘플 한계가 적용되고 조인 및 피벗 단계 유형에는 3백만 개 행의 데이터 샘플 한계가 적용됩니다.

  • 고정된 행 수: 데이터 집합에서 반환할 행 수를 선택합니다. 권장 행 수는 1백만 개 이하입니다. 1백만 개를 초과하는 행 수를 설정하면 성능이 저하될 수 있습니다.

    • 웹 작성: 대규모 데이터 집합을 사용할 때 사용자가 선택할 수 있는 최대 행 수는 관리자가 구성합니다. 사용자는 해당 제한까지 행 수를 선택할 수 있습니다.
  • 빠른 선택(기본값): 데이터베이스가 가능한 한 빨리 요청된 행 수를 반환합니다. 이는 처음 N개 행이거나 이전 쿼리에서 데이터베이스가 메모리에 캐시한 행일 수 있습니다.

  • 임의 샘플: 데이터베이스가 요청된 행 수를 반환하지만 데이터 집합의 모든 행을 조사하여 모든 행 중에서 대표적인 샘플을 반환합니다. 이 옵션을 사용하면 데이터를 처음 검색할 때 성능이 저하될 수 있습니다.

피드백을 제공해 주셔서 감사합니다!