데이터 정리 및 변형

데이터를 정리하고 변형하면 더 쉽게 다른 데이터와 결합할 수 있거나 다른 사용자가 이해하기 쉽게 만들 수 있습니다.

흐름 작성

흐름에 포함하려는 데이터에 연결한 후 흐름에 새 단계를 추가하여 데이터 정리 및 변형을 시작합니다. 단계를 마우스오버하고 더하기 아이콘이 나타나면 해당 아이콘을 클릭하여 옵션을 표시합니다.

다음과 같은 옵션을 사용하여 흐름을 작성합니다.

  • 분기 추가: 흐름을 서로 다른 분기로 분할합니다.

  • 단계 추가 또는 단계 삽입: 새 흐름에 단계를 추가하거나 기존 흐름에 단계를 삽입하여 정리 작업을 수행합니다.

  • 집계 추가: 집계하거나 그룹화하려는 데이터가 포함된 단계를 선택합니다.

  • 피벗 추가: 피벗하려는 데이터가 포함된 단계를 선택합니다.

  • 조인 추가: 데이터를 조인하려는 단계를 선택합니다. Tableau Prep Builder 버전 2019.1.3 이상에서 관계 데이터가 있는 테이블이 포함된 데이터베이스에 연결하는 경우 흐름 패널의 메뉴에서 조인을 만들 수도 있습니다. 이 방법을 사용하여 테이블을 조인하는 방법에 대한 자세한 내용은 입력 단계에서 데이터 조인을 참조하십시오.

    다른 방법으로, 단계를 끌어 놓아 파일을 조인할 수 있습니다. 다음 예제에서는 Orders_Central 입력 단계를 끌어와 조인 위에 놓습니다.

    조인 만들기에 대한 자세한 내용은 데이터 조인 또는 통합(Union)을 참조하십시오.

  • Union 추가: 데이터를 Union으로 통합하려는 단계를 선택합니다. 다른 방법으로, 단계를 끌어 놓아 파일을 유니온할 수 있습니다. Union 만들기에 대한 자세한 내용은 데이터 조인 또는 통합(Union)을 참조하십시오.

  • 출력 추가: 출력을 추출 파일(.tde 또는 .hyper) 또는 .csv 파일로 저장하거나 출력을 서버에 데이터 원본으로 게시하려면 이 옵션을 선택합니다.

색 구성표 변경

Tableau Prep Builder는 기본적으로 흐름의 각 단계에 색상을 지정합니다. 이 색 구성표는 흐름 전체에 적용되므로 정리 단계를 적용할 때 흐름 전체에서 데이터를 추적할 수 있으며, 데이터를 조인하거나, 유니온하거나, 집계할 때 작업의 영향을 받는 파일을 파악할 수 있으므로 작업이 쉬워집니다.

단계에 대해 다른 색 구성표를 선택하려면 다음 작업을 수행합니다.

  1. 하나 이상의 단계를 선택합니다.

  2. 선택한 단계를 마우스 오른쪽 단추로 클릭하고 단계 색상 편집을 선택합니다.

  3. 색상표에서 색상을 클릭하여 적용합니다.

단계 색상을 기본 색상으로 재설정하려면 다음 작업 중 하나를 수행합니다.

  • 상단 메뉴에서 실행 취소를 클릭합니다.

  • Cntrl+Z 또는 Command-Shift-Z(Mac)을 누릅니다.

  • 변경한 단계를 선택하고, 선택한 단계를 마우스 오른쪽 단추로 클릭한 다음 단계 색상 편집을 선택합니다. 그런 다음 색상표 하단에서 단계 색상 재설정을 선택합니다.

설명 추가

흐름을 작성하고 다양한 정리 작업을 수행할 때 나중에 흐름을 보거나 처리하는 사용자가 단계를 보다 쉽게 이해할 수 있도록 설명을 추가할 수 있습니다.

흐름 패널에서 직접 흐름의 개별 단계에 설명을 추가할 수 있습니다. 설명의 최대 길이는 200자입니다.

설명을 추가하면 단계 아래에 메시지 아이콘이 추가됩니다. 이 아이콘을 클릭하여 흐름 패널에서 설명 텍스트를 표시하거나 숨길 수 있습니다.

단계에 설명을 추가하려면 다음을 수행합니다.

  1. 흐름 패널에서 단계를 선택합니다.

  2. 다음 작업 중 하나를 수행합니다.

    • 단계를 마우스 오른쪽 단추로 클릭하고 메뉴에서 설명 추가를 선택합니다.

    • 단계의 이름 필드를 두 번 클릭한 다음 설명 추가를 클릭합니다.

  3. 텍스트 상자에 설명을 입력합니다.

  4. 텍스트 상자 바깥쪽을 클릭하거나 Enter 키를 눌러 변경 내용을 적용합니다. 기본적으로 설명은 단계 아래에 표시됩니다. 설명을 숨기려면 메시지 아이콘을 클릭합니다.

  5. 설명을 편집하거나 삭제하려면 단계나 설명을 마우스 오른쪽 단추로 클릭하고 메뉴에서 설명 편집 또는 설명 삭제를 선택합니다.

흐름 레이아웃 재구성(버전 2019.2.2 이상)

흐름을 작성할 때 Tableau Prep Builder는 기본 레이아웃을 사용하여 단계와 분기를 추가합니다. 각 흐름은 왼쪽에서 오른쪽으로 데이터를 처리하며, 입력 단계는 캔버스의 맨 왼쪽에서 시작하고 출력 단계는 캔버스의 오른쪽에서 끝납니다. 그러나 크고 복잡한 흐름을 작성하게 되면 금방 흐름을 따라갈 수 없게 됩니다.

흐름의 레이아웃을 정리하려면 단계를 선택하고 이동하여 흐름 레이아웃을 이해하기 쉬운 형태로 구성할 수 있습니다. 예를 들어, 교차하는 흐름선을 수정하거나, 흐름 단계를 이동하여 불필요한 공백을 정리하거나, 명확한 이벤트 순서를 나타내도록 흐름 단계를 재배치할 수 있습니다.

예를 들어, 다음 흐름은 혼란스럽고 따라 이동하기가 어렵습니다.

이 흐름을 정리하려면 단계를 선택하고 위, 아래, 왼쪽 또는 오른쪽으로 끌어 캔버스의 새 위치에 놓을 수 있습니다. 흐름 단계는 왼쪽에서 오른쪽으로의 프로세스 흐름을 방해하는 위치로 이동할 수 없습니다. 예를 들어, 조인 단계 앞에 배치된 유니온 단계를 같은 흐름에서 조인 단계 뒤에 있는 위치로 끌어 놓을 수 없습니다.

흐름 단계를 허용되는 위치로 끌어 놓으면 주황색 상자가 표시됩니다. 허용되지 않는 위치이면 주황색 상자가 표시되지 않으며 단계를 끌어 놓으려고 하면 원래 위치로 돌아갑니다.

"단계 흐름 재구성" 작업 직접 보기

다음 예제에서는 끌어 놓기를 사용하여 흐름을 재배치하는 방법을 보여 줍니다.

흐름에서 단계를 이동하려면:

  1. 흐름 패널에서 이동하려는 단계를 선택합니다. 특정 단계를 클릭하거나, 끌기로 여러 단계를 선택하거나, Ctrl 키 또는 Cmd 키(MacOS)를 누른 채로 클릭하여 인접하지 않은 단계를 선택할 수 있습니다.

  2. 단계를 끌어 새 위치에 놓습니다.

    참고: 이동하여 재배치한 위치가 마음에 들지 않으면 상단 메뉴에서 실행 취소를 클릭하여 되돌릴 수 있습니다. 그러나 단계를 이동하는 과정에서 정리 작업을 수행한 경우 해당 작업도 실행 취소될 수 있습니다. 실행 취소 옵션은 수행한 순서대로 작업을 되돌립니다.

흐름에서 단계 제거

흐름의 어느 지점에서나 단계나 단계 사이의 흐름선을 제거할 수 있습니다.

  • 단계 또는 흐름선을 제거하려면 제거하려는 단계 또는 흐름선을 선택하고 요소를 마우스 오른쪽 단추로 클릭한 다음 제거를 선택합니다.

  • 여러 단계 또는 흐름선을 제거하려면 다음 중 하나를 수행합니다.

    • 마우스를 끌어 전체 흐름 부분을 선택합니다. 그런 다음 선택된 단계 중 하나를 마우스 오른쪽 단추로 클릭하고 제거를 선택합니다.

    • Ctrl+A 또는 Cmd+A(MacOS)를 눌러 흐름의 모든 요소를 선택하거나 Ctrl+클릭 또는 Cmd+클릭(MacOS)하여 특정 요소를 선택한 다음 Delete 키를 누릅니다.

데이터 피벗

스프레드시트 또는 크로스탭 형식의 데이터를 Tableau에서 분석하기 어려운 경우가 있습니다. Tableau는 기본적으로 데이터를 "가로 방향"이 아니라 "세로 방향"으로 표시합니다. 즉, Tableau가 데이터를 적절하게 평가할 수 있도록 데이터를 열 방향에서 행 방향으로 피벗해야 할 경우가 많습니다.

그러나 데이터 테이블이 길고 좁고 너무 정규화되어 있어 적절한 분석을 수행하기가 어려운 시나리오가 있을 수 있습니다. 예를 들어 영업 부서에서 2개 열의 광고 비용을 추적합니다. 하나는 라디오, TV인쇄 행이 포함된 광고라는 이름의 열이고, 다른 하나는 총 지출에 대한 열입니다. 이 유형의 시나리오에서 이 데이터를 개별 측정값으로 분석하려면 행 데이터를 열로 피벗해야 합니다.

그러나 더 큰 데이터 집합이나 시간대별로 자주 변경되는 데이터를 피벗하려는 경우에는 와일드카드 패턴 일치를 사용하여 패턴과 일치하는 필드를 검색하고 자동으로 데이터를 피벗할 수 있습니다.

데이터를 피벗할 때는 다음 옵션 중 하나를 사용합니다.

  • 열에서 행으로 피벗

  • 와일드카드 검색을 사용하여 패턴 일치에 따라 필드를 즉시 피벗(Tableau Prep Builder 버전 2019.1.1 이상)

  • 행에서 열로 피벗(Tableau Prep Builder 버전 2019.1.1 이상)

필드를 어떻게 피벗하든 관계없이 결과에서 직접 상호 작용하고 원하는 추가 정리 작업을 수행하여 원하는 방식으로 표시되는 데이터를 얻을 수 있습니다. Tableau Prep Builder의 지능적인 기본 명명 기능을 사용하여 피벗된 필드 및 값의 이름을 자동으로 바꿀 수 있습니다.

참고: 여러 필드 그룹에서 열을 행으로 피벗하는 기능은 Tableau Prep Builder 2018.1.1에서 지원되지 않습니다. Tableau Prep Builder 버전 2018.1.1에서 여러 필드 그룹에 대해 피벗된 열을 포함하는 피벗을 편집하면 오류나 예기치 않은 결과가 발생할 수 있습니다.

열에서 행으로 피벗:

넓은 데이터를 긴 데이터로 전환하려면 이 피벗 옵션을 사용합니다. 열을 하나 이상의 필드 그룹의 행으로 피벗합니다. 작업하려는 필드를 선택하고 데이터를 열에서 행으로 피벗하면 됩니다.

  1. 데이터 원본에 연결합니다.

  2. 피벗하려는 테이블을 흐름 패널에 끌어 놓습니다.

  3. 더하기 아이콘을 클릭하고 상황에 맞는 메뉴에서 피벗 추가를 선택합니다.

  4. (선택 사항) 필드 패널의 검색 필드에 값을 입력하여 피벗할 필드에 대한 필드 목록을 검색합니다.

  5. (선택 사항) 피벗된 필드 및 값의 이름을 자동으로 바꾸기 확인란을 선택하여 Tableau Prep이 데이터의 공통 값을 사용하여 새 피벗된 필드의 이름을 바꾸도록 설정합니다. 공통 값을 찾을 수 없는 경우 기본 이름이 사용됩니다.
  6. 왼쪽 패널에서 하나 이상의 필드를 선택하고 피벗된 필드 패널의 Pivot1 Values(피벗1 값) 열에 끌어 놓습니다.

  7. (선택 사항) 피벗된 필드 패널에서 더하기 아이콘을 클릭하여 피벗할 더 많은 열을 추가한 다음 이전 단계를 반복하여 피벗할 더 많은 필드를 선택합니다. 결과는 피벗 결과 패널과 데이터 그리드 모두에서 즉시 나타납니다.

    참고: 5단계에서 선택한 것과 동일한 수의 필드를 선택해야 합니다. 예를 들어 처음에 피벗할 필드 3개를 선택했다면 피벗할 각 후속 열에는 3개의 필드가 포함되어야 합니다.

  8. 기본 명명 옵션을 사용하도록 설정하지 않았거나 Tableau Prep에서 자동으로 이름을 검색할 수 없는 경우 필드명을 편집합니다. 또한, 이 패널에서 데이터를 잘 나타내도록 원래 필드명을 편집할 수 있습니다.

  9. (선택 사항) 변경 사항을 추적할 수 있도록 새 피벗 단계의 이름을 바꿉니다. 예를 들어 "Pivot months(월 피벗)"로 바꿉니다.

  10. 데이터가 변경될 때 피벗 데이터를 새로 고치려면 흐름을 실행합니다. 피벗에 추가해야 하는 새 필드가 데이터 원본에 추가되는 경우 새 필드를 수동으로 피벗에 추가합니다.

: 여러 필드에 대한 피벗

이 예제에서는 제약업체의 월 및 연도별 매출, 세금 및 총계가 나와 있는 스프레드시트를 보여 줍니다.

데이터를 피벗함으로써 각 월 및 연도에 대한 행과 매출, 세금 및 총계에 대한 개별 열을 만들어 Tableau가 분석을 위해 이 데이터를 보다 쉽게 해석하게 만들 수 있습니다.

"여러 필드에 대한 피벗" 동작을 직접 보십시오.

와일드카드 검색을 사용하여 피벗

Tableau Prep Builder 버전 2019.1.1 이상에서 대용량 데이터 집합으로 작업하거나 데이터가 시간대별로 자주 변경되는 경우 열을 행으로 피벗할 때 와일드카드 검색을 사용하면 와일드카드 패턴 일치에 따라 데이터를 즉시 피벗할 수 있습니다. 패턴과 일치하는 새로운 필드가 추가되거나 제거되는 경우 흐름을 실행하면 Tableau Prep Builder가 스키마 변경 내용을 검색하고 자동으로 피벗 결과를 업데이트합니다.

  1. 데이터 원본에 연결합니다.

  2. 피벗하려는 테이블을 흐름 패널에 끌어 놓습니다.

  3. 더하기 아이콘을 클릭하고 상황에 맞는 메뉴에서 피벗 추가를 선택합니다.

  4. 피벗된 필드 패널에서 Click here to create wildcard pivot(여기를 클릭하여 와일드카드 피벗 만들기) 링크를 클릭합니다.

  5. 검색하려는 값 또는 부분 값을 입력합니다. 예를 들어 Sales_를 입력하면 레이블이 sales_2017, sales_2018sales_2019인 필드가 일치됩니다.

    검색하는 필드 값에 별표가 포함되지 않는 한 패턴 일치에 별표를 사용하지 마십시오. 대신 검색 옵션 단추를 클릭하여 값 일치에 사용할 방법을 선택합니다. 그런 다음 Enter 키를 눌러 검색을 적용하고 일치하는 값을 피벗합니다.

  6. (선택 사항) 피벗된 필드 패널에서 더하기 아이콘을 클릭하여 피벗할 더 많은 열을 추가한 다음 이전 단계를 반복하여 피벗할 더 많은 필드를 선택합니다.

  7. 기본 명명 옵션을 사용하도록 설정하지 않았거나 Tableau Prep Builder에서 자동으로 이름을 검색할 수 없는 경우 필드명을 편집합니다.

  8. 데이터가 변경될 때 피벗 데이터를 새로 고치려면 흐름을 실행합니다. 데이터 원본에 추가된 새 필드 중 와일드카드 패턴과 일치하는 필드는 자동으로 검색되고 피벗에 추가됩니다.

  9. 결과가 예상과 다른 경우 다음 옵션 중 하나를 사용합니다.

    • 검색 필드에 다른 값 패턴을 입력하고 Enter 키를 누릅니다. 피벗이 자동으로 새로 고쳐지고 새 결과가 표시됩니다.

    • 피벗된 필드 패널의 Pivot1 Values(피벗1 값) 열로 추가 필드를 수동으로 끌어옵니다. 또한 수동으로 추가한 필드를 제거하려면 Pivot1 Values(피벗1 값) 열의 필드를 필드 패널로 끌어 놓으면 됩니다.

      참고: 와일드카드 검색 결과에서 추가된 필드는 Pivot1 Values(피벗1 값) 열에서 끌어오는 방법으로 제거할 수 없습니다. 대신 좀 더 구체적인 패턴을 사용하여 일치하는 검색 결과를 찾으십시오.

행에서 열로 피벗

Tableau Prep Builder 버전 2019.1.1에서는 행에서 열로 피벗할 수 있습니다. 데이터가 너무 정규화되어 있고 새 열을 만들어 긴 데이터를 넓은 데이터로 전환해야 하는 경우 이 옵션을 사용합니다.

예를 들어 월별 광고 비용의 모든 광고 유형이 1개 열에 포함되는 경우 데이터를 행에서 열로 피벗하면 각 광고 유형에 대한 개별 열이 만들어지므로 데이터를 분석하기가 더 쉬워집니다.

피벗할 필드 1개를 선택할 수 있습니다. 그런 다음 해당 필드의 필드 값을 사용하여 새 열을 만듭니다. 새 열을 채울 때 사용할 필드를 선택합니다. 이러한 필드 값은 집계되며 적용할 집계 유형을 선택할 수 있습니다.

집계가 적용되므로 열을 다시 행으로 피벗하는 경우 이 피벗 작업을 되돌릴 수 없습니다. 행을 열 피벗 유형으로 되돌리려면 작업을 실행 취소해야 합니다. 상단 메뉴에서 실행 취소 단추를 클릭하거나 피벗된 필드 패널에서 필드를 제거하거나 피벗 단계를 삭제합니다.

  1. 데이터 원본에 연결합니다.

  2. 피벗하려는 테이블을 흐름 패널에 끌어 놓습니다.

  3. 더하기 아이콘을 클릭하고 상황에 맞는 메뉴에서 피벗 추가를 선택합니다.

  4. 피벗된 필드 패널의 드롭다운 목록에서 행에서 열로를 선택합니다.

  5. (선택 사항) 필드 패널의 검색 필드에 값을 입력하여 피벗할 필드에 대한 필드 목록을 검색합니다.
  6. 왼쪽 패널에서 필드를 선택하고 피벗된 필드 패널의 Field that will pivot rows to columns(행에서 열로 피벗할 필드) 섹션으로 끌어옵니다.

    참고: 피벗할 필드에 날짜 또는 날짜/시간 데이터 유형이 있는 경우 이 데이터 유형을 문자열로 변경한 후 피벗해야 합니다.

    이 필드의 값은 새 열을 만들고 명명할 때 사용됩니다. 열 이름은 나중에 피벗 결과 패널에서 변경할 수 있습니다.

  7. 왼쪽 패널에서 필드를 선택하고 피벗된 필드 패널의 Field to aggregate for new columns(새 열에 대해 집계할 필드) 섹션으로 끌어옵니다. 이 필드의 값은 이전 단계에서 만든 새 열을 채울 때 사용됩니다.

    필드에는 기본 집계 유형이 할당됩니다. 집계 유형을 클릭하여 변경할 수 있습니다.

  8. 피벗 결과 패널에서 결과를 검토하고 만들어진 새 열에 정리 작업을 적용합니다.

  9. 피벗할 필드의 행 데이터가 변경된 경우 흐름 패널의 피벗 단계에서 마우스 오른쪽 단추를 클릭하거나 Command-클릭(Mac)하고 새로 고침을 선택합니다.

정리 작업 적용

필드의 필터링, 추가, 이름 바꾸기, 분할, 그룹화 또는 제거와 같은 정리 작업을 적용하여 데이터를 정리할 수 있습니다. 이전 릴리스에서 정리 작업은 정리 단계 유형에서만 수행할 수 있었습니다. Tableau Prep Builder 버전 2018.2.1 이상에서는 정리 단계의 데이터 그리드에서도 정리 작업을 수행할 수 있습니다.

Tableau Prep Builder 버전 2018.3.1 이상에서는 흐름에 있는 대부분의 단계 유형에서 정리 작업을 수행할 수 있습니다. 한 가지 예외는 출력 단계입니다.

다음 표에서는 각 단계 유형에서 사용할 수 있는 정리 작업을 보여 줍니다.

  입력 정리 집계 피벗 조인 유니온 출력
필터 X X X X X X  
그룹화 및 바꾸기   X   X X X  
정리   X   X X X  
값 분할   X   X X X  
필드명 바꾸기 X X X X X X  
필드 복제   X   X X X  
필드만 유지 X X X X X X  
계산된 필드 만들기   X   X X X  
필드 제거 X X X X X X  
값 편집   X   X X X  
데이터 유형 변경 X X X X X X  

데이터를 변경하면 흐름 패널에서 해당하는 단계에 주석이 추가되고 작업을 추적할 수 있도록 변경 패널에 항목이 추가됩니다. 입력 단계를 변경하면 주석이 흐름 패널의 단계 왼쪽에 표시되고 필드 목록의 입력 프로필에도 표시됩니다.

변경 내용을 적용하는 순서가 중요합니다. 집계, 피벗, 조인 및 유니온 단계 유형을 변경한 내용은 변경 시점의 필드 위치에 따라 해당 유형의 재구성 작업 전이나 후에 수행됩니다. 변경이 수행되는 위치는 단계의 변경 패널에 표시됩니다.

예를 들어 조인 절에서 필드 값을 변경하는 경우 조인 작업 전에 변경이 수행되어 수정된 결과가 제공됩니다.

다음 표에는 단계에서 필드의 위치에 따라 집계, 피벗, 조인 및 유니온 단계 유형에서 정리 작업이 수행되는 위치가 나와 있습니다.

작업   집계 집계 피벗 피벗 조인 조인 유니온 유니온
  필드 위치: 그룹화된 필드 집계된 필드 피벗에 없음 피벗에서 만들어짐 한 테이블에 포함됨* 두 테이블 모두에 포함됨* 불일치 필드 결합된 필드
필터   집계 전 집계 후 피벗 전 피벗 후 조인 전 조인 후 유니온 전 유니온 후
그룹화 및 바꾸기   해당 없음 해당 없음 피벗 전 피벗 후 조인 전 조인 후 유니온 전 유니온 후
정리   해당 없음 해당 없음 피벗 전 피벗 후 조인 전 조인 후 유니온 전 유니온 후
값 분할   해당 없음 해당 없음 피벗 전 피벗 후 조인 전 조인 후 유니온 전 유니온 후
필드명 바꾸기   집계 전 집계 후 피벗 전 피벗 후 조인 전 조인 후 유니온 전 유니온 후
필드 복제   해당 없음 해당 없음 피벗 전 피벗 후 조인 전 조인 후 유니온 전 유니온 후
필드만 유지   집계 후 집계 후 피벗 전 피벗 후 조인 전 조인 후 유니온 전 유니온 후
필드 제거   집계에서 제거 집계에서 제거 피벗 전 피벗 후 조인 전 조인 후 유니온 전 유니온 후
계산된 필드 만들기   해당 없음 해당 없음 피벗 전 피벗 후 조인 전 조인 후 유니온 전 유니온 후
값 편집   해당 없음 해당 없음 피벗 전 피벗 후 조인 전 조인 후 유니온 전 유니온 후
데이터 유형 변경   집계 전 집계 후 피벗 전 피벗 후 조인 전 조인 전 유니온 전 유니온 후

참고: 조인의 경우 필드가 한 테이블의 필드를 사용하여 만들어진 계산된 필드라면 변경은 조인 전에 적용됩니다. 이러한 필드가 두 테이블 모두에서 필드를 사용하여 만들어진 경우 변경은 조인 후에 적용됩니다.

입력 단계에 정리 작업 적용

입력 단계에서는 정리 작업 중 일부만 사용할 수 있습니다. 입력 필드 목록에서 다음과 같은 변경을 수행할 수 있습니다. 변경 사항은 변경 패널에서 추적되고 흐름 패널의 입력 단계 왼쪽과 입력 필드 목록에 주석이 추가됩니다.

  • 필터: 툴바에서 값 필터링을 클릭하고 계산 에디터에 필터 조건을 입력합니다.

  • 필드명 바꾸기: 필드명 필드에서 필드명을 두 번 클릭(Mac의 경우 Control+클릭)하고 새 필드명을 입력합니다.

  • 데이터 유형 변경: 필드의 데이터 유형을 클릭하고 메뉴에서 새 데이터 유형을 선택합니다.

  • 필드 제거: 흐름에 포함하지 않으려는 필드 옆에 있는 확인란을 선택 취소합니다.

다른 단계에 정리 작업 적용

다른 단계 유형에서는 모든 정리 작업을 사용할 수 있습니다. 필드에 정리 작업을 적용하려면 툴바 옵션을 사용하거나 필드 프로필 카드에서 기타 옵션 을 클릭하여 메뉴를 엽니다. 집계, 피벗, 조인 및 유니온 단계 유형에서 기타 옵션 메뉴는 결과 패널의 프로필 카드에서 사용할 수 있습니다.

프로필 패널 툴바 드롭다운 메뉴

정리 단계에서 데이터 그리드에 정리 작업을 적용할 수도 있습니다. 프로필 패널 숨기기 단추를 클릭하여 프로필 패널을 축소한 다음 필드에서 기타 옵션 을 클릭하여 메뉴를 엽니다.

참고: 모든 정리 작업을 데이터 그리드에서 사용할 수 있는 것은 아닙니다. 예를 들어, 값을 인라인으로 편집하려면 프로필 패널에서 값을 편집해야 합니다.

필드에 정리 작업을 적용하려면

  1. 프로필 패널, 데이터 그리드 또는 결과 패널에서 변경하려는 필드를 선택합니다.

  2. 툴바 또는 필드의 기타 옵션 에서 다음 옵션을 선택합니다.

    • 필터 또는 값 필터링: 필터 옵션 중 하나를 선택하고 필드 값을 마우스 오른쪽 단추로 클릭(Mac의 경우 CTRL+클릭)하여 값을 유지 또는 제외하거나 선택된 값 필터를 사용하여 흐름 샘플에 없는 포함된 값을 필터링할 값을 취사 선택합니다.

    • 그룹화 및 바꾸기: 수동으로 값을 선택하거나 자동 그룹화를 사용합니다. 프로필 카드에서 값을 여러 개 선택하고 마우스 오른쪽 단추를 클릭(Mac의 경우 Control+클릭)하여 값을 그룹화 또는 그룹 해제하거나 그룹 값을 편집할 수 있습니다.

    • 정리: 빠른 정리 작업 목록에서 선택하여 필드의 모든 값에 적용합니다.

    • 값 분할: 자동 또는 사용자 지정 분할을 선택합니다.

      참고: 자동 분할 및 사용자 지정 분할은 Tableau Desktop과 동일한 방식으로 작동합니다. 자세한 내용은 Tableau Desktop 및 웹 작성 도움말에서 필드를 여러 필드로 분할을 참조하십시오.

    • 필드명 바꾸기

    • 필드 복제(버전 2019.2.3 이상) 필드 및 값의 복사본을 만듭니다.

    • 필드만 유지(버전 2019.2.2 이상)

    • 계산된 필드 만들기

    • 필드 제거

  3. 값을 편집하려면 하나 이상의 값을 마우스 오른쪽 단추로 클릭 또는 Ctrl+클릭(MacOS)하고 값 편집을 선택한 다음 새 값을 입력합니다. Null로 바꾸기를 선택하여 값을 Null 값으로 바꾸거나 단일 필드를 두 번 클릭하여 직접 편집할 수도 있습니다. 필드 값 편집에 대한 자세한 내용은 동일한 값의 변형 정리(수정)를 참조하십시오.

  4. 프로필 패널, 요약 패널 또는 데이터 그리드에서 이러한 작업의 결과를 검토합니다.

변경 내용 보기

정리 작업의 여러 유형은 흐름에서 단계 위에 있는 아이콘으로 표시됩니다. 한 단계에 4개가 넘는 작업 유형이 적용된 경우 단계 위에 줄임표가 표시됩니다. 이러한 아이콘을 마우스오버하면 적용된 작업과 작업이 수행되는 순서를 보여 주는 주석이 표시됩니다.

Tableau Prep Builder 버전 2019.1.3 이상부터는 흐름 패널의 단계에서 변경 아이콘의 주석을 클릭하거나 프로필 또는 결과 창의 프로필 카드에서 주석을 클릭하면 영향을 받는 변경 사항 및 필드가 변경사항 패널 및 프로필 또는 결과 패널에서 하이라이트됩니다.

단계를 선택한 다음 변경사항 패널을 확장하여 각 변경 사항의 세부 정보를 보거나, 변경 사항을 편집 또는 제거하거나, 변경 사항을 위나 아래로 끌어 놓아 변경 사항이 적용되는 순서를 변경할 수 있습니다. 또한 Tableau Prep Builder 버전 2019.1.1에서는 설명을 추가하여 다른 사용자에게 컨텍스트를 제공할 수 있습니다.

정리 주석 변경사항 패널

집계, 피벗, 조인 또는 유니온 단계의 변경 내용을 볼 때 변경이 적용된 순서는 재구성 작업 전이나 후에 표시됩니다. 이러한 변경의 순서는 시스템에 의해 적용되며 바꿀 수 없습니다. 변경 자체는 편집하고 제거할 수 있습니다.

변경 항목에 설명 추가(버전 2019.1.1 이상)

변경사항 패널의 모든 변경 항목에 최대 200자의 설명을 추가하여 변경 항목에 대한 추가적인 컨텍스트를 제공할 수 있습니다.

  1. 흐름 패널에서 단계를 선택합니다.

  2. 변경사항 패널 또는 변경사항 탭을 엽니다.

  3. 변경사항 패널의 항목을 마우스 오른쪽 단추로 클릭하거나 Ctrl-클릭(Mac)하고 설명 추가를 선택합니다.

  4. 단계에 대한 설명을 입력합니다.

    변경 사항에 대해 생성된 텍스트 아래에 설명 아이콘과 함께 설명이 나타납니다.

  5. 설명을 편집하거나 삭제하려면 변경 항목을 마우스 오른쪽 단추로 클릭하거나 Ctrl-클릭(Mac)하고 설명 편집 또는 설명 삭제를 선택합니다.

권장 사항을 사용하여 정리 작업 적용

가끔은 데이터의 문제를 해결할 때 사용해야 하는 정리 작업을 식별하기가 어려울 수 있습니다. Tableau Prep Builder 버전 2018.3.2 이상에는 데이터를 분석한 후 자동으로 적용할 수 있는 정리 작업을 권장하는 기능이 있습니다. 이 기능을 사용하면 신속하게 데이터 필드의 문제를 해결하거나 문제를 식별하여 수정할 수 있습니다.

참고: 이 기능을 사용하지 않으려면 기능을 해제할 수 있습니다. 상단 메뉴에서 도움말 > 설정 및 성능으로 이동합니다. 권장 사항 사용을 클릭하여 설정 옆에 있는 확인 표시를 지웁니다.

이 기능은 입력, 출력 및 조인 단계 유형을 제외한 모든 단계 유형에서 사용할 수 있습니다. 현재 권장 유형은 다음과 같습니다.

  • 데이터 역할

  • 그룹화 및 바꾸기(버전 2019.2.3부터 데이터 역할이 있는 필드에도 적용됨)
  • 필터

  • 값을 Null 값으로 바꾸기

  • 필드 제거

  • 분할(버전 2019.1.1 이상)

    참고: 이 옵션은 고정 너비 유형 텍스트 파일의 데이터에 특히 효과적입니다. 이 파일 유형에 분할 권장 사항을 사용하려면 데이터 원본에 연결한 후 입력 단계의 텍스트 설정 탭에서 데이터에 사용되지 않은 필드 구분 기호 문자를 선택하여 데이터를 단일 필드로 로드합니다.

  • 공백 자르기

권장 사항을 사용하여 데이터를 정리하려면 다음을 수행하십시오.

  1. 다음 작업 중 하나를 수행합니다.

    • 프로필 카드의 오른쪽 위에 있는 전구 아이콘을 클릭합니다.
    • 툴바에서 권장 사항 드롭다운 화살표를 클릭하여 데이터 집합의 모든 권장 사항을 보고 목록에서 권장 사항을 선택합니다.

    이 옵션은 Tableau Prep Builder에서 권장되는 변경 사항이 식별될 때만 나타납니다.

  2. 권장 사항을 적용하려면 권장 사항 카드를 마우스오버하고 적용을 클릭합니다.

    변경이 자동으로 적용되고 변경 패널에 항목이 추가됩니다. 변경을 제거하려면 상단 메뉴에서 실행 취소를 클릭하거나 변경 패널에서 변경을 마우스오버하고 X를 클릭하여 제거합니다.

  3. Tableau Prep Builder이 변경 후에 추가 권장 사항을 식별하는 경우 추가 권장 사항이 발견되지 않을 때까지 전구 아이콘이 프로필 카드에 유지됩니다.

    위의 단계를 반복하여 추가 변경을 적용하거나 제안되는 변경을 무시하고 Tableau Prep Builder의 다른 정리 도구를 사용하여 데이터 문제를 해결합니다.

필드 병합

동일한 값을 포함하지만 이름이 다른 필드가 있는 경우 한 필드를 다른 필드 위로 끌어 놓는 방법으로 두 필드를 결합하여 단일 필드로 쉽게 병합할 수 있습니다. 필드를 병합하면 대상 필드가 주 필드가 되고 대상 필드의 필드명이 지속됩니다. 대상 필드에 병합하는 필드는 제거됩니다.

예:

와일드카드 Union을 사용하여 동일한 값을 갖는 3개의 필드 생성 3개 필드를 1개로 병합

Tableau Prep Builder에서 필드를 병합하면 대상 필드의 모든 필드가 유지되고 해당 필드의 모든 null 값이 대상 필드와 병합하는 원본 필드의 값으로 바뀝니다. 원본 필드는 제거됩니다.

Name Contact_Phone Business_Phone Cell_Phone Home_Phone
Bob 123-4567 123-4567 null null
Sally null null 456-7890 789-0123
Fred null null null 567-8901
Emma null 234-5678 345-6789 null

Business _Phone, Cell_PhoneHome_Phone 필드를 Contact_phone 필드와 병합하면 다른 필드가 제거되고 다음과 같은 결과가 생성됩니다.

Name Contact_Phone
Bob 123-4567
Sally 456-7890
Fred 567-8901
Emma 234-5678

필드를 병합하려면 다음 작업 중 하나를 수행합니다.

  • 한 필드를 다른 필드 위로 끌어 놓습니다. 병합할 필드 놓기 표시기가 나타납니다.

  • 여러 필드를 선택하고 선택된 항목 중 하나를 마우스 오른쪽 단추로 클릭하여 상황에 맞는 메뉴를 연 다음 필드 병합을 클릭합니다.

  • 여러 필드를 선택한 다음 툴바에서 필드 병합을 클릭합니다.

유니온의 결과로 일치하지 않는 필드를 수정하는 방법에 대한 자세한 내용은 일치하지 않는 필드 수정을 참조하십시오.

동일한 값의 변형 정리(수정)

동일한 값의 여러 변형이 있으면 데이터를 정확하게 요약할 수 없게 됩니다. Tableau Prep Builder에서 다음과 같은 옵션을 사용하면 이러한 변형을 쉽고 빠르게 수정할 수 있습니다.

참고: 값에 대한 모든 편집은 필드 데이터 유형과 호환되어야 합니다.

단일 값 편집

  1. 프로필 카드에서 편집하려는 값을 클릭하고 새 값을 입력합니다. 값 옆에 그룹 아이콘 이 표시됩니다.

    또는 값을 마우스 오른쪽 단추로 클릭하고 값 편집을 클릭합니다. 변경 사항이 화면 왼쪽에 있는 변경사항 패널에 기록됩니다.

  2. 프로필 패널 및 데이터 그리드에서 결과를 확인합니다.

다중 값 편집

한 번에 다중 값을 편집할 수 있는 몇 가지 옵션이 있습니다. 예를 들어 빠른 정리 작업을 사용하여 한 필드의 모든 값에서 문장 부호를 제거하거나, 다중 선택을 사용하여 값을 수동으로 그룹화하거나, 유사한 값을 찾는 유사 항목 일치 알고리즘을 사용하여 자동으로 값을 그룹화하거나, 여러 값을 선택하고 Null 값으로 바꿀 수 있습니다.

참고: 다중 값을 단일 값으로 매핑하면 원래 필드의 값 옆에 그룹 아이콘 이 표시되어 함께 그룹화된 값을 보여 줍니다.

빠른 정리 작업을 사용하여 다중 값 편집

이 옵션은 텍스트 필드에만 적용됩니다.

  1. 프로필 패널, 결과 패널 또는 데이터 그리드에서 편집하려는 필드를 선택합니다.

  2. 기타 옵션 을 클릭하고 정리를 선택한 후 다음 옵션 중 하나를 선택합니다.

    • 대문자 만들기: 모든 값을 대문자 텍스트로 변경합니다.

    • 소문자 만들기: 모든 값을 소문자 텍스트로 변경합니다.

    • 문자 제거: 모든 알파벳 문자를 제거하고 기타 문자만 남깁니다.

    • 숫자 제거: 모든 숫자를 제거하고 알파벳 문자와 기타 문자만 남깁니다.

    • 문장 부호 제거: 모든 문장 부호를 제거합니다.

    • 공백 잘라내기: 선행 및 후행 공백을 제거합니다.

    작업을 중첩시켜 여러 정리 작업을 필드에 적용할 수 있습니다. 예를 들어 먼저 정리 > 숫자 제거를 선택한 다음 정리 > 문장 부호 제거를 선택하여 필드 값에서 모든 숫자와 문장 부호를 제거할 수 있습니다.

  3. 변경을 실행 취소하려면 흐름 패널 상단에 있는 실행 취소 화살표를 클릭하거나 변경 목록에서 변경 사항을 제거하십시오.

다중 값 인라인 그룹화 및 편집

  1. 프로필 카드에서 편집하려는 필드를 선택합니다.

  2. Ctrl 또는 Shift 키를 누른 채로 클릭하거나 Command 또는 Shift 키를 누른 채로 클릭(MacOS)하고 그룹화하려는 값을 선택합니다.

  3. 마우스 오른쪽 단추를 클릭하고 상황에 맞는 메뉴에서 그룹을 선택합니다. 마우스 오른쪽 단추로 클릭한 선택 항목의 값이 새 그룹의 기본 이름이 되지만 이 값은 인라인으로 편집할 수 있습니다.

  4. 그룹 이름을 편집하려면 그룹화된 필드를 선택하고 값을 편집하거나, 그룹화된 필드를 마우스 오른쪽 단추로 클릭(Mac의 경우 Control+클릭)하고 상황에 맞는 메뉴에서 값 편집을 선택합니다.

  5. 그룹화된 필드 값을 그룹 해제하려면 그룹화된 필드를 마우스 오른쪽 단추로 클릭하고 상황에 맞는 메뉴에서 그룹 해제를 선택합니다.

하나 이상의 값을 Null로 바꾸기

분석에 포함하려는 데이터 행이 있지만 특정 필드 값을 제외하려는 경우 해당 값을 Null 값으로 변경할 수 있습니다.

  1. 프로필 카드에서 Ctrl 또는 Shift 키를 누른 채로 클릭하거나 Command 또는 Shift 키를 누른 채로 클릭(Mac의 경우)하고 변경하려는 값을 선택합니다.

  2. 마우스 오른쪽 단추를 클릭(Mac의 경우 Control+클릭)하고 메뉴에서 Null로 바꾸기를 선택합니다. 값이 Null로 변경되고 값 옆에 그룹 아이콘 이 표시됩니다.

그룹화 및 바꾸기를 사용하여 다중 값을 수동으로 편집

그룹화 및 바꾸기를 사용하여 필드의 값을 한 값에서 다른 값으로 매핑하거나 수동으로 여러 값을 선택하여 그룹화합니다. 새 값을 추가하여 데이터를 구성하는 매핑 관계를 설정할 수도 있습니다.

예를 들어 한 필드에 My Company, My Company Incorporated 및 My Company Inc.의 세 값이 있다고 가정합니다. 세 값 모두 동일한 회사인 My Company를 나타냅니다. 그룹화 및 바꾸기를 사용하면 My Company Incorporated 및 My Company Inc 값을 My Company로 매핑하여 세 개 값 모두 필드에 My Company로 나타나게 만들 수 있습니다.

다중 값을 선택한 단일 필드로 매핑

  1. 프로필 패널 또는 결과 패널에서 편집하려는 필드를 선택합니다.

  2. 기타 옵션 을 클릭하고 메뉴에서 그룹화 및 바꾸기 > 수동 선택을 선택합니다.

  3. 그룹화 및 바꾸기 에디터의 왼쪽 패널에서 그룹화 값으로 사용하려는 필드 값을 선택합니다. 이제 이 값이 오른쪽 패널 맨 위에 표시됩니다.

  4. 그룹화 및 바꾸기 에디터의 오른쪽 패널 하단에서 그룹에 추가하려는 값을 선택합니다.

    그룹에서 값을 제거하려면 그룹화 및 바꾸기 에디터의 오른쪽 패널 상단에서 값 옆에 있는 확인란을 선택 취소합니다.

다중 값을 선택하여 그룹 만들기

  1. 프로필 패널 또는 결과 패널에서 편집하려는 필드를 선택합니다.

  2. 기타 옵션 을 클릭하고 메뉴에서 그룹화 및 바꾸기 > 수동 선택을 선택합니다.

  3. 그룹화 및 바꾸기 에디터의 왼쪽 패널에서 그룹화하려는 다중 값을 선택합니다.

  4. 그룹화 및 바꾸기 에디터의 오른쪽 패널에서 값 그룹화를 클릭합니다.

    마지막으로 선택한 값을 그룹 이름으로 사용하여 새 그룹이 만들어집니다. 그룹 이름을 편집하려면 그룹화된 필드를 선택하고 값을 편집하거나, 그룹화된 필드를 마우스 오른쪽 단추로 클릭(Mac의 경우 Control+클릭)하고 메뉴에서 값 편집을 선택합니다.

유사 항목 일치와 그룹화 및 바꾸기를 사용하여 다중 값 편집

유사한 값을 검색하고 자동으로 그룹화하려면 유사 항목 일치 알고리즘 중 하나를 사용합니다. 필드 값은 발생 빈도가 가장 높은 값을 기준으로 그룹화됩니다. 그룹화된 값을 검토하여 필요에 따라 그룹의 값을 추가하거나 제거합니다.

다음 옵션 중 하나를 선택하여 값을 그룹화합니다.

  • 발음: 소리가 같은 값을 찾아 그룹화합니다. 이 옵션은 단어를 발음별로 인덱싱하는 Metaphone 3 알고리즘을 사용하며 영어 단어에 가장 적합합니다. 이 유형의 알고리즘은 많은 유명한 맞춤법 검사기에서 사용됩니다. 이 옵션은 데이터 역할에 사용할 수 없습니다.

  • 공통 문자: 공통적인 알파벳 문자 또는 숫자가 있는 값을 찾아 그룹화합니다. 이 옵션에서는 문장 부호, 중복 및 공백 문자를 제거한 후 고유한 문자로 단어를 인덱싱하는 ngram 지문 알고리즘을 사용합니다. 이 알고리즘은 지원되는 모든 언어에서 작동합니다. 이 옵션은 데이터 역할에 사용할 수 없습니다.

    예를 들어 이 알고리즘에서는 "John Smith"와 "Smith, John"으로 표현된 이름이 모두 "hijmnost"를 생성하므로 두 이름이 일치합니다. 이 알고리즘에서는 발음을 고려하지 않으므로 "Tom Jhinois" 값이 동일한 키 "hijmnost"를 갖게 되고 그룹에 포함됩니다.

  • 맞춤법: 철자가 유사한 텍스트 값을 찾아 그룹화합니다. 이 옵션은 레벤시테인(Levenshtein) 거리 알고리즘에 기반하며 고정된 기본 임계값을 사용하여 두 텍스트 값 사이의 편집 거리를 계산합니다. 그런 다음 편집 거리가 임계값보다 작으면 두 텍스트 값을 함께 그룹화합니다. 이 알고리즘은 지원되는 모든 언어에서 작동합니다.

    Tableau Prep Builder 버전 2019.2.3부터 데이터 역할을 적용한 후 이 옵션을 사용할 수 있습니다. 이 경우 잘못된 값을 편집 거리를 사용하여 가장 가까운 올바른 값에 일치시킵니다. 표준 값이 데이터 집합 샘플에 없으면 Tableau Prep Builder에 자동으로 추가되고 값이 원래 데이터 집합에 없는 것으로 표시됩니다.

  • 발음 + 맞춤법: (버전 2019.1.4 이상) 필드에 데이터 역할을 할당하면 해당 데이터 역할을 사용하여 데이터 역할에 정의된 표준 값과 일치하는 값을 지정하고 그룹화할 수 있습니다. 이 옵션은 잘못된 값을 맞춤법 및 발음에 따라 가장 유사한 올바른 값과 일치시킵니다. 표준 값이 데이터 집합 샘플에 없으면 Tableau Prep Builder에 자동으로 추가되고 값이 원래 데이터 집합에 없는 것으로 표시됩니다. 이 옵션은 영어 단어에 가장 적합합니다.

    자세한 내용은 데이터 역할별로 유사한 값 그룹화를 참조하십시오.

    참고: Tableau Prep Builder 버전 2019.1.4 및 2019.2.1에서 이 옵션의 레이블은 데이터 역할 일치입니다.

유사 항목 일치를 사용하여 유사한 값 그룹화
  1. 프로필 패널 또는 결과 패널에서 편집하려는 필드를 선택합니다.

  2. 기타 옵션 을 클릭하고 그룹화 및 바꾸기를 선택한 후 다음 옵션 중 하나를 선택합니다.

    • 발음

    • 공통 문자

    • 맞춤법

    Tableau Prep Builder가 일치하는 값을 찾아 그룹화하고 해당 그룹에서 발생 빈도가 가장 높은 값으로 그룹을 매핑합니다.

  3. 그룹화를 검토하고 필요에 따라 값을 수동으로 추가 또는 제거하거나 편집합니다. 그런 다음 완료를 클릭합니다.

필드 값을 그룹화할 때 결과 조정

유사한 값을 맞춤법 또는 발음으로 그룹화하는 경우 필드의 슬라이더를 사용하여 그룹화 매개 변수의 양을 조정하여 결과를 변경할 수 있습니다.

슬라이더를 설정하는 방법에 따라 그룹에 포함된 값의 수와 만들어진 그룹 수를 제어할 수 있습니다. 기본적으로 Tableau Prep Builder에서는 최적의 그룹화 설정을 검색하고 해당 위치에 슬라이더를 표시합니다.

임계값을 변경하면 Tableau Prep Builder에서 값의 샘플을 분석하여 새 그룹화를 결정합니다. 설정에서 생성된 그룹은 변경사항 패널에 저장되고 기록되지만 임계값 설정은 저장되지 않습니다. 다음번에 그룹화 및 바꾸기 에디터를 열면 기존 변경 내용을 편집하거나 새 변경을 수행할 때 임계값 슬라이더가 기본 위치에 표시되므로 현재 데이터 집합에 따라 조정할 수 있습니다.

  1. 프로필 패널 또는 결과 패널에서 편집하려는 필드를 선택합니다.

  2. 기타 옵션 을 클릭하고 그룹화 및 바꾸기를 선택한 후 다음 옵션 중 하나를 선택합니다.

    • 발음

    • 맞춤법

    Tableau Prep Builder이 일치하는 값을 찾아 그룹화하고 해당 그룹에서 발생 빈도가 가장 높은 값으로 그룹을 매핑합니다.

  3. 그룹화 및 바꾸기 에디터의 왼쪽 패널에서 슬라이더를 5개의 임계값 수준 중 하나로 끌 어 결과를 변경합니다.

    보다 엄격한 임계값을 설정하려면 슬라이더를 왼쪽으로 이동합니다. 그러면 일치하는 항목이 줄어들고 더 적은 그룹이 만들어집니다. 보다 느슨한 임계값을 설정하려면 슬라이더를 오른쪽으로 이동합니다. 그러면 일치하는 항목이 늘고 더 많은 그룹이 만들어집니다.

  4. 완료를 클릭하여 변경 내용을 저장합니다.

데이터 역할별로 유사한 값 그룹화

참고: Tableau Prep Builder 버전 2019.1.4 및 2019.2.1에서 이 옵션의 레이블은 데이터 역할 일치입니다.

필드 값을 표준화하고 유효하지 않은 값을 빠르게 찾을 수 있도록 필드에 데이터 역할을 할당할 수 있습니다. Tableau Prep Builder 버전 2019.1.4 이상에서는 필드에 지리적 데이터 역할을 할당하면 해당 데이터 역할의 값을 사용하여 맞춤법이나 발음을 기반으로 데이터 필드의 값을 그룹화하고 일치시켜 표준화할 수 있습니다. Tableau Prep Builder 버전 2019.2.3에서는 맞춤법 또는 맞춤법 + 발음을 사용하여 잘못된 값을 그룹화하고 올바른 값과 일치시킬 수 있습니다.

이러한 옵션에서는 데이터 역할에 정의된 표준 값을 사용합니다. 표준 값이 데이터 집합 샘플에 없으면 Tableau Prep Builder에 자동으로 추가되고 값이 원래 데이터 집합에 없는 것으로 표시됩니다. 필드에 데이터 역할을 할당하는 방법에 대한 자세한 내용은 데이터에 데이터 역할 할당을 참조하십시오.

데이터 역할을 사용하여 값을 그룹화하려면 다음 단계를 완료하십시오.

  1. 프로필 패널, 결과 패널 또는 데이터 그리드에서 필드의 데이터 유형을 클릭합니다.

  2. 필드에 대해 다음 데이터 역할 중 하나를 선택합니다.

    • 공항
    • 구/군/시
    • 국가/지역
    • 주/시/도

    Tableau Prep Builder는 필드의 데이터 값을 선택한 데이터 역할에 대한 알려진 영역 값과 비교하여 일치하지 않는 모든 값에 빨간색 느낌표 마크를 표시합니다.

  3. 기타 옵션 을 클릭하고 그룹화 및 바꾸기를 선택한 후 다음 옵션 중 하나를 선택합니다.

    • 맞춤법: 잘못된 값을 문자의 추가, 제거 또는 대체를 통해 가장 가까운 올바른 값과 일치시킵니다.
    • 발음 + 맞춤법: 잘못된 값을 맞춤법 및 발음을 기반으로 가장 유사한 올바른 값과 일치시킵니다.

      참고: Tableau Prep Builder 버전 2019.1.4 또는 2019.2.1에서는 이 옵션을 데이터 역할 일치라고 합니다.

    Tableau Prep Builder에서는 맞춤법 또는 맞춤법과 발음을 기준으로 값을 비교한 다음 데이터 역할의 표준화된 값 아래에 유사한 값을 그룹화합니다. 표준화된 값이 데이터 집합에 없으면 값이 추가되고 빨간색 점으로 표시됩니다.

데이터 집합에 없는 값 추가 및 식별

데이터 집합에서 값을 존재하지 않는 새 값에 매핑하려는 경우 그룹화 및 바꾸기를 사용하여 값을 추가할 수 있습니다. 데이터 집합에 존재하지 않는 값을 쉽게 식별할 수 있도록 이러한 값은 그룹화 및 바꾸기 에디터에서 값 이름 옆에 빨간색 점이 표시됩니다.

예를 들어 아래 이미지에서 Wyoming(와이오밍)과 Nevada(네바다)는 데이터 집합에 없습니다.

값이 데이터 집합에 없는 이유 중 몇 가지는 다음과 같습니다.

  • 새 값을 수동으로 추가했습니다.

  • 값이 더 이상 데이터에 없습니다.

  • 값이 데이터에 있지만 샘플링된 데이터 집합에 없습니다.

새 값을 추가하려면

  1. 프로필 패널 또는 결과 패널에서 편집하려는 필드를 선택합니다.

  2. 기타 옵션 을 클릭하고 상황에 맞는 메뉴에서 그룹화 및 바꾸기 > 수동 선택을 선택합니다.

  3. 그룹화 및 바꾸기 에디터의 왼쪽 패널에서 더하기 를 클릭하여 새 값을 추가합니다.

  4. 필드에 새 값을 입력하고 Enter 키를 눌러 추가합니다.

  5. 오른쪽 패널에서 새 값에 매핑하려는 값을 선택합니다.

  6. (선택 사항) 매핑된 값에 다른 새로운 값을 추가하려면 그룹화 및 바꾸기 에디터의 오른쪽 패널에서 더하기 단추를 클릭합니다.

값 집계 및 그룹화

흐름에서 생성되는 데이터의 양을 줄이거나 함께 조인하거나 Union으로 통합하려는 다른 데이터에 맞게 데이터를 정렬하기 위해 일부 데이터의 세부 수준을 조정해야 할 경우도 있습니다. 예를 들어 판매 테이블을 고객 테이블과 조인하기 전에 고객별로 판매 데이터를 집계할 수 있습니다.

데이터의 세부 수준을 조정해야 한다면 집계 추가 옵션을 사용하여 데이터를 집계하거나 그룹화하는 단계를 만듭니다. 데이터가 집계되는지, 아니면 그룹화되는지는 데이터 유형(문자열, 숫자 또는 날짜)에 따라 다릅니다.

  1. 흐름 패널에서 더하기 아이콘을 클릭하고 집계 추가를 선택합니다. 흐름 패널에 새 집계 단계가 표시되고 프로필 패널이 집계 및 그룹 프로필을 표시하도록 업데이트됩니다.

  2. 필드를 그룹화하거나 집계하려면 왼쪽 패널에서 필드를 끌어 오른쪽 패널의 열 중 하나에 놓습니다.

    또한 다음 작업을 수행할 수도 있습니다.

    • 두 패널 간에서 필드를 끌어 놓습니다.

    • 목록에서 필드를 검색하고 집계에 포함하려는 필드만 선택합니다.

    • 필드를 두 번 클릭하여 왼쪽 또는 오른쪽 패널에 필드를 추가합니다.

    • 필드의 함수를 변경하여 적절한 패널에 필드를 자동으로 추가합니다.

    • 모두 추가 또는 모두 제거를 클릭하여 대량으로 필드를 적용하거나 제거합니다.

    • 필드에 특정 정리 작업을 적용합니다. 사용할 수 있는 정리 옵션에 대한 자세한 내용은 정리 작업 적용을 참조하십시오.

    필드는 데이터 유형에 따라 그룹화된 필드집계된 필드 열에 분산됩니다. 그룹 또는 집계 유형(예: AVG 또는 SUM) 머리글을 클릭하여 그룹 또는 집계 유형을 변경합니다.

    집계 및 그룹 프로필 아래에 있는 데이터 그리드에서 그룹 또는 집계의 멤버 샘플을 확인할 수 있습니다.

    필드에 적용된 모든 정리 작업은 변경 패널에서 추적됩니다.

의견을 주셔서 감사합니다! 피드백을 제출하는 동안 오류가 발생했습니다. 다시 시도하거나 메시지를 보내주십시오.