데이터 정리 및 변형

Tableau Prep Builder에서는 데이터를 정리하고 변형하는 데 바로 사용할 수 있는 다양한 정리 작업을 제공합니다. 불필요한 데이터를 정리하면 데이터를 쉽게 결합하고 분석하거나 데이터 집합을 공유할 때 다른 사람들이 데이터를 쉽게 이해할 수 있습니다.

피벗 단계 또는 스크립트 단계를 사용하여 R 또는 Python 스크립트를 흐름에 적용하여 데이터를 정리할 수도 있습니다. 자세한 내용은 데이터 피벗 또는 R 및 Python 스크립트를 흐름에 사용을 참조하십시오.

정리 작업 정보

필드의 필터링, 추가, 이름 바꾸기, 분할, 그룹화 또는 제거와 같은 정리 작업을 적용하여 데이터를 정리할 수 있습니다. 이전 릴리스에서 정리 작업은 정리 단계 유형에서만 수행할 수 있었습니다. Tableau Prep Builder 버전 2018.2.1 이상에서는 정리 단계의 데이터 그리드에서도 정리 작업을 수행할 수 있습니다.

Tableau Prep Builder 버전 2018.3.1 이상에서는 흐름에 있는 대부분의 단계 유형에서 정리 작업을 수행할 수 있습니다. 입력 단계에서 제한된 정리 작업을 적용할 수 있지만 출력 단계에서 정리 작업을 적용할 수 없습니다. 입력 단계에서 정리 작업을 적용하는 것에 대한 자세한 내용은 입력 단계에 정리 작업 적용을 참조하십시오.

사용 가능한 정리 작업

다음 표에서는 각 단계 유형에서 사용할 수 있는 정리 작업을 보여 줍니다.

  입력 정리 집계 피벗 조인 유니온 출력
필터 X X X X X X  
그룹화 및 바꾸기   X   X   X  
정리   X   X X X  
날짜 변환   X X X X X  
값 분할   X   X X X  
필드명 바꾸기 X X X X X X  
필드 복제   X   X X X  
필드만 유지 X X X X X X  
필드 제거 X X X X X X  
계산된 필드 만들기   X   X X X  
값 편집   X   X X X  
데이터 유형 변경 X X X X X X  

데이터를 변경하면 흐름 패널에서 해당하는 단계에 주석이 추가되고 작업을 추적할 수 있도록 변경 패널에 항목이 추가됩니다. 입력 단계를 변경하면 주석이 흐름 패널의 단계 왼쪽에 표시되고 필드 목록의 입력 프로필에도 표시됩니다.

변경 내용을 적용하는 순서가 중요합니다. 집계, 피벗, 조인 및 유니온 단계 유형을 변경한 내용은 변경 시점의 필드 위치에 따라 해당 유형의 재구성 작업 전이나 후에 수행됩니다. 변경이 수행되는 위치는 단계의 변경 패널에 표시됩니다.

다음 예는 조인 단계에서 단일 테이블의 필드 변경을 보여줍니다. 수정된 결과를 제공하기 위해 조인 작업 전에 변경이 수행됩니다.

작업 순서

다음 표에는 단계에서 필드의 위치에 따라 집계, 피벗, 조인 및 유니온 단계 유형에서 정리 작업이 수행되는 위치가 나와 있습니다.

동작 단계 유형: 집계 집계 피벗 피벗 조인 조인 유니온 유니온
  필드 위치: 그룹화된 필드 집계된 필드 피벗에 없음 피벗에서 만들어짐 한 테이블에 포함됨* 두 테이블 모두에 포함됨* 불일치 필드 결합된 필드
필터   집계 전 집계 후 피벗 전 피벗 후 조인 전 조인 후 유니온 전 유니온 후
그룹화 및 바꾸기   해당 없음 해당 없음 피벗 전 피벗 후 조인 전 조인 후 유니온 전 유니온 후
정리   해당 없음 해당 없음 피벗 전 피벗 후 조인 전 조인 후 유니온 전 유니온 후
날짜 변환   집계 전 집계 후 피벗 전 피벗 후 조인 전 조인 후 유니온 전 유니온 후
값 분할   해당 없음 해당 없음 피벗 전 피벗 후 조인 전 조인 후 유니온 전 유니온 후
필드명 바꾸기   집계 전 집계 후 피벗 전 피벗 후 조인 전 조인 후 유니온 전 유니온 후
필드 복제   해당 없음 해당 없음 피벗 전 피벗 후 조인 전 조인 후 유니온 전 유니온 후
필드만 유지   집계 후 집계 후 피벗 전 피벗 후 조인 전 조인 후 유니온 전 유니온 후
필드 제거   집계에서 제거 집계에서 제거 피벗 전 피벗 후 조인 전 조인 후 유니온 전 유니온 후
계산된 필드 만들기   해당 없음 해당 없음 피벗 전 피벗 후 조인 후 조인 후 유니온 전 유니온 후
값 편집   해당 없음 해당 없음 피벗 전 피벗 후 조인 전 조인 후 유니온 전 유니온 후
데이터 유형 변경   집계 전 집계 후 피벗 전 피벗 후 조인 전 조인 전 유니온 전 유니온 후

참고: 조인의 경우 필드가 한 테이블의 필드를 사용하여 만들어진 계산된 필드라면 변경은 조인 전에 적용됩니다. 이러한 필드가 두 테이블 모두에서 필드를 사용하여 만들어진 경우 변경은 조인 후에 적용됩니다.

정리 작업 적용

필드에 정리 작업을 적용하려면 툴바 옵션을 사용하거나 필드 프로필 카드, 데이터 그리드 또는 결과 패널에서 기타 옵션 을 클릭하여 메뉴를 엽니다.

집계, 피벗, 조인 및 유니온 단계 유형에서 기타 옵션 메뉴는 결과 패널의 프로필 카드와 해당하는 데이터 그리드에서 사용할 수 있습니다. 흐름 전반에 걸쳐 동일한 정리 작업 또는 동작을 반복해서 수행하는 경우 단계, 동작 또는 심지어 필드를 복사하여 붙여 넣을 수 있습니다. 자세한 내용은 단계, 작업 및 필드 복사를 참조하십시오.

프로필 패널 툴바 드롭다운 메뉴

뷰 선택

데이터 그리드 또는 목록 뷰의 프로필 또는 결과 패널 외부에서 정리 작업을 수행할 수 있습니다. 뷰 툴바 (버전 2019.3.2 이상)을 사용하여 뷰를 변경한 다음 필드에서 기타 옵션을 클릭하여 정리 메뉴를 엽니다.

  • 프로필 패널 표시 : 기본 뷰입니다. 프로필 패널 또는 결과 패널 뷰로 돌아가려면 이 단추를 선택합니다.

  • 데이터 그리드 표시 : 프로필 또는 결과 패널을 축소하여 데이터 그리드만 확장하고 표시합니다. 이 뷰는 데이터를 자세히 보여주므로 특정 필드 값을 작업해야 하는 경우 유용할 수 있습니다. 이 옵션을 선택한 후 이 뷰 상태는 흐름의 모든 단계에서 유지되지만 언제든지 변경할 수 있습니다.

    참고: 모든 정리 작업을 데이터 그리드에서 사용할 수 있는 것은 아닙니다. 예를 들어, 값을 인라인으로 편집하려면 프로필 패널에서 값을 편집해야 합니다.

  • 목록 뷰 표시 (버전 2019.3.2 이상): 프로필 패널 또는 결과 패널을 목록으로 변환합니다. 이 옵션을 선택한 후 이 뷰 상태는 흐름의 모든 단계에서 유지되지만 언제든지 변경할 수 있습니다.

    여러 행을 선택하고 X를 클릭하여 제거하거나 기타 옵션 메뉴를 사용하여 선택한 필드에 작업을 적용할 수 있습니다. 필드에 데이터 역할을 할당하거나 필터, 그룹화 및 바꾸기, 정리 또는 값 분할을 선택하는 경우 프로필 또는 결과 뷰로 돌아가서 이러한 작업을 완료하게 됩니다. 다른 모든 옵션은 목록 뷰에서 수행할 수 있습니다.

버전 2019.3.1 이상

뷰 툴바 를 사용하여 프로필 패널을 숨기고 데이터 그리드만 표시합니다. 그럼 다음 데이터 그리드의 필드에 대한 기타 옵션을 클릭하여 정리 메뉴를 엽니다. 이 뷰는 데이터를 자세히 보여주므로 특정 필드 값을 작업해야 하는 경우 유용할 수 있습니다. 이 옵션을 선택한 후 이 뷰 상태는 흐름의 모든 단계에서 유지되지만 언제든지 변경할 수 있습니다.

참고: 모든 정리 작업을 데이터 그리드에서 사용할 수 있는 것은 아닙니다. 예를 들어, 값을 인라인으로 편집하려면 프로필 패널에서 값을 편집해야 합니다.

성능 향상을 위해 데이터 업데이트 일시 중지

데이터 정리 작업을 수행할 때 작업을 진행하면 Tableau Prep Builder에서 즉시 변경 사항을 적용하여 결과를 보여 줍니다. 하지만 무엇을 변경하려는 것인지 정확하게 알고 있어 변경할 때마다 즉각적인 피드백이 필요하지 않은 경우나 성능을 향상시키고 싶은 경우 데이터 업데이트를 일시 중지하여 귀중한 처리 시간을 줄일 수 있습니다. 데이터 업데이트를 일시 중지한 경우 한 번에 모든 변경을 수행한 후 업데이트를 다시 시작하여 결과를 확인할 수 있습니다. 언제라도 데이터 업데이트를 다시 시작하고 모든 사용 가능한 연산을 실행할 수 있습니다.

참고: 데이터 업데이트를 일시 중지한 경우 값을 확인하는 데 필요한 모든 연산이 실행되지 않습니다. 예를 들어 선택한 값에 필터를 적용하려는 경우 제외할 값을 확인해야 합니다.

  1. 상단 메뉴에서 데이터 업데이트 일시 중지를 클릭하여 업데이트를 일시 중지합니다.

  2. Tableau Prep Builder에서 프로필 패널이 목록 뷰로 바뀝니다. 목록 뷰에서 기타 옵션 메뉴를 사용하여 선택한 필드에 연산을 적용합니다. 값을 확인하는 데 연산이 필요한 경우 연산이 실행되지 않습니다. 연산을 실행하려면 데이터 업데이트를 다시 시작해야 합니다.

    목록 뷰 모드 사용에 대한 자세한 내용은 뷰 선택을 참조하십시오.

  3. 변경 사항의 결과를 확인하거나 해제된 기능을 실행하려면 데이터 업데이트를 다시 시작하십시오. 데이터 업데이트 다시 시작 단추를 클릭하고 메뉴 대화 상자나 흐름 패널 상단에 있는 메시지 배너에서 다시 시작을 클릭합니다.

정리 작업 적용

필드에 정리 작업을 적용하려면 다음을 수행하십시오.

참고: 버전 2019.3.2부터는 목록 뷰에서 정리 작업을 수행할 수 있습니다.

  1. 프로필 패널, 데이터 그리드, 결과 패널 또는 목록 뷰에서 변경하려는 필드를 선택합니다.

  2. 툴바 또는 필드의 기타 옵션 메뉴에서 다음 옵션을 선택합니다.

    • 필터 또는 값 필터링: 필터 옵션 중 하나를 선택하고 필드 값을 마우스 오른쪽 단추를 클릭하거나 Ctrl-클릭(MacOS)하여 값을 유지하거나 제외할 수 있습니다. 선택한 값 필터를 사용하여 흐름 샘플에 없는 값을 포함하여 필터링할 값을 선택할 수도 있습니다. 필터 옵션에 대한 자세한 내용은 데이터 필터링을 참조하십시오.

    • 그룹화 및 바꾸기: 수동으로 값을 선택하거나 자동 그룹화를 사용합니다. 프로필 카드에서 값을 여러 개 선택하고 마우스 오른쪽 단추를 클릭하거나 Ctrl-클릭(MacOS)하여 값을 그룹화 또는 그룹 해제하거나 그룹 값을 편집할 수 있습니다. 그룹화 및 바꾸기를 사용하는 것에 대한 자세한 내용은 유사 항목 일치를 사용하여 표준 값에 값 자동 매핑을 참조하십시오.

    • 정리: 빠른 정리 작업 목록에서 선택하여 필드의 모든 값에 적용합니다.

    • 날짜 변환(버전 2020.1.4 이상): 날짜 또는 날짜 및 시간 데이터 유형에 할당된 필드인 경우 DATEPART 빠른 정리 작업 목록에서 선택하여 날짜 필드 값을 연도, 분기, 월, 주, 일 또는 날짜 및 시간 값을 나타내는 정수 값으로 변환할 수 있습니다.
    • 값 분할: 공통 구분 기호를 기준으로 값을 자동으로 분할하거나 사용자 지정 분할을 사용하여 필드 값을 분할할 방법을 지정하십시오.

      자동 분할 및 사용자 지정 분할은 Tableau Desktop과 동일한 방식으로 작동합니다. 자세한 내용은 Tableau Desktop 및 웹 작성 도움말에서 필드를 여러 필드로 분할을 참조하십시오.

    • 필드명 바꾸기: 필드명을 편집합니다.

    • 필드 복제(버전 2019.2.3 이상): 필드 및 값의 복사본을 만듭니다.

    • 필드만 유지(버전 2019.2.2 이상): 단계에서 선택한 필드만 유지하고 다른 모든 필드를 제외합니다.

    • 계산된 필드 만들기: 계산 에디터에서 사용자 지정 계산을 작성하거나 시각적 계산 편집기(버전 2020.1.1 이상)를 사용하여 세부 수준, 순위 또는 행 번호 계산을 만듭니다. 자세한 내용은 세부 수준(LOD) 및 순위 계산 만들기를 참조하십시오.

    • 제거(이전 버전의 필드 제거): 흐름에서 필드를 제거합니다.

      참고: 버전 2019.3.1부터는 데이터 역할로 게시 옵션을 사용하여 사용자 지정 데이터 역할을 만들고 이를 필드에 적용해 데이터를 정리할 때 필드 값을 검증할 수 있습니다. 이 옵션에 대한 자세한 내용은 사용자 지정 데이터 역할 만들기(버전 2019.3.1 이상)을 참조하십시오.

  3. 값을 편집하려면 하나 이상의 값을 마우스 오른쪽 단추로 클릭하거나 Ctrl-클릭(MacOS)하고 값 편집을 선택한 다음 새 값을 입력합니다. Null로 바꾸기를 선택하여 값을 Null 값으로 바꾸거나 단일 필드를 두 번 클릭하여 직접 편집할 수도 있습니다. 필드 값 편집에 대한 자세한 내용은 필드 값 편집을 참조하십시오.

  4. 프로필 패널, 요약 패널 또는 데이터 그리드에서 이러한 작업의 결과를 검토합니다.

변경 내용 보기

정리 작업의 여러 유형은 흐름에서 단계 위에 있는 아이콘으로 표시됩니다. 한 단계에 4개가 넘는 작업 유형이 적용된 경우 단계 위에 줄임표가 표시됩니다. 이러한 아이콘을 마우스오버하면 적용된 작업과 작업이 수행되는 순서를 보여 주는 주석이 표시됩니다.

Tableau Prep Builder 버전 2019.1.3 이상부터는 흐름 패널의 단계에서 변경 아이콘의 주석을 클릭하거나 프로필 또는 결과 창의 프로필 카드에서 주석을 클릭하면 영향을 받는 변경 사항 및 필드가 변경사항 패널 및 프로필 또는 결과 패널에서 하이라이트됩니다.

단계를 선택한 다음 변경사항 패널을 확장하여 각 변경 사항의 세부 정보를 보거나, 변경 사항을 편집 또는 제거하거나, 변경 사항을 위나 아래로 끌어 놓아 변경 사항이 적용되는 순서를 변경할 수 있습니다. 또한 Tableau Prep Builder 버전 2019.1.1에서는 설명을 추가하여 다른 사용자에게 컨텍스트를 제공할 수 있습니다. 변경 내용에 설명을 추가하는 방법에 대한 자세한 내용은 흐름 단계 및 정리 작업에 설명 추가를 참조하십시오.

정리 주석 변경사항 패널

집계, 피벗, 조인 또는 유니온 단계의 변경 내용을 볼 때 변경이 적용된 순서는 재구성 작업 전이나 후에 표시됩니다. 이러한 변경의 순서는 시스템에 의해 적용되며 바꿀 수 없습니다. 변경 자체는 편집하고 제거할 수 있습니다.

필드 병합

동일한 값을 포함하지만 이름이 다른 필드가 있는 경우 한 필드를 다른 필드 위로 끌어 놓는 방법으로 두 필드를 결합하여 단일 필드로 쉽게 병합할 수 있습니다. 필드를 병합하면 대상 필드가 주 필드가 되고 대상 필드의 필드명이 지속됩니다. 대상 필드에 병합하는 필드는 제거됩니다.

예:

와일드카드 유니온을 사용하여 동일한 값을 갖는 3개의 필드 생성 3개 필드를 1개로 병합

Tableau Prep Builder에서 필드를 병합하면 대상 필드의 모든 필드가 유지되고 해당 필드의 모든 null 값이 대상 필드와 병합하는 원본 필드의 값으로 바뀝니다. 원본 필드는 제거됩니다.

Name Contact_Phone Business_Phone Cell_Phone Home_Phone
Bob 123-4567 123-4567 null null
Sally null null 456-7890 789-0123
Fred null null null 567-8901
Emma null 234-5678 345-6789 null

Business _Phone, Cell_PhoneHome_Phone 필드를 Contact_phone 필드와 병합하면 다른 필드가 제거되고 다음과 같은 결과가 생성됩니다.

Name Contact_Phone
Bob 123-4567
Sally 456-7890
Fred 567-8901
Emma 234-5678

필드를 병합하려면 다음 작업 중 하나를 수행합니다.

  • 한 필드를 다른 필드 위로 끌어 놓습니다. 병합할 필드 놓기 표시기가 나타납니다.

  • 여러 필드를 선택하고 선택된 항목 중 하나를 마우스 오른쪽 단추로 클릭하여 상황에 맞는 메뉴를 연 다음 필드 병합을 클릭합니다.

  • 여러 필드를 선택한 다음 툴바에서 필드 병합을 클릭합니다.

유니온의 결과로 일치하지 않는 필드를 수정하는 방법에 대한 자세한 내용은 일치하지 않는 필드 수정을 참조하십시오.

권장 사항을 사용하여 정리 작업 적용(버전 2018.3.2 이상)

가끔은 데이터의 문제를 해결할 때 사용해야 하는 정리 작업을 식별하기가 어려울 수 있습니다. Tableau Prep Builder에는 데이터를 분석한 후 자동으로 적용할 수 있는 정리 작업을 권장하는 기능이 있습니다. 이 기능을 사용하면 신속하게 데이터 필드의 문제를 해결하거나 문제를 식별하여 수정할 수 있습니다. 이 기능은 입력, 출력 및 조인 단계 유형을 제외한 모든 단계 유형에서 사용할 수 있습니다.

참고: 이 기능을 사용하지 않으려면 기능을 해제할 수 있습니다. 상단 메뉴에서 도움말 > 설정 및 성능으로 이동합니다. 권장 사항 사용을 클릭하여 설정 옆에 있는 확인 표시를 지웁니다.

권장 유형은 다음과 같습니다.

  • 데이터 역할

  • 필터

  • 그룹화 및 바꾸기(버전 2019.2.3부터 데이터 역할이 있는 필드에도 적용됨)
  • 열에서 행으로 피벗(2019.4.2 이상)

  • 값을 Null 값으로 바꾸기
  • 필드 제거

  • 분할(버전 2019.1.1 이상)

    참고: 이 옵션은 고정 너비 유형 텍스트 파일의 데이터에 특히 효과적입니다. 이 파일 유형에 분할 권장 사항을 사용하려면 데이터 원본에 연결한 후 입력 단계의 텍스트 설정 탭에서 데이터에 사용되지 않은 필드 구분 기호 문자를 선택하여 데이터를 단일 필드로 로드합니다.

  • 공백 자르기

권장 사항 적용

  1. 다음 작업 중 하나를 수행합니다.

    • 프로필 카드의 오른쪽 맨 위에 있는 전구 아이콘을 클릭합니다.
    • 툴바에서 권장 사항 드롭다운 화살표를 클릭하여 데이터 집합의 모든 권장 사항을 보고 목록에서 권장 사항을 선택합니다.

    이 옵션은 Tableau Prep Builder에서 권장되는 변경 사항이 식별될 때만 나타납니다.

  2. 권장 사항을 적용하려면 권장 사항 카드를 마우스오버하고 적용을 클릭합니다.

    변경이 자동으로 적용되고 변경 패널에 항목이 추가됩니다. 변경을 제거하려면 상단 메뉴에서 실행 취소를 클릭하거나 변경 패널에서 변경을 마우스오버하고 X를 클릭하여 제거합니다.

    권장 사항을 적용하여 필드를 피벗하는 경우(버전 2019.4.2 이상) 피벗 단계가 자동으로 만들어지며, 이 단계에서 피벗된 필드의 이름을 바꾸거나 추가 필드에 대한 피벗을 수행하는 등, 원하는 피벗 작업을 수행할 수 있습니다.

  3. Tableau Prep Builder이 변경 후에 추가 권장 사항을 식별하는 경우 추가 권장 사항이 발견되지 않을 때까지 전구 아이콘이 프로필 카드에 유지됩니다.

    위의 단계를 반복하여 추가 변경을 적용하거나 제안되는 변경을 무시하고 Tableau Prep Builder의 다른 정리 도구를 사용하여 데이터 문제를 해결합니다.

필드 값 편집

동일한 값의 여러 변형이 있으면 데이터를 정확하게 요약할 수 없게 됩니다. Tableau Prep Builder에서 다음과 같은 옵션을 사용하면 이러한 변형을 쉽고 빠르게 수정할 수 있습니다.

참고: 값에 대한 모든 편집은 필드 데이터 유형과 호환되어야 합니다.

단일 값 편집

  1. 프로필 카드에서 편집하려는 값을 클릭하고 새 값을 입력합니다. 값 옆에 그룹 아이콘 이 표시됩니다.

    또는 값을 마우스 오른쪽 단추로 클릭하고 값 편집을 클릭합니다. 변경 사항이 화면 왼쪽에 있는 변경사항 패널에 기록됩니다.

  2. 프로필 패널 및 데이터 그리드에서 결과를 확인합니다.

다중 값 편집

한 번에 다중 값을 편집할 수 있는 몇 가지 옵션이 있습니다. 예를 들어 빠른 정리 작업을 사용하여 한 필드의 모든 값에서 문장 부호를 제거하거나, 다중 선택을 사용하여 값을 수동으로 그룹화하거나, 유사한 값을 찾는 유사 항목 일치 알고리즘을 사용하여 자동으로 값을 그룹화하거나, 여러 값을 선택하고 Null 값으로 바꿀 수 있습니다.

참고: 다중 값을 단일 값으로 매핑하면 원래 필드의 값 옆에 그룹 아이콘 이 표시되어 함께 그룹화된 값을 보여 줍니다.

빠른 정리 작업을 사용하여 다중 값 편집

이 옵션은 텍스트 필드에만 적용됩니다.

  1. 프로필 패널, 결과 패널 또는 데이터 그리드에서 편집하려는 필드를 선택합니다.

  2. 기타 옵션 을 클릭하고 정리를 선택한 후 다음 옵션 중 하나를 선택합니다.

    • 대문자 만들기: 모든 값을 대문자 텍스트로 변경합니다.

    • 소문자 만들기: 모든 값을 소문자 텍스트로 변경합니다.

    • 문자 제거: 모든 알파벳 문자를 제거하고 기타 문자만 남깁니다.

    • 숫자 제거: 모든 숫자를 제거하고 알파벳 문자와 기타 문자만 남깁니다.

    • 문장 부호 제거: 모든 문장 부호를 제거합니다.

    • 공백 잘라내기: 선행 및 후행 공백을 제거합니다.

    작업을 중첩시켜 여러 정리 작업을 필드에 적용할 수 있습니다. 예를 들어 먼저 정리 > 숫자 제거를 선택한 다음 정리 > 문장 부호 제거를 선택하여 필드 값에서 모든 숫자와 문장 부호를 제거할 수 있습니다.

  3. 변경을 실행 취소하려면 흐름 패널 상단에 있는 실행 취소 화살표를 클릭하거나 변경 목록에서 변경 사항을 제거하십시오.

다중 값 인라인 그룹화 및 편집

  1. 프로필 카드에서 편집하려는 필드를 선택합니다.

  2. Ctrl 또는 Shift 키를 누른 채로 클릭하거나 Command 또는 Shift 키를 누른 채로 클릭(MacOS)하고 그룹화하려는 값을 선택합니다.

  3. 마우스 오른쪽 단추를 클릭하고 상황에 맞는 메뉴에서 그룹을 선택합니다. 마우스 오른쪽 단추로 클릭한 선택 항목의 값이 새 그룹의 기본 이름이 되지만 이 값은 인라인으로 편집할 수 있습니다.

  4. 그룹 이름을 편집하려면 그룹화된 필드를 선택하고 값을 편집하거나, 그룹화된 필드를 마우스 오른쪽 단추로 클릭(Mac의 경우 Control+클릭)하고 상황에 맞는 메뉴에서 값 편집을 선택합니다.

  5. 그룹화된 필드 값을 그룹 해제하려면 그룹화된 필드를 마우스 오른쪽 단추로 클릭하고 상황에 맞는 메뉴에서 그룹 해제를 선택합니다.

하나 이상의 값을 Null로 바꾸기

분석에 포함하려는 데이터 행이 있지만 특정 필드 값을 제외하려는 경우 해당 값을 Null 값으로 변경할 수 있습니다.

  1. 프로필 카드에서 Ctrl 또는 Shift 키를 누른 채로 클릭하거나 Command 또는 Shift 키를 누른 채로 클릭(Mac의 경우)하고 변경하려는 값을 선택합니다.

  2. 마우스 오른쪽 단추를 클릭(Mac의 경우 Control+클릭)하고 메뉴에서 Null로 바꾸기를 선택합니다. 값이 Null로 변경되고 값 옆에 그룹 아이콘 이 표시됩니다.

여러 값을 표준 값에 수동으로 매핑

그룹화 및 바꾸기를 사용하여 필드의 값을 한 값에서 다른 값으로 매핑하거나 수동으로 여러 값을 선택하여 그룹화합니다. 새 값을 추가하여 데이터를 구성하는 매핑 관계를 설정할 수도 있습니다.

예를 들어 한 필드에 My Company, My Company Incorporated 및 My Company Inc.의 세 값이 있다고 가정합니다. 세 값 모두 동일한 회사인 My Company를 나타냅니다. 그룹화 및 바꾸기를 사용하면 My Company Incorporated 및 My Company Inc 값을 My Company로 매핑하여 세 개 값 모두 필드에 My Company로 나타나게 만들 수 있습니다.

다중 값을 선택한 단일 필드로 매핑

  1. 프로필 패널 또는 결과 패널에서 편집하려는 필드를 선택합니다.

  2. 기타 옵션 을 클릭하고 메뉴에서 그룹화 및 바꾸기 > 수동 선택을 선택합니다.

  3. 그룹화 및 바꾸기 에디터의 왼쪽 패널에서 그룹화 값으로 사용하려는 필드 값을 선택합니다. 이제 이 값이 오른쪽 패널 맨 위에 표시됩니다.

  4. 그룹화 및 바꾸기 에디터의 오른쪽 패널 하단에서 그룹에 추가하려는 값을 선택합니다.

    그룹에서 값을 제거하려면 그룹화 및 바꾸기 에디터의 오른쪽 패널 상단에서 값 옆에 있는 확인란을 선택 취소합니다.

다중 값을 선택하여 그룹 만들기

  1. 프로필 패널 또는 결과 패널에서 편집하려는 필드를 선택합니다.

  2. 기타 옵션 을 클릭하고 메뉴에서 그룹화 및 바꾸기 > 수동 선택을 선택합니다.

  3. 그룹화 및 바꾸기 에디터의 왼쪽 패널에서 그룹화하려는 다중 값을 선택합니다.

  4. 그룹화 및 바꾸기 에디터의 오른쪽 패널에서 값 그룹화를 클릭합니다.

    마지막으로 선택한 값을 그룹 이름으로 사용하여 새 그룹이 만들어집니다. 그룹 이름을 편집하려면 그룹화된 필드를 선택하고 값을 편집하거나, 그룹화된 필드를 마우스 오른쪽 단추로 클릭(Mac의 경우 Control+클릭)하고 메뉴에서 값 편집을 선택합니다.

    데이터 집합에 없는 값 추가 및 식별

    데이터 집합에서 값을 존재하지 않는 새 값에 매핑하려는 경우 그룹화 및 바꾸기를 사용하여 값을 추가할 수 있습니다. 데이터 집합에 존재하지 않는 값을 쉽게 식별할 수 있도록 이러한 값은 그룹화 및 바꾸기 에디터에서 값 이름 옆에 빨간색 점이 표시됩니다.

    예를 들어 아래 이미지에서 Wyoming(와이오밍)과 Nevada(네바다)는 데이터 집합에 없습니다.

    값이 데이터 집합에 없는 이유 중 몇 가지는 다음과 같습니다.

    • 새 값을 수동으로 추가했습니다.

    • 값이 더 이상 데이터에 없습니다.

    • 값이 데이터에 있지만 샘플링된 데이터 집합에 없습니다.

    새 값을 추가하려면

    1. 프로필 패널 또는 결과 패널에서 편집하려는 필드를 선택합니다.

    2. 기타 옵션 을 클릭하고 상황에 맞는 메뉴에서 그룹화 및 바꾸기 > 수동 선택을 선택합니다.

    3. 그룹화 및 바꾸기 에디터의 왼쪽 패널에서 더하기 를 클릭하여 새 값을 추가합니다.

    4. 필드에 새 값을 입력하고 Enter 키를 눌러 추가합니다.

    5. 오른쪽 패널에서 새 값에 매핑하려는 값을 선택합니다.

    6. (선택 사항) 매핑된 값에 다른 새로운 값을 추가하려면 그룹화 및 바꾸기 에디터의 오른쪽 패널에서 더하기 단추를 클릭합니다.

유사 항목 일치를 사용하여 표준 값에 값 자동 매핑

유사한 값을 검색하고 자동으로 그룹화하려면 유사 항목 일치 알고리즘 중 하나를 사용합니다. 필드 값은 발생 빈도가 가장 높은 값을 기준으로 그룹화됩니다. 그룹화된 값을 검토하여 필요에 따라 그룹의 값을 추가하거나 제거합니다.

데이터 역할을 사용하여 필드 값의 유효성을 검사하는 경우 그룹화 및 바꾸기 옵션을 사용하여 유효하지 않은 값을 유효한 값과 일치시킬 수 있습니다. 자세한 내용은 데이터 역할별로 유사한 값 그룹화를 참조하십시오.

다음 옵션 중 하나를 선택하여 값을 그룹화합니다.

  • 발음: 소리가 같은 값을 찾아 그룹화합니다. 이 옵션은 단어를 발음별로 인덱싱하는 Metaphone 3 알고리즘을 사용하며 영어 단어에 가장 적합합니다. 이 유형의 알고리즘은 많은 유명한 맞춤법 검사기에서 사용됩니다. 이 옵션은 데이터 역할에 사용할 수 없습니다.

  • 공통 문자: 공통적인 알파벳 문자 또는 숫자가 있는 값을 찾아 그룹화합니다. 이 옵션에서는 문장 부호, 중복 및 공백 문자를 제거한 후 고유한 문자로 단어를 인덱싱하는 ngram 지문 알고리즘을 사용합니다. 이 알고리즘은 지원되는 모든 언어에서 작동합니다. 이 옵션은 데이터 역할에 사용할 수 없습니다.

    예를 들어 이 알고리즘에서는 "John Smith"와 "Smith, John"으로 표현된 이름이 모두 "hijmnost"를 생성하므로 두 이름이 일치합니다. 이 알고리즘에서는 발음을 고려하지 않으므로 "Tom Jhinois" 값이 동일한 키 "hijmnost"를 갖게 되고 그룹에 포함됩니다.

  • 맞춤법: 철자가 유사한 텍스트 값을 찾아 그룹화합니다. 이 옵션은 레벤시테인(Levenshtein) 거리 알고리즘에 기반하며 고정된 기본 임계값을 사용하여 두 텍스트 값 사이의 편집 거리를 계산합니다. 그런 다음 편집 거리가 임계값보다 작으면 두 텍스트 값을 함께 그룹화합니다. 이 알고리즘은 지원되는 모든 언어에서 작동합니다.

    Tableau Prep Builder 버전 2019.2.3부터 데이터 역할을 적용한 후 이 옵션을 사용할 수 있습니다. 이 경우 잘못된 값을 편집 거리를 사용하여 가장 가까운 올바른 값에 일치시킵니다. 표준 값이 데이터 집합 샘플에 없으면 Tableau Prep Builder에 자동으로 추가되고 값이 원래 데이터 집합에 없는 것으로 표시됩니다.

  • 발음 + 맞춤법: (버전 2019.1.4 이상) 필드에 데이터 역할을 할당하면 해당 데이터 역할을 사용하여 데이터 역할에 정의된 표준 값과 일치하는 값을 지정하고 그룹화할 수 있습니다. 이 옵션은 잘못된 값을 맞춤법 및 발음에 따라 가장 유사한 올바른 값과 일치시킵니다. 표준 값이 데이터 집합 샘플에 없으면 Tableau Prep Builder에 자동으로 추가되고 값이 원래 데이터 집합에 없는 것으로 표시됩니다. 이 옵션은 영어 단어에 가장 적합합니다.

    자세한 내용은 데이터 정리 및 변형를 참조하십시오.

    참고: Tableau Prep Builder 버전 2019.1.4 및 2019.2.1에서 이 옵션의 레이블은 데이터 역할 일치입니다.

유사 항목 일치를 사용하여 유사한 값 그룹화

  1. 프로필 패널 또는 결과 패널에서 편집하려는 필드를 선택합니다.

  2. 기타 옵션 을 클릭하고 그룹화 및 바꾸기를 선택한 후 다음 옵션 중 하나를 선택합니다.

    • 발음

    • 공통 문자

    • 맞춤법

    Tableau Prep Builder가 일치하는 값을 찾아 그룹화하고 해당 그룹에서 발생 빈도가 가장 높은 값으로 그룹을 매핑합니다.

  3. 그룹화를 검토하고 필요에 따라 값을 수동으로 추가 또는 제거하거나 편집합니다. 그런 다음 완료를 클릭합니다.

필드 값을 그룹화할 때 결과 조정

유사한 값을 맞춤법 또는 발음으로 그룹화하는 경우 필드의 슬라이더를 사용하여 그룹화 매개 변수의 양을 조정하여 결과를 변경할 수 있습니다.

슬라이더를 설정하는 방법에 따라 그룹에 포함된 값의 수와 만들어진 그룹 수를 제어할 수 있습니다. 기본적으로 Tableau Prep Builder에서는 최적의 그룹화 설정을 검색하고 해당 위치에 슬라이더를 표시합니다.

임계값을 변경하면 Tableau Prep Builder에서 값의 샘플을 분석하여 새 그룹화를 결정합니다. 설정에서 생성된 그룹은 변경사항 패널에 저장되고 기록되지만 임계값 설정은 저장되지 않습니다. 다음번에 그룹화 및 바꾸기 에디터를 열면 기존 변경 내용을 편집하거나 새 변경을 수행할 때 임계값 슬라이더가 기본 위치에 표시되므로 현재 데이터 집합에 따라 조정할 수 있습니다.

  1. 프로필 패널 또는 결과 패널에서 편집하려는 필드를 선택합니다.

  2. 기타 옵션 을 클릭하고 그룹화 및 바꾸기를 선택한 후 다음 옵션 중 하나를 선택합니다.

    • 발음

    • 맞춤법

    Tableau Prep Builder이 일치하는 값을 찾아 그룹화하고 해당 그룹에서 발생 빈도가 가장 높은 값으로 그룹을 매핑합니다.

  3. 그룹화 및 바꾸기 에디터의 왼쪽 패널에서 슬라이더를 5개의 임계값 수준 중 하나로 끌 어 결과를 변경합니다.

    보다 엄격한 임계값을 설정하려면 슬라이더를 왼쪽으로 이동합니다. 그러면 일치하는 항목이 줄어들고 더 적은 그룹이 만들어집니다. 보다 느슨한 임계값을 설정하려면 슬라이더를 오른쪽으로 이동합니다. 그러면 일치하는 항목이 늘고 더 많은 그룹이 만들어집니다.

  4. 완료를 클릭하여 변경 내용을 저장합니다.

이 섹션의 다른 문서

피드백을 제공해 주셔서 감사합니다! 피드백을 제출하는 동안 오류가 발생했습니다. 다시 시도하거나 메시지를 보내주십시오.