데이터 집계, 조인 또는 유니온
데이터를 그룹으로 집계, 조인 또는 유니온하거나 분석을 위해 결합할 수 있습니다.
참고: 버전 2020.4.1부터 Tableau Server 및 Tableau Cloud에서 흐름을 만들고 편집할 수 있습니다. 이 항목의 내용은 특별히 언급하지 않는 한 모든 플랫폼에 적용됩니다. 웹에서 흐름을 작성하는 것에 대한 자세한 내용은 Tableau Server(링크가 새 창에서 열림) 및 Tableau Cloud(링크가 새 창에서 열림) 도움말에서 웹에서의 Tableau Prep을 참조하십시오.
값 집계 및 그룹화
흐름에서 생성되는 데이터의 양을 줄이거나 함께 조인하거나 유니온으로 통합하려는 다른 데이터에 맞게 데이터를 정렬하기 위해 일부 데이터의 세부 수준을 조정해야 할 경우도 있습니다. 예를 들어 판매 테이블을 고객 테이블과 조인하기 전에 고객별로 판매 데이터를 집계할 수 있습니다.
데이터의 세부 수준을 조정해야 한다면 집계 옵션을 사용하여 데이터를 그룹화하고 집계하는 단계를 만듭니다. 데이터가 집계되는지, 아니면 그룹화되는지는 데이터 유형(문자열, 숫자 또는 날짜)에 따라 다릅니다.
흐름 패널에서 더하기 아이콘을 클릭하고 집계를 선택합니다. 흐름 패널에 새 집계 단계가 표시되고 프로필 패널이 집계 및 그룹 프로필을 표시하도록 업데이트됩니다.
왼쪽 패널의 필드를 그룹화된 필드 패널(행을 구성하는 필드) 또는 집계된 필드 패널(집계하여 그룹화된 필드 수준에서 표시할 데이터)로 끌어옵니다.
또한 다음 작업을 수행할 수도 있습니다.
두 패널 간에서 필드를 끌어 놓습니다.
목록에서 필드를 검색하고 집계에 포함하려는 필드만 선택합니다.
필드를 두 번 클릭하여 왼쪽 또는 오른쪽 패널에 필드를 추가합니다.
필드의 함수를 변경하여 적절한 패널에 필드를 자동으로 추가합니다.
모두 추가 또는 모두 제거를 클릭하여 대량으로 필드를 적용하거나 제거합니다.
필드에 특정 정리 작업을 적용합니다. 사용할 수 있는 정리 옵션에 대한 자세한 내용은 정리 작업 정보(링크가 새 창에서 열림)를 참조하십시오.
다음 예제는 수익 및 수량의 합계와 지역별 평균 할인 및 매출 연도를 보여줍니다.
필드는 데이터 유형에 따라 그룹화된 필드 및 집계된 필드 열에 분산됩니다. 그룹 또는 집계 유형(예: AVG 또는 SUM) 머리글을 클릭하여 그룹 또는 집계 유형을 변경합니다.
집계 및 그룹 프로필 아래에 있는 데이터 그리드에서 그룹 또는 집계의 멤버 샘플을 확인할 수 있습니다.
필드에 적용된 모든 정리 작업은 변경 패널에서 추적됩니다.
데이터 조인
분석하려는 데이터는 대체로 특정 필드로 관련된 테이블 모음으로 구성됩니다. 조인은 이러한 공통 필드에서 관련 데이터를 결합하는 방법입니다. 조인을 사용한 데이터 결합 결과는 대개 데이터의 필드를 추가하여 가로로 확장되는 테이블입니다.
조인은 흐름의 어디에서나 수행할 수 있는 작업입니다. 흐름의 초기에 조인을 수행하면 데이터 집합을 파악하기 쉽고 주의가 필요한 영역을 바로 노출시킬 수 있습니다.
Tableau Prep은 다음과 같은 조인 유형을 지원합니다.
조인 유형 | 설명 |
---|---|
Left | 각 행에 대해 왼쪽 테이블의 모든 값과 오른쪽 테이블의 일치하는 행을 포함합니다. 왼쪽 테이블의 값이 오른쪽 테이블에 일치하는 항목이 없는 경우 조인 결과에 Null 값이 표시됩니다. |
lnner | 각 행에 대해 두 테이블에서 일치하는 항목이 있는 값을 포함합니다. |
Right | 각 행에 대해 오른쪽 테이블의 모든 값과 왼쪽 테이블의 일치하는 행을 포함합니다. 오른쪽 테이블의 값과 일치하는 항목이 왼쪽 테이블에 없는 경우 조인 결과에 Null 값이 표시됩니다. |
leftOnly | 각 행에 대해 왼쪽 테이블에서 오른쪽 테이블에 일치하는 값이 없는 값만 포함합니다. 오른쪽 테이블의 필드 값은 조인 결과에 null로 표시됩니다. |
rightOnly | 각 행에 대해 오른쪽 테이블에서 왼쪽 테이블에 일치하는 값이 없는 값만 포함합니다. 왼쪽 테이블의 필드 값은 조인 결과에 null로 표시됩니다. |
notInner | 각 행에 대해 오른쪽 및 왼쪽 테이블에서 일치하지 않는 모든 값을 포함합니다. |
Full | 각 행에 대해 두 테이블의 모든 값을 포함합니다. 한 테이블의 값이 다른 테이블에 일치하는 항목이 없는 경우 조인 결과에 Null 값이 표시됩니다. |
조인을 만들려면 다음 작업을 수행합니다.
다음 방법 중 하나를 사용하여 두 테이블을 조인합니다.
- 흐름 패널에 테이블을 두 개 이상 추가한 다음 관련 테이블을 선택하고 다른 테이블로 끌어와 조인 옵션이 표시되게 합니다.
- 아이콘을 클릭하고 메뉴에서 조인을 선택한 후 수동으로 다른 입력을 조인에 추가하고 조인 절을 추가합니다.
참고: 정의된 테이블 관계가 있고 관련 필드를 포함하는 테이블에 연결하는 경우 조인을 선택하고 관련 테이블 목록에서 조인을 선택할 수 있습니다. Tableau Prep에서는 두 테이블 간의 관계를 구성하는 필드를 기반으로 조인을 만듭니다.
테이블 관계가 있는 커넥터에 대한 자세한 내용은 입력 단계에서 데이터 조인(링크가 새 창에서 열림)을 참조하십시오.흐름에 새 조인 단계가 추가되고 프로필 패널이 조인 프로필을 표시하도록 업데이트됩니다.
조인을 검토하고 구성하려면 다음을 수행합니다.
조인 결과 요약을 검토하여 조인 유형 및 조인 조건의 결과로 포함되거나 제외된 필드 수를 확인합니다.
조인 유형에서 벤 다이어그램을 클릭하여 원하는 조인 유형을 지정합니다.
적용된 조인 절에서 더하기 아이콘을 클릭하거나 기본 조인 조건으로 선택된 필드에서 조인 절을 지정하거나 편집합니다. 조인 조건에서 선택한 필드는 조인의 테이블 간에서 공통되는 필드입니다.
또한 조인 절 권장 사항에 표시된 권장 조인 절을 클릭하여 해당 절을 적용된 조인 절 목록에 추가할 수 있습니다.
조인 결과 검사
조인 프로필의 요약에는 조인에 필요한 데이터가 포함되었는지 여부를 확인할 수 있도록 도와 주는 조인 관련 메타데이터가 표시됩니다.
적용된 조인 절: 기본적으로 Tableau Prep은 조인되는 테이블의 공통 필드명을 기반으로 첫 번째 조인 절을 정의합니다. 필요에 따라 조인 절을 추가하거나 제거합니다.
조인 유형: 기본적으로, 조인을 만들면 Tableau Prep은 테이블 간에서 내부 조인을 사용합니다. 연결하는 데이터에 따라 Left, Inner, Right, leftOnly, rightOnly, notInner 또는 Full 조인을 사용할 수 있습니다.
조인 결과 요약: 조인 결과 요약에는 조인의 테이블에서 포함되거나 제외된 값의 분포가 표시됩니다.
각 포함됨 막대를 클릭하여 분리하고 조인에 포함된 조인 프로필의 데이터를 확인합니다.
각 제외됨 막대를 클릭하여 분리하고 조인에서 제외된 조인 프로필의 데이터를 확인합니다.
포함됨 및 제외됨 막대의 임의 조합을 클릭하여 누적된 관점에서 데이터를 확인합니다.
조인 절 권장 사항: 권장 조인 절 옆에 있는 더하기 아이콘을 클릭하여 해당 절을 적용된 조인 절 목록에 추가합니다.
조인 절 패널: 조인 절 패널에서 조인 절의 각 필드에 있는 값을 확인할 수 있습니다. 조인 절의 조건을 충족하지 못하는 값은 빨간색 텍스트로 표시됩니다.
조인 결과 패널: 조인 결과 패널에 변경하려는 값이 표시되는 경우 이 패널에서 값을 편집할 수 있습니다.
일반적인 조인 문제
데이터 조인 후 예상한 결과가 나오지 않는 경우 필드 값을 추가로 정리해야 할 수 있습니다. 다음 문제는 Tableau Prep이 값을 일치하지 않는 항목으로 읽고 조인에서 제외하는 결과를 야기합니다.
대/소문자 불일치: My Sales와 my sales
맞춤법 불일치: Hawaii와 Hawai'i
맞춤법 오류 또는 데이터 입력 오류: My Company Health와 My Company Heath
이름 변경: John Smith와 John Smith Jr.
약어: My Company Limited와 My Company Ltd
추가 구분 기호: Honolulu와 Honolulu (Hawaii)
추가 공백: 문자 사이의 추가 공백 탭 공백 또는 추가 선행 또는 후행 공백이 포함됩니다.
마침표 사용 불일치: Returned, not needed와 Returned, not needed.
그러나 필드 값에 이러한 문제가 있더라도 조인 절에서 필드 값을 직접 수정하거나 조인 결과 요약에서 제외됨 막대를 클릭하여 제외된 값을 작업한 후 프로필 카드 메뉴에서 정리 작업을 사용할 수 있습니다.
조인 단계에서 사용할 수 있는 다양한 정리 옵션에 대한 자세한 내용은 정리 작업 정보(링크가 새 창에서 열림)를 참조하십시오.
불일치 필드 수정 및 기타
조인 절에서 불일치 필드를 바로 수정할 수 있습니다. 값을 두 번 클릭하거나 마우스 오른쪽 단추로 클릭한 다음 수정하여 새 값을 입력하려는 필드의 상황에 맞는 메뉴에서 값 편집을 선택합니다. 데이터 변경 내용은 추적되고 조인 단계 오른쪽에 있는 변경 패널에 추가됩니다.
여러 값을 선택하여 조인 절 패널에서 유지, 제외 또는 필터링하거나 조인 결과 패널에서 다른 정리 작업을 적용할 수 있습니다. 변경하는 필드 자체와 조인 프로세스에서 필드의 위치에 따라 변경은 조인 전이나 후에 적용되어 수정된 결과를 제공합니다.
정리 필드에 대한 자세한 내용은 정리 작업 적용(링크가 새 창에서 열림)을 참조하십시오.
데이터 유니온
유니온은 한 테이블의 행을 다른 테이블에 추가하여 데이터를 결합하는 방법입니다. 예를 들어 한 테이블의 새 거래를 다른 테이블의 이전 거래 목록에 추가할 수 있습니다. 유니온할 테이블들이 필드 수와 필드명이 동일하고 필드의 데이터 유형이 동일한지 확인하십시오.
팁: 성능을 극대화하기 위해 단일 유니온에는 최대 10개의 입력을 사용할 수 있습니다. 10개를 초과하는 파일이나 테이블을 유니온해야 하는 경우 입력 단계에서 파일을 유니온하십시오. 이 유형의 유니온에 대한 자세한 내용은 입력 단계에서 파일 및 데이터베이스 테이블 유니온(링크가 새 창에서 열림)을 참조하십시오.
조인과 유사하게 유니온 작업은 흐름의 아무 위치에서나 사용할 수 있습니다.
유니온을 만들려면 다음 작업을 수행합니다.
흐름 패널에 테이블을 두 개 이상 추가한 후 관련 테이블을 선택하고 다른 테이블로 끌어 유니온 옵션이 표시되게 합니다. 또는 아이콘을 클릭하고 메뉴에서 유니온을 선택할 수도 있습니다. 흐름 패널에 새 유니온 단계가 추가되고 프로필 패널이 유니온 프로필을 표시하도록 업데이트됩니다.
유니온에 다른 테이블을 추가하려면 테이블을 유니온된 테이블로 끌어와 추가 옵션이 표시되게 합니다.
유니온 프로필에서 유니온 관련 메타데이터를 검토합니다. 유니온에서 테이블을 제거하고 일치하지 않는 필드의 세부 정보를 확인할 수 있습니다.
유니온 결과 검사
유니온을 만든 후 유니온 결과를 검사하여 유니온의 데이터가 예상한 데이터인지 확인합니다. 유니온된 데이터의 유효성을 확인하려면 다음 영역을 확인합니다.
유니온 메타데이터 검토: 유니온 프로필에는 몇 가지 유니온 관련 메타데이터가 표시됩니다. 여기에서 유니온을 구성하는 테이블, 결과 필드 수 및 일치하지 않은 필드를 확인할 수 있습니다.
각 필드의 색상 검토: 유니온 요약에 나열된 각 필드의 옆과 유니온 프로필의 각 필드 위에 일련의 색상이 표시됩니다. 색상은 유니온의 각 테이블에 해당합니다.
필드에 대해 모든 테이블 색상이 표시되면 해당 필드에 유니온이 올바르게 수행된 것입니다. 테이블 색상이 누락되면 일치하지 않은 필드가 있다는 의미입니다.
일치하지 않은 필드는 유사한 데이터가 있지만 어떤 면에서 다른 필드입니다. 일치하지 않는 필드의 목록은 유니온 요약과 해당 필드가 발생한 테이블에서 볼 수 있습니다. 필드의 데이터를 더 자세히 살펴보려면 일치하지 않은 필드만 표시 확인란을 선택하여 유니온 프로필에서 일치하지 않은 필드를 분리합니다.
이러한 필드를 수정하려면 아래 일치하지 않는 필드 수정 섹션의 제안 사항 중 하나를 따릅니다.
일치하지 않는 필드 수정
유니온의 테이블이 일치하지 않는 경우 유니온에서 불필요한 필드가 생성됩니다. 불필요한 필드는 적절한 컨텍스트에서 제외되는 유효한 데이터입니다.
필드 불일치 문제를 해결하려면 일치하지 않는 필드를 함께 병합해야 합니다.
필드가 일치하지 않는 이유는 많습니다.
대응하는 필드의 이름이 다른 경우: 테이블 간의 대응하는 필드가 서로 이름이 다른 경우 유니온 권장 사항을 사용하거나, 불일치 필드 목록에서 수동으로 필드를 병합하거나, 유니온 프로필에서 필드명을 바꿔 일치하지 않는 필드를 함께 병합할 수 있습니다.
유니온 권장 사항을 사용하려면 다음을 수행합니다.
불일치 필드 목록에서 일치하지 않은 필드를 클릭합니다. 제안된 일치 항목이 있으면 일치하는 필드가 노란색으로 하이라이트됩니다.
제안된 일치 항목은 데이터 유형 및 필드명이 유사한 필드를 기반으로 합니다.
하이라이트된 필드를 마우스오버하고 더하기 단추를 클릭하여 필드를 병합합니다.
불일치 필드 목록에서 수동으로 필드를 병합하려면 다음을 수행합니다.
목록에서 하나 이상의 필드를 선택합니다.
선택한 필드를 마우스 오른쪽 단추로 클릭하거나 Ctrl-클릭(MacOS)합니다. 병합이 유효한 경우 필드 병합 메뉴 옵션이 나타납니다.
필드를 마우스 오른쪽 단추로 클릭할 때 사용 가능한 옵션이 없음이 나타나는 것은 병합할 수 있는 필드가 없기 때문입니다. 예를 들어 동일한 입력의 두 필드를 병합해 보십시오.
필드 병합을 클릭하여 선택한 필드를 병합합니다.
유니온 프로필 패널에서 필드명을 바꾸려면 필드명을 마우스 오른쪽 단추로 클릭하고 필드명 바꾸기를 클릭합니다.
대응하는 필드의 이름이 같지만 유형이 다른 경우: 기본적으로, 대응하는 필드의 이름은 일치하지만 필드의 데이터 유형이 일치하지 않는 경우 Tableau Prep은 필드 중 하나의 데이터 유형을 변경하여 서로 호환되게 만듭니다. Tableau Prep이 이 변경을 수행한 경우 병합된 필드의 상단에 데이터 유형 변경 아이콘이 표시됩니다.
하지만 Tableau Prep이 올바른 데이터 유형을 선택하지 못하는 경우도 있습니다. 이런 일이 발생한 경우 병합을 실행 취소하려면 데이터 유형 변경 아이콘을 마우스 오른쪽 단추로 클릭하거나 Ctrl-클릭(MacOS)하고 서로 다른 유형을 사용하여 입력 분리를 선택합니다.
그런 다음 필드 중 하나의 데이터 유형을 먼저 변경한 후 추가 필드 병합 옵션의 제안 사항에 따라 필드를 다시 병합할 수 있습니다.대응하는 테이블의 필드 수가 서로 다른 경우: 테이블을 유니온하려면 유니온의 각 테이블에 동일한 수의 필드가 있어야 합니다. 유니온에서 불필요한 필드가 발생하는 경우 필드를 기존 필드로 병합하십시오.
추가 필드 병합 옵션
필드 병합의 경우 위 섹션에서 설명한 방법뿐만 아니라 다음 방법 중 하나를 사용하여 필드를 병합할 수도 있습니다. 출력 단계를 제외한 모든 단계에서 필드를 병합할 수 있습니다.
같은 파일의 필드를 병합하는 방법에 대한 자세한 내용은 필드 병합을 참조하십시오.
필드를 병합하려면 다음 작업 중 하나를 수행합니다.
한 필드를 다른 필드 위로 끌어 놓습니다. 병합할 필드 놓기 표시기가 나타납니다.
여러 필드를 선택하고 선택된 항목 중 하나를 마우스 오른쪽 단추로 클릭하여 상황에 맞는 메뉴를 연 다음 필드 병합을 클릭합니다.
여러 필드를 선택한 다음 상황을 인식하는 툴바에서 필드 병합을 클릭합니다.