Tableau Desktop에서 두 번째 날짜를 사용하여 분석

이것은 자습서의 두 번째 단계이며 첫 번째 단계인 Tableau Prep으로 두 번째 날짜 구하기를 완료했다고 가정합니다.

첫 번째 단계에서 원래 데이터 집합을 가져와 다음과 같은 질문에 답할 수 있도록 변형했습니다.

  1. 각 운전자에 대한 첫 번째 위반과 두 번째 위반 사이의 간격(일)은 얼마입니까?

  2. 첫 번째 위반과 두 번째 위반에 대한 벌금을 비교합니다. 상관 관계가 있습니까?

  3. 가장 많은 벌금을 낸 운전자는 누구입니까? 가장 적은 벌금을 낸 운전자는 누구입니까?

  4. 위반 유형이 여러 개인 운전자는 몇 명입니까?

  5. 교통 안전 교육을 받은 적이 없는 운전자의 평균 벌금 액수는 얼마입니까?

이제 이러한 질문을 살펴보면 앞서 만든 첫 번째 데이터 구조에 몇 가지 장점과 단점이 있다는 것이 명확해집니다. 다시 Tableau Prep Builder로 돌아가 추가적인 몇 가지 변형을 다시 수행한 다음 Tableau Desktop에서 동일한 분석에 미치는 영향을 확인할 것입니다. 마지막으로, 원래 데이터와 세부 수준(LOD) 식을 사용하여 분석에 Tableau Desktop만 사용하는 접근 방식을 살펴볼 것입니다.

이 자습서의 목표는 생활 속 시나리오의 관점에서 다양한 개념을 제안하고 옵션을 살펴보는 것입니다. 따라서, 어떤 옵션이 최선인지에 대해서는 다루지 않습니다. 이 자습서를 끝내면 Tableau Prep의 다양한 특성과 Tableau Desktop의 계산에 대해 더 잘 알게 되며 데이터 구조가 계산 및 분석에 미치는 영향을 더 잘 이해하게 됩니다.

참고: 이 자습서의 작업을 완료하려면 Tableau Prep Builder가 필요하며 선택적으로 Tableau Desktop을 설치하고 데이터를 다운로드해야 합니다.

이 자습서를 계속하기 전에 Tableau Prep 및 Tableau Desktop을 설치하려면 Tableau Desktop 및 Tableau Prep 배포 가이드(링크가 새 창에서 열림)를 참조하십시오. 또는 Tableau Prep(링크가 새 창에서 열림)Tableau Desktop(링크가 새 창에서 열림) 무료 평가판을 다운로드할 수 있습니다.

데이터 집합은 첫 번째 단계에서 구축한 Driver Infractions.tflx의 출력입니다.

Tableau Desktop의 분석

이제 데이터를 구성했으므로 Tableau Desktop으로 데이터를 가져와야 합니다. 몇 가지 질문에는 쉽게 답할 수 있지만, 다른 질문들에는 몇 개의(또는 많은) 계산이 필요합니다. 아래 질문에 답해 보십시오. 막혔을 때 진행하는 방법에 대한 기본 정보를 얻으려면 각 질문을 확장하면 됩니다.

참고: Driver Infractions.twbx(링크가 새 창에서 열림) 통합 문서를 다운로드하면 솔루션을 상황에 맞게 살펴볼 수 있습니다. 분석을 해석하거나 답을 찾는 다른 방법이 있을 수 있음을 기억하십시오.

1. 각 운전자에 대한 첫 번째 위반과 두 번째 위반 사이의 간격(일)은 얼마입니까?
2. 첫 번째 위반과 두 번째 위반에 대한 벌금을 비교합니다. 상관 관계가 있습니까?
3. 가장 많은 벌금을 낸 운전자는 누구입니까? 가장 적은 벌금을 낸 운전자는 누구입니까?
4. 위반 유형이 여러 개인 운전자는 몇 명입니까?
5. 교통 안전 교육을 받은 적이 없는 운전자의 평균 벌금 액수는 얼마입니까?

자세히 알아보기 - 피벗된 데이터

지금까지 작업한 데이터는 첫 번째와 두 번째 위반과 관련된 질문에 답할 수 있도록 잘 구조화되어 있지만 Tableau Desktop에서 사용할 수 있도록 권장되는 표준 구조는 아닙니다. 분석이 위반 날짜와 관련된 기본적인 질문에서 멀어질수록 관련 정보를 사용 가능한 형태로 결합하기 위해 계산이 더욱 복잡해집니다.

일반적으로 데이터가 동일한 데이터 유형(예: 날짜에 대한 두 열, 벌금 액수에 대한 두 열 등)에 대한 여러 열에 저장되어 있고 필드명(예: 첫 번째 위반인지 또는 두 번째 위반인지 여부)에 고유한 정보가 저장되어 있는 경우 데이터를 피벗해야 한다는 의미입니다.

Tableau Prep Builder에서 다중 피벗을 수행하면 이 문제를 훌륭하게 해결할 수 있습니다. 이전 자습서 Tableau Prep으로 두 번째 날짜 구하기에서 만든 Driver Infraction(운전자 위반) Tableau Prep 흐름의 끝부터 작업할 수 있습니다.

: 다음 단계를 위해 Tableau Prep으로 돌아왔는지 확인하십시오.

  1. 마지막 정리 단계에서 모든 중복 필드를 기준으로 피벗하는 피벗 단계를 추가합니다. 피벗된 필드 영역의 오른쪽 위에 있는 더하기 더하기 기호가 있는 단추입니다. 아이콘을 사용하여 더 많은 피벗 값을 추가합니다. 1st/2nd Fine Amounts(첫 번째/두 번째 벌금 액수) 같은 각 필드 집합은 함께 피벗되어야 합니다.

    피벗에 대한 자세한 내용은 데이터 정리 및 변형을 참조하십시오.

  2. 피벗 필드 영역의 Pivot1 이름 열 아래에서 각 값을 두 번 클릭하고 이름을 1st(첫 번째) 및 2nd(두 번째)로 바꿉니다.

    5개 피벗이 표시된 Tableau Prep의 피벗 1 구성 패널

Null 날짜를 제거하고 필드 이름을 변경한 다음 순서를 재정리하여 결과를 간소화할 수 있습니다.

  1. 피벗 다음에 정리 단계를 추가합니다. Infraction Date(위반 날짜) 열에서 Null 표시줄을 마우스 오른쪽 단추로 클릭하고 제외를 선택합니다.

  2. Pivot1 Names(피벗1 이름) 필드명을 두 번 클릭하고 이름을 Infraction Number(위반 수)로 바꿉니다.

  3. 필드를 적절히 끌어 놓아 아래와 같이 순서를 다시 정렬합니다.

    피벗되고 정리된 데이터의 미리 보기

  1. 새 피벗된 데이터에서 Pivoted Driver Infractions(피벗된 운전자 위반 수)라는 출력을 만들고 Tableau Desktop으로 가져옵니다. (출력 단계를 추가한 후 흐름을 실행하는 것을 잊지 마십시오.)

이제 이 피벗된 데이터 구조를 사용하여 다섯 개 질문을 다시 살펴볼 수 있습니다. 막혔을 때 진행하는 방법에 대한 기본 정보를 얻으려면 각 질문을 확장하면 됩니다.

참고: 완성된 흐름 파일 Pivoted Driver Infractions.tflx를 다운로드하여 작업을 확인하거나, 통합 문서 Pivoted Driver Infractions.twbx를 다운로드하여 솔루션을 상황에 맞게 살펴볼 수 있습니다. 분석을 해석하거나 답을 찾는 다른 방법이 있을 수 있음을 기억하십시오.

1. 각 운전자에 대한 첫 번째 위반과 두 번째 위반 사이의 간격(일)은 얼마입니까?
2. 첫 번째 위반과 두 번째 위반에 대한 벌금을 비교합니다. 상관 관계가 있습니까?
3. 가장 많은 벌금을 낸 운전자는 누구입니까? 가장 적은 벌금을 낸 운전자는 누구입니까?
4. 위반 유형이 여러 개인 운전자는 몇 명입니까?
5. 교통 안전 교육을 받은 적이 없는 운전자의 평균 벌금 액수는 얼마입니까?

피벗된 데이터의 이점

자습서의 원래 데이터 구조를 사용하여 쉽게 답할 수 있는 질문에만 답하면 되는 경우 해당 데이터 구조를 유지할 수 있습니다. 하지만 피벗된 데이터 형식은 훨씬 유연합니다. 몇 가지 계산이 필요하더라도 일단 데이터 집합을 얻게 되면 더 광범위한 질문에 적합하게 됩니다.

더 자세히 알아보기 - 계산만 사용

Tableau Prep Builder에 액세스할 수 없다면 어떻게 될까요? 원래 데이터에서 막힌 경우 전혀 방법이 없을까요? 전혀 그렇지 않습니다!

Tableau Desktop 및 LOD 식은 모든 분석 질문에 답할 수 있습니다. 원래 Traffic Violations.xlsx(링크가 새 창에서 열림)에 연결하면 피벗된 데이터 집합과 매우 유사합니다. 중요한 Infraction Number(위반 수) 필드가 없을 뿐입니다. LOD 식을 통해 집계 단계의 결과를 흉내 낼 수 있습니다.

참고: LOD Driver Infractions.twbx(링크가 새 창에서 열림) 통합 문서를 다운로드하면 솔루션을 상황에 맞게 살펴볼 수 있습니다. 분석을 해석하거나 답을 찾는 다른 방법이 있을 수 있음을 기억하십시오.

1. 각 운전자에 대한 첫 번째 위반과 두 번째 위반 사이의 간격(일)은 얼마입니까?
2. 첫 번째 위반과 두 번째 위반에 대한 벌금을 비교합니다. 상관 관계가 있습니까?
3. 가장 많은 벌금을 낸 운전자는 누구입니까? 가장 적은 벌금을 낸 운전자는 누구입니까?
4. 위반 유형이 여러 개인 운전자는 몇 명입니까?
5. 교통 안전 교육을 받은 적이 없는 운전자의 평균 벌금 액수는 얼마입니까?

이 솔루션에 많은 중첩 계산과 LOD 식이 있다는 것을 기억해야 합니다. 데이터 집합의 크기와 데이터의 복잡성에 따라 성능이 문제가 될 수 있습니다.

방법에 대한 반성

그렇다면 어떤 경로를 따라야 할까요? 이는 전적으로 귀하와 귀하가 사용할 수 있는 도구에 따라 결정됩니다.

  • LOD 없이 관리하고 싶다면 데이터 변형 솔루션이 있지만 일부 분석(Tableau Desktop의 분석)에 계산이 필요할 수 있습니다.

  • 데이터를 변형할 수 있으며 LOD를 포함한 계산에 거부감이 없다면 가운데 옵션(자세히 알아보기 - 피벗된 데이터)이 최상의 유연성을 제공합니다.

  • LOD에 익숙하다면 성능에 미치는 영향을 최소화하거나 Tableau Prep에 액세스할 필요가 없도록 LOD만 사용하여 푸는 것이 실행 가능한 옵션(더 자세히 알아보기 - 계산만 사용)입니다.

적어도 Tableau Prep의 집계와 Tableau Desktop의 세부 수준 식이 어떻게 상호 관련되어 있으며 데이터 분석에 영향을 주는지 이해하는 것이 중요합니다. Tableau에서 수행하는 대부분의 작업과 마찬가지로 이 경우에도 방법이 둘 이상 있을 수 있습니다. 모든 다양한 옵션을 탐색하면 개념을 모아 최상의 솔루션을 선택할 수 있습니다.

사용된 계산:

참고: 이 자습서의 초기 영감을 제공한 Workout Wednesday 주제 Do Customers Spend More on Their First or Second Purchase?(고객이 첫 번째 또는 두 번째 구매에서 더 많은 소비를 합니까?)(링크가 새 창에서 열림)의 Ann Jackson과 Tableau Prep 팁 Returning the First and Second Purchase Dates(첫 번째 및 두 번째 구매 날짜 반환)(링크가 새 창에서 열림)의 Andy Kriebel에게 특별한 감사를 전합니다. 이러한 링크를 클릭하면 Tableau 웹 사이트 외부로 이동합니다. Tableau는 외부 공급자에 의해 유지 관리되는 페이지가 정확하며 최신 상태인지에 대해 책임을 지지 않습니다. 콘텐츠와 관련된 질문이 있는 경우 해당 소유자에게 문의하십시오.