Tableau Desktop에서 두 번째 날짜를 사용하여 분석

이것은 자습서의 두 번째 단계이며 첫 번째 단계인 Tableau Prep으로 두 번째 날짜 구하기를 완료했다고 가정합니다.

첫 번째 단계에서 원래 데이터 집합을 가져와 다음과 같은 질문에 답할 수 있도록 변형했습니다.

  1. 각 운전자에 대한 첫 번째 위반과 두 번째 위반 사이의 간격(일)은 얼마입니까?

  2. 첫 번째 위반과 두 번째 위반에 대한 벌금을 비교합니다. 상관 관계가 있습니까?

  3. 가장 많은 벌금을 낸 운전자는 누구입니까? 가장 적은 벌금을 낸 운전자는 누구입니까?

  4. 위반 유형이 여러 개인 운전자는 몇 명입니까?

  5. 교통 안전 교육을 받은 적이 없는 운전자의 평균 벌금 액수는 얼마입니까?

이제 이러한 질문을 살펴보면 앞서 만든 첫 번째 데이터 구조에 몇 가지 장점과 단점이 있다는 것이 명확해집니다. 다시 Tableau Prep Builder로 돌아가 추가적인 몇 가지 변형을 다시 수행한 다음 Tableau Desktop에서 동일한 분석에 미치는 영향을 확인할 것입니다. 마지막으로, 원래 데이터와 세부 수준(LOD) 식을 사용하여 분석에 Tableau Desktop만 사용하는 접근 방식을 살펴볼 것입니다.

이 자습서의 목표는 생활 속 시나리오의 관점에서 다양한 개념을 제안하고 옵션을 살펴보는 것입니다. 따라서, 어떤 옵션이 최선인지에 대해서는 다루지 않습니다. 이 자습서를 끝내면 Tableau Prep의 다양한 특성과 Tableau Desktop의 계산에 대해 더 잘 알게 되며 데이터 구조가 계산 및 분석에 미치는 영향을 더 잘 이해하게 됩니다.

참고: 이 자습서의 작업을 완료하려면 Tableau Prep Builder가 필요하며 선택적으로 Tableau Desktop을 설치하고 데이터를 다운로드해야 합니다.

이 자습서를 계속하기 전에 Tableau Prep 및 Tableau Desktop을 설치하려면 Tableau Desktop 및 Tableau Prep 배포 가이드(링크가 새 창에서 열림)를 참조하십시오. 또는 Tableau Prep(링크가 새 창에서 열림)Tableau Desktop(링크가 새 창에서 열림) 무료 평가판을 다운로드할 수 있습니다.

데이터 집합은 첫 번째 단계에서 구축한 Driver Infractions.tflx의 출력입니다.

Tableau Desktop의 분석

이제 데이터를 구성했으므로 Tableau Desktop으로 데이터를 가져와야 합니다. 몇 가지 질문에는 쉽게 답할 수 있지만, 다른 질문들에는 몇 개의(또는 많은) 계산이 필요합니다. 아래 질문에 답해 보십시오. 막혔을 때 진행하는 방법에 대한 기본 정보를 얻으려면 각 질문을 확장하면 됩니다.

참고: Driver Infractions.twbx(링크가 새 창에서 열림) 통합 문서를 다운로드하면 솔루션을 상황에 맞게 살펴볼 수 있습니다. 분석을 해석하거나 답을 찾는 다른 방법이 있을 수 있음을 기억하십시오.

1. 각 운전자에 대한 첫 번째 위반과 두 번째 위반 사이의 간격(일)은 얼마입니까?
2. 첫 번째 위반과 두 번째 위반에 대한 벌금을 비교합니다. 상관 관계가 있습니까?
3. 가장 많은 벌금을 낸 운전자는 누구입니까? 가장 적은 벌금을 낸 운전자는 누구입니까?
4. 위반 유형이 여러 개인 운전자는 몇 명입니까?
5. 교통 안전 교육을 받은 적이 없는 운전자의 평균 벌금 액수는 얼마입니까?

자세히 알아보기 - 피벗된 데이터

지금까지 작업한 데이터는 첫 번째와 두 번째 위반과 관련된 질문에 답할 수 있도록 잘 구조화되어 있지만 Tableau Desktop에서 사용할 수 있도록 권장되는 표준 구조는 아닙니다. 분석이 위반 날짜와 관련된 기본적인 질문에서 멀어질수록 관련 정보를 사용 가능한 형태로 결합하기 위해 계산이 더욱 복잡해집니다.

일반적으로 데이터가 동일한 데이터 유형(예: 날짜에 대한 두 열, 벌금 액수에 대한 두 열 등)에 대한 여러 열에 저장되어 있고 필드명(예: 첫 번째 위반인지 또는 두 번째 위반인지 여부)에 고유한 정보가 저장되어 있는 경우 데이터를 피벗해야 한다는 의미입니다.

Tableau Prep Builder에서 다중 피벗을 수행하면 이 문제를 훌륭하게 해결할 수 있습니다. 이전 자습서 Tableau Prep으로 두 번째 날짜 구하기에서 만든 Driver Infraction(운전자 위반) Tableau Prep 흐름의 끝부터 작업할 수 있습니다.

: 다음 단계를 위해 Tableau Prep으로 돌아왔는지 확인하십시오.

  1. 마지막 정리 단계에서 모든 중복 필드를 기준으로 피벗하는 피벗 단계를 추가합니다. 피벗된 필드 영역의 오른쪽 위에 있는 더하기 아이콘을 사용하여 더 많은 피벗 값을 추가합니다. 1st/2nd Fine Amounts(첫 번째/두 번째 벌금 액수) 같은 각 필드 집합은 함께 피벗되어야 합니다.

    피벗에 대한 자세한 내용은 데이터 정리 및 변형을 참조하십시오.

  2. 피벗 필드 영역의 Pivot1 이름 열 아래에서 각 값을 두 번 클릭하고 이름을 1st(첫 번째) 및 2nd(두 번째)로 바꿉니다.

    5개 피벗이 표시된 Tableau Prep의 피벗 1 구성 패널

Null 날짜를 제거하고 필드 이름을 변경한 다음 순서를 재정리하여 결과를 간소화할 수 있습니다.

  1. 피벗 다음에 정리 단계를 추가합니다. Infraction Date(위반 날짜) 열에서 Null 표시줄을 마우스 오른쪽 단추로 클릭하고 제외를 선택합니다.

  2. Pivot1 Names(피벗1 이름) 필드명을 두 번 클릭하고 이름을 Infraction Number(위반 수)로 바꿉니다.

  3. 필드를 적절히 끌어 놓아 아래와 같이 순서를 다시 정렬합니다.

    피벗되고 정리된 데이터의 미리 보기

  1. 새 피벗된 데이터에서 Pivoted Driver Infractions(피벗된 운전자 위반 수)라는 출력을 만들고 Tableau Desktop으로 가져옵니다. (출력 단계를 추가한 후 흐름을 실행하는 것을 잊지 마십시오.)

이제 이 피벗된 데이터 구조를 사용하여 다섯 개 질문을 다시 살펴볼 수 있습니다. 막혔을 때 진행하는 방법에 대한 기본 정보를 얻으려면 각 질문을 확장하면 됩니다.

참고: 완성된 흐름 파일 Pivoted Driver Infractions.tflx를 다운로드하여 작업을 확인하거나, 통합 문서 Pivoted Driver Infractions.twbx를 다운로드하여 솔루션을 상황에 맞게 살펴볼 수 있습니다. 분석을 해석하거나 답을 찾는 다른 방법이 있을 수 있음을 기억하십시오.

1. 각 운전자에 대한 첫 번째 위반과 두 번째 위반 사이의 간격(일)은 얼마입니까?
2. 첫 번째 위반과 두 번째 위반에 대한 벌금을 비교합니다. 상관 관계가 있습니까?
3. 가장 많은 벌금을 낸 운전자는 누구입니까? 가장 적은 벌금을 낸 운전자는 누구입니까?
4. 위반 유형이 여러 개인 운전자는 몇 명입니까?
5. 교통 안전 교육을 받은 적이 없는 운전자의 평균 벌금 액수는 얼마입니까?

피벗된 데이터의 이점

자습서의 원래 데이터 구조를 사용하여 쉽게 답할 수 있는 질문에만 답하면 되는 경우 해당 데이터 구조를 유지할 수 있습니다. 하지만 피벗된 데이터 형식은 훨씬 유연합니다. 몇 가지 계산이 필요하더라도 일단 데이터 집합을 얻게 되면 더 광범위한 질문에 적합하게 됩니다.

더 자세히 알아보기 - 계산만 사용

Tableau Prep Builder에 액세스할 수 없다면 어떻게 될까요? 원래 데이터에서 막힌 경우 전혀 방법이 없을까요? 전혀 그렇지 않습니다!

Tableau Desktop 및 LOD 식은 모든 분석 질문에 답할 수 있습니다. 원래 Traffic Violations.xlsx(링크가 새 창에서 열림)에 연결하면 피벗된 데이터 집합과 매우 유사합니다. 중요한 Infraction Number(위반 수) 필드가 없을 뿐입니다. LOD 식을 통해 집계 단계의 결과를 흉내 낼 수 있습니다.

참고: LOD Driver Infractions.twbx(링크가 새 창에서 열림) 통합 문서를 다운로드하면 솔루션을 상황에 맞게 살펴볼 수 있습니다. 분석을 해석하거나 답을 찾는 다른 방법이 있을 수 있음을 기억하십시오.

1. 각 운전자에 대한 첫 번째 위반과 두 번째 위반 사이의 간격(일)은 얼마입니까?
2. 첫 번째 위반과 두 번째 위반에 대한 벌금을 비교합니다. 상관 관계가 있습니까?
3. 가장 많은 벌금을 낸 운전자는 누구입니까? 가장 적은 벌금을 낸 운전자는 누구입니까?
4. 위반 유형이 여러 개인 운전자는 몇 명입니까?
5. 교통 안전 교육을 받은 적이 없는 운전자의 평균 벌금 액수는 얼마입니까?

이 솔루션에 많은 중첩 계산과 LOD 식이 있다는 것을 기억해야 합니다. 데이터 집합의 크기와 데이터의 복잡성에 따라 성능이 문제가 될 수 있습니다.

방법에 대한 반성

그렇다면 어떤 경로를 따라야 할까요? 이는 전적으로 귀하와 귀하가 사용할 수 있는 도구에 따라 결정됩니다.

  • LOD 없이 관리하고 싶다면 데이터 변형 솔루션이 있지만 일부 분석(Tableau Desktop의 분석)에 계산이 필요할 수 있습니다.

  • 데이터를 변형할 수 있으며 LOD를 포함한 계산에 거부감이 없다면 가운데 옵션(자세히 알아보기 - 피벗된 데이터)이 최상의 유연성을 제공합니다.

  • LOD에 익숙하다면 성능에 미치는 영향을 최소화하거나 Tableau Prep에 액세스할 필요가 없도록 LOD만 사용하여 푸는 것이 실행 가능한 옵션(더 자세히 알아보기 - 계산만 사용)입니다.

적어도 Tableau Prep의 집계와 Tableau Desktop의 세부 수준 식이 어떻게 상호 관련되어 있으며 데이터 분석에 영향을 주는지 이해하는 것이 중요합니다. Tableau에서 수행하는 대부분의 작업과 마찬가지로 이 경우에도 방법이 둘 이상 있을 수 있습니다. 모든 다양한 옵션을 탐색하면 개념을 모아 최상의 솔루션을 선택할 수 있습니다.

사용된 계산:

참고: 이 자습서의 초기 영감을 제공한 Workout Wednesday 주제 Do Customers Spend More on Their First or Second Purchase?(고객이 첫 번째 또는 두 번째 구매에서 더 많은 소비를 합니까?)(링크가 새 창에서 열림)의 Ann Jackson과 Tableau Prep 팁 Returning the First and Second Purchase Dates(첫 번째 및 두 번째 구매 날짜 반환)(링크가 새 창에서 열림)의 Andy Kriebel에게 특별한 감사를 전합니다. 이러한 링크를 클릭하면 Tableau 웹 사이트 외부로 이동합니다. Tableau는 외부 공급자에 의해 유지 관리되는 페이지가 정확하며 최신 상태인지에 대해 책임을 지지 않습니다. 콘텐츠와 관련된 질문이 있는 경우 해당 소유자에게 문의하십시오.