Tableau Desktop 中包含第二個日期的分析

這是教程的第二個階段,並且假定第一個階段使用 Tableau Prep 查找第二個日期已完成。

在第一個階段中,我們採用原始資料集並對其進行調整來回答以下問題:

  1. 每個駕駛員第一次和第二次違章相隔多長時間(以天數為單位)?

  2. 比較第一次和第二次違章的罰款金額。這些金額是否相關?

  3. 總體而言,哪個駕駛員支付的罰款最多?誰支付的最少?

  4. 有多少駕駛員有過多種類型的違章?

  5. 從未上過交通法規學習班的駕駛員的平均罰款金額是多少?

我們現在探討這些問題時,可以清晰地發現我們建立的第一個資料結構有一些優缺點。我們將返回到 Tableau Prep Builder 中並進行一些額外的重新調整,然後看看會對 Tableau Desktop 中同樣的分析產生怎樣的影響。最後,我們將探討 Tableau Desktop 獨有的將詳細資料層級 (LOD) 運算式與原始資料結合使用進行分析的方法。

本教程的目標是在一個真實場景的內容中呈現各種概念並演練各個選項 — 而不是規定式地確定哪一個是最好的。最後,您應該會對資料結構對計算和分析的影響有更深的認識,並更加熟悉 Tableau Prep 的各項功能以及 Tableau Desktop 中的計算。

附註:為完成本教程中的工作,您需要安裝 Tableau Prep Builder 並根據需要安裝 Tableau Desktop,並下載相關資料。

若要在繼續本教學課程之前安裝 Tableau Prep 和 Tableau Desktop,請參閱 Tableau Desktop 和 Tableau Prep 部署指南(連結在新視窗開啟)。否則,您可以下載 Tableau Prep(連結在新視窗開啟)Tableau Desktop(連結在新視窗開啟) 免費試用版。

資料集是在第一個階段中組建的 Driver Infractions.tflx 的輸出。

Tableau Desktop 中的分析

既然我們已經設定了資料,我們就將其引入 Tableau Desktop。我們可以輕鬆地回答一些問題,但其他問題會涉及一些(或很多)計算。請嘗試下面的問題;如果遇到困難,您可以展開每個問題來瞭解有關如何繼續的基本資訊。

附註:您可以下載工作簿 Driver Infractions.twbx(連結在新視窗開啟),在上下文中探討解決方案。請記住,可以透過一些替代方式來解讀分析或尋找答案。

1.每個駕駛員第一次和第二次違章相隔多長時間(以天數為單位)?
2.比較第一次和第二次違章的罰款金額。這些金額是否相關?
3.總體而言,哪個駕駛員支付的罰款最多?誰支付的最少?
4.有多少駕駛員有過多種類型的違章?
5.從未上過交通法規學習班的駕駛員的平均罰款金額是多少?

更進一步 — 樞紐的資料

儘管我們一直在處理的資料結構良好,可以解決與第一次和第二次違章特定相關的問題,但它並不是我們建議用於 Tableau Desktop 的標準結構。我們的分析背離與違章日期相關的基本問題越遠,用於將相關資訊合併為可用形式的計算就會變得越複雜。

通常,如果為同一類型的資料使用多個列存放資料(例如兩個列用於日期,兩個列用於罰款金額等),並且唯一的資訊存放在欄位名中(例如是第一次還是第二次違章),這就表明應該要對資料進行樞紐。

在 Tableau Prep Builder 中執行多重樞紐可以很好地處理此問題。我們可以從上一教程使用 Tableau Prep 查找第二個日期中建立的「Driver Infraction」(駕駛員違章)Tableau Prep 流程的結尾開始工作。

提示:請確保已返回 Tableau Prep,以進行後續步驟。

  1. 從最後的清理步驟中,新增一個「Pivot」(樞紐)步驟,該步驟將按每個重複的欄位進行樞紐。使用「樞紐的欄位」區域右上角的加號 圖示來新增更多「樞紐值」。每一組欄位(例如第一次和第二次罰款金額)應一起樞紐。

    有關樞紐的詳細資訊,請參閱清理和調整資料

  2. 在「樞紐的欄位」區域中的「Pivot1 Names」(樞紐 1 名稱)欄下,按兩下每個值,並將其重新命名為 1st 和 2nd。

    Tableau Prep 中的樞紐 1 設定窗格,顯示五個樞紐

透過移除 null 日期以及重命名欄位並對其進行重新排序,可以對結果進行整理。

  1. 在樞紐後面新增清理步驟。在「Infraction Date」(違章日期)欄中,以滑鼠右鍵按一下 null 條並選取「排除」

  2. 按兩下欄位名「Pivot1 Names」(樞紐 1 名稱),並將其重命名「Infraction Number」(違章次數)。

  3. 視情況而定拖動資料以按如下方式對其進行重新排序:

    已樞紐和已清理資料的預覽

  1. 依據新的樞紐的資料建立一個名為「Pivoted Driver Infractions」(樞紐的駕駛員違章)的輸出,並將其引入 Tableau Desktop。(在新增「輸出」步驟之後,不要忘記執行流程。)

現在,我們可以用這個樞紐的資料結構再次探討我們的五個問題;如果遇到困難,您可以展開每個問題來瞭解有關如何繼續操作的基本資訊。

附註:您可以下載完成的流程檔 Pivoted Driver Infractions.tflx 來檢查您的工作,或者下載工作簿 Pivoted Driver Infractions.twbx 在上下文中查看解決方案。請記住,可以透過一些替代方式來解讀分析或尋找答案。

1.每個駕駛員第一次和第二次違章相隔多長時間(以天數為單位)?
2.比較第一次和第二次違章的罰款金額。這些金額是否相關?
3.總體而言,哪個駕駛員支付的罰款最多?誰支付的最少?
4.有多少駕駛員有過多種類型的違章?
5.從未上過交通法規學習班的駕駛員的平均罰款金額是多少?

樞紐資料的優點

如果知道我們只需要回答可以使用教程中的原始資料結構輕鬆回答的問題,我們可以繼續使用該結構。不過,樞紐的資料格式更加靈活。即使它需要一些計算,但在計算就位之後,產生的資料集將非常適合於回答更廣泛的問題。

再進一步 — 只使用計算

若無法存取 Tableau Prep Builder,該怎麼辦?如果被迫使用原始資料,您是否完全不走運?根本不會!

Tableau Desktop 和 LOD 運算式可以回答所有分析問題。如果我們連線到原始的 Traffic Violations.xlsx(連結在新視窗開啟),它看起與已樞紐資料集非常相似 — 只是沒有重要的「Infraction Number」(違章次數)欄位。我們將需要透過 LOD 運算式類比彙總步驟的輸出。

附註:您可以下載工作簿 LOD Driver Infractions.twbx(連結在新視窗開啟),在上下文中探討解決方案。請記住,可以透過一些替代方式來解讀分析或尋找答案。

1.每個駕駛員第一次和第二次違章相隔多長時間(以天數為單位)?
2.比較第一次和第二次違章的罰款金額。這些金額是否相關?
3.總體而言,哪個駕駛員支付的罰款最多?誰支付的最少?
4.有多少駕駛員有過多種類型的違章?
5.從未上過交通法規學習班的駕駛員的平均罰款金額是多少?

請務必記住,此解決方案包含大量的嵌套計算和 LOD 運算式。視資料集的大小以及資料集的複雜性而定,可能會出現效能問題。

對各種方法的反思

那麼您應該採用哪種方法呢?這完全取決於您,並且工具任由您隨意使用。

  • 如果您想要避開 LOD,則可以使用資料調整解決方案,儘管對於某些分析(Tableau Desktop 中的分析)計算可能是必需的。

  • 如果您能夠調整資料並且熟悉計算(包括 LOD),則中間型選項可以提供最好的靈活性(更進一步 — 樞紐的資料)。

  • 如果您熟悉 LOD、對效能的影響較小,並且/或者您無法存取 Tableau Prep,則單獨使用 LOD 解決此問題是可行的選項(再進一步 — 只使用計算)。

至少,它對於瞭解 Tableau Prep 中的彙總和 Tableau Desktop 中的詳細資料層級運算式如何相互關聯以及會對資料分析產生怎樣的影響是有價值的。如同 Tableau 中的大多數功能一樣,執行任何操作的方法都有多種。探索各種各樣的選項可以幫助將概念聯係在一起,讓您能挑選最適合於自己的解決方案。

使用的計算:

附註:特別感謝 Ann Jackson 的 Workout Wednesday 主題 Do Customers Spend More on Their First or Second Purchase?(客戶在第一次或第二次購買時是否花費更多?)(連結在新視窗開啟)以及 Andy Kriebel 的 Tableau Prep 技巧 Returning the First and Second Purchase Dates(返回第一次和第二次購買日期)(連結在新視窗開啟),這些文章為本教程提供了最初的靈感。按一下這些連結會使您離開 Tableau 網站。Tableau 對於外部提供者所維護之頁面的準確性或新鮮度不擔負任何責任。如果您對內容有疑問,請聯絡其擁有者。