善加運用更深入的關係

由於關係的性質,瞭解欄位的來源、欄位的範圍以及 null 表示的內容比以往更加重要。請記住,任何人在檢視視覺效果時,若無法存取「資料來源」頁面或「資料」窗格,則需要依靠作者提供的標題或其他資訊來正確解譯視覺效果。

附註︰若對使用關係的資料來源背後的原理還不太了解,在深入探討本主題之前,請閱讀善加運用關係可能會有所幫助。

為什麼所有日期欄位不對等?

請務必記住,兩個欄位名稱中都包含「日期」一詞並不意味著這些欄位的內容相同。讓我們看一個與年份層級相關的範例。也就是說,我們不關注月和日的值,我們只關注欄位涉及的年份。

Bookshop 資料集中有多個欄位,其資料類型為「日期」。

  • 生日
  • 出版日期
  • 銷售日期
  • 「獲獎年份」和「建立年份」也包含日期資訊,雖然它們是數值欄位。
    • 附註︰若資料窗格中的圖示為綠色,則此欄位為連續欄位。右鍵按一下「資料」窗格中的欄位名稱,然後選擇「轉換為離散」(連結在新視窗開啟)。圖示應變為藍色。如有必要,請為「獲獎年份」和「建立年份」執行此動作。

但範圍(每個欄位中的值)卻不同。依次將每個欄位移至「列」架,並查看左下角的標記數,在移出下個欄位之前先移除每個欄位。

  • 年份(生日)有 27 個標記,表示該範圍包含 27 個不同的年份。
  • 年份([出版日期])有 15 個標記,因此其範圍為 15 年。
  • 獲獎年份有 11 個標記
  • 建立年份有 4 個標記
  • 年份([銷售日期])有 1 個標記

請務必牢記範圍中的差異。若我們將年份([出版日期])上的「版本和獎項」表與「獲將年份」建立關聯,我們最終可以使用內部聯結進行分析,從而將範圍縮減為獲獎的年份,這樣就可以刪除未獲獎的年份中的所有書籍。(請注意,這與篩選掉未獲獎的書籍不同。與獲獎書籍同年出版的未獲獎書籍會被保留。未獲獎年份中的所有書籍會被完全刪除。聯結中的篩選動作處於年份層級,而不是書籍層級。)

範例:出版日期和生日

若我們將出版日期移至欄,將生日移至列,我們會得到一個 Abc 表。您可以下載此工作簿並自行探索此表。(需要 Tableau Desktop 2020.2 或更高版本。)

Abc 只是一個預留位置,因為除了年份之外沒有其他資料。Tableau 沒有可用來做標記的值,但是 Abc 顯示了可以做標記的位置。

請注意,此表中有很多空格。出版年份 2180 和生日 2133 沒有預留位置。這表示出生於 2133 年的作者沒有在 2180 年出版書籍。

好吧。但是我們為什麼要在乎呢?

想像一下,您想隨著時間的推移進行一些分析。精裝本銷量是否隨著時間增長?您可以將您的圖表想像成一個時間表,該時間表將「格式」篩選為僅「精裝本」,並在列上顯示銷售(量),在欄上顯示日期。但是應使用哪個日期欄位呢?出版日期?生日?銷售日期?這些欄位的名稱很明確,所以,很明顯,若我們對銷售有疑問,應使用「銷售日期」。但是,並非所有資料集都有明確的名稱。若為類似「Date1」和「Date3」的欄位,則很難確定使用哪個欄位。特別是當我們未徹底地想清楚分析問題時。

欄位來自哪個表以及欄位的範圍表示的內容對分析有至關重要的影響。

透過變更日期欄位,我們可以完全變更分析。請考慮以下兩個視覺效果︰

第一個可以解譯為「每年出生的作者寫了多少本書?」。它可回答「年長的作者寫了更多的書嗎?」(否)或「哪個年份出生的作者最高產?」(2155 年)之類的問題。

第二個可以解譯為「每年出版了多少本書?」。它可回答「哪一年出版的書最多?」(2188 年)或「書籍出版是否隨著時間的推移而變得穩定?」(否)之類的問題。

若視覺效果使用生日欄位,則不適合提出這些問題,因為將這些概念組合在一起就是不合適的。但是 Tableau 不會對此作出評價,而是讓您提出自己喜歡的問題,無論您是有意為之還是無意為之。這是一個至關重要的要點。如果您在應該使用 Date1 時使用了 Date3,Tableau 會為您產生一個視覺效果。但並非所有日期欄位都有相同的功能,因此作者應知道使用哪個欄位進行正確的分析。

有關欄位來自哪個表之重要性的詳情,請檢視此部落格文章(連結在新視窗開啟)

資料缺失意味著什麼?

零和 null 是有區別的。

表示我們已進行測量,但沒有任何測量結果。我們知道該值,並且它為零。若我有零張超速罰單,則可能我超速不嚴重。

  • 附註︰0 和 1 通常可與 True/False 或其他二項式值(如是/否或成功/失敗)互換使用。在這種情況下,零被用作標籤,而不是數值。

Null 表示我們不知道:我們尚未測量或未記錄資料。若我的駕駛記錄上沒有關於超速罰單的任何記錄,則我們不知道我是否超速。

Null 可以表示資料缺失或資料不存在。

  • 對我的駕駛記錄而言,若超速罰單值為 null, 則我可能有未記錄的超速罰單。我們應認為該資料缺失。
  • 不存在的資料可以記錄為 N/A,但通常不會記錄,因為我們不需要追蹤不可能的事情。我坐公車時得到了多少張超速罰單?該資料可能不會存在於資料集中。在「交通方式」和「超速罰單」矩陣中,有些組合根本就沒有意義。我們可以認為該資料不存在。

當 null 帶有含義時

我們需要瞭解有關資料的知識,才能辨識 null 是否為真正的未知值(缺少關於超速罰單數量的資訊)或是否表示不存在的資料(缺少關於公車乘客得到的超速罰單數量的資料)。資料是否足夠可信,從而可以將缺乏資訊視為不存在的資料而不是缺失的資料?應用主題專業知識時,null 可能有意義。

讓我們再看一下 Abc 表,我們可以分析沒有預留位置的空格。我們假定此資料是可靠的,而 null 表示該資料不存在,而不是不完整。

缺少預留位置意味著作者出生於該年(因此該列存在),並且書籍在該年出版(因此該欄存在),但是出版的書籍不是由該年出生的作者所寫(因此儲存格為空)。我們可以以有意義的方式為該空格指派一個標籤:未出版任何內容。我們甚至可以對這些 null 進行分析-例如,鑒於資料中存在的日期,每位作者有多少年沒有出版書籍了?

附註:生日範圍中也有差異。沒有作者出生於 2131 年或 2132 年,因此年份範圍為從 2130 年到 2133 年(2131 年和 2132 年的列不存在)。這些缺失的年份可以解譯為「該資料集中沒有書籍的作者出生於這些年份」。但是,如上所述,在談論日期欄位的範圍時,範圍中有缺失值的事實是建立關係或選擇將哪個欄位用於視覺效果中標頭或軸時要考慮的重要資訊。

有關在關係中使用 null 的詳情,請參閱此部落格文章(連結在新視窗開啟)

動手練習

為每個視覺效果寫一個標題。您能用簡單的語言描述正在發生的事情嗎?下載工作簿,以探索即時視覺效果。(此工作簿使用的Bookshop 資料集版本略有調整,並且只使用了兩個表。日期欄位已經過調整,因此可以用作相關欄位。)

若要讀取視覺效果的矩陣: 

  • 長條圖顯示每年的版本數(紫色)和獎項數(綠色)。
  • 每欄對於軸有不同的日期欄位。左側的欄為「版本」表中的「出版年份」,中間的欄為「獎項」表中的「獲獎年份」,右側的欄為使用出版日期的計算欄位,但如果該欄位為 null,則使用「獲獎年份」(此計算用於確保兩個範圍可充分表示其內容)。
  • 每列代表不同的關係,顯示「獎項」和「版本」表的組合方式。頂端列與書籍 ID 上的表相關,中間列與年份上的表相關,底端列與書籍 ID 和年份上的表相關。
  • 2183 年的長條更粗,可以使比較更加容易。在下面的解決方案中,我們會詳細查看該年的值。
  • 請注意,兩個以陰影顯示的視覺效果具有相同的值。

如果遇到困難

請逐步瀏覽視覺效果的每個部分。查看資料來源結構、軸和標頭,以及用於標記的欄位(以及它們來自哪個表)。想想 null,以及為什麼它們可能在那裡。檢視一個或兩個特定標記的資料,以查看其包含的記錄。

  • 資料來源是與書籍 ID 上版本有關的獎項。
  • 日期軸為出版年份
  • 值為獎勵數和版本數。

嘗試在視覺效果中選擇一個標記並進行定義。對於 2183 年,視覺效果顯示有 7 個版本和 3 個獎項。使用檢視基礎資料來調查每個標記中表示的紀錄。

版本

獎項

組合在一起時,可以解譯為「退回 2183 年出版的 7 本書,然後為這些書列出它們獲得的任何獎項,無論何時獲得該獎項」。TM925 最初出版於 2179 年,精裝本在該年獲得了兩個獎項。在 2183 年,該書的不同版本出版,也許是平裝本。獎項數的值與書籍有關,而不是與年份有關。

因此總的來說,該視覺效果可以解譯為「每年出版的版本數量,以及該年出版的圖書獲得的獎項數量」或「每年出版的版本數量以及這些書籍獲得的獎項數量」。

動手練習的解決方案

2183 年(較粗的長條)是我們在解譯中關注的年份。有關版本的資訊為紫色,有關獎項的資訊為綠色。說明中還標出了 2187 年,因為在這一年中,沒有獲得任何獎項,但卻出版了書籍。因此,它很好地說明了哪個日期欄位用於該軸時有何作用。此細微差別在說明中以藍色表示。用於建立關係的欄位的重要性以粉紅色表示。

此視覺效果是為方便起見而提供的,但更好的體驗可能是下載工作簿,然後在 Tableau Desktop 2020.2 或更高版本中開啟,以便您可以使用工具提示和檢視資料等互動功能。如果您希望更仔細地查看試算表,則可以右鍵按一下底部的任一儀表板索引標籤,然後選擇「取消隱藏所有試算表」。這將使所有單獨的視覺效果可用,並且您可以從每個工作表中看到「資料」窗格和製作環境,包括哪些欄位位於哪些列架上。請注意,為取得三種不同的關係(上面矩陣的列),我們提供三個不同的資料來源。

相關資源

感覺有點不知所措,想返回上一步?請嘗試閱讀善加運用關係

準備好處理與關係有關的計算了嗎?請參閱善加運用計算關係

若要直接從產品管理團隊取得有關關係技術基礎的詳情,請參閱 Tableau 部落格上有關關係的系列文章。

另請參閱「動作分析」(連結在新視窗開啟)中有關關係的影片播客,例如 Tableau 為何發明關係?(連結在新視窗開啟)按一下內容庫(連結在新視窗開啟)中的「影片播客」以查看更多資訊。

感謝您的意見反應!已成功提交您的意見回饋。謝謝!