具有產生標記的預測模型

如果您使用 Tableau 有一段時間了,您可能聽說過「資料密集化」一詞。這指的是由 Tableau 產生標記並新增到檢視中的過程,即使基礎數據來源中的記錄不支援這些標記。這可能是為了延伸日期軸,或者如果您正在使用預測建模函數,以顯示預測。

觀看影片:有關資料密集化的深入討論,請查看 TC19 的簡報:《您對資料做了什麼?》深入了解插補資料和資料密集化

瞭解更多資訊:請參閱 Data Plus Science 部落格文章資料密集化

計算遺失數值的預測

例如,您也許想要新增未來日期的預測。預設情況下,Tableau 不會顯示缺少的值,但您可以按下列步驟生成這些標籤:

  1. 以右鍵按一下(在 Mac 上,Control + 按一下)日期或資料桶標題。

  2. 選擇 「Show Missing Values」(顯示遺失數值)

    選取「顯示缺失值」的膠囊上下文功能表

  3. 但這還不足以讓您預測這些生成的標記。如果您試著對它們執行計算(無論是否為預測計算),Tableau 將返回 null 值。 這正如預料,因為這些標記以不存在的遺失數值為基礎。

    若要預測這些值,請打開頂端「分析」 功能表,然後選擇「從遺失數值推斷屬性」

    具有選取「缺失值」的「Infer Properties」的分析功能表

    附註:預設設定是關閉「Infer Properties from Missing Values」(從遺失數值推斷屬性),即使開啟了「Show Missing Values」(顯示遺失數值)。 可以使用「Show Missing Values」(顯示遺失數值)展開的任何欄位或軸都可以套用此設定。

預測產生標記的範例

現在,讓我們進一步探討此行為。我們將比較三種不同的插圖,顯示「Show Missing Values」(顯示遺失數值)「Infer Properties from Missing Values」(從遺失數值推斷屬性)如何影響視覺化效果,而這取決於其中一個或兩個都已啟用或停用。 若要繼續作業,請從 Tableau Public 下載以下工作簿:預測遺失數值

我們已使用 ATTR(DAY([Order Date])) 作為預測變數來包含預測。這不是資料的最佳預測變數(並且產生預測不足),但基於本文的目的,它是「Infer Properties from Missing Values」(從遺失數值推斷屬性)的極佳例證。

每個視覺效果包括資料列架上同樣的四種度量,如下所示:

  • 第一行:SUM([Profit])
  • 第二行:RUNNING_SUM(SUM([Profit]))
  • 第三列:ATTR(DAY([Order Date]))
  • 第四行:MODEL_QUANTILE(0.5, SUM([Profit]),ATTR(DAY([Order Date])))

插圖 1

插圖 1

在上圖中,「Show Missing Values」(顯示遺失數值)「Infer Properties from Missing Values」(從遺失數值推斷屬性)都停用,這是 Tableau 的預設值。

如果「Infer Properties from Missing Values」(從遺失數值推斷屬性)啟用,「Show Missing Values」(顯示遺失數值)停用,你會看到同樣的視覺效果。這是因為「Infer Properties from Missing Values」(從遺失數值推斷屬性)取決於「Show Missing Values」(顯示遺失數值)是否啟用

插圖 2

插圖 2

在上圖中,「Show Missing Values」(顯示遺失數值)啟用而「Infer Properties from Missing Values」(從遺失數值推斷屬性)停用。 預設設定是關閉「Infer Properties from Missing Values」(從遺失數值推斷屬性),即使開啟了「Show Missing Values」(顯示遺失數值)

請注意,在此情況下,我們不為遺失數值(第 3 列)計算 ATTR 在 DAY([Order Date]) 的值。我為密集化的日期產生預測,但他們與所有遺失的日期相同,因為我們無法在第 3 列推斷實際的 ATTR(DAY([Order Date]))。實際上,這些標記的計算方式就如 DAY([Order Date]) 為 null。

插圖 3

插圖 3

在此影像中,「Show Missing Values」(顯示遺失數值)「Infer Properties from Missing Values」(從遺失數值推斷屬性)皆啟用,表現出「Infer Properties from Missing Values」(從遺失數值推斷屬性)的設定活動。

如您所見,由於我們能夠推斷 ATTR(DAY([Order Date]))(第 3 列),因此我們能在第 4 列的預測中使用,返回平滑的預測曲線。

感謝您的意見反應!已成功提交您的意見回饋。謝謝!