「資料詮釋」中的詮釋類型
每次在視覺化或儀表板中選擇新標記並執行「資料詮釋」時,Tableau 都會考慮該標記和工作簿中的基礎資料執行新的統計分析。會在「資料指南」窗格的可展開部分顯示可能的詮釋。有關「資料詮釋」如何分析和評估詮釋的資訊,請參閱資料詮釋如何運作。
探索基礎值
此部分列出了每個可以詮釋的度量(稱為目標度量)的詮釋。此處列出的每個詮釋都描述了與在分析標記上測試的目標量值的關係。運用您對資料在現實世界的實際理解來確定「資料詮釋」給出的關係是否有意義且值得探索。
基礎特徵
這些詮釋描述了檢視中標記的基礎記錄如何對所詮釋量值的彙總值做出貢獻。標記屬性可以包括極值、Null 值、記錄數或標記的平均值。
附註:有關詮釋中常用術語的定義,請見詮釋中的詮釋中的術語和概念(連結在新視窗開啟)。
極值
此詮釋類型指示一或多個記錄值是否明顯高於或低於大多數記錄。如果某個模型支持該詮釋,則表明極值正在影響被分析標記的目標量值。
當標記包含極值時,並不自動意味著其是異常或者您應將那些記錄排除在檢視之外。您需要根據分析作出自己的決定。詮釋只是指出標記中存在相關的極值。例如,它可以揭示記錄中誤輸入的值,比如香蕉花費 10 美元而不是 10 美分。或者,它可以揭示某個銷售員的季度銷售業績很好。
附註:此詮釋必須由作者啟用才能在已發佈工作簿的檢視模式下可見。有關詳情,請參閱控制資料詮釋的存取。
這個詮釋表示:
探索選項:
隨後的分析步驟:
| 在此範例中,租用 463 小時的單個極值導致總租用時間的總和高於預期的 613 小時。 這個值很高的可能原因是有人在歸還自行車時忘記將自行車停在適當的位置。在這種情況下,作者可能希望排除此值以供將來分析。
| |
可視化差異本區段顯示:
探索選項:
隨後的分析步驟:
| 在此範例中,排除極值 483 時,與檢視中的其他標記相比,分析標記不再那麼高。其他標記現在十分突出。作者可能想要探索其他標記,以考慮為什麼這些其他地點的自行車租賃時間更長。 |
Null 值
Null 值詮釋類型可顯示標記中缺失資料量高於預期的情況。其可表明目標度量值為 Null 的比例以及 Null 值可能如何影響該度量的彙總值。
這個詮釋表示:
探索選項:
隨後的分析步驟:
| 在此範例中,目標度量中的 Null 值百分比顯示為藍色圓圈。 |
記錄數
這種詮釋類型描述了基礎記錄的計數何時與總和相關。分析發現標記中彙總的記錄數量與標記的實際值之間存在關係。
雖然這看起來很明顯,但這種詮釋類型可幫助探索標記值是否受到其記錄中值的大小的影響,或者僅僅是因為分析標記中的記錄數。
這個詮釋表示:
探索選項:
隨後的分析步驟:
| 在此範例中,針對「本月騎乘」的每個值列出了「旅程距離」的記錄數,這是原始視覺化中的一個維度。八月的總行程距離值最高。 您可能會探索八月的行程距離值最高,是因為八月出現更多行程,還是因為某些行程時間更長,而具有最高的行程距離。 |
標記的平均值
這種詮釋類型描述了量值的平均值何時與總和相關。比較平均值是低還是高,或者記錄數是低還是高。
這個詮釋表示:
探索選項:
隨後的分析步驟:
| 在此範例中,八月的平均行程距離與大多數月份相比,並沒有顯著地高或低。這表示八月的旅程距離更高,因為八月的騎行次數更多,而不是人們乘坐的時間更長。 |
具有影響的單一值
使用此詮釋可了解構成分析標記的記錄值組成。
這種詮釋類型確定未視覺化維度中的單值何時可能對分析標記的彙總值有貢獻。未視覺化維度是資料來源中存在,但目前並未用於檢視中的維度。
此詮釋表示何時某個維度的每個基礎記錄具有相同的值,或者何時某個維度值因許多或少數記錄,對分析標記具有相同的單值而突出。
附註:有關詮釋中常用術語的定義,請見詮釋中的詮釋中的術語和概念(連結在新視窗開啟)。
這個詮釋表示:
探索選項:
隨後的分析步驟:
| 在此範例中,統計分析表示,許多遊樂設施來自 Back Bay 車站周邊地區。請注意,車站周邊地區是一個未視覺化的維度,它與來源視覺化基礎資料中的旅程距離有某種關係。 |
貢獻較多者
使用此詮釋查看佔已分析標記最大部分的值。
對於 COUNT 彙總,貢獻較多者可顯示具有最多記錄的維度值。對於 SUM,此詮釋可顯示具有最大部分總和的維度值。
具有影響的維度
使用此詮釋可了解構成分析標記的記錄值組成。
這種詮釋類型表示,未視覺化維度的分佈可能對分析標記的總值有貢獻。這種類型的詮釋是用於目標量值的總和、計數與平均值。未視覺化維度是資料來源中存在,但目前並未用於檢視中的維度。
附註:有關詮釋中常用術語的定義,請見詮釋中的詮釋中的術語和概念(連結在新視窗開啟)。
這個詮釋表示:
探索選項:
隨後的分析步驟:
| 在此範例中,統計分析顯示,與整體標記的搭乘次數相比,從南部車站和 MIT 搭乘的次數較多,從 Charles Circle 和 Kendall 搭乘的次數較少。 請注意,車站名稱是一個未視覺化的維度,它與來源視覺化基礎資料中的旅程距離有某種關係。 |
具有影響的度量
這種詮釋類型表示,未視覺化量值的平均值可能對分析標記的總值有貢獻。未視覺化量值是資料來源中存在,但目前並未用於檢視中的量值。
此詮釋可以顯示未視覺化量值與目標量值之間的線性或二次關係。
附註:有關詮釋中常用術語的定義,請見詮釋中的詮釋中的術語和概念(連結在新視窗開啟)。
這個詮釋表示:
探索選項:
隨後的分析步驟:
| 在此範例中,旅程距離高的一個可能原因是平均租用總時間也高。 |
要探索的其他內容︰
此部分顯示了分析標記獨特或不尋常的可能原因。這些詮釋:
- 不要詮釋為什麼這個標記的值就是這樣。
- 與來源視覺化中的量值沒有任何關係。
- 不考慮任何目標量值。
其他感興趣的維度
使用此詮釋可了解構成分析標記的記錄值組成。
與檢視中所有其他標記值分佈相比,分析標記中未視覺化維度分佈是不尋常的。未視覺化維度是資料來源中存在,但目前並未用於檢視中的維度。
附註:有關詮釋中常用術語的定義,請見詮釋中的詮釋中的術語和概念(連結在新視窗開啟)。
這個詮釋表示:
探索選項:
隨後的分析步驟:
| 在此範例中,很大比例的記錄與陰天天氣相關。因為資料是關於波士頓的自行車租賃,並且分析標記是八月的旅程距離,我們可以假設天氣和平常一樣溫暖潮濕。人們可能會在陰天更頻繁地租用自行車以避免炎熱。八月也可能有更多的陰天。 |