Tableau 中的資料彙總
在 Tableau 中,可以彙總度量或維度,儘管彙總度量更常見。每當您向檢視中新增度量時,預設情況下都會向該度量應用一個彙總。應用的彙總類型因檢視上下文而異。
變更檢視中的度量彙總
向檢視中新增度量時,Tableau 會自動對它的值進行彙總。常見的彙總包括總和、平均值和中值;有關完整清單,請參閱Tableau 中預定義彙總的清單。
當前彙總在檢視中顯示為度量名稱的一部分。例如, [Sales] 會變為 [SUM(Sales)] 。每個度量都有一個預設彙總,該彙總由 Tableau 在您連線到資料來源時設定。您可以查看或變更度量的預設彙總 — 請參閱為度量設定預設彙總。
可以使用 Tableau 只對關係資料來源進行度量彙總。多維資料來源包含已經彙總的資料。在 Tableau 中,只支援 Windows 中的多維資料來源。
您可以透過其上下文功能表來變更檢視中某個度量的彙總:
彙總維度
您可以採用 [最小值] 、 [最大值] 、 [計數] 或 [計數(不重複)] 的形式彙總檢視中的維度。當彙總維度時,將建立一個新的臨時度量欄,使維度實際具有度量的特徵。
檢視維度的另一種方法是透過從維度的內容功能表中選擇屬性將其視為屬性。 [屬性] 彙總有若干用途:
- 它可在混合多個資料來源時確保一致的詳細層級。
- 它可在計算表計算(需要彙總運算式)時提供一種彙總維度的方式。
- 由於已經過計算,因此可以提高查詢效能
Tableau 可使用以下公式來計算屬性:
IF MIN([dimension]) = MAX([dimension]) THEN
MIN([dimension]) ELSE "*" END
透過初始查詢檢索資料後,將在 Tableau 中對該公式進行計算。星號 (*) 實際上是存在多個值時產生的特殊類型空值的可視指示符。若要瞭解有關星號詳情,請參閱資料混合疑難排解(連結在新視窗開啟)。
以下是在表計算中使用屬性的範例。該表按市場、市場大小和州來顯示銷售額。假設您需要計算每個州的總銷售額占該市場銷售額的百分比。在新增將按州進行計算的 [總計百分比] 快速表計算(請參閱快速表計算(連結在新視窗開啟))時,將在紅色區域內進行計算。這是因為, [Market Size] (市場規模)維度會對資料進行分區。
在將 [Market Size] (市場規模)作為 [屬性] 進行彙總時,將在 [Market] (市場)(在下圖中為東部)內進行計算,並將 [Market Size] (市場規模)純粹作為標籤來使用。
Tableau 中預定義彙總的清單
有時,以彙總形式(例如總和或平均值)查看數字資料很有用。用來產生彙總資料的數學函數稱為彙總函式。彙總函式對一組值進行計算並返回單個值。例如,包含值 1, 2, 3, 3, 4 的某個度量經過求和彙總後返回單個值:13。或者,若您有 50 種產品的 3,000 筆銷售額交易,您可能想要檢視每種產品的銷售額總和,以確定哪些產品的收入最高。
附註:將浮點值與彙總結合使用有時會導致意外結果。有關詳情,請參閱瞭解計算中的資料類型(連結在新視窗開啟)。
Tableau 可提供一組預先定義的彙總,如表中所示。可以為任何不是本身包含彙總的計算欄位的度量設定預設彙總,例如 AVG([Discount])
。請參閱為度量設定預設彙總。還可以為檢視中已存在的欄位設定彙總。有關詳情,請參閱變更檢視中的度量彙總。
彙總 | 說明 | 包含 1、2、2、3 的度量的彙總結果 |
---|---|---|
屬性 | 如果組中所有列都只有單個值,則返回給定運算式的值,否則顯示星號 (*) 字元。會忽略 Null 值。此彙總在彙總維度時非常有用。要將檢視中的某個度量設定為此彙總,請以右鍵按一下(在 Mac 上,Control+按一下)該度量並選取 [屬性] 。此欄位隨後變更為顯示文字 ATTR: | * |
維度 | 返回度量或維度中的所有唯一值。 | 3 個值(1、2、3) |
總計 | 返回度量中數字的和。會忽略 Null 值。 | 1 個值 (8) |
平均值 | 傳回量值中數字的算術平均數。會忽略 Null 值。 | 1 個值 (2) |
計數(不重複) | 返回度量或維度中唯一值的個數。當應用於某個維度時,Tableau 建立一個新的臨時度量欄,因為計數的結果是一個數字。可對數位、日期、布林值和字串進行計數。所有情況下均忽略空值。 此彙總不適用於以下類型的工作簿:
若連線到使用其中一種類型的工作簿,則計數(相異)不可用,且 Tableau 會顯示訊息「需要擷取」。若要使用此彙總,請擷取您的資料。請參閱擷取資料。 | 1 個值 (3) |
最小值 | 返回度量或連續維度中的最小數字。會忽略 Null 值。 | 1 個值 (1) |
最大值 | 基於樣本總體返回度量或給定運算式中的最大值。會忽略 Null 值。若樣本中不為 Null 的成員少於 2 個,則傳回 Null。如果資料表示總體的樣本,可使用此函數。 | 1 個值 (3) |
標準差(總體) | 基於有偏差總體返回給定運算式中所有值的標準差。假定其參數由整個總體組成。此函數適用於較大的樣本大小。 | 1 個值 (0.7071) |
方差 | 基於樣本返回給定運算式中所有值的方差。會忽略 Null 值。如果非空樣本成員少於 2 個,則返回空值。如果資料表示總體的樣本,可使用此函數。 | 1 個值 (0.6667) |
方差(總體) | 基於有偏差總體返回給定運算式中所有值的方差。假定其參數由整個總體組成。此函數適用於較大的樣本大小。 | 1 個值 (0.5000) |
分解 | 返回基礎資料來源中的所有記錄。若要分解檢視中的所有度量,請從 [分析] 功能表中選取 [彙總度量] (以清除核取記號)。 Tableau 允許查看分解形式的資料(僅限關聯式資料庫)。資料分解後,可檢視資料來源的各個列。例如,知道橡皮筋的銷售總額為 $14,600,可能需要查看各筆銷售交易的金額分佈情況。要回答此問題,必須建立一個顯示各列資料的檢視。也就是說,必須分解資料(請參閱如何分解資料)。查看分解資料的另一種方法是查看整個或部分檢視的基礎資料。有關詳情,請參閱檢視基礎資料。 | 4 個值(1、2、2、3) |
也可以按照Tableau 中的彙總函式(連結在新視窗開啟) 中的說明定義自訂彙總。根據建立的資料檢視的類型,Tableau 會在適當的詳細資料層級套用這些彙總。例如,Tableau 會將彙總套用於單一維度成員(東部區域的平均交付時間)、指定維度中的所有成員(東部、西部和中部區域的平均交付時間)或維度群組(所有區域和所有市場的銷售額總和)。
為度量設定預設彙總
可以為任何不是本身包含彙總的計算欄位的度量設定預設彙總,例如 AVG([Discount])
。預設彙總是優先對連續或離散欄位進行匯總的計算。將度量拖到檢視中時,會自動使用預設彙總。
變更預設彙總:
在 [資料] 窗格中以右鍵按一下(在 Mac 上,Control+按一下)度量,並選取 [預設屬性] > [彙總] ,然後選取其中一個彙總選項。
附註:可以使用 Tableau 只對關係資料來源進行度量彙總。多維資料來源只包含彙總資料。
無法為已發佈資料來源設定預設彙總。預設彙總是在資料來源最初發佈時設定的。建立發佈的資料來源的本機複本(連結在新視窗開啟)以調整預設彙總。
如何分解資料
每當您向檢視中新增度量時,預設情況下都會向該度量應用一個彙總。此預設值透過 [分析] 功能表中的 [彙總度量] 設定進行控制。
若決定要在最詳細的粒度層級查看檢視中的所有標記,則可以分解檢視。分解資料意味著 Tableau 會為資料來源每一列中的每個資料值顯示單獨的標記。
分解檢視中的所有度量:
清除 [分析] > [彙總度量] 選項。若已選取,請按一下「彙總度量」一次,以取消選取。
選取「彙總度量」時,Tableau 預設會嘗試彙總檢視中的度量。資料來源中各個列值將在檢視的詳細資料層級彙總為單一值(單一標記)。
可用於度量的不同彙總確定單獨值的聚集方式:對這些值進行加總 (SUM)、求平均值 (AVG),或設定為單獨列值中的最大值 (MAX) 或最小值 (MIN)。
有關可用彙總的完整清單,請參閱Tableau 中預定義彙總的清單。
詳細層級由檢視中的維度確定 — 有關詳細層級的概念的資訊,請參閱維度會對檢視中的詳細層級產生怎樣的影響。
在分析您可能想要在檢視中獨立和非獨立使用的度量時,分解資料可能非常有用。例如,您可能正在使用一個軸上的參與者年齡對產品滿意度調查結果進行分析。可以彙總 [Age] (年齡)欄位以確定參與者平均年齡,或者分解資料以確定哪個年齡的參與者對產品最滿意。
以散點圖形式檢視資料時,分解資料會很有用。請參閱範例:散佈圖、彙總和粒度。
附註: 如果資料來源非常大,分解資料時可導致性能大幅下降。
範例:散佈圖、彙總和粒度
若您將一個度量放在「列」架上,並將另一個度量放在「欄」架上,則您是在要求 Tableau 比較兩個數值。通常,在這種情況下,Tableau 會選取散佈圖作為預設視覺化形式。初始檢視很可能是單一標記,顯示兩個度量的所有值的總和。這是因為您必須增加檢視中的詳細資料層級。
開始構建散佈圖
有多種方法可以向基本散佈圖新增詳細資料:可以使用維度新增詳細資料,可以向「列」和「欄」架新增更多欄位,或者可以分解資料。也可以使用這些選項的任意組合。本主題介紹這些備選方法,並使用 [Sample - Superstore] 資料來源。
若要建立初始檢視,請執行以下步驟:
將 [Sales] (銷售額)度量放在 [欄] 架上。
將 [Profit] (利潤)度量放在 [列] 架上。
度量自動彙總為總計。預設彙總 (SUM) 在欄位名稱中指示。工具提示中顯示的值是資料來源中每一列的銷售額和利潤總和。
請依照以下步驟使用維度為檢視新增詳細資料,並分解資料。
使用維度新增詳細資料
請依照下列步驟完善透過新增維度建立的散佈圖檢視,以顯示更多詳細資料層級。
將 [Category] (類別)維度拖到 [標記] 卡的 [色彩] 上。
這會將資料分隔成三種標記 - 每個維度成員一個標記 - 然後使用色彩對標記進行編碼。
將 [State] (州/省/市/自治區)維度拖到 [標記] 卡的 [詳細資料] 上。
現在檢視中有更多標記。標記數量等於資料來源中不同的州/省/市/自治區數乘以類別數。
儘管顯示更多標記,度量仍然是彙總的。因此,無論資料來源中是存在一個 State = North Dakota(州 = 北達科他州)且 Category= Furniture(類別= 家具)的列,還是 100 個這樣的列,結果始終是單一標記。
也許這個過程正在朝著您認為有用的方向完善檢視,或者您可能更喜歡朝不同的方向進行完善。一切都由您決定。
嘗試向 [列] 和 [欄] 架新增更多欄位
復原為原來的單標記檢視並按照這些步驟操作,透過向 [列] 和 [欄] 架新增欄位來完善散佈圖。
將 [State] (州/省/市/自治區)維度拖到 [欄] 架。
即使您將 [Continent] 放到 SUM(Sales) 的右側,Tableau 也會將其移到 SUM(Sales) 的左側。這是因為您無法在連續軸內插入維度。相反,您的檢視會為維度的每個成員顯示一個單獨的軸。
將 [Segment] (細分市場)維度拖到 [列] 架。
現在,您有了一個可提供跨州/省/市/自治區和客戶細分市場的銷售額與利潤概況的檢視。將游標暫留於檢視中的標記上以查看各個細分市場的工具提示資料可能會很有趣:
嘗試分解資料
另一種修改您原來的單標記散佈圖以顯示更多標記的方法是分解資料。
清除 [分析] > [彙總度量] 選項。若已選取,請按一下「彙總度量」一次,以取消選取。
您所做的是分解資料,因為此命令是最初選取的開關(存在核取標記)。Tableau 預設情況下會彙總檢視中的資料。
現在您會看到許多標記 - 原始資料來源中的每一列都有一個標記:
當您分解度量時,查看的將不再是資料來源中各列值的平均值或總和。相反,檢視會為資料來源中的每一列顯示一個標記。分解資料是檢視資料的整個表面區域的一種方法。這是瞭解資料形狀和識別離群點的快捷方式。在本例中,檢視顯示銷售額和利潤之間存在一致的關係,以四十五度角對齊的標記線表示。