Tableau 中的資料彙總
在 Tableau 中,您可以彙總度量或維度,儘管對度量進行彙總更為常見。每當您向檢視中新增度量時,預設情況下都會向該度量應用一個彙總。應用的彙總類型因檢視上下文而異。
變更檢視中的度量彙總
向檢視中新增度量時,Tableau 會自動對它的值進行彙總。常見的彙總包括總和、平均值和中值;有關完整清單,請參閱Tableau 中預定義彙總的清單。
當前彙總在檢視中顯示為度量名稱的一部分。例如, [Sales] 會變為 [SUM(Sales)] 。每個度量都有一個預設彙總,該彙總由 Tableau 在您連線到資料來源時設定。您可以查看或變更度量的預設彙總 — 請參閱為度量設定預設彙總。
可以使用 Tableau 只對關係資料來源進行度量彙總。多維資料來源包含已經彙總的資料。在 Tableau 中,只支援 Windows 中的多維資料來源。
您可以透過其上下文功能表來變更檢視中某個度量的彙總:
彙總維度
您可以採用 [最小值] 、 [最大值] 、 [計數] 或 [計數(不重複)] 的形式彙總檢視中的維度。當彙總維度時,將建立一個新的臨時度量欄,使維度實際具有度量的特徵。
附註:Microsoft Access 資料來源以及使用舊連線的 Microsoft Excel 和文字檔資料來源不支援 [計數(不重複)] 彙總。如果您連線到這些資料來源類型的其中一種, [計數(不同)] 彙總將不可用並顯示訊息 [需要擷取] 。如果將資料來源另存新檔為擷取,您將能夠使用 [計數(不重複)] 彙總。
查看維度的另一種方法是將其作為屬性處理。從維度上下文功能表中選取 [屬性] 來執行此操作。 [屬性] 彙總有若干用途:
它可在混合多個資料來源時確保一致的詳細層級。
它可在計算表計算(需要彙總運算式)時提供一種彙總維度的方式。
由於它是在本地計算的,因此可以提高查詢性能。
Tableau 可使用以下公式來計算屬性:
IF MIN([dimension]) = MAX([dimension]) THEN
MIN([dimension]) ELSE "*" END
透過初始查詢檢索資料後,將在 Tableau 中對該公式進行計算。星號 (*) 實際上是存在多個值時產生的特殊類型空值的可視指示符。若要瞭解有關星號詳情,請參閱資料混合疑難排解(連結在新視窗開啟)。
下面是在表計算中使用屬性的範例。該表按市場、市場大小和州來顯示銷售額。假設您需要計算每個州的總銷售額占該市場銷售額的百分比。在新增將按州進行計算的 [總額百分比] 快速表計算(請參閱快速表計算(連結在新視窗開啟))時,將在下面所示的紅色區域內進行計算。這是因為, [Market Size] (市場規模)維度會對資料進行分區。
在您將 [Market Size] (市場規模)作為 [屬性] 進行彙總時,將在 [Market] (市場)(在下圖中為 East)內進行計算,並在顯示中將 [Market Size] (市場規模)資訊純粹作為標籤來使用。
Tableau 中預定義彙總的清單
有時,查看數字型資料的彙總形式(如總和或平均值)非常有用。用來產生彙總資料的數學函數稱為彙總函式。彙總函式對一組值進行計算並返回單個值。例如,包含值 1, 2, 3, 3, 4 的某個度量經過求和彙總後返回單個值:13。或者,如果資料來源中含 50 種產品的 3000 筆銷售交易,則您可能希望查看每種產品的銷售總額,以確定哪些產品的收入最高。
可以使用 Tableau 只為關係資料來源中的度量設定彙總。多維資料來源只包含彙總資料。
附註:將浮點值與彙總結合使用有時可能會導致意外結果。有關詳情,請參閱瞭解計算中的資料類型(連結在新視窗開啟)。
Tableau 提供一組預定義彙總,如下表所示。可以為非計算欄位(本身包含彙總)的任何度量設定預設彙總,例如 AVG([Discount])
。請參閱為度量設定預設彙總。還可以為檢視中已存在的欄位設定彙總。有關詳情,請參閱變更檢視中的度量彙總。
彙總 | 說明 | 包含 1、2、2、3 的度量的彙總結果 |
---|---|---|
屬性 | 如果組中所有列都只有單個值,則返回給定運算式的值,否則顯示星號 (*) 字元。會忽略 Null 值。在對維度進行彙總時,此彙總尤其有用。要將檢視中的某個度量設定為此彙總,請以右鍵按一下(在 Mac 上,Control+按一下)該度量並選取 [屬性] 。此欄位隨後變更為顯示文字 ATTR: | 不可用 |
維度 | 返回度量或維度中的所有唯一值。 | 3 個值(1、2、3) |
總計 | 返回度量中數字的和。會忽略 Null 值。 | 1 個值 (8) |
平均值 | 傳回量值中數字的算術平均數。會忽略 Null 值。 | 1 個值 (4) |
計數(不重複) | 返回度量或維度中唯一值的個數。當應用於某個維度時,Tableau 建立一個新的臨時度量欄,因為計數的結果是一個數字。可對數位、日期、布林值和字串進行計數。所有情況下均忽略空值。 此彙總不適用於以下類型的工作簿:
如果您連線到使用其中一種類型的工作簿, [計數(不重複)] 將不可用,並且 Tableau 將顯示訊息 [ [需要擷取] 。若要使用此彙總,請擷取您的資料。請參閱擷取資料。 | 1 個值 (3) |
最小值 | 返回度量或連續維度中的最小數字。會忽略 Null 值。 | 1 個值 (1) |
最大值 | 基於樣本總體返回度量或給定運算式中的最大值。會忽略 Null 值。如果非空樣本成員少於 2 個,則返回空值。如果資料表示總體的樣本,可使用此函數。 | 1 個值 (3) |
標準差(總體) | 基於有偏差總體返回給定運算式中所有值的標準差。假定其參數由整個總體組成。此函數適用於較大的樣本大小。 | 1 個值 (0.7071) |
方差 | 基於樣本返回給定運算式中所有值的方差。會忽略 Null 值。如果非空樣本成員少於 2 個,則返回空值。如果資料表示總體的樣本,可使用此函數。 | 1 個值 (0.6667) |
方差(總體) | 基於有偏差總體返回給定運算式中所有值的方差。假定其參數由整個總體組成。此函數適用於較大的樣本大小。 | 1 個值 (0.5000) |
分解 | 返回基礎資料來源中的所有記錄。若要分解檢視中的所有度量,請從 [分析] 功能表中選取 [彙總度量] (以清除核取記號)。 Tableau 允許查看分解形式的資料(僅限關聯式資料庫)。資料分解後,可檢視資料來源中所有的列。例如,知道橡皮筋的銷售總額為 $14,600,可能需要查看各筆銷售交易的金額分佈情況。為了回答這個問題,需要建立檢視來顯示各列資料。也就是說,需要分解資料(請參閱如何分解資料)。查看分解資料的另一種方法是查看整個或部分檢視的基礎資料。有關詳情,請參閱檢視基礎資料。 | 4 個值(1、2、2、3) |
也可以按照Tableau 中的彙總函式(連結在新視窗開啟) 中的說明定義自訂彙總。根據建立的資料檢視類型,Tableau 將以相應的詳細層級應用這些彙總。例如,Tableau 將彙總應用於單個維度成員(East 地區平均交付時間)、某個給定維度的所有成員(East、West 和 Central 地區的平均交付時間)或維度組(所有地區和所有市場的銷售總額)。
為度量設定預設彙總
可以為非計算欄位(本身包含彙總)的任何度量設定預設彙總,例如 AVG([Discount])
。預設彙總是優先對連續或離散欄位進行匯總的計算。將度量拖到檢視中時,會自動使用預設彙總。
變更預設彙總:
在 [資料] 窗格中以右鍵按一下(在 Mac 上,Control+按一下)度量,並選取 [預設屬性] > [彙總] ,然後選取其中一個彙總選項。
附註:可以使用 Tableau 只對關係資料來源進行度量彙總。多維資料來源只包含彙總資料。
您無法為發佈的資料來源設定預設彙總。預設彙總是在資料來源最初發佈時設定的。建立發佈的資料來源的本機複本(連結在新視窗開啟)以調整預設彙總。
如何分解資料
每當您向檢視中新增度量時,預設情況下都會向該度量應用一個彙總。此預設值透過 [分析] 功能表中的 [彙總度量] 設定進行控制。
如果決定要以最詳細的資料粒度層級查看檢視中的所有標記,您可以對檢視進行分解。分解資料意味著 Tableau 將為資料來源每一列中的每個資料值顯示單獨標記。
分解檢視中的所有度量:
清除 [分析] > [彙總度量] 選項。如果已選中該選項,請按一下 [彙總度量] 一次將其取消選中。
如果 [彙總度量] 處於選中狀態,預設情況下 Tableau 將嘗試對檢視中的度量進行彙總。這意味著它會將資料來源中的各個列值聚集為針對檢視中的詳細層級調整的單一值(該值將變為單一標記)。
可用於度量的不同彙總確定單獨值的聚集方式:對這些值進行加總 (SUM)、求平均值 (AVG),或設定為單獨列值中的最大值 (MAX) 或最小值 (MIN)。
有關可用彙總的完整清單,請參閱Tableau 中預定義彙總的清單。
詳細層級由檢視中的維度確定 — 有關詳細層級的概念的資訊,請參閱維度會對檢視中的詳細層級產生怎樣的影響。
在分析您可能想要在檢視中獨立和非獨立使用的度量時,分解資料可能非常有用。例如,您可能正在使用一個軸上的參與者年齡對產品滿意度調查結果進行分析。可以彙總 [Age] (年齡)欄位以確定參與者平均年齡,或者分解資料以確定哪個年齡的參與者對產品最滿意。
在以散佈圖形式檢視資料時,分解資料可能很有用。請參閱範例:散佈圖、彙總和粒度。
附註: 如果資料來源非常大,分解資料時可導致性能大幅下降。
範例:散佈圖、彙總和粒度
如果您將一個度量放置在 [列] 架上,將另一個度量放置在 [欄] 架上,則表示您想要 Tableau 比較兩個數值。通常,在這種情況下,Tableau 會選取散佈圖作為預設視覺化形式。初始檢視最可能是一個標記,顯示兩個度量的所有值的匯總。這是因為您需要增加檢視中的詳細層級。
開始構建散佈圖
可透過多種方式向散佈圖中新增詳細資料:您可以使用維度新增詳細資料,可以向 [列] 和 [欄] 架新增額外的度量和/或維度,以便在檢視中建立多個單標記散佈圖,您也可以分解資料。並且,您也可以使用這些選項的任意組合。本主題介紹這些備選方法,並使用 [Sample - Superstore] 資料來源。
若要建立初始檢視,請執行以下步驟:
將 [Sales] (銷售額)度量放在 [欄] 架上。
將 [Profit] (利潤)度量放在 [列] 架上。
度量自動彙總為總計。預設彙總 (SUM) 在欄位名稱中指示。工具提示中顯示的值是資料來源中每一列的銷售額和利潤總和。
按照下面的步驟進行操作,使用維度向檢視中新增詳細資料以及分解資料。
使用維度新增詳細資料
按照這些步驟操作,透過新增維度以顯示更多詳細資料,來完善您建立的散佈圖。
將 [Category] (類別)維度拖到 [標記] 卡的 [色彩] 上。
這會將資料分隔成三種標記 - 每個維度成員一個標記 - 然後使用色彩對標記進行編碼。
將 [State] (州/省/市/自治區)維度拖到 [標記] 卡的 [詳細資料] 上。
現在檢視中有更多標記。標記數量等於資料來源中不同的州/省/市/自治區數乘以類別數。
儘管顯示更多標記,度量仍然是彙總的。因此,無論資料來源中是只存在一個 State = North Dakota、Category= Furniture 的列還是 100 個這樣的列,結果始終都是一個標記。
此過程可能會按您認為有用的方向形成檢視,或者您可能更願意轉向不同的方向 — 例如,透過向檢視中新增時間維度,或者透過引入趨勢線或預測。一切都由您決定。
嘗試向 [列] 和 [欄] 架新增更多欄位
復原為原來的單標記檢視並按照這些步驟操作,透過向 [列] 和 [欄] 架新增欄位來完善散佈圖。
將 [State] (州/省/市/自治區)維度拖到 [欄] 架。
即使您將 [Continent] 放到 SUM(Sales) 的右側,Tableau 也會將其移到 SUM(Sales) 的左側。這是因為您無法在連續軸內插入維度。相反,您的檢視會為維度的每個成員顯示一個單獨的軸。
將 [Segment] (細分市場)維度拖到 [列] 架。
現在,您有了一個可提供跨州/省/市/自治區和客戶細分市場的銷售額與利潤概況的檢視。將游標暫留於檢視中的標記上以查看各個細分市場的工具提示資料可能會很有趣:
嘗試分解資料
另一種修改您原來的單標記散佈圖以顯示更多標記的方法是分解資料。
清除 [分析] > [彙總度量] 選項。如果已選中該選項,請按一下 [彙總度量] 一次將其取消選中。
實際上您做的是分解資料,因為此命令會切換原來所選的選項(存在核取記號)。Tableau 預設情況下會彙總檢視中的資料。
現在您看到許多標記 -- 原始資料來源中的每一列分別有一個標記:
當您分解度量時,查看的將不再是資料來源中各列值的平均值或總和。相反,檢視會為資料來源中的每一列顯示一個標記。分解資料是檢視資料的整個表面區域的一種方法。這是瞭解資料形狀和識別離群點的快捷方式。這種情況下,分解資料將顯示,對於資料中的許多列,銷售收入和利潤之間存在一致的關係,呈 45 度角的標記線表明了這一點。