Tableau 中的彙總函式

本文介紹 Tableau 中的彙總函式及其用途。它還示範如何使用範例建立彙總計算。

為何使用彙總函式

彙總函式允許您進行匯總或變更資料的資料粒度。

例如,您可能想要準確知道您的商店在特定年度有多少訂單。您可以使用 COUNTD 函數對您的公司具有的準確訂單數進行匯總,然後按年對視覺效果進行細分。

計算可能如下所示:

COUNTD(Order ID)

視覺效果可能如下所示:

Tableau 中的可用彙總函式

彙總和浮點演算法:有些彙總的結果可能並非總是完全符合預期。例如,您可能發現 Sum 函數為一列數字的返回值為 -1.42e-14,此時您知道總和應該正好為 0。出現這種情況的原因是電氣電子工程師學會 (IEEE) 755 浮點標準要求使用二進位格式儲存數字,這意味著數字有時會以極高的精度層級舍入。您可以使用 ROUND 函數(請參閱數位函數)或者透過將數位格式設定為顯示較少小數位來消除這種潛在誤差。

ATTR

語法ATTR(expression)
定義如果它的所有列都有一個值,則返回該運算式的值。否則返回星號。會忽略 Null 值。

AVG

語法AVG(expression)
定義返回運算式中所有值的平均值。會忽略 Null 值。
說明AVG 只能用於數字欄位。

收集

語法COLLECT(spatial)
定義將參數欄位中的值組合在一起的彙總計算。會忽略 Null 值。
說明COLLECT 只能用於空間欄位。

CORR

語法CORR(expression1, expression2)
輸出從 -1 到 1 的數字
定義返回兩個運算式的皮爾森相關係數。
範例
example
說明

皮爾森相關係數衡量兩個變數之間的線性關係。結果範圍為 -1 至 +1(包括 -1 和 +1),其中 1 表示精確的正向線性關係,0 表示變異數之間沒有線性關係,而 −1 表示精確的反向關係。

CORR 結果的平方等於線性趨勢線模型的 R 平方值。請參閱趨勢線模型術語(連結在新視窗開啟)

與表範圍 LOD 運算式一起使用:

您可以使用 CORR 來視覺化分解散點中的關聯性 表範圍的詳細資料層級運算式(連結在新視窗開啟)。例如:

{CORR(Sales, Profit)}

借助詳細層級運算式,關聯將在所有列上執行。如果您使用像 CORR(Sales, Profit)(不帶兩邊的方括號可使其成為詳細層級運算式)這樣的公式,檢視將顯示散點圖中每個單獨的點與其他每個點(未定義)的關聯。

資料庫限制

CORR 適用於以下資料來源:Tableau 資料擷取、Cloudera Hive、EXASolution、Firebird(版本 3.0 及更高版本)、Google BigQuery、Hortonworks Hadoop Hive、IBM PDA (Netezza)、Oracle、PostgreSQL、Presto、SybaseIQ、Teradata、Vertica。

對於其他資料來源,請考慮擷取資料或使用 WINDOW_CORR。請參閱表計算函數(連結在新視窗開啟)

COUNT

語法COUNT(expression)
定義傳回項目數量。不對 Null 值計數。

COUNTD

語法COUNTD(expression)
定義返回群組中不同項目的數量。不對 Null 值計數。

COVAR

語法COVAR(expression1, expression2)
定義傳回兩個運算式的樣本共變異數。
說明

共變數對兩個變數的共同變化方式進行量化。正共變數指明兩個變數趨向於向同一方向移動,平均來說,即一個變數的較大值趨向於與另一個變數的較大值對應。樣本共變異數使用非空資料點的數量 n - 1 來規範化共變異數計算,而不是使用母體共變異數(可用於 COVARP 函數)所使用的 n。當資料是用於估算較大總體的共變數的隨機樣本時,則樣本共變數是合適的選取。

如果 <expression1><expression2> 相同 — 例如 COVAR([profit], [profit])COVAR 將傳回一個值,指明值分佈的廣泛程度。

COVAR(X, X) 的值等於 VAR(X) 的值,也等於 STDEV(X)^2 的值。

資料庫限制

COVAR 適用於以下資料來源:Tableau 資料擷取、Cloudera Hive、EXASolution、Firebird(版本 3.0 及更高版本)、Google BigQuery、Hortonworks Hadoop Hive、IBM PDA (Netezza)、Oracle、PostgreSQL、Presto、SybaseIQ、Teradata、Vertica。

對於其他資料來源,請考慮擷取資料或使用 WINDOW_COVAR。請參閱表計算函數(連結在新視窗開啟)

COVARP

語法COVARP(expression 1, expression2)
定義傳回兩個運算式的母體共變異數。
說明

共變數對兩個變數的共同變化方式進行量化。正共變數指明兩個變數趨向於向同一方向移動,平均來說,即一個變數的較大值趨向於與另一個變數的較大值對應。母體共變異數為樣本共變異數乘以 (n-1)/n,其中 n 是非 null 資料點的總數。如果存在可用於所有相關項目的資料,則母體共變異數是合適的選取,與之相反,在只有隨機項目子集的情況下,樣本共變異數(及 COVAR 函數)較為適合。

如果 <expression1><expression2> 相同 — 例如 COVARP([profit], [profit])COVARP 將傳回一個值,指明值分佈的廣泛程度。附註:COVARP(X, X) 附註:的值等於 VARP(X) 的值,也等於 STDEVP(X)^2 的值。

資料庫限制

COVARP 適用於以下資料來源:Tableau 資料擷取、Cloudera Hive、EXASolution、Firebird(版本 3.0 及更高版本)、Google BigQuery、Hortonworks Hadoop Hive、IBM PDA (Netezza)、Oracle、PostgreSQL、Presto、SybaseIQ、Teradata、Verez

對於其他資料來源,請考慮擷取資料或使用 WINDOW_COVAR。請參閱表計算函數(連結在新視窗開啟)

MAX

語法MAX(expression)MAX(expr1, expr2)
輸出與引數相同的資料類型,若引數的任何部分為 NULL,則為 NULL 
定義

傳回兩個引數中的最大值,這兩個引數必須具有相同的資料類型。

MAX 也可以作為彙總套用於單一欄位。

範例
MAX(4,7) = 7
MAX(#3/25/1986#, #2/20/2021#) = #2/20/2021#
MAX([Name]) = "Zander"
說明

對於字串

MAX 通常是按字母順序排在最後的值。

對於資料庫資料來源,MAX 字串值是資料庫為欄定義的排序順序中的最高值。

對於日期

對於日期,MAX 是最近的日期。如果 MAX 是彙總,結果不會有日期階層。如果 MAX 是比較,結果將保留日期階層。

作為彙總

MAX(expression) 為彙總函數,會傳回單一彙總結果。這在視覺效果中顯示為 AGG(expression)

作為比較

MAX(expr1, expr2) 會比較兩個值,並傳回一個列層級值。

另請參閱 MIN

MEDIAN

語法MEDIAN(expression)
定義返回運算式在所有記錄中的中位數。會忽略 Null 值。
說明MEDIAN 只能用於數字欄位。
資料庫限制

MEDIAN 適用於下列資料來源:Access、Amazon Redshift、Cloudera Hadoop、HP Vertica、IBM DB2、IBM PDA (Netezza)、Microsoft SQL Server、MySQL、SAP HANA、Teradata。

對於其他資料來源類型,可以將資料擷取到擷取檔案以使用此函數。請參閱擷取您的資料(連結在新視窗開啟)

MIN

語法MIN(expression)MIN(expr1, expr2)
輸出與引數相同的資料類型,若引數的任何部分為 NULL,則為 NULL 
定義

傳回兩個引數(必須為相同資料類型)的最小值。

MIN 也可以作為彙總套用於單一欄位。

範例
MIN(4,7) = 4
MIN(#3/25/1986#, #2/20/2021#) = #3/25/1986#
MIN([Name]) = "Abebi"
說明

對於字串

MIN 通常是按字母順序排列在最前面的值。

對於資料庫資料來源,MIN 字串值是資料庫為欄定義的排序順序中的最低值。

對於日期

對於日期,MIN 是最早的日期。如果 MIN 是彙總,結果不會有日期階層。如果 MIN 是比較,結果將保留日期階層。

作為彙總

MIN(expression) 為彙總函數,會傳回單一彙總結果。這在視覺效果中顯示為 AGG(expression)

作為比較

MIN(expr1, expr2) 會比較兩個值,並傳回一個列層級值。

另請參閱 MAX

PERCENTILE

語法PERCENTILE(expression, number)
定義從給定運算式傳回與指定 <number> 對應的百分位數值。<number> 必須介於 0 到 1 之間(含 0 和 1)並且必須是數字常數。
範例
PERCENTILE([Score], 0.9)
說明 
資料庫限制

此功能適用於以下資料來源:非舊版 Microsoft Excel 和文字檔案連線、擷取和僅擷取資料來源類型(例如 Google Analytics、OData 或 Salesforce)、Sybase IQ 15.1 及更高版本資料來源、Oracle 10 及更高版本的資料來源、Cloudera Hive 和Hortonworks Hadoop Hive 資料來源、EXASolution 4.2 及更高版本的資料來源。

對於其他資料來源類型,可以將資料擷取到擷取檔案以使用此函數。請參閱擷取您的資料(連結在新視窗開啟)

STDEV

語法STDEV(expression)
定義基於群體樣本返回給定運算式中所有值的統計標準差。

STDEVP

語法STDEVP(expression)
定義基於有偏差群體返回給定運算式中所有值的統計標準差。

SUM

語法SUM(expression)
定義返回運算式中所有值的總計。會忽略 Null 值。
說明SUM 只能用於數字欄位。

VAR

語法VAR(expression)
定義基於群體樣本返回給定運算式中所有值的統計變異數。

VARP

語法VARP(expression)
定義對整個群體返回給定運算式中所有值的統計變異數。

建立彙總計算

按照下面的步驟進行操作以瞭解如何建立彙總計算。

  1. 在 Tableau Desktop 中,連線到 Tableau 附帶的[範例 - 超級市場]已儲存資料來源。

  2. 巡覽到工作表,並選取 [分析] > [建立計算欄位]

  3. 在開啟的計算編輯器中,執行以下操作:

    • 將計算欄位命名為 [Margin] (利潤)

    • 輸入以下公式:

      IIF(SUM([Sales]) !=0, SUM([Profit])/SUM([Sales]), 0)

      附註:您可以使用函數引用來尋找彙總函式和其他函數(如此範例中的邏輯 IIF 函數),並將其新增到計算公式。有關詳情,請參閱在計算編輯器中使用函數引用

    • 完成後,按一下 [確定]

    新的彙總計算將出現在 [資料] 窗格中的 [度量] 下。就像其他欄位一樣,您可以在一個或多個視覺效果中使用該欄位。

    附註:彙總計算始終為度量。

    當將 [Margin] (利潤)放在工作表中的架或卡上時,它的名稱將變更為 [AGG(Margin)] ,表示它是彙總計算,並且無法進一步彙總。

    描述將會總計算放在架上時會發生什麼情況的圖形。該欄位顯示 AGG 首碼。

彙總計算的規則

適用于彙總計算的規則如下:

  • 任何彙總計算中不得同時包括彙總值和分解值。例如,SUM(Price)*[Items] 不是有效的運算式,因為 SUM(Price) 已彙總,而 Items 則沒有。不過,SUM(Price*Items) 和 SUM(Price)*SUM(Items) 均有效。

  • 運算式中的常量可根據情況充當彙總值或分解值。例如:SUM(Price*7) 和 SUM(Price)*7 均為有效的運算式。

  • 所有函數都可用彙總值進行計算。但是,任何給定函數的參數必須或者全部彙總,或者全部分解。例如:MAX(SUM(Sales),Profit) 不是有效的運算式,因為 Sales 已彙總,而 Profit 則沒有。不過,MAX(SUM(Sales),SUM(Profit)) 為有效的運算式。

  • 彙總計算的結果始終為度量。

  • 與預定義彙總一樣,彙總計算可正確地進行總計計算。有關詳情,請參閱 [總計] 。

另請參閱

瞭解計算:彙總計算(連結在新視窗開啟)

Tableau 中的資料彙總(連結在新視窗開啟)

Tableau 中的函數

Tableau 函數(按類別)(連結在新視窗開啟)

Tableau 函數(按字母順序)

感謝您的意見反應!已成功提交您的意見回饋。謝謝!