Aggregationsfunktionen in Tableau

Anwendungsbereich: Tableau Cloud, Tableau Desktop, Tableau Public, Tableau Server

In diesem Artikel werden Aggregationsfunktionen sowie deren Nutzen in Tableau vorgestellt. Außerdem wird das Erstellen einer Aggregationsberechnung anhand eines Beispiels dargestellt .

Gründe für die Verwendung von Aggregationsfunktionen

Mithilfe von Aggregationsfunktionen können Sie die Granularität Ihrer Daten zusammenfassen oder ändern.

Beispielsweise möchten Sie möglicherweise wissen, wie viele Bestellungen Ihr Geschäft für ein bestimmtes Jahr genau verzeichnete. Sie können die COUNTD-Funktion verwenden, um die exakte Anzahl eindeutiger Bestellungen zu ermitteln, die Ihr Unternehmen hatte, und dann die Visualisierung nach dem Jahr aufschlüsseln.

Die Berechnung sieht in etwa so aus:

COUNTD(Order ID)

Die Visualisierung sieht in etwa so aus:

In Tableau verfügbare Aggregationsfunktionen

Aggregationen und Fließkommaarithmetik: Die Ergebnisse einiger Aggregationen entsprechen möglicherweise nicht immer genau den Erwartungen. Beispiel: Sie stellen fest, dass die SUM-Funktion einen Wert wie -1.42e-14 für eine Spalte von Zahlen zurück gibt, von der Sie jedoch wissen, dass deren Summe exakt 0 sein sollte. Der Grund hierfür ist, dass der Fließkommastandard 754 des Institute of Electrical and Electronics Engineers (IEEE) die Speicherung der Zahlen in einem Binärformat erfordert, was bedeutet, dass Zahlen manchmal mit extremer Präzision gerundet werden. Sie eliminieren diese mögliche Ablenkung mit der ROUND-Funktion (siehe Zahlenfunktionen) oder indem Sie die Zahl so formatieren, dass weniger Dezimalstellen angezeigt werden.

ATTR

Syntax	`ATTR(expression)`
Definition	Gibt den Wert des Ausdrucks zurück, wenn für alle Zeilen ein einziger Wert vorliegt. Andernfalls wird ein Sternchen zurückgegeben. Null-Werte werden ignoriert.

AVG

Syntax	`AVG(expression)`
Definition	Gibt den Mittelwert aller Werte im Ausdruck zurück. Null-Werte werden ignoriert.
Hinweise	`AVG` kann nur mit numerischen Feldern verwendet werden.

COLLECT

Syntax	`COLLECT(spatial)`
Definition	Eine Aggregationsberechnung, bei der Werte im Argumentfeld kombiniert werden. Null-Werte werden ignoriert.
Hinweise	`COLLECT` kann nur mit räumlichen Feldern verwendet werden.

CORR

Syntax	`CORR(expression1, expression2)`
Ausgabe	Zahl von -1 bis 1
Definition	Gibt den Pearson-Korrelationskoeffizienten von zwei Ausdrücken zurück.
Beispiel	example
Hinweise	Bei der Kennzahl der Pearson-Korrelation handelt es sich um eine lineare Beziehung zwischen zwei Variablen. Der Ergebnisbereich liegt zwischen -1 und +1 (einschließlich), wobei 1 eine exakte positive lineare Beziehung bezeichnet, 0 bedeutet, dass keine lineare Beziehung zwischen der Varianz besteht, und -1 eine exakte negative Beziehung bedeutet. Das Quadrat eines CORR-Ergebnisses entspricht dem Bestimmtheitsmaß-Wert für ein lineares Trendlinienmodell. Weitere Informationen finden Sie unter Trendlinienmodell-Begriffe(Link wird in neuem Fenster geöffnet). Verwendung mit tabellenbereichsbezogenen LOD-Ausdrücken: Sie können CORR verwenden, um die Korrelation in einer disaggregierten Streuung mithilfe eines tabellenbereichsbezogenen Detailgenauigkeitsausdrucks(Link wird in neuem Fenster geöffnet) zu visualisieren. Beispiel: {CORR(Sales, Profit)} Die Korrelation wird mit einem Genauigkeitsausdruck über alle Reihen durchgeführt. Wenn Sie eine Formel wie z. B. `CORR(Sales, Profit)` verwendet haben (ohne die umschließenden Klammern, um daraus einen Genauigkeitsausdruck zu machen), sollte in der Ansicht eine Korrelation für jeden einzelnen Punkt im Streudiagramm mit jedem anderen Punkt dargestellt werden, der nicht definiert ist.
Datenbankseitige Einschränkungen	`CORR` ist mit den folgenden Datenquellen verfügbar: Tableau-Datenextrakte, Cloudera Hive, EXASolution, Firebird (Version 3.0 und höher), Google BigQuery, Hortonworks Hadoop Hive, IBM PDA (Netezza), Oracle, PostgreSQL, Presto, SybaseIQ, Teradata, Vertica. Für andere Datenquellen können Sie entweder die Daten extrahieren oder `WINDOW_CORR` verwenden. Informationen dazu finden Sie unter Tabellenberechnungsfunktionen(Link wird in neuem Fenster geöffnet).

COUNT

Syntax	`COUNT(expression)`
Definition	Gibt die Anzahl der Elemente zurück. Null-Werte werden nicht gezählt.

COUNTD

Syntax	`COUNTD(expression)`
Definition	Gibt die Anzahl an eindeutigen Elementen in einer Gruppe zurück. Null-Werte werden nicht gezählt.

COVAR

Syntax	`COVAR(expression1, expression2)`
Definition	Gibt die Stichprobenkovarianz von zwei Ausdrücken zurück.
Hinweise	Die Kovarianz beziffert, auf welche Weise sich zwei Variablen gemeinsam ändern. Eine positive Kovarianz gibt an, dass die Variablen die Tendenz aufweisen, sich in die gleiche Richtung zu bewegen, und im Schnitt weisen höhere Werte einer Variablen die Tendenz auf, den höheren Werten der anderen Variablen zu entsprechen. Die Stichprobenkovarianz verwendet zum Normalisieren der Kovarianzberechnung die Anzahl n – 1 an Datenpunkten, die nicht null sind, anstelle von n, das von der Populationskovarianz verwendet wird (mit der Funktion `COVARP`). Die Stichprobenkovarianz ist dann die richtige Wahl, wenn es sich bei den Daten um eine Zufallsstichprobe handelt, die zum Schätzen der Kovarianz für eine größere Population verwendet wird. Wenn `<expression1>` und `<expression2>` identisch sind, z. B. `COVAR([profit], [profit])`, gibt `COVAR` einen Wert zurück, der angibt, wie weit Werte verteilt sind. Der Wert von `COVAR(X, X)` entspricht dem Wert von `VAR(X)` sowie dem Wert von `STDEV(X)^2`.
Datenbankseitige Einschränkungen	`COVAR` ist mit den folgenden Datenquellen verfügbar: Tableau-Datenextrakte, Cloudera Hive, EXASolution, Firebird (Version 3.0 und höher), Google BigQuery, Hortonworks Hadoop Hive, IBM PDA (Netezza), Oracle, PostgreSQL, Presto, SybaseIQ, Teradata, Vertica. Für andere Datenquellen können Sie entweder die Daten extrahieren oder `WINDOW_COVAR` verwenden. Informationen dazu finden Sie unter Tabellenberechnungsfunktionen(Link wird in neuem Fenster geöffnet).

COVARP

Syntax	`COVARP(expression 1, expression2)`
Definition	Gibt die Populationskovarianz von zwei Ausdrücken zurück.
Hinweise	Die Kovarianz beziffert, auf welche Weise sich zwei Variablen gemeinsam ändern. Eine positive Kovarianz gibt an, dass die Variablen die Tendenz aufweisen, sich in die gleiche Richtung zu bewegen, und im Schnitt weisen höhere Werte einer Variablen die Tendenz auf, den höheren Werten der anderen Variablen zu entsprechen. Bei der Populationskovarianz handelt es sich um die Stichprobenkovarianz multipliziert mit (n–1)/n, wobei n für die Gesamtanzahl an Datenpunkten steht, die nicht null sind. Die Populationskovarianz ist die geeignete Wahl, wenn für alle gewünschten Elemente Daten vorhanden sind, im Gegensatz zu den Fällen, in denen nur eine zufällige Teilmenge an Elementen vorhanden ist. In solchen Fällen ist die Stichprobenkovarianz (mit der Funktion `COVAR`) die geeignete Wahl. Wenn `<expression1>` und `<expression2>` identisch sind, z. B. `COVARP([profit], [profit])`, gibt `COVARP` einen Wert zurück, der angibt, wie weit Werte verteilt sind. Anmerkung: Der Wert von `COVARP(X, X)` entspricht dem Wert von `VARP(X)` sowie dem Wert von `STDEVP(X)^2`.
Datenbankseitige Einschränkungen	`COVARP` ist mit den folgenden Datenquellen verfügbar: Tableau-Datenextrakte, Cloudera Hive, EXASolution, Firebird (Version 3.0 und höher), Google BigQuery, Hortonworks Hadoop Hive, IBM PDA (Netezza), Oracle, PostgreSQL, Presto, SybaseIQ, Teradata, Vertica Für andere Datenquellen können Sie entweder die Daten extrahieren oder `WINDOW_COVAR` verwenden. Informationen dazu finden Sie unter Tabellenberechnungsfunktionen(Link wird in neuem Fenster geöffnet).

MAX

Syntax	`MAX(expression)` oder `MAX(expr1, expr2)`
Ausgabe	Gleicher Datentyp wie das Argument oder `NULL` , wenn ein Teil des Arguments null ist.
Definition	Gibt den Maximalwert der zwei Argumente zurück, die vom selben Datentyp sein müssen. `MAX` kann auch auf ein einzelnes Feld als Aggregation angewendet werden.
Beispiel	MAX(4,7) = 7 MAX(#3/25/1986#, #2/20/2021#) = #2/20/2021# MAX([Name]) = "Zander"
Hinweise	Für Zeichenfolgen `MAX` ist normalerweise der Wert, der in alphabetischer Reihenfolge an letzter Stelle steht. Bei Datenquellen einer Datenbank ist der Zeichenfolgenwert `MAX` in der Sortierfolge am höchsten und wird von der Datenbank für diese Spalte definiert. Für Datumsangaben Für Datumsangaben ist `MAX` das aktuellste Datum. Wenn `MAX` eine Aggregation ist, weist das Ergebnis keine Datumshierarchie auf. Wenn `MAX` ein Vergleich ist, behält das Ergebnis die Datumshierarchie bei. Als Aggregation `MAX(expression)` ist eine Aggregatfunktion und gibt ein einziges aggregiertes Ergebnis zurück. Dieses wird in der Visualisierung als `AGG(expression)` angezeigt. Als Vergleich `MAX(expr1, expr2)` vergleicht die beiden Werte und gibt einen Wert auf Zeilenebene zurück. Siehe auch `MIN`.

MEDIAN

Syntax	`MEDIAN(expression)`
Definition	Gibt den Median eines Ausdrucks über alle Datensätze hinweg zurück. Null-Werte werden ignoriert.
Hinweise	`MEDIAN` kann nur mit numerischen Feldern verwendet werden.
Datenbankseitige Einschränkungen	`MEDIAN` ist für die folgenden Datenquellen nicht verfügbar: Access, Amazon Redshift, Cloudera Hadoop, HP Vertica, IBM DB2, IBM PDA (Netezza), Microsoft SQL Server, MySQL, SAP HANA, Teradata. Bei anderen Datenquellentypen können Sie Ihre Daten in eine Extraktdatei extrahieren, um diese Funktion zu nutzen. Informationen dazu finden Sie unter Extrahieren von Daten(Link wird in neuem Fenster geöffnet).

MIN

Syntax	`MIN(expression)` oder `MIN(expr1, expr2)`
Ausgabe	Gleicher Datentyp wie das Argument oder `NULL` , wenn ein Teil des Arguments null ist.
Definition	Gibt den Minimalwert der zwei Argumente zurück, die vom selben Datentyp sein müssen. `MIN` kann auch auf ein einzelnes Feld als Aggregation angewendet werden.
Beispiel	MIN(4,7) = 4 MIN(#3/25/1986#, #2/20/2021#) = #3/25/1986# MIN([Name]) = "Abebi"
Hinweise	Für Zeichenfolgen `MIN` ist normalerweise der Wert, der in alphabetischer Reihenfolge an erster Stelle steht. Bei Datenquellen einer Datenbank ist der Zeichenfolgenwert `MIN` in der Sortierfolge am niedrigsten und wird von der Datenbank für diese Spalte definiert. Für Datumsangaben Für Datumsangaben ist `MIN` das früheste Datum. Wenn `MIN` eine Aggregation ist, weist das Ergebnis keine Datumshierarchie auf. Wenn `MIN` ein Vergleich ist, behält das Ergebnis die Datumshierarchie bei. Als Aggregation `MIN(expression)` ist eine Aggregatfunktion und gibt ein einziges aggregiertes Ergebnis zurück. Dieses wird in der Visualisierung als `AGG(expression)` angezeigt. Als Vergleich `MIN(expr1, expr2)` vergleicht die beiden Werte und gibt einen Wert auf Zeilenebene zurück. Siehe auch `MAX`.

PERCENTILE

Syntax	`PERCENTILE(expression, number)`
Definition	Gibt den Wert des angegebenen Ausdrucks als Perzentil zurück, das der angegebenen Zahl (`<number>`) entspricht. Die Zahl (`<number>`) muss eine numerische Konstante zwischen 0 und 1 (einschließlich) sein.
Beispiel	PERCENTILE([Score], 0.9)
Datenbankseitige Einschränkungen	Diese Funktion ist für die folgenden Datenquellen verfügbar: Nicht-Legacy-Microsoft Excel- und Textdatei-Verbindungen, Extrakte und Datenquellen vom Typ "Nur-Extrakt" (z. B. Google Analytics, OData oder Salesforce), sowie Datenquellen der Versionen Sybase IQ 15.1 (und höher), Oracle 10 (und höher), Cloudera Hive und Hortonworks Hadoop Hive sowie EXASolution 4.2 (und höher). Bei anderen Datenquellentypen können Sie Ihre Daten in eine Extraktdatei extrahieren, um diese Funktion zu nutzen. Informationen dazu finden Sie unter Extrahieren von Daten(Link wird in neuem Fenster geöffnet).

STDEV

Syntax	`STDEV(expression)`
Definition	Gibt die statistische Standardabweichung aller Werte in einem Ausdruck basierend auf einer Stichprobe der Population zurück.

STDEVP

Syntax	`STDEVP(expression)`
Definition	Gibt die statistische Standardabweichung aller Werte in einem Ausdruck basierend auf einer verzerrten Population zurück.

SUM

Syntax	`SUM(expression)`
Definition	Gibt die Summe aller Werte im Ausdruck zurück. Null-Werte werden ignoriert.
Hinweise	`SUM` kann nur mit numerischen Feldern verwendet werden.

VAR

Syntax	`VAR(expression)`
Definition	Gibt die statistische Varianz aller Werte in einem Ausdruck basierend auf einer Stichprobe der Population zurück.

VARP

Syntax	`VARP(expression)`
Definition	Gibt die statistische Varianz aller Werte in einem Ausdruck basierend auf der Gesamtpopulation zurück.

Erstellen einer Aggregationsberechnung

Sehen Sie sich das Beispiel unten an, um mehr über das Erstellen einer Aggregationsberechnung zu erfahren.

Stellen Sie in Tableau Desktop eine Verbindung zur standardmäßig in Tableau enthaltenen gespeicherten Datenquelle Beispiel – Superstore her.
Navigieren Sie zu einem Arbeitsblatt, und wählen Sie Analyse > Berechnetes Feld erstellen aus.
Gehen Sie in dem Berechnungs-Editor, der daraufhin geöffnet wird, wie folgt vor:
- Geben Sie dem berechneten Feld den Namen Marge.
- Geben Sie die folgende Formel ein:
  IIF(SUM([Sales]) !=0, SUM([Profit])/SUM([Sales]), 0)
  Hinweis: Sie können die Funktionsreferenz verwenden, um Aggregations- und andere Funktionen (wie die logische IIF-Funktion in diesem Beispiel) zu suchen und zur Berechnungsformel hinzuzufügen. Weitere Informationen finden Sie im Thema über das Verwenden der Funktionsreferenz im Berechnungs-Editor.
- Klicken Sie auf OK, wenn Sie fertig sind.
Das neue Feld mit der Aggregationsberechnung wird im Datumsfenster unter Kennzahlen angezeigt. Wie bei Ihren anderen Feldern ist die Verwendung in mindestens einer Visualisierung möglich.
Hinweis: Bei Aggregationsberechnungen handelt es sich immer um Kennzahlen.
Wenn Marge auf einem Container oder einer Karte im Arbeitsblatt platziert wird, wird der zugehörige Name in AGG(Marge) geändert. Dies gibt an, dass es sich hierbei um eine Aggregationsberechnung handelt und nicht weiter aggregiert werden kann.

Regeln für Aggregationsberechnungen

Folgende Regeln gelten für Aggregationsberechnungen:

Für alle Aggregationsberechnungen gilt, dass Sie einen aggregierten Wert nicht mit einem disaggregierten Wert kombinieren können. Beispielsweise handelt es sich bei SUM(Price)*[Items] nicht um einen gültigen Ausdruck, da „SUM(Price)“ aggregiert ist, „Items“ jedoch nicht. Jedoch wären SUM(Price*Items) und SUM(Price)*SUM(Items) beide gültig.
Konstante Begriffe in einem Ausdruck fungieren je nach Bedarf als aggregierte oder disaggregierte Werte. Beispiel: SUM(Price*7) und SUM(Price)*7 sind gültige Ausdrücke.
Alle Funktionen können für aggregierte Werte ausgewertet werden. Die Argumente einer Funktion müssen jedoch entweder alle aggregiert oder alle disaggregiert sein. Beispiel: MAX(SUM(Sales),Profit) ist kein gültiger Ausdruck, weil „Sales“ aggregiert ist, „Profit“ jedoch nicht. MAX(SUM(Sales),SUM(Profit)) ist jedoch ein gültiger Ausdruck.
Das Ergebnis einer Aggregationberechnung ist immer eine Kennzahl. Hierzu gehören Ausdrücke wie ATTR(Dimension) oder MIN(Dimension).
Genau wie bei vordefinierten Aggregationen werden Aggregationsberechnungen für Gesamtsummen richtig berechnet. Weitere Informationen finden Sie unter "Gesamtsummen".