Aggregationsfunktionen in Tableau

In diesem Artikel werden Aggregationsfunktionen sowie deren Nutzen in Tableau vorgestellt. Außerdem wird das Erstellen einer Aggregationsberechnung anhand eines Beispiels dargestellt .

Gründe für die Verwendung von Aggregationsfunktionen

Mithilfe von Aggregationsfunktionen können Sie die Granularität Ihrer Daten zusammenfassen oder ändern.

Beispielsweise möchten Sie möglicherweise wissen, wie viele Bestellungen Ihr Geschäft für ein bestimmtes Jahr genau verzeichnete. Sie können die COUNTD-Funktion verwenden, um die exakte Anzahl eindeutiger Bestellungen zu ermitteln, die Ihr Unternehmen hatte, und dann die Visualisierung nach dem Jahr aufschlüsseln.

Die Berechnung sieht in etwa so aus:

COUNTD(Order ID)

Die Visualisierung sieht in etwa so aus:

In Tableau verfügbare Aggregationsfunktionen

Aggregationen und Fließkommaarithmetik: Die Ergebnisse einiger Aggregationen entsprechen möglicherweise nicht immer genau den Erwartungen. Beispiel: Sie stellen fest, dass die SUM-Funktion einen Wert wie -1.42e-14 für eine Spalte von Zahlen zurück gibt, von der Sie jedoch wissen, dass deren Summe exakt 0 sein sollte. Der Grund hierfür ist, dass der Fließkommastandard 754 des Institute of Electrical and Electronics Engineers (IEEE) die Speicherung der Zahlen in einem Binärformat erfordert, was bedeutet, dass Zahlen manchmal mit extremer Präzision gerundet werden. Sie eliminieren diese mögliche Ablenkung mit der ROUND-Funktion (siehe Zahlenfunktionen) oder indem Sie die Zahl so formatieren, dass weniger Dezimalstellen angezeigt werden.

ATTR

SyntaxATTR(expression)
DefinitionGibt den Wert des Ausdrucks zurück, wenn für alle Zeilen ein einziger Wert vorliegt. Andernfalls wird ein Sternchen zurückgegeben. Null-Werte werden ignoriert.

AVG

SyntaxAVG(expression)
DefinitionGibt den Mittelwert aller Werte im Ausdruck zurück. Null-Werte werden ignoriert.
HinweiseAVG kann nur mit numerischen Feldern verwendet werden.

COLLECT

SyntaxCOLLECT(spatial)
DefinitionEine Aggregationsberechnung, bei der Werte im Argumentfeld kombiniert werden. Null-Werte werden ignoriert.
HinweiseCOLLECT kann nur mit räumlichen Feldern verwendet werden.

CORR

SyntaxCORR(expression1, expression2)
AusgabeZahl von -1 bis 1
DefinitionGibt den Pearson-Korrelationskoeffizienten von zwei Ausdrücken zurück.
Beispiel
example
Hinweise

Bei der Kennzahl der Pearson-Korrelation handelt es sich um eine lineare Beziehung zwischen zwei Variablen. Der Ergebnisbereich liegt zwischen -1 und +1 (einschließlich), wobei 1 eine exakte positive lineare Beziehung bezeichnet, 0 bedeutet, dass keine lineare Beziehung zwischen der Varianz besteht, und -1 eine exakte negative Beziehung bedeutet.

Das Quadrat eines CORR-Ergebnisses entspricht dem Bestimmtheitsmaß-Wert für ein lineares Trendlinienmodell. Weitere Informationen finden Sie unter Trendlinienmodell-Begriffe(Link wird in neuem Fenster geöffnet).

Verwendung mit tabellenbereichsbezogenen LOD-Ausdrücken:

Sie können CORR verwenden, um die Korrelation in einer disaggregierten Streuung mithilfe eines tabellenbereichsbezogenen Detailgenauigkeitsausdrucks(Link wird in neuem Fenster geöffnet) zu visualisieren. Beispiel:

{CORR(Sales, Profit)}

Die Korrelation wird mit einem Genauigkeitsausdruck über alle Reihen durchgeführt. Wenn Sie eine Formel wie z. B. CORR(Sales, Profit) verwendet haben (ohne die umschließenden Klammern, um daraus einen Genauigkeitsausdruck zu machen), sollte in der Ansicht eine Korrelation für jeden einzelnen Punkt im Streudiagramm mit jedem anderen Punkt dargestellt werden, der nicht definiert ist.

Datenbankseitige Einschränkungen

CORR ist mit den folgenden Datenquellen verfügbar: Tableau-Datenextrakte, Cloudera Hive, EXASolution, Firebird (Version 3.0 und höher), Google BigQuery, Hortonworks Hadoop Hive, IBM PDA (Netezza), Oracle, PostgreSQL, Presto, SybaseIQ, Teradata, Vertica.

Für andere Datenquellen können Sie entweder die Daten extrahieren oder WINDOW_CORR verwenden. Informationen dazu finden Sie unter Tabellenberechnungsfunktionen(Link wird in neuem Fenster geöffnet).

COUNT

SyntaxCOUNT(expression)
DefinitionGibt die Anzahl der Elemente zurück. Null-Werte werden nicht gezählt.

COUNTD

SyntaxCOUNTD(expression)
DefinitionGibt die Anzahl an eindeutigen Elementen in einer Gruppe zurück. Null-Werte werden nicht gezählt.

COVAR

SyntaxCOVAR(expression1, expression2)
DefinitionGibt die Stichprobenkovarianz von zwei Ausdrücken zurück.
Hinweise

Die Kovarianz beziffert, auf welche Weise sich zwei Variablen gemeinsam ändern. Eine positive Kovarianz gibt an, dass die Variablen die Tendenz aufweisen, sich in die gleiche Richtung zu bewegen, und im Schnitt weisen höhere Werte einer Variablen die Tendenz auf, den höheren Werten der anderen Variablen zu entsprechen. Die Stichprobenkovarianz verwendet zum Normalisieren der Kovarianzberechnung die Anzahl n – 1 an Datenpunkten, die nicht null sind, anstelle von n, das von der Populationskovarianz verwendet wird (mit der Funktion COVARP). Die Stichprobenkovarianz ist dann die richtige Wahl, wenn es sich bei den Daten um eine Zufallsstichprobe handelt, die zum Schätzen der Kovarianz für eine größere Population verwendet wird.

Wenn <expression1> und <expression2> identisch sind, z. B. COVAR([profit], [profit]), gibt COVAR einen Wert zurück, der angibt, wie weit Werte verteilt sind.

Der Wert von COVAR(X, X) entspricht dem Wert von VAR(X) sowie dem Wert von STDEV(X)^2.

Datenbankseitige Einschränkungen

COVAR ist mit den folgenden Datenquellen verfügbar: Tableau-Datenextrakte, Cloudera Hive, EXASolution, Firebird (Version 3.0 und höher), Google BigQuery, Hortonworks Hadoop Hive, IBM PDA (Netezza), Oracle, PostgreSQL, Presto, SybaseIQ, Teradata, Vertica.

Für andere Datenquellen können Sie entweder die Daten extrahieren oder WINDOW_COVAR verwenden. Informationen dazu finden Sie unter Tabellenberechnungsfunktionen(Link wird in neuem Fenster geöffnet).

COVARP

SyntaxCOVARP(expression 1, expression2)
DefinitionGibt die Populationskovarianz von zwei Ausdrücken zurück.
Hinweise

Die Kovarianz beziffert, auf welche Weise sich zwei Variablen gemeinsam ändern. Eine positive Kovarianz gibt an, dass die Variablen die Tendenz aufweisen, sich in die gleiche Richtung zu bewegen, und im Schnitt weisen höhere Werte einer Variablen die Tendenz auf, den höheren Werten der anderen Variablen zu entsprechen. Bei der Populationskovarianz handelt es sich um die Stichprobenkovarianz multipliziert mit (n–1)/n, wobei n für die Gesamtanzahl an Datenpunkten steht, die nicht null sind. Die Populationskovarianz ist die geeignete Wahl, wenn für alle gewünschten Elemente Daten vorhanden sind, im Gegensatz zu den Fällen, in denen nur eine zufällige Teilmenge an Elementen vorhanden ist. In solchen Fällen ist die Stichprobenkovarianz (mit der Funktion COVAR) die geeignete Wahl.

Wenn <expression1> und <expression2> identisch sind, z. B. COVARP([profit], [profit]), gibt COVARP einen Wert zurück, der angibt, wie weit Werte verteilt sind. Anmerkung: Der Wert von COVARP(X, X) entspricht dem Wert von VARP(X) sowie dem Wert von STDEVP(X)^2.

Datenbankseitige Einschränkungen

COVARP ist mit den folgenden Datenquellen verfügbar: Tableau-Datenextrakte, Cloudera Hive, EXASolution, Firebird (Version 3.0 und höher), Google BigQuery, Hortonworks Hadoop Hive, IBM PDA (Netezza), Oracle, PostgreSQL, Presto, SybaseIQ, Teradata, Vertica

Für andere Datenquellen können Sie entweder die Daten extrahieren oder WINDOW_COVAR verwenden. Informationen dazu finden Sie unter Tabellenberechnungsfunktionen(Link wird in neuem Fenster geöffnet).

MAX

SyntaxMAX(expression) oder MAX(expr1, expr2)
AusgabeGleicher Datentyp wie das Argument oder NULL , wenn ein Teil des Arguments null ist.
Definition

Gibt den Maximalwert der zwei Argumente zurück, die vom selben Datentyp sein müssen.

MAX kann auch auf ein einzelnes Feld als Aggregation angewendet werden.

Beispiel
MAX(4,7) = 7
MAX(#3/25/1986#, #2/20/2021#) = #2/20/2021#
MAX([Name]) = "Zander"
Hinweise

Für Zeichenfolgen

MAX ist normalerweise der Wert, der in alphabetischer Reihenfolge an letzter Stelle steht.

Bei Datenquellen einer Datenbank ist der Zeichenfolgenwert MAX in der Sortierfolge am höchsten und wird von der Datenbank für diese Spalte definiert.

Für Datumsangaben

Für Datumsangaben ist MAX das aktuellste Datum. Wenn MAX eine Aggregation ist, weist das Ergebnis keine Datumshierarchie auf. Wenn MAX ein Vergleich ist, behält das Ergebnis die Datumshierarchie bei.

Als Aggregation

MAX(expression) ist eine Aggregatfunktion und gibt ein einziges aggregiertes Ergebnis zurück. Dieses wird in der Visualisierung als AGG(expression) angezeigt.

Als Vergleich

MAX(expr1, expr2) vergleicht die beiden Werte und gibt einen Wert auf Zeilenebene zurück.

Siehe auch MIN.

MEDIAN

SyntaxMEDIAN(expression)
DefinitionGibt den Median eines Ausdrucks über alle Datensätze hinweg zurück. Null-Werte werden ignoriert.
HinweiseMEDIAN kann nur mit numerischen Feldern verwendet werden.
Datenbankseitige Einschränkungen

MEDIAN ist für die folgenden Datenquellen nicht verfügbar: Access, Amazon Redshift, Cloudera Hadoop, HP Vertica, IBM DB2, IBM PDA (Netezza), Microsoft SQL Server, MySQL, SAP HANA, Teradata.

Bei anderen Datenquellentypen können Sie Ihre Daten in eine Extraktdatei extrahieren, um diese Funktion zu nutzen. Informationen dazu finden Sie unter Extrahieren von Daten(Link wird in neuem Fenster geöffnet).

MIN

SyntaxMIN(expression) oder MIN(expr1, expr2)
AusgabeGleicher Datentyp wie das Argument oder NULL , wenn ein Teil des Arguments null ist.
Definition

Gibt den Minimalwert der zwei Argumente zurück, die vom selben Datentyp sein müssen.

MIN kann auch auf ein einzelnes Feld als Aggregation angewendet werden.

Beispiel
MIN(4,7) = 4
MIN(#3/25/1986#, #2/20/2021#) = #3/25/1986#
MIN([Name]) = "Abebi"
Hinweise

Für Zeichenfolgen

MIN ist normalerweise der Wert, der in alphabetischer Reihenfolge an erster Stelle steht.

Bei Datenquellen einer Datenbank ist der Zeichenfolgenwert MIN in der Sortierfolge am niedrigsten und wird von der Datenbank für diese Spalte definiert.

Für Datumsangaben

Für Datumsangaben ist MIN das früheste Datum. Wenn MIN eine Aggregation ist, weist das Ergebnis keine Datumshierarchie auf. Wenn MIN ein Vergleich ist, behält das Ergebnis die Datumshierarchie bei.

Als Aggregation

MIN(expression) ist eine Aggregatfunktion und gibt ein einziges aggregiertes Ergebnis zurück. Dieses wird in der Visualisierung als AGG(expression) angezeigt.

Als Vergleich

MIN(expr1, expr2) vergleicht die beiden Werte und gibt einen Wert auf Zeilenebene zurück.

Siehe auch MAX.

PERCENTILE

SyntaxPERCENTILE(expression, number)
DefinitionGibt den Wert des angegebenen Ausdrucks als Perzentil zurück, das der angegebenen Zahl (<number>) entspricht. Die Zahl (<number>) muss eine numerische Konstante zwischen 0 und 1 (einschließlich) sein.
Beispiel
PERCENTILE([Score], 0.9)
Datenbankseitige Einschränkungen

Diese Funktion ist für die folgenden Datenquellen verfügbar: Nicht-Legacy-Microsoft Excel- und Textdatei-Verbindungen, Extrakte und Datenquellen vom Typ "Nur-Extrakt" (z. B. Google Analytics, OData oder Salesforce), sowie Datenquellen der Versionen Sybase IQ 15.1 (und höher), Oracle 10 (und höher), Cloudera Hive und Hortonworks Hadoop Hive sowie EXASolution 4.2 (und höher).

Bei anderen Datenquellentypen können Sie Ihre Daten in eine Extraktdatei extrahieren, um diese Funktion zu nutzen. Informationen dazu finden Sie unter Extrahieren von Daten(Link wird in neuem Fenster geöffnet).

STDEV

SyntaxSTDEV(expression)
DefinitionGibt die statistische Standardabweichung aller Werte in einem Ausdruck basierend auf einer Stichprobe der Population zurück.

STDEVP

SyntaxSTDEVP(expression)
DefinitionGibt die statistische Standardabweichung aller Werte in einem Ausdruck basierend auf einer verzerrten Population zurück.

SUM

SyntaxSUM(expression)
DefinitionGibt die Summe aller Werte im Ausdruck zurück. Null-Werte werden ignoriert.
HinweiseSUM kann nur mit numerischen Feldern verwendet werden.

VAR

SyntaxVAR(expression)
DefinitionGibt die statistische Varianz aller Werte in einem Ausdruck basierend auf einer Stichprobe der Population zurück.

VARP

SyntaxVARP(expression)
DefinitionGibt die statistische Varianz aller Werte in einem Ausdruck basierend auf der Gesamtpopulation zurück.

Erstellen einer Aggregationsberechnung

Sehen Sie sich das Beispiel unten an, um mehr über das Erstellen einer Aggregationsberechnung zu erfahren.

  1. Stellen Sie in Tableau Desktop eine Verbindung zur standardmäßig in Tableau enthaltenen gespeicherten Datenquelle Beispiel – Superstore her.
  2. Navigieren Sie zu einem Arbeitsblatt, und wählen Sie Analyse > Berechnetes Feld erstellen aus.
  3. Gehen Sie in dem anschließend geöffneten Berechnungs-Editor wie folgt vor:
    • Geben Sie dem berechneten Feld den Namen Marge.
    • Geben Sie die folgende Formel ein:

      IIF(SUM([Sales]) !=0, SUM([Profit])/SUM([Sales]), 0)

      Hinweis: Sie können die Funktionsreferenz verwenden, um Aggregations- und andere Funktionen (wie die logische IIF-Funktion in diesem Beispiel) zu suchen und zur Berechnungsformel hinzuzufügen. Weitere Informationen finden Sie im Thema über das Verwenden der Funktionsreferenz im Berechnungs-Editor.

    • Klicken Sie auf OK, wenn Sie fertig sind.

    Das neue Feld mit der Aggregationsberechnung wird im Datumsfenster unter Kennzahlen angezeigt. Wie bei Ihren anderen Feldern ist die Verwendung in mindestens einer Visualisierung möglich.

    Hinweis: Bei Aggregationsberechnungen handelt es sich immer um Kennzahlen.

    Wenn Marge auf einem Container oder einer Karte im Arbeitsblatt platziert wird, wird der zugehörige Name in AGG(Marge) geändert. Dies gibt an, dass es sich hierbei um eine Aggregationsberechnung handelt und nicht weiter aggregiert werden kann.

    Eine Grafik, die zeigt, was passiert, wenn eine Aggregationsberechnung in einem Container abgelegt wird. Das Feld zeigt das AGG-Präfix an.

Regeln für Aggregationsberechnungen

Folgende Regeln gelten für Aggregationsberechnungen:

  • Für alle Aggregationsberechnungen gilt, dass Sie einen aggregierten Wert nicht mit einem disaggregierten Wert kombinieren können. Beispielsweise handelt es sich bei SUM(Price)*[Items] nicht um einen gültigen Ausdruck, da „SUM(Price)“ aggregiert ist, „Items“ jedoch nicht. Jedoch wären SUM(Price*Items) und SUM(Price)*SUM(Items) beide gültig.
  • Konstante Begriffe in einem Ausdruck fungieren je nach Bedarf als aggregierte oder disaggregierte Werte. Beispiel: SUM(Price*7) und SUM(Price)*7 sind gültige Ausdrücke.
  • Alle Funktionen können für aggregierte Werte ausgewertet werden. Die Argumente einer Funktion müssen jedoch entweder alle aggregiert oder alle disaggregiert sein. Beispiel: MAX(SUM(Sales),Profit) ist kein gültiger Ausdruck, weil „Sales“ aggregiert ist, „Profit“ jedoch nicht. MAX(SUM(Sales),SUM(Profit)) ist jedoch ein gültiger Ausdruck.
  • Das Ergebnis einer Aggregationberechnung ist immer eine Kennzahl. Hierzu gehören Ausdrücke wie ATTR(Dimension) oder MIN(Dimension).
  • Genau wie bei vordefinierten Aggregationen werden Aggregationsberechnungen für Gesamtsummen richtig berechnet. Weitere Informationen finden Sie unter "Gesamtsummen".

Siehe auch

Grundlegendes zu Berechnungen: Aggregationsberechnungen(Link wird in neuem Fenster geöffnet)

Datenaggregation in Tableau(Link wird in neuem Fenster geöffnet)

Funktionen in Tableau

Tableau-Funktionen (nach Kategorie)(Link wird in neuem Fenster geöffnet)

Tableau-Funktionen (alphabetisch)

Vielen Dank für Ihr Feedback!Ihr Feedback wurde erfolgreich übermittelt. Vielen Dank.