Aggregationsfunktionen in Tableau
In diesem Artikel werden Aggregationsfunktionen sowie deren Nutzen in Tableau vorgestellt. Außerdem wird das Erstellen einer Aggregationsberechnung anhand eines Beispiels dargestellt .
Gründe für die Verwendung von Aggregationsfunktionen
Mithilfe von Aggregationsfunktionen können Sie die Granularität Ihrer Daten zusammenfassen oder ändern.
Beispielsweise möchten Sie möglicherweise wissen, wie viele Bestellungen Ihr Geschäft für ein bestimmtes Jahr genau verzeichnete. Sie können die COUNTD-Funktion verwenden, um die exakte Anzahl eindeutiger Bestellungen zu ermitteln, die Ihr Unternehmen hatte, und dann die Visualisierung nach dem Jahr aufschlüsseln.
Die Berechnung sieht in etwa so aus:
COUNTD(Order ID)
Die Visualisierung sieht in etwa so aus:
In Tableau verfügbare Aggregationsfunktionen
Aggregationen und Fließkommaarithmetik: Die Ergebnisse einiger Aggregationen entsprechen möglicherweise nicht immer genau den Erwartungen. Beispiel: Sie stellen fest, dass die SUM-Funktion einen Wert wie -1.42e-14 für eine Spalte von Zahlen zurück gibt, von der Sie jedoch wissen, dass deren Summe exakt 0 sein sollte. Der Grund hierfür ist, dass der Fließkommastandard 754 des Institute of Electrical and Electronics Engineers (IEEE) die Speicherung der Zahlen in einem Binärformat erfordert, was bedeutet, dass Zahlen manchmal mit extremer Präzision gerundet werden. Sie eliminieren diese mögliche Ablenkung mit der ROUND-Funktion (siehe Zahlenfunktionen) oder indem Sie die Zahl so formatieren, dass weniger Dezimalstellen angezeigt werden.
ATTR
Syntax | ATTR(expression) |
Definition | Gibt den Wert des Ausdrucks zurück, wenn für alle Zeilen ein einziger Wert vorliegt. Andernfalls wird ein Sternchen zurückgegeben. Null-Werte werden ignoriert. |
AVG
Syntax | AVG(expression) |
Definition | Gibt den Mittelwert aller Werte im Ausdruck zurück. Null-Werte werden ignoriert. |
Hinweise | AVG kann nur mit numerischen Feldern verwendet werden. |
COLLECT
Syntax | COLLECT(spatial) |
Definition | Eine Aggregationsberechnung, bei der Werte im Argumentfeld kombiniert werden. Null-Werte werden ignoriert. |
Hinweise | COLLECT kann nur mit räumlichen Feldern verwendet werden. |
CORR
Syntax | CORR(expression1, expression2) |
Ausgabe | Zahl von -1 bis 1 |
Definition | Gibt den Pearson-Korrelationskoeffizienten von zwei Ausdrücken zurück. |
Beispiel | example |
Hinweise | Bei der Kennzahl der Pearson-Korrelation handelt es sich um eine lineare Beziehung zwischen zwei Variablen. Der Ergebnisbereich liegt zwischen -1 und +1 (einschließlich), wobei 1 eine exakte positive lineare Beziehung bezeichnet, 0 bedeutet, dass keine lineare Beziehung zwischen der Varianz besteht, und -1 eine exakte negative Beziehung bedeutet. Das Quadrat eines CORR-Ergebnisses entspricht dem Bestimmtheitsmaß-Wert für ein lineares Trendlinienmodell. Weitere Informationen finden Sie unter Trendlinienmodell-Begriffe(Link wird in neuem Fenster geöffnet). Verwendung mit tabellenbereichsbezogenen LOD-Ausdrücken: Sie können CORR verwenden, um die Korrelation in einer disaggregierten Streuung mithilfe eines tabellenbereichsbezogenen Detailgenauigkeitsausdrucks(Link wird in neuem Fenster geöffnet) zu visualisieren. Beispiel: {CORR(Sales, Profit)} Die Korrelation wird mit einem Genauigkeitsausdruck über alle Reihen durchgeführt. Wenn Sie eine Formel wie z. B. |
Datenbankseitige Einschränkungen |
Für andere Datenquellen können Sie entweder die Daten extrahieren oder |
COUNT
Syntax | COUNT(expression) |
Definition | Gibt die Anzahl der Elemente zurück. Null-Werte werden nicht gezählt. |
COUNTD
Syntax | COUNTD(expression) |
Definition | Gibt die Anzahl an eindeutigen Elementen in einer Gruppe zurück. Null-Werte werden nicht gezählt. |
COVAR
Syntax | COVAR(expression1, expression2) |
Definition | Gibt die Stichprobenkovarianz von zwei Ausdrücken zurück. |
Hinweise | Die Kovarianz beziffert, auf welche Weise sich zwei Variablen gemeinsam ändern. Eine positive Kovarianz gibt an, dass die Variablen die Tendenz aufweisen, sich in die gleiche Richtung zu bewegen, und im Schnitt weisen höhere Werte einer Variablen die Tendenz auf, den höheren Werten der anderen Variablen zu entsprechen. Die Stichprobenkovarianz verwendet zum Normalisieren der Kovarianzberechnung die Anzahl n – 1 an Datenpunkten, die nicht null sind, anstelle von n, das von der Populationskovarianz verwendet wird (mit der Funktion Wenn Der Wert von |
Datenbankseitige Einschränkungen |
Für andere Datenquellen können Sie entweder die Daten extrahieren oder |
COVARP
Syntax | COVARP(expression 1, expression2) |
Definition | Gibt die Populationskovarianz von zwei Ausdrücken zurück. |
Hinweise | Die Kovarianz beziffert, auf welche Weise sich zwei Variablen gemeinsam ändern. Eine positive Kovarianz gibt an, dass die Variablen die Tendenz aufweisen, sich in die gleiche Richtung zu bewegen, und im Schnitt weisen höhere Werte einer Variablen die Tendenz auf, den höheren Werten der anderen Variablen zu entsprechen. Bei der Populationskovarianz handelt es sich um die Stichprobenkovarianz multipliziert mit (n–1)/n, wobei n für die Gesamtanzahl an Datenpunkten steht, die nicht null sind. Die Populationskovarianz ist die geeignete Wahl, wenn für alle gewünschten Elemente Daten vorhanden sind, im Gegensatz zu den Fällen, in denen nur eine zufällige Teilmenge an Elementen vorhanden ist. In solchen Fällen ist die Stichprobenkovarianz (mit der Funktion Wenn |
Datenbankseitige Einschränkungen |
Für andere Datenquellen können Sie entweder die Daten extrahieren oder |
MAX
Syntax | MAX(expression) oder MAX(expr1, expr2) |
Ausgabe | Gleicher Datentyp wie das Argument oder NULL , wenn ein Teil des Arguments null ist. |
Definition | Gibt den Maximalwert der zwei Argumente zurück, die vom selben Datentyp sein müssen.
|
Beispiel | MAX(4,7) = 7 |
Hinweise | Für Zeichenfolgen
Bei Datenquellen einer Datenbank ist der Zeichenfolgenwert Für Datumsangaben Für Datumsangaben ist Als Aggregation
Als Vergleich
Siehe auch |
MEDIAN
Syntax | MEDIAN(expression) |
Definition | Gibt den Median eines Ausdrucks über alle Datensätze hinweg zurück. Null-Werte werden ignoriert. |
Hinweise | MEDIAN kann nur mit numerischen Feldern verwendet werden. |
Datenbankseitige Einschränkungen |
Bei anderen Datenquellentypen können Sie Ihre Daten in eine Extraktdatei extrahieren, um diese Funktion zu nutzen. Informationen dazu finden Sie unter Extrahieren von Daten(Link wird in neuem Fenster geöffnet). |
MIN
Syntax | MIN(expression) oder MIN(expr1, expr2) |
Ausgabe | Gleicher Datentyp wie das Argument oder NULL , wenn ein Teil des Arguments null ist. |
Definition | Gibt den Minimalwert der zwei Argumente zurück, die vom selben Datentyp sein müssen.
|
Beispiel | MIN(4,7) = 4 |
Hinweise | Für Zeichenfolgen
Bei Datenquellen einer Datenbank ist der Zeichenfolgenwert Für Datumsangaben Für Datumsangaben ist Als Aggregation
Als Vergleich
Siehe auch |
PERCENTILE
Syntax | PERCENTILE(expression, number) |
Definition | Gibt den Wert des angegebenen Ausdrucks als Perzentil zurück, das der angegebenen Zahl (<number> ) entspricht. Die Zahl (<number> ) muss eine numerische Konstante zwischen 0 und 1 (einschließlich) sein. |
Beispiel | PERCENTILE([Score], 0.9) |
Datenbankseitige Einschränkungen | Diese Funktion ist für die folgenden Datenquellen verfügbar: Nicht-Legacy-Microsoft Excel- und Textdatei-Verbindungen, Extrakte und Datenquellen vom Typ "Nur-Extrakt" (z. B. Google Analytics, OData oder Salesforce), sowie Datenquellen der Versionen Sybase IQ 15.1 (und höher), Oracle 10 (und höher), Cloudera Hive und Hortonworks Hadoop Hive sowie EXASolution 4.2 (und höher). Bei anderen Datenquellentypen können Sie Ihre Daten in eine Extraktdatei extrahieren, um diese Funktion zu nutzen. Informationen dazu finden Sie unter Extrahieren von Daten(Link wird in neuem Fenster geöffnet). |
STDEV
Syntax | STDEV(expression) |
Definition | Gibt die statistische Standardabweichung aller Werte in einem Ausdruck basierend auf einer Stichprobe der Population zurück. |
STDEVP
Syntax | STDEVP(expression) |
Definition | Gibt die statistische Standardabweichung aller Werte in einem Ausdruck basierend auf einer verzerrten Population zurück. |
SUM
Syntax | SUM(expression) |
Definition | Gibt die Summe aller Werte im Ausdruck zurück. Null-Werte werden ignoriert. |
Hinweise | SUM kann nur mit numerischen Feldern verwendet werden. |
VAR
Syntax | VAR(expression) |
Definition | Gibt die statistische Varianz aller Werte in einem Ausdruck basierend auf einer Stichprobe der Population zurück. |
VARP
Syntax | VARP(expression) |
Definition | Gibt die statistische Varianz aller Werte in einem Ausdruck basierend auf der Gesamtpopulation zurück. |
Erstellen einer Aggregationsberechnung
Sehen Sie sich das Beispiel unten an, um mehr über das Erstellen einer Aggregationsberechnung zu erfahren.
- Stellen Sie in Tableau Desktop eine Verbindung zur standardmäßig in Tableau enthaltenen gespeicherten Datenquelle Beispiel – Superstore her.
- Navigieren Sie zu einem Arbeitsblatt, und wählen Sie Analyse > Berechnetes Feld erstellen aus.
- Gehen Sie in dem anschließend geöffneten Berechnungs-Editor wie folgt vor:
- Geben Sie dem berechneten Feld den Namen Marge.
- Geben Sie die folgende Formel ein:
IIF(SUM([Sales]) !=0, SUM([Profit])/SUM([Sales]), 0)
Hinweis: Sie können die Funktionsreferenz verwenden, um Aggregations- und andere Funktionen (wie die logische IIF-Funktion in diesem Beispiel) zu suchen und zur Berechnungsformel hinzuzufügen. Weitere Informationen finden Sie im Thema über das Verwenden der Funktionsreferenz im Berechnungs-Editor.
- Klicken Sie auf OK, wenn Sie fertig sind.
Das neue Feld mit der Aggregationsberechnung wird im Datumsfenster unter Kennzahlen angezeigt. Wie bei Ihren anderen Feldern ist die Verwendung in mindestens einer Visualisierung möglich.
Hinweis: Bei Aggregationsberechnungen handelt es sich immer um Kennzahlen.
Wenn Marge auf einem Container oder einer Karte im Arbeitsblatt platziert wird, wird der zugehörige Name in AGG(Marge) geändert. Dies gibt an, dass es sich hierbei um eine Aggregationsberechnung handelt und nicht weiter aggregiert werden kann.
Regeln für Aggregationsberechnungen
Folgende Regeln gelten für Aggregationsberechnungen:
- Für alle Aggregationsberechnungen gilt, dass Sie einen aggregierten Wert nicht mit einem disaggregierten Wert kombinieren können. Beispielsweise handelt es sich bei
SUM(Price)*[Items]
nicht um einen gültigen Ausdruck, da „SUM(Price)“ aggregiert ist, „Items“ jedoch nicht. Jedoch wärenSUM(Price*Items)
undSUM(Price)*SUM(Items)
beide gültig. - Konstante Begriffe in einem Ausdruck fungieren je nach Bedarf als aggregierte oder disaggregierte Werte. Beispiel:
SUM(Price*7)
undSUM(Price)*7
sind gültige Ausdrücke. - Alle Funktionen können für aggregierte Werte ausgewertet werden. Die Argumente einer Funktion müssen jedoch entweder alle aggregiert oder alle disaggregiert sein. Beispiel:
MAX(SUM(Sales),Profit)
ist kein gültiger Ausdruck, weil „Sales“ aggregiert ist, „Profit“ jedoch nicht.MAX(SUM(Sales),SUM(Profit))
ist jedoch ein gültiger Ausdruck. - Das Ergebnis einer Aggregationberechnung ist immer eine Kennzahl. Hierzu gehören Ausdrücke wie ATTR(Dimension) oder MIN(Dimension).
- Genau wie bei vordefinierten Aggregationen werden Aggregationsberechnungen für Gesamtsummen richtig berechnet. Weitere Informationen finden Sie unter "Gesamtsummen".
Siehe auch
Grundlegendes zu Berechnungen: Aggregationsberechnungen(Link wird in neuem Fenster geöffnet)
Datenaggregation in Tableau(Link wird in neuem Fenster geöffnet)
Tableau-Funktionen (nach Kategorie)(Link wird in neuem Fenster geöffnet)