Aggregaatfuncties in Tableau

Dit artikel introduceert aggregaatfuncties en hun gebruik in Tableau. Het laat ook zien hoe u een geaggregeerde berekening kunt maken aan de hand van een voorbeeld.

Aggregaatfuncties gebruiken

Met aggregaatfuncties kunt u de granulariteit van uw data samenvatten of wijzigen.

Misschien wilt u bijvoorbeeld precies weten hoeveel bestellingen uw winkel in een bepaald jaar heeft ontvangen. U kunt de functie COUNTD gebruiken om het exacte aantal bestellingen van uw bedrijf te verkrijgen en de visualisatie vervolgens op te splitsen per jaar.

De berekening zou er ongeveer als volgt uitzien:

COUNTD(Order ID)

De visualisatie zou er ongeveer als volgt uitzien:

Aggregaatfuncties in Tableau

Aggregaties en drijvende-kommaberekeningen: soms zijn de resultaten van aggregaties niet precies zoals verwacht. Het kan bijvoorbeeld zijn dat de functie SUM een waarde als -1,42e-14 retourneert voor een kolom met getallen waarvan u weet dat de som precies 0 moet zijn. Dit gebeurt omdat getallen volgens de drijvendekommanorm 754 van het Institute of Electrical and Electronics Engineers (IEEE) in binaire notatie moeten worden opgeslagen, wat betekent dat getallen soms met extreem fijne precisie worden afgerond. U kunt deze potentiële afleiding elimineren door de functie ROUND te gebruiken (zie Getalfuncties) of door een notatie met minder decimalen te gebruiken.

ATTR

SyntaxisATTR(expression)
DefinitieRetourneert de waarde van de expressie als deze een enkele waarde heeft voor alle rijen. Anders wordt een asterisk geretourneerd. Nullwaarden worden genegeerd.

AVG

SyntaxisAVG(expression)
DefinitieRetourneert het gemiddelde van alle waarden in de expressie. Nullwaarden worden genegeerd.
OpmerkingenAVG kan alleen worden gebruikt met numerieke velden.

COLLECT

SyntaxisCOLLECT(spatial)
DefinitieEen geaggregeerde berekening die de waarden in het argumentveld combineert. Nullwaarden worden genegeerd.
OpmerkingenCOLLECT kan alleen worden gebruikt met ruimtelijke velden.

CORR

SyntaxisCORR(expression1, expression2)
UitvoerGetal van -1 tot 1
DefinitieRetourneert de coëfficiënt voor Pearson-correlatie van twee expressies.
Voorbeeld
example
Opmerkingen

De Pearson-correlatie meet de lineaire relatie tussen twee variabelen. De resultaten variëren van -1 tot en met 1, waarbij 1 staat voor een exact positief lineair verband, 0 voor geen lineair verband tussen de variantie en -1 voor een exact negatief verband.

Het kwadraat van een CORR-resultaat is gelijk aan de R-kwadraatwaarde voor een lineair trendlijnmodel. Zie Voorwaarden voor trendlijnmodel(Link wordt in een nieuw venster geopend).

Gebruik met LOD-expressies met tabelbereik:

U kunt CORR gebruiken om de correlatie in een uitgesplitste spreiding te visualiseren met gebruik van Tabelgerichte LOD-expressies(Link wordt in een nieuw venster geopend). Bijvoorbeeld:

{CORR(Sales, Profit)}

Met een expressie op detailniveau wordt de correlatie over alle rijen uitgevoerd. Als u een formule als deze gebruikt CORR(Sales, Profit) (zonder de omringende haakjes om er een expressie op detailniveau van te maken), zou de weergave de correlatie van elk afzonderlijk punt in de spreidingsdiagram met elk ander punt weergeven, wat ongedefinieerd is.

Beperkingen voor database

CORR is beschikbaar met de volgende databronnen: Tableau-data-extracten, Cloudera Hive, EXASolution, Firebird (versie 3.0 en later), Google BigQuery, Hortonworks Hadoop Hive, IBM PDA (Netezza), Oracle, PostgreSQL, Presto, SybaseIQ, Teradata en Vertica.

Voor andere databronnen kunt u overwegen de data te extraheren of WINDOW_CORR te gebruiken. Zie Tabelberekeningsfuncties(Link wordt in een nieuw venster geopend).

COUNT

SyntaxisCOUNT(expression)
DefinitieRetourneert het aantal items. Nullwaarden worden niet geteld.

COUNTD

SyntaxisCOUNTD(expression)
DefinitieRetourneert het aantal afzonderlijke items in een groep. Nullwaarden worden niet geteld.

COVAR

SyntaxisCOVAR(expression1, expression2)
DefinitieRetourneert een voorbeeld van een covariantie van twee expressies.
Opmerkingen

Covariantie kwantificeert hoe twee variabelen samen veranderen. Een positieve covariantie geeft aan dat de variabelen de neiging hebben om in dezelfde richting te bewegen. Dit is bijvoorbeeld het geval wanneer grotere waarden van de ene variabele gemiddeld overeenkomen met grotere waarden van de andere variabele. Steekproefcovariantie gebruikt het aantal niet-nietige datapunten n - 1 om de berekening van de covariantie te normaliseren, in plaats van n. N wordt gebruikt door de populatiecovariantie (beschikbaar met de functie COVARP). Steekproefcovariantie is de juiste keuze wanneer de data een willekeurige steekproef zijn die wordt gebruikt om de covariantie voor een grotere populatie te schatten.

Als <expression1> en <expression2> hetzelfde zijn, bijvoorbeeld COVAR([profit], [profit]), COVAR retourneert een waarde die aangeeft hoe breed de waarden verdeeld zijn.

De waarde van COVAR(X, X) is gelijk aan de waarde van VAR(X) en ook de waarde van STDEV(X)^2.

Beperkingen voor database

COVAR is beschikbaar met de volgende databronnen: Tableau-data-extracten, Cloudera Hive, EXASolution, Firebird (versie 3.0 en later), Google BigQuery, Hortonworks Hadoop Hive, IBM PDA (Netezza), Oracle, PostgreSQL, Presto, SybaseIQ, Teradata en Vertica.

Voor andere databronnen kunt u overwegen de data te extraheren of WINDOW_COVAR te gebruiken. Zie Tabelberekeningsfuncties(Link wordt in een nieuw venster geopend).

COVARP

SyntaxisCOVARP(expression 1, expression2)
DefinitieRetourneert de covariantie van een populatie van twee expressies.
Opmerkingen

Covariantie kwantificeert hoe twee variabelen samen veranderen. Een positieve covariantie geeft aan dat de variabelen de neiging hebben om in dezelfde richting te bewegen. Dit is bijvoorbeeld het geval wanneer grotere waarden van de ene variabele gemiddeld overeenkomen met grotere waarden van de andere variabele. Populatiecovariantie is de steekproefcovariantie vermenigvuldigd met (n-1)/n, waarbij n het totale aantal datapunten is dat niet nietig is. Populatiecovariantie is de juiste keuze wanneer data beschikbaar zijn voor alle items van belang, in tegenstelling tot wanneer er slechts een willekeurige subset van items is. In dat geval is steekproefcovariantie (met de functie COVAR) passend.

Als <expression1> en <expression2> hetzelfde zijn, bijvoorbeeld COVARP([profit], [profit]), COVARP retourneert een waarde die aangeeft hoe breed de waarden verdeeld zijn. Opmerking: de waarde van COVARP(X, X) is gelijk aan de waarde van VARP(X) en ook de waarde van STDEVP(X)^2.

Beperkingen voor database

COVARP is beschikbaar met de volgende databronnen: Tableau-data-extracten, Cloudera Hive, EXASolution, Firebird (versie 3.0 en later), Google BigQuery, Hortonworks Hadoop Hive, IBM PDA (Netezza), Oracle, PostgreSQL, Presto, SybaseIQ, Teradata en Vertica

Voor andere databronnen kunt u overwegen de data te extraheren of WINDOW_COVAR te gebruiken. Zie Tabelberekeningsfuncties(Link wordt in een nieuw venster geopend).

MAX

SyntaxisMAX(expression) of MAX(expr1, expr2)
UitvoerHetzelfde datatype als het argument, of NULL als een deel van het argument nul is.
Definitie

Retourneert het maximum van de twee argumenten. Deze moeten van hetzelfde datatype zijn.

MAX kan ook worden toegepast op een enkel veld als aggregatie.

Voorbeeld
MAX(4,7) = 7
MAX(#3/25/1986#, #2/20/2021#) = #2/20/2021#
MAX([Name]) = "Zander"
Opmerkingen

Voor tekenreeksen

MAX is meestal de waarde die als laatste in alfabetische volgorde staat.

Bij databasedatabronnen is de tekenreekswaarde MAX de hoogste in de sorteervolgorde die door de database voor die kolom is gedefinieerd.

Voor datums

Voor datums is MAX de meest recente datum. Als MAX een aggregatie is, zal het resultaat geen datumhiërarchie hebben. Als MAX een vergelijking is, behoudt het resultaat de datumhiërarchie.

Als een aggregatie

MAX(expression) is een geaggregeerde functie en retourneert één geaggregeerd resultaat. Dit wordt weergegeven als AGG(expression) in de visualisatie.

Ter vergelijking

MAX(expr1, expr2) vergelijkt de twee waarden en retourneert een waarde op rijniveau.

Zie ook MIN.

MEDIAN

SyntaxisMEDIAN(expression)
DefinitieRetourneert de mediaan van een expressie in alle records. Nullwaarden worden genegeerd.
OpmerkingenMEDIAN kan alleen worden gebruikt met numerieke velden.
Beperkingen voor database

MEDIAN is niet beschikbaar voor de volgende databronnen: Access, Amazon Redshift, Cloudera Hadoop, HP Vertica, IBM DB2, IBM PDA (Netezza), Microsoft SQL Server, MySQL, SAP HANA en Teradata.

Voor andere typen databronnen kunt u uw data naar een extractiebestand extraheren om deze functie te gebruiken. Zie Uw data extraheren(Link wordt in een nieuw venster geopend).

MIN

SyntaxisMIN(expression) of MIN(expr1, expr2)
UitvoerHetzelfde datatype als het argument, of NULL als een deel van het argument nul is.
Definitie

Retourneert het minimum van de twee argumenten, die van hetzelfde datatype moeten zijn.

MIN kan ook worden toegepast op een enkel veld als aggregatie.

Voorbeeld
MIN(4,7) = 4
MIN(#3/25/1986#, #2/20/2021#) = #3/25/1986#
MIN([Name]) = "Abebi"
Opmerkingen

Voor tekenreeksen

MIN is meestal de waarde die in alfabetische volgorde als eerste voorkomt.

Bij databasedatabronnen is de tekenreekswaarde MIN de laagste in de sorteervolgorde die door de database voor die kolom is gedefinieerd.

Voor datums

Voor datums is MIN de vroegste datum. Als MIN een aggregatie is, zal het resultaat geen datumhiërarchie hebben. Als MIN een vergelijking is, behoudt het resultaat de datumhiërarchie.

Als een aggregatie

MIN(expression) is een geaggregeerde functie en retourneert één geaggregeerd resultaat. Dit wordt weergegeven als AGG(expression) in de visualisatie.

Ter vergelijking

MIN(expr1, expr2) vergelijkt de twee waarden en retourneert een waarde op rijniveau.

Zie ook MAX.

PERCENTILE

SyntaxisPERCENTILE(expression, number)
DefinitieRetourneert de percentielwaarde van de opgegeven expressie die overeenkomt met het opgegeven <number>. Het <number> moet tussen 0 en 1 (inclusief) vallen en moet een numerieke constante zijn.
Voorbeeld
PERCENTILE([Score], 0.9)
Beperkingen voor database

Deze functie is beschikbaar voor de volgende databronnen: niet-verouderde Microsoft Excel- en tekstbestandverbindingen, extracten en alleen extract-databrontypen (bijvoorbeeld Google Analytics, OData of Salesforce), Sybase IQ 15.1 en latere databronnen, Oracle 10 en latere databronnen, Cloudera Hive en Hortonworks Hadoop Hive-databronnen, EXASolution 4.2 en latere databronnen.

Voor andere typen databronnen kunt u uw data naar een extractiebestand extraheren om deze functie te gebruiken. Zie Uw data extraheren(Link wordt in een nieuw venster geopend).

STDEV

SyntaxisSTDEV(expression)
DefinitieRetourneert de statistische standaardafwijking van alle waarden in de gegeven expressie op basis van een steekproef van de populatie.

STDEVP

SyntaxisSTDEVP(expression)
DefinitieRetourneert de statistische standaardafwijking van alle waarden in de gegeven expressie op basis van een vertekende populatie.

SUM

SyntaxisSUM(expression)
DefinitieRetourneert de som van alle waarden in de expressie. Nullwaarden worden genegeerd.
OpmerkingenSUM kan alleen worden gebruikt met numerieke velden.

VAR

SyntaxisVAR(expression)
DefinitieRetourneert de statistische variantie van alle waarden in de gegeven expressie op basis van een steekproef van de populatie.

VARP

SyntaxisVARP(expression)
DefinitieRetourneert de statistische variantie van alle waarden in de gegeven expressie op basis van de gehele populatie.

Een geaggregeerde berekening maken

Volg de onderstaande stappen om te leren hoe u een geaggregeerde berekening maakt.

  1. Maak in Tableau Desktop verbinding met de opgeslagen databron Voorbeeld - Superstore, die bij Tableau wordt geleverd.
  2. Navigeer naar een werkblad en selecteer Analyse > Berekend veld maken.
  3. Doe het volgende in de berekeningseditor die wordt geopend:
    • Geef het berekende veld de naam Marge.
    • Voer de volgende formule in:

      IIF(SUM([Sales]) !=0, SUM([Profit])/SUM([Sales]), 0)

      Opmerking: u kunt de functieverwijzing gebruiken om aggregaatfuncties en andere functies (zoals de logische IIF-functie in dit voorbeeld) te zoeken en toe te voegen aan de berekeningsformule. Zie voor meer informatie De functiewijzer gebruiken in de editor berekeningen.

    • Klik op OK als u klaar bent.

    De nieuwe geaggregeerde berekening verschijnt onder Meetwaarden in het deelvenster Data. Net als uw andere velden kunt u deze in een of meer visualisaties gebruiken.

    Opmerking: geaggregeerde berekeningen zijn altijd meetwaarden.

    Wanneer Marge op een container of kaart in het werkblad wordt geplaatst, wordt de naam gewijzigd in AGG(Marge), wat aangeeft dat het een geaggregeerde berekening is, die niet verder kan worden geaggregeerd.

    Een afbeelding die aangeeft wat er gebeurt als u een geaggregeerde berekening op een container plaatst. In het veld wordt het AGG-voorvoegsel weergegeven.

Regels voor geaggregeerde berekeningen

Op geaggregeerde berekeningen zijn de volgende regels van toepassing:

  • Voor geen enkele geaggregeerde berekening kunt u een geaggregeerde waarde en een uitgesplitste waarde combineren. SUM(Price)*[Items] is bijvoorbeeld geen geldige expressie omdat SUM(Price) is geaggregeerd en Items niet. SUM(Price*Items) en SUM(Price)*SUM(Items) zijn echter beide geldig.
  • Constante termen in een expressie fungeren voor zover relevant als geaggregeerde of uitgesplitste waarden. SUM(Price*7) en SUM(Price)*7 zijn bijvoorbeeld beide geldige expressies.
  • Alle functies kunnen worden geëvalueerd op basis van geaggregeerde waarden. De argumenten voor een bepaalde functie moeten echter allemaal geaggregeerd of allemaal uitgesplitst zijn. MAX(SUM(Sales),Profit) is bijvoorbeeld geen geldige expressie omdat Sales is geaggregeerd en Profit niet. MAX(SUM(Sales),SUM(Profit)) is echter een geldige uitdrukking.
  • Het resultaat van een geaggregeerde berekening is altijd een meetwaarde. Hiertoe behoren expressies zoals ATTR(Dimension) of MIN(Dimension).
  • Net als bij vooraf gedefinieerde aggregaties worden geaggregeerde berekeningen voor eindtotalen correct uitgevoerd. Raadpleeg Eindtotalen voor meer informatie.

Zie ook

De basisprincipes van berekeningen: geaggregeerde berekeningen(Link wordt in een nieuw venster geopend)

Data-aggregatie in Tableau(Link wordt in een nieuw venster geopend)

Functies in Tableau

Tableau-functies (op categorie)(Link wordt in een nieuw venster geopend)

Tableau-functies (alfabetische lijst)

Bedankt voor uw feedback.De feedback is verzonden. Dank u wel.