Aggregaatfuncties in Tableau
Dit artikel introduceert aggregaatfuncties en hun gebruik in Tableau. Het laat ook zien hoe u een geaggregeerde berekening kunt maken aan de hand van een voorbeeld.
Aggregaatfuncties gebruiken
Met aggregaatfuncties kunt u de granulariteit van uw data samenvatten of wijzigen.
Misschien wilt u bijvoorbeeld precies weten hoeveel bestellingen uw winkel in een bepaald jaar heeft ontvangen. U kunt de functie COUNTD gebruiken om het exacte aantal bestellingen van uw bedrijf samen te vatten en de visualisatie vervolgens op te splitsen per jaar.
De berekening zou er ongeveer als volgt uitzien:
COUNTD(Order ID)
De visualisatie zou er ongeveer als volgt uitzien:
Aggregaatfuncties in Tableau
Aggregaties en drijvende-kommaberekeningen: soms zijn de resultaten van aggregaties niet precies zoals verwacht. Het kan bijvoorbeeld zijn dat de functie SUM een waarde als -1,42e-14 retourneert voor een kolom met getallen waarvan u weet dat de som precies 0 moet zijn. Dit gebeurt omdat getallen volgens de drijvendekommanorm 754 van het Institute of Electrical and Electronics Engineers (IEEE) in binaire notatie moeten worden opgeslagen, wat betekent dat getallen soms met extreem fijne precisie worden afgerond. U kunt deze potentiële afleiding elimineren door de functie ROUND te gebruiken (zie Nummerfuncties) of door een notatie met minder decimalen te gebruiken.
ATTR
Syntaxis | ATTR(expression) |
Definitie | Retourneert de waarde van de expressie als deze een enkele waarde heeft voor alle rijen. Anders wordt een asterisk geretourneerd. Nullwaarden worden genegeerd. |
AVG
Syntaxis | AVG(expression) |
Definitie | Retourneert het gemiddelde van alle waarden in de expressie. Nullwaarden worden genegeerd. |
Opmerkingen | AVG kan alleen worden gebruikt met numerieke velden. |
COLLECT
Syntaxis | COLLECT(spatial) |
Definitie | Een geaggregeerde berekening die de waarden in het argumentveld combineert. Nullwaarden worden genegeerd. |
Opmerkingen | COLLECT kan alleen worden gebruikt met ruimtelijke velden. |
CORR
Syntaxis | CORR(expression1, expression2) |
Uitvoer | Getal van -1 tot 1 |
Definitie | Retourneert de coëfficiënt voor Pearson-correlatie van twee expressies. |
Voorbeeld | example |
Opmerkingen | De Pearson-correlatie meet de lineaire relatie tussen twee variabelen. De resultaten variëren van -1 tot en met 1, waarbij 1 staat voor een exact positief lineair verband, 0 voor geen lineair verband tussen de variantie en -1 voor een exact negatief verband. Het kwadraat van een CORR-resultaat is gelijk aan de R-kwadraatwaarde voor een lineair trendlijnmodel. Zie Voorwaarden voor trendlijnmodel(Link wordt in een nieuw venster geopend). Gebruik met LOD-expressies met tabelbereik: U kunt CORR gebruiken om de correlatie in een uitgesplitste spreiding te visualiseren met gebruik van Tabelgerichte LOD-expressies(Link wordt in een nieuw venster geopend). Bijvoorbeeld: {CORR(Sales, Profit)} Met een expressie op detailniveau wordt de correlatie over alle rijen uitgevoerd. Als u een formule als deze gebruikt |
Beperkingen voor database |
Voor andere databronnen kunt u overwegen de data te extraheren of |
COUNT
Syntaxis | COUNT(expression) |
Definitie | Retourneert het aantal items. Nullwaarden worden niet geteld. |
COUNTD
Syntaxis | COUNTD(expression) |
Definitie | Retourneert het aantal afzonderlijke items in een groep. Nullwaarden worden niet geteld. |
COVAR
Syntaxis | COVAR(expression1, expression2) |
Definitie | Retourneert een voorbeeld van een covariantie van twee expressies. |
Opmerkingen | Covariantie kwantificeert hoe twee variabelen samen veranderen. Een positieve covariantie geeft aan dat de variabelen de neiging hebben om in dezelfde richting te bewegen. Dit is bijvoorbeeld het geval wanneer grotere waarden van de ene variabele gemiddeld overeenkomen met grotere waarden van de andere variabele. Steekproefcovariantie gebruikt het aantal niet-nietige datapunten n - 1 om de berekening van de covariantie te normaliseren, in plaats van n. N wordt gebruikt door de populatiecovariantie (beschikbaar met de functie Als De waarde van |
Beperkingen voor database |
Voor andere databronnen kunt u overwegen de data te extraheren of |
COVARP
Syntaxis | COVARP(expression 1, expression2) |
Definitie | Retourneert de covariantie van een populatie van twee expressies. |
Opmerkingen | Covariantie kwantificeert hoe twee variabelen samen veranderen. Een positieve covariantie geeft aan dat de variabelen de neiging hebben om in dezelfde richting te bewegen. Dit is bijvoorbeeld het geval wanneer grotere waarden van de ene variabele gemiddeld overeenkomen met grotere waarden van de andere variabele. Populatiecovariantie is de steekproefcovariantie vermenigvuldigd met (n-1)/n, waarbij n het totale aantal datapunten is dat niet nietig is. Populatiecovariantie is de juiste keuze wanneer data beschikbaar zijn voor alle items van belang, in tegenstelling tot wanneer er slechts een willekeurige subset van items is. In dat geval is steekproefcovariantie (met de functie Als |
Beperkingen voor database |
Voor andere databronnen kunt u overwegen de data te extraheren of |
MAX
Syntaxis | MAX(expression) of MAX(expr1, expr2) |
Uitvoer | Hetzelfde datatype als het argument, of NULL als een deel van het argument nul is. |
Definitie | Retourneert het maximum van de twee argumenten. Deze moeten van hetzelfde datatype zijn.
|
Voorbeeld | MAX(4,7) = 7 |
Opmerkingen | Voor tekenreeksen
Bij databasedatabronnen is de tekenreekswaarde Voor datums Voor datums is Als een aggregatie
Ter vergelijking
Zie ook |
MEDIAN
Syntaxis | MEDIAN(expression) |
Definitie | Retourneert de mediaan van een expressie in alle records. Nullwaarden worden genegeerd. |
Opmerkingen | MEDIAN kan alleen worden gebruikt met numerieke velden. |
Beperkingen voor database |
Voor andere typen databronnen kunt u uw data naar een extractiebestand extraheren om deze functie te gebruiken. Zie Uw data extraheren(Link wordt in een nieuw venster geopend). |
MIN
Syntaxis | MIN(expression) of MIN(expr1, expr2) |
Uitvoer | Hetzelfde datatype als het argument, of NULL als een deel van het argument nul is. |
Definitie | Retourneert het minimum van de twee argumenten, die van hetzelfde datatype moeten zijn.
|
Voorbeeld | MIN(4,7) = 4 |
Opmerkingen | Voor tekenreeksen
Bij databasedatabronnen is de tekenreekswaarde Voor datums Voor datums is Als een aggregatie
Ter vergelijking
Zie ook |
PERCENTILE
Syntaxis | PERCENTILE(expression, number) |
Definitie | Retourneert de percentielwaarde van de opgegeven expressie die overeenkomt met het opgegeven <number> . Het <number> moet tussen 0 en 1 (inclusief) vallen en moet een numerieke constante zijn. |
Voorbeeld | PERCENTILE([Score], 0.9) |
Opmerkingen | |
Beperkingen voor database | Deze functie is beschikbaar voor de volgende databronnen: niet-verouderde Microsoft Excel- en tekstbestandverbindingen, extracten en alleen extract-databrontypen (bijvoorbeeld Google Analytics, OData of Salesforce), Sybase IQ 15.1 en latere databronnen, Oracle 10 en latere databronnen, Cloudera Hive en Hortonworks Hadoop Hive-databronnen, EXASolution 4.2 en latere databronnen. Voor andere typen databronnen kunt u uw data naar een extractiebestand extraheren om deze functie te gebruiken. Zie Uw data extraheren(Link wordt in een nieuw venster geopend). |
STDEV
Syntaxis | STDEV(expression) |
Definitie | Retourneert de statistische standaardafwijking van alle waarden in de gegeven expressie op basis van een steekproef van de populatie. |
STDEVP
Syntaxis | STDEVP(expression) |
Definitie | Retourneert de statistische standaardafwijking van alle waarden in de gegeven expressie op basis van een vertekende populatie. |
SUM
Syntaxis | SUM(expression) |
Definitie | Retourneert de som van alle waarden in de expressie. Nullwaarden worden genegeerd. |
Opmerkingen | SUM kan alleen worden gebruikt met numerieke velden. |
VAR
Syntaxis | VAR(expression) |
Definitie | Retourneert de statistische variantie van alle waarden in de gegeven expressie op basis van een steekproef van de populatie. |
VARP
Syntaxis | VARP(expression) |
Definitie | Retourneert de statistische variantie van alle waarden in de gegeven expressie op basis van de gehele populatie. |
Een geaggregeerde berekening maken
Volg de onderstaande stappen om te leren hoe u een geaggregeerde berekening maakt.
Maak in Tableau Desktop verbinding met de opgeslagen databron Voorbeeld - Superstore, die bij Tableau wordt geleverd.
Navigeer naar een werkblad en selecteer Analyse > Berekend veld maken.
Doe het volgende in de berekeningseditor die wordt geopend:
Geef het berekende veld de naam Marge.
Voer de volgende formule in:
IIF(SUM([Sales]) !=0, SUM([Profit])/SUM([Sales]), 0)
Opmerking: u kunt de functieverwijzing gebruiken om aggregaatfuncties en andere functies (zoals de logische IIF-functie in dit voorbeeld) te zoeken en toe te voegen aan de berekeningsformule. Zie voor meer informatie De functiewijzer gebruiken in de editor berekeningen.
Klik op OK als u klaar bent.
De nieuwe geaggregeerde berekening verschijnt onder Meetwaarden in het deelvenster Data. Net als uw andere velden kunt u deze in een of meer visualisaties gebruiken.
Opmerking: geaggregeerde berekeningen zijn altijd meetwaarden.
Wanneer Marge op een container of kaart in het werkblad wordt geplaatst, wordt de naam gewijzigd in AGG(Marge), wat aangeeft dat het een geaggregeerde berekening is, die niet verder kan worden geaggregeerd.
Regels voor geaggregeerde berekeningen
Op geaggregeerde berekeningen zijn de volgende regels van toepassing:
Voor geen enkele geaggregeerde berekening kunt u een geaggregeerde waarde en een uitgesplitste waarde combineren. SUM(Prijs)*[Items] is bijvoorbeeld geen geldige expressie omdat SUM(Prijs) is geaggregeerd en Items niet. SUM(Prijs*Items) en SUM(Prijs)*SUM(Items) zijn echter beide geldig.
Constante termen in een expressie fungeren voor zover relevant als geaggregeerde of uitgesplitste waarden. Bijvoorbeeld: SUM(Prijs*7) en SUM(Prijs)*7 zijn beide geldige expressies.
Alle functies kunnen worden geëvalueerd op basis van geaggregeerde waarden. De argumenten voor een bepaalde functie moeten echter allemaal geaggregeerd of allemaal uitgesplitst zijn. Bijvoorbeeld: MAX(SUM(Verkoop),Winst) is geen geldige expressie omdat Verkoop geaggregeerd is en Winst niet. MAX(SUM(Verkoop),SUM(Winst)) is echter wel een geldige expressie.
Het resultaat van een geaggregeerde berekening is altijd een meetwaarde.
Net als bij vooraf gedefinieerde aggregaties worden geaggregeerde berekeningen voor eindtotalen correct uitgevoerd. Raadpleeg Eindtotalen voor meer informatie.
Zie ook
Data-aggregatie in Tableau(Link wordt in een nieuw venster geopend)
Tableau-functies (op categorie)(Link wordt in een nieuw venster geopend)