Data-aggregatie in Tableau
In Tableau kunt u meetwaarden of dimensies aggregeren. Het is echter gebruikelijker om meetwaarden te aggregeren. Telkens wanneer u een meetwaarde aan uw weergave toevoegt, wordt er standaard een aggregatie toegepast op die meetwaarde. Het type toegepaste aggregatie varieert afhankelijk van de context van de weergave.
De aggregatie van een meetwaarde in de weergave wijzigen
Wanneer u een meetwaarde aan de weergave toevoegt, aggregeert Tableau automatisch de waarden ervan. Som, gemiddelde en mediaan zijn veelvoorkomende aggregaties. Zie Lijst met vooraf gedefinieerde aggregaties in Tableau voor een volledige lijst.
De huidige aggregatie wordt weergegeven als onderdeel van de naam van de meetwaarde in de weergave. Verkoop wordt bijvoorbeeld SOM(Verkoop). Elke meetwaarde heeft een standaardaggregatie die door Tableau wordt ingesteld wanneer u verbinding maakt met een databron. U kunt de standaardaggregatie voor een meetwaarde bekijken of wijzigen. Zie hiervoor De standaardaggregatie voor een meetwaarde instellen.
U kunt met Tableau uitsluitend voor relationele databronnen meetwaarden aggregeren. Multidimensionale databronnen bevatten data die al zijn geaggregeerd. In Tableau worden multidimensionale databronnen alleen ondersteund in Windows.)
U kunt de aggregatie voor een meetwaarde in de weergave wijzigen via het contextmenu van de meetwaarde:
Dimensies aggregeren
U kunt een dimensie in de weergave aggregeren als Minimum, Maximum, Aantal of Aantal (uniek). Wanneer u een dimensie aggregeert, maakt u een nieuwe tijdelijke kolom voor een meetwaarde, zodat de dimensie de kenmerken van een meetwaarde aanneemt.
Een andere manier om een dimensie weer te geven, is door deze als kenmerk te behandelen door Kenmerk te kiezen in het contextmenu voor de dimensie. De aggregatie Kenmerk heeft verschillende toepassingen:
- Het kan zorgen voor een consistent detailniveau wanneer u meerdere databronnen combineert.
- Het kan een manier bieden om dimensies te aggregeren bij het uitvoeren van tabelberekeningen waarvoor een aggregatie-expressie vereist is.
- Het kan de queryprestaties verbeteren omdat het wordt berekend
Tableau berekent Kenmerkt met behulp van de volgende formule:
IF MIN([dimension]) = MAX([dimension]) THEN
MIN([dimension]) ELSE "*" END
De formule wordt in Tableau berekend nadat de data uit de initiële query zijn opgehaald. Het sterretje (*) is eigenlijk een visuele indicator van een speciaal type null-waarde dat optreedt als er meerdere waarden zijn. Zie Problemen met Datacombinatie oplossen(Link wordt in een nieuw venster geopend) voor meer informatie over het sterretje.
Hier ziet u een voorbeeld van het gebruik van Kenmerk in een tabelberekening. In de tabel worden de verkopen per markt, marktomvang en staat weergegeven. Stel dat u het percentage van de totale verkopen wilt berekenen dat elke staat aan de markt heeft bijgedragen. Wanneer u een snelle tabelberekening Percentage van totaal toevoegt (zie Snelle tabelberekeningen(Link wordt in een nieuw venster geopend)) die via Staat wordt uitgevoerd, wordt de berekening uitgevoerd binnen het rode gebied. Dit komt doordat de data door de dimensie Marktomvang worden verdeeld.
Wanneer u Marktomvang als een kenmerk aggregeert, wordt de berekening uitgevoerd binnen Markt (Oost, in de volgende afbeelding) en is Marktomvang slechts een label.
Lijst met vooraf gedefinieerde aggregaties in Tableau
Soms is het handig om numerieke data in geaggregeerde vorm te bekijken, zoals een som of een gemiddelde. De wiskundige functies die geaggregeerde data produceren, worden aggregatiefuncties genoemd. Aggregatiefuncties voeren een berekening uit op een reeks waarden en retourneren één enkele waarde. Een meetwaarde die de waarden 1, 2, 3, 3 en 4 bevat, geaggregeerd als een som, retourneert bijvoorbeeld één enkele waarde: 13. Of als u 3.000 verkooptransacties heeft voor 50 producten, wilt u misschien de som van de verkopen per product bekijken om te bepalen welke producten de grootste omzet genereren.
Opmerking: het gebruik van drijvendekommawaarden bij aggregaties kan soms tot onverwachte resultaten leiden. Zie Datatypen in berekeningen begrijpen(Link wordt in een nieuw venster geopend) voor meer informatie.
Tableau biedt een reeks vooraf gedefinieerde aggregaties die in de tabel worden weergegeven. U kunt de standaardaggregatie instellen voor elke meetwaarde die geen berekend veld is dat zelf een aggregatie bevat, zoals AVG([Discount])
. Zie De standaardaggregatie voor een meetwaarde instellen. U kunt ook de aggregatie instellen voor een veld dat al in de weergave is opgenomen. Zie De aggregatie van een meetwaarde in de weergave wijzigen voor nadere informatie.
Aggregatie | Beschrijving | Resultaat voor de meetwaarde die 1, 2, 2 en 3 bevat |
---|---|---|
Kenmerk | Retourneert de waarde van de betreffende expressie als deze maar één waarde heeft voor alle rijen in de groep. Anders wordt een sterretje (*) weergegeven. Null-waarden worden genegeerd. Deze aggregatie is handig bij het aggregeren van een dimensie. Als u een meetwaarde in de weergave wilt instellen op deze aggregatie, klikt u met de rechtermuisknop (op een Mac met de Control-toets) op de meetwaarde en kiest u Kenmerk. Het veld verandert vervolgens en bevat de tekst ATTR: | * |
Dimensie | Retourneert alle unieke waarden in een meetwaarde of dimensie. | Drie waarden (1, 2, 3) |
Som | Retourneert de som van de getallen in een expressie. Null-waarden worden genegeerd. | Één waarde (8) |
Gemiddeld | Retourneert het rekenkundig gemiddelde van de getallen in een meetwaarde. Null-waarden worden genegeerd. | Één waarde (2) |
Aantal (uniek) | Retourneert het aantal unieke waarden in een meetwaarde of dimensie. Wanneer deze aggregatie wordt toegepast op een dimensie, wordt er door Tableau een nieuwe tijdelijke kolom gemaakt die een meetwaarde is, omdat het resultaat van een aggregatie Aantal een getal is. U kunt getallen, datums, booleaanse waarden en tekenreeksen tellen. Null-waarden worden in alle gevallen genegeerd. Deze aggregatie is niet beschikbaar voor de volgende typen werkmappen:
Als u bent verbonden met een werkmap die een van deze typen gebruikt, is Aantal (uniek) niet beschikbaar en wordt in Tableau het bericht 'Vereist extract' weergegeven. Als u deze aggregatie wilt gebruiken, extraheert u uw data. Zie Uw data extraheren. | Één waarde (3) |
Minimum | Retourneert het kleinste getal in een meetwaarde of continue dimensie. Null-waarden worden genegeerd. | Één waarde (1) |
Maximum | Retourneert het grootste getal in een meetwaarde of in de betreffende expressie op basis van een steekproefpopulatie. Null-waarden worden genegeerd. Retourneert een null-waarde als er minder dan twee leden in de steekproef zijn die geen null-waarden zijn. Gebruik deze functie als uw data een steekproef van de populatie zijn. | Één waarde (3) |
Std. Afw (pop.) | Retourneert de standaardafwijking van alle waarden in de gegeven expressie op basis van een vertekende populatie. Gaat ervan uit dat de argumenten van de functie betrekking hebben op de gehele populatie. Gebruik deze functie voor grote steekproeven. | Één waarde (0,7071) |
Variantie | Retourneert de variantie van alle waarden in de gegeven expressie op basis van een steekproef. Null-waarden worden genegeerd. Retourneert een null-waarde als de steekproef minder dan twee leden bevat die geen null-waarden zijn. Gebruik deze functie als uw data een steekproef van de populatie zijn. | Één waarde (0,6667) |
Variantie (populatie) | Retourneert de variantie van alle waarden in de gegeven expressie op basis van een vertekende populatie. Gaat ervan uit dat de argumenten van de functie betrekking hebben op de gehele populatie. Gebruik deze functie voor grote steekproeven. | Één waarde (0,5000) |
Desaggregeren | Retourneert alle records in de onderliggende databron. Als u alle meetwaarden in de weergave wilt desaggregeren, selecteert u Meetwaarden aggregeren in het menu Analyse (om het vinkje te verwijderen). Met Tableau kunt u data in gedesaggregeerde vorm bekijken (alleen relationele databases). Wanneer data zijn gedesaggregeerd, kunt u de afzonderlijke rijen van uw databron bekijken. Nadat u bijvoorbeeld hebt ontdekt dat de som van de verkopen voor elastiekjes 14.600 € bedraagt, wilt u misschien de verdeling van de afzonderlijke verkooptransacties bekijken. Om een antwoord te krijgen op deze vraag, moet u een weergave maken waarin afzonderlijke rijen met data worden weergegeven. U moet de data dus desaggregeren (zie Data desaggregeren). Een andere manier om naar gedesaggregeerde data te kijken, is door de onderliggende data voor de gehele weergave of een deel ervan te bekijken. Zie Onderliggende data weergeven voor nadere informatie. | Vier waarden (1, 2, 2, 3) |
U kunt ook aangepaste aggregaties definiëren, zoals wordt beschreven in Aggregaatfuncties in Tableau(Link wordt in een nieuw venster geopend). Afhankelijk van het type dataweergave dat u maakt, past Tableau deze aggregaties toe op het juiste detailniveau. Tableau past de aggregatie bijvoorbeeld toe op afzonderlijke dimensieleden (de gemiddelde levertijd in de regio Oost), alle leden in een bepaalde dimensie (de gemiddelde levertijd in de regio Oost, West en Midden) of groepen dimensies (de som van de verkopen voor alle regio's en voor alle markten).
De standaardaggregatie voor een meetwaarde instellen
U kunt de standaardaggregatie instellen voor elke meetwaarde die geen berekend veld is dat zelf een aggregatie bevat, zoals AVG([Discount])
. Een standaardaggregatie is een voorkeursberekening voor het samenvatten van een continu of discreet veld. De standaardaggregatie wordt automatisch gebruikt wanneer u een meetwaarde naar een weergave sleept.
U wijzigt als volgt de standaardaggregatie :
Klik met de rechtermuisknop (op een Mac met de Control-toets) op een meetwaarde in het deelvenster Data en selecteer Standaardeigenschappen > Aggregatie en selecteer vervolgens een van de aggregatieopties.
Opmerking: u kunt met Tableau uitsluitend bij relationele databronnen meetwaarden aggregeren. Multidimensionale databronnen bevatten alleen geaggregeerde data.
U kunt geen standaardaggregaties instellen voor gepubliceerde databronnen. De standaardaggregatie wordt ingesteld wanneer de databron voor het eerst wordt gepubliceerd. Maak een lokale kopie(Link wordt in een nieuw venster geopend) van de gepubliceerde databron om de standaardaggregatie aan te passen.
Data desaggregeren
Telkens wanneer u een meetwaarde aan uw weergave toevoegt, wordt er standaard een aggregatie toegepast op die meetwaarde. Deze standaardactie wordt bepaald door de instelling Meetwaarden aggregeren in het menu Analyse.
Als u besluit dat u alle markeringen in de weergave op het meest gedetailleerde granulariteitsniveau wilt weergeven, kunt u de weergave desaggregeren. Het desaggregeren van uw data betekent dat Tableau voor elke datawaarde in elke rij van uw databron een afzonderlijke markering weergeeft.
U desaggregeert als volgt alle meetwaarden in de weergave:
Schakel de optie Analyse >Meetwaarden aggregeren uit. Als het al is geselecteerd, klikt u één keer op Meetwaarden aggregeren om de selectie ongedaan te maken.
Wanneer Meetwaarden aggregeren is geselecteerd, probeert Tableau standaard meetwaarden in de weergave te aggregeren. Afzonderlijke rijwaarden uit uw databron worden geaggregeerd tot één waarde (één markering) op het detailniveau in uw weergave.
De verschillende aggregaties die beschikbaar zijn voor een meetwaarde bepalen hoe de afzonderlijke waarden worden verzameld: ze kunnen worden opgeteld (SOM), gemiddeld (GEM) of worden ingesteld op de maximale (MAX) of minimale (MIN) waarde van de afzonderlijke rijwaarden.
Zie Lijst met vooraf gedefinieerde aggregaties in Tableau voor een volledige lijst van de beschikbare aggregaties.
Het detailniveau wordt bepaald door de dimensies in uw weergave. Zie Hoe dimensies het detailniveau beïnvloeden in de weergave voor informatie over het concept van detailniveau.
Het desaggregeren van uw data kan handig zijn voor het analyseren van meetwaarden die u mogelijk zowel onafhankelijk als afhankelijk van de weergave wilt gebruiken. U analyseert bijvoorbeeld de resultaten van een producttevredenheidsonderzoek met de leeftijd van de deelnemers langs één as. U kunt het veld Leeftijd aggregeren om de gemiddelde leeftijd van deelnemers te bepalen of de data desaggregeren om te bepalen op welke leeftijd deelnemers het meest tevreden waren met het product.
Het desaggregeren van data kan handig zijn als u data als een spreidingsdiagram weergeeft. Zie Voorbeeld: spreidingsdiagrammen, aggregatie en granulariteit.
Opmerking: als uw databron erg groot is, kan het desaggregeren van de data resulteren in een aanzienlijke prestatievermindering.
Voorbeeld: spreidingsdiagrammen, aggregatie en granulariteit
Als u een meetwaarde in de container Rijen plaatst en een andere meetwaarde in de container Kolommen , vraagt u Tableau om twee numerieke waarden te vergelijken. Meestal kiest Tableau in dergelijke gevallen een spreidingsdiagram als de standaardvisualisatie. De aanvankelijke weergave zal hoogstwaarschijnlijk één enkele markering zijn, die de som van alle waarden voor de twee metingen toont. Dit komt omdat u het detailniveau van de weergave moet verhogen.
Beginnen met het maken van het spreidingsdiagram
Dimensies gebruiken om details toe te voegen
Beginnen met het maken van het spreidingsdiagram
Er zijn verschillende manieren om details toe te voegen aan een eenvoudig spreidingsdiagram: u kunt dimensies gebruiken om details toe te voegen, u kunt meer velden toevoegen aan de containers Rijen en Kolommen of u kunt de data desaggregeren. U kunt ook een combinatie van deze opties gebruiken. In dit onderwerp worden deze opties bekeken met behulp van de databron Sample-Superstore.
Voer de volgende stappen uit om de initiële weergave te maken:
Plaats de meetwaarde Verkoop in de container Kolommen.
Plaats de meetwaarde Winst in de container Rijen.
De meetwaarden worden automatisch geaggregeerd als een optelsom. De standaardaggregatie (SOM) wordt aangegeven in de veldnamen. De waarden die in de knopinfo worden weergegeven, tonen de som van de verkoop- en winstwaarden in elke rij in de databron.
Voer de volgende stappen uit om met behulp van dimensies details aan de weergave toe te voegen en data te desaggregeren.
Dimensies gebruiken om details toe te voegen
Voer de volgende stappen uit om de weergave van het spreidingsdiagram verder te ontwikkelen door dimensies toe te voegen om meer detailniveaus weer te geven
Sleep de dimensie Categorie naar Kleur op de kaart Markeringen.
Hierdoor worden de data in drie markeringen opgesplitst (één voor elk dimensielid) en worden de markeringen gecodeerd met behulp van kleur.
Sleep de dimensie Staat naar Detail op de kaart Markeringen.
Nu bevat de weergave nog veel meer markeringen. Het aantal markeringen is gelijk aan het aantal verschillende staten in de databron, vermenigvuldigd met het aantal categorieën.
Hoewel er nu meer markeringen worden weergegeven, worden de meetwaarden nog steeds geaggregeerd. Dus ongeacht of de databron één rij bevat, waarbij Staat = North Dakota en Categorie= Meubilair, of 100 van dergelijke rijen, het resultaat is altijd één enkele markering.
Misschien begint de weergave te lijken op wat u voor ogen hebt of misschien wilt u er een andere wending aan geven. U bepaalt welke vragen er worden gesteld.
Meer velden toevoegen aan de containers Rijen en Kolommen
Keer terug naar de oorspronkelijke weergave met één markering en voer de volgende stappen uit om de weergaven van het spreidingsdiagram te ontwikkelen door velden toe te voegen aan de containers Rijen en Kolommen .
Sleep de dimensie Staat naar de container Kolommen.
Zelfs als u Continent rechts van SOM(Verkoop) neerzet, zet Tableau het links van SOM(Verkoop). Dit komt omdat u geen dimensie in een continue as kunt invoegen. In plaats daarvan bevat uw weergave een afzonderlijke as voor elk lid van de dimensie.
Sleep de dimensie Segment naar de container Rijen.
U hebt nu een weergave die een overzicht biedt van de verkopen en winst voor verschillende staten en klantsegmenten. Het kan interessant zijn om met de muis over de markeringen in de weergave te bewegen om knopinfo voor verschillende segmenten te bekijken:
De data desaggregeren
Een andere manier om uw oorspronkelijke spreidingsdiagram van één markering aan te passen om meer markeringen weer te geven, is door de data te desaggregeren.
Schakel de optie Analyse >Meetwaarden aggregeren uit. Als het al is geselecteerd, klikt u één keer op Meetwaarden aggregeren om de selectie ongedaan te maken.
Wat u hebt gedaan, is de data desaggregeren, omdat deze opdracht een schakeloptie is die oorspronkelijk was geselecteerd (er stond een vinkje). Tableau aggregeert standaard data in uw weergave.
U ziet nu veel markeringen. Eén voor elke rij in uw oorspronkelijke databron:
Wanneer u meetwaarden desaggregeert, kijkt u niet meer naar het gemiddelde of de som van de waarden in de rijen in de databron. In plaats daarvan wordt in de weergave een markering weergegeven voor elke rij in de databron. Het desaggregeren van data is een manier om naar het hele oppervlak van de data te kijken. Het is een snelle manier om inzicht te krijgen in de vorm van uw data en uitschieters te identificeren. In dit geval laat de weergave zien dat er een consistente relatie bestaat tussen verkopen en winst. Dit wordt aangegeven door de lijn met markeringen die in een hoek van vijfenveertig graden zijn uitgelijnd.