De databron plannen
Uw data staan centraal in Tableau. Hoe succesvol u bent in het verkennen van data, het beantwoorden van vragen en het bouwen van visualisaties voor eigen gebruik of voor anderen, hangt allemaal af van de onderliggende data.
Als het uw doel is om wat snelle verkenningen of ad-hocanalyses uit te voeren, volstaat het misschien om even snel verbinding te maken met de data en een paar visualisaties te bouwen door wat zaken te slepen en neer te zetten, om zo de informatie die u nodig hebt te verkrijgen. Maar als het uw doel is om een analyse of databron te maken die meerdere keren gebruikt zal worden, is het beter om uw databron goed te overdenken en plannen.
Tableau-databronnen
Een Tableau-databron is de koppeling tussen uw brondata en Tableau. Het is in wezen de som van uw data (als liveverbinding of als extract), de verbindingsgegevens, de namen van tabellen of werkbladen die data bevatten, en de aanpassingen die u bovenop de data aanbrengt om ermee in Tableau te kunnen werken. Deze aanpassingen omvatten zaken als hoe de data worden gecombineerd en metadata zoals berekeningen, hernoemde velden en standaardindeling.
Een Tableau-databron kan meerdere dataverbindingen naar verschillende databases of bestanden bevatten. Verbindingsgegevens omvatten waar de data zich bevinden, zoals een bestandsnaam en pad of een netwerklocatie, en details over hoe u verbinding kunt maken met de data, zoals de naam van de databaseserver en aanmeldingsgegevens van de server.
Opmerking: De termen databron en dataverbinding zijn in het verleden door elkaar gebruikt en in oudere materialen kan het lastig zijn ze van elkaar te onderscheiden.
Het is ook belangrijk om rekening te houden met het verschil tussen de Tableau-databron (de toegang van Tableau tot uw data en alle aanpassingen die daarbij betrokken kunnen zijn) en de brondata zelf (zoals een database of Excel-spreadsheet). Het plannen van een databron in de zin van het ontwerpen van een database valt niet binnen het bereik van dit onderwerp.
Tableau-databronnen kunnen ingesloten blijven in de werkmap waar ze oorspronkelijk zijn gemaakt, of ze kunnen afzonderlijk worden gepubliceerd. Gepubliceerde databronnen maken centralisatie en schaalbaarheid van georganiseerde databronnen mogelijk. Zie Best practices voor gepubliceerde databronnen voor meer informatie.
Data combineren
Als uw data uit één tabel komen, kunt u verbinding maken met de data om de databron te maken, de tabel naar het canvas slepen en beginnen met het samenstellen van uw weergave. Maar als uw data over meerdere tabellen, of meerdere databases, zijn verspreid, moet u deze combineren. Het combineren van data gebeurt op de Databronpagina.
Enkele database | Meerdere databases |
|
|
Opmerking: Om tabellen in verschillende databases te relateren, moeten ze worden toegevoegd als dataverbindingen binnen dezelfde databron, geen nieuwe databron. Dataverbindingen worden toegevoegd via de link Toevoegen in het linkerdeelvenster. Nieuwe databronnen kunnen worden gemaakt via het menu Data of via het vervolgkeuzemenu van het pictogram naast de naam van de databron, zoals u in de onderstaande afbeelding kunt zien.
Methoden voor het combineren van data
Relaties zijn de standaardmanier om data in Tableau te combineren. Relaties zijn een dynamische, flexibele manier om data uit meerdere tabellen te combineren voor analyse. Indien nodig kunnen tabellen ook worden samengevoegd met behulp van een join of vereniging. Databronnen kunnen ook worden gecombineerd. Laten we eens kijken naar de opties voor de manier waarop data in Tableau kunnen worden gecombineerd, en naar enkele situaties waarin elke methode nuttig is.
Relaties | Bepalen de mogelijkheden voor joins tussen twee tabellen op basis van gerelateerde velden. Voegen data niet samen om een nieuwe, vaste tabel te creëren. Tijdens de analyse worden de relevante tabellen automatisch doorzocht met behulp van de contextueel geschikte joins om een aangepaste datatabel voor die analyse te genereren. Handhaven het juiste detailniveau, verliezen geen data, behouden de juiste aggregaties en hanteren null-waarden. |
Joins | Voegen twee datatabellen samen op basis van een join-component en een join-type om een nieuwe, vaste datatabel te vormen. Worden vaak gebruikt om nieuwe datakolommen toe te voegen binnen dezelfde basisrijstructuur. Sommige join-typen kunnen dataverlies veroorzaken als velden niet in alle tabellen aanwezig zijn. Kunnen dataduplicatie veroorzaken als tabellen zich op verschillende detailniveaus bevinden. |
Verenigingen | Voegen twee of meer datatabellen samen om een nieuwe, vaste datatabel te vormen. Worden gebruikt om (nieuwe rijen met) data toe te voegen binnen dezelfde basiskolomstructuur. |
Combinaties | Werken met twee of meer afzonderlijke Tableau-databronnen. Data blijven gescheiden. Tableau doorzoekt de databronnen onafhankelijk van elkaar en visualiseert de resultaten samen in de weergave, op basis van de koppelingsvelden die voor dat blad zijn vastgelegd. Bootsen het gedrag van een left join na en kunnen data uit secundaire databronnen filteren. |
Opmerking: Het is ook mogelijk om data te combineren met Aangepaste SQL. Meestal is het het beste om data rechtstreeks op het canvas samen te voegen of om datacombinatie te gebruiken. Dat geeft Tableau de grootste flexibiliteit voor optimalisatie. In bepaalde scenario's kunnen er echter redenen zijn om Aangepaste SQL te gebruiken. Houd er rekening mee dat dit gevolgen voor de prestaties kan hebben, omdat Tableau gedwongen wordt de Aangepaste SQL-instructie uit te voeren zoals die geschreven is.
Relaties
Relateren is een methode voor het werken met data van meerdere tabellen op basis van gedeelde velden (kolommen) tussen die tabellen. Door een relatie tot stand te brengen, weet Tableau hoe rijen tussen tabellen kunnen worden verbonden. Tableau bewaart die informatie, maar brengt de rijen niet onmiddellijk bij elkaar, zoals wel gebeurt bij in code opgenomen joins. In plaats daarvan worden bij het maken van een visualisatie de bij de analyse betrokken velden via de relatie getraceerd en worden de juiste joins gemaakt om de correcte data te retourneren.
Omdat de data buiten de context van een visualisatie nooit in één tabel worden geforceerd, zijn relaties nuttig wanneer de data zich op verschillende detailniveaus of granulariteitsniveaus bevinden. Bijvoorbeeld wanneer u in een tabel met data over de dagelijkse neerslag moet werken, en in een andere tabel met de temperaturen per uur.
Zie Uw data relateren voor meer informatie over het combineren van tabellen met behulp van relaties:
Voor meer informatie over het combineren van tabellen met behulp van relaties, zie Uw data relateren en deze Tableau-blogposts:
- Relaties, deel 1: Introductie van nieuwe datamodellering in Tableau (in het Engels)(Link wordt in een nieuw venster geopend)
- Relaties, deel 2: Tips en trucs (in het Engels)(Link wordt in een nieuw venster geopend)
- Relaties, deel 3: Vragen stellen over meerdere gerelateerde tabellen (in het Engels)(Link wordt in een nieuw venster geopend)
Opmerking: In Tableau versie 2024.2 en hoger ondersteunt het Tableau-datamodel analyse op basis van meerdere feitentabellen en gedeelde dimensies via relaties op basis van meerdere feitentabellen. Zie Over datamodellen met relaties op basis van meerdere feitentabellen(Link wordt in een nieuw venster geopend), Wanneer een model met relaties op basis van meerdere feitentabellen gebruiken(Link wordt in een nieuw venster geopend) en Een datamodel maken met relaties op basis van meerdere feitentabellen(Link wordt in een nieuw venster geopend) voor meer informatie.
Een join maken
Joins maken is een methode voor het combineren van tabellen die gerelateerd zijn door gemeenschappelijke velden. Het resultaat van het combineren van data met behulp van een join is een tabel die horizontaal wordt uitgebreid door kolommen met data toe te voegen.
Zie Joins maken van uw data voor meer informatie over joins maken van data in Tableau.
Datacombinatie
Wanneer u datacombinatie gebruikt om uw data samen te voegen, combineert u data in een zogenaamde primaire databron met gemeenschappelijke velden uit een of meer secundaire databronnen.
Datacombinatie is handig als u de manier waarop de databron wordt geconfigureerd per blad moet wijzigen, en als u databases wilt combineren die geen relaties of joins toestaan, zoals kubusdatabronnen of gepubliceerde databronnen.
Het resultaat van het combineren van data met behulp van een datacombinatie is een virtuele tabel die horizontaal wordt uitgebreid door kolommen met data toe te voegen. De data uit elke databron worden geaggregeerd tot een gemeenschappelijk niveau voordat ze samen in de visualisatie worden weergegeven.
Zie Uw data combineren voor meer informatie over hoe datacombinatie werkt en hoe u het kunt gebruiken in Tableau.
Vereniging
Verenigen is een methode voor het toevoegen van waarden (rijen) aan tabellen. U kunt verenigde tabellen maken als ze dezelfde kolommen hebben. Het resultaat van het combineren van data met behulp van een vereniging is een virtuele tabel die dezelfde kolommen heeft maar verticaal wordt uitgebreid door rijen met data toe te voegen.
U kunt tabellen op twee manieren verenigen: handmatig of door te zoeken met jokertekens. Zie Uw data verenigen voor meer informatie over het verenigen van data met behulp van een van deze methoden in Tableau.
Overwegingen voor een Tableau-databron
Zorg er allereerst voor dat u duidelijk weet wat het doel van de databron is. Als u een allesomvattende databron maakt voor een grote verscheidenheid aan gebruikers met brede vragen, zou u het anders aanpakken dan wanneer u een nichedatabron zou maken die geoptimaliseerd is voor prestaties. Het is belangrijk om vanaf het begin uw doel te kennen.
Met dat doel voor ogen zijn er verschillende zaken die u moet overwegen en plannen voordat u een databron in Tableau bouwt:
- Locatie en toegang
- Vorm en netheid
- Het datamodel en het combineren van data
- Metadata en mogelijkheid tot aanpassing
- Schaalbaarheid, beveiliging en vindbaarheid
- Prestaties en nieuwheid
Locatie en toegang
De locatie van uw data kan zo eenvoudig zijn als één Excel-bestand op uw computer of een Google Spreadsheet dat u hebt gemaakt, of zo complex als meerdere databases die verschillende technologieën gebruiken. Toegang kan ook betrekking hebben op specifieke stuurprogramma's of connectors voor een database of op inloggegevens voor een databaseserver.
Vragen om rekening mee te houden:
- Hebben de juiste Tableau-gebruikers toegang en machtigingen voor zowel de data als Tableau?
- Welk gebruikersaccount moet worden gebruikt om in te loggen op de database?
- Zal gebruikersfiltering of beveiliging op rijniveau nodig zijn?
- Bevinden de brondata zich on-premises of in de cloud?
- Zijn er Ondersteunde connectors?
- Zijn er beperkingen voor die database (ondersteunt de database alle functionaliteit die u wilt gebruiken)?
Vorm en netheid
Mogelijk beschikt uw organisatie al over goed gestructureerde data waarmee u verbinding kunt maken of over ETL-processen die u kunt gebruiken, of moet u Tableau Prep Builder gebruiken om opschonings- en vormgevingsbewerkingen uit te voeren om uw data in een bruikbaar formaat te krijgen.
Vragen om rekening mee te houden:
- Zijn de data goed gestructureerd voor gebruik met Tableau?
- Moeten Tableau Prep Builder en Tableau Prep Conductor worden gebruikt voor het reinigen en automatiseren van flows voor datavoorbereiding?
- Welke berekeningen of manipulaties kunnen het beste native in Tableau worden uitgevoerd?
- Zijn delen van deze data overbodig? Ontbreken er data?
Het datamodel en het combineren van data
Tableau moet weten hoe de data die worden overgebracht door Het Tableau-datamodel moeten worden opgevraagd. Als de data uit meerdere tabellen komen, moeten de data worden gecombineerd. Methoden voor het combineren van data zijn onder meer relaties, joins, verenigingen en combinaties.
Vragen om rekening mee te houden:
- Zijn de data verspreid over meerdere systemen?
- Wat is voor elke datatabel de beste manier om die te combineren?
Metadata en mogelijkheid tot aanpassing
Data worden vaak opgeslagen op een manier die voor een persoon niet gemakkelijk te gebruiken is. Standaardveldnamen kunnen bijvoorbeeld onpraktisch zijn, aangepaste opmaak kan gewenst zijn, definities van afkortingen of codes kunnen ontbreken, of mogelijk zijn algemene berekeningen niet aanwezig in de onderliggende data. Het creëren van een semantische laag met deze stukjes informatie kan ervoor zorgen dat de data veel gemakkelijker te begrijpen en te gebruiken zijn.
Vragen om rekening mee te houden:
- Welke berekeningen moeten worden toegevoegd?
- Zijn de tabel- en veldnamen begrijpelijk?
- Zijn de standaardinstellingen voor de velden nuttig of moeten deze worden aangepast?
- Moeten er aanpassingen worden gedaan ter ondersteuning van Tableau Catalog?
Houd er rekening mee dat Data uitleggen momenteel geen databronnen met meerdere tabellen ondersteunt.
Schaalbaarheid, beveiliging en vindbaarheid
Een databron kan in de werkmap blijven staan waarin deze is gemaakt (een ingesloten databron) of onafhankelijk van enige analyse worden gepubliceerd naar Tableau Server of Tableau Cloud als een eigen inhoudsitem. Deze centralisatie van gepubliceerde databronnen heeft het extra voordeel van beveiliging en schaalbaarheid, waardoor meerdere gebruikers toegang hebben tot een consistente databron. Gepubliceerde databronnen kunnen ook profiteren van Tableau Catalog en aanbevelingen en bieden een enkele bron van waarheid voor een organisatie.
Vragen om rekening mee te houden:
- Moet de databron ingesloten blijven in de werkmap?
(Bij de volgende vragen wordt ervan uitgegaan dat de databron wordt gepubliceerd)
- Waar zal de databron gepubliceerd worden?
- Wie is de eigenaar van de databron?
- Welke verificatie en machtigingen moet de databron hebben?
- Zal de databron gecertificeerd zijn?
Prestaties en nieuwheid
Bovendien kunnen Tableau-databronnen liveverbindingen zijn met de brondata of kunnen de data worden gekopieerd als een vernieuwbaar extract. Extracten kunnen de analyseprestaties verbeteren of voorkomen dat databasesystemen uitgeput raken.
Vragen om rekening mee te houden:
- Moet de dataverbinding live zijn of een extract?
- Indien sprake is van een extract, is er een vernieuwingsschema? (Tableau Server | Tableau Cloud)
- Indien gepubliceerd naar Tableau Cloud, zal er gebruik gemaakt moeten worden van Tableau Bridge?
Databronnen van hoge kwaliteit bouwen
Er komt veel kijken bij een goed ontworpen en performante databron. U hoeft de eerste poging echter niet te publiceren. Net als het maken van een goede visualisatie kan het bouwen van een databron een continu proces zijn. Probeer eerst de data te combineren die u denkt nodig te hebben en kijk dan of u de gewenste visualisatie kunt opbouwen. U kunt altijd teruggaan en een nieuwe berekening opstellen of een andere tabel met data invoeren. Voer wat gebruikerstests uit en vraag of een collega de veldnamen kan achterhalen.
Het is natuurlijk het beste om alleen databronnen te publiceren waar u vertrouwen in hebt en alleen bronnen te certificeren die de kwaliteitsborging hebben doorstaan. Tegen de tijd dat uw databron zichtbaar is voor gebruikers, moeten zij erop kunnen vertrouwen.