Tableau-databeheer

Deze inhoud is onderdeel van Tableau Blueprint, een volwassenheidsframework waarmee u kunt inzoomen op en verbeteren hoe uw organisatie data gebruikt om impact te bevorderen. Om het traject te beginnen, voert u onze beoordeling(Link wordt in een nieuw venster geopend) uit.

 

Tableau-databeheer helpt u de data binnen uw analyseomgeving beter te beheren, zodat u zeker weet dat er altijd van vertrouwde en actuele data gebruik wordt gemaakt om beslissingen te nemen. Van datavoorbereiding tot catalogiseren, zoeken en beheer: Tableau Data Management vergroot het vertrouwen in uw data, waardoor de adoptie van selfservice-analyses wordt versneld. Het aanbod is een afzonderlijk gelicentieerde verzameling functies en functionaliteiten, waaronder Tableau Prep Conductor en Tableau Catalog, waarmee Tableau-inhoud en data-assets in Tableau Server en Tableau Cloud worden beheerd.

Wat is Tableau-databeheer?

Over het algemeen zal uw organisatie profiteren van benaderingen betreffende datagovernance en databronbeheer die elders in Tableau Blueprint worden besproken. Naast deze methodologieën zal u vaak algemene verwijzingen naar de term databeheer horen in de database-, data-analyse- en visualisatie-community's. Deze term wordt echter specifieker als het gaat om Tableau met Tableau Data Management, een set met mogelijkheden voor gebruik met Tableau Server en Tableau Cloud. Ongeacht of u Tableau Server gebruikt voor Windows of Linux, of Tableau Cloud, zijn de functies van Tableau Data Management grotendeels identiek (een kleine subset van functies is mogelijk alleen beschikbaar in Tableau Cloud of in Tableau Server).

Tableau Data Management omvat een reeks tools waarmee de data-stewards en analisten van uw organisatie datagerelateerde inhoud en assets in uw Tableau-omgeving kunnen beheren. Concreet worden er drie extra functiesets toegevoegd als u Tableau Data Management aanschaft:

  • Tableau Catalog

  • Tableau Prep Conductor

  • Virtuele verbindingen met databeleid

Tableau Catalog

Dé originele functie van Tableau Data Management, Tableau Catalog biedt functies om de toegang tot en het inzicht en vertrouwen in Tableau-databronnen te helpen stroomlijnen. Doordat Tableau Catalog zich richt op gebieden als herkomst, datakwaliteit, zoeken en impactanalyse, kan het voor data-stewards en datavisualiseerders/analisten gemakkelijker worden om databronnen in Tableau Server en Cloud te begrijpen en te vertrouwen. Tableau Catalog bevat extra functies voor Tableau-ontwikkelaars via metadatamethoden in de Tableau REST-API.

Wanneer Tableau Catalog voor het eerst wordt ingeschakeld, worden alle gerelateerde inhouditems in uw Tableau Server- of Cloud-site gescande om een verbonden weergave van alle gerelateerde objecten op te bouwen (Tableau Catalog noemt dit inhoudmetadata). Dit breidt de zoekmogelijkheden uit, waardoor u verder kunt gaan dan alleen dataverbindingen. Data-stewards en visuele auteurs kunnen ook zoeken op basis van kolommen, databases en tabellen.

Om de kans te verkleinen dat u per ongeluk een object wijzigt of verwijdert waarvan een ander object afhankelijk is (bijvoorbeeld als u een databasekolom hernoemt of verwijdert die essentieel is voor een productiewerkmap), worden in De herkomstfunctie van Tableau Catalog de onderlinge relaties blootgelegd tussen alle inhoud op een Tableau-site, inclusief statistieken, flows en virtuele verbindingen. U kunt nu gemakkelijk de relaties tussen objecten zien en de impact van een aankomende wijziging analyseren voordat u deze doorvoert.

 

Om het vertrouwen in uw Tableau-databronnen te vergroten, biedt Tableau Catalog aanvullende informatie, zoals uitgebreide datagerelateerde objectbeschrijvingen, de datadetailsweergave en trefwoordtags voor verbeterde zoekflexibiliteit. Met Databronnen certificeren plaatst u een prominent pictogram naast databronnen om aan te geven dat de eigenaar of beheerder van een databron vertrouwen heeft in de databron. Data-items (databronnen, kolommen, enzovoort) die consumenten aanleiding kunnen geven tot bezorgdheid, zoals verouderde data, kunnen worden aangeduid met datakwaliteitswaarschuwingen. Naast een datakwaliteitswaarschuwing kunt u gevoelige data markeren met gevoeligheidslabels.

 

 

Tableau Prep Conductor

Waarschijnlijk hebt u net als vele andere Tableau-klanten ontdekt welke voordelen Tableau Prep Builder oplevert als het gaat om de aanmaak van geavanceerde 'flows' voor datavoorbereiding. Hierbij worden onder andere meerdere databronnen gecombineerd en kolommen aangepast, worden data vormgegeven en uitvoer naar een of meer gewenste data-indeling mogelijk gemaakt. Maar als u eenmaal de perfecte voorbereidingsflow hebt gecreëerd, hoe automatiseert u deze dan zodat databronnen volgens een planning worden uitgevoerd en volledig of stapsgewijs worden bijgewerkt?

Dit is waar Tableau Prep Conductor, een andere functie van Data Management, in het spel komt. Tableau Prep Conductor maakt een flexibele planning van Tableau Prep Flows mogelijk, ongeacht of ze vanuit Tableau Prep Builder naar uw Tableau Server- of Tableau Cloud-omgeving worden gepubliceerd of rechtstreeks in een browser worden gemaakt met Prep Flow-webauthoring. Begin met het testen van uw webgebaseerde flow (u kunt flows handmatig on demand uitvoeren zonder Data Management, maar u moet Data Management wel aanschaffen om te plannen dat flows automatisch worden uitgevoerd met Prep Conductor). De flow moet volledig voltooid zijn en de gewenste uitvoerdatabron foutloos voordat u deze inplant.

Als uw Tableau Server gebruikt, kan uw beheerder (of u, als u over de juiste rechten beschikt) aangepaste planningen maken (zoals 'Dagelijks om middernacht', 'Zondag om 12.00 uur', enzovoort) om voorbereidingsflows uit te voeren, op dezelfde manier als bij extractvernieuwingen.

Als u Tableau Cloud gebruikt, wordt er standaard een set vooraf gedefinieerde voorbereidingsflowplanningen geïnstalleerd. U kunt deze niet aanpassen of uw eigen voorbereidingsflowplanningen maken.

Plan de uitvoering van flows vanuit het menu Acties. Een planning met Eén taak voert alleen de geselecteerde voorbereidingsflow uit volgens de planning die u selecteert. Met een Gekoppelde taak kunt u een of meer aanvullende flows selecteren om op volgorde met de geselecteerde flow uit te voeren. Dit is handig in het geval dat u meerdere flows wil 'ketenen' om in een specifieke volgorde uit te voeren, bijvoorbeeld om één databronuitvoer te maken die als invoerdata kan worden gebruikt voor een volgende flow. De flows worden nu volgens planning uitgevoerd, zodat databronnen waarop Tableau-werkmappen mogelijk zijn gebaseerd automatisch worden bijgewerkt of gemaakt.

Naast dat u met Data Management en Tableau Prep Conductor de mogelijkheid hebt om flows in te plannen, zitten er ook opties bij om het slagen/mislukken van geplande flows te monitoren, e-mailmeldingen te verzenden wanneer flowplanningen slagen of mislukken, programmatisch flows uit te voeren met de REST-APIvan Tableau Server/Cloud en te profiteren van extra mogelijkheden voor de beheerweergave om de geschiedenis van de flowprestaties te monitoren.

AANBEVELING VOOR BEST PRACTICE: Als u van plan bent een groot aantal Tableau Prep Conductor-flows op Tableau Server uit te voeren, moet u mogelijk de schaal van uw serveromgeving aanpassen. Stem indien nodig de prestaties van uw Tableau Server-systeem af door extra knooppunten of achtergrondprocessen toe te voegen om tegemoet te komen aan de vereiste voorbereidingsflowbelasting.

Hoe zit dat met Tableau Cloud? Hoewel u wat betreft de voorbereidingsflowcapaciteit geen architectonische wijzigingen in Tableau Cloud hoeft aan te brengen, bent uw wel verplicht om een resourceblok aan te schaffen (een eenheid van Tableau Cloud-computingcapaciteit) voor elke Tableau Prep Conductor-flow die u gelijktijdig wilt inplannen. Bepaal hoeveel gelijktijdige flowplanningen u nodig hebt en schaf dienovereenkomstig Tableau Cloud-resourceblokken aan.

 

Virtuele verbindingen

Op naar onze volgende Data Management-functie: virtuele verbindingen. Een virtuele verbinding biedt een centraal toegangspunt tot data. Deze heeft toegang tot meerdere tabellen in verschillende databases. Met virtuele verbindingen kunt u data-extrahering en -beveiliging op één plek beheren, op verbindingsniveau.

In welke situaties zijn virtuele verbindingen nuttig?

Overweegt u een traditionele manier om een databaseverbinding te delen met meerdere werkmappen in Tableau? Dan denkt u waarschijnlijk aan rechtstreeks verbinding maken met een databaseserver zoals SQL Server of Snowflake, referenties voor de database verstrekken, een of meer tabellen toevoegen en samenvoegen, en vervolgens de databron naar Tableau Server of Tableau Cloud publiceren. Hoewel zo’n soort liveverbinding met data natuurlijk een optie is, kan het heel goed zijn dat u data uit de databron wilt extraheren om verbonden werkmappen te versnellen.

Stelt u zich voor dat u dit een willekeurig aantal keer doet om bijvoorbeeld ruimte te bieden aan een andere set tabellen of joins. Dat resulteert in meerdere gepubliceerde (en misschien geëxtraheerde) databronnen die voor een reeks werkmappen worden gebruikt. Voor die werkmappen gelden verschillende tabel-/joinvereisten, maar wordt wel dezelfde initiële database gebruikt.

Laten we nu eens kijken wat er gebeurt als er iets verandert aan de oorspronkelijke SQL Server- of Snowflake-database waarnaar in die reeks databronnen wordt verwezen. Misschien worden tabellen hernoemd, worden er extra velden toegevoegd of worden databasereferenties gewijzigd. U moet dan elk van de eerder gemaakte databronnen gaan openen, de nodige wijzigingen aanbrengen om aan de databasewijziging tegemoet te komen, en opnieuw publiceren (en misschien extractvernieuwingen opnieuw in te plannen).

Het is mogelijk veel handiger om slechts één initiële dataverbindingsdefinitie te maken waarin de naam van de databaseserver, de referenties en tabelreferenties worden opgeslagen. Misschien geeft u wel de voorkeur aan data uit die grotere ‘definitie’ te extraheren. Wanneer u vervolgens verschillende databronnen moet maken voor verschillende combinaties van tabellen, joins, enzovoort, kunt u naar die initiële ‘definitie’ verwijzen in plaats van rechtstreeks verbinding te maken met een of meer databaseservers. Als er iets in de kerndatabasestructuur verandert (bijvoorbeeld tabelnamen veranderen of referenties worden gewijzigd), hoeft u alleen het initiële “definitie”-object aan te passen en dan nemen alle afhankelijke databronnen de wijzigingen automatisch over.

Met de functie Data Management wordt deze gedeelde “definitie” mogelijk gemaakt via een virtuele verbinding. Een virtuele verbinding is vergelijkbaar met een standaard databronverbinding, omdat hierin de databaseserver, referenties en geselecteerde tabellen worden opgeslagen. Net als bij een traditionele Tableau-databron kan u een virtuele verbinding met meer dan één database/databron verbinden (elk met zijn eigen set referenties en tabellen). Hoewel sommige wijzigingen in de metadata zijn toegestaan in een virtuele verbinding (bijvoorbeeld velden verbergen of hernoemen), worden tabellen niet samengevoegd binnen de virtuele verbinding. Wanneer u de virtuele verbinding uiteindelijk gebruikt als directe bron voor een werkmap of als verbindingstype voor een extra gepubliceerde databron, kunt u tabellen samenvoegen en verdere aanpassingen aan de databron uitvoeren.

Zodra er een virtuele verbinding is gemaakt en gepubliceerd naar Tableau Server of Tableau Cloud en de juiste machtigingen zijn ingesteld, kunt u verbinding maken met de virtuele verbinding in Tableau Desktop of Tableau Server/Cloud, net zoals u met elke andere databron zou doen. U hoeft echter geen databaseserverlocatie op te geven of referenties op te geven, en u kunt tabellen onmiddellijk samenvoegen en doorgaan met het visualiseren van data of het publiceren van de databron.

 

Databeleid

Naast de eerder beschreven gecentraliseerde databaseverbindingsfuncties bieden de virtuele verbindingen van Tableau Data Management ook een meer gestroomlijnde gecentraliseerde optie voor beveiliging op rijniveau met databeleid. Gebruik een databeleid om beveiliging op rijniveau toe te passen op een of meer tabellen in een virtuele verbinding. Met een databeleid wordt de data gefilterd, zodat gebruikers alleen die data zien die ze zouden moeten zien. Het databeleid is van toepassing op zowel live- als extractverbindingen.

In welke situaties is databeleid handig?

In veel organisaties is het gebruikelijk om de data die zichtbaar is in een visualisatie automatisch te beperken tot datgene wat van toepassing is op de huidige gebruiker. Denk bijvoorbeeld aan een gedeeld dashboard dat bestelgegevens bevat in een kruistabelobject.

  • Als u een verkoopmanager bent voor een groot gebied, worden in het kruistabblad met details de bestellingen voor elke accountmanager in uw gebied getoond.

  • Als u echter een individuele accountmanager bent, worden in de kruistabel met details alleen bestellingen voor uw accounts getoond.

In dit scenario moet beveiliging op rijniveau worden geïmplementeerd in uw Tableau-omgeving volgens een van de volgende methoden:

  • Beveiliging op rijniveau in de database. Elke keer dat een visualisatie wordt bekeken, worden gebruikers gevraagd zich aan te melden bij de onderliggende database met eigen referenties, of de referenties worden overgenomen van hun Tableau-gebruikersaccount. De resulterende dataset wordt beperkt tot alleen data die ze mogen zien op basis van de verstrekte referenties. Niet alleen kan dit snel vervelend worden omdat elke gebruiker zijn eigen referenties moet bijhouden, maar ook kunnen de prestaties beïnvloed worden door de livedataverbinding doordat deze een grote last op de onderliggende database legt. Bovendien kunnen sommige opties voor het doorgeven van referenties aan liveverbindingen beperkt zijn met Tableau Cloud.

  • Tableau-gebruikersfilters. Gebruikersfilters worden toegepast bij het maken van individuele werkbladen binnen een werkmap. Door combinaties van individuele Tableau-gebruikersreferenties of lidmaatschap van een of meer Tableau-gebruikersgroepen op te geven, kunnen individuele werkbladen worden gefilterd om alleen data weer te geven die relevant zijn voor die gebruiker. Dit kan vervelend zijn, omdat voor elk afzonderlijk werkblad in een werkmap gebruikersfilters moeten worden opgegeven. Er is geen manier om met één proces een gebruikersfilter voor een grote groep werkmappen te specificeren. Als een gebruiker bovendien per ongeluk bewerkingsmachtigingen voor de werkmap heeft gekregen, kan deze het gebruikersfilter eenvoudig van de filtercontainer slepen en alle onderliggende data zien waarvoor deze mogelijk geen toestemming heeft om deze te bekijken.

Door gebruik te maken van een subset van de Tableau-berekeningstaal kan u met databeleid geavanceerde regels specificeren, bijvoorbeeld door gebruik te maken van een gerelateerde ‘rechtentabel’ in een database. Zo wordt de data die de virtuele verbinding retourneert aangepast en beperkt op basis van gebruikers-ID of groepslidmaatschap. Op deze manier wordt de beveiliging op rijniveau op databronniveau gehandhaafd: alle werkmappen die met de databron zijn verbonden, nemen automatisch de beveiliging en eventuele wijzigingen over die binnen de virtuele verbinding zijn aangebracht. Dat niet alleen, er wordt zo een extra beveiligingslaag toegevoegd door elke wijziging van databeleid te beperken tot alleen die gebruikers met bewerkingsrechten voor de oorspronkelijke virtuele verbinding.