Prestaties verbeteren voor joins op basis van meerdere databases
Belangrijk: Met deze functie worden data tijdelijk buiten Tableau verplaatst. Zorg ervoor dat de database waarmee u verbinding maakt afkomstig is van een vertrouwde bron.
U kunt de prestaties verbeteren wanneer u joins maakt van data uit één bestand en één database door Tableau de join via de database te laten uitvoeren in plaats van Hyper. Wanneer deze optie is ingeschakeld, kiest Tableau de snelste optie (Hyper of de verbonden database). Als Tableau de verbonden database gebruikt, worden de data van de bestandsverbinding verplaatst naar tijdelijke tabellen in de database en wordt de join daar uitgevoerd.
Functievoorwaarden
Deze optie is alleen beschikbaar als aan de volgende voorwaarden is voldaan:
- De databron bestaat uit één of meer bestandsgebaseerde verbindingen en één SQL-gebaseerde verbinding.
- Het bestand is van het type Microsoft Excel, PDF of Tekst (.csv, .txt, .tsv of .tab).
- De verbonden database is een van de volgende:
- Microsoft SQL Server
- Oracle
- PostgreSQL
- Vertica
- Teradata
- Het join-type is een binnenste join.
- In webauthoring: De optie Gebruikers toestaan om webauthoring te gebruiken is ingeschakeld.
Functievoorwaarden overschrijven
Als beheerder kunt u de beperkingen voor bestandsgrootte, join-typen en verbindingen met één bestand overschrijven en Tableau dwingen de live database te gebruiken om de join uit te voeren. Hiermee kunt u experimenteren en optimale prestatieconfiguraties bepalen. De vereiste van één enkele databaseverbinding is nog steeds van toepassing.
Om deze optie in te schakelen, voert u de volgende informatie in op de opdrachtregel:
- Tableau Desktop: Voer de volgende opdracht in:
tableau.exe -DForceAlternativeFederationEngine=true
- Tableau Server: Voer de tsm configuration-opdracht in:
tsm configuration set -k native_api.force_alternative_federation_engine -v true
Zie tsm configuration set-opties(Link wordt in een nieuw venster geopend) in de helpsectie van Tableau Server voor meer informatie over het instellen van configuratiewaarden in Tableau Server.
De prestatieoptie voor joins op basis van meerdere databases inschakelen
- Maak verbinding met de eerste databron.
- In Tableau Desktop: Maak op de startpagina onder Verbinding maken verbinding met een ondersteund bestandstype of een ondersteund databasetype. Met deze stap wordt de eerste verbinding in de Tableau-databron gemaakt.
- In webauthoring:Klik vanaf de Startpagina of de pagina Verkennen op Maken> Werkmap om een nieuwe werkmap te starten en vervolgens verbinding te maken met uw data. Met deze stap wordt de eerste verbinding in de Tableau-databron gemaakt.
- Selecteer het bestand of de database waarmee u verbinding wilt maken en dubbelklik vervolgens op een tabel of sleep deze naar het canvas.
Klik in het linkerdeelvenster onder Verbindingen op de knop Toevoegen ( in webauthoring) om uw tweede verbinding aan de Tableau-databron toe te voegen.
De optie Join op basis van meerdere databases wordt weergegeven.
Opmerking: Als u deze optie niet ziet, controleer dan of u alleen ondersteunde databronnen gebruikt en of u slechts twee databronnen hebt (één bestand en één databasetype). Anders heeft de sitebeheerder mogelijk de configuratieoptie Joins op basis van meerdere databases ingesteld op Alleen Tableau.
- Om te wijzigen hoe Tableau de join uitvoert, klikt u naast de optie Join op basis van meerdere databases op Bewerken.
- Selecteer in het dialoogvenster Join op basis van meerdere databases een van de volgende opties en klik vervolgens op OK:
- Tableau of bestaande databases gebruiken. Met deze optie kan Tableau de snelste optie kiezen om de join uit te voeren: Hyper of de database waarmee u verbonden bent.
- Alleen Tableau gebruiken. Deze optie is de standaardoptie en maakt altijd gebruik van Hyper om de join uit te voeren.
De optie Join op basis van meerdere databases verandert van de standaardoptie Tableau gebruiken (met behulp van Hyper) naar de nieuwe optie Uw database gebruiken, afhankelijk van wat u kiest.
Belangrijk: Als u Tableau of bestaande databases gebruiken selecteert, kiest Tableau de snelste optie bij het uitvoeren van de join. Dit gedrag wordt vooraf bepaald door een reeks criteria, waaronder join-typen. Tableau kiest bijvoorbeeld altijd Hyper voor niet-binnenste joins.
Als Tableau Hyper gebruikt om de join uit te voeren, vindt dit proces op de achtergrond plaats en wordt er geen indicator weergegeven die aangeeft waar de join is uitgevoerd. - Voeg een of meer JOIN-componenten toe door een veld uit één databron, een join-operator en een veld uit de toegevoegde tabel te selecteren. Controleer de JOIN-component om er zeker van te zijn dat deze weerspiegelt hoe u de tabellen wilt verbinden.
Over het werken met databronnen met meerdere verbindingen
Het werken met databronnen met meerdere verbindingen is hetzelfde als het werken met elke andere databron, met een paar kanttekeningen die in deze sectie worden besproken.
Data verenigen vanuit een verbinding
Om data te verenigen, moet u teksttabellen of Excel-tabellen uit dezelfde verbinding gebruiken. Dat wil zeggen dat u geen tabellen uit verschillende databases kunt verenigen. In Tableau Desktop kunt u tabellen uit verschillende Excel-werkmappen en bestanden in verschillende directory's verenigen. Zie Tabellen verenigen met behulp van een zoekopdracht met jokertekens (Tableau Desktop) voor meer informatie.
Als u data uit verschillende databases wilt verenigen, gebruikt u Tableau Prep(Link wordt in een nieuw venster geopend).
Sortering
Sortering verwijst naar de regels van een database die bepalen hoe tekenreekswaarden moeten worden vergeleken en gesorteerd. Normaal gesproken wordt de sortering door de database afgehandeld. Wanneer u echter met joins op basis van meerdere databases werkt, is het mogelijk dat u een join maakt van kolommen met verschillende sorteringen.
Stel bijvoorbeeld dat uw join op basis van meerdere databases gebruikmaakt van een join-sleutel die bestaat uit een hoofdlettergevoelige kolom uit SQL Server en een niet-hoofdlettergevoelige kolom uit Oracle. In dergelijke gevallen koppelt Tableau bepaalde sorteringen aan andere sorteringen om de kans op onjuiste interpretatie van waarden te minimaliseren.
De volgende regels worden gebruikt bij joins op basis van meerdere databases:
- Als een kolom de sorteringsnormen van de International Components for Unicode (ICU) gebruikt, gebruikt Tableau de sortering van de andere kolom.
- Als alle kolommen de sorteringsnormen van de ICU gebruiken, gebruikt Tableau de sortering van de kolom uit de linkertabel.
- Als geen enkele kolom de sorteringsnormen van de ICU gebruikt, gebruikt Tableau een binaire sortering. Bij binaire sortering bepalen de landinstellingen van de database en het datatype van de kolommen hoe tekenreekswaarden moeten worden vergeleken en gesorteerd.
Hoofdlettergevoeligheid behouden voor Excel-data
Als u hoofdlettergevoeligheid voor uw Excel-data wilt behouden bij het uitvoeren van joins, kunt u de optie Tekengrootte behouden (Excel) in het menu Data inschakelen.
Wanneer deze optie is geselecteerd, behoudt Tableau het hoofdlettergebruik en worden waarden met verschillend hoofdlettergebruik op unieke wijze geïdentificeerd in plaats van dat ze worden gecombineerd, wat resulteert in een ander aantal rijen.
Denk bijvoorbeeld aan een werkblad met 'Huis' en een ander met 'huis' en 'HUIS'. Standaard negeert Tableau het hoofdlettergebruik en beschouwt alle drie de varianten van 'huis' als hetzelfde. Als de optie Tekengrootte behouden (Excel) is ingeschakeld, behoudt Tableau de verschillen in hoofdlettergebruik wanneer u joins maakt van tabellen. 'Huis', 'huis' en 'HUIS' worden als verschillende waarden behandeld.
Opmerking: Deze optie is beschikbaar voor alle door Tableau ondersteunde talen en is niet afhankelijk van de landinstellingen van uw besturingssysteem. Deze optie is alleen beschikbaar voor Microsoft Excel-databronnen.
Berekeningen en databronnen met meerdere verbindingen
Er kan slechts een subset van de berekeningen worden gebruikt in een databron met meerdere verbindingen.
- In Tableau Desktop: U kunt een specifieke berekening gebruiken als beide mogelijkheden van toepassing zijn:
- Ondersteund door alle verbindingen in de databron met meerdere verbindingen
- Ondersteund door Tableau-extracten.
- Bij webauthoring (Tableau Cloud en Tableau Server): U kunt een specifieke berekening gebruiken als deze wordt ondersteund door alle verbindingen in de databron met meerdere verbindingen.
Opgeslagen procedures
Opgeslagen procedures zijn niet beschikbaar voor databronnen met meerdere verbindingen.
Data draaien vanuit een verbinding
Om data te draaien, moet u tekstkolommen of Excel-kolommen uit dezelfde verbinding gebruiken. Dat wil zeggen dat u geen kolommen uit verschillende databases in een draaitabel kunt opnemen.
Van extractbestanden de eerste verbinding maken (alleen Tableau Desktop)
Wanneer u verbinding maakt om bestanden uit een databron met meerdere verbindingen te extraheren, moet u ervoor zorgen dat de verbinding met het extractbestand (.hyper) de eerste verbinding is. Hiermee blijven alle aanpassingen behouden die mogelijk deel uitmaken van het extract, inclusief wijzigingen in standaardeigenschappen, berekende velden, groepen, aliassen, enzovoort.
Opmerking: Als u verbinding moet maken met meerdere extractbestanden in uw databron met meerdere verbindingen, worden alleen de aanpassingen in het extract in de eerste verbinding behouden.
Extracten van databronnen met meerdere verbindingen die verbindingen bevatten met op bestanden gebaseerde data (alleen Tableau Desktop)
Als u een extract van een databron met meerdere verbindingen publiceert met op bestanden gebaseerde data, zoals Excel, kopieert u met het selecteren van de optie Externe bestanden opnemen de op bestanden gebaseerde data als onderdeel van de databron. In dit geval kan een kopie van uw op bestanden gebaseerde data worden gedownload en kunnen andere gebruikers toegang krijgen tot de inhoud ervan. Als er gevoelige informatie in de op bestanden gebaseerde data staat die u opzettelijk uit uw extract hebt weggelaten, selecteert u Externe bestanden opnemen niet wanneer u de databron publiceert.
Zie Een databron publiceren voor meer informatie over het publiceren van databronnen.
Over query's en joins op basis van meerdere databases
Voor elke verbinding stuurt Tableau onafhankelijke query's naar de databases in de join. De resultaten worden opgeslagen in een tijdelijke tabel, in de vorm van een extractbestand.
Belangrijk: Joins op basis van meerdere databases kunnen data tussen databases verplaatsen. Zorg ervoor dat de databases waarvoor u een join maakt, betrouwbare bronnen zijn.
Stel dat u bijvoorbeeld verbindingen maakt met twee tabellen: dbo.listings en reviews$. Deze tabellen worden opgeslagen in twee verschillende databases: SQL Server en Excel. Tableau voert onafhankelijk query's uit op de database in elke verbinding. De database voert de query uit en past aanpassingen toe, zoals filters en berekeningen. Tableau slaat de resultaten voor elke verbinding op in een tijdelijke tabel. In dit voorbeeld is FQ_Temp_1 de tijdelijke tabel voor de verbinding met SQL Server en FQ_Temp_2 de tijdelijke tabel voor de verbinding met Excel.
SQL Server-tabel | Excel-tabel |
Wanneer u een join op basis van meerdere databases uitvoert, wordt een join gemaakt van de tijdelijke tabellen door Tableau Desktop. Deze tijdelijke tabellen zijn nodig om Tableau joins op basis van meerdere databases te laten uitvoeren.
Nadat een join van de tabellen is gemaakt, wordt een Top N-filter toegepast om het aantal waarden dat in het dataraster wordt weergegeven, te beperken tot de eerste 1.000 rijen. Dit filter wordt toegepast om de responsiviteit van het dataraster en de algehele prestaties van de pagina Databron te behouden.
Tabellen waarvoor een join is gemaakt