Tableau Catalog inschakelen
Tableau Catalog(Link wordt in een nieuw venster geopend) ontdekt en indexeert alle inhoud op uw Tableau Cloud-site of Tableau Server, inclusief werkmappen, databronnen, spreadsheets, statistieken en flows. (De verouderde functie Statistieken is in februari 2024 buiten gebruik gesteld voor Tableau Cloud en in Tableau Server versie 2024.2. Zie Statistieken maken en problemen met statistieken oplossen (buiten gebruik gesteld) voor meer informatie.) Indexering wordt gebruikt om informatie te verzamelen over de inhoud, of metadata, over het schema en de herkomst van de inhoud. Catalog identificeert vervolgens op basis van de metadata alle databases, bestanden en tabellen die worden gebruikt door de inhoud op uw Tableau Cloud-site of Tableau Server.
Catalog is verkrijgbaar met de Databeheer-licentie. Zie Over Databeheer voor meer informatie.
Naast Catalog zijn metadata over uw inhoud ook toegankelijk via de Tableau Metadata-API(Link wordt in een nieuw venster geopend) en de Tableau REST API met Metadatamethoden(Link wordt in een nieuw venster geopend).
Voordat u Catalog inschakelt
Als beheerder van Tableau Server moet u rekening houden met een aantal zaken voordat en terwijl u Catalog inschakelt. Zo zorgt u ervoor dat Catalog optimaal presteert in uw Tableau Server-omgeving.
Vereiste versies
Zorg dat u één van de volgende versies van Tableau Server gebruikt voordat u Catalog inschakelt:
- Minimaal Tableau Server 2019.3.4 of hoger
- Minimaal Tableau Server 2019.4.2 of hoger
- Minimaal Tableau Server 2020.1.0 of hoger
- Minimaal Tableau Server 2020.2.15 of hoger
- Tableau Server 2020.3 en hoger
Zie de Tableau Knowledgebase voor meer informatie over waarom deze versies vereist zijn.
Wat u kunt verwachten bij het inschakelen van Catalog
Wanneer Catalog is ingeschakeld, wordt de inhoud die al op uw Tableau Server bestaat onmiddellijk geïndexeerd.
Initiële opname
Het indexeringsproces bestaat uit twee primaire componenten, waarvan één initiële opname wordt genoemd. De initiële opname kan worden onderverdeeld in twee aanvullende componenten:
- Content-backfill
- Herkomst-backfill
Het is belangrijk om de status van de inhoud-backfill en de herkomst-backfill later te noteren bij het monitoren van de voortgang en het valideren dat Catalog met succes is ingeschakeld en actief is in uw Tableau Server-omgeving.
Snelheid van initiële opname
De tijd die Catalog nodig heeft om de inhoud voor de eerste keer te indexeren, is afhankelijk van een aantal factoren:
Hoeveelheid inhoud op Tableau Server: de hoeveelheid inhoud wordt gemeten aan de hand van het totale aantal werkmappen, statistieken, gepubliceerde databronnen en flows die naar Tableau Server zijn gepubliceerd. Zie Schijfruimte om metadata op te slaan voor meer informatie.
Aantal niet-interactieve microservicecontainers: Catalog gebruikt de niet-interactieve microservicecontainers om alle inhoud op Tableau Server te indexeren. Zie Geheugen voor niet-interactieve microservicecontainers voor meer informatie.
Als u de factoren begrijpt die van invloed zijn op de initiële opname, kunt u beter inschatten hoe lang het kan duren voordat Catalog in uw omgeving is ingeschakeld en wordt uitgevoerd.
Schijfruimte om metadata op te slaan
Tijdens de initiële opname worden metadata gegenereerd en opgeslagen in de Tableau Server-opslagplaats (’relatie’ PostgreSQL-database). De hoeveelheid schijfruimte die nodig is om de metadata op te slaan bedraagt grofweg de helft van de schijfruimte die momenteel wordt gebruikt door de opslagplaats (’werkgroep’ PostgreSQL-database).
Stel bijvoorbeeld dat de opslagplaats 50 GB schijfruimte gebruikt voordat Catalog wordt ingeschakeld. Dan kan de opslagplaats tot 75 GB schijfruimte gebruiken nadat Catalog is ingeschakeld.
Geheugen voor niet-interactieve microservicecontainers
De initiële opname vindt plaats in de niet-interactieve microservicecontainer. De niet-interactieve microservicecontainer is een van de twee processen voor Tableau Server-microservicecontainers(Link wordt in een nieuw venster geopend). Standaard wordt één exemplaar van het proces voor niet-interactieve microservicecontainers toegevoegd aan elk knooppunt waarop een achtergrondproces is geïnstalleerd.
Standaard kan de initiële opname op één exemplaar van de niet-interactieve microservicecontainer maximaal 4 GB geheugen op het Backgrounder-knooppunt gebruiken. Als de hoeveelheid inhoud op Tableau Server groter is dan 10.000, kan een proces voor niet-interactieve microservicecontainers tot 16 GB geheugen op het Backgrounder-knooppunt vereisen. Zorg er daarom bij het inschakelen van Catalog voor dat elk Backgrounder-knooppunt de beschikbare capaciteit heeft om elke niet-interactieve microservicecontainer te ondersteunen tijdens de initiële opname. Als de capaciteit moet worden vergroot, moet u de JVM-heapgrootte voor niet-interactieve microservicecontainers bijwerken om maximaal 16 GB geheugen toe te wijzen aan de Backgrounder-knooppunten. Zie noninteractive.vmopts voor meer informatie.
Als u van plan bent meer niet-interactieve microservicecontainers toe te voegen om de tijd van initiële opname te verkorten, bepaalt u eerst hoeveel containers er in totaal nodig zijn (met behulp van Stap 2: Inschatten hoe lang de initiële opname zal duren hieronder). Controleer vervolgens of uw Tableau Server-omgeving is geconfigureerd met voldoende capaciteit om alle niet-interactieve microservicecontainers te ondersteunen. Afhankelijk van hoe uw Tableau Server-omgeving al is geconfigureerd, kunt u mogelijk niet alle aanvullende niet-interactieve microservicecontainers toevoegen die u nodig hebt om de initiële opnametijd te verkorten.
Aanbevolen procedures voor het inschakelen van Catalog
Omdat de snelheid van de initiële opname en de vereisten uniek zijn voor elke Tableau Server-omgeving, raadt Tableau aan dat u, wanneer u Catalog inschakelt, een of meer van de volgende handelingen uitvoert:
Zorg dat er voldoende schijfruimte is die de Tableau Server-opslagplaats kan gebruiken ter ondersteuning van de aanvullende metadata die bij de initiële opname worden gegenereerd en opgeslagen. Als algemene regel heeft de opslagplaats 50% extra schijfruimte nodig dan die momenteel door de opslagplaats wordt gebruikt. Zie Schijfruimte op server voor meer informatie over het schijfgebruik van Tableau Server.
Zorg er, afhankelijk van de hoeveelheid inhoud op Tableau Server, voor dat tijdens de initiële opname elk Backgrounder-knooppunt ten minste 4-16 GB beschikbaar geheugen heeft voor elk exemplaar van een niet-interactieve microservicecontainer.
Voer het proces gedurende het weekend uit, zodat de initiële opname kan worden voltooid voordat uw gebruikers de Catalog-mogelijkheden gaan gebruiken.
Voer het proces eerst uit in een testomgeving met productie-inhoud. Dit komt omdat het type inhoud dat moet worden opgenomen een belangrijke rol kan spelen bij de opnamesnelheid.
Samenvatting van de stappen om Catalog in te schakelen
De volgende stappen vatten het proces samen voor het inschakelen en uitvoeren van Catalog op Tableau Server. De stappen moeten opeenvolgend worden uitgevoerd.
- De hoeveelheid inhoud op Tableau Server bepalen
- Inschatten in hoe lang de initiële opname zal duren
- De tijd van de initiële opname verkorten
- De Databeheer-licentie activeren
- Catalog-mogelijkheden uitschakelen
- De opdracht tsm maintenance metadata-services uitvoeren
- De voortgang van de initiële opname monitoren en de status ervan valideren
- SMTP configureren
- Catalog-mogelijkheden inschakelen
Opmerking: omdat het indexeren van metadata over Tableau-inhoud op Tableau Server mogelijk wordt gemaakt door de Metadata-API, is het inschakelen van de Metadata-API vereist om Catalog uit te kunnen voeren en te gebruiken.
Catalog inschakelen
Stap 1: de hoeveelheid inhoud op Tableau Server bepalen
Ga als volgt te werk om de hoeveelheid inhoud op Tableau Server te bepalen:
Meld u aan bij Tableau Server met uw beheerdersreferenties.
Ga naar de pagina Verkennen.
Klik op het vervolgkeuzemenu Projecten op hoogste niveau en voeg de cijfers naast Alle werkmappen, Alle statistieken, Alle databronnen en Alle flows samen toe. Dit is de totale hoeveelheid inhoud op Tableau Server.
Stap 2: inschatten in hoe lang de initiële opname zal duren
Om te schatten hoeveel tijd Catalog nodig heeft om voor de eerste keer inhoud in Tableau Server op te nemen (initiële opname), vergelijkt u uw Tableau Server-installatie met een basisconfiguratie van Tableau Server.
Voor een Tableau Server met de volgende configuratie kan de initiële opname ongeveer zes uur duren.
Componenten | Basiswaarden |
---|---|
Inhoud | 17.000 werkboeken, statistieken, gepubliceerde databronnen en flows |
Niet-interactieve microservicecontainers | 10 |
Opname | ~ 6 uur |
Als u ongeveer de helft van de inhoud in uw Tableau Server-omgeving hebt, kan de initiële opname de helft van de tijd in beslag nemen.
Bijvoorbeeld: 8.500 (werkmappen, statistieken, gepubliceerde databronnen en flows) + 10 niet-interactieve microservicecontainers = ~3 uur (initiële opname)
Als u ongeveer de dubbele inhoud in uw Tableau Server-omgeving hebt, kan de initiële opname twee keer zoveel tijd in beslag nemen.
Bijvoorbeeld: 34.000 (werkmappen, statistieken, gepubliceerde databronnen en flows) + 10 niet-interactieve microservicecontainers = ~12 uur (initiële opname)
Stap 3: de tijd van de initiële opname verkorten
Als algemene regel geldt dat de tijd die Catalog nodig heeft om de initiële opname uit te voeren, gecorreleerd is aan het aantal niet-interactieve microservicecontainers. Om de tijd van de initiële opname te verkorten, kunt u het aantal niet-interactieve microservicecontainers vergroten.
Het aantal niet-interactieve microservicecontainers vergroten
Standaard wordt één niet-interactieve microservicecontainer toegevoegd aan elk knooppunt met een Backgrounder. Om de tijd van initiële opname te helpen verkorten, raadt Tableau aan dat u het aantal niet-interactieve microservicecontainers vergroot met de opdracht tsm topology set-process
.
Open een opdrachtprompt als beheerder op het eerste knooppunt (waar TSM is geïnstalleerd) in het cluster.
Voer deze opdracht uit:
tsm topology set-process --count <process_count> --node <node_ID> --process <process_name>
Als u bijvoorbeeld het aantal niet-interactieve microservicecontainers op het initiële knooppunt wilt vergroten naar vier containers, voert u de volgende opdracht uit:
tsm topology set-process --count 4 –-node node1 --process noninteractive
Zie tsm-topologie voor meer informatie over het uitvoeren van de opdracht en de algemene opties.
Belangrijk: voordat u het aantal niet-interactieve microservicecontainers verhoogt, moet u het volgende controleren:
De aanbeveling voor het vergroten van niet-interactieve microservicecontainers geldt voor het totale aantal niet-interactieve microservicecontainers. Niet voor het totale aantal niet-interactieve microservicecontainers per knooppunt. Stel dat u vier knooppunten hebt, maar dat u het aantal niet-interactieve microservicecontainers wilt verhogen naar acht. De waarde
--count
die u gebruikt in de tsm-opdracht is 2.Voor elke toegevoegde niet-interactieve microservicecontainer wordt 4 GB aan extra geheugen op het knooppunt gebruikt en wordt de belasting toegevoegd aan de Tableau Server-opslagplaats (PostreSQL-database).
Tableau raadt u aan om niet-interactieve microservicecontainers stapsgewijs uit te breiden met niet meer dan twee tegelijk, terwijl u uw Tableau Server-omgeving nauwlettend in de gaten houdt om problemen met het CPU-gebruik van de Tableau Server-opslagplaats (PostgreSQL-database) te voorkomen.
Wanneer te veel niet-interactieve microservicecontainers worden toegevoegd, kan het CPU-gebruik van de PostgreSQL-database pieken en failovers veroorzaken. Symptomen waar u op moet letten zijn onder meer SQLException-fouten in de vizportal-logboeken. Zie het onderwerp Failover voor opslagplaats(Link wordt in een nieuw venster geopend) voor meer informatie.
Stap 4: de Databeheer-licentie activeren
(Databeheer vereist)
Als dit nog niet is gedaan, kunt u Databeheer activeren. Zie Licentie voor Databeheer voor meer informatie.
Stap 5 (optioneel): Catalog-mogelijkheden uitschakelen voor elke site
(Databeheer vereist)
Als onderdeel van de activering van Databeheer zijn Catalog-mogelijkheden standaard ingeschakeld. Vanwege het indexeringsproces en de geschatte tijd die nodig is om dit te voltooien, kunt u overwegen de Catalog-mogelijkheden voor elke site tijdelijk uit te schakelen. Zo hebben Tableau Server-gebruikers geen toegang tot de Catalog-mogelijkheden totdat Catalog klaar is en volledige en nauwkeurige resultaten kan leveren.
Meld u aan bij Tableau Server met uw beheerdersreferenties.
Klik in het navigatiedeelvenster links op Instellingen.
Schakel op het tabblad Algemeen onder Tableau Catalog het vinkje voor Tableau Catalog inschakelen uit.
Herhaal stap 2-3 voor elke site op uw Tableau Server.
Stap 6: de opdracht tsm maintenance metadata-services uitvoeren
Voer de opdracht tsm maintenance metadata-services
uit om de Tableau Metadata-API uit te schakelen. Als u de opdracht uitvoert, wordt de initiële opname gestart. Als uw Tableau Server een licentie heeft voor Databeheer, schakelt het uitvoeren van deze opdracht ook Catalog-mogelijkheden in (als deze niet eerder waren uitgeschakeld).
Open een opdrachtprompt als beheerder op het eerste knooppunt (waar TSM is geïnstalleerd) in het cluster.
Voer deze opdracht uit:
tsm maintenance metadata-services enable
Zie tsm maintenance(Link wordt in een nieuw venster geopend) voor meer informatie over het uitvoeren van de tsm-opdracht.
Opmerking: houd bij het uitvoeren van deze opdracht rekening met het volgende:
Deze opdracht stopt en start enkele services die worden gebruikt door Tableau Server, waardoor bepaalde functies, zoals Aanbevelingen, tijdelijk niet beschikbaar zijn voor uw gebruikers.
Er wordt op dit moment een nieuwe index met metadata gemaakt. Als u deze opdracht een volgende keer uitvoert, wordt de vorige index gemaakt en vervangen.
Stap 7: de voortgang van de initiële opname monitoren en de status ervan valideren
Als u de bovenstaande tsm-opdracht uitvoert, wordt de initiële opname gestart. Om te zorgen dat de initiële opname soepel verloopt, kunt u de voortgang ervan volgen met de Backfill-API. Zie Status eerste opname ophalen voor meer informatie.
Stap 8: SMTP-instellingen configureren
Als u Tableau Server nog niet hebt ingesteld, configureert u de SMTP-instellingen. SMTP ondersteunt het verzenden van e-mails naar eigenaren met wie contact moet worden opgenomen over wijzigingen in data. Zie SMTP-instellingen configureren(Link wordt in een nieuw venster geopend) voor meer informatie over het configureren van SMTP.
Stap 9 (optioneel): Catalog-mogelijkheden inschakelen voor elke site
(Databeheer vereist)
Als u Catalog-mogelijkheden hebt uitgeschakeld voordat u Catalogus inschakelde in een van de bovenstaande procedures, moet u Catalog inschakelen om de mogelijkheden ervan toegankelijk te maken voor uw gebruikers.
Meld u aan bij Tableau Server met uw beheerdersreferenties.
Klik in het navigatiedeelvenster links op Instellingen.
Schakel op het tabblad Algemeen onder Tableau Catalog het vinkje voor Tableau Catalog inschakelen in.
Herhaal stap 2-3 voor elke site op uw Tableau Server.
Problemen met Catalog oplossen
U of uw gebruikers kunnen een van de volgende problemen tegenkomen bij het gebruik van Catalog.
Berichten Time-outlimiet en Knooppuntlimiet overschreden
Om te zorgen dat Catalog-taken die een groot aantal resultaten moeten retourneren, niet alle ruimte in beslag nemen op
Time-outlimiet
Wanneer taken in Catalog de time-outlimiet bereiken, zien u en uw gebruikers het volgende bericht:
“Gedeeltelijke resultaten worden getoond. Tijdlimiet voor het verzoek is overschreden. Probeer het later opnieuw’. of TIME_LIMIT_EXCEEDED
Om dit probleem op te lossen, kunt u als Tableau Server-beheerder de time-outlimiet verhogen met de opdracht
tsm configuration set –k metadata.query.limits.time
. Zie de onderwerpen tsm-configuration(Link wordt in een nieuw venster geopend) en tsm-configuration set-opties(Link wordt in een nieuw venster geopend)n.Belangrijk: Het verhogen van de limiet voor time-outs kan ervoor zorgen dat er langer en meer CPU wordt gebruikt. Dit kan van invloed zijn op de prestaties van andere processen in Tableau Server.
Knooppuntlimiet
Wanneer taken in Catalog de knooppuntlimiet bereiken, zien u en uw gebruikers het volgende bericht:
NODE_LIMIT_EXCEEDED
Om dit probleem op te lossen, kunt u als Tableau Server-beheerder de knooppuntlimiet verhogen met de opdracht
tsm configuration set –k metadata.query.limits.count
. Zie de onderwerpen tsm-configuration(Link wordt in een nieuw venster geopend) en tsm-configuration set-opties(Link wordt in een nieuw venster geopend)n.Belangrijk: het verhogen van de time-outlimiet kan het systeemgeheugen beïnvloeden.
Ontbrekende inhoud
Als u vermoedt dat er na de initiële opname inhoud ontbreekt in Catalog, kunt u de Eventing-API gebruiken om het probleem op te lossen. Eventing zorgt voor het indexeren van inhoud op Tableau Server na de initiële opname. Zie Gebeurtenisstatus ophalen voor meer informatie.
Wanneer de verbinding tussen een ingesloten externe asset en de downstream Tableau-inhoud wordt verwijderd, blijft deze in Catalog (of de Tableau Metadata-API) totdat deze automatisch wordt verwijderd door een Backgrounder-proces dat elke dag om 22:00:00 uur UTC (gecoördineerde universele tijd) wordt uitgevoerd. Stel bijvoorbeeld dat een werkmap, aanvankelijk gepubliceerd met een ingesloten tekstbestand A, opnieuw wordt gepubliceerd met een ingesloten tekstbestand B. Bestand A blijft zichtbaar (of kan worden opgevraagd) als externe asset totdat de Backgrounder-processen het kunnen verwijderen.
U kunt dit Backgrounder-proces uitschakelen als u dit soort externe assets niet wilt verwijderen of als u denkt dat er systeembronnen in beslag worden genomen die u niet aan dit proces wilt besteden. U ook het aantal externe ingesloten assets aanpassen dat wordt verwijderd. Zie features.DeleteOrphanedEmbeddedDatabaseAsset en databaseservice.max_database_deletes_per_run voor meer informatie.
U kunt dit proces op twee manieren volgen:
Filteren op het taaktype Eenmalige taak om bestaande database-/tabelassets opnieuw te selecteren na een wijziging in de selectielogica in de beheerdersweergave Achtergrondtaken voor niet-extracten.
Raadpleeg de gebeurtenissen Verwijdering voltooid van zwevende ingesloten databases of database_service_canonicalization_change in de Tableau Server-logboekbestanden.
Prestaties na initiële opname
In sommige Tableau Server-omgevingen waar specifieke inhoud zeer regelmatig wordt bijgewerkt (bijvoorbeeld via zeer frequente planningen of opdrachtregel- of API-verzoeken), kan het indexeringsproces oververzadigd raken. In deze gevallen kunt u als serverbeheerder overwegen gebeurtenisbeperking in te schakelen om de prestaties van Catalog te verbeteren. Zie metadata.ingestor.pipeline.throttleEventsEnable voor meer informatie.
Opmerking: wanneer gebeurtenisbeperking is ingeschakeld, kunnen gebruikers een beoogde vertraging opmerken bij wijzigingen aan inhoud in Catalog.
Fouten met onvoldoende geheugen
In sommige gevallen kunnen fouten met onvoldoende geheugen in Tableau Server optreden als gevolg van problemen met het opnemen van complexe inhoud. Als u vermoedt dat opname de oorzaak is van fouten met onvoldoende geheugen bij uw Tableau Server, neem dan contact op met en werk samen met de Tableau-ondersteuning om te voorkomen dat metadata.ingestor.blocklist worden ingetrokken.
Catalog uitschakelen
U kunt Catalogus op twee manieren uitschakelen.
Catalog-mogelijkheden uitschakelen voor elke site
(Databeheer vereist)
U kunt de Catalog-mogelijkheden op elk gewenst moment uitschakelen. Wanneer Catalog-mogelijkheden zijn uitgeschakeld, zijn bepaalde functies van Catalog niet toegankelijk, zoals het toevoegen van datakwaliteitswaarschuwingen of de mogelijkheid om machtigingen voor database- en tabelelementen expliciet te beheren. Catalog blijft echter gepubliceerde inhoud indexeren en de metadata zijn toegankelijk via de Tableau Metadata-API en metadatamethoden in de Tableau REST API.
- Meld u aan bij Tableau Server met uw beheerdersreferenties.
- Klik in het navigatiedeelvenster links op Instellingen.
- Schakel op het tabblad Algemeen onder Tableau Catalog het vinkje voor Tableau Catalog inschakelen uit.
Het indexeren van metadata stoppen
Als u wilt stoppen met het indexeren van de gepubliceerde inhoud op Tableau Server, kunt u de Tableau Metadata-API uitschakelen. Om de metadata-API in te schakelen, voert u de opdracht tsm maintenance metadata-services disable
uit. Zie tsm maintenance(Link wordt in een nieuw venster geopend) voor meer informatie.