Aktivera Tableau Catalog
Tableau Catalog(Länken öppnas i ett nytt fönster) identifierar och indexerar allt innehåll på Tableau Cloud-platsen eller Tableau Server, inklusive arbetsböcker, datakällor, blad, mätvärden och flöden. (Den gamla funktionen Mätvärden fasade ut i februari 2024 för Tableau Cloud och i Tableau Server version 2024.2. Mer information finns i Skapa och felsöka mätvärden (utfasad).) Indexering används för att samla in information om innehållet eller metadata om schemat och ursprunget för innehållet. Ur metadata identifierar sedan Catalog alla databaser, filer och tabeller som används av innehållet på Tableau Cloud-platsen eller Tableau Server.
Catalog är tillgängligt med Datahantering-licensen. Mer information finns i Om Datahantering.
Utöver Catalog kan metadata om innehållet även öppnas från både Tableaus metadata-API(Länken öppnas i ett nytt fönster) och Tableau REST API med Metadata-metoder(Länken öppnas i ett nytt fönster).
Innan Catalog aktiveras
Som administratör av Tableau Server finns det några saker du behöver tänka på innan du aktiverar Catalog för att säkerställa att Catalog fungerar optimalt i Tableau Server-miljön.
Version som krävs
Innan du aktiverar Catalog ska du kontrollera att du använder en av följande versioner av Tableau Server:
- Tableau Server 2019.3.4 eller senare
- Tableau Server 2019.4.2 eller senare
- Tableau Server 2020.1.0 eller senare
- Tableau Server 2020.2.15 eller senare
- Tableau Server 2020.3 och senare
Mer information om varför dessa versioner krävs finns i Tableaus kunskapsbas.
Det här kan du förvänta dig när du aktiverar Catalog
När Catalog aktiveras indexeras innehållet som redan finns på Tableau Server omedelbart.
Inledande inhämtning
Indexeringsprocessen består av två primära komponenter. En av dessa komponenter är inledande inhämtning. Inledande inhämtning kan delas upp i två ytterligare komponenter:
- Efteretablering av innehåll
- Efteretablering av ursprung
Statusen för efteretablering av innehåll och efteretablering av ursprung är viktig att notera senare när du ska övervaka förloppet och bekräfta att Catalog har aktiverats och körs i Tableau Server-miljön.
Hastighet på inledande inhämtning
Hur lång tid det tar för Catalog att indexera innehållet för första gången beror på ett par faktorer:
Mängden innehåll på Tableau Server: Mängden innehåll syftar på det totala antalet arbetsböcker, mätvärden, publicerade datakällor och flöden som publicerats på Tableau Server. Mer information finns i Diskutrymme för lagring av metadata.
Antal icke-interaktiva mikrotjänstbehållare: Catalog använder icke-interaktiva mikrotjänstbehållare för att indexera allt innehåll på Tableau Server. Mer information finns i Minne för icke-interaktiva mikrotjänstbehållare.
Om du förstår vilka faktorer som påverkar den inledande inhämtningen kan du lättare bedöma hur lång tid det tar att aktivera och köra Catalog i miljön.
Diskutrymme för lagring av metadata
Under den inledande inhämtningen genereras metadata som lagras på Tableau Server-lagringsplatsen (PostgreSQL-databasen ”Relation”). Den mängd diskutrymme som krävs för att lagra dessa metadata är ungefär hälften av det diskutrymme som för närvarande används av lagringsplatsen (PostgreSQL-databasen ”Arbetsgrupp”).
Anta till exempel att lagringsplatsen använder 50 GB diskutrymme innan Catalog aktiveras. Lagringsplatsen kan du använda upp till 75 GB diskutrymme efter att Catalog har aktiverats.
Minne för icke-interaktiva mikrotjänstbehållare
Inledande inhämtning körs i den icke-interaktiva mikrotjänstbehållaren. Den icke-interaktiva mikrotjänstbehållaren är en av två processer för Tableau Servers mikrotjänstbehållare(Länken öppnas i ett nytt fönster). Som standard läggs en instans av den icke-interaktiva mikrotjänstbehållaren till i alla noder som har en bakgrundsprocessor installerad.
Som standard kan den inledande inhämtningen på en enskild instans av den icke-interaktiva mikrotjänstbehållaren använda upp till 4 GB minne på bakgrundsprocessornoden. Om antalet innehållsobjekt på Tableau Server överstiger 10 000 kan det hända att en icke-interaktiv mikrotjänstbehållare behöver upp till 16 GB minne på bakgrundsprocessornoden. När du aktiverar Catalog måste du därför se till att bakgrundsprocessornoderna har den kapacitet som krävs för de icke-interaktiva mikrotjänstbehållarna under den inledande inhämtningen. Om kapaciteten behöver ökas måste du uppdatera JVM-heapstorleken för icke-interaktiva mikrotjänstbehållare för att tilldela upp till 16 GB minne på bakgrundsprocessornoderna. Mer information finns i noninteractive.vmopts.
Om du planerar att lägga till fler icke-interaktiva mikrotjänstbehållare för att den inledande inhämtningen ska gå snabbare bör du först fastställa hur många behållare som krävs totalt (med hjälp av Steg 2: Uppskatta hur lång tid inledande inhämtning tar nedan) och sedan bekräfta att Tableau Server-miljön har konfigurerats med tillräcklig kapacitet för att stödja alla icke-interaktiva mikrotjänstbehållare. Beroende på hur Tableau Server-miljön har konfigurerats kan det hända att du inte kan lägga till alla ytterligare icke-interaktiva mikrotjänstbehållare som du behöver för att den inledande inhämtningen ska gå snabbare.
Bästa praxis för aktivering av Catalog
Eftersom hastigheten på och kraven för inledande inhämtning är unika för varje Tableau Server-miljö rekommenderar Tableau att du gör minst en av följande saker när du aktiverar Catalog:
Se till att det finns tillräckligt med diskutrymme som Tableau Server-lagringsplatsen kan använda för att stödja ytterligare metadata som den inledande inhämtningen genererar och lagrar. En allmän regel är att lagringsplatsen behöver ytterligare 50 % diskutrymme utöver det som redan används av lagringsplatsen. Mer information om Tableau Servers diskanvändning finns i Serverdiskutrymme.
Beroende på mängden innehåll på Tableau Server ser du till att varje bakgrundsprocessornod har minst 4–16 GB tillgängligt minne för varje instans av en icke-interaktiv mikrotjänstbehållare under den inledande inhämtningen.
Utför processen under helgen så att den inledande inhämtningen kan slutföras innan användarna börjar förbruka Catalog-kapacitet.
Utför processen i en testmiljö med produktionsinnehåll först. Detta rekommenderas eftersom typen av innehåll som ska inhämtas kan spela en avgörande roll för inhämtningshastigheten.
Sammanfattning av stegen för att aktivera Catalog
I följande steg sammanfattas processen att aktivera och köra Catalog på Tableau Server. Stegen måste utföras i ordning.
- Fastställa mängden innehåll på Tableau Server
- Uppskatta hur lång tid inledande inhämtning tar
- Minska tiden för inledande inhämtning
- Aktivera Datahantering-licensen
- Inaktivera Catalog-kapacitet
- Kör kommandot tsm maintenance metadata-services
- Övervaka det ursprungliga inhämtningsförloppet och validera dess status
- Konfigurera SMTP
- Aktivera Catalog-kapacitet
Obs! Eftersom indexering av metadata om Tableau-innehåll på Tableau Server drivs av Metadata-API måste du aktivera Metadata-API för att kunna köra och använda Catalog.
Aktivera Catalog
Steg 1: Fastställa mängden innehåll på Tableau Server
Gör följande för att fastställa mängden innehåll på Tableau Server:
Logga in till Tableau Server med dina inloggningsuppgifter som administratör.
Gå till sidan Utforska.
Klicka på listrutemenyn Projekt på översta nivån och addera antalen bredvid Alla arbetsböcker, Alla mätvärden, Alla datakällor och Alla flöden. Resultatet är den totala mängden innehåll på Tableau Server.
Steg 2: Uppskatta hur lång tid inledande inhämtning tar
Du uppskattar hur lång tid det tar för Catalog att inhämta innehåll på Tableau Server för första gången (inledande inhämtning) genom att jämföra din Tableau Server-konfiguration med en grundläggande Tableau Server-konfiguration.
För Tableau Server med följande konfiguration kan inledande inhämtning ta omkring sex timmar att slutföra.
Komponenter | Grundläggande värden |
---|---|
Innehåll | 17 000 arbetsböcker, mätvärden, publicerade datakällor och flöden |
Icke-interaktiva mikrotjänstbehållare | 10 |
Inhämtning | ~6 timmar |
Om du har ungefär hälften så mycket innehåll i Tableau Server-miljön kan inledande inhämtning ta hälften så lång tid att slutföra.
Exempel: 8 500 (arbetsböcker, mätvärden, publicerade datakällor och flöden) + 10 icke-interaktiva mikrotjänstbehållare = ~3 timmar (inledande inhämtning)
Om du har ungefär dubbelt så mycket innehåll i Tableau Server-miljön kan inledande inhämtning ta dubbelt så lång tid att slutföra.
Exempel: 34 000 (arbetsböcker, mätvärden, publicerade datakällor och flöden) + 10 icke-interaktiva mikrotjänstbehållare = ~12 timmar (inledande inhämtning)
Steg 3: Minska tiden för inledande inhämtning
En allmän regel är att den tid det tar för Catalog att utföra inledande inhämtning korrelerar med antalet icke-interaktiva mikrotjänstbehållare. Om du vill minska tiden för inledande inhämtning kan du öka antalet icke-interaktiva mikrotjänstbehållare.
Öka antalet icke-interaktiva mikrotjänstbehållare
Som standard läggs en icke-interaktiv mikrotjänstbehållare till varje nod som har en bakgrundsprocessor. Om du vill minska tiden för inledande inhämtning rekommenderar Tableau att du ökar antalet icke-interaktiva mikrotjänstbehållare med kommandot tsm topology set-process
.
Öppna en kommandotolk som administratör på den första noden (där TSM är installerat) i klustret.
Kör kommandot:
tsm topology set-process --count <process_count> --node <node_ID> --process <process_name>
Om du till exempel vill öka antalet icke-interaktiva mikrotjänstbehållare på den initiala noden till fyra kör du följande kommando:
tsm topology set-process --count 4 –-node node1 --process noninteractive
Mer information om kommandot och dess globala alternativ finns i tsm topology.
Viktigt: Innan du ökar antalet icke-interaktiva mikrotjänstbehållare bör du gå igenom följande:
Rekommendationen avseende ett ökat antal icke-interaktiva mikrotjänstbehållare gäller det totala antalet icke-interaktiva mikrotjänstbehållare, inte det totala antalet icke-interaktiva mikrotjänstbehållare per nod. Anta till exempel att du har fyra noder, men du vill öka antalet icke-interaktiva mikrotjänstbehållare till åtta. Det
--count
-värde du använder i tsm-kommandot är då 2.För varje icke-interaktiv mikrotjänstbehållare som läggs till används ytterligare 4 GB minne på noden, och belastningen läggs till Tableau Server-lagringsplatsen (PostgreSQL-databasen).
Tableau rekommenderar att du ökar antalet icke-interaktiva mikrotjänstbehållare stegvis, med högst två åt gången, samtidigt som du noga övervakar Tableau Server-miljön så att det inte uppstår problem med CPU-användning hos Tableau Server-lagringsplatsen (PostgreSQL-databasen).
Tänk på att CPU-användningen hos PostgreSQL-databasen kan toppa och reservomkopplas om du lägger till för många icke-interaktiva mikrotjänstbehållare. Något att hålla ögonen öppna efter är SQLException-fel i vizportal-loggarna. Mer information finns i avsnittet Reservomkoppling av lagringsplats(Länken öppnas i ett nytt fönster).
Steg 4: Aktivera Datahantering-licensen
(Kräver Datahantering)
Om det inte redan har gjorts, kan du aktivera Datahantering. Mer information finns i Licens för Datahantering.
Steg 5 (valfritt): Inaktivera Catalog-kapacitet för varje plats
(Kräver Datahantering)
Catalog-kapacitet avaktiveras som en del av Datahantering-aktiveringen. På grund av indexeringsprocessen och den uppskattade tid den tar att slutföra bör du överväga att tillfälligt inaktivera Catalog-kapacitet för varje plats, så att Tableau Server-användare inte har tillgång till Catalog-kapacitet förrän Catalog är redo och kan tillhandahålla fullständiga och korrekta resultat.
Logga in till Tableau Server med dina inloggningsuppgifter som administratör.
Klicka på Inställningar i den vänstra navigeringsrutan.
Avmarkera kryssrutan Slå på Tableau Catalog på fliken Allmänt under Tableau Catalog, .
Upprepa steg 2–3 för varje Tableau Server-plats.
Steg 6: Kör kommandot tsm maintenance metadata-services
Kör kommandot tsm maintenance metadata-services
för att aktivera Tableaus metadata-API. När du kör kommandot påbörjas den inledande inhämtningen. Om Tableau Server har licensierats med Datahantering aktiveras också Catalog-kapacitet när du kör kommandot (om det inte avaktiverades tidigare).
Öppna en kommandotolk som administratör på den första noden (där TSM är installerat) i klustret.
Kör kommandot:
tsm maintenance metadata-services enable
Mer information om tsm-kommandot finns i tsm maintenance(Länken öppnas i ett nytt fönster).
Obs! När du kör det här kommandot bör du tänka på följande:
Det här kommandot stoppar och startar vissa tjänster som används av Tableau Server, vilket leder till att vissa funktioner blir tillfälligt otillgängliga, såsom kapaciteten Rekommendationer.
Ett nytt index av metadata skapas. Varje gång du kör det här kommandot skapas ett nytt index som ersätter det gamla.
Steg 7: Övervaka förloppet för inledande inhämtning och validera dess status
När du kör tsm-kommandot ovan startas den inledande inhämtningen. Du kan övervaka förloppet med Backfill API för att säkerställa att den inledande inhämtningen fortlöper som den ska. Mer information finns i Hämta status för inledande inmatning.
Steg 8: Konfigurera SMTP-inställningar
Konfigurera SMTP-inställningar om det inte redan har gjorts för Tableau Server. SMTP stödjer sändning av e-postmeddelanden till ägare som måste kontaktas om dataändringar. Mer information om hur du konfigurerar SMTP finns i Konfigurera SMTP(Länken öppnas i ett nytt fönster).
Steg 9 (valfritt): Aktivera Catalog-kapacitet för varje plats
(Kräver Datahantering)
Om du inaktiverade Catalog-kapacitet innan du aktiverade Catalog i en av ovanstående procedurer måste du aktivera Catalog för att kapaciteterna ska bli tillgängliga för användarna.
Logga in till Tableau Server med dina inloggningsuppgifter som administratör.
Klicka på Inställningar i den vänstra navigeringsrutan.
Markera kryssrutan Aktivera Tableau Catalog på fliken Allmänt under Tableau Catalog.
Upprepa steg 2–3 för varje Tableau Server-plats.
Felsöka Catalog
Det kan hända att du eller någon användare stöter på ett av följande fel vid användning av Catalog.
Meddelanden om överskriden tidsgräns och nodgräns
För att säkerställa att Catalog-uppgifter som måste returnera ett stort antal resultat inte tar upp alla
Timeout-gräns
När uppgifter i Catalog når timeout-gränsen får du och användarna följande meddelande:
”Visar delresultat. Tidsgränsen för förfrågan överskreds. Försök igen senare.” eller TIME_LIMIT_EXCEEDED
Som administratör av Tableau Server kan du åtgärda felet genom att öka timeout-gränsen med hjälp av kommandot
tsm configuration set –k metadata.query.limits.time
. Mer information finns i avsnitten tsm configuration(Länken öppnas i ett nytt fönster) och Alternativ för tsm configuration set(Länken öppnas i ett nytt fönster).Viktigt: Om du ökar tidsgränsen kan du förbruka mer processorkraft under längre tid, vilket kan påverka prestandan hos andra processer på Tableau Server.
Nodgräns
När uppgifter i Catalog når nodgränsen får du och användarna följande meddelande:
NODE_LIMIT_EXCEEDED
Som administratör av Tableau Server kan du åtgärda felet genom att öka nodgränsen med hjälp av kommandot
tsm configuration set –k metadata.query.limits.count
. Mer information finns i avsnitten tsm configuration(Länken öppnas i ett nytt fönster) och Alternativ för tsm configuration set(Länken öppnas i ett nytt fönster).Viktigt: Att öka tidsgränsen kan påverka systemminnet.
Innehåll som saknas
Om du efter den inledande inhämtningen misstänker att det saknas innehåll från Catalog, kan du använda Eventing API för att felsöka. Indexhantering sköter indexeringen av innehåll på Tableau Server efter den inledande inhämtningen. Mer information finns i Hämta status för Eventing.
När anslutningen mellan en inbäddad extern resurs och dess Tableau-innehåll nedströms tas bort finns det kvar i Catalog (eller i Tableaus metadata-API) tills det raderas automatiskt av en bakgrundsprocessor, som körs varje dag 22:00:00 UTC (koordinerad universal tid). Anta till exempel att en arbetsbok som först publicerades med en inbäddad textfil A publiceras på nytt med en inbäddad textfil B. Fil A förblir synlig (eller möjlig att fråga) som en extern resurs tills bakgrundsprocessorn kan radera den.
Du kan inaktivera bakgrundsprocessorn om du inte vill ta bort de här typerna av externa resurser eller om du tror att den tar upp systemresurser som du inte vill avsätta för den här processen. Alternativt kan du justera antalet externa inbäddade resurser som raderas. Mer information finns i features.DeleteOrphanedEmbeddedDatabaseAsset och databaseservice.max_database_deletes_per_run.
Du kan övervaka den här processen på ett av två sätt:
Filtrera efter uppgiftstypen Engångsjobb: omkanonisering av befintlig databas/tabell efter ändrad kanoniseringslogik i administratörsvyn Bakgrundsaktiviteter för icke-extrakt.
Se händelsen Slutförd borttagning av kvarlämnade inbäddade databaser eller databas_tjänst_kanonisering_ändring i Tableau Server-loggfilerna.
Prestanda efter inledande inhämtning
I vissa Tableau Server-miljöer där specifikt innehåll uppdateras ofta (till exempel genom högfrekventa scheman eller kommandorader eller API-förfrågningar) kan det hända att indexeringsprocessen blir överbelastad. I sådant fall bör du som serveradministratör överväga att aktivera händelsebegränsning för att bevara Catalogs prestanda. Mer information finns i metadata.ingestor.pipeline.throttleEventsEnable.
Obs! När händelsebegränsning har aktiverats kan det hända att användare märker av en fördröjning i innehållsförändringar i Catalog.
Fel vid slut på minne
I vissa fall kan fel vid slut på minne uppstå i Tableau Server. Detta beror på problem med inhämtning av komplext innehåll. Om du misstänker att inhämtningen är orsaken till minnesfelen i Tableau Server ber vi dig kontakta och samarbeta med Tableaus support för att hindra metadata.ingestor.blocklist från att inhämtas, så att problemet kan åtgärdas.
Inaktivera Catalog
Du kan inaktivera Catalog på två olika sätt.
Stäng av Catalog-funktioner för varje plats
(Kräver Datahantering)
Du kan när som helst inaktivera Catalog-kapacitet. När Catalog-funktionerna är avstängda är funktioner som att lägga till datakvalitetsvarningar eller möjligheten att explicit hantera behörigheter för databas- och tabellresurser inte tillgängliga. Catalog fortsätter emellertid att indexera publicerat innehåll, och metadata är tillgängliga från Tableaus metadata-API och metadata-metoderna i Tableau REST API.
- Logga in till Tableau Server med dina inloggningsuppgifter som administratör.
- Klicka på Inställningar i den vänstra navigeringsrutan.
- Avmarkera kryssrutan Slå på Tableau Catalog på fliken Allmänt under Tableau Catalog, .
Sluta indexera metadata
Om du vill sluta indexera publicerat innehåll i Tableau Server kan du inaktivera Tableaus metadata-API. Du inaktiverar metadata-API genom att köra kommandot tsm maintenance metadata-services disable
. Mer information finns i tsm maintenance(Länken öppnas i ett nytt fönster).