Del 2 - Förstå Tableau Server driftsättning i referensarkitektur
Följande bild visar de relevanta Tableau Server-processerna och hur de distribueras i referensarkitekturen. Denna driftsättning anses vara den minsta företagslämpliga Tableau Server-distributionen.
Processdiagrammen i detta ämne är avsedda att visa de viktigaste, definierande processerna för varje nod. Det finns många stödjande processer som också körs på noderna som inte visas i diagrammen. För en lista över alla processer, se konfigurationsavsnittet i denna guide, Del 4 – Installera och konfigurera Tableau Server.
Tableau Server-processer
Tableau Server-referensarkitekturen är en fyra noders Tableau Server-klusterdistribution med extern lagringsplats på PostgreSQL:
- Tableau Server initial nod (nod 1): Kör nödvändiga TSM-administrativa tjänster och licenstjänster som endast kan köras på en enda nod i klustret. I företagssammanhang är den initiala noden för Tableau Server den primära noden i klustret. Denna nod kör även redundanta applikationstjänster med nod 2.
- Tableau Server applikationsnoder (nod 1 och nod 2): De två noderna betjänar klientförfrågningar, ansluter till och söker datakällor och till datanoderna.
- Tableau Server datanoder (nod 3 och nod 4): Två noder som är dedikerade till att hantera data.
- Extern PostgreSQL: denna värd kör processen Tableau Server-lagringsplats. -För HA-driftsättning måste du köra ytterligare en PostgreSQL-värd för aktiv/passiv redundans.
Du kan också köra PostgreSQL på Amazon RDS. Mer information om skillnaderna mellan att köra lagringsplatsen på en RDS-instans jämfört med en EC2-instans finns i Extern lagringsplats för Tableau Server (Linux(Länken öppnas i ett nytt fönster)).
Distribuering av Tableau Server med en extern lagringsplats kräver en licens för Tableau Advanced Management.
Om din organisation inte har intern DBA-expertis kan du eventuellt köra Tableau Server-lagringsplatsens process som standard, intern PostgreSQL-konfiguration. I standardscenariot körs lagringsplatsen på en Tableau-nod med inbäddad PostgreSQL. I detta fall rekommenderar vi att du kör lagringsplatsen på en dedikerad Tableau-nod, och ett passivt lagringsplatsen på en ytterligare dedikerad nod för att stödja reservomkoppling av lagringsplats. Se Reservonkoppling av lagringsplats (Linux(Länken öppnas i ett nytt fönster)).
Som exempel kan nämnas att den AWS-implementering som beskrivs i denna guide förklarar hur man distribuerar den externa lagringsplatsen på PostgreSQL som körs på en EC2-instans.
Valfritt: Om din organisation använder extern lagring kan du distribuera Tableau fillagring som en extern tjänst. Den här guiden inkluderar inte det externa fillagret i kärnimplementeringsscenariot. Läs mer i Installera Tableau Server med extern fillagring (Linux(Länken öppnas i ett nytt fönster)).
För att driftsätta Tableau Server med en extern fillagring krävs en licens för Tableau Advanced Management.
PostgresSQL lagringsplats
Tableau Server-lagringsplats är en PostgresSQL-databas som lagrar serverdata. I dessa data ingår bland annat Tableau Server-relaterad information om användare, grupper, grupptilldelningar, behörigheter, projekt, datakällor, extraktmetadata och uppdateringsinformation.
Den förvalda PostgresSQL-distributionen förbrukar nästan 50 % av systemets minnesresurser. Baserat på dess användning (för produktion och stora produktionsdistributioner) kan resursanvändningen öka. Av den anledningen rekommenderar vi att du kör lagringsprocessen på en dator som inte kör några andra resursintensiva serverkomponenter som VizQL, bakgrundsprocessor eller datamotor. Att köra lagringsplatsprocessen tillsammans med någon av dessa komponenter kommer att skapa IO-konflikter, resursbegränsning och försämra den totala prestandan för distributionen.
Nod 1: Initial nod
Den initiala noden kör ett litet antal viktiga processer och delar applikationsbelastningen med nod 2.
Den första datorn som du installerar Tableau på, den ”ursprungliga noden”, har vissa unika egenskaper. Det finns tre processer som bara körs på den ursprungliga noden och som inte kan flyttas till en annan nod förutom i händelse av ett fel: Licenstjänst (Licenshanteraren), Aktiveringstjänst och TSM-styrenhet (Administrationsstyrenhet).
Nod 1 reservomkoppling och automatisk återställning
Licensen, aktiveringen och TSM-styrenheten är avgörande för hur bra en Tableau Server-driftsättning fungerar. I händelse av ett nod 1-fel kommer användarna fortfarande att kunna ansluta till Tableau Server-distributionen, eftersom en korrekt konfigurerad referensarkitektur kommer att dirigera förfrågningar till nod 2. Utan dessa huvudtjänster kommer dock distributionen att befinna sig i ett kritiskt tillstånd av pågående fel. Se Automatisk återställning av ursprunglig nod.
Noderna 1 och 2: Applikationsservrar
Noderna 1 och 2 kör Tableau Server-processerna som betjänar klientförfrågningar, frågedatakällor, genererar visualiseringar, hanterar innehåll och administration och annan kärnverksamhetslogik i Tableau. Programservrarna lagrar inte användardata.
Obs! ”Application Server” är en term som också hänvisar till en Tableau Server-process som listas i TSM. Den underliggande processen för ”Application Server” är VizPortal.
Kör parallellt, nod 1 och nod 2 skalar upp till serviceförfrågningar från logiken för belastningsutjämning som körs på omvända proxyservrar. I egenskap av redundanta noder, hanteras klientförfrågningar och service av den återstående noden om en av dessa noder skulle sluta att fungera.
Referensarkitekturen har utformats så att kostnadsfria applikationsprocesser körs på samma dator. Detta innebär att processerna inte konkurrerar om datorresurser och skapar konflikter.
Till exempel är VizQL, en kärnbehandlingstjänst på applikationsservrar, mycket CPU- och minnesbunden. Dessutom använder VizQL nästan 60-70 % av CPU och minne på datorn. Av denna anledning är referensarkitekturen utformad så att inget annat minne eller processorbundna processer är på samma nod som VizQL. Testning visar att mängden av belastning eller antalet användare inte påverkar minnet eller CPU-användningen på VizQL-noder. Att till exempel minska antalet samtidiga användare i vårt belastningstest påverkar endast kontrollpanelens prestanda eller laddningsprocessen för visualisering, men det minskar inte resursutnyttjandet. Baserat på det tillgängliga minnet och CPU under toppanvändning kan du därför överväga att lägga till fler VizQL-processer. Som en utgångspunkt för typiska arbetsböcker, tilldela 4 kärnor per VizQL-process.
Skalning av applikationsservrar
Referensarkitekturen är utformad för skala upp baserat på en användningsbaserad modell. Som en allmän utgångspunkt rekommenderar vi minst två applikationsservrar som var och en stöder upp till 1000 användare. I takt med att användarbasen ökar ska du planera att lägga till en applikationsserver för varje ytterligare 1000 användare. Övervaka användning och prestanda för att justera användarbasen per värd för din organisation.
Noderna 3 och 4: Dataservrar
Processerna fillagring, datamotor (Hyper) och bakgrundsprocessor är samlokaliserade på noderna 3 och 4 av följande skäl:
- Extraktoptimering: Genom att köra bakgrundsprocessorn, Hyper och fillagring på samma nod optimeras prestanda och tillförlitlighet. Under extraheringsprocessen frågar bakgrundsprocessorn efter måldatabasen, skapar Hyper-filen på samma nod och laddar sedan upp till fillagringsplatsen. Genom att samlokalisera dessa processer på samma nod kräver arbetsflödet för skapande av extraktion inte kopiering av datamängder över nätverket eller noderna.
- Kostnadsfri resursutjämning: Bakgrundsprocessorn är huvudsakligen CPU-intensiv. Datamotor är en minnesintensiv process. Koppling av dessa processer möjliggör maximalt resursutnyttjande på varje nod.
- Konsolidering av dataprocesser: Eftersom var och en av dessa processer är backend-dataprocesser, är det logiskt att köra dem på den säkraste datanivån. I framtida versioner av referensarkitekturen kommer applikations- och dataserverna att köras på separata nivåer. På grund av applikationsberoende i Tableau-arkitekturen måste dock applikations- och dataserverna köras på samma nivå vid denna tidpunkt.
Skalning av dataservrar
Precis som med applikationsservrar kräver planering av de resurser som krävs för Tableau-dataservrar användarbaserad modellering. Anta i allmänhet att varje dataserver kan stödja upp till 2000 jobb för uppdatering av extrakt per dag. När dina extraktjobb ökar lägger du till ytterligare dataservrar utan fillagringstjänsten. Generellt sett är distributionen av dataservern med två noder lämplig för driftsättningar som använder det lokala filsystemet för fillagringstjänsten. Observera att om du lägger till fler applikationsservrar påverkas inte prestandan eller skalan på dataserverna på ett linjärt sätt. Med undantag för vissa allmänna omkostnader från ytterligare användarfrågor, är effekten av att lägga till fler programvärdar och användare i själva verket minimal.