Optimera för extraktfrågeintensiva miljöer

I det här avsnittet ges vägledning om hur du upprättar specifika topologier och konfigurationer i Tableau Server för att optimera och förbättra prestanda i en extraktfrågeintensiv miljö.

Vad är en extraktfrågeintensiv miljö? Extrakt och sammanslutna datakällor frågas vid inläsning av arbetsböcker, vyer och instrumentpaneler, vilket skapar en hög frågebelastning. Om du har många extrakt och federerade datakällor kan man därför säga att du har en extraktfrågeintensiv miljö.

Om miljön är extraktfrågeintensiv enligt definitionen ovan kan de kommande avsnitten hjälpa dig att avgöra om den här konfigurationen är rätt för dig.

Då ska du använda den här konfigurationen

Resonemanget bakom den här konfigurationen: Hyper är Tableaus minnesoptimerade datamotorteknik, som är anpassad för snabb datainsamling och analys, vilket gör det till en viktig del av optimeringen av frågeintensiva arbetsbelastningar. När extraktanvändningen växer rekommenderar vi att du konfigurerar Datamotor på dedikerade noder av Tableau Server-klustret. Med den här konfigurationen kan Tableau Server skala ut infrastrukturen och optimera prestandan vid frågor till extrakt.

Det finns flera faktorer som påverkar Tableau Servers prestanda vid visning av innehåll med extrakt och sammanslutna datakällor. Målet här är att uppnå konsekvent och tillförlitlig frågeprestanda vid visning av innehåll på servern. Använd den här konfigurationen om något av följande förhållanden gäller din miljö.

  • Du ser stora skillnader i inläsningstid för arbetsboken och arbetsboken använder extrakt eller sammanslutna datakällor.

  • Din version av Tableau Server växer i antal Creators, Explorers, Viewers och extraktbaserat innehåll, så du vill skala ut på ett effektivt sätt.

  • Du ser resurskonkurrens mellan Datamotor och VizQL Server nät Fillagring finns på datorn.
  • Du analyserar stora mängder data. Med den här konfigurationen kan du optimera prestandan i scenarier med big data, både vad gäller datapåfyllning och analys. Mer information om Tableau och big data finns i Hyperladda analys av big data med Tableau.

Obs! Använd prestandaregistrering på serversidan för att fastställa hur lång tid det tar att hantera frågor. För att fastställa resursanvändningen i Tableau använder du Prestandaövervakare för Windows-installationer och sysstat eller vmstat för Linux-installationer.

Fördelar med att använda den här konfigurationen

Följande är de viktigaste fördelarna med att konfigurera dedikerade datamotornoder:

  • Dedikerade datamotornoder minskar resurskonkurrensen mellan extraktfrågor och andra resursintensiva belastningar, såsom de som behandlas av VizQL Server.

  • Extraktfrågor belastningsutjämnas dynamiskt på de dedikerade noderna, med hänsyn tagen till det aktuella systemtillståndet så att inga noder används för mycket eller för lite.
  • Mer konsekvent prestanda i användarupplevelse vid inläsning av extraktberoende arbetsböcker. Fokus här ligger på att skapa en konsekvent och tillförlitlig prestanda snarare än att göra enskilda processer bättre.

  • Du har mer kontroll över utskalningen av Tableau Server-processer som kräver mer resurser. Om VizQL Server, Datamotor och Bakgrundsprocessor alla körs på samma nod och problemet är långsamma extraktfrågor är det svårt att uppnå prestandaförbättringar genom att lägga till en andra nod med alla tre processer. Med den här konfigurationen kan du lägga till fler noder som specifikt förbättrar belastningen från extraktfrågor.

  • Bidrar till förbättrad tillgänglighet och drifttid. I händelse av att ett fel uppstår och en av de dedikerade Datamotor-noderna är otillgänglig försöker VizQL Server att dirigera väntande förfrågningar på problemnoden till en annan dedikerad Datamotor-nod.

  • Datamotorn utnyttjar så många kärnor som är tillgängliga på datorn. Därmed har du möjlighet att lägga till fler resurser till de dedikerade Datamotor-noderna för att minska svarstiden på frågor och skillnaderna mellan krävande extraktfrågor. Du kan även lägga till fler dedikerade Datamotor-noder för att öka genomflödet av extraktfrågor på servern.

  • Datamotorn har en standardkonfiguration som begränsar den till i genomsnitt 75 % av processorn per timme. Detta är för att i största möjliga mån undvika konflikter med andra Tableau Server-processer. Om du kör datamotorn på en dedikerad nod kan du öka detta genomsnitt till 95 %. Information om hur du gör detta finns i hyper.srm_cpu_limit_percentage.

Då ska du inte använda den här konfigurationen

  • Om du inte upplever problem med extraktbaserad frågebelastning kan maskinvaruresurser i stället allokeras till andra delar av Tableau Server.

  • På noder där Fillagring, Datamotor och VizQL Server samexisterar finns ingen resurskonkurrens mellan Datamotor och VizQL Server.

  • Innan du implementerar den här konfigurationen rekommenderar vi starkt att du utvärderar CPU-användningen för VizQL Server och för noden där Datamotor installerades med Fillagring.

Konfiguration

Målet med den här konfigurationen är att ha Datamotor på en eller flera dedikerade noder.

  • I driftsättningar där Fillagring har installerats lokalt innebär detta att Fillagring ska konfigureras på en eller flera dedikerade noder. Datamotor installeras automatiskt på samma nod som Fillagring.

  • I driftsättningar där du konfigurerar Extern fillagring kan du fortfarande konfigurera Datamotor på dedikerade noder på Tableau Server.

Genom att separera processerna för VizQL Server och Fillagring balanserar du belastningen mellan extraktfrågor och visning av eller interaktion med vyer. Den här konfigurationen är inriktad på konsekvent prestanda hos extraktfrågor.

Nedan ges en visuell representation av konfigurationen där processerna Datamotor/Fillagring har två dedikerade noder, nod 5 och 6. Det här är ett exempel där Fillagring har konfigurerats lokalt och därför har processerna Datamotor och Fillagring placerats på samma plats.

Samma konfiguration fungerar för driftsättningar med Extern fillagring, men i sådant fall har nod 5 och 6 endast Datamotor konfigurerad.

Eftersom nod 1 också har processerna för lagringsplats och fillagring så finns alla data som behövs för att säkerhetskopiera på nod 1, vilket kan förbättra säkerhetskopieringsprestandan.

Riktlinjer för maskinvara

För att få ut mesta möjliga ur den här konfigurationen behöver du experimentera med olika storlekar och konfigurationer på maskinvaran för att se vad som passar bäst för dina mål vad gäller prestanda under belastningstoppar. Hyper är en högpresterande databasteknik och de resurser som påverkar prestanda mest är minne, kärnor och lagringsrelaterad I/O. Om du förstår hur Hyper använder resurser för att hantera frågor blir det lättare att fatta beslut angående maskinvara och förstå skillnaderna mellan olika konfigurationer.

  • Minne: När en extraktbaserad fråga hanteras för en användare eller bakgrundsprocess väljer Tableau Server en dedikerad Datamotor-nod för hanteringen av frågan. Denna dedikerade Datamotor-nod kopierar då extraktet från den lokala lagringsplatsen, vilket oftast är serverhårddisken, till minnet. Mer tillgängligt systemminne gör att operativsystemet kan hantera minnesanvändningen av Tableau på ett bättre sätt. Dedikerade Datamotor-noder använder systemminne för att lagra den slutliga uppsättningen av körda frågor. Om den slutliga uppsättningen fortfarande gäller och operativsystemet inte har rensat den från minnet kan uppsättningen i minnet återanvändas.

    Tableau Servers rekommenderade minsta minne är 32 GB, men om du förväntar dig hög volym av extraktbaserad arbetsboksbelastning bör du överväga 64 eller 128 GB. Om du når andra resursgränser utöver minnet (till exempel gränsen för kärnor) kan det vara bättre att skala ut till ytterligare en dedikerar Datamotor-nod på 64 GB i stället för att skala upp till 128 GB.

    Kopieringen av extraktet från den lokala lagringsplatsen till minnet kan ta tid och du kan behöva optimera diskprestanda. Optimering av diskprestanda diskuteras i avsnittet Lagringsrelaterad I/O.

  • Kärnor: Vid hanteringen av en extrakbaserad fråga är antalet kärnor en viktig maskinvarudel som kan ha en inverkan på prestandan och skalbarheten. CPU-kärnor ansvarar för körningen av frågor, så fler tillgängliga kärnor leder till snabbare körningstid. I allmänhet kan man säga att en dubblering av antalet kärnor halverar tiden för körning av frågor. Exempel: En fråga som tar tio sekunder att köra med fyra fysiska kärnor eller åtta vCPU:er tar fem sekunder om du uppgraderar till åtta fysiska kärnor eller sexton vCPU:er.

    Tableau Servers aktuella minsta rekommendation är 8 kärnor, men om distributionen använder extrakt bör du överväga 16 eller 32. Något att tänka på är att om minne och I/O är flaskhalsar förbättras inte frågeprestandan om du ökar antalet tillgängliga kärnor.

  • Lagringsrelaterad I/O: Hyper har utformats för att utnyttja tillgänglig prestanda hos extraktlagringsenheten, för att snabba på hanteringen av frågor. Vi rekommenderar att använda snabb disklagring, som SSD (Solid State Drive), med hög skriv- och läshastighet. För tillfället erbjuder SSD:er som använder lagringsprotokollet NVMe högst hastighet.

Obs! Att ändra storleken på resurser för dedikerade Datamotor-noder påverkar endast prestandan hos extraktfrågor. När du läser in en arbetsbok är många andra processer inblandade som tillsammans utgör den totala tiden för inläsningen av VizQL. VizQL Server-processen till exempel ansvarar för att ta data från Datamotor och återge visualiseringen.

Annan prestandajustering och optimering:

Det finns andra funktioner du kan använda för att optimera prestanda utöver den grundläggande konfigurationen som beskrivs ovan. De optimeringar som beskrivs nedan kan tillämpas på både lokal och extern fillagring.

  • Belastningsutjämning av extraktfråga: För att fastställa vart extraktfrågan ska dirigeras använder Datamotor ett servertillståndsvärde. Detta mätvärde är mängden resurser som Datamotor förbrukar samt belastningen från andra Tableau-processer som körs på samma nod. Huruvida ett extrakt redan finns i minnet på noden tas också i beaktande (utöver utvärderingen av systemresurser) för att säkerställa att en extraktfråga skickas till noden som har mest tillgängliga resurser för att hantera frågan. Detta leder till effektivare användning av minne och disk, och extrakt dupliceras inte i minnet på flera noder. Mer information finns i hjälpartikeln Belastningsutjämning för extraktfrågor.

    Belastningsutjämning av extraktfråga är aktiverad som standard från och med Tableau Server-version 2020.2.

  • Optimering av arbetsbelastning med nodroller: Med nodroller för Bakgrundsprocessor och Fillagring har serveradministratörer större flexibilitet och mer kontroll över vilka noder som ska dedikeras till att köra extraktfrågor och extraktuppdateringar. Som nämns i topologidiagrammet ovan är vissa Datamotor-noder dedikerade till hanteringen av extraktfrågor och till att endast köra processerna Fillagring och Datamotor. Nodroller finns tillgängliga med Advanced Management. Mer information om nodroller finns i Hantera arbetsbelastning via nodroller.

I diagrammet nedan används samma topologi som i den grundläggande konfigurationen som beskrivs ovan, men med nodroller.

  • Nodrollen Extraktuppdateringar för Bakgrundsprocessor: Genom att ställa in nod 3 på nodrollen Extraktuppdateringar för Bakgrundsprocessor körs endast inkrementella uppdateringar, fullständiga uppdateringar och krypterings-/dekrypteringsjobb på den här noden. Genom att ställa in nod 4 på nodrollen Inga extraktuppdateringar för Bakgrundsprocessor körs alla andra bakgrundsjobb än extraktuppdateringar på den här noden. Dataserver och Gateway hjälper till i extraktuppdateringsjobben vid användning av sammanslutna extrakt och skuggfiler. Mer information om Bakgrundsprocessor-nodroller finns i Nodroller för fillagring.

    Eftersom nod 1 också har processerna för lagringsplats och fillagring så finns alla data som behövs för att säkerhetskopiera på nod 1, vilket kan förbättra säkerhetskopieringsprestandan.

    Bakgrundsprocessor-nodroller är tillgängliga med Advanced Management från och med Tableau Server-version 2019.3.

  • Nodrollen Extraktfrågor för Fillagring: Nod 5 och 6 är dedikerade Datamotor-noder och har nodrollen Extraktfrågor för Fillagring för att säkerställa att de endast hanterar frågor för inläsning av visualiseringar, prenumerationer och datadrivna aviseringar.
  • Nodrollen Interaktiva extraktfrågor för Fillagring: För dedikerade Datamotor-noder med nodrollen Extraktfrågor för Fillagring kan serveradministratörer isolera de interaktiva och schemalagda arbetsbelastningarna, så att de körs på specifika, dedikerade Datamotor-noder. Detta är användbart när många användare interagerar och läser in arbetsböcker under perioder med hög prenumerationsvolym. Anta till exempel att 1 000 prenumerationer har schemalagts till kl. 8.00 på måndag morgon. Samtidigt läser många användare in instrumentpaneler i början på dagen. Den sammanlagda volymen av prenumerationer och användarfrågor kan leda till att användare upplever långsammare och ojämnare inläsning av arbetsböcker. Med nodrollen Interaktiva extraktfrågor för Fillagring kan du utse dedikerade Datamotor-noder, som endast accepterar frågor från interaktiva användare (de som tittar på skärmen när de väntar). Dessa dedikerade Datamotor-noder, som prioriteras för interaktiv arbetsbelastning, skyddas mot den höga volymen av konkurrerande prenumerationsjobb och ger mer konsekventa frågetider. Dessutom kan serveradministratörer använda den här nodrollen för att bättre planera inför tillväxt, då de kan lägga till dedikerade Datamotor-noder separat för interaktiva och schemalagda arbetsbelastningar. Mer information finns i Nodroller för fillagring.

    Fillagringsnodroller är tillgängliga med Advanced Management från och med Tableau Server-version 2020.4.

  • Optimering med Extern fillagring: Med den här funktionen kan du använda en nätverksresurs som lagringsplats för Fillagring i stället för att använda den lokala disken på en Tableau Server-nod. Genom att ha lagringen på en centraliserad plats kan du minska mängden nätverkstrafik som läggs på att kopiera data mellan fillagringsnoderna betydligt. Exempel: Om Fillagring använder en lokal disk och ett extrakt på 1 GB uppdateras med lokal Fillagring, kopieras dessa data på 1 GB till alla noder som kör processen Fillagring. Om Tableau Server har konfigurerats med Extern Fillagring behöver extraktet på 1 GB endast kopieras till nätverksresursen en gång, så har alla fillagringsnoder tillgång till den kopian. Centraliseringen av lagring minskar även den totala mängden lokal lagring som krävs på fillagringsnoder.

    Dessutom utnyttjar Tableau Server-säkerhetskopieringar ögonblicksbildsteknik för att minska tiden för att slutföra en säkerhetskopiering betydligt.

    Även om du inte behöver en dedikerad Datamotor-nod för att dra nytta av fördelarna med Extern fillagring kan de extra funktionerna för hantering av arbetsbelastning med Fillagringsnodrollen och nodrollen Interaktiva extraktfrågor användas tillsammans. Mer information finns i avsnittet Extern fillagring på Tableau Server.

    Extern fillagring är tillgänglig med Advanced Management från och med Tableau Server-version 2020.1.

     

Tack för din feedback!Din feedback har skickats in. Tack!