Tableau Server-data-engine

Hyper is de data-engine-technologie in het geheugen van Tableau, geoptimaliseerd voor snelle data-opname en analytische queryverwerking bij grote of complexe datasets. Hyper drijft de data-engine aan in Tableau Server, Tableau Desktop, Tableau Cloud en Tableau Public. De data-engine wordt gebruikt bij het maken en vernieuwen van extracten en bij het uitvoeren van query's voor extracten. Hij wordt ook gebruikt voor joins op basis van meerdere databases om federatieve databronnen met meerdere verbindingen te ondersteunen.

Proces

Data Engine

StatusStatus van het proces Data Engine is zichtbaar op de statuspagina. Zie Serverprocesstatus weergeven voor meer informatie.
LoggenLogboeken gegenereerd door het proces Data Engine bevinden zich in C:\ProgramData\Tableau\Tableau Server\data\tabsvc\logs\hyper. Zie Tableau Server-logboeken en locaties van logboekbestanden voor meer informatie.

Geheugen en CPU-gebruik

De data-engine is ontworpen om alle beschikbare CPU en geheugen op de machine te benutten om de snelste responstijden te bieden.

CPU-gebruik

Hyper-technologie maakt gebruik van de nieuwe instructiesets in CPU en kan parallelliseren en schalen naar alle beschikbare kernen. Hyper-technologie is ontworpen om efficiënt naar veel kernen te schalen en ook om het gebruik van elke afzonderlijke kern zoveel mogelijk te maximaliseren. Dit betekent dat u tijdens de verwerking van query's een gemiddeld gebruik van de totale CPU van 75% per uur kunt verwachten. Het toevoegen van meer CPU zou tot prestatieverbetering moeten leiden.

Opmerking: het gemiddelde gebruik van 75% per uur is de standaardwaarde en moet ongewijzigd blijven, tenzij u de data-engine op een speciaal serverknooppunt draait. Zie Optimaliseren voor omgevingen met veel extract-query's voor meer informatie over het uitvoeren van de data-engine op een speciaal knooppunt.

Moderne besturingssystemen zoals Microsoft Windows, Apple macOS en Linux beschikken over mechanismen die ervoor zorgen dat zelfs als een CPU volledig wordt gebruikt, inkomende en andere actieve processen tegelijkertijd kunnen worden uitgevoerd. Om het totale bronverbruik te beheren en om overbelasting en het volledig uithongeren van andere processen op de machine te voorkomen, controleert de data-engine bovendien zichzelf om binnen de limieten te blijven die zijn vastgelegd in de Tableau Server Resource Manager (SRM). Tableau Server Resource Manager bewaakt het bronverbruik en waarschuwt de data-engine om het gebruik te verminderen wanneer de vooraf gedefinieerde limiet wordt overschreden.

Omdat de data-engine is ontworpen om de beschikbare CPU te gebruiken, is het normaal dat er soms pieken in het CPU-gebruik optreden. Als u echter gedurende langere tijd (een uur of langer) een hoog CPU-gebruik ziet (bijvoorbeeld 95%), kan dit een aantal dingen betekenen:

  • Er is een grote hoeveelheid query's. Dit kan gebeuren als een server onder druk staat als gevolg van een overbelasting van meerdere clientverzoeken en er query's in de wachtrij staan. Als dit vaak gebeurt, is dit een indicatie dat er meer hardware nodig is om de clients te bedienen. Het toevoegen van meer CPU zou in dit geval de prestaties moeten helpen verbeteren.

  • Er is één langlopende query. In dit geval stopt de Tableau Server Resource Manager langlopende query's op basis van de time-outinstellingen. Dit gold ook voor de Tableau Server-versies vóór versie 10.5.

Zie Algemene prestatierichtlijnen voor meer informatie over Tableau Server Resourcebeheerder.

Geheugengebruik

Het geheugengebruik van de data-engine is afhankelijk van de hoeveelheid data die nodig is om de query te beantwoorden. De data-engine zal proberen dit eerst in het geheugen uit te voeren. Er wordt een werksetgeheugen toegewezen om een tussenliggende datastructuur op te slaan tijdens de verwerking van query's. In de meeste gevallen hebben systemen voldoende geheugen om dit soort verwerkingen uit te voeren, maar als er niet genoeg beschikbaar geheugen is of als meer dan 80% van het RAM-geheugen wordt gebruikt, schakelt de data-engine over op in de wachtrij plaatsen door tijdelijk naar de schijf te schrijven. Het tijdelijke bestand wordt verwijderd nadat de query is beantwoord. Daarom is in de wachtrij plaatsen een indicatie dat er mogelijk meer geheugen nodig is. Het geheugengebruik moet op de juiste manier worden gecontroleerd en bijgewerkt om prestatieproblemen veroorzaakt door in de wachtrij plaatsen te voorkomen.

Om geheugenbronnen op de machine te beheren, wordt de maximale geheugenlimiet voor de data-engine ingesteld door Tableau Server Resource Manager (SRM).

Serverconfiguratie, schaalbaarheid en prestaties

  • Er wordt automatisch één instantie van de data-engine geïnstalleerd per knooppunt waar een exemplaar van Bestandsarchief, Toepassingsserver (VizPortal), VizQLServer, Data Server of Backgrounder op Tableau Server is geïnstalleerd. De data-engine kan zichzelf schalen en gebruikt zoveel CPU en geheugen als nodig is, waardoor er geen noodzaak meer is voor meerdere instanties van de data-engine. Zie Tableau Server-processen voor meer informatie over de serverprocessen.

  • De instantie van de data-engine die is geïnstalleerd op het knooppunt waarop Bestandsarchief is geïnstalleerd, wordt gebruikt voor het opvragen van data voor weergaveverzoeken. De instantie van de data-engine die is geïnstalleerd op het knooppunt waarop Backgrounder is geïnstalleerd, wordt gebruikt voor het maken en vernieuwen van extracten. Dit is een belangrijke overweging bij het verbeteren van prestaties. Zie Prestaties verbeteren voor meer informatie.

  • Data Server, VizQL Server en de Toepassingsserver (VizPortal) gebruiken allemaal de lokale instantie van de data-engine om joins op basis van meerdere databases uit te voeren en schaduwextracten te maken. Schaduwextractbestanden worden alleen gemaakt als u werkt met werkmappen die zijn gebaseerd op niet-verouderde Excel- of tekstbestanden of statistische bestanden. Tableau maakt een schaduwextractbestand om de data sneller te laden.

  • In Tableau Server 10.5 wordt één instantie van de data-engine automatisch geïnstalleerd wanneer u Backgrounder installeert. Het Backgrounder-proces maakt gebruik van de enkele instantie van de data-engine (hyperd.exe) die op hetzelfde knooppunt is geïnstalleerd.

Belangrijk! Er zijn uitzonderingen wanneer de data-engine op hetzelfde knooppunt als Bestandsarchief is geïnstalleerd. Wanneer Bestandsarchief extern is geconfigureerd voor Tableau Server, wordt de data-engine niet langer geïnstalleerd met Bestandsarchief. In deze configuratie, waarbij Tableau Server is geconfigureerd met een extern bestandsarchief, blijft de data-engine geïnstalleerd met het andere proces, zoals hierboven vermeld. Bovendien kunt u de data-engine ook op een knooppunt configureren zonder andere processen, maar alleen wanneer Bestandsarchief extern is geconfigureerd. Zie Extern bestandsarchief Tableau Server voor meer informatie over het externe bestandsarchief.

Schaalbaarheid:

U kunt opschalen met de nieuwe data-engine: omdat kernen volledig worden benut, zorgt het toevoegen van meer kernen ervoor dat individuele query's sneller worden uitgevoerd, waardoor er in minder tijd meer query's kunnen worden uitgevoerd.

Het geheugengebruik moet op de juiste manier worden gecontroleerd en bijgewerkt om prestatieproblemen veroorzaakt door in de wachtrij plaatsen te voorkomen.

Zie Schaalbaarheid van Tableau Server voor meer informatie over schaalbaarheid.

Prestaties:

Prestatievoordelen

Vanaf 10.5 is Hyper-technologie geïntegreerd met Tableau-data-engine om u de volgende belangrijke voordelen te bieden:

  • Snellere creatie van extracten: met Hyper-technologie worden extracten bijna net zo snel gegenereerd als het bronsysteem data kan leveren, zonder dat sortering nodig is.

  • Ondersteuning voor grotere extracten: vóór deze release was het mogelijk dat u niet al uw data in één extract kon krijgen. Met Hyper-technologie kunnen veel grotere hoeveelheden data in één extract worden opgenomen.

  • Snellere analyse van extracten: in veel gevallen kunnen query's sneller worden uitgevoerd voor grotere extracten of werkmappen met complexe berekeningen.

Hier zijn enkele redenen waarom de data-engine, mogelijk gemaakt door Hyper, beter presteert bij grotere of complexe extracten en is geoptimaliseerd voor sneller query's uitvoeren:

  • Hyper-technologie is ontworpen om data sneller te verbruiken. In tegenstelling tot eerdere versies doet de data-engine geen nabewerking zoals sorteren. Met Hyper zijn nabewerkingsstappen zoals sorteren niet nodig, waardoor de data-engine beter kan presteren met grotere extracten.

  • Hyper-technologie is geoptimaliseerd voor geheugen. Dit betekent dat alle data, indien nodig, in het geheugen blijft staan. Dit resulteert in snelle toegangstijden tot data.

  • Hyper-technologie is geoptimaliseerd voor CPU. Dit betekent dat de data-engine de uitvoering van query's nu volledig parallelliseert en de beschikbare CPU op een zodanige manier gebruikt dat de uitvoeringstijd van query's bijna lineair wordt geschaald met het aantal kernen in de machine.

  • Hyper is een compilerende query-engine. Query's worden geïnterpreteerd of gecompileerd naar de machinecode voor maximale prestaties, waardoor de data-engine de meeste prestaties uit moderne hardware (CPU, grote hoofdgeheugencapaciteit) kan halen.

  • Hyper-technologie maakt gebruik van geavanceerde queryoptimalisaties om query's sneller te maken. Samen met vele aanvullende geavanceerde technieken, zoals het materialiseren van minimum- en maximumwaarden voor elke kolom, mini-indexen om zoekbereiken te optimaliseren, gedetailleerdere woordenboeken op datablokniveau, geavanceerde logica voor optimalisatie van samenvoegingen en subqueryprestaties, biedt de nieuwe data-engine veel verbeteringen ten opzichte van de vorige Tableau-data-engine op het gebied van prestaties en schaalbaarheid.

Voor meer informatie over de prestaties begint u met Algemene prestatierichtlijnen en Prestaties verbeteren.

Bedankt voor uw feedback.De feedback is verzonden. Dank u wel.