Tableau Server-Daten-Engine

Bei Hyper handelt es sich um die In-Memory-Daten-Engine-Technologie von Tableau, die für schnelle Datenerfassung und analytische Abfrageverarbeitung für große oder komplexe Datensätze optimiert ist. Die Daten-Engine in Tableau Server, Tableau Desktop, Tableau Cloud und Tableau Public wird von Hypers unterstützt. Die Daten-Engine wird beim Erstellen, Aktualisieren oder Abfragen von Extrakten verwendet. Sie wird zudem für datenbankübergreifende Verknüpfungen verwendet, um verbundene Datenquellen mit mehreren Verbindungen zu unterstützen.

Prozess

Data Engine

StatusDer Status des Data Engine-Prozesses ist auf der Seite "Status" sichtbar. Weitere Informationen finden Sie unter Anzeigen des Status eines Serverprozesses.
ProtokollierungDurch den Data Engine-Prozess generierte Protokolle befinden sich unter /var/opt/tableau/tableau_server/data/tabsvc/logs/hyper. Weitere Informationen finden Sie unter Speicherorte der Tableau Server-Protokolle und -Protokolldateien.

Arbeitsspeicher- und CPU-Auslastung

Die Daten-Engine ist so konzipiert, dass sie die gesamte auf dem Computer verfügbare CPU und den Arbeitsspeicher verwendet, um die schnellsten Antwortzeiten zu ermöglichen.

CPU-Auslastung

Die Hyper-Technologie verwendet die neuen Befehlssätze in der CPU und kann eine Parallelisierung und Skalierung zu allen verfügbaren Kernen vornehmen. Die Hyper-Technologie ist so konzipiert, dass viele Kerne effizient skaliert und die Verwendung der einzelnen Kerne maximiert wird. Das bedeutet, dass Sie während der Abfrageverarbeitung mit einer durchschnittlichen Auslastung der gesamten CPU pro Stunde von bis zu 75 % rechnen können. Durch Hinzufügen weiterer CPU-Ressourcen sollte sich die Leistung verbessern.

Hinweis: Die durchschnittliche stündliche CPU-Auslastung von 75 % ist der Standardwert und sollte unverändert bleiben, es sei denn, Sie führen die Daten-Engine auf einem dedizierten Serverknoten aus. Weitere Informationen über das Ausführen der Daten-Engine auf einem dedizierten Knoten finden Sie unter Optimieren für extraktabfragelastige Umgebungen.

Moderne Betriebssysteme wie Microsoft Windows, Apple macOS und Linux verfügen über Mechanismen, die sicherstellen, dass eingehende und andere aktive Prozesse gleichzeitig ausgeführt werden können, und zwar sogar wenn eine CPU vollständig ausgelastet ist. Zusätzlich zum Verwalten der CPU-Ressourcenauslastung und zum Verhindern der Überlastung und der vollständigen Unterversorgung anderer auf dem Computer ausgeführter Prozesse überwacht sich die Daten-Engine selbst, um die vom Tableau Server-Ressourcen-Manager festgelegten Grenzwerte nicht zu überschreiten. Der Tableau Server-Ressourcen-Manager überwacht die Ressourcenauslastung und benachrichtigt die Daten-Engine dahingehend, die Nutzung zu reduzieren, wenn sie die vordefinierten Grenzwerte überschreitet.

Da die Daten-Engine die verfügbare CPU nutzen soll, ist es normal, dass zeitweise CPU-Auslastungsspitzen auftreten. Wenn die CPU-Auslastung (z. B. 95 %) über längere Zeiträume (eine Stunde oder mehr) hoch ist, kann dies einige Dinge bedeuten:

  • Es liegt eine hohe Abfragelast vor. Dies kann passieren, wenn ein Server aufgrund der Überlastung durch mehrere Clientanforderungen unter Stress steht und die Abfragen in der Warteschlange stehen. Wenn dies oft vorkommt, bedeutet dies, dass mehr Hardware erforderlich ist, um die Client zu versorgen. Wenn in diesem Fall mehr CPU-Ressourcen hinzugefügt werden, sollte dies zu einer besseren Leistung führen.

  • Es liegt eine Abfrage vor, die lange ausgeführt wird. In diesem Fall beendet der Tableau Server-Ressourcen-Manager auf Grundlage der Zeitüberschreitungseinstellungen Abfragen, die lange ausgeführt werden. Dies galt auch für die Tableau Server-Versionen vor Version 10.5.

Weitere Informationen zum Tableau Server-Ressourcen-Manager finden Sie unter Allgemeine Richtlinien zur Leistung.

Arbeitsspeichernutzung

Die Arbeitsspeichernutzung der Daten-Engine hängt von der zum Beantworten der Abfrage erforderlichen Datenmenge ab. Die Daten-Engine versucht, diese zunächst im Arbeitsspeicher auszuführen. Es wird ein Arbeitssatzspeicher zugeteilt, damit während der Abfrageverarbeitung eine Zwischendatenstruktur gespeichert wird. In den meisten Fällen verfügen Systeme über ausreichend Arbeitsspeicher, um diese Verarbeitungstypen durchzuführen. Wenn jedoch nicht genug Arbeitsspeicher vorhanden ist oder mehr als 80 % des Arbeitsspeichers ausgelastet sind, wechselt die Daten-Engine zum Spoolvorgang, indem sie vorübergehend auf den Datenträger schreibt. Nachdem die Abfrage beantwortet wurde, wird die temporäre Datei gelöscht. Der Spoolvorgang gibt demnach an, dass ggf. mehr Arbeitsspeicher benötigt wird. Die Arbeitsspeicherauslastung sollte überwacht und entsprechend aufgerüstet werden, um durch den Spoolvorgang verursachte Leistungsprobleme zu vermeiden.

Der Tableau Server-Ressourcen-Manager (SRM) legt den maximalen Speichergrenzwert für die Daten-Engine fest, um die Arbeitsspeicherressourcen auf dem Computer zu verwalten.

Serverkonfiguration, Skalierbarkeit und Leistung

  • Für jeden Knoten, auf dem eine Dateispeicher-, Anwendungsserver-(VizPortal-), VizQLServer-, Datenserver- oder Hintergrundprozesskomponenten-Instanz installiert ist, wird in Tableau Server automatisch eine einzelne Daten-Engine-Instanz installiert. Die Daten-Engine kann sich selbst skalieren und nutzt die entsprechend benötigten CPU- und Arbeitsspeicherressourcen. Dadurch sind mehrere Instanzen der Daten-Engine nicht mehr nötig. Weitere Informationen zu Serverprozessen finden Sie unter Tableau Server-Prozesse.

  • Die Instanz der auf dem Knoten, auf dem der Dateispeicher installiert ist, installierten Daten-Engine wird verwendet, um Daten für Anzeigeanforderungen abzufragen. Die Instanz der auf dem Knoten installierten Daten-Engine, auf dem die Hintergrundprozesskomponente installiert ist, wird verwendet, um Extrakte zu erstellen und zu aktualisieren. Dies sollten Sie unbedingt beachten, wenn Sie Leistungsoptimierungen vornehmen. Weitere Informationen finden Sie unter Leistungsanpassung.

  • Der Datenserver, der VizQL Server und der Anwendungsserver (VizPortal) verwenden die lokale Daten-Engine-Instanz, um datenbankübergreifende Verknüpfungen und Schattenextrakte zu erstellen. Schattenextraktdateien werden nur erstellt, wenn Sie Arbeitsmappen verwenden, die auf nicht veralteten Excel-, Text- oder Statistikdateien basieren. Tableau erstellt eine Schattenextraktdatei, damit die Daten schneller geladen werden.

  • In Tableau Server 10.5 wird während der Installation der Hintergrundprozesskomponente automatisch eine Instanz der Daten-Engine installiert. Der Hintergrundprozesskomponenten-Prozess verwendet die auf demselben Knoten installierte Daten-Engine-Einzelinstanz (hyperd.exe).

Wichtig! Es gibt Ausnahmen, wenn die Daten-Engine auf demselben Knoten wie der Dateispeicher installiert ist. Wenn der Dateispeicher extern für Tableau Server konfiguriert ist, wird die Daten-Engine nicht mehr mit dem Dateispeicher installiert. In dieser Konfiguration, in der Tableau Server mit einem externen Dateispeicher konfiguriert ist, wird die Daten-Engine weiterhin mit dem anderen Prozess installiert, wie oben erwähnt. Darüber hinaus können Sie die Daten-Engine auch auf einem Knoten ohne andere Prozesse konfigurieren – jedoch nur, wenn der Dateispeicher extern konfiguriert ist. Weitere Informationen zum externen Dateispeicher finden Sie unter Externer Tableau Server-Dateispeicher.

Skalierbarkeit:

Sie können mit der neuen Daten-Engine hochskalieren: Da die Kerne vollständig ausgelastet werden, werden einzelne Abfragen durch das Hinzufügen weiterer Kerne schneller ausgeführt. Dadurch können mehr Abfragen in weniger Zeit ausgeführt werden.

Die Arbeitsspeicherauslastung sollte überwacht und entsprechend aufgerüstet werden, um durch den Spoolvorgang verursachte Leistungsprobleme zu vermeiden.

Weitere Informationen zur Skalierbarkeit finden Sie unter Tableau Server-Skalierbarkeit.

Leistung:

Leistungsvorteile

Ab Version 10.5 ist die Hyper-Technologie in der Tableau-Daten-Engine integriert. Dadurch erhalten Sie u. a. folgende Vorteile:

  • Schnellere Extrakterstellung: Mit der Hyper-Technologie werden Extrakte nahezu so schnell generiert, wie das Quellsystem Daten bereitstellen kann, wobei keine Sortierung erforderlich ist.

  • Unterstützung größerer Extrakte: Vor dieser Version waren Sie möglicherweise nicht in der Lage, alle Ihre Daten in einem einzelnen Extrakt zu vereinen. Mit der Hyper-Technologie können viel größere Datenmengen in einem einzelnen Extrakt enthalten sein.

  • Schnellere Analyse von Extrakten: In vielen Fällen werden Sie feststellen, dass die Abfrage von Daten für größere Extrakte oder Arbeitsmappen mit komplexen Berechnungen schneller ist.

Im Folgenden finden Sie einige Gründe, weshalb die von Hypher unterstützte Daten-Engine eine bessere Leistung bei größeren oder komplexen Extrakten aufweist und für schnellere Abfragen optimiert ist:

  • Die Hyper-Technologie wurde so konzipiert, dass sie Daten schneller verwendet. Im Gegensatz zu vorherigen Versionen nimmt die Daten-Engine keine Nachverarbeitungen wie Sortierungen vor. Mit Hyper sind Nachverarbeitungsschritte wie Sortierungen nicht erforderlich. Dadurch kann die Daten-Engine große Extrakte besser verarbeiten.

  • Die Hyper-Technologie ist speicheroptimiert. Demzufolge sind alle Daten bei Bedarf im Speicher vorhanden. Dies hat schnelle Zugriffszeiten zur Folge.

  • Die Hyper-Technologie ist CPU-optimiert. Die Daten-Engine parallelisiert nun vollständig die Abfrageausführung und nutzt die verfügbare CPU so, dass die Abfrageausführungszeit nahezu linear mit der Anzahl der Kerne im Computer skaliert wird.

  • Hyper ist eine Engine zum Kompilieren von Abfragen. Abfragen werden entweder interpretiert oder im Computercode zusammengetragen, um eine maximale Leistung zu erzielen und um der Daten-Engine zu ermöglichen, die moderne Hardware (CPU, große Arbeitsspeicherkapazitäten) bestmöglich zu nutzen.

  • Die Hyper-Technologie nutzt erweiterte Abfrageoptimierungen, um Abfragen schneller zu erstellen. Zusammen mit vielen zusätzlichen erweiterten Techniken, beispielsweise das Materialisieren der minimalen und maximalen Werte für jede Spalte, Mini-Indizes zum Optimieren von Suchbereichen, Verzeichnisse auf Datenblockebene mit einer höheren Granularität, eine erweiterte Logik für Optimierungen von Verknüpfungen und der Teilabfrageleistung, bietet die Daten-Engine im Vergleich zur vorherigen Tableau-Daten-Engine viele Verbesserungen in Bezug auf die Leistung und Skalierbarkeit.

Weitere Informationen zur Leistung finden Sie unter Allgemeine Richtlinien zur Leistung und Leistungsanpassung

Vielen Dank für Ihr Feedback!Ihr Feedback wurde erfolgreich übermittelt. Vielen Dank.