Tableau Server-Daten-Engine

Bei Hyper handelt es sich um die In-Memory-Daten-Engine-Technologie von Tableau, die für schnelle Datenerfassung und analytische Abfrageverarbeitung für große oder komplexe Datensätze optimiert ist. Ab Tableau 10.5 unterstützt Hyper die neue Daten-Engine in Tableau Server, Tableau Desktop, Tableau Online und Tableau Public. Die Daten-Engine wird beim Erstellen, Aktualisieren oder Abfragen von Extrakten verwendet. Sie wird zudem für datenbankübergreifende Verknüpfungen verwendet, um verbundene Datenquellen mit mehreren Verbindungen zu unterstützen.

Prozess

Data Engine

Status Der Status des Data Engine-Prozesses ist auf der Seite "Status" sichtbar. Weitere Informationen finden Sie unter Anzeigen des Status eines Serverprozesses.
Protokollierung Durch den Data Engine-Prozess generierte Protokolle befinden sich unter C:\ProgramData\Tableau\Tableau Server\data\tabsvc\logs\hyper. Weitere Informationen finden Sie unter Speicherorte von Server-Protokolldateien.

Arbeitsspeicher- und CPU-Auslastung

Die Daten-Engine ist so konzipiert, dass sie die gesamte auf dem Computer verfügbare CPU und den Arbeitsspeicher verwendet, um die schnellsten Antwortzeiten zu ermöglichen.

CPU-Auslastung

Die Hyper-Technologie verwendet die neuen Befehlssätze in der CPU und kann eine Parallelisierung und Skalierung zu allen verfügbaren Kernen vornehmen. Die Hyper-Technologie ist so konzipiert, dass viele Kerne effizient skaliert und die Verwendung der einzelnen Kerne maximiert wird. Demzufolge können Sie erwarten, dass die CPU während der Abfrageverarbeitung vollständig in Anspruch genommen wird. Es wird davon ausgegangen, dass die Leistung durch das Hinzufügen von mehr CPU-Ressourcen verbessert wird.

Moderne Betriebssysteme wie Microsoft Windows, Apple macOS und Linux verfügen über Mechanismen, die sicherstellen, dass eingehende und andere aktive Prozesse gleichzeitig ausgeführt werden können, und zwar sogar wenn eine CPU vollständig ausgelastet ist. Zusätzlich zum Verwalten der CPU-Ressourcenauslastung und zum Verhindern der Überlastung und der vollständigen Unterversorgung anderer auf dem Computer ausgeführter Prozesse überwacht sich die Daten-Engine selbst, um die vom Tableau Server-Ressourcen-Manager festgelegten Grenzwerte nicht zu überschreiten. Der Tableau Server-Ressourcen-Manager überwacht die Ressourcenauslastung und benachrichtigt die Daten-Engine dahingehend, die Nutzung zu reduzieren, wenn sie die vordefinierten Grenzwerte überschreitet.

Da die Daten-Engine die verfügbare CPU nutzen soll, ist es normal, dass zeitweise CPU-Auslastungsspitzen auftreten. Wenn die CPU-Auslastung (z. B. 95 %) über längere Zeiträume (eine Stunde oder mehr) hoch ist, kann dies einige Dinge bedeuten:

  • Es liegt eine hohe Abfragelast vor. Dies kann passieren, wenn ein Server aufgrund der Überlastung durch mehrere Clientanforderungen unter Stress steht und die Abfragen in der Warteschlange stehen. Wenn dies oft vorkommt, bedeutet dies, dass mehr Hardware erforderlich ist, um die Client zu versorgen. Wenn in diesem Fall mehr CPU-Ressourcen hinzugefügt werden, sollte dies zu einer besseren Leistung führen.

  • Es liegt eine Abfrage vor, die lange ausgeführt wird. In diesem Fall beendet der Tableau Server-Ressourcen-Manager auf Grundlage der Zeitüberschreitungseinstellungen Abfragen, die lange ausgeführt werden. Dies galt auch für die Tableau Server-Versionen vor Version 10.5.

Weitere Informationen zum Tableau Server-Ressourcen-Manager finden Sie unter Allgemeine Richtlinien zur Leistung.

Arbeitsspeichernutzung

Die Arbeitsspeichernutzung der Daten-Engine hängt von der zum Beantworten der Abfrage erforderlichen Datenmenge ab. Die Daten-Engine versucht, diese zunächst im Arbeitsspeicher auszuführen. Es wird ein Arbeitssatzspeicher zugeteilt, damit während der Abfrageverarbeitung eine Zwischendatenstruktur gespeichert wird. In den meisten Fällen verfügen Systeme über ausreichend Arbeitsspeicher, um diese Verarbeitungstypen durchzuführen. Wenn jedoch nicht genug Arbeitsspeicher vorhanden ist oder mehr als 80 % des Arbeitsspeichers ausgelastet sind, wechselt die Daten-Engine zum Spoolvorgang, indem sie vorübergehend auf den Datenträger schreibt. Nachdem die Abfrage beantwortet wurde, wird die temporäre Datei gelöscht. Der Spoolvorgang gibt demnach an, dass ggf. mehr Arbeitsspeicher benötigt wird. Die Arbeitsspeicherauslastung sollte überwacht und entsprechend aufgerüstet werden, um durch den Spoolvorgang verursachte Leistungsprobleme zu vermeiden.

Der Tableau Server-Ressourcen-Manager (SRM) legt den maximalen Speichergrenzwert für die Daten-Engine fest, um die Arbeitsspeicherressourcen auf dem Computer zu verwalten.

Serverkonfiguration, Skalierbarkeit und Leistung

  • Für jeden Knoten, auf dem eine Dateispeicher-, Anwendungsserver-(VizPortal-), VizQLServer-, Datenserver- oder Hintergrundprozesskomponenten-Instanz installiert ist, wird automatisch eine einzelne Daten-Engine-Instanz installiert. Die Daten-Engine kann sich selbst skalieren und nutzt die entsprechend benötigten CPU- und Arbeitsspeicherressourcen. Dadurch sind mehrere Instanzen der Daten-Engine nicht mehr nötig. Weitere Informationen zu Serverprozessen finden Sie unter Tableau Server-Prozesse.

  • Die Instanz der auf dem Knoten, auf dem der Dateispeicher installiert ist, installierten Daten-Engine wird verwendet, um Daten für Anzeigeanforderungen abzufragen. Die Instanz der auf dem Knoten installierten Daten-Engine, auf dem die Hintergrundprozesskomponente installiert ist, wird verwendet, um Extrakte zu erstellen und zu aktualisieren. Dies sollten Sie unbedingt beachten, wenn Sie Leistungsoptimierungen vornehmen. Weitere Informationen finden Sie unter Beispiele für die Leistungsoptimierung.

  • Der Datenserver, der VizQL Server und der Anwendungsserver (VizPortal) verwenden die lokale Daten-Engine-Instanz, um datenbankübergreifende Verknüpfungen und Schattenextrakte zu erstellen. Schattenextraktdateien werden nur erstellt, wenn Sie Arbeitsmappen verwenden, die auf nicht veralteten Excel-, Text- oder Statistikdateien basieren. Tableau erstellt eine Schattenextraktdatei, damit die Daten schneller geladen werden.

  • In Tableau Server 10.5 wird während der Installation der Hintergrundprozesskomponente automatisch eine Instanz der Daten-Engine installiert. Der Hintergrundprozesskomponenten-Prozess verwendet die auf demselben Knoten installierte Daten-Engine-Einzelinstanz (hyperd.exe).

Skalierbarkeit:

Sie können mit der neuen Daten-Engine hochskalieren: Da die Kerne vollständig ausgelastet werden, werden einzelne Abfragen durch das Hinzufügen weiterer Kerne schneller ausgeführt. Dadurch können mehr Abfragen in weniger Zeit ausgeführt werden.

Die Arbeitsspeicherauslastung sollte überwacht und entsprechend aufgerüstet werden, um durch den Spoolvorgang verursachte Leistungsprobleme zu vermeiden.

Weitere Informationen zur Skalierbarkeit finden Sie unter Tableau Server-Skalierbarkeit.

Leistung:

Wie zu Anfang dieses Themas erwähnt, erreichen Sie durch ein Upgrade auf Tableau 10.5 oder höher in den meisten Fällen eine Leistungsverbesserung. Gelegentlich treten jedoch Leistungsprobleme wie langsamere Reaktionszeiten auf, insbesondere bei Arbeitsmappen mit komplexen Berechnungen. Wir empfehlen Ihnen vor einem Upgrade zu testen, ob mit Ihren Arbeitsmappen Leistungsprobleme zu erwarten sind. Weitere Informationen finden Sie unter Testen der Arbeitsmappenleistung. Falls Sie Tableau Server bereits aktualisiert haben und Probleme auftreten, finden Sie im Abschnitt Fehlerbehebung bei Leistungsproblemen mit Arbeitsmappen mit Berechnungen nähere Informationen.

Weitere Informationen zur Leistung finden Sie unter Allgemeine Richtlinien zur Leistung und Leistungsanpassung

Leistungsvorteile

Ab Version 10.5 ist die Hyper-Technologie in der Tableau-Daten-Engine integriert. Dadurch erhalten Sie u. a. folgende Vorteile:

  • Schnellere Extrakterstellung: Mit der Hyper-Technologie werden Extrakte nahezu so schnell generiert, wie das Quellsystem Daten bereitstellen kann, wobei keine Sortierung erforderlich ist.

  • Unterstützung größerer Extrakte: Vor dieser Version waren Sie möglicherweise nicht in der Lage, alle Ihre Daten in einem einzelnen Extrakt zu vereinen. Mit der Hyper-Technologie können viel größere Datenmengen in einem einzelnen Extrakt enthalten sein.

  • Schnellere Analyse von Extrakten: In vielen Fällen werden Sie feststellen, dass die Abfrage von Daten für größere Extrakte oder Arbeitsmappen mit komplexen Berechnungen schneller ist.

Im Folgenden finden Sie einige Gründe, weshalb die von Hypher unterstützte Daten-Engine eine bessere Leistung bei größeren oder komplexen Extrakten aufweist und für schnellere Abfragen optimiert ist:

  • Die Hyper-Technologie wurde so konzipiert, dass sie Daten schneller verwendet. Im Gegensatz zu vorherigen Versionen nimmt die Daten-Engine keine Nachverarbeitungen wie Sortierungen vor. Mit Hyper sind Nachverarbeitungsschritte wie Sortierungen nicht erforderlich. Dadurch kann die Daten-Engine große Extrakte besser verarbeiten.

  • Die Hyper-Technologie ist speicheroptimiert. Demzufolge sind alle Daten bei Bedarf im Speicher vorhanden. Dies hat schnelle Zugriffszeiten zur Folge.

  • Die Hyper-Technologie ist CPU-optimiert. Die Daten-Engine parallelisiert nun vollständig die Abfrageausführung und nutzt die verfügbare CPU so, dass die Abfrageausführungszeit nahezu linear mit der Anzahl der Kerne im Computer skaliert wird.

  • Hyper ist eine Engine zum Kompilieren von Abfragen. Abfragen werden entweder interpretiert oder im Computercode zusammengetragen, um eine maximale Leistung zu erzielen und um der Daten-Engine zu ermöglichen, die moderne Hardware (CPU, große Arbeitsspeicherkapazitäten) bestmöglich zu nutzen.

  • Die Hyper-Technologie nutzt erweiterte Abfrageoptimierungen, um Abfragen schneller zu erstellen. Zusammen mit vielen zusätzlichen erweiterten Techniken, beispielsweise das Materialisieren der minimalen und maximalen Werte für jede Spalte, Mini-Indizes zum Optimieren von Suchbereichen, Verzeichnisse auf Datenblockebene mit einer höheren Granularität, eine erweiterte Logik für Optimierungen von Verknüpfungen und der Teilabfrageleistung, bietet die Daten-Engine im Vergleich zur vorherigen Tableau-Daten-Engine viele Verbesserungen in Bezug auf die Leistung und Skalierbarkeit.

Vielen Dank für Ihr Feedback! Es gab einen Fehler bei der Übermittlung Ihres Feedback. Versuchen Sie es erneut oder senden Sie uns eine Nachricht.