Das Tableau-Datenmodell

Jede Datenquelle, die Sie in Tableau erstellen, verfügt über ein Datenmodell. Sie können sich ein Datenmodell als Diagramm vorstellen, das Tableau darüber informiert, wie Daten in den verbundenen Datenbanktabellen abgefragt werden sollen.

Die Tabellen, die Sie dem Arbeitsbereich auf der Seite Datenquelle hinzufügen, bilden die Struktur des Datenmodells. Ein Datenmodell kann einfach sein, z. B. eine einzelne Tabelle. Oder es kann komplexer sein, mit mehreren Tabellen, die verschiedene Kombinationen von Beziehungen, Verknüpfungen und Vereinigungen verwenden.

Das Datenmodell besteht aus zwei Ebenen:

  • Die Standardansicht, die Sie zuerst im Verknüpfungsbereich der Datenquellenseite sehen, ist die logische Ebene der Datenquelle. Sie kombinieren Daten in der logischen Ebene mithilfe von Beziehungen (oder Nudeln). Stellen Sie sich diese Ebene als einen Verknüpfungsbereich der Beziehungen auf der Datenquellenseite vor. Weitere Informationen finden Sie unter Verwenden von Beziehungen für die Datenanalyse mit mehreren Tabellen.
  • Die nächste Ebene ist die physische Ebene. Sie kombinieren Daten zwischen Tabellen auf der physischen Ebene mithilfe von Verknüpfungen und Vereinigungen. Jede logische Tabelle enthält mindestens eine physische Tabelle in dieser Ebene. Stellen Sie sich diese physische Ebene als einen Verknüpfungsbereich der Verknüpfung/Vereinigung auf der Datenquellenseite vor. Doppelklicken Sie auf eine logische Tabelle, um Verknüpfungen und Vereinigungen anzuzeigen oder hinzuzufügen.

Logische Ebene   Physische Ebene
Nudeln = Beziehungen   Venn-Diagramm = Verknüpfungen
 
Die Ansicht einer Datenquelle auf oberster Ebene mit mehreren verknüpften Tabellen. Dies ist die logische Ebene. Logische Tabellen können mit Beziehungen (Nudeln) kombiniert werden. Sie verwenden keine Verknüpfungstypen. Sie agieren wie Container für physische Tabellen.   Doppelklicken Sie auf eine logische Tabelle, um sie zu öffnen und ihre physischen Tabellen anzuzeigen Physische Tabellen können mit Verknüpfungen oder Vereinigungen kombiniert werden. In diesem Beispiel besteht die logische Tabelle "Book" (Buch) aus drei verknüpften physischen Tabellen ("Book" (Buch), "Award" (Auszeichnung), "Info").

 

Logische Ebene   Physische Ebene
Verknüpfungsbereich der Beziehungen auf der Datenquellenseite   Verknüpfungsbereich der Verknüpfung/Vereinigung auf der Datenquellenseite
Die in diesen Bereich gezogene Tabellen werden als logische Tabellen bezeichnet   Die in diesen Bereich gezogene Tabellen werden als physische Tabellen bezeichnet
Logische Tabellen können mit anderen logischen Tabellen in Beziehung gesetzt werden   Physische Tabellen können mit anderen physischen Tabellen verknüpft oder vereinigt werden
Logische Tabellen sind wie Container für physische Tabellen   Doppelklicken Sie auf eine logische Tabelle, um ihre physischen Tabellen anzuzeigen
Die Detailgenauigkeit befindet sich auf der Zeilenebene der logischen Tabelle   Die Detailgenauigkeit befindet sich auf der Zeilenebene der zusammengeführten physischen Tabellen
Logische Tabellen bleiben unterschiedlich (normalisiert), nicht in der Datenquelle zusammengeführt   Physische Tabellen werden in einer einzelnen, flachen Tabelle zusammengeführt, welche die logische Tabelle definiert

Ebenen des Datenmodells

Die oberste Ansichtsebene einer Datenquelle ist die logische Ebene des Datenmodells. Sie können sich diese als den Verknüpfungsbereich der Beziehungen vorstellen, da Tabellen hier mit Beziehungen kombiniert werden statt mit Verknüpfungen.

Wenn Sie Daten aus mehreren Tabellen kombinieren, muss jede Tabelle, die Sie in den Verknüpfungsbereich in der logischen Ebene ziehen, eine Beziehung zu einer anderen Tabelle haben. Sie müssen die Verknüpfungstypen für Beziehungen nicht angeben. Während der Analyse wählt Tableau automatisch die geeigneten Verknüpfungstypen anhand der Felder und des Kontexts der Analyse im Arbeitsblatt aus.

Auf der physischen Ebene des Datenmodells können Sie Daten mit Verknüpfungen und Vereinigungen kombinieren. Sie können nur Pivots in diesem Verknüpfungsbereich verwenden. Sie können es sich als den Verknüpfungsbereich der Verknüpfung/Vereinigung vorstellen. In früheren Versionen von Tableau war die physische Ebene die einzige Ebene im Datenmodell. Jede logische Tabelle kann eine oder mehrere physische Tabellen enthalten.

Wichtig: Sie können weiterhin Datenquellen mit einer einzelnen Tabelle in Tableau erstellen, die Verknüpfungen und Vereinigungen verwenden. Das Verhalten der Analyse von Einzeltabellen in Tableau hat sich nicht geändert. Ihre aktualisierten Arbeitsmappen funktionieren genauso wie vor 2020.2.

Grundlegendes zum Datenmodell

In früheren Versionen von Tableau bestand das Datenmodell nur aus der physischen Ebene. Ab Tableau 2020.2 und höher verfügt das Datenmodell über die logische (semantische) Ebene und eine physische Ebene. Dadurch erhalten Sie mehr Optionen zum Kombinieren von Daten mithilfe von Schemata, die zu Ihrer Analyse passen.

Ab Tableau 2020.2 und höher wurde in der Datenquelle eine logische Ebene hinzugefügt. Jede logische Tabelle enthält physische Tabellen in einer physischen Ebene.

In früheren Versionen von Tableau bestand das Datenmodell in Ihrer Datenquelle aus einer einzelnen physischen Ebene, auf der Sie Verknüpfungen und Vereinigungen angeben konnten. Tabellen, die der physischen Ebene hinzugefügt werden (verknüpft oder vereint), erzeugen eine einzelne, vereinfachte Tabelle (denormalisiert) für die Analyse.

Frühere Versionen   2020.2 und höher
 
In Versionen vor Tableau 2020.2 besteht das Datenmodell nur aus der physischen Ebene.   Ab Tableau 2020.2 und höher verfügt das Datenmodell über zwei Ebenen: die logische Ebene und die physische Ebene.

Ab Tableau 2020.2 enthält das Datenmodell in Ihrer Datenquelle eine neue semantische Ebene über der physischen Ebene – die so genannte logische Ebene –, in der Sie mehrere Tabellen hinzufügen und sie miteinander in Beziehung setzen können. Tabellen auf der logischen Ebene werden nicht in der Datenquelle zusammengeführt, sie bleiben getrennt (normalisiert) und behalten ihre native Detailgenauigkeit bei.

Logische Tabellen verhalten sich wie Container für zusammengeführte physische Tabellen. Eine logische Tabelle kann eine einzelne, physische Tabelle enthalten. Sie kann aber auch mehrere physische Tabellen enthalten, die durch Verknüpfungen oder Vereinigungen zusammengeführt werden.

Erstellen eines neuen Modells

Wenn Sie der logischen Ebene eine oder mehrere Tabellen hinzufügen, erstellen Sie im Prinzip das Datenmodell für die Datenquelle. Eine Datenquelle kann aus einer einzelnen logischen Tabelle bestehen, oder Sie können mehrere Tabellen in den Arbeitsbereich ziehen, um ein komplexeres Modell zu erstellen.

  • Die erste Tabelle, die Sie in den Verknüpfungsbereich ziehen, wird zur Stammtabelle für das Datenmodell in der Datenquelle.
  • Nachdem Sie die Stammtabelle herausgezogen haben, können Sie zusätzliche Tabellen in beliebiger Reihenfolge herausziehen. Sie müssen berücksichtigen, welche Tabellen miteinander verknüpft sein sollen, und die übereinstimmenden Feldpaare, die Sie für jede Beziehung definieren.
  • Wenn Sie ein Sternschema erstellen, kann es hilfreich sein, zuerst die Faktentabelle herauszuziehen und dann Dimensionstabellen mit dieser Tabelle zu verknüpfen.
  • Durch das Löschen einer Tabelle im Verknüpfungsbereich werden automatisch auch die zugehörigen abhängigen Elemente gelöscht. Wenn Sie die Stammtabelle löschen, werden auch alle anderen Tabellen im Modell entfernt.
  • Jede Beziehung muss aus mindestens einem übereinstimmenden Feldpaar bestehen. Fügen Sie mehrere Feldpaare hinzu, um eine zusammengesetzte Beziehung zu erstellen. Übereinstimmende Paare müssen denselben Datentyp aufweisen. Das Ändern des Datentyps auf der Datenquellenseite ändert diese Anforderung nicht. Tableau verwendet weiterhin den Datentyp in der zugrunde liegenden Datenbank für Abfragen.
  • Beziehungen können auf berechneten Feldern basieren.
  • Sie können angeben, wie verwendete Felder in den Beziehungen verglichen werden sollen, indem Sie Operatoren verwenden, wenn Sie die Beziehung definieren.

Hinweis: Sie können das Datenmodell einer veröffentlichten Datenquelle nicht bearbeiten.

Weitere Informationen zu Beziehungen finden Sie unter Erstellen und Definieren von Beziehungen in Setzen Sie Ihre Daten in Beziehung.

Modell mit mehreren Tabellen

  • Um ein Modell mit mehreren Tabellen zu erstellen, ziehen Sie Tabellen auf die logische Ebene des Datenquellenseiten-Verknüpfungsbereichs.


Die von Ihnen in die logische Ebene des Datenquellenseiten-Verknüpfungsbereichs gezogenen Tabellen müssen miteinander verknüpft sein. Wenn Sie zusätzliche Tabellen in den Verknüpfungsbereich der logischen Ebene ziehen, versucht Tableau automatisch, die Beziehung anhand bestehender Schlüsselbeschränkungen und übereinstimmender Felder zu erstellen, um die Beziehung zu definieren. Wenn die übereinstimmenden Felder nicht bestimmt werden können, müssen Sie sie auswählen.

Wenn keine Einschränkungen erkannt werden, wird eine Many-to-many-Beziehung erstellt, und die referenzielle Integrität wird auf Einige Datensätze stimmen überein festgelegt. Diese Standardeinstellungen sind eine sichere Wahl und bieten die größte Flexibilität für Ihre Datenquelle. Die Standardeinstellungen unterstützen vollständige äußere Verknüpfungen und optimieren Abfragen, indem Tabellendaten aggregiert werden, bevor Verknüpfungen während der Analyse gebildet werden. Alle Spalten- und Zeilendaten aus jeder Tabelle werden für die Analyse verfügbar.

Sie können weitere Daten in jeder logischen Tabelle hinzufügen, indem Sie auf die Tabelle doppelklicken. Dadurch wird die physische Ebene des Datenquellenseiten-Verknüpfungsbereichs geöffnet. Wenn Sie Verknüpfungen oder Vereinigungen verwenden müssen, können Sie die zu verknüpfenden oder zu vereinigenden Tabellen in die physische Ebene des Verknüpfungsbereichs ziehen. Die physischen Tabellen werden in ihrer logischen Tabelle zusammengeführt.

Führen Sie die unter Erstellen und Definieren von Beziehungen angegebenen Schritte aus, um mehrere Tabellen zu kombinieren.

Modell mit einer einzelnen Tabelle

  • Um ein Modell mit einer einzelnen Tabelle zu erstellen, Ziehen Sie eine Tabelle auf den Canvas der logischen Ebene der Datenquellenseite. Anschließend können Sie die Felder aus dieser Tabelle im Datenbereich für die Analyse verwenden.

Modell mit einer einzelnen Tabelle, das andere Tabellen enthält

Sie können weitere Daten innerhalb der einzelnen logischen Tabelle hinzufügen, indem Sie auf die Tabelle doppelklicken. Dadurch wird die physische Ebene des Datenquellenseiten-Verknüpfungsbereichs geöffnet. Wenn Sie Verknüpfungen oder Vereinigungen verwenden müssen, können Sie die zu verknüpfenden oder zu vereinigenden Tabellen in die physische Ebene des Verknüpfungsbereichs ziehen. Die physischen Tabellen werden in ihrer logischen Tabelle zusammengeführt.

Dieses Beispiel zeigt die Tabelle "Book" (Buch) im Verknüpfungsbereich für Beziehungen (logische Ebene) der Datenquelle. Wenn Sie auf die logische Tabelle "Book" (Buch) doppelklicken, wird der Verknüpfungsbereich der Verknüpfung/Vereinigung (physische Ebene) geöffnet.

In diesem Beispiel führen die Verknüpfungen die Tabelle "Award" (Auszeichnung) und "Info" mit der Tabelle "Book" (Buch) zusammen. In diesem Fall ist die Verknüpfung zwischen "Book" (Buch) und "Award" (Auszeichnung) eine One-to-many-Beziehung mit der Detailgenauigkeit für "Awards" (Auszeichnungen). Auf diese Weise würden Kennzahlwerte für "Book" (Buch) und "Info" dupliziert werden. Zum Vermeiden von Duplikaten können Sie "Award" (Auszeichnung) und "Info" mit "Book" (Buch) in Beziehung setzen, statt sie innerhalb der logischen Tabelle "Book" (Buch) zu verknüpfen.

Unterstützte Datenmodellschemas

Die in Tableau 2020.2 eingeführten Datenmodellierungsfunktionen sollen die Analyse gängiger Datenszenarien mit mehreren Tabellen – einschließlich Stern- und Schneeflockendatenmodellen – vereinfachen. Die folgenden Modelltypen werden in Tableau-Datenquellen unterstützt.

Einzelne Tabelle

Die Analyse einer einzelnen logischen Tabelle, die eine Mischung aus Dimensionen und Kennzahlen enthält, funktioniert wie in Tableau vor 2020.2. Sie können eine logische Tabelle mithilfe einer Kombination aus Verknüpfungen, Vereinigungen, benutzerdefinierten SQL-Elementen usw. erstellen.

Stern und Schneeflocke

In Enterprise Data Warehouses ist es üblich, Daten in Stern- oder Schneeflockenschemas zu strukturieren, bei denen Kennzahlen in einer zentralen Faktentabelle enthalten sind und die Dimensionen separat in unabhängigen Dimensionstabellen gespeichert werden. Diese Datenorganisation unterstützt viele häufige Analyseflüsse, einschließlich Roll-up und Drill-down.

Diese Modelle können direkt mit Beziehungen in den Datenmodellierungsfunktionen dargestellt werden, die ab Tableau 2020.2 verfügbar sind.

Ziehen Sie die Faktentabelle zuerst in das Modell. Verbinden Sie dann die Dimensionstabellen mit der Faktentabelle (in einem Sternschema) oder mit anderen Dimensionstabellen (in einer Schneeflocke).

In der Regel bewegen sich die Beziehungen zwischen der Faktentabelle und den Dimensionstabellen in einem gut modellierten Stern- oder Schneeflockenschema im Verhältnis n:1. Wenn diese Daten in Ihrem Data Warehouse kodiert sind, verwendet Tableau diese automatisch, um die Leistungsoptionen der Beziehung festzulegen. Wenn nicht, können Sie diese Daten selbst festlegen. Weitere Informationen finden Sie unter Optimieren von Beziehungsabfragen mithilfe von Leistungsoptionen.

In einem gut modellierten Stern- oder Schneeflockenschema hat jede Zeile in der Faktentabelle einen übereinstimmenden Eintrag in jeder Dimensionstabelle. Wenn dies zutrifft und in Ihren Data Warehouse-Integritätseinschränkungen erfasst wird, verwendet Tableau diese Daten automatisch, um die Einstellung für die referenzielle Integrität in den Leistungsoptionen festzulegen. Wenn einige Faktentabellenzeilen keine übereinstimmende Zeile in einer Dimensionstabelle haben (manchmal auch als "spät ankommende Dimensionen" oder "früh ankommende Fakten" bezeichnet), behält Tableau standardmäßig alle Zeilen bei der Berechnung von Kennzahlen bei, kann jedoch Werte beim Anzeigen von Dimensionskopfzeilen verlieren. Weitere Informationen finden Sie unter Optimieren von Beziehungsabfragen mithilfe von Leistungsoptionen.

Stern und Schneeflocke mit Kennzahlen in mehreren Tabellen

In einigen Stern- oder Schneeflockenschemas sind alle Kennzahlen in der Faktentabelle für Ihre Analyse enthalten. Es kommt jedoch häufig vor, dass zusätzlich interessierende Kennzahlen mit den Dimensionstabellen in Ihrer Analyse zusammenhängen. Auch wenn die Dimensionstabellen keine Kennzahlen enthalten, ist es in der Analyse üblich, Dimensionswerte zu zählen oder anderweitig zu aggregieren. In diesen Fällen ist die Unterscheidung zwischen Faktentabellen und Dimensionstabellen weniger deutlich. Wenn Sie Klarheit beim Betrachten Ihres Datenmodells schaffen möchten, sollten Sie zunächst dem Datenquellen-Verknüpfungsbereich die detaillierteste Tabelle hinzufügen und dann alle anderen Tabellen mit dieser ersten Tabelle verbinden.

Wenn Sie diese Tabellen in einer einzigen logischen Tabelle verknüpfen würden, würden die Kennzahlen in den Dimensionstabellen repliziert, was zu verzerrten Aggregaten führt, es sei denn, Sie haben Vorsichtsmaßnahmen getroffen, um die Werte mithilfe von LOD-Berechnungen oder COUNT DISTINCT zu duplizieren. Wenn Sie jedoch stattdessen Beziehungen zwischen diesen Tabellen erstellen, aggregiert Tableau Maßnahmen, bevor Verknüpfungen ausgeführt werden, wodurch das Problem unnötiger Duplizierungen vermieden wird. Dies enthebt Sie der Notwendigkeit, die Detailgenauigkeit Ihrer Maßnahmen sorgfältig zu verfolgen.

Multi-Fakten-Analyse

Die Datenmodellierungsfunktionen von Tableau unterstützen einige Formen der Multi-Fakten-Analyse. Zusätzliche Faktentabellen (mit Kennzahlen) können zu jedem der zuvor genannten Modelle hinzugefügt werden, sofern sie sich nur auf eine einzelne Dimensionstabelle beziehen. Sie können zum Beispiel zwei oder mehr Faktentabellen zusammenführen, um eine gemeinsame Dimension zu analysieren, beispielsweise wie in Customer 360-ähnlichen Analysen. Diese Faktentabellen können eine andere Detailgenauigkeit als die Dimensionstabelle oder untereinander aufweisen. Sie können auch eine Many-to-many-Beziehung zur Dimensionstabelle aufweisen. In diesen Szenarien stellt Tableau sicher, dass Werte nicht vor der Aggregation repliziert werden.

Wenn Sie keine freigegebene Dimensionstabelle haben, die Ihre Faktentabellen verbindet, können Sie manchmal dynamisch eine solche mit benutzerdefiniertem SQL oder mithilfe von Verknüpfungen oder Vereinigungen oder anderen Dimensionstabellen erstellen.

Zwei Faktentabellen können direkt miteinander in einer gemeinsamen Dimension verbunden werden. Diese Art der Analyse funktioniert am besten, wenn eine der Faktentabellen eine Obermenge der gemeinsamen Dimension enthält.

Nicht unterstützte Modelle

  • Mehrere Faktentabellen, die sich auf mehrere freigegebene Dimensionstabellen beziehen. In einigen Anwendungsfällen ist es üblich, dass mehrere Faktentabellen zu mehreren freigegebenen Dimensionstabellen verknüpft sind. Sie können z. B. zwei Faktentabellen haben, "Filialumsatz" und "Internetverkäufe", die sich auf zwei gemeinsame Dimensionstabellen beziehen: "Datum" und "Kunde". In der Regel erfordern solche Szenarien das Erstellen eines Zirkelbezugs in Ihrem Datenmodell. Zirkelbezüge werden in Version 2020.2 nicht unterstützt.

    Sie können dieser Art von Modell am ehesten nahekommen, indem Sie einige der Tabellen in der physischen Ebene zusammenführen. Sie können z. B. "Filialumsatz" und "Internetverkäufe" in einer einzigen Tabelle vereinigen, die dann mit "Datum" und "Kunde" verbunden werden kann. Alternativ können Sie "Datum" und "Kunde" miteinander verknüpfen, um eine einzelne Dimensionstabelle zu erstellen, die dann mit "Filialumsatz" und "Internetverkäufe" verbunden werden kann.

  • Direktes Verbinden von mindestens 3 Faktentabellen in gemeinsam genutzten Dimensionen. Es ist zwar möglich, dieses Modell in der logischen Ebene zu erstellen. Es werden jedoch möglicherweise unerwünschte Ergebnisse angezeigt, es sei denn, Sie verwenden nur Dimensionen aus einer einzelnen Tabelle.

Anforderungen an Beziehungen in einem Datenmodell

  • Bei der Verbindung von Tabellen müssen die Felder, die die Beziehungen festlegen, den gleichen Datentyp haben. Das Ändern des Datentyps auf der Datenquellenseite ändert diese Anforderung nicht. Tableau verwendet weiterhin den Datentyp in der zugrunde liegenden Datenbank für Abfragen.
  • Sie können keine Beziehungen auf Basis von geografischen Feldern definieren.
  • Zirkelbezüge werden im Datenmodell nicht unterstützt.
  • Sie können keine Beziehungen in einer veröffentlichten Datenquelle bearbeiten.
  • Sie können keine Beziehungen zwischen veröffentlichten Datenquellen definieren.
  • Ihre Arbeitsmappe muss eine eingebettete Datenquelle verwenden, damit Sie Beziehungen und Leistungsoptionen auf der Datenquellenseite in Tableau Online oder Tableau Server bearbeiten können.

Faktoren, die den Nutzen der Verwendung verwandter Tabellen einschränken

  • Unreine Daten in Tabellen (d. h. Tabellen, die nicht mit Blick auf ein gut strukturiertes Modell erstellt wurden und eine Mischung aus Kennzahlen und Dimensionen in mehreren Tabellen enthalten) können die Analyse mehrerer Tabellen komplexer machen.
  • Die Verwendung von Datenquellenfiltern schränkt die Tableau-Fähigkeit der Aussortierung von Verknüpfungen in den Daten ein. "Aussortierung von Verknüpfungen" ist ein Begriff dafür, wie Tableau Abfragen vereinfacht, indem unnötige Verknüpfungen entfernt werden.
  • Tabellen mit vielen nicht übereinstimmenden Werten in den Beziehungen.
  • Wechselbeziehung mit mehreren Faktentabellen mit mehreren Dimensionstabellen (Versuch, gemeinsam genutzte oder konforme Dimensionen zu modellieren).
Vielen Dank für Ihr Feedback!