Über Datenmodelle mit Multi-Fakten-Beziehungen

Multi-Fakten-Beziehungen ermöglichen Ihnen das Erstellen von Datenquellen mit mehr als einer Basistabelle. Durch die Verwendung mehrerer Basistabellen in Ihrem Datenmodell können Sie in Tableau Multi-Fakten-Analysen durchführen.

Durch das Aufstellen von Bäumen aus Tabellen, deren Wurzel eine Basistabelle ist, können Sie Datenstrukturen mit unterschiedlichen konzeptionellen Domänen modellieren und deren gemeinsame Merkmale verwenden, um diese zu verbinden. Diese Art der Analyse wird oft als Multi-Fakten-Analyse, gleichlautende oder gemeinsame Dimensionen bezeichnet. In Tableau bezeichnen wir dies als ein Datenmodell mit Multi-Fakten-Beziehungen, weil Sie Beziehungen verwenden, um es zu erstellen. Ein Datenmodell mit Multi-Fakten-Beziehungen enthält immer mehrere Basistabellen. Basistabellen sind die Tabellen, die im Datenmodell ganz links stehen. Wie Sie entscheiden, welche Tabellen als Basistabellen zu verwenden sind, erfahren Sie unter Wann Sie ein Multi-Fakten-Beziehungsmodell verwenden sollten.

Ein Modell mit mehreren Basistabellen, wobei ein Baum hervorgehoben ist

Ein Datenmodell mit mehreren Basistabellen, wobei der Baum einer Basistabelle hervorgehoben ist

Zusammengehörigkeit

Datenmodelle mit mehreren Basistabellen verfügen über eine große Flexibilität hinsichtlich der Art und Weise, wie Teile von Daten sich aufeinander beziehen können (oder nicht).

Hinweis: Zusammengehörigkeit auf allen Ebenen ist nur in Datenmodellen mit mehreren Basistabellen relevant. Vor Datenmodellen mit Multi-Fakten-Beziehungen gehörte entweder alles irgendwie zusammen (eine einzelne Datenquelle) oder nichts (Vermischung über mehrere Datenquellen hinweg).

Zusammengehörigkeit im Datenmodell

Tabellen sind entweder verwandt, nicht verwandt oder werden gemeinsam genutzt – je nach der Struktur des Datenmodells. In einer Datenquelle ist der Verwandschaftsgrad von Tabellen eine Konstante. Ein kurzer Überblick dazu: 

  • Verwandte Tabellen befinden sich im selben Baum.
    • Vor der Version 2024.2 handelte es sich bei allen Datenquellen um Datenquellen mit einer einzigen Basistabelle, aus einem einzelnen Baum bestehend, und in einer Datenquelle mit einer einzigen Basistabelle sind alle Tabellen miteinander verwandt.
  • Nicht verwandte Tabellen befinden in unterschiedlichen Bäumen. Basistabellen sind immer miteinander nicht verwandt (d. h. sie stehen in keiner Beziehung zueinander). Tabellen, die exakt einer Basistabelle nachgelagert sind, sind auch nicht mit Tabellen in anderen Bäumen verwandt.
  • Gemeinsam genutzte Tabellen haben mehrere Beziehungen in Eingangsrichtung und gehören zu mehr als einem Baum.
    • Tabellen, die einer Tabelle mit mehreren Beziehungen in Eingangsrichtung nachgelagert sind, werden auch als gemeinsam genutzt betrachtet.

Beziehungen während der Analyse

Felder können sich aufeinander beziehen, sich nicht aufeinander beziehen, sich mehrdeutig aufeinander beziehen oder als „zusammengeheftete“ Felder dienen. Die Zusammengehörigkeit bei einer Gruppe von Feldern wird bei jedem Blatt spezifisch ermittelt, basierend darauf, wie die Struktur des Datenmodells aussieht, welche Felder aktiv in Gebrauch sind (d. h. welche Felder in Containern als Felder dienen) und ob es sich bei diesen Feldern um Dimensionen oder Kennzahlen handelt.  

Eine einfache Visualisierung mit zwei nicht verwandten Feldern, eines in Zeilen und eines in Spalten, und einer unabhängigen Quickinfo, die angezeigt wird

Um eine Visualisierung mit Feldern aus mehreren Tabellen zu erstellen, muss Tableau im Hintergrund Verknüpfungen durchführen, um die Werte zu berechnen. Die Art der Verknüpfung richtet sich nach der Zusammengehörigkeit der Felder. Ein kurzer Überblick dazu: 

  • Wenn zusammengehörige Felder in einer Visualisierung verwendet werden, werden Dimensionen per Inner Join verknüpft und Kennzahlwerte nach den Dimensionen aufgeschlüsselt.
    • Es ist ein wenig komplizierter als das – hinter den Kulissen könnten weitere Verknüpfungen erforderlich sein, um sicherzustellen, dass keine Kennzahlwerte weggelassen werden. In einer Nur-Dimensionen-Visualisierung jedoch werden zusammengehörige Dimensionen per Inner Join verknüpft, und das ist hier das Hauptkonzept.
    • Dies ist das gleiche Verhalten wie bei Modellen mit einer einzigen Basistabelle.
  • Wenn nicht zusammengehörige Felder in einer Visualisierung verwendet werden, werden Dimensionen per Cross Join verknüpft. Kennzahlwerte sind tabellenbezogen (d. h. sie werden lokal zu einem einzigen Wert für die gesamte Tabelle aggregiert) und wiederholt.
    • Es ist auch möglich, dass Felder mehrdeutig zueinander in einer Beziehung stehen, was bedeutet, dass es für die Kombination aktiver Felder mehr als eine Möglichkeit gibt, die Beziehungen zwischen ihren Tabellen aufzulösen. Wenn Tableau auf Mehrdeutigkeiten stößt, behandelt es die Felder als nicht verwandt.
  • Wenn Felder basierend auf einem gemeinsam genutzten Feld zusammengeheftet sind, werden Dimensionen per Outer Join miteinander verknüpft. Kennzahlwerte werden auf der Ebene beliebiger Dimensionen aggregiert, nach denen sie aufgeschlüsselt werden können, und können wiederholt werden.
    • Zusammengeheftete Dimensionen ähneln dem Verknüpfen von Feldern beim Verschmelzen von Daten. Die Ergebnisse werden für jedes Paar zusammengehöriger Felder berechnet. Anschließend werden die nicht zugeordneten Werte über die gemeinsamen Werte der von ihnen gemeinsam genutzten Dimension hinweg „zusammengeheftet“.

All diese Konzepte und Definitionen werden später in diesem Thema ausführlicher erläutert.

Eine Randbemerkung zu Dimensionen und Kennzahlen

In Tableau sind Kennzahlen Aggregationen – sie werden gemäß der Granularität aggregiert, die von den Dimensionen in der Ansicht festgelegt sind. Der Wert einer Kennzahl hängt daher von dem Kontext der Dimensionen ab. Beispiel: Die „Anzahl der Müslischachteln“ hängt davon ab, ob wir den gesamten Bestand oder die Anzahl der Schachteln pro Marke meinen.

Dimensionen sind in der Regel kategorische Felder, wie beispielsweise „Land“ oder „Marke“. In Tableau legen Dimensionen die Granularität (die Detailgenauigkeit) der Ansicht fest. Meist möchten wir unsere Daten nach einer Kombination von Kategorien in Markierungen gruppieren. Welche Dimensionen wir zum Erstellen der Ansicht verwenden, gibt vor, wie viele Markierungen wir haben.

Wenn eine Kennzahl ohne Dimensionen verwendet wird, wird dies als tabellenbezogen bezeichnet. Dies bedeutet, dass ihr Wert der vollständig aggregierte Wert für die gesamte Tabelle ist. Sobald wir in der Visualisierung eine Dimension (z. B. eine Marke) verwenden, wird die Kennzahl mit einer höheren Granularität (d. h. detaillierter) aufgeschlüsselt. Die Gesamtzahl der Müslipackungen wird jetzt pro Marke berechnet.

Aggregation bezieht sich darauf, wie die Daten kombiniert werden. Die Standardaggregation in Tableau ist SUM. Sie können die Aggregation in andere Optionen ändern, z. B. „Durchschnitt“, „Median“, „Anzahl (eindeutig)", „Minimum“ usw. Granularität gibt an, wie detailliert oder aufgeschlüsselt die Kennzahl ist – was wiederum durch die Dimensionen gesteuert wird. Sofern die Granularität der Kennzahl nicht auf Zeilenebene liegt (was auch als „disaggregiert“ bezeichnet wird), muss ihr Wert aggregiert werden.

Beispiel

Eine Tabelle mit Werten für die Anzahl der Müslipackungen für fünf Marken und drei Packungsgrößen

Wie lautet der Wert für die „Anzahl der Müslipackungen“?

Nun, das hängt vom Aggregationstyp und der durch die Dimensionen festgelegten Granularität ab.

  • Aggregationen:
    • Summe (oder Gesamtwert)
    • Durchschnitt
  • Granularität:
    • Tabellenbezogen / vollständig aggregiert (die blauen Balken im Beispiel)
    • Aufgeschlüsselt nach der Dimension Marke (die farbigen Balken im Beispiel)

Ein Dashboard mit vier Visualisierungen, eine mit der summierten tabellenbezogenen Anzahl der Packungen (54), eine mit der durchschnittlichen tabellenbezogenen Anzahl der Packungen (6) und dann Versionen dieser beiden Visualisierungen, aufgeschlüsselt nach den fünf Marken

Indikatoren für die Zugehörigkeit auf Feldebene

Es gibt mehrere visuelle Hinweise, die Ihnen dabei helfen können, den Grad der Zugehörigkeit von Feldern zu verstehen, die Sie in einer Analyse verwenden.

Indikatoren für die Zugehörigkeit auf einem Arbeitsblatt

  • Symbol Nicht zugeordnet: Tableau verwendet das Symbol Nicht zugeordnet (Symbol), um anzuzeigen, dass nicht alles in der Ansicht miteinander in einer Beziehung steht. Wenn Sie in der Ansicht oder im Datenbereich auf einem Feld ein Symbol vom Typ „Nicht zugeordnet“ sehen, können Sie den Mauszeiger über das Symbol bewegen, um weitere Informationen zu erhalten.
  • Hellgraue Feldnamen: Feldnamen werden im Datenbereich in hellgrauem Text angezeigt, wenn sie mit keinem der in Containern verwendeten Feldern in einer Beziehung stehen. Sie können diese Felder weiterhin für Analysen in dieser Visualisierung verwenden, aber nicht zugeordnete Felder werden in Analysen anders ausgewertet als zugehörige Felder. Wenn Sie mit der Maus auf diese Felder zeigen, wird ein Symbol für „Nicht zugeordnet“ angezeigt.

Der Datenbereich mit einer Tabelle, die komplett ausgegraut ist, und zwei Feldern, bei denen ein Symbol mit einem durchgestrichenen Auge anzeigt, dass sie ausgeblendet sind

Hinweis: In früheren Versionen von Tableau bedeuteten hellgraue Feldnamen, dass die Felder ausgeblendet wurden und die Option Ausgeblendete Felder anzeigen aktiviert war. Ausgeblendete Felder werden nun, wenn sie angezeigt werden, mit einem anklickbaren Augensymbol gekennzeichnet. Ausgeblendetes Feld (Symbol)

Warndialogfeld „Fehlende Zuordnung“

Wenn nicht zugeordnete Felder gemeinsam in einer Visualisierung verwendet werden, zeigt Tableau ein Warndialogfeld an, um Sie darauf hinzuweisen, dass zwischen den Feldern keine Beziehung besteht. Diese Meldung wird jedes Mal angezeigt, wenn Sie ein nicht zugeordnetes Feld hinzufügen, um Sie daran zu erinnern, die Verwendung nicht zugeordneter Felder in Ihrer Analyse zu validieren. Die Warnmeldung hindert Sie nicht daran, fortzufahren, kann aber helfen, potenzielle Leistungsprobleme zu vermeiden. Beispielsweise kann die Verwendung nicht zugeordneter Felder mit hoher Kardinalität zu Cross Joins („Überkreuzverknüpfungen“) führen, die die Leistung der Arbeitsmappe beeinträchtigen.

Der Warndialog „Fehlende Zuordnung“ mit einer Warnung vor nicht zugeordneten Dimensionen

Klicken Sie auf Hinzufügen, um mit dem Hinzufügen des Feldes zur Visualisierung fortzufahren. Wenn die Meldung nicht erneut eingeblendet werden soll, aktivieren Sie die Option Nicht noch einmal anzeigen. Sie können diese Warnmeldungen jederzeit wieder anzeigen lassen, indem Sie sie wieder aktivieren: Öffnen Sie dazu das Menü Helfen > Einstellungen und Leistung > Ignorierte Meldungen zurücksetzen.

Wenn mehrere Felder hinzugefügt werden oder bereits in der Ansicht vorhanden sind, wird der Bereich Details wird im Dialogfeld angezeigt. Erweitern Sie den Bereich, um weitere Informationen zu den Beziehungen aller verwendeten Felder anzuzeigen und um festzustellen, woher das Beziehungsproblem kommt.

Das Warndialogfeld „Fehlende Zuordnung“ mit einer Meldung zu nicht zugeordneten Dimensionen und Kennzahlen, wobei der Detailbereich erweitert ist

Verwandschaft auf Tabellenebene im Datenmodell

In einem Datenmodell mit mehreren Basistabellen definiert jede Basistabelle eines Satz von Tabellen, die miteinander in Beziehung stehen und einen konzeptionellen Baum bilden. Diese Bäume müssen durch mindestens eine gemeinsam genutzte Tabelle verbunden sein, um sicherzustellen, dass die Gesamtdatenquelle eine einzige Entität bildet.

Was früher möglicherweise zwei Datenquellen waren, die mithilfe von Verknüpfungsfeldern verschmolzen werden konnten, kann jetzt eine einzelne Datenquelle mit zwei Bäumen sein, die durch die gemeinsam genutzten Tabellen verbunden sind, in denen sich deren gemeinsamen Felder befinden.

Zwei Datenmodelle: Das eine besteht aus zwei verschiedenen Datenquellen und das andere aus den beiden Datenquellen, die auf den gemeinsam verwendeten Tabellen aufsetzen, um eine einzige Datenquelle zu bilden

Tipp: Die Art und Weise, wie Tabellen in dem Datenmodell verbunden sind, wirkt sich darauf aus, wie ihre Felder in der Analyse verknüpft werden können. Es kann hilfreich sein, während der Analyse auf die Registerkarte „Datenquelle“ zurückzugreifen, um zu sehen, wie eine Tabelle in das Gesamtdatenmodell passt.

Lassen Sie uns anhand dieser Beispieldatenquelle durchgehen, welche Tabellen verwandt, nicht verwandt oder gemeinsam genutzt sind. Es gibt zwei Bäume – der eine wird durch die Basistabelle A und der andere durch die Basistabelle B gebildet.

Nicht verwandte Tabellen

Basistabellen sind grundsätzlich nicht verwandt. Ebenso sind alle Tabellen, die ausschließlich in einem einzigen Baum vorhanden sind, nicht verwandt mit Tabellen in anderen Bäumen.

Tabelle A und Tabelle X sind nicht verwandt

Tabelle B und Tabelle X sind nicht verwandt

Ein Datenmodell, bei dem die Basistabellen A und X ihre eigenen Strukturen haben. Beziehungen werden hellgrau dargestellt.Ein Datenmodell, bei dem die Basistabelle A und die ihr nachgelagerte Tabelle B eine gemeinsame Struktur haben. Basistabelle X hat ihre eigene Struktur. Beziehungen werden hellgrau dargestellt.

Verwandte Tabellen

Tabellen, die sich im selben Baum befinden, werden als verwandt betrachtet.

Tabelle A und Tabelle S sind verwandt

Tabelle B und Tabelle S sind verwandt (über Tabelle A)

Ein Datenmodell, bei dem die Beziehung der Basistabelle A zu einer nachgelagerten Tabelle hervorgehoben wirdEin Datenmodell, bei dem die Beziehung von Tabelle B zu einer anderen Tabelle durch ihre Beziehungen zu der gleichen Basistabelle (A) hervorgehoben wird

Gemeinsam verwendete Tabellen

Gemeinsam verwendete Tabellen haben mehrere Beziehungen in Eingangsrichtung. Diese Tabellen gehören zu mehreren Bäumen und werden über diese hinweg gemeinsam verwendet.

Tabelle S und Tabelle T werden gemeinsam genutzt.

Ein Datenmodell, bei dem die Tabellen S und T beide über mehrere Beziehungen in Eingangsrichtung verfügen. Beide gehören zu dem Baum der Basistabelle A und zu dem Baum der Basistabelle X.

Verwandschaft auf Feldebene in der Analyse

Die Verwandtschaft zwischen Feldern wird bei jedem Blatt spezifisch ermittelt, basierend darauf, wie die Struktur des Datenmodells aussieht, welche Felder aktiv in Gebrauch sind (d. h. welche Felder in der Visualisierung als Felder in Containern dienen) und ob es sich bei diesen Feldern um Dimensionen oder Kennzahlen handelt. Wie sich die Feldverwandtschaft auf die Ergebnisse einer Visualisierung auswirkt, wird im nächsten Abschnitt behandelt.

Lassen Sie uns einige Szenarien unter Verwendung derselben Beispieldatenquelle durchgehen. Der Name jedes Feldes gibt an, aus welcher Tabelle es stammt (so stammt z. B. FeldB aus der Tabelle B). Felder können Dimensionen oder Kennzahlen sein, sofern nicht anders angegeben.

Verwandte Felder

Ganz allgemein gesagt, Felder sind dann verwandt, wenn Tableau anhand eines Beziehungspfads innerhalb eines einzelnen Baums eindeutig bestimmen kann, wie die Felder zusammen ausgewertet werden.

Beispiel: FieldB (aus der Tabelle B) und FieldS (aus der Tabelle S) sind verwandt.

FieldB und FieldS sind verwandt.

Nicht verwandte Felder

Ganz allgemein gesagt, Felder sind unverwandt, wenn sie nicht verwandt sind. Dies kann zum Beispiel daran liegen, dass die Felder aus nicht verwandten Tabellen stammen, wie zum Beispiel, wenn Felder aus zwei Basistabellen verwendet werden. In diesem Fall sind Felder aus unterschiedlichen Basistabellen grundsätzlich nicht verwandt.

Beispiel: FeldA und FeldX sind nicht verwandt.

FeldA und FeldX sind nicht verwandt.

Oder Felder können zu einem bestimmten Zeitpunkt als nicht verwandt behandelt werden – etwa in Fällen, in denen sie mehrdeutig verwandt sind. In den meisten Fällen können Sie sich darauf verlassen, dass Verwandschaftsindikatoren Sie warnen, wenn Felder im Kontext einer Visualisierung nicht miteinander verwandt sind.

Zusammenheften von Feldern („Stitching“)

Beim „Stitching“ wertet Tableau während der Analyse Felder aus nicht verwandten Tabellen in einem Multi-Fakten-Beziehungen Datenmodell aus. In einer Visualisierung werden durch die Verwendung einer Dimension aus einer gemeinsam verwendeten Tabelle Felder, die ansonsten nicht verwandt sind, zusammenheftet und können gleichzeitig in derselben Visualisierung ausgewertet werden. Stellen Sie sich das so vor, als würden die Ergebnisse aus zwei Bäumen auf Grundlage einer gemeinsamen Dimension nebeneinander gestellt werden.

Wenn beispielsweise eine Visualisierung mit FeldA und FeldX erstellt wird, sind diese beiden Feldern nicht verwandt. Durch das Hinzufügen von DimensionS wird ein zusammengeheftetes Feld gebildet.

  • FieldA und DimensionS werden zusammen ausgewertet.
  • FieldX und DimensionS werden zusammen ausgewertet.
  • Diese Zwischenergebnisse werden auf Grundlage der Werte von DimensionS zusammengeführt.
  • FieldA und FieldX sind jetzt zusammengeheftet.

Nicht miteinander verwandte Basistabellen A und X, die über ihre gemeinsam verwendete Tabelle S zusammengeheftet sind

Tipp: Eine Best Practice besteht darin, in der Visualisierung ein „Stitching“-Feld zu verwenden, bevor es zu einem nicht verwandten Feld kommt. Ziehen Sie beispielsweise DimensionS zuerst heraus, oder FieldA, dann DimensionS und dann FieldX, anstatt FieldA, dann FieldX und dann DimensionS. Durch das vorherige Hinzufügen des Stitching-Feldes wird sichergestellt, dass Tableau immer weiß, wie die Beziehungen ausgewertet werden sollen. So werden potenzielle Leistungsprobleme vermieden, die auftreten, wenn nicht miteinander verwandte Dimensionen zusammen ausgewertet werden.

Für ein Zusammenlegen ist es erforderlich, dass eine Dimension aus einer gemeinsamen Tabelle in der Visualisierung aktiv ist. Felder, die im Filter-Container oder in der Quickinfo-Eigenschaft der Markierungskarte abgelegt sind, gelten im Context des Zusammenheftens nicht als aktiv.

Mehrdeutig verwandte Felder

Felder können auch mehrdeutig verwant sein. Dies geschieht, wenn zwischen zwei gemeinsamen Tabellen (oder Tabellen, die einer gemeinsamen Tabelle nachgelagert sind) mehr als eine mögliche Beziehung besteht und im Kontext der Visualisierung als „noch nicht verwandt“ angesehen werden können.

Betrachten Sie FieldS und FieldT. Deren Tabellen sind sowohl über den von der Basistabelle A definierten Baum als auch über den von der Basistabelle X definierten Baum miteinander verwandt.

In einer Visualisierung, die nur FieldS und FieldT enthält, besteht Unklarheit darüber, welcher Baum zu deren Verknüpfung verwendet werden soll. Ohne zusätzliche Informationen kann Tableau nicht beurteilen, ob diese Felder über den Baum der Basistabelle A oder den Baum der Basistabelle B verknüpft werden sollen.

FeldS und FeldT sind mehrdeutig verwandt: Es gibt mehrere mögliche Beziehungen.

Mehrdeutig verwandte Felder S und T

Mehrdeutig verwandte Felder werden als nicht verwandte Felder ausgewertet, da Tableau ihren Beziehungspfad nicht eindeutig bestimmen kann. Im Gegensatz zu real nicht verwandten Feldern können mehrdeutig verwandte Felder aufgelöst werden und die Felder können direkt miteinander verwandt sein.

Beheben von Mehrdeutigkeiten

Mehrdeutigkeiten werden behoben, indem ein Feld hinzugefügt wird, um festzulegen, welcher Baum verwendet werden soll.

Beispiel:

  • Wenn in einer Visualisierung von FeldS und FeldT ein Feld aus Tabelle A, B oder C zur Visualisierung hinzugefügt wird, wird der Baum der Basistabelle A aktiviert und die Mehrdeutigkeit zwischen FeldS und FeldT wird aufgelöst.
  • Alternativ dazu kann durch die Verwendung eines Feldes aus Tabelle X die Mehrdeutigkeit zwischen FeldS und FeldT dahingehend behoben werden, dass der Baum von Tabelle X als Grundlage dienen soll.
Mehrdeutig verwandtMehrdeutigkeit zu einem einzigen Baum aufgelöst
Verwandt durch Basistabelle AVerwandt durch Basistabelle X
Nicht genügend verwandtVerwandt durch AVerwandt durch X

Das Beheben von Mehrdeutigkeiten ähnelt der Verwendung eines FIXED LOD-Ausdrucks (Level of Detail, Detailgenauigkeit). In einem FIXED LOD-Ausdruck teilen Sie Tableau mit, mit welcher Detailgenauigkeit aggregiert werden soll, indem Sie die Dimensionsdeklaration definieren. Mehrdeutigkeiten werden behoben, indem die Struktur der Visualisierung so geändert wird, dass nur ein Baum aktiv ist. Auf diese Weise wird Tableau mitgeteilt, welche Beziehungspfade beim Durchführen der Analyse zu berücksichtigen sind.

Vergleich von Zusammenheften von Feldern mit dem Auflösen von Mehrdeutigkeiten

Sowohl das Zusammenheften von Feldern („Stitching“) als auch das Auflösen von Mehrdeutigkeiten sind Möglichkeiten, mit fehlenden Zusammenhängen umzugehen. Sie führen jedoch zu unterschiedlichen Ergebnissen:

Zusammenheften von Feldern

Auflösen von Mehrdeutigkeiten

Zusammenheften von A und X mit S

Nicht verwandtes FeldA und FeldX per DimensionS zusammengeheftet

Auflösen von S und T mit A

FeldS und FeldT werden anhand des Baumes ausgewertet, der von der Basistabelle A definiert wird.

Stellt nicht verwandte Felder auf Grundlage gemeinsamer Attribute einander gegenüberSchränkt ein, welcher Beziehungspfad zu verwenden ist, wenn mehrere Optionen vorhanden sind

Verwendet eine Logik mit mehreren Basistabellen zur Berechnung von Ergebnissen

Verwendet eine Logik mit einer einzigen Basistabelle zur Berechnung von Ergebnissen

Bei einer Analyse sind Tabellen involviert, die nicht gemeinsam verwendet werdenBei einer Analyse sind gemeinsam verwendete Tabellen involviert

So werden Verknüpfungen für die einzelnen Verwandschaftsebenen verwendet

Nachdem die Verwandtschaft auf Feldebene ermittelt wurde, muss Tableau die Ergebnisse auswerten, um die eigentliche Visualisierung zu erstellen. Die zum Berechnen der in einer Visualisierung angezeigten Werte verwendeten Abfragen basieren auf Verknüpfungen. Ob die Felder verwandt, nicht verwandt oder zusammengeheftet sind, hat unterschiedliche Auswirkungen darauf, welche Verknüpfungen durchgeführt werden. Bedenken Sie, dass mehrdeutig verwandte Felder in diesem Kontext als nicht verwandt behandelt werden.

Um Verwandtschaftsverhältnisse und Verknüpfungen zu erklären, behandelt dieser Abschnitt Tabellen und deren Felder sowie die Werte in diesen Feldern. Betrachten Sie das folgende Datenmodell mit zwei Basistabellen, „Klassen“ und „Kurse“, und einer gemeinsamen Tabelle, „Schüler“.

Ein Datenmodell mit den zwei Basistabellen „Classes“ (Klassen) und „Clubs“ (Kurse) und der gemeinsamen Tabelle „Students“ (Schüler)

Classes

Clubs

Students

Ansicht mit Daten für die Tabelle „Classes“, wobei die Werte für drei Felder angezeigt werdenAnsicht mit Daten für die Tabelle „Clubs“, wobei die Werte für drei Felder angezeigt werdenAnsicht mit Daten für die Tabelle „Students“, wobei die Werte für drei Felder angezeigt werden

Felder:

  • Class, (Klasse), eine Dimension mit den Werten „Grundlagen des Nestbaus“, „Lieder für Fortgeschrittene“, „Fliegen für Jungvögel“ und „Alarmrufe 101“
  • Length (Länge), eine Kennzahl
  • Student (Schüler), eine Dimension, über die eine Verknüpfung mit der Schüler-Tabelle hergestellt wird

Felder:

  • Club (Kurs), eine Dimension mit den Werten „Fotografie“, „Reisen“, „Jonglieren“, „Kunst“ und „Erste Hilfe“
  • Dues (Gebühren), eine Kennzahl
  • Student, (Schüler), eine Dimension, über die eine Verknüpfung mit der Schüler-Tabelle hergestellt wird

Felder:

  • Bus-Fahrgast (Bus-Fahrgast), eine Dimension mit den Werten „Ja“ oder „Nein“
  • Student (Schüler), eine Dimension mit den Werten „Fink“, „Kardinal“, „Spatz“, „Rotkehlchen“ und „Eichelhäher“. Wird verwendet, um eine Verknüpfung zu den anderen beiden Tabellen herzustellen
  • Age (Alter), eine Kennzahl

Dieses sehr einfache Modell zeigt ganz allgemein, wie die Verknüpfungslogik für Datenmodelle mit Multi-Fakten-Beziehungen berechnet wird. Weitere Informationen zu den Grundlagen von Verknüpfungen in Datenmodellen mit einer einzigen Basistabelle, die auf Beziehungen basieren, finden Sie unter Funktionsweise der Analyse für Datenquellen mit mehreren Tabellen, die Beziehungen verwenden.

Soll dieses Beispiel ein Datenmodell mit mehreren Basistabellen sein?

Bei diesem Datenmodell mit drei Tabellen ist es möglicherweise verlockend, es als Modell mit einer einzigen Basistabelle einzurichten („Klassen-Schüler-Kurse“ oder „Kurse-Schüler-Klassen“) oder mit „Schüler“ als eine Basistabelle. In der Regel sind Datenmodelle mit Multi-Fakten-Beziehungen für bestimmte Arten von Datenschemas oder Analyseszenarien vorgesehen. Wenn Ihr Datenmodell über Merkmale verfügt, die sich am besten für ein Datenmodell mit Multi-Fakten-Beziehungen eignen, richten Sie es so ein, dass Ihre Basistabellen konzeptionell voneinander getrennt bleiben. Wenn Ihre Daten jedoch diese Art von Struktur nicht erfordern, kann die Verwendung eines Modells mit einer einzelnen Basistabelle einfacher sein.

Alternative Datenmodellstrukturen für das „Klassen-Kurse-Schüler“-Beispielmodell

Für diese drei Tabellen könnten Modelle erstellt werden, die wie folgt aussehen: (1) „Klassen“ und „Kurse“ als Basistabellen mit „Schülern“ als gemeinsamer Tabelle, (2) Linear, beginnend mit entweder „Klassen“ oder „Kurse“, und (3) „Schüler“ als einzige Basistabelle mit „Klassen“ und „Kurse“ als nachgelagerte Tabellen.

In diesem konkreten Fall gibt es bei diesen Tabellen, Daten oder diesem Modell nichts, das wirklich mehrere Basistabellen erfordert. Wir verwenden dieses Modell der Einfachheit halber als Beispiel, damit wir uns ganz auf die Verknüpfungslogik konzentrieren können. Sie könnten sich auch vorstellen, dass es eine andere verwandte Tabelle gibt, „Räume“, die wir einfach ignorieren, um die Diskussion nicht unnötig zu verkomplizieren.

Eine Variante des „Klassen-Kurse-Schüler“-Modells mit einer zusätzlichen gemeinsamen Tabelle, „Räume“

Als Best Practice gilt jedoch, dass Sie ein Multi-Fakten-Beziehungsmodell nur dann verwenden sollten, wenn Ihre Daten dies erfordern.

Verwandte Dimensionen verwenden Inner Joins (innere Verknüpfungen)

Zusammengehörige Dimensionen werden innen verknüpft. Bei Inner Joins fallen alle Dimensionswerte weg, die nicht in beiden Tabellen gemeinsam verwendet werden.

  • Tableau verwendet zusätzliche Logik, um sicherzustellen, dass keine Kennzahlwerte verloren gehen. In diesem Abschnitt werden Dimensionen nur verwendet, um grundlegend vorzuführen, wie Tableau Inner Joins auf verwandte Dimensionen anwendet.

Das folgende Beispiel zeigt, wie verwandte Dimensionen nur Zeilen zurückgeben, die in den Daten vorhanden sind. Da es in dem Kurs „Alarmrufe 101“ keine Schüler gibt, ist dieser Kurs auch nicht in den Ergebnissen enthalten. „Kardinal“ und „Eichelhäher“ sind in keinem Kurs vorhanden und tauchen daher auch nicht in den Ergebnissen auf.

Eine Visualisierung, die eine innere Verknüpfung von „Kurs“ und „Schüler“ zeigt, mit zwei Zeilen für „Fink“ („Gesang für Fortgeschrittene“, „Grundlagen des Nestbaus“), zwei Zeilen für „Rotkehlchen“ („Fliegen für Jungvögel“, „Grundlagen des Nestbaus“) und zwei Zeilen für „Spatz“ („Gesang für Fortgeschrittene“, „Grundlagen des Nestbaus“)

Nicht verwandte Dimensionen verwenden Cross Joins (Überkreuzverknüpfungen)

Nicht verwandte Dimensionen (eigenständige, ohne Stitching-Dimension) werden über Kreuz („Cross Join“) verknüpft.

Bei einem Cross Join wird jeder Wert einer Dimension mit jedem Wert der anderen Dimension kombiniert, auch wenn eine daraus resultierende Kombination in den Daten eigentlich nicht vorhanden ist. In diesem Beispiel fügt der Cross Join für jede mögliche Kombination aus „Klasse“ und „Kurs“ eine Zeile hinzu.

Eine Visualisierung, die eine Kreuzverknüpfung von Klasse und Kurs mit Zeilen für jede Kombination aus Liedern für Fortgeschrittene/Alarmrufe 101/Fliegen für Jungvögel/Grundlagen des Nestbaus mit Kunst/Erste Hilfe/Jonglieren/Fotografie zeigt. Auf beiden Dimensions-Feldern im Zeilen-Container wird ein Symbol vom Typ „Nicht verwandt“ angezeigt.

Es ist wichtig zu erkennen, wenn es in Ihrer Analyse zu einem Cross Join kommt. Obwohl in der Ergebnistabelle für den Cross Join eine Zeile für „Gesang für Fortgeschrittene“ plus „Erste Hilfe“ vorhanden ist, gibt es in dieser Kombination von Aktivitäten in Wahrheit keine Schüler (einen Beweis dafür wird im nächsten Abschnitt in dem Beispiel zu „Stitching“ gezeigt).

Warum ist es wichtig zu erkennen, dass nicht alle Ergebnisse eines Cross Joins auf den Daten basieren? Stellen Sie sich vor, Sie möchten einen Stundenplan für Klassen und Kurse erstellen, damit es für keinen Schüler zu Konflikten kommt. Es gibt keine Schüler in den Kursen „Gesang für Fortgeschrittene“ und „Erste Hilfe“, daher können Sie dieses Ergebnis ignorieren und die Klasse und den Kurs gleichzeitig planen. Der Cross Join stellt keine Kombinationen von Werten dar, die in den Daten tatsächlich vorhanden sind.

Zusammengeheftete Dimensionen verwenden Outer Joins

Nicht verwandte Dimensionen werden – bei Vorhandensein einer Stitching-Dimension – per Outer Join verknüpft.

In diesem Beispiel stehen sowohl die Tabelle „Klassen“ als auch die Tabelle „Kurse“ zu der gemeinsam verwendeten Tabelle „Schüler“ in einer Beziehung, jedoch nicht miteinander – daher sind die Felder „Klasse“ und „Kurs“ auch nicht verwandt. Durch das Hinzufügen der Dimension „Schüler“ erkennt Tableau, welche Werte aus „Klasse“ und welche Werte aus „Kurs“ in der Analyse gegenübergestellt werden sollen. Dieses Outer-Join-Verhalten bezeichnen wir als Stitching („Zusammenheften“).

Eine Visualisierung, die die Ergebnisse einer Außenverknüpfung der Innenverknüpfung „Schüler-Klasse“ und der Innenverknüpfung „Schüler-Kurs“ zeigt. Auf den Feldern „Klasse“ und „Kurs“ im Zeilen-Container wird ein Symbol vom Typ „Nicht verwandt“ angezeigt. Ein Feld für „Schüler“ befindet sich auf der Eigenschaft „Farbe“ der Markierungskarte und ist nicht mit einem Symbol vom Typ „Nicht verwandt“ versehen. Nicht alle Kombinationen aus Klassen und Kursen sind aufgeführt, und es gibt Zeilen für Schüler und Kursen ohne eine Klasse.

Das Stitching ähnelt einer Datenverschmelzung dahingehend, dass es Zwischenergebnisse gibt, die zusammen zurückgegegeben werden, um das Gesamtergebnis zu erhalten. Im Gegensatz zum Verschmelzen handelt es sich beim Zusammenheften allerdings um einen Outer Join, nicht um einen Left Join, und es werden auf keiner Seite Werte weggelassen. Wenn es sich um eine einzige Datenquelle handelt, gibt es kein Konzept von primären oder sekundären Datenquellen. Daher wird beiden nicht miteinander in Zusammenhang stehenden Feldern die gleiche Priorität eingeräumt.

Zwischenergebnisse werden per Outer Join verknüpft

Was geht in den Outer Join für zusammengeheftete Felder ein? Für jedes der nicht verwandten Felder und das Stitching-Feld wird wiederum ein unmittelbarer Inner Join berechnet. Anschließend werden diese Zwischenergebnisse basierend auf den Werten der Stitching-Dimension per Outer Join verknüpft.

Beispiel

Ein Inner Join für Schüler und Klasse...

Eine Ergebnistabelle für drei Werte aus „Schüler“ und drei Werte aus „Klassen“

... und ein Inner Join für „Schüler“ und „Kurs“...

Eine Ergebnistabelle für vier Werte aus „Schüler“ und fünf Werte aus „Kursen“

...werden dann in „Schüler“ per Outer Join verknüpft.

Eine Ergebnistabelle für vier Werte aus „Schüler“, drei Werte aus „Klassen“ und fünf Werte aus „Kursen“

Zusätzliche Verknüpfungen, damit Kennzahlen beibehalten werden

Zusätzlich zur Verknüpfungslogik für Dimensionen können Kennzahlen weitere Verknüpfungen mit sich bringen. Als Beziehungen erstmals in Tableau eingeführt wurden, war eines der Grundprinzipien, dass Kennzahlwerte nicht verloren gehen. Dies wird auch in Datenmodellen mit Multi-Fakten-Beziehungen so beibehalten.

Die wichtigsten Details lauten:

  • Kennzahlwerte werden nur nach verwandten Dimensionen aufgeschlüsselt.
  • Kennzahlwerte werden bei nicht verwandten Dimensionen wiederholt.
  • Dimensionswerte, die in Visualisierungen, die nur Dimensionen enthalten, wegfallen würden, können zurückgegeben werden, wenn es relevante Kennzahlwerte gibt, die ihnen zugeordnet sind.

Hinweis: Denken Sie daran, dass Kennzahlen Aggregationen sind. Sie werden auf der Detailgenauigkeitsebene (Granularität) berechnet, die durch die Kombination der Dimensionen in der Visualisierung festgelegt wird. Dies wird als eine Kennzahl bezeichnet, die durch eine Dimension aufgeschlüsselt wird. Wenn eine Kennzahl ohne Dimensionen verwendet wird, spricht man von tabellenbezogen. Das bedeutet, dass der Wert der Kennzahl der vollständig aggregierte Wert ist. Sobald wir eine Dimension in der Visualisierung verwenden, wird die Kennzahl basierend auf den Dimensionswerten detaillierter aufgeschlüsselt. Der Wert einer Kennzahl in einer Analyse hängt daher vom Kontext der Dimensionen ab.

Verwandte Kennzahlen

Betrachten Sie die Teilmenge der Dimensionswerte, die bei einem Inner Join der verwandten Dimensionen Schüler und Klasse zurückgegeben werden. Es gibt drei Schüler-Werte: „Fink“, „Rotkehlchen“ und „Spatz“, und drei Klassen-Werte: „Gesang für Fortgeschrittene“, „Grundlagen des Nestbaus“ und „Fliegen für Jungvögel“.

Eine Ergebnistabelle für einen Inner Join zwischen „Schüler“ und „Klasse“

Wenn wir die Kennzahl Länge aus der Tabelle „Klasse“ hinzufügen, sehen wir, dass alle vier Kurse angezeigt werden und für „Schüler“ eine Null steht. Die Länge jeder Klasse wird angezeigt, auf der Ebene von Klasse.

Für „Schüler“ wird ein Null-Wert angezeigt, obwohl die Dimensionen per Inner Join verknüpft sind.

Wenn wir stattdessen die Kennzahl Alter aus der Tabelle „Schüler“ hinzufügen, sehen wir, dass alle fünf Schüler angezeigt werden und dass es zwei Null-Werte für „Klasse“ gibt. In den Ergebnissen sind alle Schüler enthalten, auch wenn sie in keiner Klasse sind. Das Alter jedes Schülers wird angezeigt, auf der Ebene von Schüler.

Für Klassen wird ein Null-Wert angezeigt, obwohl die Dimensionen per Inner Join verknüpft sind.

Nicht verwandte Kennzahlen

Kennzahlwerte werden bei nicht verwandten Dimensionswerten wiederholt.

Wenn uns die Kennzahl Länge aus der Tabelle „Klasse“ und die nicht verwandte Dimension Kurs anschauen, ist die Kennzahl tabellenbezogen und wird über alle Dimensionswerte von Kurs wiederholt.

Eine tabellenbezogene Kennzahl, die über nicht verwandte Dimensionswerte hinweg wiederholt wird

Bei Vorhandensein einer Stitching-Dimension können Kennzahlen sowohl aufgeschlüsselt als auch wiederholt werden.

Hier kommt die Kennzahl Alter aus der Tabelle „Schüler“ und wird auf Ebene von „Schüler“ aufgeschlüsselt. Jedes Mal, wenn ein Schüler basierend auf den Dimensionen für Klasse und Kurs wiederholt wird, wird der Wert für Alter wiederholt.

Problembehebung

Aspekte beim Arbeiten mit Datenmodellen mit Multi-Fakten-Beziehungen

Berechnungen auf Zeilenebene

Berechnungen auf Zeilenebene können sich nur auf Felder beziehen, die dieselbe vorgelagerte Basistabelle verwenden. Das heißt, dass Berechnungen auf Zeilenebene nicht über mehrere Bäume hinweg durchgeführt werden können.

Kombinierte Felder

Alle Felder in einem kombinierten Feld müssen eine vorgelagerte Tabelle gemeinsam verwenden. Das heißt, Sie können ein kombiniertes Feld nicht mit Feldern erstellen, die sich in unterschiedlichen Bäumen befinden.

Sätze

Sätze können nur mit einer Definition erstellt werden, die Felder beinhaltet, die dieselbe vorgelagerte Basistabelle verwenden. Allerdings kann in einer Visualisierung die Option „Zum Satz hinzufügen“ von einer Markierung aus verfügbar sein, wenn diese Markierung durch Felder definiert ist, die keinen Bezug zu den zum Feldern haben, die zum Definieren des Satzes verwendet wurden. Wenn Sie „Zum Satz hinzufügen“ auswählen, fügt Tableau der Satzdefinition nur die zugehörigen Felder hinzu. Dies unterscheidet sich vom Verhalten der Option „Zum Satz hinzufügen“ in Datenquellen mit einer einzigen Basistabelle, wo „Zum Satz hinzufügen“ alles hinzufügt, was die Markierung definiert.

Validieren von Detailgenauigkeitsausdrücken vom Typ INCLUDE

INCLUDE-LOD-Ausdrücke können nicht über nicht verwandte Felder hinweg ausgewertet werden. Da die Verwandtschaft zwischen Feldern Blatt für Blatt ausgewertet wird, ist es möglich, dass im Datenbereich oder im Berechnungseditor ein gültiger LOD-Ausdruck vorhanden ist, der im Kontext einer bestimmten Visualisierung (bei Vorhandensein einer nicht zugehörigen Dimension) ungültig wird. Wenn dies geschieht, wird das LOD-Feld rot angezeigt. Sie können den LOD-Ausdruck so ändern, dass Konflikte aufgrund nicht zugehöriger Felder beseitigt werden, oder die Struktur der Visualisierung ändern oder den LOD-Ausdruck aus der Visualisierung zu entfernen.

Aktualisieren veröffentlichter Datenquellen

Erstellen Sie am Besten eine Kopie einer vorhandenen veröffentlichten Datenquelle, wenn Sie beabsichtigen, diese auf ein Datenmodell mit Multi-Fakten-Beziehungen umzustellen, und nicht alle damit verbundenen Arbeitsmappen das neue Datenmodell benötigen. Die vorhandene Version der Datenquelle sollten Sie nur dann ändern, wenn all ihre Arbeitsmappen die neuen Tabellen benötigen. Veröffentlichen Sie die geänderte Datenquelle als neue Datenquelle und erstellen Sie daraus neue Arbeitsmappen. Dadurch wird verhindert, dass die vorhandenen Arbeitsmappen zur Verwendung von VDS anstelle des Datenservers konvertiert werden, wenn sie die Funktionalität nicht benötigen. Dadurch werden mögliche Leistungseinbußen vermieden.

Bekannte Probleme in 2024.2

Extrakte

Warnung: Datenquellen mit Multi-Fakten-Beziehungen sollten Direktverbindungen sein, keine Extrakte.

Lokale Datenquelle (in einer Arbeitsmappe): Bei dem Versuch, eine Datenquelle mit Multi-Fakten-Beziehungen zu extrahieren, wird die Fehlermeldung „Keine solche Tabelle vorhanden“ angezeigt.

Veröffentlichte Datenquelle: Das Extrahieren einer veröffentlichten Datenquelle mit Multi-Fakten-Beziehungen scheint erfolgreich zu sein, aber Feldwerte können vertauscht sein.

Für dieses Verhalten ist eine Lösung geplant.

Verwandtschaftsindikatoren mit mehreren Markierungskarten

Wenn eine Visualisierung mit mehreren Kennzahlen im Zeilen- oder Spalten-Container erstellt wird, erhält jede Kennzahl ihre eigene Markierungskarte. Die Logik, die zur Ermittlung der Zugehörigkeitsindikatoren (das Symbol „Nicht verwandt“, der Text in Quickinfos und das Warndialogfeld „Fehlende Zuordnung“) verwendet wird, liefert möglicherweise nicht die erwarteten Ergebnisse, je nachdem, welche Markierungskarte geöffnet ist. Die Visualisierung selbst wird jedoch basierend auf der Zusammengehörigkeit jedes einzelnen Feldpaares korrekt berechnet. Für dieses Verhalten ist eine Lösung geplant.

EXCLUDE-Detailgenauigkeitsausdrücke

Bei Vorhandensein nicht verwandter Felder sollten nur EXCLUDE-Detailgenauigkeitsausdrücke („EXCLUDE-LODs“) validiert werden. Allerdings können EXCLUDE-LODs unter denselben Bedingungen auch fälschlicherweise als ungültig bewertet werden. Für dieses Verhalten ist eine Lösung geplant.

Verschachtelte Benutzerberechnungen

Verschachtelte Benutzerberechnungen sind in veröffentlichten Datenquellen mit einem Datenmodell mit Multi-Fakten-Beziehungen nicht verfügbar. Für dieses Verhalten ist eine Lösung geplant.

BatchQueryProcessor

Zur Unterstützung von Datenmodellen mit Multi-Fakten-Beziehungen muss BatchQueryProcessor aktiviert werden. Dies ist ein erwartetes Verhalten und derzeit ist keine Lösung geplant.

Tableau Pulse

Pulse funktioniert möglicherweise nicht mit Datenmodellen mit Multi-Fakten-Beziehungen. Möglicherweise können Sie keine Metrikdefinition erstellen, oder erstellten Metriken sind möglicherweise leer. Dies ist kein erwartetes Verhalten, es ist jedoch derzeit noch keine Lösung geplant.

Vielen Dank für Ihr Feedback!Ihr Feedback wurde erfolgreich übermittelt. Vielen Dank.