Wann Sie ein Multi-Fakten-Beziehungsmodell verwenden sollten
Ein Multi-Fakten-Beziehungsmodell ist ein Datenmodell, bei dem Sie nicht verknüpfte Tabellen in einer einzigen Datenquelle hinzufügen können und das anschließend während der visuellen Analyse verknüpfte Felder verwendet, um die Tabellen abhängig vom Kontext zusammenzuheften. Anders als bei der Verschmelzung befinden sich die Daten in einer gemeinsamen Datenquelle. Die Konzepte der primären und sekundären Datenquellen gelten nicht, und aus Linksverknüpfungen werden keine Daten gelöscht. Im Gegensatz zu einem Datenmodell mit einer einzigen Tabelle behalten mehrere Basistabellen ihren eigenen Kontext bezüglich der von ihnen gemeinsam genutzten Tabellen. Ein Multi-Fakten-Beziehungsmodell bietet Ihnen mehr Optionen bei der Durchführung von Multi-Faktoren-Analysen in Tableau.
Stellen Sie sich vor, Sie möchten den Zusammenhang zwischen Wetter und Eisverkauf analysieren. Sowohl das Wetter als auch der Eisverkauf finden zu bestimmten Zeiten und an bestimmten Orten statt, es besteht jedoch kein direkter Zusammenhang zwischen dem Eisverkauf und dem Wetter. Es handelt sich dabei um voneinander unabhängige Datenelemente, die sich beide auf die gemeinsamen Konzepte Datum und Ort beziehen.
Für diese Fragestellung eignet sich ein Multi-Fakten-Beziehungsmodell. Eisverkauf und Wetter können jeweils als Basistabelle hinzugefügt und mit den gemeinsam genutzten Tabellen „Datum“ und „Ort“ verknüpft werden.
Warum haben wir die Möglichkeit geschaffen, nicht verknüpfte Tabellen zu modellieren?
Bei Analysen geht es oft darum, Datentabellen zusammenzuführen, die keine direkte Beziehung zueinander haben, sich aber auf dieselben gemeinsamen Informationen beziehen (wie etwa Datum oder Ort). Ein Multi-Fakten-Beziehungsmodell ermöglicht eine lose semantische Kopplung durch die Einführung des Konzepts von Beziehungsgraden und die Fähigkeit, ein Datenmodell mit mehreren nicht verknüpften Basistabellen zu erstellen.
Der Begriff „semantische Kopplung“ beschreibt, wie eng Daten miteinander verknüpft sind. Eine Verknüpfung oder Vereinigung ist eine enge semantische Kopplung. Dabei werden mehrere Tabellen zu einer neuen physischen Tabelle zusammengefügt, die dann als eine einzige Tabelle fungiert. Eine Beziehung ist eine eher lose Kopplung zwischen Tabellen, bei der diese logisch miteinander verbunden werden, aber ihren Status als separate Tabellen beibehalten. Noch stärker semantisch gekoppelt ist die Datenverschmelzung, bei der Ergebnisse aus separaten Datenquellen auf Grundlage der gemeinsam genutzten Elemente visuell kombiniert werden. Ein Multi-Fakten-Beziehungsmodell liegt näher am Verschmelzungsende des Spektrums, verwendet aber eine gemeinsame Datenquelle anstatt mehrerer Datenquellen.
Ein Multi-Fakten-Beziehungsmodell – ein Datenmodell mit mehreren Basistabellen – erlaubt nicht verknüpfte Tabellen im Modell, solange im Modell auch gemeinsame Tabellen vorhanden sind. Während der Analyse werden auf Grundlage der gemeinsamen Dimensionen (z. B. Auftreten am gleichen Ort oder zur gleichen Zeit) die ansonsten nicht miteinander verknüpften Datentabellen durch Felder einer gemeinsamen Tabelle zusammengeheftet. Alle Vorteile der Beziehungen bleiben erhalten, einschließlich der Körnung oder des nativen Detaillierungsgrads jeder Tabelle.
Ähnlich wie bei einem Datenmodell mit einer einzelnen Basistabelle ermittelt Tableau im Hintergrund basierend auf der Struktur der Visualisierung den besten zu verwendenden Verknüpfungstyp. In einem Multi-Fakten-Beziehungsmodell werden die Verknüpfungsoptionen jedoch zur Verarbeitung der unterschiedlichen Beziehungsebenen um Außen- und Kreuzverknüpfungen erweitert. Weitere Informationen finden Sie unter Über Datenmodelle mit Multi-Fakten-Beziehungen.
Woher stammt der Name?
Multi-Fakten-Beziehungen erhielten ihre Bezeichnung von der Multi-Fakten-Analyse. In einem Data-Warehouse-Modell werden Daten in einer zentralen Faktentabelle gespeichert, die von Dimensionstabellen umgeben ist. In diesem Kontext bezieht sich Fakt auf Kennzahlen oder Metriken. Diese sind numerische Datenfelder, die Fakten über die Daten erfassen – die Kennzahlen von Tableau. Dimensionstabellen enthalten Attribute zu diesen Fakten.
Auf Faktentabellen basierende Schemata sind häufig stern- oder schneeflockenförmig strukturiert, je nachdem, wie die Dimensionstabellen organisiert sind. Wenn eine Analyse über mehrere Faktentabellen hinweg durchgeführt werden muss, spricht man von einer Multi-Fakten-Analyse. Eine Analyse wird im Kontext der gemeinsamen Dimensionstabellen durchgeführt, die als gemeinsam genutzte Dimensionen oder konforme Dimensionen bezeichnet werden. In Tableau erstellen Sie diese Datenmodelle mithilfe von Beziehungen, daher haben wir diese Zusammenstellung von Funktionen „Multi-Fakten-Beziehungen“ genannt.
Wann sollten Sie Datenmodelle mit Multi-Fakten-Beziehungen verwenden?
Wenn Ihre Daten aus Tabellen bestehen, die alle miteinander verknüpft sind, können Sie Datenquellen mit einer einzigen Basistabelle verwenden, die auf Beziehungen basiert. Ein Multi-Fakten-Beziehungsmodell ist erforderlich, wenn Ihre Daten verschiedene Konzepte umfassen, entweder in Form von Multi-Fakten-Tabellen oder verschiedener, nicht miteinander verbundener Kontexte.
Wann immer möglich, erstellen Sie Ihre Datenquellen mit einer einzigen Basistabelle. In einem Datenmodell mit einer einzigen Basistabelle ist jede Tabelle verknüpft, und der Beziehungsgrad kann außer Acht gelassen werden. Verwenden Sie Multi-Fakten-Beziehungen nur, wenn diese Datenmodellstruktur tatsächlich erforderlich ist.
Multi-Fakten-Analyse
Die Multi-Fakten-Analyse ist ein wichtiger Anwendungsfall für Multi-Fakten-Beziehungen in Tableau. In diesem Beispiel verwenden Fakt A und Fakt B gemeinsam die Tabelle „Datum“.
Um dies in Tableau zu modellieren, werden die Faktentabellen zu Basistabellen, und für ihre gemeinsame Dimensionstabelle werden mehrere eingehende Beziehungen erstellt.
Andere Szenarien
Doch Multi-Fakt-Beziehungsmodelle eignen sich nicht nur für die Multi-Fakten-Analyse. Tableau verwendet keine strenge Definition für Fakten- oder Dimensionstabellen. Jede beliebige Tabelle kann eine Basistabelle sein (sie sollte jedoch den Merkmalen von Basistabellen entsprechen). In den folgenden Szenarien kann eine Datenquelle mit mehreren Basistabellen hilfreich sein:
- Durchlaufen von Phasen, wie etwa jeweils eine Basistabelle für Bewerbungen, Transkripte und Alumni-Veranstaltungen für eine gemeinsame Schülertabelle.
- Unterschiedliche Kontexte für dieselben Ereignisse, wie etwa Basistabellen für die Ereignisse „Medizinische Termine“ und „Abrechnungen“ mit gemeinsamen Tabellen, um den Kontext für Ärzte oder Patienten festzulegen.
- Verschiedene Wertebereiche, die von einander abhängen können, wie beispielsweise Szenarien, für die früher idealerweise Datenverschmelzung verwendet wurde, wie etwa die Beziehung von Eisverkäufen und Wetter mit gemeinsamen Datums- und Ortstabellen.
Mehr darüber, wann Multi-Fakten-Beziehungen nützlich sind, erfahren Sie in diesem Tableau-Blogbeitrag: When and How to Use Multi-fact Relationships in Tableau (Wann und wie Multi-Fakten-Beziehungen in Tableau verwendet werden).
Identifizieren der Basistabellen
In einem Beziehungsmodell mit mehreren Fakten ist die Richtung wichtig. Das heißt, welche Tabellen die Basistabellen auf der linken Seite des Modells sind und welche Tabellen nachgelagert gemeinsam genutzt werden, hat Auswirkungen darauf, wie die Beziehungen ausgewertet und welche Analyseergebnisse zurückgegeben werden.
Stellen Sie sich Rechnungen, Termine, Ärzte und Patienten in einem Bowtie-Konzept vor:
Die korrekte Vorgehensweise zum Erstellen des Datenmodells in Tableau besteht darin, Rechnungen und Termine als Basistabellen und Ärzte und Patienten als gemeinsame Tabellen zu verwenden (nicht Ärzte und Patienten als Basistabellen).
Richtig: Rechnungen und Termine als Basistabellen | Falsch: Ärzte und Patienten als Basistabellen |
In Bezug auf das Konzept ist ein Patient (oder Arzt) die Entität, die das Ereignis eines Termins und das Ereignis einer Rechnung zusammenheftet.
Wenn Ihr Datenmodell anders herum strukturiert ist (z. B. mit Ärzten und Patienten als Basistabellen anstelle von Terminen und Rechnungen), ist das Zusammenheftungs-Verhalten der äußeren Verbindung nicht so sinnvoll. Eine solche Analyse könnte zahlreiche durch Tabellen beschränkte Kennzahlen und Mehrdeutigkeiten aufweisen. Wenn Sie unerwartete, mehrdeutig verknüpfte Felder feststellen, überprüfen Sie die Tabellen, die Sie als Basistabellen verwenden, und prüfen Sie, ob Ihr Datenmodell umgekehrt werden muss.
Merkmale von Basistabellen und gemeinsam genutzten Tabellen
Wenn Sie eine Multi-Fakten-Analyse durchführen, werden die Faktentabellen zu Basistabellen, und alle gemeinsam genutzten Dimensionstabellen sind gemeinsam genutzte Tabellen. Tableau verlangt keine strikte Einhaltung der Merkmale von Fakten- und Dimensionstabellen. Es gibt jedoch bestimmte Attribute, die Ihnen dabei helfen können, zu erkennen, welche Tabellen Basistabellen und welche gemeinsam genutzte Tabellen sein sollten.
Basistabelle | Gemeinsam genutzte Tabelle |
Faktentabellen in einem Data-Warehouse-Schema | Gemeinsam genutzte oder konforme Dimensionstabellen in einem Data-Warehouse-Schema |
Spezifisch für den Kontext oder die Analyse (Fluginformationen, Energieverbrauch) | Konsistentes Konzept in unterschiedlichen Kontexten (Datum, Ort) |
Hauptsächlich Kennzahlen | Hauptsächlich Dimensionen |
Häufigere Aktualisierungen/Transaktionen (Arzttermine, Rezepte, Vitalwerte) | Stabiler/langlebiger (Arzt, Patient) |
Hat Fremdschlüsselfelder | Hat Primärschlüsselfelder |
Ereignisbasiert (Stundenplan, Note einer Aufgabe) | Entitätsbasiert (Schüler, Klassenzimmer) |
Wenn sich zwischen einer Basistabelle und einer gemeinsamen Tabelle Zwischentabellen befinden, können Sie ändern, welche die Basistabelle ist, ohne das Datenmodell grundlegend zu verändern. (Wie „Eissalon-Info“ und „Eisverkauf“ im ersten Beispiel.) Entscheidend ist, welche Tabellen den gemeinsam genutzten Tabellen vorgelagert sind und welche gemeinsam genutzt werden.
Versuchen Sie es stattdessen mit einer zusätzlichen Basistabelle
In manchen Szenarien ist es vorteilhaft, ein Multi-Fakt-Beziehungsmodell mit mehreren Basistabellen anstelle einer Datenquelle mit einer einzigen Basistabelle zu erstellen:
- Wenn Sie eine Datenquelle mit einem Zirkel erstellen möchten, sollte die nachgelagerte Tabelle eine weitere Basistabelle sein.
- Wenn Sie mehrere Tabellen haben, die über dieselben Beziehungsklauseln (wie etwa Datum und Ort) verknüpft sind, sollten diese Dimensionen herausgenommen und stattdessen in gemeinsame Tabellen umgewandelt werden.
- Dies ist besonders hilfreich, da bei mehreren Beziehungsklauseln alle wahr sein müssen (logisch ein UND), damit die Tabellen für diese Datensätze verknüpft sind.
- Wenn Sie stattdessen Datensätze analysieren möchten, von denen nur jeweils einer wahr sein kann (ein kontextbezogenes ODER), wird diese Flexibilität durch die Einrichtung eines Datenmodells ermöglicht, das gemeinsame Dimensionstabellen hat.
- Wenn Sie eine Verschmelzung verwenden, aber eine äquivalente Verschmelzung ohne primäre und sekundäre Datenquellen wünschen, erstellen Sie ein Datenmodell, in dem die Datenquellen der Verschmelzung in einer oder mehreren gemeinsamen Tabellen mit ihren Verknüpfungsfeldern kombiniert werden.