Planen der Datenquelle
Ihre Daten befinden sich in Tableau. Wie erfolgreich Sie beim Untersuchen von Daten, Beantworten von Fragen und Erstellen von Visualisierungen für sich selbst oder andere sind, um alles zu nutzen, hängt von den zugrunde liegenden Daten ab.
Wenn Ihr Ziel darin besteht, eine schnelle Erkundung oder Ad-hoc-Analyse durchzuführen, können Sie sofort loslegen, eine Verbindung zu einigen Daten herstellen, ein paar Drag-and-Drop-Vorgänge durchführen, um einige Visualisierungen zu erstellen, und die benötigten Informationen abrufen. Wenn Sie jedoch eine Analyse oder Datenquelle erstellen möchten, die mehr als einmal verwendet wird, sollten Sie Ihre Datenquelle am besten durchdenken und planen.
Tableau-Datenquellen
Bei einer Tableau-Datenquelle handelt es sich um eine Verknüpfung zwischen Ihren Quelldaten und Tableau. Sie ist im Grunde die Summe Ihrer Daten (als Live-Verbindung oder Extrakt), der Verbindungsinformationen, der Namen der Daten enthaltenden Tabellen oder Blätter sowie der Anpassungen, die Sie zusätzlich zu den Datenanpassungen vornehmen, um damit in Tableau zu arbeiten. Zu diesen Anpassungen gehören z. B. die Kombination der Daten und Metadaten wie Berechnungen, umbenannte Felder und Standardformatierungen.
Eine Tableau-Datenquelle kann mehrere Datenverbindungen zu verschiedenen Datenbanken oder Dateien enthalten. Zu den Verbindungsinformationen gehören der Speicherort der Daten, etwa Dateiname und Pfad oder ein Netzwerkspeicherort, sowie Details zum Herstellen einer Verbindung mit den Daten, etwa Datenbankservername und Serveranmeldeinformationen.
Hinweis: Die Begriffe Datenquelle und Datenverbindung wurden in der Vergangenheit unterschiedslos verwendet. Daher wurde in älteren Materialien möglicherweise keine klare Unterscheidung vorgenommen.
Es ist auch wichtig, den Unterschied zwischen der Tableau-Datenquelle (Tableau-Zugriff auf Ihre Daten und alle möglicherweise beteiligten Anpassungen) und den Quelldaten selbst (z. B. eine Datenbank oder Excel-Tabelle) zu berücksichtigen. Das Planen einer Datenquelle im Sinne des Entwerfens einer Datenbank wird in diesem Thema nicht behandelt.
Tableau-Datenquellen können in der Arbeitsmappe eingebettet bleiben, in der sie ursprünglich erstellt wurden, oder sie können separat veröffentlicht werden. Veröffentlichte Datenquellen ermöglichen die Zentralisierung und Skalierung kuratierter Datenquellen. Weitere Informationen finden Sie unter Bewährte Methoden für veröffentlichte Datenquellen.
Kombinieren von Daten
Wenn Ihre Daten aus einer Tabelle stammen, können Sie Ihre Daten verbinden, um die Datenquelle zu erstellen, die Tabelle in den Verknüpfungsbereich zu ziehen und anschließend mit dem Erstellen der Ansicht zu beginnen. Wenn Ihre Daten jedoch auf mehrere Tabellen oder über mehrere Datenbanken verteilt sind, müssen Sie sie kombinieren. Das Kombinieren von Daten erfolgt auf der Datenquellenseite.
Einzeldatenbank | Mehrere Datenbanken |
|
|
Hinweis: Um Tabellen über verschiedene Datenbanken hinweg zu verbinden, müssen sie als Datenverbindungen innerhalb derselben Datenquelle und nicht als neue Datenquelle hinzugefügt werden. Datenverbindungen werden über den Link "Hinzufügen" im linken Bereich hinzugefügt. Neue Datenquellen können über das Datenmenü oder das Dropdown-Menü über das Symbol neben dem Namen der Datenquelle erstellt werden, wie in der Abbildung unten zu sehen.
Methoden zum Kombinieren von Daten
Beziehungen sind die Standardmethode zum Kombinieren von Daten in Tableau. Beziehungen sind eine dynamische, flexible Möglichkeit, Daten aus mehreren Tabellen zur Analyse zu kombinieren. Bei Bedarf können Tabellen auch verbunden oder vereinigt werden. Datenquellen können auch verschmolzen werden. Werfen wir einen Blick auf die Optionen zum Kombinieren von Daten in Tableau und einige der Situationen, in denen jede Methode nützlich ist.
Beziehungen | Legen das Potenzial für Verknüpfungen zwischen zwei Tabellen basierend auf verknüpften Feldern fest. Sie führen keine Daten zusammen, um eine neue, feste Tabelle zu erstellen. Während der Analyse werden die relevanten Tabellen automatisch mithilfe der kontextabhängigen Verknüpfungen abgefragt, um eine benutzerdefinierte Datentabelle für diese Analyse zu generieren. Behält die entsprechende Detailgenauigkeit bei, verliert keine Daten, behält entsprechende Aggregationen bei und verarbeitet NULL-Werte. |
Verknüpfungen | Führen zwei Datentabellen basierend auf einer JOIN-Klausel und dem Verknüpfungstyp zusammen, um eine neue, feste Datentabelle zu bilden. Sie werden häufig verwendet, um neue Datenspalten in derselben grundlegenden Zeilenstruktur hinzuzufügen. Kann bei einigen Verknüpfungstypen zu Datenverlust führen, wenn Felder nicht in allen Tabellen vorhanden sind. Es kann zu einer Duplizierung von Daten führen, wenn sich Tabellen auf unterschiedlichen Detailebenen befinden. |
Vereinigungen | Führen zwei oder mehr Datentabellen zusammen, um eine neue, feste Datentabelle zu bilden. Sie werden verwendet, um Daten über dieselbe grundlegende Spaltenstruktur anzuhängen (neue Zeilen von Daten hinzuzufügen). |
Mischungen | Funktionieren in zwei oder mehr separaten Tableau-Datenquellen. Die Daten bleiben getrennt. Tableau fragt die Datenquellen unabhängig ab und visualisiert auf der Grundlage der für dieses Blatt festgelegten Verknüpfungsfelder die Ergebnisse zusammen in der Ansicht. Imitiert das Verhalten einer linken Verknüpfung und filtert möglicherweise Daten aus sekundären Datenquellen. |
Hinweis: Es ist auch möglich, Daten mit benutzerdefinierter SQL zu kombinieren. Meistens ist es am besten, Daten direkt im Verknüpfungsbereich oder mittels Datenverschmelzung zu kombinieren. Dies ermöglicht Tableau die größte Flexibilität bei der Optimierung. In bestimmten Szenarien kann es jedoch Gründe für die Verwendung von benutzerdefinierter SQL geben. Beachten Sie, dass dies Auswirkungen auf die Leistung haben kann, da Tableau gezwungen ist, die benutzerdefinierte SQL-Anweisung wie geschrieben auszuführen.
Beziehungen
Beziehungen sind eine Methode zum Arbeiten mit Daten aus mehreren Tabellen, die auf freigegebenen Feldern –Spalten – zwischen diesen Tabellen basieren. Durch das Einrichten einer Beziehung wird Tableau darüber informiert, wie Zeilen über Tabellen hinweg verbunden werden können. Tableau enthält diese Informationen, führt die Zeilen jedoch nicht sofort zusammen, wie dies bei einer fest einprogrammierten Verknüpfung der Fall wäre. Stattdessen werden, wenn die Visualisierung erstellt wird, die an der Analyse involvierten Felder über die Beziehung zurückverfolgt und die entsprechenden Verknüpfungen erstellt, um die korrekten Daten zurückgegeben.
Da die Daten niemals zwangsweise in eine einzelne Tabelle außerhalb des Kontexts einer Visualisierung eingebracht werden, sind Beziehungen nützlich, wenn sich die Daten auf unterschiedlichen Detailebenen oder Granularitäten befinden. Ein Beispiel dafür wäre, wenn Sie mit Daten über den täglichen Niederschlag in einer Tabelle arbeiten müssen, aber mit stündlichen Temperaturen in einer anderen.
Weitere Informationen darüber, wie Tabellen mithilfe von Beziehungen kombiniert werden, finden Sie unter Setzen Sie Ihre Daten in Beziehung.
Weitere Informationen zum Kombinieren von Tabellen mithilfe von Beziehungen finden Sie unter Setzen Sie Ihre Daten in Beziehung und in diesen Tableau-Blogbeiträgen:
- Relationships, part 1: Introducing new data modeling in Tableau(Link wird in neuem Fenster geöffnet)
- Relationships, part 2: Tips and tricks(Link wird in neuem Fenster geöffnet)
- Relationships, part 3: Asking questions across multiple related tables(Link wird in neuem Fenster geöffnet)
Hinweis: Ab der Tableau-Version 2024.2 unterstützt das Tableau-Datenmodell Multi-Fakten-Analysen und gemeinsam genutzte Dimensionen per Multi-Fakten-Beziehungen. Weitere Informationen finden Sie unter Informationen zu Datenmodellen mit Multi-Fakten-Beziehungen(Link wird in neuem Fenster geöffnet), Wann Sie ein Multi-Fakten-Beziehungsmodell verwenden sollten(Link wird in neuem Fenster geöffnet) und Erstellen eines Datenmodells für Multi-Fakten-Beziehungen(Link wird in neuem Fenster geöffnet).
Verknüpfen
Das Verknüpfen ist eine Methode zum Zusammenführen von Tabellen, die über gemeinsame Felder verbunden sind. Das Ergebnis einer Datenzusammenführung mithilfe einer Verknüpfung ist eine Tabelle, die horizontal durch das Hinzufügen von Datenspalten erweitert wird.
Weitere Informationen zum Verknüpfen von Daten in Tableau finden Sie unter Verknüpfen Ihrer Daten.
Datenverschmelzung
Wenn Sie zum Zusammenführen von Daten die Datenverschmelzung nutzen, führen Sie Ihre Daten in einer so genannten primären Datenquelle mit gemeinsamen Feldern aus einer oder mehreren sekundären Datenquellen zusammen.
Eine Datenverschmelzung ist nützlich, wenn Sie die Konfiguration der Datenquelle je nach Blatt ändern müssen, wenn Sie Datenbanken kombinieren möchten, die keine Beziehungen oder Verknüpfungen zulassen (wie beispielsweise Cube-Datenquellen oder veröffentlichte Datenquellen).
Das Ergebnis einer Datenzusammenführung mithilfe einer Datenverschmelzung ist eine virtuelle Tabelle, die horizontal durch das Hinzufügen von Datenspalten erweitert wird. Die Daten aus jeder Datenquelle werden auf eine gemeinsame Ebene aggregiert, bevor sie gemeinsam in der Visualisierung angezeigt werden.
Weitere Informationen zur Funktionsweise und Anwendung der Datenverschmelzung in Tableau finden Sie unter Verschmelzen von Daten.
Vereinigung
Beim Vereinigen handelt es sich um eine Methode zum Anhängen von Werten (Zeilen) an Tabellen. Sie können Tabellen vereinigen, wenn sie über die gleichen Spalten verfügen. Das Ergebnis einer Datenzusammenführung mithilfe einer Vereinigung ist eine virtuelle Tabelle, die über die gleichen Spalten verfügt, jedoch vertikal durch das Hinzufügen von Datenzeilen erweitert wird.
Sie können Tabellen auf folgende Weise vereinigen: manuell oder über eine Suche mit Platzhaltern. Weitere Informationen zum Vereinigen von Daten mithilfe einer dieser Methoden in Tableau finden Sie unter Vereinigen von Daten.
Hinweise zu Tableau-Datenquellen
Stellen Sie vor allem sicher, dass Sie sich über den Zweck der Datenquelle im Klaren sind. Wenn Sie eine Datenquelle vom Typ "Catch-all" für eine Vielzahl von Benutzern mit breit gefächerten Fragen erstellen, würden Sie dies anders tun, als wenn Sie eine für einen spezifischen Zweck konzipierte Datenquelle erstellen würden, die für die Leistung optimiert ist. Es ist wichtig, Ihr Ziel von Anfang an zu kennen.
Unter Berücksichtigung dieses Ziels müssen sie mehrere Elemente berücksichtigen und planen, bevor Sie eine Datenquelle in Tableau erstellen:
- Speicherort und Zugriff
- Form und Reinheit
- Das Datenmodell und die Kombination von Daten
- Metadaten und Anpassung
- Skalierbarkeit, Sicherheit und Auffindbarkeit
- Leistung und Aktualität
Speicherort und Zugriff
Der Speicherort Ihrer Daten kann ganz simpel sein, wie zum Beispiel eine einzelne Excel-Datei auf Ihrem Computer oder eine von Ihnen erstellte Google Tabelle, bis überaus komplex, wie zum Beispiel mehrere Datenbanken mit verschiedenen Technologien. Der Zugriff kann auch spezifische Treiber oder Connectoren für eine Datenbank oder Anmeldeinformationen für einen Datenbankserver beinhalten.
Zu berücksichtigende Fragen:
- Haben die richtigen Tableau-Benutzer Zugriff und Berechtigungen auf die Daten und auf Tableau?
- Welches Benutzerkonto sollte verwendet werden, um sich bei der Datenbank anzumelden?
- Wird Benutzerfilterung oder Sicherheit auf Zeilenebene benötigt?
- Sind die Quelldaten vor Ort oder in der Cloud?
- Gibt es Unterstützte Connectoren?
- Gibt es Einschränkungen für diese Datenbank (unterstützt sie alle Funktionen, die Sie zu verwenden hoffen)?
Form und Reinheit
Möglicherweise verfügt Ihre Organisation bereits über gut strukturierte Daten, mit denen Sie eine Verbindung herstellen können, oder über Datenvorbereitungsprozesse, die Sie nutzen können. Alternativ müssen Sie Tableau Prep Builder verwenden, um Bereinigungs- und Formgebungsvorgänge durchzuführen mit dem Ziel, Ihre Daten in ein nützliches Format zu konvertieren.
Zu berücksichtigende Fragen:
- Sind die Daten für die Verwendung mit Tableau gut strukturiert?
- Sollten Tableau Prep Builder und Tableau Prep Conductor zum Bereinigen und Automatisieren von Datenvorbereitungsschemas verwendet werden?
- Welche Berechnungen oder Änderungen sollten nach Möglichkeit nativ in Tableau durchgeführt werden?
- Sind manche dieser Daten nicht erforderlich? Fehlen Daten?
Das Datenmodell und die Kombination von Daten
Tableau muss wissen, wie die Daten abgefragt werden, die vom Das Tableau-Datenmodell übermittelt werden. Wenn die Daten aus mehreren Tabellen stammen, müssen die Daten kombiniert werden. Zu den Methoden für das Kombinieren von Daten zählen Beziehungen, Verknüpfungen, Vereinigungen und Verschmelzungen.
Zu berücksichtigende Fragen:
- Sind die Daten auf mehrere Systeme verteilt?
- Wie können Sie die einzelnen Datentabellen am besten kombinieren?
Metadaten und Anpassung
Daten werden oft auf eine Weise gespeichert, die für eine Person nicht einfach zu verwenden ist. Beispielsweise kann es sein, dass Standardfeldnamen sperrig sind, benutzerdefinierte Formatierungen gewünscht werden oder Definitionen von Abkürzungen oder Codes fehlen. Alternativ dazu sind gemeinsame Berechnungen in den zugrunde liegenden Daten möglicherweise nicht vorhanden. Das Erstellen einer semantischen Ebene mit diesen Informationen kann das Verständnis und die Verwendung der Daten erheblich vereinfachen.
Zu berücksichtigende Fragen:
- Welche Berechnungen sollten hinzugefügt werden?
- Sind die Tabellen- und Feldnamen verständlich?
- Sind die Standardeinstellungen für die Felder nützlich, oder sollten sie angepasst werden?
- Gibt es Anpassungen, die vorgenommen werden sollten, um Tableau Catalog zu unterstützen?
Beachten Sie, dass "Erklär die Daten" derzeit keine Datenquellen mit mehreren Tabellen unterstützt.
Skalierbarkeit, Sicherheit und Auffindbarkeit
Eine Datenquelle verbleibt möglicherweise in der Arbeitsmappe, in der sie erstellt wurde – eine eingebettete Datenquelle – oder sie kann unabhängig von einer Analyse als eigenständiges Inhaltsobjekt in Tableau Server oder Tableau Cloud veröffentlicht werden. Diese Zentralisierung veröffentlichter Datenquellen hat den zusätzlichen Vorteil von Sicherheit und Skalierung, sodass mehrere Benutzer auf eine konsistente Datenquelle zugreifen können. Veröffentlichte Datenquellen können auch die Vorteile von Tableau Catalog und der Empfehlungen nutzen und eine zentrale verlässliche Datenquelle für eine Organisation bereitstellen.
Zu berücksichtigende Fragen:
- Soll die Datenquelle in der Arbeitsmappe eingebettet bleiben?
(Bei den folgenden Fragen wird davon ausgegangen, dass die Datenquelle veröffentlicht wird.)
- Wo wird die Datenquelle veröffentlicht?
- Wem gehört die Datenquelle?
- Welche Authentifizierung und Berechtigungen sollte sie aufweisen?
- Wird sie zertifiziert?
Leistung und Aktualität
Darüber hinaus können Tableau-Datenquellen Live-Verbindungen zu den Quelldaten sein, oder die Daten können als ein aktualisierbares Extrakt kopiert werden. Extrakte können die Analyseleistung steigern oder Ressourcenabflüsse für Datenbanksysteme verhindern.
Zu berücksichtigende Fragen:
- Soll die Datenverbindung live oder ein Extrakt sein?
- Wird es einen Aktualisierungszeitplan geben, wenn sie extrahiert wird? (Tableau Server | Tableau Cloud)
- Muss beim Veröffentlichen in Tableau Cloud Tableau Bridge verwendet werden?
Erstellen von Qualitätsdatenquellen
Es gibt eine Menge Elemente, die in eine gut gestaltete und leistungsfähige Datenquelle einfließen. Sie müssen Ihren ersten Versuch jedoch nicht veröffentlichen. Wie das Erstellen einer guten Visualisierung kann das Erstellen einer Datenquelle ein fortlaufender Prozess sein. Versuchen Sie Ihr Glück bei der Kombination der Ihres Erachtens nötigen Daten, und prüfen Sie dann, ob Sie die gewünschte Visualisierung erstellen können. Sie können jederzeit zurückgehen und eine neue Berechnung schreiben oder eine andere Datentabelle einbeziehen. Führen Sie einige Benutzertests durch, und fragen Sie einen Kollegen, ob er Ihre Feldnamen herausfinden kann.
Natürlich ist es am besten, nur Datenquellen zu veröffentlichen, auf die Sie vertrauen, und nur die zu zertifizieren, die die Qualitätssicherung bestanden haben. Benutzer sollten Ihrer veröffentlichten Datenquelle vertrauen können.