Planen der Datenquelle

Ihre Daten befinden sich in Tableau. Wie erfolgreich Sie beim Untersuchen von Daten, Beantworten von Fragen und Erstellen von Visualisierungen für sich selbst oder andere sind, um alles zu nutzen, hängt von den zugrunde liegenden Daten ab.

Wenn Ihr Ziel darin besteht, eine schnelle Erkundung oder Ad-hoc-Analyse durchzuführen, können Sie sofort loslegen, eine Verbindung zu einigen Daten herstellen, ein paar Drag-and-Drop-Vorgänge durchführen, um einige Visualisierungen zu erstellen, und die benötigten Informationen abrufen. Wenn Sie jedoch eine Analyse oder Datenquelle erstellen möchten, die mehr als einmal verwendet wird, sollten Sie Ihre Datenquelle am besten durchdenken und planen.

Tableau-Datenquellen

Bei einer Tableau-Datenquelle handelt es sich um eine Verknüpfung zwischen Ihren Quelldaten und Tableau. Sie ist im Grunde die Summe Ihrer Daten (als Live-Verbindung oder Extrakt), der Verbindungsinformationen, der Namen der Daten enthaltenden Tabellen oder Blätter sowie der Anpassungen, die Sie zusätzlich zu den Datenanpassungen vornehmen, um damit in Tableau zu arbeiten. Zu diesen Anpassungen gehören z. B. die Kombination der Daten und Metadaten wie Berechnungen, umbenannte Felder und Standardformatierungen.

Eine Tableau-Datenquelle kann mehrere Datenverbindungen zu verschiedenen Datenbanken oder Dateien enthalten. Zu den Verbindungsinformationen gehören der Speicherort der Daten, etwa Dateiname und Pfad oder ein Netzwerkspeicherort, sowie Details zum Herstellen einer Verbindung mit den Daten, etwa Datenbankservername und Serveranmeldeinformationen.

Hinweis: Die Begriffe Datenquelle und Datenverbindung wurden in der Vergangenheit unterschiedslos verwendet. Daher wurde in älteren Materialien möglicherweise keine klare Unterscheidung vorgenommen.

Es ist auch wichtig, den Unterschied zwischen der Tableau-Datenquelle (Tableau-Zugriff auf Ihre Daten und alle möglicherweise beteiligten Anpassungen) und den Quelldaten selbst (z. B. eine Datenbank oder Excel-Tabelle) zu berücksichtigen. Das Planen einer Datenquelle im Sinne des Entwerfens einer Datenbank wird in diesem Thema nicht behandelt.

Tableau-Datenquellen können in der Arbeitsmappe eingebettet bleiben, in der sie ursprünglich erstellt wurden, oder sie können separat veröffentlicht werden. Veröffentlichte Datenquellen ermöglichen die Zentralisierung und Skalierung kuratierter Datenquellen. Weitere Informationen finden Sie unter Bewährte Methoden für veröffentlichte Datenquellen.

Hinweise zu Tableau-Datenquellen

Stellen Sie vor allem sicher, dass Sie sich über den Zweck der Datenquelle im Klaren sind. Wenn Sie eine Datenquelle vom Typ "Catch-all" für eine Vielzahl von Benutzern mit breit gefächerten Fragen erstellen, würden Sie dies anders tun, als wenn Sie eine für einen spezifischen Zweck konzipierte Datenquelle erstellen würden, die für die Leistung optimiert ist. Es ist wichtig, Ihr Ziel von Anfang an zu kennen.

Unter Berücksichtigung dieses Ziels müssen sie mehrere Elemente berücksichtigen und planen, bevor Sie eine Datenquelle in Tableau erstellen:

  • Speicherort und Zugriff
  • Form und Reinheit
  • Das Datenmodell und die Kombination von Daten
  • Metadaten und Anpassung
  • Skalierbarkeit, Sicherheit und Auffindbarkeit
  • Leistung und Aktualität

Speicherort und Zugriff

Der Speicherort Ihrer Daten kann so einfach sein wie eine einzelne Excel-Datei auf Ihrem Computer oder eine von Ihnen erstellte Google Tabelle, oder so komplex wie mehrere Datenbanken mit verschiedenen Technologien. Der Zugriff kann auch spezifische Treiber oder Connectoren für eine Datenbank oder Anmeldeinformationen für einen Datenbankserver beinhalten.

Zu berücksichtigende Fragen:

Form und Reinheit

Möglicherweise verfügt Ihre Organisation bereits über gut strukturierte Daten, mit denen Sie eine Verbindung herstellen können, oder über Datenvorbereitungsprozesse, die Sie nutzen können. Alternativ müssen Sie Tableau Prep Builder verwenden, um Bereinigungs- und Formgebungsvorgänge durchzuführen mit dem Ziel, Ihre Daten in ein nützliches Format zu konvertieren.

Zu berücksichtigende Fragen:

  • Sind die Daten für die Verwendung mit Tableau gut strukturiert?
  • Sollten Tableau Prep Builder und Tableau Prep Conductor zum Bereinigen und Automatisieren von Datenvorbereitungsschemas verwendet werden?
  • Welche Berechnungen oder Änderungen sollten nach Möglichkeit nativ in Tableau durchgeführt werden?
  • Sind manche dieser Daten nicht erforderlich? Fehlen Daten?

Das Datenmodell und die Kombination von Daten

Tableau muss wissen, wie die Daten abgefragt werden, die vom Das Tableau-Datenmodell übermittelt werden. Wenn die Daten aus mehreren Tabellen stammen, müssen die Daten kombiniert werden. Zu den Methoden für das Kombinieren von Daten zählen Beziehungen, Verknüpfungen, Vereinigungen und Verschmelzungen.

Zu berücksichtigende Fragen:

  • Sind die Daten auf mehrere Systeme verteilt?
  • Wie können Sie die einzelnen Datentabellen am besten kombinieren?

Metadaten und Anpassung

Daten werden oft auf eine Weise gespeichert, die für eine Person nicht einfach zu verwenden ist. Beispielsweise kann es sein, dass Standardfeldnamen sperrig sind, benutzerdefinierte Formatierungen gewünscht werden oder Definitionen von Abkürzungen oder Codes fehlen. Alternativ dazu sind gemeinsame Berechnungen in den zugrunde liegenden Daten möglicherweise nicht vorhanden. Das Erstellen einer Metadatenebene mit diesen Informationen kann das Verständnis und die Verwendung der Daten erheblich vereinfachen.

Zu berücksichtigende Fragen:

  • Welche Berechnungen sollten hinzugefügt werden?
  • Sind die Tabellen- und Feldnamen verständlich?
  • Sind die Standardeinstellungen für die Felder nützlich, oder sollten sie angepasst werden?
  • Gibt es Anpassungen, die vorgenommen werden sollten, um Frag die Daten oder Tableau Catalog zu unterstützen?
    Beachten Sie, dass "Erklär die Daten" derzeit keine Datenquellen mit mehreren Tabellen unterstützt.

Skalierbarkeit, Sicherheit und Auffindbarkeit

Eine Datenquelle verbleibt möglicherweise in der Arbeitsmappe, in der sie erstellt wurde – eine eingebettete Datenquelle – oder sie kann unabhängig von einer Analyse als eigenständiges Inhaltsobjekt in Tableau Server oder Tableau Cloud veröffentlicht werden. Diese Zentralisierung veröffentlichter Datenquellen hat den zusätzlichen Vorteil von Sicherheit und Skalierung, sodass mehrere Benutzer auf eine konsistente Datenquelle zugreifen können. Veröffentlichte Datenquellen können auch die Vorteile von Tableau Catalog und der Empfehlungen nutzen und eine zentrale verlässliche Datenquelle für eine Organisation bereitstellen.

Zu berücksichtigende Fragen:

  • Soll die Datenquelle in der Arbeitsmappe eingebettet bleiben?

(Bei den folgenden Fragen wird davon ausgegangen, dass die Datenquelle veröffentlicht wird.)

Leistung und Aktualität

Darüber hinaus können Tableau-Datenquellen Live-Verbindungen zu den Quelldaten sein, oder die Daten können als ein aktualisierbares Extrakt kopiert werden. Extrakte können die Analyseleistung steigern oder Ressourcenabflüsse für Datenbanksysteme verhindern.

Zu berücksichtigende Fragen:

Erstellen von Qualitätsdatenquellen

Es gibt eine Menge Elemente, die in eine gut gestaltete und leistungsfähige Datenquelle einfließen. Sie müssen Ihren ersten Versuch jedoch nicht veröffentlichen. Wie das Erstellen einer guten Visualisierung kann das Erstellen einer Datenquelle ein fortlaufender Prozess sein. Versuchen Sie Ihr Glück bei der Kombination der Ihres Erachtens nötigen Daten, und prüfen Sie dann, ob Sie die gewünschte Visualisierung erstellen können. Sie können jederzeit zurückgehen und eine neue Berechnung schreiben oder eine andere Datentabelle einbeziehen. Führen Sie einige Benutzertests durch, und fragen Sie einen Kollegen, ob er Ihre Feldnamen herausfinden kann.

Natürlich ist es am besten, nur Datenquellen zu veröffentlichen, auf die Sie vertrauen, und nur die zu zertifizieren, die die Qualitätssicherung bestanden haben. Benutzer sollten Ihrer veröffentlichten Datenquelle vertrauen können.

Kombinieren von Daten

Wenn Ihre Daten aus einer Tabelle stammen, können Sie Ihre Daten verbinden, um die Datenquelle zu erstellen, die Tabelle in den Verknüpfungsbereich zu ziehen und anschließend mit dem Erstellen der Ansicht zu beginnen. Wenn Ihre Daten jedoch auf mehrere Tabellen oder über mehrere Datenbanken verteilt sind, müssen Sie sie kombinieren. Das Kombinieren von Daten erfolgt auf der Datenquellenseite.

EinzeldatenbankMehrere Datenbanken
  1. Stellen Sie eine Verbindung zu Ihren Daten her. Dadurch wird eine Datenquelle erstellt.
  2. Ziehen Sie eine Tabelle oder ein Datenblatt auf den Verknüpfungsbereich, und lassen Sie los.
  3. Ziehen Sie eine zweite Tabelle oder ein zweites Blatt auf den Verknüpfungsbereich, und lassen Sie los. Entweder bildet sich eine Nudel, die angibt, dass eine automatische Beziehung gebildet wurde, oder das Dialogfeld "Beziehung bearbeiten" wird geöffnet, in dem Sie aufgefordert werden, Tableau mitzuteilen, welches Feld diese Tabellen mit den beiden Tabellen verbindet.
  4. Setzen Sie das Hinzufügen von Tabellen fort.
  1. Stellen Sie eine Verbindung zu Ihren Daten her. Dadurch wird eine Datenquelle erstellt.
  2. Ziehen Sie eine Tabelle oder ein Datenblatt auf den Verknüpfungsbereich, und lassen Sie los.
  3. Nachdem Sie die erste Datentabelle angezeigt haben, klicken Sie auf den Link Hinzufügen rechts neben der Überschrift "Verbindungen" im linken Bereich.
  4. Wechseln Sie zwischen Datenverbindungen im linken Bereich, ziehen Sie dann die gewünschte Tabelle in den Verknüpfungsbereich, und lassen Sie sie los. Entweder bildet sich eine Nudel, die angibt, dass eine automatische Beziehung gebildet wurde, oder das Dialogfeld "Beziehung bearbeiten" wird geöffnet, in dem Sie aufgefordert werden, Tableau mitzuteilen, welches Feld diese Tabellen mit den beiden Tabellen verbindet.
  5. Setzen Sie das Hinzufügen von Tabellen fort, und wechseln Sie nach Bedarf zwischen Datenverbindungen.

Hinweis: Um Tabellen über verschiedene Datenbanken hinweg zu verbinden, müssen sie als Datenverbindungen innerhalb derselben Datenquelle und nicht als neue Datenquelle hinzugefügt werden. Datenverbindungen werden über den Link "Hinzufügen" im linken Bereich hinzugefügt. Neue Datenquellen können über das Datenmenü oder das Dropdown-Menü über das Symbol neben dem Namen der Datenquelle erstellt werden, wie in der Abbildung unten zu sehen.

Methoden zum Kombinieren von Daten

Beziehungen sind die Standardmethode zum Kombinieren von Daten in Tableau. Beziehungen sind eine dynamische, flexible Möglichkeit, Daten aus mehreren Tabellen zur Analyse zu kombinieren. Bei Bedarf können Tabellen auch verbunden oder vereinigt werden. Datenquellen können auch verschmolzen werden. Werfen wir einen Blick auf die Optionen zum Kombinieren von Daten in Tableau und einige der Situationen, in denen jede Methode nützlich ist.

 

BeziehungenLegen das Potenzial für Verknüpfungen zwischen zwei Tabellen basierend auf verknüpften Feldern fest. Sie führen keine Daten zusammen, um eine neue, feste Tabelle zu erstellen. Während der Analyse werden die relevanten Tabellen automatisch mithilfe der kontextabhängigen Verknüpfungen abgefragt, um eine benutzerdefinierte Datentabelle für diese Analyse zu generieren.

Behält die entsprechende Detailgenauigkeit bei, verliert keine Daten, behält entsprechende Aggregationen bei und verarbeitet NULL-Werte.

VerknüpfungenFühren zwei Datentabellen basierend auf einer JOIN-Klausel und dem Verknüpfungstyp zusammen, um eine neue, feste Datentabelle zu bilden. Sie werden häufig verwendet, um neue Datenspalten in derselben grundlegenden Zeilenstruktur hinzuzufügen.

Kann bei einigen Verknüpfungstypen zu Datenverlust führen, wenn Felder nicht in allen Tabellen vorhanden sind. Es kann zu einer Duplizierung von Daten führen, wenn sich Tabellen auf unterschiedlichen Detailebenen befinden.

VereinigungenFühren zwei oder mehr Datentabellen zusammen, um eine neue, feste Datentabelle zu bilden. Sie werden verwendet, um Daten über dieselbe grundlegende Spaltenstruktur anzuhängen (neue Zeilen von Daten hinzuzufügen).
MischungenFunktionieren in zwei oder mehr separaten Tableau-Datenquellen. Die Daten bleiben getrennt. Tableau fragt die Datenquellen unabhängig ab und visualisiert auf der Grundlage der für dieses Blatt festgelegten Verknüpfungsfelder die Ergebnisse zusammen in der Ansicht. Imitiert das Verhalten einer linken Verknüpfung und filtert möglicherweise Daten aus sekundären Datenquellen.

Hinweis: Es ist auch möglich, Daten mit benutzerdefinierter SQL zu kombinieren. Meistens ist es am besten, Daten direkt im Verknüpfungsbereich oder mittels Datenverschmelzung zu kombinieren. Dies ermöglicht Tableau die größte Flexibilität bei der Optimierung. In bestimmten Szenarien kann es jedoch Gründe für die Verwendung von benutzerdefinierter SQL geben. Beachten Sie, dass dies Auswirkungen auf die Leistung haben kann, da Tableau gezwungen ist, die benutzerdefinierte SQL-Anweisung wie geschrieben auszuführen.

Beziehungen

Beziehungen sind eine Methode zum Arbeiten mit Daten aus mehreren Tabellen, die auf freigegebenen Feldern –Spalten – zwischen diesen Tabellen basieren. Durch das Einrichten einer Beziehung wird Tableau darüber informiert, wie Zeilen über Tabellen hinweg verbunden werden können. Tableau enthält diese Informationen, führt die Zeilen jedoch nicht sofort zusammen. Wenn stattdessen eine Visualisierung erstellt wird, werden die an der Analyse beteiligten Felder durch die Beziehung zurückverfolgt. Zudem werden die entsprechenden Daten aus der ursprünglichen Tabelle zurückgegeben.

Da die Daten nie vollständig in einer einzigen Tabelle außerhalb des Kontexts einer Visualisierung zusammengefasst werden, sind Beziehungen nützlich, wenn sich die Daten auf unterschiedlichen Detailebenen oder Granularitäten befinden, beispielsweise wenn Sie mit Daten über den täglichen Niederschlag in einer Tabelle arbeiten müssen, aber mit stündlichen Temperaturen in einer anderen.

Tableau unterstützt Beziehungen zwischen Tabellen in derselben Datenbank und zwischen Tabellen in verschiedenen Datenbanken.

Weitere Informationen zum Kombinieren von Tabellen mithilfe von Beziehungen finden Sie unter Setzen Sie Ihre Daten in Beziehung und in diesen Tableau-Blogbeiträgen:

Verknüpfen

Das Verknüpfen ist eine Methode zum Zusammenführen von Tabellen, die über gemeinsame Felder verbunden sind. Das Ergebnis einer Datenzusammenführung mithilfe einer Verknüpfung ist eine Tabelle, die horizontal durch das Hinzufügen von Datenspalten erweitert wird.

Weitere Informationen zum Verknüpfen von Daten in Tableau finden Sie unter Verknüpfen Ihrer Daten.

Datenverschmelzung

Wenn Sie zum Zusammenführen von Daten die Datenverschmelzung nutzen, führen Sie Ihre Daten in einer so genannten primären Datenquelle mit gemeinsamen Feldern aus einer oder mehreren sekundären Datenquellen zusammen.

Die Datenverschmelzung ist nützlich, wenn Sie die Konfiguration der Datenquelle blattweise ändern müssen, wenn Sie Datenbanken kombinieren möchten, die weder Beziehungen noch Verknüpfungen zulassen,

etwa Cube-Datenquellen oder veröffentlichte Datenquellen.

Das Ergebnis einer Datenzusammenführung mithilfe einer Datenverschmelzung ist eine virtuelle Tabelle, die horizontal durch das Hinzufügen von Datenspalten erweitert wird. Die Daten aus jeder Datenquelle werden auf eine gemeinsame Ebene aggregiert, bevor sie gemeinsam in der Visualisierung angezeigt werden.

Weitere Informationen zur Funktionsweise und Anwendung der Datenverschmelzung in Tableau finden Sie unter Verschmelzen von Daten.

Gesamtverknüpfung

Beim Vereinigen handelt es sich um eine Methode zum Anhängen von Werten (Zeilen) an Tabellen. Sie können Tabellen vereinigen, wenn sie über die gleichen Spalten verfügen. Das Ergebnis einer Datenzusammenführung mithilfe einer Vereinigung ist eine virtuelle Tabelle, die über die gleichen Spalten verfügt, jedoch vertikal durch das Hinzufügen von Datenzeilen erweitert wird.

Sie können Tabellen auf folgende Weise vereinigen: manuell oder über eine Suche mit Platzhaltern. Weitere Informationen zum Vereinigen von Daten mithilfe einer dieser Methoden in Tableau finden Sie unter Vereinigen von Daten.

Vielen Dank für Ihr Feedback!Ihr Feedback wurde erfolgreich übermittelt. Vielen Dank.