Tableau Data Management

Dieser Inhalt ist Teil von Tableau Blueprint – einem Framework, mit dem Sie genauer unter die Lupe nehmen können, wie Ihr Unternehmen Daten nutzt, um mehr Nutzen daraus zu ziehen. Ihre Reise beginnt mit unserer Beurteilung(Link wird in neuem Fenster geöffnet).

 

Tableau Data Management unterstützt Sie bei der Verwaltung der Daten in Ihrer Analytics-Umgebung, damit Sie sicherstellen können, dass für Entscheidungen immer vertrauenswürdige und aktuelle Daten zur Verfügung stehen. Von der Datenvorbereitung über die Katalogerstellung bis hin zur Suche und Governance können Sie mit Tableau Data Management das Vertrauen in Ihre Daten erhöhen und so die Akzeptanz von Selfservice-Analytics beschleunigen. Tableau Data Management ist eine separat lizenzierte Sammlung von Features und Funktionen, darunter Tableau Prep Conductor und Tableau Catalog, zur Verwaltung von Tableau-Inhalten und -Datenressourcen in Tableau Server und Tableau Cloud.

Was ist Tableau Data Management?

Diese Funktion eröffnet Ihrem Unternehmen Verfahren der Daten-Governance und Datenquellen-Verwaltung, die an anderer Stelle in Tableau Blueprint erläutert werden. Der allgemeine Begriff „Datenmanagement“ ist oft in den Datenbank-, Datenanalyse- und Visualisierungs-Communities zu hören. Eine spezielle Bedeutung erhält dieser Begriff in Tableau jedoch in Verbindung mit Tableau Data Management. Dort bezeichnet er einen Satz kostenpflichtiger Add-on-Funktionen, die mit Tableau Server und Tableau Cloud verwendet werden können. Die Funktionen von Tableau Data Management sind größtenteils identisch, unabhängig davon, ob Sie Tableau Server für Windows, Linux oder Tableau Cloud verwenden (nur wenige Funktionen sind möglicherweise nur in Tableau Cloud oder Tableau Server verfügbar).

Tableau Data Management bietet eine Reihe von Tools, mit deren Hilfe Dateneigentümer und Analysten in Ihrem Unternehmen datenbezogene Inhalte und Assets in Ihrer Tableau-Umgebung verwalten können. Konkret erhalten Sie beim Kauf von Tableau Data Management drei zusätzliche Funktionssets:

  • Tableau Catalog

  • Tableau Prep Conductor

  • Virtuelle Verbindungen mit Datenrichtlinien

Tableau Catalog

Die in Tableau Data Management integrierte Funktion Tableau Catalog ermöglicht die Optimierung des Zugriffs, des Verständnisses und der Vertrauenswürdigkeit von Tableau-Datenquellen. Tableau Catalog umfasst Bereiche wie Verzweigung, Datenqualität, Suche und Folgenabschätzung. Dadurch können Dateneigentümer und Datenvisualisierer/-analysten Datenquellen in Tableau Server und Cloud besser verstehen und ihre Vertrauenswürdigkeit einschätzen. Tableau Catalog bietet Tableau-Entwicklern durch Metadatenmethoden in der Tableau REST API zusätzliche Funktionen.

Wenn Tableau Catalog zum ersten Mal aktiviert wird, werden alle zugehörigen Inhaltselemente auf Ihrer Tableau Server- oder Cloud-Site gescannt und eine verbundene Ansicht aller zusammengehörigen Objekte erstellt (in Tableau Catalog werden diese als Inhaltsmetadaten bezeichnet). Dies erweitert die Suchmöglichkeiten über reine Datenverbindungen hinaus. Dateneigentümer und Ersteller von Visualisierungen können dadurch auch Suchanfragen auf der Basis von Spalten, Datenbanken und Tabellen stellen.

Um möglichst zu verhindern, dass ein Objekt, von dem ein anderes Objekt abhängt, versehentlich geändert oder gelöscht wird (z. B. durch Umbenennen oder Entfernen einer Datenbankspalte, die für eine Produktionsarbeitsmappe von entscheidender Bedeutung ist), werden durch die Verzweigungsfunktion von Tableau Catalog die Zusammenhänge zwischen allen Inhalten auf einer Tableau-Site dargestellt, einschließlich Metriken, Schemas und virtueller Verbindungen. Dadurch können Sie die Beziehungen zwischen Objekten schon vor einer Änderung erkennen und ihre Auswirkungen feststellen.

 

Um das Vertrauen in Ihre Tableau-Datenquellen zu verbessern, bietet Tableau Catalog zusätzliche Informationen, wie z. B. erweiterte datenbezogene Objektbeschreibungen, die Ansicht Datendetails und Keyword-Tags, die die Suche flexibler gestalten. Bei der Zertifizierung von Datenquellen wird ein auffälliges Symbol neben die entsprechenden Datenquellen platziert. Dies bedeutet, dass der Datenquellen-Eigentümer oder Administrator dieser Datenquelle vertraut. Datenelemente (Datenquellen, Spalten usw.), die Verbrauchern Probleme bereiten könnten, wie z. B. überholte oder veraltete Daten, können mit Datenqualitätswarnungen gekennzeichnet werden. Zusätzlich zu einer Datenqualitätswarnung können sensible Daten individuell mit Sensitivitätskennzeichnungen versehen werden.

 

 

Tableau Prep Conductor

Wahrscheinlich haben Sie wie viele andere Tableau-Kunden bereits die Vorteile von Tableau Prep Builder entdeckt. Sie können damit komplexe „Schemas“ zur Datenvorbereitung erstellen, die mehrere Datenquellen kombinieren, Daten modellieren, Spalten anpassen und Ausgaben in einem oder mehreren gewünschten Datenformaten tätigen. Doch wie können Sie nach der Erstellung Ihres perfekten Vorbereitungsschemas dieses automatisieren, sodass es nach einem Zeitplan ausgeführt wird und Datenquellen vollständig oder inkrementell aktualisieren werden?

Genau hier kommt Tableau Prep Conductor, ein weiteres Feature von Data Management, ins Spiel. Tableau Prep Conductor ermöglicht die flexible Planung von Tableau Prep-Schemas, unabhängig davon, ob diese über Tableau Prep Builder in Ihrer Tableau Server- oder Tableau Cloud-Umgebung veröffentlicht oder direkt in einem Browser mit der Prep-Schema-Webdokumenterstellung erstellt werden. Testen Sie zunächst Ihr webbasiertes Schema (Sie können Schemas nach Bedarf ohne Data Management manuell ausführen, müssen aber Data Management erwerben, wenn Sie Schemas planen und automatisch mit Prep Conductor ausführen möchten). Vor der Planung sollten Sie das Schema vollständig ausführen und sicherstellen, dass Ihre gewünschte Ausgabedatenquelle fehlerfrei erstellt wird.

Wenn Sie Tableau Server verwenden, kann Ihr Administrator (oder Sie selbst, wenn Sie über die entsprechenden Berechtigungen verfügen) ähnlich wie bei Extraktaktualisierungen benutzerdefinierte Zeitpläne (z. B. „Täglich um Mitternacht“, „Sonntags um 12 Uhr“) erstellen, um Prep-Schemas auszuführen,.

Wenn Sie Tableau Cloud verwenden, wird standardmäßig eine Reihe vordefinierter Prep-Schemas installiert. Sie können diese nicht anpassen, noch können Sie eigene Prep-Schemas erstellen.

Die Planung der Schemaausführung erfolgt über das Aktions-Menü. Bei einem Zeitplan mit einer einzelnen Aufgabe wird nur das ausgewählte Prep-Schema nach dem von Ihnen ausgewählten Zeitplan ausgeführt. Bei einem Zeitplan mit einer verknüpften Aufgabe können Sie, falls Sie mehrere Schemas in einer bestimmten Reihenfolge „verketten“ möchten, ein oder mehrere zusätzliche Schemas auswählen, die dann nacheinander mit dem ausgewählten Schema ausgeführt werden (z. B. um eine einzige Datenquellenausgabe zu erstellen, die von einem nachfolgenden Schema als Eingabedatenquelle verwendet wird). Die Schemas werden nun zum geplanten Zeitpunkt ausgeführt und aktualisieren oder erstellen automatisch Datenquellen, die als Basis für Tableau-Arbeitsmappen dienen können.

Neben der Möglichkeit, Schemas zu planen, bieten Data Management und Tableau Prep Conductor Optionen, um den Erfolg/das Fehlschlagen geplanter Schemas zu überwachen, beim Erfolg oder Fehlschlagen von Schema-Zeitplänen Benachrichtigungen per E-Mail zu senden und Schemas programmgesteuert mit der Tableau Server/Cloud REST-API auszuführen. Darüber hinaus stehen zusätzliche Funktionen für die Verwaltungsansicht zur Verfügung, mit denen der Schema-Leistungsverlauf überwacht werden kann.

BEST-PRACTICE-EMPFEHLUNG: Wenn Sie planen, eine große Anzahl von Tableau Prep Conductor-Schemas auf Tableau Server auszuführen, müssen Sie möglicherweise die Skalierung Ihrer Serverumgebung anpassen. Die Leistung Ihres Tableau Server-Systems können Sie anpassen, indem Sie zusätzliche Knoten oder Hintergrundprozesse hinzufügen, um das erforderliche Prep-Schema-Volumen zu bewältigen.

Was ist mit Tableau Cloud? Sie müssen zwar für die Prep-Schema-Kapazität keine Änderungen an der Architektur von Tableau Cloud vornehmen, müssen jedoch für jedes Tableau Prep Conductor-Schema, das Sie gleichzeitig ausführen möchten, ein Ressourcenpaket (eine Einheit von Tableau Cloud-Rechenkapazität) erwerben. Ermitteln Sie, wie viele gleichzeitige Schemapläne Sie benötigen, und erwerben Sie entsprechend viele Tableau Cloud-Ressourcenpakete.

 

Virtuelle Verbindungen

Wir kommen zu unserer nächsten Datenmanagement-Funktion: virtuelle Verbindungen. Eine virtuelle Verbindung bietet einen zentralen Zugriffspunkt auf Daten. Damit kann auf mehrere Tabellen in mehreren Datenbanken zugegriffen werden. Mit virtuellen Verbindungen können Sie das Extrahieren der Daten und die Sicherheit an einer einzigen Stelle – auf Ebene der Verbindung – verwalten.

Wann sind virtuelle Verbindungen sinnvoll?

Üblicherweise wird eine gemeinsame Datenbankverbindung mit mehreren Arbeitsmappen in Tableau so verwendet: Sie stellen eine direkte Verbindung mit einem Datenbankserver wie SQL Server oder Snowflake her, stellen Datenbank-Anmeldeinformationen bereit, fügen eine oder mehrere Tabellen hinzu und verknüpfen sie und veröffentlichen dann die Datenquelle auf Tableau Server oder Tableau Cloud. Sie können diese Methode zwar als Direktverbindung zu Daten verwenden, doch wahrscheinlich möchten Sie Daten aus der Datenquelle extrahieren, um verbundene Arbeitsmappen zu beschleunigen.

Nehmen wir nun an, Sie führen dies mehrfach aus, um beispielsweise auch andere Tabellen oder Verknüpfungen einzubeziehen. Dies führt dazu, dass mehrere veröffentlichte (und möglicherweise extrahierte) Datenquellen für eine Reihe von Arbeitsmappen verwendet werden, die unterschiedliche Tabellen-/Verknüpfungs-Anforderungen haben, aber alle dieselbe Ausgangsdatenbank verwenden.

Sehen wir uns nun an, was passiert, wenn sich etwas an der ursprünglichen SQL Server- oder Snowflake-Datenbank ändert, auf die in diesen Datenquellen verwiesen wird – möglicherweise werden Tabellen umbenannt, zusätzliche Felder hinzugefügt oder Datenbankanmeldeinformationen geändert. In diesem Fall müssen Sie jede der zuvor erstellten Datenquellen öffnen, die erforderlichen Änderungen entsprechend der Datenbankänderung vornehmen und erneut veröffentlichen (und möglicherweise Extraktaktualisierungen neu planen).

Es ist wesentlich einfacher, nur eine „Definition“ einer Datenverbindung zu erstellen, in der der Name des Datenbankservers, die Anmeldeinformationen und Tabellenverweise gespeichert sind. Sie können dann die Daten aus dieser übergeordneten „Definition“ extrahieren. Falls Sie für unterschiedliche Kombinationen von Tabellen und Verknüpfungen unterschiedliche Datenquellen erstellen müssen, können Sie auf diese übergeordnete „Definition“ verweisen, anstatt eine direkte Verbindung zu einem oder mehreren Datenbankservern herzustellen. Sollte sich etwas an der Struktur der Kerndatenbank ändern (z. B. Tabellennamen oder Anmeldeinformationen), müssen Sie nur das übergeordnete „Definitions“-Objekt ändern. Alle abhängigen Datenquellen übernehmen automatisch diese Änderungen.

Das Feature „Data Management“ führt diese Funktion einer „geteilten Definition“ über eine virtuelle Verbindung ein. Eine virtuelle Verbindung ähnelt einer standardmäßigen Datenquellenverbindung, da auch in ihr der Datenbankserver, Anmeldeinformationen und ausgewählte Tabellen gespeichert sind. Und ebenso wie eine herkömmliche Tableau-Datenquelle kann eine virtuelle Verbindung Verbindungen zu mehr als einer Datenbank/Datenquelle enthalten (jede mit ihrem eigenen Satz an Anmeldeinformationen und Tabellen). In einer virtuellen Verbindung sind zwar einige Metadatenänderungen zulässig (z. B. das Ausblenden oder Umbenennen von Feldern), Tabellen werden in einer virtuellen Verbindung aber nicht verknüpft. Wenn Sie die virtuelle Verbindung aber als direkte Quelle für eine Arbeitsmappe oder als Verbindung für eine zusätzliche veröffentlichte Datenquelle verwenden, können Sie Tabellen verknüpfen und weitere Anpassungen an der Datenquelle vornehmen.

Nachdem eine virtuelle Verbindung erstellt und auf Tableau Server oder Tableau Cloud veröffentlicht wurde und die entsprechenden Berechtigungen festgelegt wurden, können Sie sich mit der virtuellen Verbindung wie mit jeder anderen Datenquelle in Tableau Desktop oder Tableau Server/Cloud verbinden. Sie müssen jedoch keinen Datenbankserver-Standort oder Anmeldeinformationen angeben und können sofort Tabellen verknüpfen und Daten visualisieren oder die Datenquelle veröffentlichen.

 

Datenrichtlinien

Zusätzlich zu den zuvor beschriebenen zentralisierten Datenbankverbindungsfunktionen bieten virtuelle Tableau Data Management-Verbindungen mit Datenrichtlinien auch eine optimierte zentralisierte Option für die Sicherheit auf Zeilenebene. Verwenden Sie eine Datenrichtlinie, um auf eine oder mehrere Tabellen in einer virtuellen Verbindung Sicherheit auf Zeilenebene anzuwenden. Eine Datenrichtlinie filtert die Daten und stellt sicher, dass Benutzer nur die Daten sehen, die sie sehen sollen. Datenrichtlinien gelten sowohl für Direkt- als auch für Extraktverbindungen.

Wann sind Datenrichtlinien sinnvoll?

In vielen Unternehmen ist es üblich, automatisch die in einer Visualisierung sichtbaren Daten so zu beschränken, dass der jeweilige Benutzer nur die für ihn relevanten Informationen sehen kann. Stellen Sie sich beispielsweise ein gemeinsames Dashboard vor, das ein Kreuztabellenobjekt mit Bestelldetails enthält.

  • Wenn Sie Vertriebsleiter für ein großes Gebiet sind, werden in den Details der Kreuztabelle die Bestellungen für alle Kundenbetreuer in Ihrem Gebiet angezeigt.

  • Wenn Sie jedoch Kundenbetreuer sind, werden in der Kreuztabelle nur Bestellungen für Ihre Konten dargestellt.

Damit dies funktioniert, muss in Ihrer Tableau-Umgebung Sicherheit auf Zeilenebene implementiert werden. Dazu stehen mehrere Methoden zur Verfügung, darunter:

  • Sicherheit auf Zeilenebene in der Datenbank. Jedes Mal, wenn ein Viewer eine Visualisierung anzeigen möchte, wird er aufgefordert, sich mit seinen Anmeldeinformationen bei der zugrunde liegenden Datenbank anzumelden. Seine Anmeldeinformationen können auch von seinem Tableau-Benutzerkonto übernommen werden. Der ihm angezeigte Datensatz ist auf die Daten beschränkt, die er aufgrund der von ihm eingegebenen Anmeldeinformationen sehen darf. Dies kann nicht nur mühsam sein, da jeder Viewer seine eigenen Anmeldeinformationen selbst verwalten muss, sondern die Live-Datenverbindung kann auch die Leistung beeinträchtigen, da sie die zugrunde liegende Datenbank stark belastet. Darüber hinaus könnte es sein, dass einige Optionen zur Weitergabe von Anmeldeinformationen an Live-Verbindungen bei Tableau Cloud eingeschränkt sind.

  • Tableau-Benutzerfilter. Benutzerfilter werden verwendet, wenn innerhalb einer Arbeitsmappe einzelne Arbeitsblätter erstellt werden. Einzelne Arbeitsblätter können durch die Angabe von individuellen Tableau-Benutzeranmeldeinformationen oder der Mitgliedschaft in einer oder mehreren Tableau-Benutzergruppen gefiltert werden, sodass nur für diesen Benutzer relevante Daten angezeigt werden. Dies kann arbeitsaufwändig sein, da für jedes einzelne Arbeitsblatt in einer Arbeitsmappe Benutzerfilter bereitgestellt werden müssen. Es gibt keine Möglichkeit, mithilfe nur eines einzigen Prozesses einen Benutzerfilter für eine große Gruppe von Arbeitsmappen festzulegen. Wenn außerdem einem Benutzer versehentlich Bearbeitungsberechtigungen für die Arbeitsmappe erteilt werden, kann er den Benutzerfilter problemlos aus dem Filter-Container ziehen und alle zugrunde liegenden Daten sehen, zu deren Anzeige er möglicherweise nicht berechtigt ist.

Durch die Verwendung einer Untergruppe der Tableau-Berechnungssprache können mithilfe von Datenrichtlinien komplexe Regeln festgelegt werden (eventuell durch die Verwendung einer zugehörigen „Berechtigungstabelle“ in einer Datenbank), mit denen die von der virtuellen Verbindung zurückgegebenen Daten basierend auf der Benutzer-ID oder Gruppenmitgliedschaft angepasst und eingeschränkt werden. Dadurch bleibt die Sicherheit auf Zeilenebene in der Datenquelle bewahrt (alle mit der Datenquelle verbundenen Arbeitsmappen erben automatisch die Sicherheit und übernehmen alle Änderungen, die innerhalb der virtuellen Verbindung vorgenommen werden). Darüber hinaus wird eine zusätzliche Sicherheitsebene eingezogen, indem alle Änderungen der Datenrichtlinien auf Personen beschränkt werden, die Bearbeitungsberechtigungen für die ursprüngliche virtuelle Verbindung besitzen.

 

 

Vielen Dank für Ihr Feedback!Ihr Feedback wurde erfolgreich übermittelt. Vielen Dank.