Grundlegendes zu Salesforce- und Data Cloud-Begriffen

Da für Tableau Next und Tableau(Link wird in neuem Fenster geöffnet) immer stärkere Integrationen entwickelt werden, fügen wir die Möglichkeit hinzu, Analysen dort durchzuführen, wo Sie möchten, unabhängig davon, wo sich Ihre Daten befinden. Das bedeutet, dass die Terminologie und die Philosophien von Tableau und Data Cloud immer mehr miteinander in Berührung kommen. Benutzer, die mit dem einen Ökosystem vertraut sind, mögen das andere Ökosystem verwirrend oder fremd finden, aber am Ende des Tages geht es überall nur um Daten.

Dieses Thema soll Benutzern die Orientierung erleichtern, unabhängig davon, an welches System sie gewöhnt sind oder in welchem sie arbeiten.

Grundlegende Datenbegriffe und -konzepte

Es gibt viele Worte, um Daten zu beschreiben. Im allgemeinsten Sinne ist ein Datensatz die Sammlung von Daten, mit denen Sie arbeiten.

  • Eine Datenbank ist die Technologieplattform, auf der die Daten gespeichert werden, z. B. Amazon Redshift, Firebird, Google Sheets oder Oracle.
  • Daten werden häufig als Datentabelle gespeichert. In einer Datenbank können mehrere Tabellen oder Ansichten vorhanden sein. In Excel oder Google Tabellen ist jede Blattregisterkarte eine Tabelle. In einer CSV-Datei ist die gesamte Datei die Tabelle.
  • Wenn die benötigten Daten auf mehrere Tabellen verteilt sind, müssen sie in einem Datenmodell verbunden werden. Ein Datenmodell ist die abstrakte Darstellung dessen, wie Tabellen miteinander verbunden sind.

Daten in Salesforce

In Data Cloud werden Daten in verschiedene Konzepte unterteilt.

DatentypBeschreibung
Datenstrom(Link wird in neuem Fenster geöffnet)

Diese Verbindungsinformationen – wie z. B. die Originalquelle (S3, Amazon, SF, Google BigQuery usw.) – sowie die Angabe, welche Felder eingebracht werden, welches Feld der primäre Schlüssel ist, wie oft die Daten aktualisiert werden usw.

Data-Lake-Objekt (DLO)(Link wird in neuem Fenster geöffnet)

Daten, die in Data Cloud aufgenommen oder von einem externen System wie Snowflake referenziert werden, werden in einem DLO gespeichert. Die in einem DLO gespeicherten Daten werden bereinigt, umgewandelt und für die Berechnung und Analyse vorbereitet.

Jede Datentabelle ist ein eigenes DLO.

Datenmodellobjekt (DMO)(Link wird in neuem Fenster geöffnet)

Ein Data Cloud-Objekt, das die Struktur und das Schema der in einem oder mehreren Data-Lake-Objekten gespeicherten Daten beschreibt. Bei einem DMO handelt es sich um eine Datentabelle, die jedoch aus einem oder mehreren DLOs stammen kann. Das DMO nimmt die DLO-Daten und ordnet sie in einem zuverlässigen Format zu. Identitätsauflösungsregeln und andere Formatierungen mit Vorlagen werden im DMO angewendet. Es gibt Standard- und benutzerdefinierte DMOs.

Die Datenzuordnung(Link wird in neuem Fenster geöffnet) von einem DLO zu einem DMO und der vorlagenbasierte Charakter der meisten DMOs sind es, was die Harmonisierungskraft von Data Cloud ausmacht.

Berechnetes Erkenntnisobjekt (Calculated insight object, CIO)(Link wird in neuem Fenster geöffnet)Ein Datenmodellobjekt, das nach der Verarbeitung einer berechneten Erkenntnis erstellt wurde. Berechnete Erkenntnisse helfen beim Erstellen von Metriken im Cube-Stil mit Kennzahlen und Dimensionen auf Data Cloud-Daten. Sie können eine Verbindung zu einem vorhandenen CIO in Data Cloud herstellen und es als Datenobjekt in Ihrem Arbeitsbereich hinzufügen.
Durch Komma getrennte Werte (Comma-separated values, CSV)(Link wird in neuem Fenster geöffnet)

Eine Textdatei, die Daten in einem tabellenähnlichen Format speichert. CSV-Dateien werden normalerweise verwendet, um Daten zwischen Anwendungen und Programmen zu verschieben.

Für Tableau Next: Eine CSV-Datei kann in einen Tableau Next-Arbeitsbereich eingebracht werden, und die Daten können hochgeladen und in Data Cloud als DLO (Data-Lake-Objekt) gespeichert werden.

Eine Randbemerkung zu Salesforce-Datenobjekten für das Tableau-Publikum

Der Datenstrom sind die Verbindungsinformationen.

Das DLO ist das Rohdump von Daten aus dem Datenstrom. Jedes DLO ist eine einzelne Tabelle.

Ein DMO hat keine direkte Entsprechung in Tableau. Ein DMO kann aus mehreren DLOs zugeordnet werden (ähnlich wie eine „Ansicht“ in einer Datenbank), und jedes DMO ist eine einzelne Tabelle.

Für ein CIO gibt es in Tableau keine Entsprechung. Berechnungen sind dort einfach Felder in der Datenquelle wie alle anderen.

Daten in Tableau

Eine Tableau-Datenquelle(Link wird in neuem Fenster geöffnet) enthält Datenbankverbindungsinformationen, das Datenmodell, Informationen darüber, wie auf die Daten zugegriffen wird (Zugriffsdaten usw.) oder sie aktualisiert werden, semantische Informationen und möglicherweise sogar die Daten selbst. Die beiden wichtigsten UI-Elemente zum Erstellen und Bearbeiten einer Datenquelle sind die Registerkarte „Datenquelle“ und der Bereich „Daten“.

Registerkarte „Datenquelle“: Auf der Registerkarte „Datenquelle“ werden die Datenverbindungen zu der zugrunde liegenden Datenbank oder den zugrunde liegenden Dateien hergestellt. Das Datenmodell wird erstellt, indem Tabellen aus einer oder mehreren Datenbanken mithilfe von Beziehungen, Verknüpfungen und Vereinigungen(Link wird in neuem Fenster geöffnet) zu einer einzelnen Datenquelle kombiniert werden. Wenn die Daten in der ursprünglichen Datenbank verbleiben, handelt es sich um eine Direktverbindung. Eine Kopie der Daten kann auch als Extrakt in Tableau selbst eingebracht und bei Bedarf aktualisiert werden.

Datenbereich: Im Datenbereich werden semantische Informationen erfasst, darunter Feldnamen, Elementaliasse, Hierarchien, Gruppen, Sätze, Berechnungen, Standardaggregationen und -farben sowie Feldbeschreibungen.

Datenquelle: Die auf der Registerkarte „Datenquelle“ und im Datenbereich vorgenommenen Änderungen bilden zusammen die Datenquelle. Eine Datenquelle kann ein veröffentlichtes Asset oder eine Datei sein, oder sie ist in der Arbeitsmappe enthalten, in der sie erstellt wurde.

  • Eine veröffentlichte Datenquelle (published data source, PDS) ist ein eigenständiges Asset in Tableau Cloud oder Tableau Server.
  • Lokal können Sie auch über dateibasierte Versionen einer Tableau-Datenquelle verfügen:
    • .tds ist die Dateierweiterung für eine Tableau-Datenquelle, die die Nicht-Dateninformationen enthält (nur Verbindung und Semantik).
    • .tdsx ist die Dateierweiterung für ein gepacktes Tableau-Datenquellenpaket, das sowohl die Nicht-Daten-Informationen als auch die Daten selbst enthält.
    • .hyper ist die Dateierweiterung für einen Extrakt (früher .tde), der eine Kopie der Daten (die Daten selbst) enthält.

Hinweis: Eine veröffentlichte Datenquelle ist das nächstliegende Äquivalent von Tableau zu einer semantischen Ebene oder einem semantischen Modell.

Eine Randbemerkung zu Tableau-Daten für die Salesforce-Zielgruppe

Tableau arbeitet mit Daten aus einer Vielzahl von Datenbanken und Technologien, sowohl lokal als auch cloudbasiert. Da die Daten nicht aus einer Salesforce-Cloud mit all den spezifischen Datenobjekten stammen, die dies impliziert, gibt es eine große Flexibilität dabei, wie die Daten modelliert und formatiert werden, und kein wirkliches Konzept für vorgefertigte Datenformate.

Standardisierungs- und semantische Modelle werden meist mit veröffentlichten Datenquellen (PDS) erfasst.

Grundlagen der Datensemantik

  • Daten sind die rohen Fakten (Zahlen, Beobachtungen und Messungen).
  • Information ist die Interpretation dieser Daten oder das Wissen, das durch die Verarbeitung und das Verständnis der Daten entsteht.
  • Die Semantik ist das Sprungbrett zwischen den zugrunde liegenden Daten und den daraus resultierenden Informationen.

Der Begriff leitet sich vom linguistischen Konzept der Semantik vs. Syntax ab. Syntax ist die Art und Weise, wie Sie etwas sagen, Semantik ist das, was es bedeutet. Dieses Konzept Semantik ist, was es bedeutet wird bis hin zur Semantik im Kontext von Daten durchgesetzt. Die Semantik umfasst Dinge wie die Kombination von Tabellen im Datenmodell, Informationen zu den Feldern oder Spalten mit Daten und wie sie möglicherweise miteinander interagieren, zusätzliche Informationen wie die Standardaggregation und Berechnungen, die zusätzlich zu den Rohdaten durchgeführt werden.

Ein Datensatz enthält möglicherweise alle Informationen, die Sie benötigen, aber wenn Sie nicht herausfinden können, wie Sie ihm einen Sinn verleihen können, ist er nutzlos(Link wird in neuem Fenster geöffnet). Semantik ist erforderlich, um nützlich zu sein.

Der geschäftliche Anwendungsfall lâsst sich nicht von den Details der Semantik trennen. Semantik ist die Beschreibung der Daten oder ihres Geschäftskontextes. Die Semantik kann in Kategorien unterteilt werden wie Datenmodellierung; Feldmetadaten und -beschreibungen; Standardaggregationen; Hierarchien, Gruppen und Sätze; und Berechnungen.

Einige Beispiele:

  • Datenmodellierung
    • Wie die Datentabellen miteinander verbunden werden könnten. Sollen die vier Quartalstabellen „Umsatz“ vereinigt werden? Soll die Tabelle „Ärzte“ direkt mit der Tabelle „Patienten“ verknüpft sein, oder sollten beide mit der Tabelle „Termine“ verknüpft sein?
  • Feldmetadaten (Feldname, Datentyp, Aliasse der Mitglieder)
    • Ist Name der Name einer Firma oder eines Kontakts?
    • Ist Rabatt ein boolesches Feld, das angibt, ob ein Rabatt angewendet wird, ein Zeichenfolgenfeld des Rabatttyps oder eine diskrete Kennzahl für den Rabattbetrag?
  • Feldbeschreibungen
    • Zum Beispiel ein Kommentar für eine mehrdeutige Abkürzung wie das englische APR, um anzugeben, dass es für diesen Datensatz nicht um die jährliche prozentuale Rendite geht, sondern um „Bereinigte Pitching-Runs“, und dass diese wie folgt berechnet werden: APR = L * IP - R / pf(P). Dabei ist L: Durchschnittliche Anzahl der Runs pro geworfenem Inning in der Liga, IP: Geworfene Innings, R: Erlaubte Runs, pf(P): Parkfaktor für den Heimpark P des Spielers.
  • Standardaggregationen
    • Sollen Angebote als COUNT (Zählung jeder Instanz) oder COUNTD (jeder Wert wird nur einmal gezählt) aggregiert werden?
    • Soll die Standardaggregation einer Kennzahl SUM oder AVG sein?
  • Hierarchien, Sätze, Gruppen
    • In einer Sammlung von Fachbereichen an einer Universität kann die technische Fakultät eine eigene Hochschule sein, während die Fachbereiche Geschichte, Literatur, Philosophie und Politikwissenschaft alle die Fakultät für Geisteswissenschaften bilden können.
  • Berechnungen
    • Felder, die aus Feldern abgeleitet sind, die nativ in den Daten vorhanden sind, aber bearbeitet oder kombiniert werden müssen, z. B. die Definition eines veralteten Supportfalls: Für ein Standardkonto kann es sein, dass ein Supportfall als veraltet gilt, wenn er seit 10 Tagen offen ist, für ein Premiumkonto hingegen bereits nach 2 Tagen.

Semantik in Tableau und Tableau Semantics

Ohne eine wiederverwendbare semantische Ebene kann es sein, dass Datenmodelle, semantische Definitionen und berechnete Felder immer wieder als einmalige Dinge erstellt werden, was zu Ineffizienzen und dem Potenzial für Fehler oder Fehlausrichtungen führt.

Semantik in Tableau

Semantik ist für die Zielgruppe von Tableau nichts Neues. Sie war einfach ein Teil der Datenquelle – insbesondere einer veröffentlichten Datenquelle (PDS). In der veröffentlichten Datenquelle steuern Sie die semantischen Definitionen Ihrer Daten.

Aufgrund der Tableau-Philosophie des Zyklus der visuellen Analytik(Link wird in neuem Fenster geöffnet)wurde die Semantik in der Vergangenheit nicht in eine separate Ebene abstrahiert. Die Erstellungsumgebung ist der Ort, an dem das Datenmodell (auf der Registerkarte „Datenquelle“) und die Semantik (im Datenbereich) zusammen entwickelt werden.

Tableau Semantics

Tableau Semantics(Link wird in neuem Fenster geöffnet) verfolgt den Ansatz, die Semantik in eine eigene, von der Analyseebene getrennte Ebene zu verlegen, sodass semantische Modelle einmal erstellt und für eine Vielzahl von Analysen oder sogar Produkten verwendet werden können. Tableau Semantics fügt sich als eigenständige semantische Ebene, die von den Daten oder Analysen getrennt ist, in die Data Cloud- und Tableau Next-Umgebungen ein. Die Einheit einer semantischen Ebene ist ein semantisches Modell. Das semantische Modell enthält sowohl das Datenmodell als auch semantische Definitionen für die Daten. In Tableau Semantics dient der Semantic Model Builder als Benutzeroberfläche zum Erstellen eines semantischen Modells. Diese semantischen Modelle können in Data Cloud oder Tableau Next erstellt werden.

Und mit dem Tableau Semantics-Connector für Tableau können Sie Analysen in Tableau unter Verwendung eines semantischen Modells von Tableau Next durchführen.

Vielen Dank für Ihr Feedback!Ihr Feedback wurde erfolgreich übermittelt. Vielen Dank.