Spark SQL

In diesem Artikel werden das Herstellen einer Verbindung zwischen Tableau und einer Spark SQL-Datenbank und das Einrichten der Datenquelle beschrieben. Tableau kann eine Verbindung zu Spark Version 1.2.1 und höher herstellen.

Sie können den Spark SQL-Connector zum Herstellen einer Verbindung zu einem Spark-Cluster auf Azure HDInsight, Azure Data Lake, Databricks oder Apache Spark verwenden.

Voraussetzungen

Stellen Sie zunächst diese Verbindungsinformationen zusammen:

  • Name des Servers, auf dem die Datenbank gehostet wird, zu der Sie eine Verbindung herstellen möchten, und die Portnummer
  • Authentifizierungsmethode:
    • Keine Authentifizierung
    • Kerberos
    • Benutzername
    • Benutzername und Kennwort
    • Microsoft Azure HDInsight Service
  • Transport. Ihre Auswahloptionen sind abhängig von der ausgewählten Authentifizierungsmethode und umfassen Folgendes:
    • Binär
    • SASL
    • HTTP
  • Anmeldeinformationen: Ihre Auswahloptionen sind abhängig von der ausgewählten Authentifizierungsmethode und können Folgendes umfassen:
    • Benutzername
    • Kennwort
    • Bereich
    • Host-FQDN
    • Dienstname
    • HTTP-Pfad
  • Soll eine Verbindung zu einem SSL-Server hergestellt werden?
  • (Optional) Anfängliche SQL-Anweisung, die bei jeder Verbindungsherstellung von Tableau ausgeführt wird

Treiber erforderlich

Damit dieser Connector mit der Datenbank kommunizieren kann, wird ein Treiber benötigt. Möglicherweise ist der erforderliche Treiber bereits auf Ihrem Computer installiert. Wenn der Treiber nicht auf Ihrem Computer installiert ist, wird in Tableau eine Meldung im Verbindungsdialogfeld angezeigt, die einen Link zu der Seite Treiber herunterladen(Link wird in neuem Fenster geöffnet) enthält. Dort finden Sie Treiber-Links und Installationsanweisungen.

Herstellen der Verbindung und Einrichten der Datenquelle

  1. Starten Sie Tableau, und wählen Sie unter Verbinden die Option Spark SQL aus. Eine umfassende Liste der Datenverbindungen wird angezeigt, wenn Sie unter Mit einem Server die Option Mehr auswählen. Gehen Sie dann wie folgt vor:

    1. Geben Sie den Namen des Host-Servers der Datenbank und die zu verwendende Portnummer ein.
    2. Stellen Sie über den SparkThriftServer eine Verbindung zur Datenbank her. Beachten Sie, dass Ihnen die alten SharkServer- und SharkServer2-Verbindungen zur Verfügung stehen, jedoch nicht von Tableau unterstützt werden.
    3. Wählen Sie die Methode zur Authentifizierung aus. Geben Sie dann basierend auf Ihrer ausgewählten Option die Informationen ein, die von Ihnen angefordert werden.

      Falls der Server kennwortgeschützt ist und Sie sich in keiner Kerberos-Umgebung befinden, müssen Sie Ihren Benutzernamen und das Kennwort eingeben.

    4. (Optional) Wählen Sie SQL-Anfangsdaten aus, um einen SQL-Befehl festzulegen, der zu Beginn jeder Verbindung ausgeführt wird, z. B. wenn Sie eine Arbeitsmappe öffnen, einen Extrakt aktualisieren, sich bei Tableau Server anmelden oder Inhalte in Tableau Server veröffentlichen. Weitere Informationen finden Sie unter Ausführen der SQL-Anfangsdaten.
    5. Wählen Sie Anmelden aus.

      Wenn Tableau keine Verbindung herstellen kann, überprüfen Sie die Richtigkeit Ihrer Anmeldeinformationen. Falls Sie weiterhin keine Verbindung herstellen können, kann der Computer den Server nicht finden. Wenden Sie sich an Ihren Netzwerkadministrator oder Datenbankadministrator.

  2. Gehen Sie auf der Datenquellenseite wie folgt vor: 

    1. (Optional) Wählen Sie den Standard-Datenquellennamen oben auf der Seite aus, und geben Sie dann einen eindeutigen Datenquellennamen für die Verwendung in Tableau ein. Beispielsweise können Sie eine Benennungskonvention für die Datenquelle verwenden, die anderen Benutzern hilft, daraus abzuleiten, welche Datenquelle verbunden werden soll.

    2. Wählen Sie das Symbol für die Suche aus der Dropdown-Liste Schema aus, oder geben Sie den Namen des Schemas in das Textfeld ein, wählen Sie das Symbol für die Suche aus, und wählen Sie dann das Schema aus.
    3. Wählen Sie im Textfeld Tabelle das Suchsymbol aus, oder geben Sie den Tabellennamen ein, und wählen Sie dann das Suchsymbol aus. Ziehen Sie anschließend die Tabelle in den Arbeitsbereich, und wählen Sie die Blattregisterkarte aus, um mit der Analyse zu beginnen.

      Verwenden Sie benutzerdefinierte SQL, um eine Verbindung zu einer bestimmten Abfrage herzustellen anstatt zur gesamten Datenquelle. Weitere Informationen finden Sie unter Herstellen einer Verbindung zu einer benutzerdefinierten SQL-Abfrage.

Hinweis: Ab 2018.3 unterstützt die Kerberos-Authentifizierung für Spark SQL die Delegation. In 2018.2 und früher wird die Delegation nicht unterstützt, was bedeutet, dass Sie die Anmeldeinformationen der anzeigenden Person als Authentifizierungsmethode nicht verwenden können, wenn Sie eine Arbeitsmappe oder Datenquelle in Tableau Server veröffentlichen. Sie können nur Server ausführen als Konto verwenden.

Anmelden bei einem Mac

Wenn Sie Tableau Desktop auf einem Mac verwenden, geben Sie einen vollständig qualifizierten Domänennamen (beispielsweise "mydb.test.ourdomain.lan") anstelle eines relativen Domänennamens (beispielsweise "mydb" oder "mydb.test") ein.

Alternativ können Sie die Domäne der Liste der Suchdomänen für den Mac-Computer hinzufügen, sodass Sie zur Herstellung einer Verbindung nur den Servernamen angeben müssen. Zum Aktualisieren der Liste der Suchdomänen gehen Sie zu System-Voreinstellungen > Netzwerk > Erweitert, und öffnen Sie dann die Registerkarte DNS.

 

Siehe auch

Vielen Dank für Ihr Feedback!