Amazon S3

In diesem Artikel wird beschrieben, wie Tableau mit dem treiberlosen Amazon S3-Connector verbunden und die Datenquelle eingerichtet wird.

Voraussetzungen

Bevor Sie beginnen, benötigen Sie die folgenden Verbindungsinformationen:

  • Die AWS-Region Ihres S3-Buckets

  • Den Namen des S3-Buckets.

  • Ihren AWS-IAM-Zugangsschlüssel für Ihren S3-Bucket (Schlüssel-ID und geheimer Zugangsschlüssel).

Berechtigungen

Stellen Sie sicher, dass Ihr AWS-IAM-Benutzer oder Ihre AWS-IAM-Rolle über Leseberechtigungen für Ihren S3-Bucket verfügt.

Empfehlungen

Die folgenden Empfehlungen können helfen, die Leistungsfähigkeit zu steigern.

  • Eine optimale Leistung wird erzielt, wenn der Client in einer AWS-Umgebung ausgeführt wird (z. B. Tableau Desktop oder Server, installiert in einer EC2-Instanz oder unter Verwendung von Tableau Cloud).
  • Die regionsübergreifende Bucket-Unterstützung funktioniert, aber die Leistung ist schlechter als beim Zugriff über dieselbe Region. Aufgrund der Gebühren für den Datenausgang können zusätzliche Kosten anfallen.

Herstellen der Verbindung und Einrichten der Datenquelle

  1. Starten Sie Tableau und wählen Sie unter Verbinden die Option Amazon S3 (Beta) aus der Liste der zusätzlichen Connectoren.
  2. Wählen Sie Installieren und Tableau neu starten aus, um den Connector zu installieren.
  3. Gehen Sie nach dem Neustart von Tableau zu Verbinden und wählen Sie Amazon S3 (Beta) aus der Liste der installierten Connectoren aus.
  4. Geben Sie Ihre Bucket-Region, Ihren Bucket-Namen, Ihre Zugangsschlüssel-ID und Ihren geheimen Zugangsschlüssel ein.
  5. Wählen Sie Anmelden aus.
  6. Wählen Sie im Inhalt Ihres Buckets eine Datei aus, mit der Sie eine Verbindung herstellen möchten.
  7. Wählen Sie Verbinden aus.

Einrichten der Datenquelle

Führen Sie die folgenden Schritte aus, um eine Datenquelle einzurichten.

  1. (Optional) Wählen Sie oben auf der Seite den Namen der Standarddatenquelle aus.
  2. Geben Sie einen eindeutigen Datenquellennamen zur Verwendung in Tableau ein.
  3. Ziehen Sie aus dem linken Bereich eine oder mehrere Dateien, mit denen Sie eine Verbindung herstellen möchten, in den Arbeitsbereich.
  4. Um Ihre Analyse zu starten, wählen Sie die Registerkarte "Blatt 1" aus.

Vereinigen von Daten

Sie können Dateien aus Ihrem S3-Bucket zusammenführen. Weitere Informationen zur Vereinigung finden Sie unter Vereinigen von Daten. Um eine Platzhaltervereinigung durchzuführen, bei der Dateien in Unterordnern eingeschlossen werden, muss der Stammordner oder Bucket mindestens eine Datei enthalten, die der Struktur der in den Unterordnern enthaltenen Dateien entspricht und in die Vereinigung einbezogen werden soll. Diese Datei ist die erste Datei, mit der Sie beim Erstellen der Vereinigung eine Verbindung herstellen.

Bekannte Probleme und Einschränkungen

In den folgenden Abschnitten werden bekannte Probleme und Einschränkungen beschrieben, die sich auf Ihren Erfolg bei der Verwendung des Amazon S3-Connectors auswirken können.

Hinweis: Dieser Connector wird derzeit in der Tableau Prep-Webdokumenterstellung und in virtuellen Verbindungen nicht unterstützt.

Bekannte Probleme und Einschränkungen bei der Authentifizierung
  • Es wird nur die Authentifizierung mit dem geheimen Schlüssel/Zugangsschlüssel des Amazon-IAM-Benutzers ohne Sitzungstoken unterstützt

Bekannte Probleme und Einschränkungen bei der Veröffentlichung
  • Arbeitsmappen und Datenquellen müssen mit der Authentifizierungsoption "Eingebettetes Kennwort" veröffentlicht werden. "Benutzer auffordern" wird derzeit nicht unterstützt.

Bekannte Probleme und Einschränkungen bei der Vereinigung
  • Nur Tableau Desktop unterstützt eine Platzhaltervereinigung.
  • Die Webdokumenterstellung unterstützt nur die benutzerdefinierte manuelle Vereinigung (Ziehen von Dateien).
Bekannte Probleme und Einschränkungen des Dateityps
  • CSV-Dateien müssen UTF-8-kodiert sein.
  • Derzeit werden Parquet-, CSV-, komprimierte .gz- und Excel-Dateien unterstützt
  • Es ist nicht möglich, mehrere Dateitypen in einer einzigen Verbindung zu vereinen oder zu verbinden (z. B. Parquet- gemeinsam mit CSV-Dateien).
  • Derzeit werden nur durch Kommas getrennte CSV-Dateien unterstützt.
  • Die kumulative Abfrage- und Dateigrößenbeschränkung beträgt 15 GB.
  • Aufgrund von Leistungsproblemen beim Excel-Dateiparser im Connector dürfen Excel-Dateien derzeit eine Größe von ca. 100 MB nicht überschreiten.
Weitere bekannte Probleme und Einschränkungen bei Parquet-Dateien
  • Parquet-Dateien müssen in dem in unserer Hyper-API-Dokumentation beschriebenen Format vorliegen.
  • Verschachtelte Spalten und daher die verschachtelten Typen MAP und LIST werden nicht unterstützt.
  • Die Typen BSON, UUID und ENUM werden nicht unterstützt.
  • Der physische Typ FIXED_LEN_BYTE_ARRAY ohne logischen oder konvertierten Typ wird nicht unterstützt.
  • Der Typ DECIMAL wird nur bis zu 8 Byte (18 Dezimalstellen) unterstützt. Wenn Sie mehr als 18 Dezimalstellen benötigen, ist die Verwendung des doppelten Werts zu empfehlen.
  • Die Typen TIME_MILLIS und TIME_NANOS werden nicht unterstützt. Erwägen Sie stattdessen die Verwendung von TIME_MICROS.
  • Die veraltete BIT_PACKED-Codierung wird nicht unterstützt. Neuere Parquet-Dateien sollten diese Kodierung nicht verwenden, da sie seit über fünf Jahren eingestellt ist.
  • Die DELTA_LENGTH_BYTE_ARRAY-Codierung und die aktuelle BYTE_STREAM_SPLIT-Codierung werden nicht unterstützt, da sie von keiner Bibliothek geschrieben werden. Wenn Sie auf Parquet-Dateien stoßen, die diese Codierungen verwenden, teilen Sie uns dies bitte mit.
  • Unterstützte Komprimierungen sind SNAPPY, GZIP, ZSTD und LZ4_RAW.

Siehe auch

Vielen Dank für Ihr Feedback!Ihr Feedback wurde erfolgreich übermittelt. Vielen Dank.