Amazon S3

In dit artikel wordt beschreven hoe u Tableau met de Amazon S3-connector zonder stuurprogramma verbind en de databron instelt.

Voordat u begint

Verzamel de volgende verbindingsgegevens voordat u begint:

  • De AWS-regio van uw S3-bucket.

  • De naam van de S3-bucket.

  • Uw AWS IAM-toegangssleutel voor uw S3-bucket (sleutel-ID en geheime toegangssleutel).

Machtigingen

Zorg ervoor dat uw AWS IAM-gebruiker leesrechten heeft voor uw S3-bucket.

Aanbevelingen

De volgende aanbevelingen kunnen helpen de prestaties te verbeteren.

  • Optimale prestaties worden behaald als de client in een AWS-omgeving draait (bijvoorbeeld Tableau Desktop of Server is geïnstalleerd in een EC2-instantie of wordt met Tableau Cloud gebruikt).
  • Ondersteuning voor cross-regionale buckets werkt, maar de prestaties zijn slechter dan bij toegang in dezelfde regio. Er kunnen extra kosten in rekening worden gebracht vanwege kosten voor dataverkeer.

Verbinding maken en de databron instellen

  1. Start Tableau en selecteer onder onder Verbinding maken de optie Amazon S3 in de lijst met Aanvullende connectors.
  2. Selecteer Installeren en Tableau opnieuw opstarten om de connector te installeren.
  3. Ga nadat Tableau opnieuw is opgestart naar Verbinding maken en selecteer Amazon S3 uit de lijst met geïnstalleerde connectors.
  4. Voer de bucketregio, bucketnaam, toegangssleutel-ID en geheime toegangssleutel in.
  5. Selecteer Aanmelden.
  6. Selecteer in de inhoud van uw bucket het bestand waarmee u verbinding wilt maken.
  7. Selecteer Verbinding maken.

De databron instellen

Voer de volgende stappen uit om de databron in te stellen.

  1. Optioneel: selecteer de naam van de standaarddatabron bovenaan de pagina.
  2. Voer een unieke naam voor de databron in voor gebruik in Tableau.
  3. Sleep een of meer bestanden waarmee u verbinding wilt maken vanuit het linkerdeelvenster naar het canvas.
  4. Selecteer het tabblad in blad 1 om de analyse te starten.

Uw data verenigen

U kunt bestanden uit de S3-bucket verenigen. Zie Uw data verenigen voor meer informatie over vereniging. Om een patroongebaseerde vereniging uit te voeren die bestanden in submappen meeneemt, moet de hoofdmap of bucket ten minste één bestand bevatten dat overeenkomt met de structuur van de bestanden in de submappen. Dit bestand is het eerste bestand waarmee u verbinding maakt bij het maken van de vereniging.

Bekende problemen en beperkingen

In de volgende secties worden bekende problemen en beperkingen beschreven die van invloed kunnen zijn op een behoorlijke werking van de Amazon S3-connector.

Opmerking: Deze connector wordt momenteel niet ondersteund door Tableau Prep-webauthoring of virtuele verbindingen.

Bekende problemen en beperkingen met verificatie
  • Alleen verificatie met de geheime sleutel/toegangssleutel van Amazon IAM zonder sessietoken wordt ondersteund.

Bekende problemen en beperkingen bij het publiceren
  • Werkmappen en databronnen moeten worden gepubliceerd met behulp van de authenticatieoptie 'Ingesloten wachtwoord'. 'Gebruiker vragen' wordt momenteel niet ondersteund.

Bekende problemen en beperkingen bij het verenigen
  • Alleen Tableau Desktop ondersteunt een patroongebaseerde vereniging.
  • Webauthoring ondersteunt alleen handmatig verenigen door de gebruiker (het slepen van bestanden).
Bekende problemen en beperkingen met bestandstypen
  • Op dit moment worden Parquet-,. csv-, gecomprimeerde .gz- en Excel-bestanden ondersteund.
  • Alle data worden standaard geïmporteerd als tekenreeks.
  • U kunt niet meerdere bestandstypen verenigen tot één verbinding of er een join van maken (bijvoorbeeld Parquet en. csv samen).
  • Momenteel worden alleen door komma's gescheiden. csv-bestanden ondersteund.
  • De maximale bestandsgrootte is 15 GB.
  • De cumulatieve resultatenset van een join of union mag niet groter zijn dan 15 GB.
  • Excel-bestanden mogen momenteel niet groter zijn dan ~100 MB vanwege prestatieproblemen met de Excel-bestandsparser in de connector.
Andere bekende problemen en imitaties met Parquet-bestanden
  • Parquet-bestanden moeten in het formaat zijn dat in onze Hyper API-documentatie (in het Engels) wordt beschreven.
  • Geneste kolommen (en dus ook de geneste typen MAP en LIST) worden niet ondersteund.
  • De typen BSON, UUID en ENUM worden niet ondersteund.
  • Het fysieke type FIXED_LEN_BYTE_ARRAY zonder logisch of geconverteerd type wordt niet ondersteund.
  • Het type DECIMAL wordt alleen ondersteund tot 8 bytes (18 decimale cijfers). Overweeg om het dubbele te gebruiken als u meer dan 18 decimalen nodig hebt.
  • De typen TIME_MILLIS en TIME_NANOS worden niet ondersteund. Overweeg om in plaats daarvan TIME_MICROS te gebruiken.
  • De verouderde BIT_PACKED-codering wordt niet ondersteund. Geen enkel recent Parquet-bestand mag deze codering gebruiken, aangezien deze al meer dan vijf jaar verouderd is.
  • De DELTA_LENGTH_BYTE_ARRAY-codering en de recente BYTE_STREAM_SPLIT-codering worden niet ondersteund, omdat ze door geen enkele bibliotheek zijn geschreven. Als u Parquet-bestanden tegenkomt die deze coderingen gebruiken, laat het ons dan weten.
  • Ondersteunde compressies zijn SNAPPY, GZIP, ZSTD en LZ4_RAW.

Zie ook