Amazon S3

Cet article décrit comment connecter Tableau au connecteur Amazon S3 sans pilote et configurer la source de données.

Avant de commencer

Avant de démarrer, rassemblez les informations de connexion suivantes :

  • La région AWS de votre compartiment S3.

  • Le nom du compartiment S3.

  • Votre clé d’accès AWS IAM pour votre compartiment S3 (ID de clé et clé d’accès secrète).

Autorisations

Assurez-vous que votre utilisateur AWS IAM dispose d’autorisations de lecture pour votre compartiment S3.

Recommandations

Les recommandations suivantes peuvent aider à augmenter les performances.

  • Des performances optimales sont atteintes si le client s’exécute dans un environnement AWS (par exemple, Tableau Desktop ou Server installé dans une instance EC2 ou à l’aide de Tableau Cloud).
  • La prise en charge des compartiments interrégionaux fonctionne, mais les performances seront inférieures à celles de l’accès à la même région. Il peut y avoir des frais supplémentaires en raison des frais de sortie de données.

Établir la connexion et configurer la source des données

  1. Démarrez Tableau et sous Connexion, sélectionnez Amazon S3 dans la liste Connecteurs supplémentaires.
  2. Sélectionnez Installer et redémarrer Tableau pour installer le connecteur.
  3. Après le redémarrage de Tableau, accédez à Connexion, puis sélectionnez Amazon S3 dans la liste des connecteurs installés.
  4. Entrez votre région de compartiment, le nom du compartiment, l’ID de clé d’accès et la clé d’accès secrète.
  5. Sélectionnez Connexion.
  6. Dans le contenu de votre compartiment, sélectionnez un fichier auquel vous souhaitez vous connecter.
  7. Sélectionnez Connexion.

Configurer la source de données

Appliquez la procédure suivante pour configurer la source de données.

  1. (Facultatif) Sélectionnez le nom de la source de données par défaut en haut de la page.
  2. Entrez un nom de source de données unique à utiliser dans Tableau.
  3. Faites glisser un ou plusieurs fichiers auxquels vous souhaitez vous connecter depuis le volet de gauche vers l’espace de travail.
  4. Pour commencer votre analyse, sélectionnez l’onglet 1 de la feuille.

Réunir vos données

Vous pouvez réunir les fichiers de votre compartiment S3. Pour plus d’informations sur l’union, consultez Réunir vos données. Pour effectuer une union générique qui inclut des fichiers dans des sous-dossiers, le dossier racine ou le compartiment doit avoir au moins un fichier, correspondant à la structure des fichiers contenus dans les sous-dossiers, à inclure dans l’union. Ce fichier est le premier fichier auquel vous vous connectez lors de la création de l’union.

Problèmes connus et limitations

Les sections suivantes présentent des problèmes connus et des limitations qui peuvent affecter votre réussite lors de l’utilisation du connecteur Amazon S3.

Remarque : ce connecteur n’est actuellement pas pris en charge dans la création Web Tableau Prep ou les connexions virtuelles.

Problèmes connus d’authentification et limitations
  • Seule l’authentification par clé secrète/clé d’accès de l’utilisateur Amazon IAM sans jeton de session est prise en charge.

Problèmes connus de publication et limitations
  • Vous devez utiliser l’option d’authentification « Mot de passe intégré » pour publier les classeurs et les sources de données. La fonction « Inviter l’utilisateur » n’est actuellement pas pris en charge.

Problèmes connus d’union et limitations
  • Seul Tableau Desktop prend en charge une union générique.
  • La création Web ne prend en charge que l’union manuelle définie par l’utilisateur (faire glisser des fichiers).
Problèmes connus des types de fichiers et limitations
  • Les fichiers Parquet, .csv, .gz compressés et Excel sont actuellement pris en charge.
  • Toutes les données sont, de par leur conception, importées au format chaîne.
  • Vous ne pouvez pas réunir ou lier plusieurs types de fichiers dans une seule connexion (par exemple, Parquet et .csv ensemble).
  • Seuls les fichiers .csv délimités par des virgules sont actuellement pris en charge.
  • La limite de taille du fichier est de 15 Go.
  • L’ensemble des résultats cumulés d’une jointure ou d’une union ne peut pas dépasser 15 Go.
  • Les fichiers Excel ne peuvent actuellement pas dépasser ~100 Mo en raison de problèmes de performances avec l’analyseur de fichiers Excel dans le connecteur.
Autres problèmes et limitations connus des fichiers Parquet
  • Les fichiers Parquet doivent être au format décrit dans notre Documentation de l’API Hyper.
  • Les colonnes imbriquées et donc les types imbriqués MAP et LIST ne sont pas pris en charge.
  • Les types BSON, UUID et ENUM ne sont pas pris en charge.
  • Le type physique FIXED_LEN_BYTE_ARRAY sans aucun type logique ou converti n’est pas pris en charge.
  • Le type DECIMAL n’est pris en charge que jusqu’à 8 octets (18 chiffres décimaux). Envisagez d’utiliser le double si vous avez besoin de plus de 18 chiffres décimaux.
  • Les types TIME_MILLIS et TIME_NANOS ne sont pas pris en charge. Envisagez d’utiliser TIME_MICROS à la place.
  • L’encodage obsolète BIT_PACKED n’est pas pris en charge. Aucun fichier Parquet récent ne devrait utiliser ce codage, car il est obsolète depuis plus d’une demi-décennie.
  • Le codage DELTA_LENGTH_BYTE_ARRAY et le codage récent BYTE_STREAM_SPLIT ne sont pas pris en charge, car ils ne sont écrits par aucune bibliothèque. Si vous rencontrez des fichiers Parquet utilisant ces codages, merci de nous en informer.
  • Les compressions prises en charge sont SNAPPY, GZIP, ZSTD et LZ4_RAW.

Voir également