Amazon S3
Cet article décrit comment connecter Tableau à un connecteur Amazon S3 intelligent et comment configurer la source de données.
Avant de démarrer, rassemblez l’information de connexion suivante :
Région AWS de votre compartiment S3.
Nom du compartiment S3.
Clé d’accès AWS IAM pour votre compartiment S3 (ID de clé d’accès et clé d’accès secrète).
Autorisations
Assurez-vous que votre utilisateur AWS IAM dispose d’autorisations de lecture pour votre compartiment S3.
Recommandations
Les recommandations suivantes peuvent contribuer à améliorer les performances.
- Les performances sont optimales si le client s’exécute dans un environnement AWS (par exemple, Tableau Desktop ou Server installé dans une instance EC2 ou utilisant Tableau Cloud).
- Les compartiments inter-zones sont pris en charge, mais les performances seront pires que si on accède depuis la même région. D’autres coûts peuvent être engagés à cause des frais de sortie de données.
Établir la connexion et configurer la source des données
- Démarrez Tableau et sous Connexion, sélectionnez Amazon S3 dans la liste des connecteurs supplémentaires.
- Sélectionnez Installer et redémarrer Tableau pour installer le connecteur.
- Après avoir redémarré Tableau, allez à Connexion, puis sélectionnez Amazon S3 dans la liste des connecteurs installés.
- Saisissez la région et le nom du compartiment, l’ID de la clé d’accès et la clé d’accès secrète.
- Sélectionnez Se connecter.
- Dans le contenu de votre compartiment, sélectionnez un fichier auquel vous souhaitez vous connecter.
- Sélectionnez Connexion.
Configurer la source de données
Effectuez les étapes suivantes pour configurer la source de données.
- (Facultatif) Sélectionnez le nom de la source de données par défaut en haut de la page.
- Entrez un nom de source de données unique à utiliser dans Tableau.
- Faites glisser dans l’espace de travail un ou plusieurs fichiers auxquels vous souhaitez vous connecter depuis le volet gauche.
- Pour commencer votre analyse, sélectionnez l’onglet Feuille 1.
Réunir vos données
Vous pouvez réunir les fichiers de votre compartiment S3. Pour plus d’informations sur l’union, consultez Réunir vos données. Pour effectuer une union de caractères génériques incluant des fichiers dans des sous-dossiers, le dossier ou le compartiment racine doit contenir au moins un fichier correspondant à la structure des fichiers figurant dans les sous-dossiers, à inclure dans l’union. Ce fichier est le premier fichier auquel vous vous connectez lors de la création de l’union.
Problèmes connus et restrictions
Les sections suivantes présentent les problèmes connus et les restrictions susceptibles d’affecter la manière dont vous utilisez correctement le connecteur Amazon S3.
Remarque : Ce connecteur n’est actuellement pas pris en charge dans la création Web Tableau Prep ou dans les connexions virtuelles.
Problèmes connus et restrictions lors de l’authentification
Seule l’authentification par clé secrète/clé d’accès de l’utilisateur Amazon IAM sans jeton de session est prise en charge.
Problèmes connus et restrictions lors de la publication
Les classeurs et les sources de données doivent être publiés à l’aide de l’option d’authentification « Mot de passe intégré ». « Inviter l’utilisateur » n’est actuellement pas pris en charge.
Problèmes connus et restrictions lors de l’union
- Seul Tableau Desktop prend en charge l’union des caractères génériques.
- La création Web ne prend en charge que l’union manuelle définie par l’utilisateur (glisser des fichiers).
Problèmes connus et restrictions concernant le type de fichier
- Les fichiers Parquet,.csv, compressés .gz et Excel sont actuellement pris en charge.
- Toutes les données sont, par définition, importées sous forme de chaîne.
- Il est impossible d’unir ou de joindre plusieurs types de fichiers dans une même connexion (par exemple, Parquet et.csv ensemble).
- Seuls les fichiers.csv délimités par des virgules sont actuellement pris en charge.
- La taille maximale de fichier est de 15 Go.
- L’ensemble de résultats cumulés d’une jointure ou d’une union ne doit pas dépasser 15 Go.
- À l’heure actuelle, les fichiers Excel ne peuvent pas dépasser ~100 Mo en raison de problèmes de performances au niveau de l’analyseur de fichiers Excel du connecteur.
Autres problèmes connus et restrictions concernant des fichiers Parquet
- Les fichiers Parquet doivent être au format décrit dans la Documentation de l’API Hyper.
- Les colonnes imbriquées et, par conséquent, les types imbriqués MAP et LIST ne sont pas pris en charge.
- Les types BSON, UUID et ENUM ne sont pas pris en charge.
- Le type physique FIXED_LEN_BYTE_ARRAY sans type logique ou converti n’est pas pris en charge.
- Le type DECIMAL ne prend en charge qu’un maximum de 8 octets (18 chiffres décimaux). Pensez à utiliser le double si vous avez besoin de plus de 18 chiffres décimaux.
- Les types TIME_MILLIS et TIME_NANOS ne sont pas pris en charge. Pensez à utiliser TIME_MICROS à la place.
- Le codage obsolète BIT_PACKED n’est pas pris en charge. Aucun fichier Parquet récent ne devrait utiliser ce codage, car il est obsolète depuis plus de cinq ans.
- Le codage DELTA_LENGTH_BYTE_ARRAY et le récent codage BYTE_STREAM_SPLIT ne sont pas pris en charge, car ils ne sont écrits par aucune bibliothèque. Si vous rencontrez des fichiers Parquet utilisant ces codages, faites-le nous savoir.
- Les compressions prises en charge sont SNAPPY, GZIP, ZSTD et LZ4_RAW.
Voir également
- Configurer des sources de données – Ajoutez des données supplémentaires à cette source de données ou préparez vos données avant de les analyser.
- Créer des graphiques et analyser des données – Lancez votre analyse de données.
- Optimiser votre déploiement Amazon Redshift et Tableau Software pour améliorer les performances(Le lien s’ouvre dans une nouvelle fenêtre) - Document technique Tableau (inscription ou authentification requise).
- Explorer l’analyse de mégadonnées avec Amazon Redshift(Le lien s’ouvre dans une nouvelle fenêtre) - Webinaire à la demande Tableau (inscription ou authentification requise).