Amazon S3

S’applique à : Tableau Cloud, Tableau Desktop, Tableau Prep, Tableau Server

Cet article décrit comment connecter Tableau à un connecteur Amazon S3 intelligent et comment configurer la source de données.

Avant de commencer

Avant de démarrer, rassemblez l’information de connexion suivante :

Région AWS de votre compartiment S3.
Nom du compartiment S3.
Clé d’accès AWS IAM pour votre compartiment S3 (ID de clé d’accès et clé d’accès secrète).

Autorisations

Assurez-vous que votre utilisateur AWS IAM dispose d’autorisations de lecture pour votre compartiment S3.

Recommandations

Les recommandations suivantes peuvent contribuer à améliorer les performances :

Le client s’exécute dans un environnement AWS (par exemple, Tableau Server installé dans une instance EC2 ou utilisant Tableau Cloud).
L’accès dans la même région offre de meilleures performances que la prise en charge des compartiments inter-régions. Les compartiments inter-régions peuvent engager des coûts supplémentaires à cause des frais de sortie de données.

Établir la connexion et configurer la source des données

Démarrez Tableau et sous Connexion, sélectionnez Amazon S3 dans la liste des connecteurs supplémentaires.
Sélectionnez Installer et redémarrer Tableau pour installer le connecteur.
Après avoir redémarré Tableau, allez à Connexion, puis sélectionnez Amazon S3 dans la liste des connecteurs installés.
Saisissez la région et le nom du compartiment, l’ID de la clé d’accès et la clé d’accès secrète.
Sélectionnez Se connecter.
Dans le contenu de votre compartiment, sélectionnez un fichier auquel vous souhaitez vous connecter.
Sélectionnez Connexion.

Configurer la source de données

Effectuez les étapes suivantes pour configurer la source de données.

(Facultatif) Sélectionnez le nom de la source de données par défaut en haut de la page.
Entrez un nom de source de données unique à utiliser dans Tableau.
Faites glisser dans l’espace de travail un ou plusieurs fichiers auxquels vous souhaitez vous connecter depuis le volet gauche.
Pour commencer votre analyse, sélectionnez l’onglet Feuille 1.

Réunir vos données

Vous pouvez réunir les fichiers de votre compartiment S3. Pour plus d’informations sur l’union, consultez Réunir vos données.

Unions avec caractères génériques

Pour effectuer une union utilisant des caractères génériques incluant des fichiers dans des sous-dossiers, le dossier ou le compartiment racine doit comprendre au moins un fichier faisant partie de l’union qui corresponde à la structure des fichiers figurant dans les sous-dossiers. Ce fichier est le premier fichier auquel vous vous connectez lors de la création de l’union.

L’union avec caractère générique fonctionne pour les fichiers CSV, mais n’est pas prise en charge pour les fichiers Excel.

Problèmes connus et restrictions

Les sections suivantes présentent les problèmes connus et les restrictions susceptibles d’affecter la manière dont vous utilisez correctement le connecteur Amazon S3.

Remarque : Ce connecteur n’est actuellement pas pris en charge dans la création Web Tableau Prep ou dans les connexions virtuelles.

Problèmes connus et restrictions lors de l’authentification

Seule l’authentification par clé secrète/clé d’accès de l’utilisateur Amazon IAM sans jeton de session est prise en charge.

Problèmes connus et restrictions lors de la publication

Les classeurs et les sources de données doivent être publiés à l’aide de l’option d’authentification « Mot de passe intégré ». « Inviter l’utilisateur » n’est actuellement pas pris en charge.

Problèmes connus et restrictions lors de l’union

Seul Tableau Desktop prend en charge l’union avec caractères génériques.
La création Web ne prend en charge que l’union manuelle définie par l’utilisateur (glisser des fichiers).
L’union avec caractère générique ne prend pas en charge les fichiers Excel.

Problèmes connus et restrictions concernant le type de fichier

Les fichiers Parquet,.csv, compressés .gz et Excel sont actuellement pris en charge.
Toutes les données sont, par définition, importées sous forme de chaîne.
Seul l’encodage UTF-8 est pris en charge.
Il est impossible d’unir ou de joindre plusieurs types de fichiers dans une même connexion (par exemple, Parquet et.csv ensemble).
Seuls les fichiers.csv délimités par des virgules sont actuellement pris en charge.
La taille maximale de fichier est de 15 Go.
L’ensemble de résultats cumulés d’une jointure ou d’une union ne doit pas dépasser 15 Go.
À l’heure actuelle, les fichiers Excel ne peuvent pas dépasser ~100 Mo en raison de problèmes de performances au niveau de l’analyseur de fichiers Excel du connecteur.

Autres problèmes connus et restrictions concernant des fichiers Parquet

Les fichiers Parquet doivent être au format décrit dans la Documentation de l’API Hyper.
Les colonnes imbriquées et, par conséquent, les types imbriqués MAP et LIST ne sont pas pris en charge.
Les types BSON, UUID et ENUM ne sont pas pris en charge.
Le type physique FIXED_LEN_BYTE_ARRAY sans type logique ou converti n’est pas pris en charge.
Le type DECIMAL ne prend en charge qu’un maximum de 8 octets (18 chiffres décimaux). Pensez à utiliser le double si vous avez besoin de plus de 18 chiffres décimaux.
Les types TIME_MILLIS et TIME_NANOS ne sont pas pris en charge. Pensez à utiliser TIME_MICROS à la place.
Le codage obsolète BIT_PACKED n’est pas pris en charge. Aucun fichier Parquet récent ne devrait utiliser ce codage, car il est obsolète depuis plus de cinq ans.
Le codage DELTA_LENGTH_BYTE_ARRAY et le récent codage BYTE_STREAM_SPLIT ne sont pas pris en charge, car ils ne sont écrits par aucune bibliothèque.
Les compressions prises en charge sont SNAPPY, GZIP, ZSTD et LZ4_RAW.

Connexion aux données dans la zone géographique Chine

Depuis la version 2.1.4 du connecteur Amazon S3, il est possible de se connecter aux données dans la zone géographique Chine d’AWS avec les limitations suivantes :

Tableau Desktop, Tableau Server et Tableau Cloud peuvent se connecter aux fichiers Excel sans aucune restriction.
Les fichiers CSV et Parquet ne sont pas accessibles dans Tableau Desktop ni dans Tableau Cloud.
Tableau Server peut être configuré pour accéder aux fichiers CSV et Parquet à l’aide de la commande TSM suivante :
```
tsm configuration set -k hyper.external_allow_custom_endpoints -v 1 --force-keys
```

Voir également

Configurer des sources de données – Ajoutez des données supplémentaires à cette source de données ou préparez vos données avant de les analyser.
Créer des graphiques et analyser des données – Lancez votre analyse de données.

Optimiser votre déploiement Amazon Redshift et Tableau Software pour améliorer les performances(Le lien s’ouvre dans une nouvelle fenêtre) - Document technique Tableau (inscription ou authentification requise).
Explorer l’analyse de mégadonnées avec Amazon Redshift(Le lien s’ouvre dans une nouvelle fenêtre) - Webinaire Tableau à la demande (inscription ou authentification requise).

Retour en haut

Merci de vos commentaires!

Votre commentaire s été envoyé avec succès. Merci!

Aide de Tableau Desktop et de la création Web