Ajouter des données supplémentaires à l'étape des données entrantes

Remarque : depuis la version 2020.4.1, vous pouvez désormais créer et modifier des flux dans Tableau Server et Tableau Online. Le contenu de cette rubrique s’applique à toutes les plates-formes, sauf mention spécifique. Pour plus d’informations sur la création de flux sur le Web, consultez Tableau Prep sur le Web.

Après vous être connecté à vos sources de données et avoir démarré la création de votre flux, vous voudrez peut-être actualiser vos connexions de données à mesure que de nouvelles données sont introduites. Vous pouvez également lier ou réunir des ensembles de données à l'étape des données entrantes pour optimiser le travail avec des sources de données plus volumineuses.

Actualiser les données dans l'étape des données entrantes

Si des données changent dans vos fichiers ou tables d'entrée après que vous avez commencé à travailler avec votre flux, vous pouvez actualiser l'étape des données entrantes de manière à intégrer les nouvelles données.

Types d’étape d’entrée de fichier

Remarque : cette option n'est pas encore disponible sur le Web.

Pour rafraîchir les étapes d’entrée de fichiers, effectuez l’une des opérations suivantes :

  • Dans le volet Flux sur le menu supérieur, cliquez sur le bouton Actualiser pour actualiser toutes les étapes de données entrantes. Pour actualiser une seule étape de données entrantes, cliquez sur la flèche déroulante à côté du bouton d'actualisation et sélectionnez l'étape des données entrantes dans la liste.

  • Dans le volet Flux, faites un clic droit sur l'étape des données entrantes que vous souhaitez actualiser et sélectionnez Actualiser dans le menu.

Types d’étape des données entrantes de fichier, de base de données ou d’extrait Tableau

Pour actualiser les étapes d’entrée de la base de données ou de l’extrait de tableau, effectuez l’une des opérations suivantes :

  • Essayez de modifier la connexion.

    Remarque : pour maintenir les performances, Tableau Prep échantillonne de grands ensembles de données. Si vos données sont échantillonnées, vous pouvez ou non voir vos nouvelles données dans le volet Profil. Vous pouvez modifier les paramètres d’échantillonnage de vos données dans l’onglet Échantillon de données de l’étape des données entrantes, mais cela peut avoir une incidence sur les performances. Pour plus d’informations sur le paramétrage de la taille de votre échantillon de données, voir Définir la taille de votre échantillon de données(Link opens in a new window).

    1. Dans le volet Connexions, cliquez avec le bouton droit de la souris ou Ctrl-clic (MacOS) sur la source de données et sélectionnez Modifier.

    2. Rétablissez votre connexion en vous connectant à la base de données ou en re-sélectionnant le fichier ou l’extrait de tableau.

  • Supprimez l'étape des données entrantes puis ajoutez-la à nouveau au flux.

    1. Dans le volet Flux, faites un clic droit sur l'étape des données entrantes que vous souhaitez actualiser, puis sélectionnez Supprimer dans le menu.

      Votre flux sera alors provisoirement dans un état d'erreur.

    2. Reconnectez-vous au fichier mis à jour.

    3. Faites glisser la table vers le volet Flux en haut de la seconde étape du flux où vous souhaitez ajouter l'étape des données entrantes. Déposez-la sur l'option Ajouter pour la reconnecter au flux.

Réunir des fichiers et des tables de base de données dans l'étape des données entrantes

Remarque : les unions de données entrantes ne peuvent pas être modifiées ou créées dans Tableau Server ou Tableau Online, mais uniquement dans Tableau Prep Builder.

Lorsque vous travaillez avec plusieurs fichiers ou tables de base de données depuis une source de données unique, vous pouvez rechercher des fichiers ou des tables en lançant une recherche avec caractères génériques, puis réunir les données de manière à inclure toutes ces données de fichiers et de tables dans l'étape des données entrantes. Pour pouvoir être réunis, les fichiers doivent être dans le même répertoire parent ou enfant.

Les nouveaux fichiers ajoutés au même dossier correspondant au modèle sont automatiquement inclus dans l'union la prochaine fois que vous ouvrez le flux ou que vous l'exécutez depuis la ligne de commande. Les fichiers de flux complets (.tflx) ne récupèrent pas automatiquement les nouveaux fichiers étant donné que ceux-ci sont déjà compressés avec le flux. Pour inclure les nouveaux fichiers pour les flux compressés, ouvrez le fichier de flux (.tfl) afin de récupérer les nouveaux fichiers puis recompressez le flux de manière à inclure les nouvelles données de fichiers.

Pour réunir des tables de bases de données, les tables doivent se trouver dans la même base de données et la connexion à la base de données doit prendre en charge l’utilisation d’une recherche avec caractères génériques pour l’union. Les bases de données suivantes prennent en charge ce type d'union :

  • Amazon Redshift

  • Microsoft SQL Server

  • MySQL

  • Oracle

  • PostgreSQL

Si vous ajoutez ou supprimez des fichiers ou des tables après avoir créé l'union, vous pouvez actualiser l'étape des données entrantes de manière à mettre à jour votre flux avec les données nouvelles ou modifiées.

Remarque : à l'heure actuelle, cette fonction s'applique uniquement aux fichiers Excel et .csv (texte), et aux tables de données stockées dans des bases de données spécifiques recensées ci-dessus. Cette option n'est pas disponible pour les extraits de données Tableau.

L'union avec caractère générique pour les fichiers est disponible dans Tableau Prep Builder version 2018.1.2 et versions ultérieures. L'union avec caractère générique pour les tables de base de données est disponible dans Tableau Prep Builder version 2018.3.1 et versions ultérieures. La modification d'une connexion au flux avec ce type d'union dans une version antérieure peut générer des erreurs.

Si vous avez besoin de réunir des données à partir de sources de données différentes, vous pouvez le faire à l'aide de l'étape Union. Pour plus d'informations sur la création des étapes Union, consultez Réunir vos données(Link opens in a new window).

Réunir des fichiers

Par défaut, Tableau Prep Builder réunit tous les fichiers .csv dans le même répertoire que le fichier .csv auquel vous êtes connecté ou toutes les feuilles du fichier Excel auquel vous êtes connecté. Si vous utilisez l'Interpréteur de données pour nettoyer des fichiers Excel et que vous utilisez Tableau Prep Builder version 2018.1.2 ou ultérieure, vous pouvez utiliser la recherche avec caractère générique pour réunir et ajouter les sous-tables que l'Interpréteur de données a trouvées.

Si vous souhaitez modifier l'union par défaut, utilisez les critères suivants pour trouver les fichiers ou les feuilles à inclure dans l'union :

  • Rechercher dans : sélectionnez le répertoire à utiliser pour rechercher des fichiers. Sélectionnez la case à cocher Inclure les sous-dossiers pour inclure les fichiers dans le sous-répertoire du dossier parent.

  • Fichiers : choisissez d'inclure ou d'exclure les fichiers correspondant aux critères de la recherche avec caractères génériques.

  • Modèle de correspondance (xxx*) : entrez un modèle de recherche avec caractères génériques pour trouver les fichiers contenant ces caractères dans le nom de fichier. Par exemple, si vous avez entré ord*, tous les fichiers incluant le nom de fichier sont retournés. Laissez ce champ vide pour inclure tous les fichiers du répertoire spécifié.

Pour réunir les fichiers dans l'étape des données entrantes, procédez comme suit :

  1. Cliquez sur le bouton Ajouter une connexion et sous Connexion, cliquez sur Fichier texte pour les fichiers .csv ou sur Microsoft Excel pour les fichiers Excel, puis sélectionnez un fichier à ouvrir.

  2. Dans le volet Entrée, sélectionnez l'onglet Plusieurs fichiers puis sélectionnez Union avec caractères génériques.

    L'exemple ci-dessous montre une union avec caractères génériques utilisant un modèle de correspondance. Le signe plus dans l'icône du fichier à l'étape des données entrantes Orders_Central dans le volet Flux indique que cette étape inclut une union avec caractères génériques. Les fichiers de l'union sont répertoriés sous Fichiers inclus.

  3. Utilisez les options de recherche, de fichier et de modèle de correspondance pour trouver les fichiers que vous souhaitez réunir.

  4. Cliquez sur Appliquer pour réunir les fichiers.

Lorsque vous ajoutez une nouvelle étape au flux, vous pouvez voir tous les fichiers ajoutés à l'ensemble de données dans le champ Chemins d'accès des fichiers dans le volet Profil. Ce champ est ajouté automatiquement.

Réunir des tables de base de données (version 2018.3.1 et ultérieur)

  1. Cliquez sur le bouton Ajouter une connexion et sous Connexion,connectez-vous à une base de données prenant en charge l'union avec caractères génériques.

  2. Faites glisser une table vers le volet Flux.

  3. Dans le volet Entrée, sélectionnez l'onglet Plusieurs tables, puis sélectionnez Union avec caractères génériques.

  4. Utilisez les options de recherche, Tables et Modèle de correspondance pour trouver les tables que vous souhaitez réunir.

    Seules les tables qui s'affichent dans le volet Connexions dans la section Tables peuvent être incluses dans l'union. La recherche avec caractères génériques ne peut pas effectuer de recherche dans des schémas ou dans la connexion à des bases de données pour trouver des tables.

  5. Cliquez sur Appliquer pour réunir les données de table.

    Lorsque vous ajoutez une nouvelle étape au flux, vous pouvez voir toutes les tables ajoutées à l'ensemble de données dans le champ Noms des tables du volet Profil. Ce champ est ajouté automatiquement.

Fusionner des champs après une union

Après avoir créé une union dans l'étape des données entrantes, vous souhaiterez peut-être fusionner les champs. Vous pouvez le faire dans toute étape suivante, sauf pour les étapes Entrée ou Sortie. Pour plus d'informations, consultez Options supplémentaires de fusion des champs(Link opens in a new window).

Lier des données dans l’étape des données entrantes

Dans Tableau Prep Builder (depuis la version 2019.3.1) et sur le Web, lorsque vous vous connectez à des bases de données contenant des tables avec des données relationnelles, Tableau Prep peut désormais détecter et afficher les champs d’une table qui sont identifiés en tant qu’identificateur unique, les champs identifiés en tant que champ lié, ainsi que les noms de table associés à ces champs.

Une nouvelle colonne appelée Clés liées apparaît dans le volet Entrée et affiche les relations suivantes, le cas échéant :

  • Identificateur unique. Ce champ identifie de manière unique chaque ligne du tableau. Une table peut contenir plusieurs identificateurs uniques. Les valeurs des champs doivent être uniques et ne peuvent pas être vides ou null.

  • Domaine connexe. Ce champ associe la table à une autre table dans la base de données. Une table peut comporter plusieurs champs associées.

  • À la fois identificateur unique et champ associé. Le champ est un identificateur unique dans cette table et il associe également la table à une autre table dans la base de données.

Vous pouvez utiliser ces relations pour trouver et ajouter rapidement les tables associées à votre flux ou créer des jointures à partir de l'étape des données entrantes. Cette fonctionnalité est disponible pour tous les connecteurs de base de données pris en charge dans lesquels des relations entre tables sont définies.

  1. Connectez-vous à une base de données (par exemple Microsoft SQL Server) qui contient des données de relation pour des champs, par exemple des identificateurs uniques ou des champs associés (clé étrangère).
  2. Dans le volet Entrée, cliquez sur un champ marqué comme champ associé ou comme , à la fois un identificateur unique et un champ associé.

    Une boîte de dialogue affiche la liste des tables associées.

  3. Pointez sur la table que vous souhaitez ajouter ou lier, et cliquez sur le bouton Plus pour ajouter la table à votre flux. Sinon, cliquez sur le bouton Lier pour créer une jointure avec la table sélectionnée.

    Si vous créez une jointure, Tableau Prep utilise la relation de champ définie pour lier les tables et vous présente un aperçu des clauses de jointure qu'il utilisera pour créer la jointure.

  4. Vous pouvez également lier des tables associées à partir du menu du volet Flux. Cliquez sur l'icône plus , puis sélectionnez Ajouter une jointure pour afficher la liste des tables liées. Tableau Prep crée la jointure en fonction des champs qui constituent la relation entre les deux tables.

    Remarque : si aucune relation entre tables n'est définie pour votre table, cette option n'est pas disponible.

Pour plus d'informations sur l'utilisation des jointures, consultez Lier vos données(Link opens in a new window).

Merci de vos commentaires !