Ajouter des données supplémentaires à l’étape des données entrantes

Remarque : depuis la version 2020.4.1, vous pouvez désormais créer et modifier des flux dans Tableau Server et Tableau Cloud. Le contenu de cette rubrique s’applique à toutes les plates-formes, sauf mention spécifique. Pour plus d’informations sur la création de flux sur le Web, consultez Tableau Prep sur le Web dans l’aide de Tableau Server(Le lien s’ouvre dans une nouvelle fenêtre) et Tableau Cloud(Le lien s’ouvre dans une nouvelle fenêtre).

Après vous être connecté à vos sources de données et avoir démarré la création de votre flux, vous voudrez peut-être actualiser vos connexions de données à mesure que de nouvelles données sont introduites. Vous pouvez également lier ou réunir des ensembles de données à l’étape des données entrantes pour optimiser le travail avec des sources de données plus volumineuses.

Actualiser les données de l’étape d’entrée ou modifier votre connexion

Si des données changent dans vos fichiers ou tables d’entrée après que vous avez commencé à travailler avec votre flux, vous pouvez actualiser l’étape des données entrantes de manière à intégrer les nouvelles données. Vous pouvez sinon facilement modifier et mettre à jour les connexions individuelles de l’étape d’entrée sans interrompre votre flux.

Actualiser votre source de données

S’applique aux types de fichiers. Non encore pris en charge sur le Web.

Effectuez l’une des actions suivantes :

  • Dans le volet Flux, faites un clic droit sur l’étape des données entrantes que vous souhaitez actualiser et sélectionnez Actualiser dans le menu.

  • Dans le volet Flux sur le menu supérieur, cliquez sur le bouton Actualiser pour actualiser toutes les étapes de données entrantes. Pour actualiser une seule étape de données entrantes, cliquez sur la flèche déroulante à côté du bouton d’actualisation et sélectionnez l’étape des données entrantes dans la liste.

Remplacer votre source de données

S’applique aux types de fichiers, aux sources de données et aux extraits dans Tableau Prep Builder et sur le Web.

Actualisez votre source de données en modifiant les connexions d’entrée individuelles ou en remplaçant les sources de données de flux individuelles par une source de données différente.

Modifier la connexion

Utilisez cette option pour actualiser facilement vos informations d’identification ou remplacer la source de données par le même type de source de données.

Remarque : pour maintenir les performances, Tableau Prep échantillonne de grands ensembles de données. Si vos données sont échantillonnées, vous pouvez ou non voir vos nouvelles données dans le volet Profil. Vous pouvez modifier les paramètres d’échantillonnage de vos données dans l’onglet Échantillon de données de l’étape des données entrantes, mais cela peut avoir une incidence sur les performances. Pour plus d’informations sur le paramétrage de la taille de votre échantillon de données, voir Définir la taille de votre échantillon de données(Le lien s’ouvre dans une nouvelle fenêtre).

  1. Dans le volet Connexions, cliquez avec le bouton droit de la souris ou Ctrl-clic (MacOS) sur la source de données et sélectionnez Modifier.

  2. Rétablissez votre connexion en vous connectant à la base de données ou en re-sélectionnant le fichier ou l’extrait Tableau.

Remplacer la connexion d’entrée

Remplacez facilement une source de données existante dans votre flux par n’importe quelle nouvelle source de données sans interrompre la connexion du flux. En fonction de votre version de Tableau Prep, vous pouvez faire glisser et déposer une nouvelle source de données sur votre ancienne source de données ou déconnecter et reconnecter manuellement votre source de données.

Remplacer la connexion d’entrée par glisser-déposer (à partir de la version 20224)

  1. Dans le volet Connexions , faites glisser la nouvelle table vers le volet Flux au-dessus de l’étape d’entrée que vous souhaitez remplacer et déposez-la sur l’option Remplacer.

  2. Reconfigurez tous les paramètres et corrigez les erreurs si nécessaire.

Déconnecter et reconnecter manuellement une source de données d’entrée (version 2022.3 et antérieure)
  1. Dans le volet Flux, faites un clic droit sur l’étape des données entrantes que vous souhaitez actualiser, puis sélectionnez Supprimer dans le menu.

    Votre flux sera alors provisoirement dans un état d’erreur.

  2. Connectez-vous à la source de données nouvelle ou mise à jour.
  3. Faites glisser la table vers le volet Flux en haut de la seconde étape du flux où vous souhaitez ajouter l’étape des données entrantes. Déposez-la sur l’option Ajouter pour la reconnecter au flux.

Réunir des fichiers et des tables de base de données dans l’étape des données entrantes

Les unions d’entrée ne peuvent être modifiées et créées que dans Tableau Prep Builder, mais peuvent être programmées pour s’exécuter sur le Web.

Lorsque vous travaillez avec plusieurs fichiers ou tables de base de données depuis une source de données unique, vous pouvez appliquer des filtres pour rechercher des fichiers ou utiliser la recherche avec caractères génériques pour rechercher des tables, puis réunir les données de manière à inclure toutes ces données de fichiers et de tables dans l’étape des données entrantes. Pour pouvoir être réunis, les fichiers doivent être dans le même répertoire ou sous-répertoire.

Remarque : cette option n’est pas disponible pour les extraits Tableau.

Les nouveaux fichiers qui sont ajoutés au même dossier correspondant aux critères de filtre sont automatiquement inclus dans l’union la prochaine fois que vous ouvrez le flux ou que vous l’exécutez depuis la ligne de commande.

Les fichiers de flux complets (.tflx) ne récupèrent pas automatiquement les nouveaux fichiers étant donné que ceux-ci sont déjà compressés avec le flux. Pour inclure les nouveaux fichiers pour les flux compressés, ouvrez le fichier de flux (.tfl) dans Tableau Prep Builder afin de récupérer les nouveaux fichiers puis recompressez le flux de manière à inclure les nouvelles données de fichiers.

Pour réunir des tables de bases de données, les tables doivent se trouver dans la même base de données et la connexion à la base de données doit prendre en charge la recherche avec caractères génériques. Les bases de données suivantes prennent en charge ce type d’union :

  • Amazon Redshift

  • Microsoft SQL Server

  • MySQL

  • Oracle

  • PostgreSQL

Si vous ajoutez ou supprimez des fichiers ou des tables après avoir créé l’union, vous pouvez actualiser l’étape des données entrantes de manière à mettre à jour votre flux avec les données nouvelles ou modifiées.

Si vous avez besoin de réunir des données à partir de sources de données différentes, vous pouvez le faire à l’aide de l’étape Union. Pour plus d’informations sur la création des étapes Union, consultez Réunir vos données(Le lien s’ouvre dans une nouvelle fenêtre).

Réunir des fichiers

Par défaut, Tableau Prep Builder réunit tous les fichiers .csv dans le même répertoire que le fichier .csv auquel vous êtes connecté ou toutes les feuilles du fichier Excel auquel vous êtes connecté.

Si vous souhaitez modifier l’union par défaut, vous pouvez spécifier des critères de filtre supplémentaires pour trouver les fichiers ou les feuilles à inclure dans l’union.

Critères de filtrage de base

Dans Tableau Prep Builder version 2022.1.1 et versions antérieures, vous pouvez choisir parmi les critères suivants :

  • Rechercher dans : sélectionnez le répertoire à utiliser pour rechercher des fichiers. Sélectionnez la case à cocher Inclure les sous-dossiers pour inclure les fichiers dans le sous-répertoire du dossier parent.

  • Fichiers : choisissez d’inclure ou d’exclure les fichiers correspondant aux critères de la recherche avec caractères génériques.

  • Modèle de correspondance (xxx*) : entrez un modèle de recherche avec caractères génériques pour trouver les fichiers contenant ces caractères dans le nom de fichier. Par exemple, si vous avez entré commande*, tous les fichiers incluant « commande » dans le nom de fichier sont retournés. Laissez ce champ vide pour inclure tous les fichiers du répertoire spécifié.

Filtres supplémentaires

Pris en charge dans Tableau Prep Builder version 2022.2.1 et versions ultérieures et pour les flux publiés sur Tableau Cloud.

Remarque : si vous utilisez des filtres supplémentaires dans votre flux, la planification des flux n’est actuellement disponible qu’à l’aide de Tableau Cloud . Vous pouvez exécuter le flux manuellement dans Tableau Prep Builder ou via l’interface de ligne de commande. Cette fonctionnalité n’est pas compatible avec Tableau Server version 2022.1 et versions antérieures.

À partir de Tableau Prep Builder version 2022.2.1 et versions ultérieures, les options de filtrage lors de la recherche de fichiers à réunir ont changé. Vous continuez à spécifier un répertoire et un sous-répertoire dans lesquels effectuer la recherche, mais vous pouvez désormais définir plusieurs filtres pour effectuer une recherche plus granulaire.

Ces options de filtrage s’appliquent aux types de fichiers Texte, Microsoft Excel et Statistiques. Vous pouvez sélectionner plusieurs filtres. Chaque filtre est appliqué séparément, dans l’ordre dans lequel vous les sélectionnez, de haut en bas. Les filtres ne peuvent actuellement pas être déplacés une fois qu’ils ont été ajoutés, mais vous pouvez supprimer et ajouter des filtres selon les besoins.

Choisissez l’un des filtres suivants :

FiltreDescription
Nom de fichierSélectionnez Correspond ou Ne correspond pas pour un modèle de nom de fichier. Par exemple : « commandes* ».
Taille du fichier

Filtrez les fichiers en sélectionnant une Plage de tailles ou un Classé par taille.

Plage de tailles : choisissez l’une des options suivantes :

  • Spécifiez une plage de valeurs.
  • Sélectionnez un opérateur Inférieur à, Inférieur ou égal à, Supérieur ou égal à ou Supérieur à et appliquez-le à une seule valeur.

Classé par taille : incluez ou excluez les N fichiers les plus grands ou les plus petits.

Date de création

Filtrez les fichiers en sélectionnant Plage de dates, Date relative ou Classé par date.

Plage de dates : choisissez l’une des options suivantes :

  • Spécifiez une date et une plage horaire.
  • Sélectionnez un opérateur Avant, Avant ou égal à, Après ou égal à ou Après et appliquez-le à une seule valeur.

Date relative : incluez ou excluez une plage exacte d’années, de trimestres, de mois, de semaines ou de jours. Vous pouvez également configurer un ancrage relatif à une date spécifique.

Remarque : les périodes de dates « Dernier » incluent l’unité de temps actuelle complète, même si certaines dates n’ont pas encore eu lieu. Par exemple, si vous sélectionnez le mois dernier et que la date actuelle est le 7 janvier, Tableau affiche les dates allant du 1er janvier au 31 janvier.

Classé par date : incluez ou excluez les N fichiers les plus récents ou les plus anciens.

Date de modification

Filtrez les fichiers en sélectionnant Plage de dates, Date relative ou Classé par date.

Plage de dates : choisissez l’une des options suivantes :

  • Spécifiez une date et une plage horaire.
  • Sélectionnez un opérateur Avant, Avant ou égal à, Après ou égal à ou Après et appliquez-le à une seule valeur.

Date relative : incluez ou excluez une plage exacte d’années, de trimestres, de mois, de semaines ou de jours. Vous pouvez également configurer un ancrage relatif à une date spécifique.

Remarque : les périodes de dates « Dernier » incluent l’unité de temps actuelle complète, même si certaines dates n’ont pas encore eu lieu. Par exemple, si vous sélectionnez le mois dernier et que la date actuelle est le 7 janvier, Tableau affiche les dates allant du 1er janvier au 31 janvier.

Classé par date : incluez ou excluez les N fichiers les plus récents ou les plus anciens.

Remarque : les instructions ci-dessous varient en fonction de votre version de Tableau Prep Builder.

Créer une union d’entrée

S’applique à Tableau Prep Builder version 2022.2.1 et versions ultérieures

  1. Cliquez sur le bouton Ajouter une connexion et sous Connexion, cliquez sur Fichier texte pour les fichiers .csv, sur Microsoft Excel pour les fichiers Excel ou sur Fichier de statistiques pour les fichiers de statistiques, puis sélectionnez un fichier à ouvrir.

  2. Dans le volet Entrée, sélectionnez l’onglet Tables, puis sélectionnez Réunir plusieurs tables.

  3. Sélectionnez un dossier dans lequel effectuer la recherche. Vous pouvez également inclure tous les sous-dossiers répertoriés dans un répertoire donné pour élargir votre recherche.
  4. Cliquez sur Ajouter un filtre de fichiers et sélectionnez l’une des options suivantes :

    • Nom du fichier : saisissez un modèle de nom à rechercher.
    • Taille du fichier : recherche par plage de tailles ou classement par taille.
    • Date de création : recherche par plage de dates, date relative ou classement par date.
    • Date de modification : recherche par plage de dates, date relative ou classement par date.
  5. Cliquez à nouveau sur Ajouter un filtre de fichiers pour ajouter d’autres filtres.

    Les résultats du filtre sont affichés dans la section Tables incluses.

  6. Cliquez sur Appliquer pour réunir les fichiers.

Lorsque vous ajoutez une nouvelle étape au flux, vous pouvez voir tous les fichiers ajoutés à l’ensemble de données dans le champ Chemins d’accès des fichiers dans le volet Profil. Ce champ est ajouté automatiquement.

Créer une union des données entrantes (version 2022.1.1 et antérieure)
  1. Cliquez sur le bouton Ajouter une connexion et sous Connexion, cliquez sur Fichier texte pour les fichiers .csv ou sur Microsoft Excel pour les fichiers Excel, puis sélectionnez un fichier à ouvrir.

  2. Dans le volet Entrée, sélectionnez l’onglet Plusieurs fichiers puis sélectionnez Union avec caractères génériques.

    L’exemple ci-dessous montre une union des données entrantes utilisant un modèle de correspondance. Le signe plus sur l’icône du fichier dans l’étape des données entrantes sur Orders_Central sur le volet Flux indique que cette étape inclut une union des données entrantes. Les fichiers de l’union sont répertoriés sous Fichiers inclus.

  3. Utilisez les options de recherche, de fichier et de modèle de correspondance pour trouver les fichiers que vous souhaitez réunir.

  4. Cliquez sur Appliquer pour réunir les fichiers.

Lorsque vous ajoutez une nouvelle étape au flux, vous pouvez voir tous les fichiers ajoutés à l’ensemble de données dans le champ Chemins d’accès des fichiers dans le volet Profil. Ce champ est ajouté automatiquement.

Tables de la base de données d’union

Pris en charge dans Tableau Prep Builder à partir de la version 2018.3.1

Remarque : l’interface d’union des données entrantes pour les tables de base de données a été mise à jour dans Tableau Prep Builder version 2022.2.1. Vos options peuvent se présenter de différentes manières selon votre version.

  1. Cliquez sur le bouton Ajouter une connexion et sous Connexion,connectez-vous à une base de données prenant en charge l’union des données entrantes.

  2. Faites glisser une table vers le volet Flux.

  3. Dans le volet Entrée, sélectionnez l’onglet Tables, puis sélectionnez Réunir plusieurs tables.

    Dans les versions antérieures, sélectionnez l’onglet Tables multiples puis sélectionnez Union avec caractères génériques.

  4. Dans le champ Tables, sélectionnez Inclure ou Exclure dans la liste déroulante, puis saisissez un modèle correspondant pour trouver les tables que vous souhaitez réunir.

    Dans les versions précédentes, utilisez les options de recherche, de tables et de modèle de correspondance.

    Seules les tables qui s’affichent dans le volet Connexions dans la section Tables peuvent être incluses dans l’union. La recherche pour l’union des données entrantes ne peut pas effectuer de recherche dans des schémas ou dans la connexion à des bases de données pour trouver des tables.

  5. Cliquez sur Appliquer pour réunir les données de table.

    Lorsque vous ajoutez une nouvelle étape au flux, vous pouvez voir toutes les tables ajoutées à l’ensemble de données dans le champ Noms des tables du volet Profil. Ce champ est ajouté automatiquement.

Fusionner des champs après une union

Après avoir créé une union dans l’étape des données entrantes, vous souhaiterez peut-être fusionner les champs. Vous pouvez le faire dans toute étape suivante, sauf pour les étapes Entrée ou Sortie. Pour plus d’informations, consultez Options supplémentaires de fusion des champs(Le lien s’ouvre dans une nouvelle fenêtre).

Lier des données dans l’étape des données entrantes

Dans Tableau Prep Builder (depuis la version 2019.3.1) et sur le Web, lorsque vous vous connectez à des bases de données contenant des tables avec des données relationnelles, Tableau Prep peut désormais détecter et afficher les champs d’une table qui sont identifiés en tant qu’identificateur unique, les champs identifiés en tant que champ lié, ainsi que les noms de table associés à ces champs.

Une nouvelle colonne appelée Clés liées apparaît dans le volet Entrée et affiche les relations suivantes, le cas échéant :

  • Identificateur unique. Ce champ identifie de manière unique chaque ligne du tableau. Une table peut contenir plusieurs identificateurs uniques. Les valeurs des champs doivent être uniques et ne peuvent pas être vides ou null.

  • Domaine connexe. Ce champ associe la table à une autre table dans la base de données. Une table peut comporter plusieurs champs associées.

  • À la fois identificateur unique et champ associé. Le champ est un identificateur unique dans cette table et il associe également la table à une autre table dans la base de données.

Vous pouvez utiliser ces relations pour trouver et ajouter rapidement les tables associées à votre flux ou créer des jointures à partir de l’étape des données entrantes. Cette fonctionnalité est disponible pour tous les connecteurs de base de données pris en charge dans lesquels des relations entre tables sont définies.

  1. Connectez-vous à une base de données (par exemple Microsoft SQL Server) qui contient des données de relation pour des champs, par exemple des identificateurs uniques ou des champs associés (clé étrangère).
  2. Dans le volet Entrée, cliquez sur un champ marqué comme champ associé ou comme , à la fois un identificateur unique et un champ associé.

    Une boîte de dialogue affiche la liste des tables associées.

  3. Pointez sur la table que vous souhaitez ajouter ou lier, et cliquez sur le bouton Plus pour ajouter la table à votre flux. Sinon, cliquez sur le bouton Lier pour créer une jointure avec la table sélectionnée.

    Si vous créez une jointure, Tableau Prep utilise la relation de champ définie pour lier les tables et vous présente un aperçu des clauses de jointure qu’il utilisera pour créer la jointure.

  4. Vous pouvez également lier des tables associées à partir du menu du volet Flux. Cliquez sur l’icône plus , puis sélectionnez Ajouter une jointure pour afficher la liste des tables liées. Tableau Prep crée la jointure en fonction des champs qui constituent la relation entre les deux tables.

    Remarque : si aucune relation entre tables n’est définie pour votre table, cette option n’est pas disponible.

Pour plus d’informations sur l’utilisation des jointures, consultez Lier vos données(Le lien s’ouvre dans une nouvelle fenêtre).

Merci de vos commentaires !Avis correctement envoyé. Merci