Enregistrer et partager votre travail

À tout moment du flux, vous pouvez l'enregistrer, afficher un aperçu des données de votre flux dans Tableau Desktop, ou créer un extrait de vos données qui inclut toutes les opérations appliquées à votre flux. Depuis la version 2020.3.1, vous pouvez même écrire vos données de flux dans des bases de données sélectionnées afin de partager vos données préparées nettoyées. Vous pouvez également compresser les données de votre flux pour les partager avec d'autres personnes ou publier un extrait de données sur Tableau Server ou Tableau Online sous forme de source de données.

Pour garder les données à jour, vous pouvez exécuter des flux individuels depuis Tableau Prep Builder ou depuis la ligne de commande. Pour exécuter automatiquement des flux de manière programmée, vous pouvez publier les flux sur Tableau Server ou Tableau Online. Pour plus d'informations sur l'exécution des flux, voir Actualiser les fichiers de sortie du flux depuis la ligne de commande(Link opens in a new window) ou Publier un flux sur Tableau Server ou Tableau Online(Link opens in a new window).

Enregistrer un flux

Enregistrez votre flux pour sauvegarder votre travail avant d'effectuer toute opération supplémentaire. Votre flux est enregistré au format de fichier de flux Tableau Prep Builder (.tfl).

Vous pouvez également compresser vos fichiers locaux (Excel, fichiers texte et extraits Tableau) avec votre flux pour les partager avec d'autres, de la même manière que vous compressez un classeur pour le partager dans Tableau Desktop. Seuls les fichiers locaux peuvent être compressés avec un flux. Les données issues des connexions à des bases de données, par exemple, ne sont pas incluses.

Lorsque vous enregistrez un flux compressé, ce flux est enregistré en tant que fichier de flux compressé Tableau (.tflx).

  • Pour enregistrer votre flux, dans le menu supérieur, sélectionnez Fichier > Enregistrer.

  • Pour compresser vos fichiers de données avec votre flux, dans le menu supérieur, effectuez l'une des opérations suivantes :

    • Sélectionnez Fichier > Exporter le flux compressé

    • Sélectionnez Fichier > Enregistrer sous. Ensuite, dans la boîte de dialogue Enregistrer sous, sélectionnez Fichiers de flux compressés Tableau dans le menu déroulant Type de fichier.

Récupération automatique de fichiers (version 2020.3.3 et versions ultérieures)

Par défaut, Tableau Prep Builder enregistre automatiquement un brouillon de tout flux ouvert en cas de blocage ou de panne de l’application. Les brouillons de flux sont enregistrés dans votre dossier Flux récupérés sur Mon dossier Tableau Prep. La prochaine fois que vous ouvrez l’application, une boîte de dialogue affiche la liste des flux récupérés que vous pouvez sélectionner. Vous pouvez ouvrir un flux récupéré et reprendre là où vous vous étiez arrêté, ou supprimer le fichier de flux récupéré si vous n’en avez pas besoin.

Remarque : si vous avez récupéré des flux dans votre dossier Flux récupérés, cette boîte de dialogue s’affiche chaque fois que vous ouvrez l’application jusqu’à ce que ce dossier soit vide.

Si vous ne souhaitez pas activer cette fonctionnalité, en tant qu’administrateur, vous pouvez la désactiver pendant ou après l’installation. Pour plus d'informations sur la désactivation de cette fonctionnalité, consultez Désactiver la récupération de fichiers(Link opens in a new window) dans le guide de déploiement de Tableau Desktop et Tableau Prep.

Afficher votre échantillon de données dans Tableau

Lorsque vous nettoyez vos données, il arrive que vous souhaitiez vérifier l'avancement de l'opération en la consultant dans Tableau Desktop. Lorsque votre flux s'ouvre dans Tableau Desktop, Tableau Prep Builder crée un extrait Tableau permanent (fichier .tde ou .hyper selon votre version de Tableau) et un fichier de source de données Tableau (.tds). Les fichiers sont enregistrés dans votre référentiel Tableau dans le fichier Sources de données afin que vous puissiez expérimenter avec vos données à tout moment.

Remarque : bien que vous puissiez expérimenter avec vos données, Tableau ne vous présente qu'un échantillon de vos données et vous ne pouvez pas enregistrer le classeur en tant que classeur complet (.twbx). Lorsque vous êtes prêt à travailler avec vos données dans Tableau, créez une étape de sortie pour votre flux et enregistrez la sortie dans un fichier ou en tant que source de données publiée, puis connectez-vous à la source de données complète dans Tableau.

Lorsque vous ouvrez le flux dans Tableau Desktop, vous pouvez voir l'échantillon de données avec lequel vous travaillez dans votre flux et les opérations qui s'y appliquent, jusqu'à l'étape que vous avez sélectionnée.

Pour afficher votre échantillon de données dans Tableau Desktop, procédez comme suit :

  1. Faites un clic droit sur l'étape où vous souhaitez afficher vos données et sélectionnez Aperçu dans Tableau Desktop depuis le menu contextuel.

  2. Tableau Desktop s'ouvre dans l'onglet Feuille.

Créer et publier des extraits de données et des sources de données

Important : à compter de la version 2020.3.1 de Tableau Prep Builder, les fichiers d’extrait (.tde) ne sont plus pris en charge pour la sortie de flux. Tous les flux publiés sur une version 2020.3 et versions ultérieures de Tableau Server utilisant ce type de fichier pour la sortie doivent être convertis en fichier d’extrait Hyper (.hyper). Sinon, l’exécution du flux échouera. Si le flux est publié sur Tableau Server ou Tableau Online, téléchargez le flux, modifiez le type de sortie et republiez le flux pour éviter les erreurs d’exécution de flux.

Pour créer un extrait, exécutez votre flux. Lorsque vous exécutez votre flux, vos modifications sont appliquées à l'intégralité de l'ensemble de données. L'exécution du flux entraîne la création d'un fichier de source de données Tableau (.tds) et d'un extrait (.hyper). Vous pouvez créer un fichier d'extrait depuis votre sortie de flux pour l'utiliser dans Tableau Desktop ou partager vos données avec des tiers.

À partir de la version 2020.2.1, vous pouvez exécuter votre flux en utilisant l'actualisation incrémentielle. Cette option contribue à économiser du temps et des ressources et vous permet de n'actualiser que les nouvelles données au lieu de votre ensemble de données complet. Pour plus d’informations sur la configuration et l'exécution de votre flux à l’aide d’une actualisation incrémentielle, consultez Actualiser les données de flux à l’aide d'une actualisation incrémentielle.

Remarque : vous pouvez publier des extraits de données ou des sources de données sur Tableau Server version 10.0 et versions ultérieures, ainsi que sur Tableau Online.

Vous pouvez créer un fichier d'extrait aux formats suivants :

  • Extrait Hyper (.hyper) : ce type de fichier est le nouveau type de fichier d'extrait Tableau mais peut uniquement être utilisé par Tableau Desktop ou Tableau Server version 10.5 et versions ultérieures.

  • Valeurs séparées par des virgules (.csv) : enregistrez l'extrait dans un fichier .csv pour partager vos données avec des tiers. L'encodage d'un fichier CSV exporté sera UTF-8 avec BOM.

Vous pouvez également publier votre sortie sous forme de source de données sur Tableau Server ou Tableau Online pour partager vos données et fournir un accès centralisé aux données que vous avez nettoyées, organisées et combinées. Depuis la version 2020.3.1, vous pouvez enregistrer votre sortie de flux dans une base de données pour créer, remplacer ou ajouter des données de table en utilisant vos données de flux nettoyées et préparées. Pour plus d’informations, voir Enregistrer les données de sortie de flux dans des bases de données externes (version 2020.3.1 et versions ultérieures).

Remarque : pour que vous puissiez publier votre sortie sur Tableau Server, l' API REST Tableau Server doit être activée. Pour plus d'informations, consultez Rest API Requirements(Link opens in a new window) (Configuration requise pour l'API Rest) dans l'aide de l'API Rest Tableau. Pour publier sur un serveur qui utilise des certificats de cryptage SSL (Secure Socket Layer), des étapes de configuration supplémentaires sont nécessaires sur l'ordinateur exécutant Tableau Prep Builder. Pour plus d'informations, consultez Avant l'installation(Link opens in a new window) dans le Guide de déploiement de Tableau Desktop et de Tableau Prep Builder.

Créer un fichier d'extrait

  1. Cliquez sur l'icône plus dans une étape et sélectionnez Ajouter une sortie.

    Si vous avez exécuté le flux précédemment, cliquez sur le bouton Exécuter le flux dans l'étape Sortie. pour exécuter le flux et mettre à jour votre sortie.

    Le volet Sortie s'ouvre et affiche un instantané de vos données.

  2. Dans le volet gauche, sélectionnez Fichier dans la liste déroulante Enregistrer la sortie sur (sélectionnez Enregistrer dans le fichier dans les versions précédentes).

  3. Cliquez sur le bouton Parcourir, puis dans la boîte de dialogue Enregistrer l'extrait sous, entrez un nom pour le fichier et cliquez sur Accepter.

  4. Dans le champ Type de sortie, sélectionnez l'un des types de sortie suivants :

    • Extrait (. hyper)

    • Valeurs séparées par des virgules (.csv)

  5. (version 2020.2.1 et versions ultérieures) Dans la section Options d’écriture, consultez l’option d’écriture par défaut pour écrire les nouvelles données sur vos fichiers et apporter des modifications si nécessaire. Pour plus d'informations, consultez Configurer les options d’écriture.

    • Créer une table : cette option crée une nouvelle table ou remplace la table existante par la nouvelle sortie.

    • Ajouter à la table : cette option ajoute les nouvelles données à votre table existante. Si la table n’existe pas déjà, une nouvelle table est créée et les exécutions suivantes ajoutent de nouvelles lignes à cette table.

      Remarque : l'option Ajouter à la table n’est pas prise en charge pour les types de sortie .csv. Pour plus d’informations sur les combinaisons d'actualisations prises en charge, consultez Options d'actualisation de flux.

  6. Cliquez sur Exécuter le flux pour exécuter le flux et générer le fichier d'extrait.

Publier en tant que source de données

  1. Cliquez sur l'icône plus dans une étape et sélectionnez Ajouter une sortie.

    Si vous avez exécuté le flux précédemment, cliquez sur le bouton Exécuter le flux dans l'étape Sortie. pour exécuter le flux et mettre à jour votre sortie.

    Remarque : dans la version 2020.1.1, Tableau Prep Builder actualise les sources de données déjà publiées et gère les modélisations de données (par exemple, les champs calculés, le formatage des nombres, et ainsi de suite) qui pourraient être incluses dans la source de données. Si la source de données ne peut pas être actualisée, elle sera remplacée.

  2. Le volet Sortie s'ouvre et affiche un instantané de vos données.

  3. Dans la liste déroulante Enregistrer la sortie dans, sélectionnez Source de données publiée (sélectionnez Publier comme source de données dans les versions antérieures) et renseignez les champs suivants :

    • Serveur : sélectionnez le serveur où vous souhaitez publier la source de données et l'extrait. Si vous n'êtes pas connecté à un serveur, vous serez invité à vous connecter.

      Remarque : depuis Tableau Prep Builder version 2020.1.4, une fois que vous vous êtes connecté à votre serveur, Tableau Prep Builder mémorise le nom et les informations d’identification de votre serveur lorsque vous fermez l’application. La prochaine fois que vous ouvrez l’application, vous êtes déjà connecté à votre serveur.

      Sur un Mac, vous pouvez être invité à donner accès à votre trousseau Mac afin que Tableau Prep Builder puisse utiliser les certificats SSL en toute sécurité pour se connecter à votre environnement Tableau Server ou Tableau Online.

      Si vous effectuez une sortie vers Tableau Online, incluez le pod sur lequel votre site est hébergé dans « serverUrl », par exemple, « https://eu-west-1a.online.tableau.com », et non « https://online.tableau.com ».

    • Projet : sélectionnez le projet où vous souhaitez charger la source de données et l'extrait.

    • Nom : entrez un nom de fichier.

    • Description : entrez une description pour la source de données.

  4. (version 2020.2.1 et versions ultérieures) Dans la section Options d’écriture, consultez l’option d’écriture par défaut pour écrire les nouvelles données sur vos fichiers et apporter des modifications si nécessaire. Pour plus d'informations, consultez Configurer les options d’écriture.

    • Créer une table : cette option crée une nouvelle table ou remplace la table existante par la nouvelle sortie.

    • Ajouter à la table : cette option ajoute les nouvelles données à votre table existante. Si la table n’existe pas déjà, une nouvelle table est créée et les exécutions suivantes ajoutent de nouvelles lignes à cette table.

  5. Cliquez sur Exécuter le flux pour exécuter le flux et publier la source de données.

Enregistrer les données de sortie de flux dans des bases de données externes (version 2020.3.1 et versions ultérieures)

Important : cette fonctionnalité vous permet de supprimer et de remplacer définitivement des données dans une base de données externe. Assurez-vous de disposer d’autorisations en écriture sur la base de données.
Pour éviter la perte de données, vous pouvez utiliser l’option SQL personnalisé pour faire une copie des données de votre table et l’exécuter avant d’écrire les données de flux sur la table.

Vous pouvez vous connecter aux données depuis n’importe lequel des connecteurs prenant en charge Tableau Prep Builder et envoyant des données à une base de données externe. Vous pouvez ainsi ajouter ou mettre à jour les données dans votre base de données avec des données nettoyées et préparées à partir de votre flux chaque fois que le flux est exécuté. Cette fonctionnalité est disponible à la fois pour les actualisations incrémentielles et les actualisations complètes. Pour plus d’informations sur la configuration d'une actualisation incrémentielle, consultez Actualiser les données de flux à l’aide d'une actualisation incrémentielle.

Lorsque vous enregistrez votre sortie de flux dans une base de données externe, Tableau Prep Builder effectue les opérations suivantes :

  1. Génère les lignes et exécute toutes les commandes SQL sur la base de données.
  2. Écrit les données dans une table temporaire (ou zone de transit en cas de sortie sur Snowflake) dans la base de données de sortie.
  3. Si l’opération réussit, les données sont déplacées de la table temporaire (ou de votre zone de transit pour Snowflake) dans la table de destination.
  4. Exécute toutes les commandes SQL que vous souhaitez exécuter après avoir écrit les données sur la base de données.

Si le script SQL échoue, le flux échoue. Toutefois, vos données seront toujours chargées dans vos tables de base de données. Vous pouvez essayer de réexécuter le flux ou d’exécuter manuellement votre script SQL sur votre base de données pour l’appliquer.

Options de sortie

Vous pouvez sélectionner les options suivantes lors de l’écriture de données sur une base de données. Si la table n’existe pas déjà, elle est créée lors de la première exécution du flux.

  • Ajouter à la table : cette option ajoute des données à une table existante. Si la table n’existe pas, la table est créée lors de l’exécution initiale du flux et des données sont ajoutées à cette table à chaque exécution ultérieure du flux .
  • Créer une table : cette option crée une nouvelle table avec les données de votre flux. Si la table existe déjà, la table et toute structure de données ou de propriétés existante définie pour la table sont supprimées et remplacées par une nouvelle table qui utilise la structure de données du flux. Tous les champs existant dans le flux sont ajoutés à la nouvelle table de base de données.
  • Remplacer les données : cette option supprime les données de votre table existante et les remplace par les données de votre flux, mais conserve la structure et les propriétés de la table de base de données. Si la table n’existe pas, la table est créée lors de l’exécution initiale du flux et les données de table sont remplacées lors de chaque exécution ultérieure du flux .

Options supplémentaires

En plus des options d’écriture, vous pouvez également inclure des scripts SQL personnalisés ou ajouter une nouvelle table à votre base de données.

  • Scripts SQL personnalisés : entrez votre SQL personnalisé et choisissez d’exécuter votre script avant, après, ou bien avant et après l’écriture des données dans les tables de base de données. Vous pouvez utiliser ces scripts pour créer une copie de votre table de base de données avant que les données de flux ne soient écrites sur la table, ajouter un index, ajouter d’autres propriétés de table, et ainsi de suite.
  • Ajouter une nouvelle table : ajoutez une nouvelle table portant un nom unique à la base de données au lieu d’en sélectionner une dans la liste de table existante. Si vous souhaitez appliquer un schéma autre que le schéma par défaut (Microsoft SQL Server et PostgreSQL), vous pouvez le spécifier à l’aide de la syntaxe [schema name].[table name]. Pour inclure les crochets dans le nom de la table, doublez le crochet d’ouverture et triplez le crochet de fermeture, par exemple [[nom de table]]].

Bases de données prises en charge et exigences relatives aux bases de données

Tableau Prep Builder prend en charge l’écriture de données de flux sur des tables dans un certain nombre de bases de données. Les flux qui s’exécutent de manière programmée dans Tableau Online ne peuvent écrire sur ces bases de données que s’ils sont hébergés dans le cloud.

Des restrictions ou des exigences en matière de données s’appliquent à certaines bases de données. Tableau Prep Builder peut également imposer certaines limites afin de conserver des performances maximales lors de l'écriture de données sur les bases de données prises en charge. Le tableau suivant répertorie les bases de données où vous pouvez enregistrer vos données de flux et toutes les restrictions ou exigences relatives aux bases de données. Les données qui ne répondent pas à ces exigences peuvent générer des erreurs lors de l’exécution du flux.

Remarque : Tableau Prep Builder ne prend pas encore en charge la définition des limites de caractères pour vos champs. Par contre, vous pouvez créer, dans votre base de données, des tables qui incluent des contraintes de limite de caractères, puis utiliser l’option Remplacer les données pour remplacer vos données tout en conservant la structure de la table dans votre base de données.

Base de données Exigences ou restrictions
Amazon Redshift
  • L’assemblage n’est pas pris en charge. Les noms de champ sont convertis entièrement en minuscules.
  • Les valeurs de champ de texte peuvent comporter jusqu’à 8192 caractères. Les valeurs plus longues seront tronquées.
Microsoft SQL Server
  • Les valeurs de champ de texte peuvent comporter jusqu’à 3072 caractères. Les valeurs plus longues seront tronquées.

MySQL
  • Les valeurs de champ de texte peuvent comporter jusqu’à 8192 caractères. Les valeurs plus longues seront tronquées.
Oracle
  • Les noms de champs et de table ne peuvent pas dépasser 30 caractères.
  • Les valeurs de champ de texte peuvent comporter jusqu’à 1000 caractères. Les valeurs plus longues seront tronquées.
  • Les caractères spéciaux dans les noms de champ peuvent causer des erreurs.
PostgreSQL
  • Les valeurs de champ de texte peuvent comporter jusqu’à 8192 caractères. Les valeurs plus longues seront tronquées.
Snowflake
  • Les valeurs de champ de texte peuvent comporter jusqu’à 8192 caractères. Les valeurs plus longues seront tronquées.
  • Les options d’entrepôt doivent être définies sur la reprise automatique pour permettre à Tableau Prep d’écrire des données dans l’entrepôt de bases de données. Pour plus d’informations, consultez Suspension et reprise automatique(Link opens in a new window) dans la documentation de Snowflake.

Teradata
  • Les valeurs de champ de texte peuvent comporter jusqu’à 1000 caractères. Les valeurs plus longues seront tronquées.

Enregistrer les données de flux dans une base de données

  1. Cliquez sur l'icône plus dans une étape et sélectionnez Ajouter une sortie.
  2. Dans la liste déroulante Enregistrer la sortie dans, sélectionnez Table de base de données.
  3. Sous l’onglet Paramètres, entrez les informations suivantes :
    • Dans la liste déroulante Connexion, sélectionnez le connecteur de base de données où vous souhaitez écrire votre sortie de flux. Seuls les connecteurs pris en charge s’affichent. Il peut s’agir du même connecteur que celui que vous avez utilisé pour votre entrée de flux ou d’un connecteur différent. Si vous sélectionnez un autre connecteur, vous serez invité à vous connecter.

      Important: assurez-vous d’avoir l’autorisation d’écriture sur la base de données que vous sélectionnez. Dans le cas contraire, le flux risque de ne traiter les données que partiellement.

    • Dans la liste déroulante Base de données, sélectionnez la base de données où vous souhaitez enregistrer vos données de sortie de flux.
    • Dans la liste déroulante Table, sélectionnez la table où vous souhaitez enregistrer vos données de sortie de flux. Selon l’Option d’écriture que vous sélectionnez, une nouvelle table sera créée, les données de flux remplaceront toutes les données existantes dans la table, ou les données de flux seront ajoutées à la table existante.

      Pour créer une table dans la base de données, entrez plutôt un nom de table unique dans le champ, puis cliquez sur Créer une nouvelle table. Lorsque vous exécutez le flux pour la première fois, quelle que soit l’option d’écriture que vous sélectionnez, la table est créée dans la base de données en utilisant le même schéma que le flux.

  4. Le volet Sortie affiche un instantané de vos données. Une comparaison de champ vous montre les champs de votre flux qui correspondent aux champs de votre table, si la table existe déjà. Si la table est nouvelle, une correspondance élément par élément s’affiche.

    En cas de non-correspondance de champ, une note d’état vous montre toutes les erreurs.

    • Pas de correspondance : le champ est ignoré : les champs existent dans le flux mais pas dans la base de données. Le champ ne sera pas ajouté à la table de base de données sauf si vous sélectionnez l’option d'écriture Créer une table et effectuez une actualisation complète. Ensuite, les champs de flux sont ajoutés à la table de base de données et utilisent le schéma de sortie de flux.
    • Aucune correspondance : le champ contiendra des valeurs null : des champs existent dans la base de données, mais pas dans le flux. Le flux transmet une valeur null à la table de base de données du champ. Si le champ existe dans le flux, mais qu’il n'y a pas de correspondance parce que le nom du champ est différent, vous pouvez accéder à une étape de nettoyage et modifier le nom du champ afin qu'il corresponde au nom du champ de base de données. Pour savoir comment modifier le nom d’un champ, consultez Appliquer des opérations de nettoyage.
    • Erreur : les types de données de champ ne correspondent pas : le type de données attribué à un champ dans le flux et la table de base de données sur laquelle vous écrivez votre sortie doit correspondre, sinon le flux échouera. Vous pouvez accéder à une étape de nettoyage et modifier le type de données de champ pour résoudre ce problème. Pour plus d’informations sur la modification des types de données, consultez Vérifier les types de données affectés à vos données.
  5. Sélectionnez une option d’écriture. Vous pouvez sélectionner une option différente pour l’actualisation complète et incrémentielle et l’option est appliquée lorsque vous sélectionnez la méthode d’exécution de votre flux. Pour plus d’informations sur l'exécution de flux à l’aide d'une actualisation incrémentielle, consultez Actualiser les données de flux à l’aide d'une actualisation incrémentielle.
    • Ajouter à la table : cette option ajoute des données à une table existante. Si la table n’existe pas, la table est créée lors de l’exécution initiale du flux et des données sont ajoutées à cette table à chaque exécution ultérieure du flux .
    • Créer une table : cette option crée une nouvelle table. S'il existe déjà une table du même nom, la table existante est supprimée et remplacée par la nouvelle table. Toutes les structures ou les propriétés de données existantes définies pour la table sont également supprimées et remplacées par la structure de données du flux. Tous les champs existant dans le flux sont ajoutés à la nouvelle table de base de données.
    • Remplacer les données : cette option supprime les données de votre table existante et les remplace par les données de votre flux, mais conserve la structure et les propriétés de la table de base de données.
  6. (facultatif) Cliquez sur l’onglet SQL personnalisé et entrez votre script SQL. Vous pouvez entrer un script à exécuter avant et après l’écriture des données sur la table.

  7. Cliquez sur Exécuter le flux pour exécuter le flux et écrire vos données dans votre base de données sélectionnée.

 

Autres articles de cette section

Merci de vos commentaires ! Erreur lors de la soumission de votre commentaire. Réessayez ou envoyez-nous un message.