Actualiser les données de flux à l’aide d'une actualisation incrémentielle

Remarque : depuis la version 2020.4.1, vous pouvez désormais créer et modifier des flux dans Tableau Server et Tableau Online. Le contenu de cette rubrique s’applique à toutes les plates-formes, sauf mention spécifique. Pour plus d’informations sur la création de flux sur le Web, consultez Tableau Prep sur le Web.

Depuis Tableau Prep Builder version 2020.2.1 et sur le Web, vous pouvez configurer l'actualisation incrémentielle des entrées et des sorties dans votre flux. Ainsi, seules les nouvelles lignes seront récupérées et traitées lors de l'exécution du flux, d'où un gain de temps et de ressources.

Par exemple, si votre flux inclut des données de transaction qui sont mises à jour quotidiennement, vous pouvez configurer des actualisations incrémentielles afin de récupérer et de traiter uniquement les nouvelles transactions quotidiennes, puis exécuter une actualisation complète hebdomadaire ou mensuelle afin d'actualiser toutes vos données de flux.

Remarque : pour exécuter une actualisation incrémentielle sur les entrées de flux qui utilisent le connecteur Salesforce, vous devez utiliser Tableau Prep Builder version 2021.1.2 ou ultérieure.

Pour exécuter votre flux à l’aide d’un actualisation incrémentielle, Tableau Prep a besoin des informations suivantes :

  • Le champ qui détecte les nouvelles lignes dans la table des données entrantes.
  • Le champ à utiliser pour comparer les dernières valeurs traitées dans la sortie de flux avec les valeurs des données entrantes afin de déterminer les lignes nouvelles.
  • La manière dont vous souhaitez écrire les nouvelles données sur vos tables. Vous pouvez ajouter de nouvelles données à vos tables existantes, remplacer les données de vos tables par de nouvelles données, ou, depuis Tableau Prep Builder version 2020.3.1 et sur le Web, remplacer les données dans une table existante.

Options d'actualisation de flux

Tableau Prep vous permet de sélectionner le mode d'actualisation de vos données ainsi que le mode de mise à jour de vos tables avec la sortie de flux. Le tableau suivant décrit les différentes options et leurs avantages.

Combinaison d'actualisations Données traitées Mise à jour de tables Avantages
Actualisation complète + Créer une table Toutes installations Créez une table ou remplacez la table existante avec l’ensemble de données complet.

Actualisez toutes les données à chaque exécution de flux.

Actualisation complète + Ajouter à une table Toutes installations Ajoutez de nouvelles lignes à la table existante. Gardez une trace des données nouvelles et des données existantes à chaque exécution de flux. L'option Ajouter à la table n’est pas disponible pour les types de sortie .csv.
Actualisation complète + Remplacer les données Toutes installations Remplacez les lignes de la table existante. Conservez la structure de schéma de table existante, mais remplacez toutes les données à chaque exécution de flux.
Actualisation incrémentielle + Créer une table Nouvelles lignes uniquement Créez ou remplacez une table existante avec les nouvelles lignes uniquement.

Créez une nouvelle table avec les nouvelles lignes uniquement en tant qu’ensemble de données complet.

Actualisation incrémentielle + Ajouter à une table Nouvelles lignes uniquement Ajoutez les nouvelles lignes à la table existante. Ajoutez uniquement les nouvelles lignes à la table existante. L'option Ajouter à la table n’est pas disponible pour les types de sortie .csv.
Actualisation incrémentielle + Remplacer les données Nouvelles lignes uniquement Remplacez toutes les lignes de la table existante par les nouvelles lignes uniquement. Conservez votre structure de schéma de table existante, mais remplacez toutes les données par les nouvelles lignes uniquement, ce qui en fait un ensemble de données complet.

Configurer une actualisation incrémentielle

Pour configurer votre flux de manière à utiliser une actualisation incrémentielle, vous devez spécifier des paramètres à la fois lors des étapes Entrée et les étapes Sortie où vous souhaitez utiliser cette option. Dans l’étape Entrée, spécifiez comment Tableau Prep va trouver vos nouvelles lignes. Dans l'étape Sortie, spécifiez comment les nouvelles lignes sont écrites sur votre table. Lorsque vous exécutez le flux, vous pouvez sélectionner un type d'actualisation complète ou incrémentielle.

Conseil : une fois que vous avez configuré vos étapes de d’entrée et de sortie pour l’actualisation incrémentielle, vous pouvez conserver vos configurations et les réutiliser. Copiez et collez les étapes pour les utiliser ailleurs dans votre flux actuel ou dans Tableau Prep Builder, utilisez Enregistrer les étapes en tant que flux pour enregistrer les étapes sélectionnées dans un fichier local ou sur votre serveur afin de les réutiliser dans d’autres flux. Pour plus d'informations sur le copier-coller ou la réutilisation d'étapes, consultez Copier des étapes, des actions et des champs.

  1. Dans le volet Flux, sélectionnez l'étape des données entrantes que vous souhaitez configurer pour l'actualisation incrémentielle.
  2. Dans le volet Entrée de l'onglet Paramètres, dans la section Actualisation incrémentielle (section Configurer l'actualisation incrémentielle dans les versions antérieures), définissez les options suivantes :
    • Sélectionnez Activer l’actualisation incrémentielle(Activerdans les versions antérieures).

    • Champ d’entrée (Identifier les nouvelles lignes à l’aide du champ dans les versions antérieures) : sélectionnez le champ que vous souhaitez actualiser dans vos données d’entrée. Un type de données de Nombre (entier), Date ou Date et heure doit être attribué à ce champ. Actuellement, vous ne pouvez sélectionner qu’un seul champ.

      Remarque : vous pouvez supprimer ou renommer ce champ ultérieurement dans le flux, tant que le champ que vous spécifiez dans Champ de sortie (Nom du champ dans la sortie dans les versions antérieures) peut être utilisé pour comparer ce champ avec la sortie la plus récente afin de trouver les nouvelles lignes.

    • Sortie : sélectionnez la sortie qui est liée à votre entrée et qui inclut le champ à utiliser pour comparer les lignes.

    • Champ de sortie (Nom du champ dans la sortie dans les versions antérieures) : sélectionnez le champ à utiliser pour comparer les dernières valeurs traitées dans la sortie de flux avec les valeurs d’entrée pour trouver les nouvelles lignes. Ce champ doit avoir le même type de données que le champ spécifié dans Champ d’entrée (Identifier les nouvelles lignes à l’aide du champ dans les versions antérieures).

Configurer les options d’écriture

Pour terminer la configuration de l'actualisation incrémentielle, définissez vos Options d’écriture de sortie pour spécifier comment les nouvelles lignes sont écrites sur vos tables. Toutes les sorties qui sont liées à l’étape des données entrantes configurée ont une option d’écriture par défaut sélectionnée, mais vous pouvez la modifier en une option prise en charge.

Vous pouvez publier vos lignes dans un fichier (Tableau Prep Builder uniquement), une source de données publiée ou une base de données. Par défaut, les sorties vers des extraits locaux ou .hyper publiés sont définies sur Ajouter à la table. Les sorties vers des types de fichiers .csv sont définies sur Créer la table.

  1. Dans le volet Flux, sélectionnez l'étape de sortie que vous souhaitez configurer pour l'actualisation incrémentielle.

  2. Dans le volet Sortie, dans la section Options d’écriture, consultez l’option d’écriture par défaut et apportez des modifications si nécessaire.

    • Créer une table : cette option crée une nouvelle table ou remplace la table existante par la nouvelle sortie.
    • Ajouter à la table : cette option ajoute les nouvelles données à votre table existante. Si la table n’existe pas déjà, une nouvelle table est créée lors de la première exécution du flux et les exécutions suivantes ajoutent les nouvelles lignes à cette table. Non disponible pour les types de sortie .csv. Pour plus d’informations sur les combinaisons d'actualisations prises en charge, consultez Options d'actualisation de flux.
    • Remplacer les données (Tableau Prep Builder depuis la version 2020.3.1 et versions ultérieures, et sur le Web) : cette option est disponible lorsque vous souhaitez écrire votre sortie en la réintégrant dans une table existante d’une base de données. Cette option remplace les données de la table de base de données par les données de flux, mais conserve la structure du schéma de la table.

Exécuter votre flux

Vous pouvez exécuter des flux individuels à l’aide d’une actualisation incrémentielle dans Tableau Prep Builder, sur le Web ou depuis la ligne de commande. Pour plus d’informations sur l’exécution de votre flux à partir de la ligne de commande, voir Exécuter le flux en activant l'actualisation incrémentielle (version 2020.2.1 et versions ultérieures).

Si vous avez le module Data Management Add-on avec Tableau Prep Conductor activé, vous pouvez exécuter votre flux à l’aide d’une actualisation incrémentielle en définissant une programmation dans Tableau Server ou Tableau Online. Pour plus d'informations sur l'exécution programmée de votre flux, consultez Planifier des tâches de flux.

Remarque : dans la version précédente, les options d’écriture sont définies dans Tableau Prep Builder et ne peuvent pas être modifiées lors de l’exécution de votre flux dans Tableau Server ou Tableau Online. Depuis Tableau Server et Tableau Online version 2020.4, vous pouvez modifier le flux directement dans le Web. Pour plus d’informations sur l’utilisation de Tableau Prep sur le Web, consultez Tableau Prep sur le Web.

Tableau Prep exécute une actualisation complète pour toutes les sorties quelle que soit l'option d’exécution que vous sélectionnez si aucune sortie existante n'est trouvée. Les flux ultérieurs utilisent le processus d'actualisation incrémentielle et récupèrent et traitent uniquement les nouvelles lignes à moins qu’il ne manque des données de configuration de l'actualisation incrémentielle ou que la sortie existante ne soit supprimée.

  • Pour exécuter le flux dans Tableau Prep à l’aide d’une actualisation incrémentielle, sélectionnez Actualisation incrémentielle dans l'un des emplacements suivants :
    • Dans le menu supérieur, cliquez sur l’option déroulante du bouton Exécuter.

    • Dans le volet Sortie, cliquez sur l’option déroulante de l'option Exécuter le flux.

    • Dans le volet Flux, cliquez sur l'option déroulante du bouton Exécuter à côté de l'étape Sortie.

    • Si une entrée pour laquelle vous avez activé l'actualisation incrémentielle est associée à plusieurs sorties, ces sorties doivent être exécutées ensemble et doivent utiliser le même type d'actualisation. Lorsque vous exécutez votre actualisation dans Tableau Prep, une boîte de dialogue s'affiche pour vous indiquer que vous devez exécuter les deux sorties ensemble.

  • Merci de vos commentaires !