Actualiser les données de flux à l’aide d’une actualisation incrémentielle

Remarque : depuis la version 2020.4.1, vous pouvez désormais créer et modifier des flux dans Tableau Server et Tableau Cloud. Le contenu de cette rubrique s’applique à toutes les plates-formes, sauf mention spécifique. Pour plus d’informations sur la création de flux sur le Web, consultez Tableau Prep sur le Web(Le lien s’ouvre dans une nouvelle fenêtre) dans l’aide de Tableau Server.

Depuis Tableau Prep Builder version 2020.2.1 et sur le Web, vous pouvez configurer l’actualisation incrémentielle des entrées et des sorties dans votre flux. Ainsi, seules les nouvelles lignes seront récupérées et traitées lors de l’exécution du flux, d’où un gain de temps et de ressources.

Par exemple, si votre flux inclut des données de transaction qui sont mises à jour quotidiennement, vous pouvez configurer des actualisations incrémentielles afin de récupérer et de traiter uniquement les nouvelles transactions quotidiennes, puis exécuter une actualisation complète hebdomadaire ou mensuelle afin d’actualiser toutes vos données de flux.

Remarque : pour exécuter une actualisation incrémentielle sur les entrées de flux qui utilisent le connecteur Salesforce, vous devez utiliser Tableau Prep Builder version 2021.1.2 ou ultérieure. L’actualisation incrémentielle n’est actuellement pas prise en charge lors de l’écriture de sorties de flux dans Microsoft Excel ou CRM Analytics.

Pour exécuter votre flux à l’aide d’un actualisation incrémentielle, Tableau Prep a besoin des renseignements suivants :

  • Le champ qui détecte les nouvelles lignes dans la table des données entrantes.
  • Le champ à utiliser pour comparer les dernières valeurs traitées dans la sortie de flux avec les valeurs des données entrantes afin de déterminer les lignes nouvelles. Pour plus d’informations, consultez Actualisation incrémentielle avec Append.
  • La manière dont vous souhaitez écrire les nouvelles données sur vos tables. Vous pouvez ajouter de nouvelles données à vos tables existantes, remplacer les données de vos tables par de nouvelles données, ou, depuis Tableau Prep Builder version 2020.3.1 et sur le Web, remplacer les données dans une table existante.

Options d’actualisation de flux

Tableau Prep vous permet de sélectionner le mode d’actualisation de vos données ainsi que le mode de mise à jour de vos tables avec la sortie de flux. Le tableau suivant décrit les différentes options et leurs avantages.

Combinaison d’actualisationsDonnées traitéesMise à jour de tablesAvantages
Actualisation complète + Créer une tableToutes installationsCréez une table ou remplacez la table existante avec l’ensemble de données complet.

Actualisez toutes les données à chaque exécution de flux.

Actualisation complète + Ajouter à une tableToutes installationsAjoutez de nouvelles lignes à la table existante.Gardez une trace des données nouvelles et des données existantes à chaque exécution de flux. L’option Ajouter à la table n’est pas disponible pour les types de sortie .csv.
Actualisation complète + Remplacer les donnéesToutes installationsRemplacez les lignes de la table existante.Conservez la structure de schéma de table existante, mais remplacez toutes les données à chaque exécution de flux.
Actualisation incrémentielle + Créer une tableNouvelles lignes uniquementCréez ou remplacez une table existante avec les nouvelles lignes uniquement.Créez une nouvelle table avec les nouvelles lignes uniquement en tant qu’ensemble de données complet.

Si la source de données de sortie n’existe pas ou ne peut pas être connectée lors de l’exécution du flux, le flux échouera. Une actualisation complète est nécessaire pour créer la sortie avant qu’elle puisse être utilisée de manière incrémentielle.

Actualisation incrémentielle + Ajouter à une tableNouvelles lignes uniquementAjoutez les nouvelles lignes à la table existante.

Ajoutez uniquement les nouvelles lignes à la table existante. L’option Ajouter à la table n’est pas disponible pour les types de sortie .csv. Consultez Actualisation incrémentielle avec Append.

Actualisation incrémentielle + Remplacer les donnéesNouvelles lignes uniquementRemplacez toutes les lignes de la table existante par les nouvelles lignes uniquement.Conservez votre structure de schéma de table existante, mais remplacez toutes les données par les nouvelles lignes uniquement, ce qui en fait un ensemble de données complet.

Configurer une actualisation incrémentielle

Pour configurer votre flux de manière à utiliser une actualisation incrémentielle, vous devez spécifier des paramètres à la fois lors des étapes Entrée et les étapes Sortie où vous souhaitez utiliser cette option. Dans l’étape Entrée, spécifiez comment Tableau Prep va trouver vos nouvelles lignes. Dans l’étape Sortie, spécifiez comment les nouvelles lignes sont écrites sur votre table. Lorsque vous exécutez le flux, vous pouvez sélectionner un type d’actualisation complète ou incrémentielle.

Conseil : une fois que vous avez configuré vos étapes de d’entrée et de sortie pour l’actualisation incrémentielle, vous pouvez conserver vos configurations et les réutiliser. Copiez et collez les étapes pour les utiliser ailleurs dans votre flux actuel ou dans Tableau Prep Builder, utilisez Enregistrer les étapes en tant que flux pour enregistrer les étapes sélectionnées dans un fichier local ou sur votre serveur afin de les réutiliser dans d’autres flux. Pour plus d’informations sur le copier-coller ou la réutilisation d’étapes, consultez Copier des étapes, des actions et des champs.

  1. Dans le volet Flux, sélectionnez l’étape de saisie que vous souhaitez configurer pour l’actualisation incrémentielle.
  2. Dans le volet Entrée de l’onglet Paramètres, dans la section Actualisation incrémentielle (section Configurer l’actualisation incrémentielle dans les versions antérieures), définissez les options suivantes :
    • Sélectionnez Activer l’actualisation incrémentielle (Activerdans les versions antérieures).

    • Champ de saisie (Identifier les nouvelles lignes à l’aide du champ dans les versions antérieures) : sélectionnez le champ que vous souhaitez actualiser dans vos données d’entrée. Un type de données de Nombre (entier), Date ou Date et heure doit être attribué à ce champ. Actuellement, vous ne pouvez sélectionner qu’un seul champ.

      Remarque : vous pouvez supprimer ou renommer ce champ ultérieurement dans le flux, tant que le champ que vous spécifiez dans Champ de sortie (Nom du champ dans la sortie dans les versions antérieures) peut être utilisé pour comparer ce champ avec la sortie la plus récente afin de trouver les nouvelles lignes.

    • Sortie : sélectionnez la sortie qui est liée à votre entrée et qui inclut le champ à utiliser pour comparer les lignes.

    • Champ de sortie (Nom du champ dans la sortie dans les versions antérieures) : sélectionnez le champ à utiliser pour comparer les dernières valeurs traitées dans la sortie de flux avec les valeurs d’entrée pour trouver les nouvelles lignes. Ce champ doit avoir le même type de données que le champ spécifié dans Champ d’entrée (Identifier les nouvelles lignes à l’aide du champ dans les versions antérieures).

    Actualisation incrémentielle avec Append

    L’actualisation incrémentielle recherche d’abord la valeur maximale existante du champ incrémentiel dans la sortie. Elle filtre ensuite les lignes de l’entrée pour ajouter uniquement les lignes avec une valeur plus grande dans le champ incrémentiel. Par exemple :

    Tableau existant :

    Col1Col2
    ID 5Ligne 5

    Ajouter de nouvelles lignes au tableau en fonction de col1 :

    Col1Col2
    ID 1NewRow1
    ID 6NewRow6
    • NewRow1 n’est pas ajoutée.
    • NewRow6 est ajoutée.

Configurer les options d’écriture

Pour terminer la configuration de l’actualisation incrémentielle, définissez vos Options d’écriture de sortie pour spécifier comment les nouvelles lignes sont écrites sur vos tables. Toutes les sorties qui sont liées à l’étape de saisie configurée ont une option d’écriture par défaut sélectionnée, mais vous pouvez la modifier en une option prise en charge.

Vous pouvez publier vos lignes dans un fichier (Tableau Prep Builder uniquement), une source de données publiée ou une base de données. Par défaut, les sorties vers des extraits locaux ou .hyper publiés sont définies sur Ajouter à la table. Les sorties vers des types de fichiers .csv sont définies sur Créer la table.

  1. Dans le volet Flux, sélectionnez l’étape de sortie que vous souhaitez configurer pour l’actualisation incrémentielle.

  2. Dans le volet Sortie, dans la section Options d’écriture, consultez l’option d’écriture par défaut et apportez des modifications si nécessaire.

    • Créer une table : cette option crée une nouvelle table ou remplace la table existante par la nouvelle sortie.
    • Ajouter à la table : cette option ajoute les nouvelles données à votre table existante. Si la table n’existe pas déjà, une nouvelle table est créée lors de la première exécution du flux et les exécutions suivantes ajoutent les nouvelles lignes à cette table. Non disponible pour les types de sortie .csv. Pour plus d’informations sur les combinaisons d’actualisations prises en charge, consultez Options d’actualisation de flux.
    • Remplacer les données (Tableau Prep Builder depuis la version 2020.3.1 et versions ultérieures, et sur le Web) : cette option est disponible lorsque vous souhaitez écrire votre sortie en la réintégrant dans une table existante d’une base de données. Cette option remplace les données de la table de base de données par les données de flux, mais conserve la structure du schéma de la table.

Exécuter votre flux

Vous pouvez exécuter des flux individuels à l’aide d’une actualisation incrémentielle dans Tableau Prep Builder, sur le Web ou depuis la ligne de commande. Pour plus d’informations sur l’exécution de votre flux à partir de la ligne de commande, consultez Exécuter le flux avec l’actualisation incrémentielle activée.

Si vous avez Data Management avec Tableau Prep Conductor activé, vous pouvez exécuter votre flux à l’aide d’une actualisation incrémentielle en définissant une programmation dans Tableau Server ou Tableau Cloud. Pour plus d’informations sur l’exécution programmée de votre flux, consultez Planifier des tâches de flux(Le lien s’ouvre dans une nouvelle fenêtre) dans l’aide de Tableau Server.

Remarque : dans la version précédente, les options d’écriture sont définies dans Tableau Prep Builder et ne peuvent pas être modifiées lors de l’exécution de votre flux dans Tableau Server ou Tableau Cloud. Depuis Tableau Server et Tableau Cloud version 2020.4, vous pouvez modifier le flux directement dans le Web. Pour plus d’informations sur l’utilisation de Tableau Prep sur le Web, consultez Tableau Prep sur le Web(Le lien s’ouvre dans une nouvelle fenêtre) dans l’aide de Tableau Server.

Tableau Prep exécute une actualisation complète pour toutes les sorties quelle que soit l’option d’exécution que vous sélectionnez si aucune sortie existante n’est trouvée. Les flux ultérieurs utilisent le processus d’actualisation incrémentielle et récupèrent et traitent uniquement les nouvelles lignes à moins qu’il ne manque des données de configuration de l’actualisation incrémentielle ou que la sortie existante ne soit supprimée.

  • Pour exécuter le flux dans Tableau Prep à l’aide d’une actualisation incrémentielle, sélectionnez Actualisation incrémentielle dans l’un des emplacements suivants :
    • Dans le menu supérieur, cliquez sur l’option déroulante du bouton Exécuter.

    • Dans le volet Sortie, cliquez sur l’option déroulante de l’option Exécuter le flux.

    • Dans le volet Flux, cliquez sur l’option déroulante du bouton Exécuter à côté de l’étape Sortie.

    • Si une entrée pour laquelle vous avez activé l’actualisation incrémentielle est associée à plusieurs sorties, ces sorties doivent être exécutées ensemble et doivent utiliser le même type d’actualisation. Lorsque vous exécutez votre actualisation dans Tableau Prep, une boîte de dialogue s’affiche pour vous indiquer que vous devez exécuter les deux sorties ensemble.

  • Merci de vos commentaires!Votre commentaire s été envoyé avec succès. Merci!