Actualiser les extraits

Lorsque les données d’origine sont modifiées, vous pouvez actualiser l’extrait à l’aide de Desktop en sélectionnant une source de données dans le menu Données, puis en sélectionnant Extrait et Actualiser. Les extraits peuvent être configurés de deux manières : avec une actualisation complète ou incrémentielle.

Lors d’une actualisation complète, toutes les données de l’extrait sont remplacées par les dernières informations de la source de données d’origine. Une actualisation incrémentielle comporte deux variantes : ajouter uniquement les nouvelles lignes depuis la dernière actualisation ou définir une période à partir de la date d’actualisation en vue de l’actualisation. La deuxième approche facultative traite de la nécessité de mettre à jour l’extrait s’il est possible que des données déjà extraites aient changé dans la source de données. Pour plus de détails sur la façon d’extraire vos données, consultez Extraire vos données.

Remarque : Vous pouvez également automatiser les actualisations d’extraits à l’aide de l’Utilitaire de ligne de commande Tableau Data Extract.

Avant d’actualiser des extraits

Si vous souhaitez actualiser un extrait, notez le format de fichier de l’extrait avant d’effectuer la tâche d’actualisation d’extrait. Si vous effectuez une actualisation d’un extrait .tde en utilisant la version 2022,4 ou une version récente, l’extrait est mis à niveau automatiquement vers un extrait .hyper. Si la mise à niveau à un extrait .hyper présente de nombreux avantages, vous ne pourrez toutefois pas ouvrir l’extrait avec les versions antérieures de Tableau Desktop. Pour plus d’informations, consultez Mise à niveau d’extraits vers le format .hyper.

Remarque : Les fichiers .tde ne sont plus pris en charge sous n’importe quelle forme après la version 2024.2 de Tableau, et ils doivent être mis à niveau au format .hyper pour être utilisés.

Configurer une actualisation d’extrait complète

Par défaut, les extraits sont actualisés dans leur intégralité. Cela signifie qu’à chaque actualisation de l’extrait, toutes les lignes sont remplacées par les données de la source de données d’origine. Si ce type d’actualisation vous permet d’obtenir une copie exacte du contenu des données d’origine, selon la taille de l’extrait, une actualisation complète peut parfois demander beaucoup de temps et faire peser une lourde charge sur la base de données. Si un extrait n’est pas configuré pour une actualisation incrémentielle, la sélection de l’actualisation de l’extrait entraîne une actualisation complète de l’extrait.

Publier dans Tableau Server

Si vous comptez publier l’extrait en tant que source de données sur Tableau Server, vous pouvez spécifier une programmation pour l’actualisation d’extrait pendant la publication.

Une boîte de dialogue pour programmer une actualisation des données.

De même, si vous publiez l’extrait dans un classeur sur Tableau Server, vous pouvez aussi spécifier une programmation pour l’actualisation d’extrait pendant la publication. Pour plus d’informations, consultez Programmer des actualisations d’extrait tandis que vous publiez un classeur.

Publier dans Tableau Cloud

Si vous comptez publier l’extrait en tant que source de données sur Tableau Cloud, vos options d’actualisation des données dépendent des caractéristiques de vos sources de données. Pour plus d’informations sur l’actualisation des données depuis des sources de données spécifiques, consultez Options d’actualisation des données par source de données.

Configurer une actualisation d’extrait incrémentielle

La plupart des sources de données prennent en charge l’actualisation incrémentielle. Plutôt que d’actualiser la totalité de l’extrait, vous pouvez configurer l’actualisation de manière à ajouter uniquement les lignes nouvelles depuis la dernière extraction des données.

Par exemple, votre source de données peut être mise à jour tous les jours avec les nouvelles transactions de ventes. Plutôt que de recréer tous les jours la totalité de l’extrait, vous pouvez ajouter les nouvelles transactions de chaque jour. Ensuite, une fois par semaine, vous pouvez envisager d’effectuer une actualisation complète pour être sûr de posséder les données les plus récentes.

En outre, vous pouvez éventuellement configurer les paramètres incrémentiels afin de définir une sous-plage horaire pour supprimer toutes les données associées de l’extrait existant et l’actualiser complètement, en récupérant toutes les modifications ou ajouts depuis la dernière actualisation dans cette plage horaire.

Colonne non unique

À partir de la version 2024.1, Tableau introduit une fonctionnalité qui permet aux utilisateurs d’effectuer des actualisations incrémentielles sur les extraits à l’aide d’une colonne à clé non unique. Cette mise à jour introduit une étape supplémentaire dans le processus.

Actualisation de la sous-plage de dates pour les extraits incrémentiels

Les versions 2024.2 et ultérieures de Tableau permettent de spécifier une période supplémentaire pour extraire à nouveau les données précédemment extraites et capturer toutes les modifications qui auraient pu se produire. Cette action est exécutée dans les champs Plage de dates minimum à actualiser. Cette fonctionnalité est avantageuse si (par exemple) la source de données permet des insertions et des modifications rétroactives dans une période de temps définie. Une fois configuré, l’extrait incrémentiel extraira toutes les nouvelles données, ainsi que les données précédemment extraites au cours d’une plage horaire définie.

Après avoir sélectionné un nombre (2, par exemple) et une période (Mois, par exemple), le texte d’aide ci-dessous sera mis à jour pour refléter vos choix (« Les données des 2 derniers mois depuis la date d’actualisation seront actualisées systématiquement »). Si aucune plage horaire n’est indiquée, seul un contenu plus récent que celui figurant dans l’extrait existant sera extrait.

Comprendre les plages de dates minimum à actualiser

Pour qu’elles soient efficaces, la configuration des plages de dates minimum à actualiser doit tenir compte de la fréquence à laquelle vous prévoyez d’actualiser vos extraits, de la fréquence à laquelle votre source de données est mise à jour, et de la quantité de données normalement mises à jour au cours de chaque période. Il est important de comprendre comment Tableau interprète vos choix de configuration d’extrait pour garantir que l’extrait contient les données attendues.

  • Lorsqu’un certain nombre d’unités de temps est indiqué, Tableau croira qu’il faut extraire toutes les données de l’unité de temps existante plus X unités de données supplémentaires. Par exemple : Si vous le définissez sur 3 mois, il extraira toutes les données du mois en cours, ainsi que les données des 3 mois précédents. Si la date actuelle est le 1er avril, toutes les données d’avril (dans ce cas, 1 jour) ainsi que toutes les données de janvier, février et mars, soit environ 91 jours de données, seront extraites. L’exécution de la même actualisation le 28 avril extrairait les données de 28 jours d avril, plus ceux des 3 mois précédents, soit environ 118 jours de données.
  • Pour un contrôle plus précis et une plus grande cohérence, il est conseillé d’utiliser la plus petite unité de temps applicable (Jour, par exemple) qui convient à vos données. Pour actualiser systématiquement les données des 90 derniers jours ainsi que celles du jour d’actualisation, choisissez 90 comme nombre et Jour comme période.
  • Tableau vous recommande de baser votre extrait sur un champ de date/heure qui reflète la date et l’heure auxquelles un enregistrement a été introduit. Si le champ de date utilisé pour déterminer les extraits inclut des dates futures (telles que « Date de livraison de la commande prévue »), les résultats utilisant la fonctionnalité de plage de dates minimum à actualiser peuvent ne pas correspondre à vos attentes. Par exemple : Une actualisation incrémentielle est configurée pour extraire les données des deux mois précédents à partir de la date d’actualisation. Nous sommes le 1er avril, mais il existe des enregistrements dans la base de données où ce champ de date contient des valeurs allant jusqu’à 6 mois plus tard, soit le 1er septembre. Lorsque l’actualisation se produit dans cet exemple, seules les données du mois d’avril (le mois d’actualisation actuel) et les données des 2 mois précédents seront extraites. Si des modifications se sont produites dans la source de données pour les lignes associées à ces dates futures au-delà du mois d’avril, elles ne seront pas mises à jour.
  • Si la source de données contient plus de données récentes à actualiser par rapport à la période configurée, les données supplémentaires extraites commencent là où les données récentes sont apparues. Par exemple, si vous configurez la sous-plage uniquement pour les 2 jours précédents, mais que la dernière actualisation est survenue il y a 10 jours, les nouvelles données de ces 10 jours seront extraites ainsi que les données extraites précédemment pendant les deux jours supplémentaires.

Remarque : Si la structure des données source change (par exemple, suite à l’ajout d’une nouvelle colonne), vous devrez procéder à une actualisation complète de l’extrait avant de pouvoir recommencer à faire des actualisations incrémentielles.

Procédez comme suit pour configurer l’actualisation incrémentielle d’un extrait ou modifier un extrait complet existant pour utiliser l’actualisation incrémentielle.

  1. Sélectionnez une source de données dans le menu Données, puis sélectionnez Extraire des données.

  2. Dans la boîte de dialogue Extraire des données, sélectionnez Toutes les lignes pour définir le nombre de lignes à extraire. L’actualisation incrémentielle peut uniquement être définie lors de l’extraction de toutes les lignes de la base de données.

    Remarque : Vous ne pouvez pas incrémenter un extrait d’échantillon.

  3. Développer la section Actualisation incrémentielle et cochez Actualisation incrémentielle.

  4. Remarque : L’actualisation incrémentielle n’est pas disponible si vous activez l’agrégation.

  5. Indiquez une colonne de la base de données qui sera utilisée pour identifier les nouvelles lignes.

    Par exemple, vous pouvez utiliser une colonne Date, Date et heure ou ID qui augmente de manière monotone au fur et à mesure que des lignes sont ajoutées à la base de données.

  6. (Facultatif) Si vous sélectionnez une colonne Date ou Date et heure dans Tableau, vous pouvez effectuer une actualisation partielle des données de l’extrait en spécifiant une plage de dates spécifique. Déterminez le nombre de jours et spécifiez l’échelle date/heure pour établir la plage de dates minimum pour l’actualisation (par exemple, 14 jours à compter de la date d’actualisation).

  7. (Facultatif) Si aucune plage d’actualisation minimum n’est établie, développez la page Paramètres avancés pour définir le mode de récupération des nouvelles lignes. Vous pouvez choisir de remplacer les dernières lignes ajoutées par des valeurs actualisées égales ou supérieures à la dernière valeur enregistrée, ou vous pouvez choisir de conserver les dernières lignes ajoutées en actualisant uniquement l’extrait avec des valeurs supérieures à la dernière valeur enregistrée.

  8. Remarque : Lorsque des filtres sont ajoutés, les paramètres avancés pour l’actualisation incrémentielle apparaissent grisés et le paramètre par défaut « Ne pas remplacer les dernières lignes ajoutées » est appliqué. Le but est d’éviter tout conflit pouvant survenir entre certains critères de filtrage et la logique avancée d’actualisation incrémentielle « Remplacer les dernières lignes ajoutées ».

  9. Pour terminer, sélectionnez Enregistrer les paramètres.

Considérations à prendre en compte lors de l’actualisation d’extraits

Modifier un extrait

Si vous modifiez un extrait existant, la dernière actualisation s’affiche, de sorte que vous êtes sûr de mettre à jour l’extrait avec les données adéquates.

Actualisation complète

Une actualisation complète remplace toutes les lignes par les données de la source de données d’origine chaque fois que vous actualisez l’extrait. Une actualisation complète peut prendre plus de temps et demander beaucoup à la base de données.

Heure/date précise et extraits

Le moteur de données, qui est le mécanisme sous-jacent utilisé par Tableau pour créer des extraits, enregistre les valeurs temporelles avec une précision allant jusqu’à 3 décimales. Si vous spécifiez une colonne date et heure ou horodatage pour Identifier les nouvelles lignes à l’aide de la colonne, et que votre base de données utilise une précision supérieure à Tableau, vous pouvez vous retrouver avec des lignes en double après une actualisation incrémentielle. Par exemple, si la base de données comporte deux lignes, l’une avec une valeur date/heure de 2015-03-13 17:30:56.502352 et une avec une valeur date/heure de 2015-03-13 17:30:56.502852, Tableau enregistre les deux colonnes en utilisant une valeur date/heure de 2015-03-13 17:30:56.502, créant de ce fait des lignes en double.

Voir l’historique de l’extrait (Tableau Desktop)

Pour afficher un historique de l’actualisation de l’extrait, sélectionnez une source de données dans le menu Données, puis Extraire > Historique.

La boîte de dialogue Historique de l’extrait affiche la date et l’heure de chaque actualisation, complète ou incrémentielle, ainsi que le nombre de lignes qui ont été ajoutées. Si l’actualisation a été effectuée à partir d’un fichier, le nom du fichier source est également mentionné.

Tableau d’historique de l’extrait avec des options pour effacer l’historique ou fermer le tableau.