Actualiser les extraits
Lorsque les données d’origine sont modifiées, vous pouvez actualiser l’extrait à l’aide de Desktop en sélectionnant une source de données dans le menu Données, puis en sélectionnant . Les extraits peuvent être configurés de deux manières : actualisation complète ou actualisation incrémentielle.
Lors d’une actualisation complète, toutes les données de l’extrait sont remplacées par les informations les plus récentes de la source de données d’origine. Une actualisation incrémentielle se décline en deux variantes : le simple ajout des nouvelles lignes depuis la dernière actualisation ou la définition d’une période à compter de la date d’actualisation à actualiser. La deuxième approche facultative répond à la nécessité de mettre à jour l’extrait s’il existe une possibilité que des données déjà extraites aient changé dans la source de données. Si vous souhaitez davantage de détails sur la manière d’extraire vos données, consultez Extraire vos données.
Remarque : vous pouvez également automatiser les actualisations à l’aide de l’Utilitaire de ligne de commande Tableau Data Extract.
Si vous souhaitez actualiser un extrait, notez le format de fichier de l’extrait avant d’effectuer la tâche d’actualisation d’extrait. Si vous effectuez l’actualisation d’un extrait .tde
en utilisant la version 2022.4 ou supérieure, l’extrait est automatiquement mis à niveau vers un extrait .hyper
. Si la mise à niveau vers un extrait .hyper
présente de nombreux avantages, vous ne pourrez toutefois pas ouvrir l’extrait avec les versions antérieures de Tableau Desktop. Pour plus d’informations, consultez Mise à niveau d’extraits vers le format .hyper.
Remarque : les fichiers .tde ne sont plus pris en charge sous aucune forme après la version 2024.2 de Tableau et doivent être mis à niveau vers le format .hyper.
Par défaut, les extraits sont actualisés dans leur intégralité. Cela signifie qu’à chaque actualisation de l’extrait, toutes les lignes sont remplacées par les données de la source de données d’origine. Si ce type d’actualisation vous permet d’obtenir une copie exacte du contenu des données d’origine, selon la taille de l’extrait, une actualisation complète peut parfois demander beaucoup de temps et faire peser une lourde charge sur la base de données. Si un extrait n’est pas configuré pour une extraction incrémentielle, la sélection de l’actualisation de l’extrait entraîne une actualisation complète de l’extrait.
Publier sur Tableau Server
Si vous comptez publier l’extrait en tant que source de données sur Tableau Server, vous pouvez spécifier une programmation pour l’actualisation d’extrait pendant la publication.
De même, si vous publiez l’extrait dans un classeur sur Tableau Server, vous pouvez aussi spécifier une programmation pour l’actualisation d’extrait pendant la publication. Pour plus d’informations, consultez Programmer des actualisations d’extrait tandis que vous publiez un classeur.
Publier sur Tableau Cloud
Si vous comptez publier l’extrait en tant que source de données sur Tableau Cloud, vos options d’actualisation des données dépendent des caractéristiques de vos sources de données. Pour plus d’informations sur l’actualisation des données depuis des sources de données spécifiques, consultez Options d’actualisation des données par source de données.
La plupart des sources de données prennent en charge l’actualisation incrémentielle. Plutôt que d’actualiser la totalité de l’extrait, vous pouvez configurer l’actualisation de manière à ajouter uniquement les lignes nouvelles depuis la dernière extraction des données.
Par exemple, votre source de données peut être mise à jour tous les jours avec les nouvelles transactions de ventes. Plutôt que de recréer tous les jours la totalité de l’extrait, vous pouvez simplement ajouter les nouvelles transactions du jour. Ensuite, une fois par semaine, vous pouvez envisager d’effectuer une actualisation complète pour être sûr d’être en possession des données les plus récentes.
Vous avez aussi la possibilité de configurer des paramètres incrémentiels pour définir une plage de dates minimum à actualiser. Vous supprimerez ainsi toutes les données associées de l’extrait existant et vous l’actualiserez intégralement, en récupérant l’ensemble des modifications ou ajouts depuis la dernière actualisation au sein de cette plage de temps.
Colonne non unique
Depuis la version 2024.1, Tableau a introduit une fonctionnalité qui permet aux utilisateurs d’effectuer des actualisations incrémentielles sur les extraits à l’aide d’une colonne de clé non unique. Cette mise à jour introduit une étape supplémentaire dans le processus.
Plage de dates minimum à actualiser pour les extraits incrémentiels
À compter de la version Tableau 2024.2, vous pouvez spécifier une période supplémentaire pour réextraire les données précédemment extraites et capturer toutes les modifications éventuelles. Pour cela, vous utilisez les champs Plage de dates minimum à actualiser. Cette option est utile si (par exemple) la source de données permet les insertions et les modifications rétroactives au sein d’une période temporelle définie. Une fois configuré, l’extrait incrémentiel extraira toutes les nouvelles données, ainsi que les données précédemment extraites d’une plage temporelle définie.
Après avoir sélectionné un nombre (tel que 2) et une période (un mois, par exemple), le texte d’aide ci-dessous sera mis à jour de manière à refléter vos choix (« Les 2 derniers mois de données à partir de la date d’actualisation seront toujours actualisés »). Si aucune plage temporelle n’est saisie, seul le contenu plus récent que celui figurant dans l’extrait existant sera extrait.
Comprendre les actualisations avec plages de dates minimum
Une configuration optimale des actualisations avec plage de dates minimum à actualiser dépend de la fréquence à laquelle vous prévoyez d’actualiser vos extraits, de la fréquence à laquelle votre source de données est mise à jour et de la quantité de données normalement mises à jour au cours de chaque période. Il est important de comprendre comment Tableau interprète vos choix de configuration d’extrait pour garantir que l’extrait contient les données attendues.
- Lorsqu’un certain nombre d’unités de temps sont saisies, Tableau les interprète comme si toutes les données étaient extraites de l’unité de temps existante plus X unités de données supplémentaires. Par exemple : si vous définissez sur 3 mois, il extraira toutes les données du mois en cours, ainsi que les données des 3 mois précédents. Si la date actuelle est le 1er avril, toutes les données d’avril (dans ce cas, 1 jour) ainsi que toutes les données de janvier, février et mars, soit environ 91 jours de données, seront extraites. L’exécution de la même actualisation le 28 avril extrairait les données de 28 jours d’avril, plus les 3 mois précédents, soit environ 118 jours de données.
- Pour un contrôle et une cohérence plus précis, les meilleures pratiques consistent à utiliser la plus petite unité de temps applicable (comme le jour) qui convient à vos données. Pour actualiser systématiquement les 90 derniers jours de données plus le jour d’actualisation, choisissez 90 comme nombre et Jour comme période.
- Tableau vous recommande de baser votre extrait sur un champ de date/heure qui reflète la date/heure auxquelles un enregistrement a été saisi. Si le champ de date utilisé pour déterminer les extraits inclut des dates futures (telles que « Date de livraison prévue de la commande »), les résultats utilisant la fonction d’actualisation de la sous-plage peuvent ne pas être ceux que vous attendez. Par exemple : une actualisation incrémentielle est configurée pour extraire les deux mois précédents de données à partir de la date d’actualisation. Nous sommes le 1er avril, mais il existe des enregistrements dans la base de données où ce champ de date contient des valeurs allant jusqu’à 6 mois dans le futur, le 1er septembre. Lorsque l’actualisation se produit dans cet exemple, seules les données d’avril (le mois d’actualisation actuel) et les données des 2 mois précédents seront extraites. Si des modifications se sont produites dans la source de données pour les lignes associées à ces dates futures au-delà d’avril, elles ne seront pas mises à jour.
- S’il y a plus de nouvelles données dans la source de données à actualiser que la période configurée, les données supplémentaires extraites commencent au point où de nouvelles données sont disponibles. Par exemple, si vous configurez la plage minimum de dates uniquement pour les 2 jours précédents, mais que la dernière actualisation a eu lieu voilà 10 jours, les 10 jours de nouvelles données seront extraits ainsi que 2 jours supplémentaires de données précédemment extraites.
Remarque : si la structure des données source change (par exemple, suite à l’ajout d’une nouvelle colonne), vous devrez procéder à une actualisation complète de l’extrait avant de pouvoir réexécuter des actualisations incrémentielles.
Suivez ces étapes si vous souhaitez configurer un extrait à actualiser de manière incrémentielle ou modifier un extrait complet existant de manière à utiliser l’actualisation incrémentielle.
Sélectionnez une source de données dans le menu Données, puis sélectionnez Extraire des données.
Dans la boîte de dialogue Extraire des données, sélectionnez Toutes les lignes pour définir le nombre de lignes à extraire. L’actualisation incrémentielle peut uniquement être définie lorsque vous procédez à l’extraction de toutes les lignes de la base de données.
Remarque : vous ne pouvez pas incrémenter un échantillon d’extrait.
Développez la section Actualisation incrémentielle et cochez Actualisation incrémentielle.
Indiquez une colonne de la base de données qui sera utilisée pour identifier les nouvelles lignes.
Par exemple, vous pouvez sélectionner un champ de date ou une colonne d’ID qui augmente de manière monotone au fur et à mesure que des lignes sont ajoutées à la base de données.
(Facultatif) Si vous sélectionnez une colonne Date ou Date et heure dans Tableau, vous pouvez effectuer une actualisation partielle des données d’extrait en spécifiant une plage de dates spécifique. Déterminez le nombre de jours et spécifiez l’échelle date/heure pour établir la plage de dates minimale pour l’actualisation (par exemple, 14 jours à compter de la date d’actualisation).
(Facultatif) Si aucune plage d’actualisation minimum n’est établie, développez Paramètres avancés pour définir la manière dont les nouvelles lignes sont récupérées. Vous pouvez choisir de remplacer les dernières lignes ajoutées par des valeurs actualisées égales ou supérieures à la dernière valeur enregistrée, ou de conserver les dernières lignes ajoutées en actualisant uniquement l’extrait avec les valeurs supérieures à la dernière valeur enregistrée.
Pour terminer, sélectionnez Enregistrer les paramètres.
Remarque : l’actualisation incrémentielle n’est pas disponible si vous activez l’agrégation.
Remarque : si des filtres sont ajoutés, les paramètres avancés d’actualisation incrémentielle s’affichent en grisé et le paramètre par défaut « Ne pas remplacer les dernières lignes ajoutées » sera appliqué. Le but est d’éviter tout conflit possible entre certains critères de filtrage et la logique avancée de l’actualisation incrémentielle, à savoir « Remplacer les dernières lignes ajoutées ».
Points à prendre en compte lors de l’actualisation d’extraits
Modification d’un extrait
Si vous modifiez un extrait existant, l’actualisation la plus récente s’affiche. Vous avez ainsi l’assurance de mettre à jour l’extrait avec les données adéquates.
Actualisation complète
Une actualisation complète remplace toutes les lignes par les données de la source de données d’origine chaque fois que vous actualisez l’extrait. Une actualisation complète peut prendre plus de temps et coûter cher à la base de données.
Précision de l’heure/de la date et extraits
Le moteur de données, qui est le mécanisme sous-jacent utilisé par Tableau pour créer des extraits, enregistre les valeurs temporelles avec une précision allant jusqu’à 3 décimales. Si vous spécifiez une colonne date/heure ou horodatage pour Identifier de nouvelles lignes à l’aide de la colonne, et que votre base de données utilise une précision supérieure à Tableau, vous pouvez vous retrouver avec des lignes en double après une actualisation incrémentielle. Par exemple, si la base de données comporte deux lignes, l’une avec une valeur date/heure de 2015-03-13 17:30:56.502352
et une avec une valeur date/heure de 2015-03-13 17:30:56.502852
, Tableau enregistre les deux colonnes en utilisant une valeur date/heure de 2015-03-13 17:30:56.502
, créant de ce fait des lignes en double.
Pour afficher un historique de l’actualisation de l’extrait, sélectionnez une source de données dans le menu Données, puis .
La boîte de dialogue Historique de l’extrait affiche la date et l’heure de chaque actualisation, indique si elle était complète ou incrémentielle et précise le nombre de lignes qui ont été ajoutées. Si l’actualisation a été effectuée à partir d’un fichier, le nom du fichier source est également mentionné.