Extraire vos données

Un extrait de données est un sous-ensemble d’informations enregistré séparément de l’ensemble de données d’origine. Il a deux objectifs : améliorer les performances et utiliser les fonctionnalités de Tableau qui peuvent ne pas être disponibles ou prises en charge dans les données d’origine. En créant un extrait de données, vous pouvez réduire efficacement le volume global de données en appliquant des filtres et en définissant d’autres limitations.

Une fois qu’un extrait de données est créé, il peut être actualisé avec les données les plus récentes de la source d’origine. Lors du processus d’actualisation, vous pouvez opter pour une actualisation complète, qui remplace tout le contenu existant de l’extrait, ou pour une actualisation incrémentielle, qui intègre uniquement les lignes qui sont nouvelles depuis la dernière actualisation.

Remarque : À partir de la version 2024.1, Tableau introduit une fonctionnalité qui permet aux utilisateurs d’effectuer des actualisations incrémentielles sur les extraits à l’aide d’une colonne à clé non unique.

Avantages des extraits

  • Traitement de grands ensembles de données : les extraits peuvent gérer des quantités massives de données, y compris les données pouvant inclure des milliards de lignes. Cela permet aux utilisateurs de travailler efficacement avec de vastes ensembles de données.

  • Amélioration des performances : l’interaction avec des vues qui utilisent des sources de données de l’extrait améliore les performances de ces vues par rapport aux vues connectées directement aux données d’origine. Les extraits optimisent les performances des requêtes, ce qui accélère l’analyse et la visualisation des données.

  • Amélioration des fonctionnalités : les extraits permettent d’accéder à des fonctionnalités Tableau supplémentaires qui peuvent ne pas être disponibles ou prises en charge par la source de données d’origine.

    Par exemple, les utilisateurs peuvent utiliser des extraits pour calculer le total distinct, ce qui permet d’effectuer des calculs et des analyses plus avancés.

  • Accès aux données hors ligne (Tableau Desktop) : les extraits permettent d’accéder aux données hors ligne. Ainsi, même lorsque la source de données d’origine n’est pas disponible, les utilisateurs peuvent toujours enregistrer, manipuler et utiliser les données localement.

Créer un extrait

Plusieurs options sont disponibles dans votre flux de travail Tableau pour créer un extrait, mais la principale méthode est expliquée ci-dessous.

  1. Une fois connecté aux données et après avoir configuré la source de données dans la page Source de données, en haut à droite, sélectionnez Extrait, puis cliquez sur le lien Modifier pour ouvrir la boîte de dialogue Extraire les données.

  2. Sous Stockage des données, sélectionnez Tables logiques ou Tables physiques. Pour obtenir de l’aide pour cette étape, consultez la section Stockage des données.

  3. Développez l’onglet Filtres pour définir des filtres afin de limiter la quantité de données extraites en fonction des champs et de leurs valeurs.

  4. Sélectionnez Agréger les données pour les dimensions visibles pour agréger les mesures à l’aide de leur agrégation par défaut.

  5. (Facultatif) Sélectionnez Regrouper les dates à un niveau de date spécifique, tel que Année, Mois, etc.

  6. Sélectionnez le nombre de lignes que vous souhaitez extraire. Vous pouvez extraire Toutes les lignes, échantillon ou les N premières lignes.

  7. Cochez la case Actualisation incrémentielle, puis indiquez la table que vous souhaitez actualiser, choisissez une colonne dans la base de données pour identifier les nouvelles lignes et définissez éventuellement une plage de dates minimale pour l’actualisation.

  8. Lorsque vous avez terminé, choisissez Enregistrer les paramètres.

  9. Sélectionnez l’onglet Feuille. Cette action déclenche la création de l’extrait.

  10. Sélectionnez ensuite l’emplacement où vous souhaitez enregistrer l’extrait.

  11. Entrez un nom de fichier de l’extrait.

  12. Sélectionnez Enregistrer. Si la boîte de dialogue Enregistrer ne s’affiche pas, consultez la section Résoudre les problèmes liés aux extraits.

Descriptions des champs d’un extrait

Vous pouvez configurer de nombreux champs lors de la création d’un extrait. Cette section vous présente chaque champ.

Stockage des données

Sous Stockage des données, vous pouvez sélectionner des tables logiques ou des tables physiques. Les tables logiques stockent les données dans une table d’extrait pour chaque table logique de la source de données. Les tables physiques, quant à elles, stockent les données dans une table d’extrait pour chaque table physique de la source de données.

Tables logiques

Pour limiter la quantité de données dans votre extrait et utiliser des propriétés d’extrait supplémentaires telles que les filtres, l’agrégation ou l’option N premiers, vous devez sélectionner Tables logiques.

  • Cette option s’applique aussi lorsque vos données incluent des fonctions directes (RAWSQL).

  • Tableau utilise des tables logiques comme structure par défaut pour stocker les données de l’extrait.

  • Si vous choisissez cette option lorsque votre extrait contient des jointures, les jointures sont appliquées lors de la création de l’extrait.

Tables physiques

Si votre extrait comporte des tables combinées avec des jointures d’égalité et remplit les Conditions d’utilisation de l’option Tables physiques, vous devez sélectionner Tables physiques. Cette option effectue des jointures au moment de la requête et peut éventuellement améliorer les performances et réduire la taille du fichier de l’extrait.

Considérations relatives à l’utilisation de l’option Tables physiques. Pour stocker votre extrait à l’aide de l’option Tables physiques, les données de votre extrait doivent remplir toutes les conditions suivantes.

  • Toutes les jointures entre les tables physiques sont des jointures d’égalité (=).

  • Les types de données des colonnes utilisées pour les relations ou les jointures sont identiques.

  • Aucune fonction directe (RAWSQL) n’est utilisée.

  • Aucune actualisation incrémentielle n’est configurée.

  • Aucun filtre d’extrait n’est configuré.

  • Aucune option N premiers ou Échantillonnage n’est configurée.

  • Lorsque l’extrait est stocké en tant que tables physiques, vous ne pouvez pas lui ajouter des données.

  • Pour les tables logiques, vous ne pouvez pas ajouter des données à des extraits qui contiennent plus d’une table logique.

Conditions d’utilisation de l’option Tables physiques

Tableau vous recommande généralement d’utiliser l’option de stockage des données par défaut, Tables logiques, lorsque vous configurez et utilisez des extraits. Dans de nombreux cas, certaines des fonctionnalités dont vous avez besoin pour votre extrait, par exemple les filtres d’extrait, sont uniquement disponibles si vous utilisez l’option Tables logiques.

Option Tables physiques pour les extraits plus volumineux qu’attendu

Vous ne devriez utiliser l’option Tables physiques qu’avec parcimonie, dans des situations spécifiques, par exemple lorsque votre source de données remplit les Conditions d’utilisation de l’option Tables physiques et que la taille de votre extrait est plus volumineuse qu’attendu. Pour déterminer si l’extrait est plus volumineux qu’il ne devrait, la somme des lignes dans l’extrait utilisant l’option Tables logiques doit être supérieure à la somme des lignes de toutes les tables combinées avant la création de l’extrait. Si ce scénario s’applique, essayez plutôt d’utiliser l’option Tables physiques.

Suggestions alternatives de filtrage en cas d’utilisation de l’option Tables physiques

Lorsque vous utilisez l’option Tables physiques, les autres options de réduction des données dans votre extrait, par exemple les filtres d’extrait, l’agrégation, la fonctionnalité N premiers et échantillonnage, sont désactivées. Si vous avez besoin de réduire les données dans un extrait utilisant l’option Tables physiques, envisagez de filtrer les données avant qu’elles ne soient intégrées dans Tableau Desktop en utilisant l’une des suggestions suivantes :

Connectez-vous à vos données et définissez des filtres à l’aide de SQL personnalisé.

Au lieu de vous connecter à une table de base de données, connectez-vous plutôt à vos données à l’aide de SQL personnalisé. Lorsque vous créez votre propre requête SQL personnalisée, assurez-vous qu’elle contient le niveau approprié de filtrage nécessaire pour réduire les données dans votre extrait. Pour plus d’informations sur la connexion à SQL personnalisé dans Tableau Desktop, consultez Se connecter à une requête SQL personnalisée.

Définir une vue dans une base de données

Si vous disposez d’un accès en écriture à votre base de données, envisagez de définir une vue de base de données contenant simplement les données nécessaires pour votre extrait, puis connectez-vous à la base de données depuis Tableau Desktop.

Sécurité au niveau des lignes avec les extraits

Si vous souhaitez sécuriser les données d’extrait au niveau des lignes, il est recommandé d’utiliser l’option Tables physiques pour réaliser ce scénario. Pour plus d’informations sur la sécurité au niveau des lignes dans Tableau, consultez Restreindre l’accès au niveau des lignes de données.

Considérations générales sur les tables

Les options Tables logiques et Tables physiques affectent uniquement la manière dont les données de votre extrait sont stockées. Les options n’affectent pas la manière dont les tables de votre extrait s’affichent dans la page Source de données.

Supposons, par exemple, que votre extrait soit composé d’une table logique qui contient trois tables physiques.

Si vous ouvrez directement le fichier d’extrait (.hyper) qui a été configuré pour utiliser l’option par défaut, Tables logiques, une seule table figure dans la page Source de données.

Toutefois, si vous ouvrez l’extrait à l’aide du fichier de la source de données complète (.tdsx) ou le fichier de la source de données (.tdsx) avec son extrait correspondant (fichier .hyper), vous voyez les trois tables contenant l’extrait dans la page Source de données.

Filtres

Utilisez l’onglet Filtres pour définir des filtres afin de limiter la quantité de données extraites en fonction des champs et de leurs valeurs.

Agrégation

L’agrégation vous permet d’agréger des mesures. Vous pouvez également choisir de Regrouper les dates à un niveau de date spécifique, tel que Année, Mois, etc. Les exemples ci-dessous expliquent comment les données seront extraites pour chaque option d’agrégation choisie.

 

Données d’origineChaque enregistrement apparaît sur une ligne distincte. Vos données contiennent sept lignes.
Agréger les données pour les dimensions visibles

(pas de regroupement)

Les enregistrements avec la même date et la même région ont été agrégés dans une seule ligne. Votre extrait contient cinq lignes.
Agréger les données pour les dimensions visibles
(regrouper les dates dans Mois)
Les dates ont été regroupées au niveau Mois et les enregistrements au sein de la même région ont été agrégés dans une seule ligne. Votre extrait contient trois lignes.

Nombre de lignes

Vous pouvez extraire Toutes les lignes ou les N premières lignes. Tableau applique d’abord les filtres et les agrégations, puis extrait le nombre de lignes des résultats filtrés et agrégés. Les options du nombre de lignes dépendent du type de source de données à partir duquel vous obtenez l’extrait. Il se peut que l’option Échantillonnage ne s’affiche pas dans la boîte de dialogue Extraire les données, car certaines sources de données ne prennent pas en charge l’échantillonnage.

Remarque(s) : Tous les champs que vous masquez en premier dans la page Source de données ou dans l’onglet de feuille seront exclus de l’extrait. Cliquez sur le bouton Masquer tous les champs inutilisés pour supprimer les champs masqués de l’extrait.

Actualisation incrémentielle

La plupart des sources de données prennent en charge l’actualisation incrémentielle. Plutôt que d’actualiser la totalité de l’extrait, vous pouvez configurer l’actualisation de manière à ajouter uniquement les lignes nouvelles depuis la dernière extraction des données.

Par exemple, votre source de données peut être mise à jour tous les jours avec les nouvelles transactions de ventes. Plutôt que de recréer tous les jours la totalité de l’extrait, vous pouvez ajouter les nouvelles transactions de chaque jour.

Conseils sur l’actualisation incrémentielle et les paramètres avancés

Cette section vous donne des conseils pour éviter les erreurs que vous pouvez rencontrer lors de la configuration de ces fonctionnalités.

Actualisation incrémentielle :

  • Dans Nombre de lignes, vous devez sélectionner Toutes les lignes.

  • L’actualisation incrémentielle ne sera pas disponible si vous activez l’agrégation.

Paramètres avancés :

  • Les paramètres avancés ne sont pas compatibles avec les filtres.

Conseils sur les extraits

Enregistrez votre classeur pour conserver la connexion à l’extrait

Une fois l’extrait créé, le classeur commence à utiliser la version d’extrait de vos données. Toutefois, la connexion à la version d’extrait de vos données n’est pas sauvegardée tant que vous n’avez pas enregistré le classeur. Cela signifie que si vous fermez le classeur sans l’enregistrer, il se connectera à la source de données d’origine lors de sa prochaine ouverture.

Permuter entre des données échantillonnées et un extrait entier

Lorsque vous utilisez un extrait volumineux, il peut être utile de créer un échantillon plus petit des données. Ainsi, vous pouvez configurer votre vue sans devoir exécuter de longues requêtes à chaque fois que vous ajoutez un champ à votre analyse. Vous pouvez facilement passer de l’utilisation de l’échantillon de données à l’utilisation de la source de données complète en sélectionnant l’option correspondante dans le menu Données.

Ne vous connectez pas directement à l’extrait

Lorsque vous enregistrez des extraits sur votre ordinateur, vous pouvez vous y connecter directement à l’aide d’un nouveau Tableau Desktop. Toutefois, cette opération est déconseillée pour les raisons suivantes :

Les noms des tables peuvent être différents.

Les extraits utilisent des noms spéciaux pour garantir que chaque table a un nom unique, qui peut être difficilement compréhensible.

Vous ne pouvez pas mettre à jour ou actualiser l’extrait.

Lorsque vous vous connectez directement à un extrait, Tableau considère cet extrait comme la source de données d’origine plutôt que comme une copie. Vous ne pourrez donc pas le relier à votre source de données d’origine.

La structure et les relations entre les tables seront perdues.

La disposition et les connexions entre les tables sont stockées dans le fichier .tds plutôt que dans le fichier .hyper. Par conséquent, lorsque vous vous connectez directement au fichier .hyper, vous perdez ces informations. Si vous utilisez le stockage des tables logiques pour l’extrait, vous ne verrez aucune référence aux tables physiques d’origine.

Supprimer l’extrait du classeur

Vous pouvez supprimer un extrait à tout moment en sélectionnant la source de données de l’extrait dans le menu Données, puis en sélectionnant Extrait > Supprimer. Lorsque vous supprimez un extrait, vous pouvez choisir de Supprimer l’extrait du classeur uniquement ou de Supprimer le fichier d’extrait. Cette dernière option supprime l’extrait de votre disque dur.

Voir l’historique de l’extrait (Tableau Desktop)

Pour voir la date de la dernière mise à jour de l’extrait et d’autres détails, sélectionnez une source de données dans le menu Données, puis sélectionnez Extrait > Historique.

Si vous ouvrez un classeur enregistré avec un extrait et que Tableau ne peut pas localiser l’extrait, sélectionnez l’une des options suivantes dans la boîte de dialogue Extrait introuvable lorsque vous y êtes invité :

  • Localiser l’extrait : Sélectionnez cette option si l’extrait est présent, mais pas dans l’emplacement où Tableau l’a enregistré à l’origine. Cliquez sur OK pour ouvrir une boîte de dialogue Ouvrir un fichier où vous pouvez spécifier le nouvel emplacement pour le fichier d’extrait.

  • Supprimer l’extrait : Sélectionnez cette option si vous n’avez plus besoin de l’extrait. Cela équivaut à fermer la source de données. Toutes les feuilles de calcul ouvertes référençant la source de données sont supprimées.

  • Désactiver l’extrait : Utilisez la source de données d’origine à partir de laquelle l’extrait a été créé, au lieu de l’extrait.

  • Régénérer l’extrait : Recrée l’extrait. Tous les filtres et les autres personnalisations que vous avez spécifiés lors de la création initiale de l’extrait sont automatiquement appliqués.

Résoudre les problèmes liés aux extraits

  • La création d’un extrait prend un certain temps : selon la taille de votre ensemble de données, la création d’un extrait peut demander un certain temps. Toutefois, une fois que vous avez extrait les données et que vous les avez enregistrées sur votre ordinateur, les performances peuvent s’améliorer.

  • L’extrait n’est pas créé : Si votre ensemble de données contient un grand nombre de colonnes (par exemple, de l’ordre du millier), Tableau risque de ne pas pouvoir créer l’extrait dans tous les cas. Si vous rencontrez des problèmes, vous pouvez envisager d’extraire moins de colonnes ou de restructurer les données sous-jacentes.

  • La boîte de dialogue Enregistrer ne s’affiche pas ou l’extrait n’est pas créé depuis un fichier.twbx : si vous suivez la procédure ci-dessus pour extraire des données à partir d’un classeur complet, la boîte de dialogue Enregistrer ne s’affiche pas. Lorsqu’un extrait est créé à partir d’un classeur complet (.twbx), le fichier d’extrait est automatiquement enregistré dans le package de fichiers associé au classeur complet. Pour accéder au fichier d’extrait que vous avez créé à partir du classeur complet, vous devez décompresser le classeur. Pour plus d’informations, consultez Classeurs complets.

Mises à jour des fonctionnalités de l’extrait

Plage de dates (sous-plage)

Depuis la version 2024.2, Tableau a ajouté une nouvelle fonctionnalité appelée actualisation de la sous-plage de dates pour une actualisation incrémentielle. Cette fonctionnalité permet aux utilisateurs de spécifier une plage de dates minimum pour actualiser les extraits. Par exemple, les utilisateurs peuvent choisir d’actualiser les données des 14 derniers jours à compter de la date d’actualisation. En utilisant cette fonctionnalité, les utilisateurs peuvent accélérer l’actualisation des extraits et économiser les coûts liés aux extraits complets inutiles.

Actualisation incrémentielle

À partir de la version 2024.1, Tableau introduit une fonctionnalité qui permet aux utilisateurs d’effectuer des actualisations incrémentielles sur les extraits à l’aide d’une colonne à clé non unique. Il existe une nouvelle interface utilisateur qui prend en charge ces paramètres avancés.

Cette mise à jour introduit une étape supplémentaire dans le processus. Lors d’une actualisation incrémentielle, Tableau supprime d’abord les lignes de l’extrait qui correspondent à la valeur la plus élevée précédemment enregistrée. Par la suite, Tableau interroge toutes les lignes dont la valeur est supérieure ou égale à la valeur la plus élevée précédente. Cette approche garantit que toutes les lignes supprimées sont prises en compte, ainsi que celles nouvellement ajoutées.

Extraits sur le Web

À partir de la version 2020.4, les extraits sont disponibles en mode de création Web et sur le serveur de contenu. Vous n’avez désormais plus besoin d’utiliser Tableau Desktop pour extraire vos sources de données. Pour plus d’informations, consultez Créer des extraits sur le Web.

Extraits de table logiques et physiques

Avec l’introduction des tables logiques et des tables physiques dans le modèle de données Tableau avec la version 2020.2, les options de stockage d’extraits sont passées des tables uniques et tables multiples aux tables logiques et tables physiques. Ces options décrivent mieux la façon dont les extraits seront stockés. Pour plus d’information, consultez Extraire vos données.

Obsolescence du format .tde

Remarque : depuis mars 2023, les extraits utilisant le format .tde sont obsolètes dans Tableau Cloud, Tableau Public et Tableau Server (version 2023.1.0). 2024.2 est la version la plus récente qui permet d’ouvrir les fichiers au format .tde. Pour plus d’informations, consultez Mise à niveau d’extraits vers le format .hyper.

Depuis la version 10.5, lorsque vous créez un extrait, ce dernier utilise le format .hyper. Les extraits au format .hyper tirent parti du moteur de données amélioré, qui prend en charge des performances plus rapides d’analyse et de requête pour des ensembles de données plus volumineux.

De même, lorsqu’une tâche liée à un extrait est exécutée sur un extrait .tde à l’aide de la version 10.5, l’extrait est mis à niveau à un extrait .hyper. Après avoir été mis à niveau à un extrait .hyper, un extrait .tde ne peut pas revenir à l’extrait .tde. Pour plus d’informations, consultez Mise à niveau d’extraits vers le format .hyper.

Modifications apportées aux valeurs et aux repères dans la vue

Pour améliorer l’efficacité et l’évolutivité des extraits, les valeurs des extraits peuvent être calculées différemment dans les versions 10.5 et ultérieures par rapport aux versions 10.4 et antérieures. Les modifications apportées au mode de calcul des valeurs peuvent affecter la manière dont les repères de votre vue sont renseignés. Dans quelques rares cas, les modifications peuvent entraîner un changement de forme de la vue, ou la rendre vide. Ces modifications peuvent également s’appliquer aux sources de données suivantes : sources de données multiconnexion, sources de données utilisant des connexions en direct à des données basées sur des fichiers, sources de données se connectant à des données Google Sheets, sources de données basées dans le nuage, sources de données composées uniquement d’extraits, et sources de données du connecteur de données Web.

Pour avoir une idée des différences que vous pouvez constater dans votre vue si vous utilisez la version 2022,4, consultez les sections suivantes.

Format des valeurs de date et de date/heure

Dans la version 10.5 et versions ultérieures, les extraits sont soumis à des règles plus cohérentes et plus strictes quant au mode d’interprétation des chaînes de date via les fonctions DATE, DATETIME et DATEPARSE. Ceci affecte le mode d’analyse des dates, ou les formats et les modèles de date autorisés pour ces fonctions. Plus spécifiquement, les règles peuvent être généralisées comme suit :

  1. Les dates sont évaluées puis analysées par colonne, et non pas ligne.
  2. Les dates sont évaluées puis analysées en fonction des paramètres régionaux de création du classeur, et non des paramètres régionaux de l’ordinateur sur lequel la classeur est ouvert.

Ces nouvelles règles permettent d’améliorer l’efficacité des extraits et de produire des résultats conformes aux bases de données commerciales.

Toutefois, du fait de ces règles, en particulier dans les scénarios internationaux où le classeur est créé avec des paramètres régionaux différents de ceux dans lesquels le classeur est ouvert ou du serveur sur lequel le classeur est publié, vous pouvez voir que 1) les valeurs de date et de date/heure sont transformées en des valeurs de date et de date/heure différentes ou 2.)les valeurs de date et de date/heure deviennent Null. Lorsque vos valeurs de date et de date/heure sont transformées en des valeurs de date et de date/heure différentes ou deviennent Null, cela indique souvent qu’il y a des problèmes avec les données sous-jacentes.

Voici quelques raisons courantes pour lesquelles vous pouvez constater des changements de vos valeurs de date et de date/heure dans votre source de données d’extrait en utilisant la version 10.5 et ultérieure.

Raisons courantes des changements de valeurs de date et de date/heure

Causes courantes des valeurs nulles

  • Lorsqu’une fonction doit analyser plusieurs formats de date dans une seule colonne. Lorsque les données sont ambiguës et peuvent être interprétées de différentes manières, la date sera interprétée selon le format que Tableau a déterminé pour cette colonne. Pour quelques exemples, consultez Scénario de date 1 et Scénario de date 2 ci-dessous.
  • Lorsqu’une fonction doit analyser un format YYYY-MM-DD (ISO). Pour un exemple, consultez Scénario de date 3.
  • Si une fonction ne dispose pas de suffisamment d’informations pour dériver l’heure, elle peut interpréter une valeur sous la forme « 00 :00 :00.0 », en utilisant « 0 » pour l’heure, les minutes, les secondes et les millisecondes.
  • Si une fonction ne dispose pas de suffisamment d’informations pour dériver le jour, elle peut interpréter une valeur sous la forme « 1 » ou « Janvier » pour le mois.
  • Lorsqu’une fonction analyse des années, elle est interprétée comme suit :
    • L’année « 07 » est interprétée comme « 2007 »
    • L’année « 17 » est interprétée comme « 2017 »
    • L’année « 30 » est interprétée comme « 2030 »
    • L’année « 69 » est interprétée comme « 2069 »
    • L’année « 70 » est interprétée comme « 1970 »
  • Lorsqu’une fonction doit analyser plusieurs formats de date dans une seule colonne. Une fois que Tableau a déterminé le format de date, toutes les autres dates de la colonne qui dévient de ce format deviennent des valeurs nulles. Pour quelques exemples, consultez Scénario de date 1 et Scénario de date 2 ci-dessous.
  • Lorsqu’une fonction doit analyser un format YYYY-MM-DD (ISO). Les valeurs dépassant ce qui est autorisé pour « YYYY », « MM » ou « DD » génèrent des valeurs nulles. Pour un exemple, consultez Scénario de date 3.
  • Lorsqu’une fonction doit analyser des valeurs de date contenant des caractères de fin. Par exemple, des suffixes et des mots-clés de fuseau horaire et d’heure d’été, par exemple « minuit », peuvent entraîner des valeurs nulles.
  • Lorsqu’une fonction doit analyser une date ou une heure non valide. Par exemple, 32/3/2012 entraîne une valeur nulle. Dans un autre exemple, 25 :01 :61 entraîne une valeur nulle.
  • Lorsqu’une fonction doit analyser des entrées contradictoires. Par exemple, supposons que le modèle soit « jj.MM (MMMM) a » et que la chaîne entrée soit « 1.09 (Août) 2017 », où « 9 » et « Août » sont tous deux des mois. Le résultat est une valeur Null parce que les valeurs de mois ne sont pas les mêmes.
  • Lorsqu’une fonction doit analyser des modèles contradictoires. Par exemple, un modèle spécifiant un mélange d’année grégorienne (a) et une semaine ISO (ss) entraîne des valeurs nulles.
Scénario de date 1

Supposons que votre classeur ait été créé avec des paramètres régionaux anglais qui utilisent une source de données d’un extrait .tde. Le tableau ci-dessous montre une colonne de données de type chaîne contenue dans la source de données de l’extrait.

10/31/2018
31/10/2018

12/10/2018

Sur la base des paramètres régionaux anglais spécifiques, le format de la colonne de date était conçu pour suivre le format MJA (mois, jour, année). Les tableaux suivants montrent ce que Tableau affiche en fonction de ces paramètres régionaux lorsque la fonction DATE est utilisée pour convertir des valeurs de chaîne en valeurs de date.

October 31, 2018
October 31, 2018
December 10, 2018

Si l’extrait est ouvert selon des paramètres régionaux allemands, voici ce que vous voyez :

31 Oktober 2018
31 Oktober 2018
12 Oktober 2018

Toutefois, une fois que l’extrait a été ouvert dans des paramètres régionaux allemands en utilisant les versions 10.5 et ultérieures, le format JMA (jour, mois, année) des paramètres régionaux allemands est appliqué de manière stricte et entraîne une valeur Null parce que l’une des valeurs ne suit pas le format JMA.

Null
October 31, 2018
October 12, 2018
Scénario de date 2

Supposons un autre classeur créé avec des paramètres régionaux anglais qui utilisent une source de données d’un extrait .tde. Le tableau ci-dessous montre une colonne de données de dates numériques contenue dans la source de données de l’extrait.

1112018
1212018
1312018
1412018

Sur la base des paramètres régionaux anglais spécifiques, le format de la colonne de date était conçu pour suivre le format MJA (mois, jour, année). Les tableaux suivants montrent ce que Tableau affiche en fonction de ces paramètres régionaux lorsque la fonction DATE est utilisée pour convertir des valeurs numériques en valeurs de date.

11/1/2018
12/1/2018
Null
Null
Scénario de date 3

Supposons que vous avez un classeur utilisant la source de données d’un extrait .tde. Le tableau ci-dessous montre une colonne de données de type chaîne contenue dans la source de données de l’extrait.

2018-10-31
2018-31-10

2018-12-10

2018-10-12

La date utilisant un format ISO, la colonne de date suit toujours le format YYYY-MM-DD. Les tableaux suivants montrent ce que Tableau affiche lorsque la fonction DATE est utilisée pour convertir des valeurs de chaîne en valeurs de date.

October 10, 2018
Null
December 10, 2018
October 12, 2018

Remarque : dans les versions 10.4 (et versions antérieures), le format ISO et autres formats de date auraient pu produire des résultats différents selon les paramètres régionaux du lieu de création du classeur. Avec des paramètres régionaux anglais par exemple, les dates 2018-12-10 et 2018/12/10 produiraient toutes deux le 12 décembre 2018. Par contre, avec des paramètres régionaux allemands, le 2018-12-10 pourrait produire le 12 décembre 2018 et le 2018/12/10 pourrait produire le 12 octobre 2018.

Ordre de tri et casse des valeurs

Les extraits prennent en charge le collationnement et peuvent donc trier de manière plus appropriée les chaînes qui ont des accents ou une casse différente.

Prenons par exemple une table de chaînes. En termes d’ordre de tri, cela signifie qu’une chaîne telle que Égypte est désormais classée correctement après Estonie et avant Fidji.

À propos des données Excel : 

En matière de casse, cela signifie que la manière dont Tableau stocke les valeurs a changé entre la version 10.4 (et versions antérieures) et la version 10.5 (et versions ultérieures). Par contre les règles de tri et de comparaison des valeurs n’ont pas changé. Dans la version 10.4 (et versions antérieures), les chaînes telles que « Maison », « MAISON » et « maiSon » sont traitées de la même manière et stockées avec une seule valeur représentative. Dans la version 10.5 (et versions ultérieures), les mêmes chaînes sont considérées comme uniques et donc stockées en tant que valeurs individuelles. Pour plus d’informations, consultez Modifications du mode de calcul des valeurs.

Briser l’égalité dans les requêtes N principaux

Lorsqu’une requête N principaux dans votre extrait produit des valeurs en double pour une position spécifique dans un classement, la position qui brise l’égalité peut être différente en cas d’utilisation de la version 10.5 et versions ultérieures. Par exemple, supposons que vous créez un filtre 3 principaux. Les positions 3, 4 et 5 ont les mêmes valeurs. Si vous utilisez la version 10.4 et versions antérieures, le filtre Principal peut retourner les positions 1, 2 et 3. Toutefois, si vous utilisez la version 10.5 et versions ultérieures, le filtre principal peut renvoyer les positions 1, 2 et 5.

Précision des valeurs en virgule flottante

Les extraits sont plus aptes à tirer parti des ressources matérielles disponibles sur un ordinateur et donc à effectuer des opérations mathématiques de manière hautement parallèle. Pour cette raison, les nombres réels peuvent être agrégés par des extraits .hyper dans un ordre différent. Lorsque les nombres sont agrégés dans un ordre différent, vous pouvez voir des valeurs différentes dans votre vue après la virgule décimale à chaque fois que l’agrégation est calculée. La raison est que les additions et les multiplications à virgule flottante ne sont pas nécessairement associatives. Cela signifie que (a + b) + c n’est pas nécessairement identique à a + (b + c). De plus, les nombres réels peuvent être agrégés dans un ordre différent parce que la multiplication en virgule flottante n’est pas nécessairement distributive. Cela signifie que (a x b) x c n’est pas nécessairement identique à a x b x c. Ce type de comportement d’arrondi en virgule flottante dans les extraits .hyper ressemble au comportement d’arrondi en virgule flottante dans les bases de données commerciales.

Par exemple, supposons que votre classeur contienne un filtre de curseur sur un champ agrégé comportant des valeurs en virgule flottante. Du fait que la précision des valeurs en virgule flottante a changé, le filtre peut désormais exclure un repère qui définit la limite supérieure ou inférieure de la plage de filtres. L’absence de ces nombres peut générer une vue vide. Pour résoudre ce problème, déplacez le curseur sur le filtre ou retirez ou ajoutez à nouveau le filtre.

Précision des agrégations

Les extraits optimisent les ensembles de données volumineux en tirant parti des ressources matérielles disponibles sur un ordinateur et sont donc capables de calculer des agrégations de manière hautement parallèle. Pour cette raison, les agrégations effectuées par des extraits .hyper peuvent s’apparenter aux résultats de bases de données commerciales davantage que les résultats fournis par des logiciels spécialisés dans les calculs statistiques. Si vous utilisez un ensemble de données de petite dimension ou que vous avez besoin d’un niveau supérieur de précision, vous pouvez envisager de réaliser les agrégations via des lignes de référence, des statistiques de fiches Résumé, ou des fonctions de calcul de table telles que la variance, l’écart-type, la corrélation ou la covariance.

À propos de l’option Exécuter les calculs maintenant pour les extraits

Si l’option Exécuter les calculs maintenant a été utilisée dans un extrait .tde à l’aide d’une version plus ancienne de Tableau Desktop, certains champs calculés ont été matérialisés et donc calculés par avance et stockés dans l’extrait. Si vous mettez à niveau l’extrait depuis un extrait .tde vers un extrait .hyper, les calculs précédemment matérialisés dans votre extrait ne sont pas inclus. Vous devez utiliser l’option Exécuter les calculs maintenant à nouveau pour que les calculs matérialisés fassent bien partie de l’extrait après sa mise à niveau. Pour plus d’informations, consultez Matérialiser les calculs dans vos extraits.

Nouvelle interface Extract API

Vous pouvez utiliser Extract API 2.0 pour créer des extraits .hyper. Pour les tâches que vous avez précédemment exécutées à l’aide du SDK de Tableau, par exemple la publication d’extraits, vous pouvez utiliser l’API REST de Tableau Server ou la bibliothèque du client Tableau Server (Python). Pour les tâches d’actualisation, vous pouvez également utiliser l’API REST de Tableau Server. Pour plus d’informations, consultez API Tableau Hyper.

Merci de vos commentaires!Votre commentaire s été envoyé avec succès. Merci!