Extraire vos données

Un extrait de données est un sous-ensemble d’informations enregistré séparément de l’ensemble de données d’origine. Il a deux objectifs : améliorer les performances et utiliser les fonctionnalités de Tableau qui peuvent ne pas être disponibles ou prises en charge dans les données d’origine. En créant un extrait de données, vous pouvez réduire efficacement le volume global de données en appliquant des filtres et en définissant d’autres limitations.

Une fois qu’un extrait de données est créé, il peut être actualisé avec les données les plus récentes de la source d’origine. Lors du processus d’actualisation, vous pouvez opter pour une actualisation complète, qui remplace tout le contenu existant de l’extrait, ou pour une actualisation incrémentielle, qui intègre uniquement les lignes qui sont nouvelles depuis la dernière actualisation.

Avantages des extraits

  • Traitement de grands ensembles de données : les extraits peuvent gérer des quantités massives de données, y compris les données pouvant inclure des milliards de lignes. Cela permet aux utilisateurs de travailler efficacement avec de vastes ensembles de données.
  • Amélioration des performances : l’interaction avec des vues qui utilisent des sources de données de l’extrait améliore les performances de ces vues par rapport aux vues connectées directement aux données d’origine. Les extraits optimisent les performances des requêtes, ce qui accélère l’analyse et la visualisation des données.
  • Amélioration des fonctionnalités : les extraits permettent d’accéder à des fonctionnalités Tableau supplémentaires qui peuvent ne pas être disponibles ou prises en charge par la source de données d’origine, telles que des fonctions spécifiques.
  • Accès aux données hors ligne (Tableau Desktop) : les extraits permettent d’accéder aux données hors ligne. Ainsi, même lorsque la source de données d’origine n’est pas disponible, les utilisateurs peuvent toujours enregistrer, manipuler et utiliser les données localement.

Créer un extrait

Il existe plusieurs façons de créer un extrait, mais la principale méthode est expliquée ci-dessous.

  1. Une fois connecté aux données et après avoir configuré la source de données dans la page Source de données, en haut à droite, sélectionnez Extrait, puis cliquez sur le lien Modifier pour ouvrir la boîte de dialogue Extraire les données.
  2. Sélectionner l’option Extraire pour afficher le lien Modifier

  3. Développez chaque section pour afficher ses options ou sélectionnez Tout développer. De plus amples informations sur chaque section sont présentées plus loin dans cette rubrique.
    • Stockage de données : basculez entre les Tables logiques et les Tables physiques.
    • Filtres : définissez des filtres afin de limiter la quantité de données extraites en fonction des champs et de leurs valeurs.
    • Agrégation : sélectionnez Agréger les données pour les dimensions visibles pour agréger les mesures à l’aide de leur agrégation par défaut. Vous pouvez également sélectionner Regrouper les dates à un niveau de date spécifique, tel que Année, Mois, etc.
    • Nombre de lignes : définissez le nombre de lignes que vous souhaitez extraire. Vous pouvez extraire Toutes les lignes, échantillon ou les N premières lignes.
    • Actualisation incrémentielle : configurez une actualisation incrémentielle en fonction d’une colonne et d’une plage de dates spécifiques. Vous pouvez également déterminer si vous souhaitez remplacer ou ajouter les dernières lignes.
  4. Lorsque vous avez terminé, choisissez Enregistrer les paramètres.
  5. Sélectionnez l’onglet Feuille. Cette action déclenche la création de l’extrait.
  6. Sélectionnez ensuite l’emplacement où vous souhaitez enregistrer l’extrait.
  7. Entrez un nom de fichier de l’extrait.
  8. Sélectionnez Enregistrer. Si la boîte de dialogue Enregistrer ne s’affiche pas, consultez la section Résoudre les problèmes liés aux extraits.

Descriptions des paramètres d’extrait

Vous pouvez configurer de nombreux paramètres lors de la création d’un extrait.

Stockage des données

Sous Stockage des données, vous pouvez sélectionner des tables logiques ou des tables physiques. Les tables logiques stockent les données dans une table d’extrait pour chaque table logique de la source de données. Les tables physiques, quant à elles, stockent les données dans une table d’extrait pour chaque table physique de la source de données.

Les options Tables logiques et Tables physiques affectent uniquement la manière dont les données de votre extrait sont stockées. Les options n’affectent pas la manière dont les tables de votre extrait s’affichent dans la page Source de données.

Supposons, par exemple, que votre extrait soit composé d’une table logique qui contient trois tables physiques. Si vous ouvrez directement le fichier d’extrait (.hyper) qui a été configuré pour utiliser l’option par défaut, Tables logiques, une seule table figure dans la page Source de données. Toutefois, si vous ouvrez l’extrait à l’aide du fichier de la source de données complète (.tdsx) ou le fichier de la source de données (.tdsx) avec son extrait correspondant (fichier .hyper), vous voyez les trois tables dans la page Source de données.

Tables logiques

Tableau utilise des tables logiques comme structure par défaut pour stocker les données de l’extrait. Tableau vous recommande généralement d’utiliser l’option de stockage des données par défaut, Tables logiques, lorsque vous configurez et utilisez des extraits. La plupart des fonctionnalités que vous pourriez souhaiter, comme les filtres d’extrait, l’agrégation, la fonctionnalité N premiers ou les fonctions directes (RAWSQL), ne sont disponibles que si vous utilisez l’option Tables logiques. Cependant, vous ne pouvez pas ajouter des données à des extraits qui contiennent plus d’une table logique.

Si vous choisissez l’option Tables logiques et que votre extrait contient des jointures, les jointures sont appliquées lorsque l’extrait est créé.

Tables physiques

Cette option effectue des jointures au moment de la requête et peut éventuellement améliorer les performances et réduire la taille du fichier de l’extrait, si vos données remplissent toutes les conditions suivantes :

  • Toutes les jointures entre les tables physiques sont des jointures d’égalité (=).
  • Les types de données des colonnes utilisées pour les relations ou les jointures sont identiques.
  • Aucune fonction directe (RAWSQL) n’est utilisée.
  • Aucune actualisation incrémentielle n’est configurée.
  • Aucun filtre d’extrait n’est configuré.
  • Aucune option N premiers ou Échantillonnage n’est configurée.
  • Aucune donnée ne doit être ajoutée à l’extrait.

Conseils d’utilisation de tables physiques

Extraits plus volumineux qu’attendu : Pour déterminer si l’extrait est plus volumineux qu’il ne devrait, la somme des lignes dans l’extrait utilisant l’option Tables logiques doit être supérieure à la somme des lignes de toutes les tables combinées avant la création de l’extrait. Si ce scénario s’applique, essayez d’utiliser l’option Tables physiques.

Options de filtrage : Lorsque vous utilisez l’option Tables physiques, les autres options de réduction des données dans votre extrait, par exemple les filtres d’extrait, l’agrégation, la fonctionnalité N premiers et l’échantillonnage, sont désactivées. Si vous avez besoin de réduire les données dans un extrait utilisant l’option Tables physiques, envisagez de filtrer les données avant qu’elles ne soient intégrées dans Tableau Desktop en utilisant l’une des suggestions suivantes :

  • Toutes les jointures entre les tables physiques sont des jointures d’égalité (=).
  • Connectez-vous à vos données et définissez des filtres à l’aide de SQL personnalisé. Au lieu de vous connecter à une table de base de données, connectez-vous plutôt à vos données à l’aide de SQL personnalisé. Lorsque vous créez votre propre requête SQL personnalisée, assurez-vous qu’elle contient le niveau approprié de filtrage nécessaire pour réduire les données dans votre extrait. Pour plus d’informations sur la connexion à SQL personnalisé dans Tableau Desktop, consultez Se connecter à une requête SQL personnalisée.

  • Définissez une vue dans la base de données. Si vous disposez d’un accès en écriture à votre base de données, envisagez de définir une vue de base de données contenant simplement les données nécessaires pour votre extrait, puis connectez-vous à la base de données depuis Tableau Desktop.

Sécurité au niveau des lignes avec les extraits : Si vous souhaitez sécuriser les données d’extrait au niveau des lignes, il est recommandé d’utiliser l’option Tables physiques pour réaliser ce scénario. Pour plus d’informations sur la sécurité au niveau des lignes dans Tableau, consultez Restreindre l’accès au niveau des lignes de données.

Filtres

Utilisez des filtres pour limiter la quantité de données extraites en fonction des champs et de leurs valeurs.

Remarque : Les filtres d’extrait sur les tables logiques sont omniprésents (s’appliquent à la source de données entière) pour les sources de données avec une seule table de base. Pour les sources de données avec plusieurs tables de base utilisant des relations multi-faits, les filtres d’extrait sont propres à chaque table et s’appliquent uniquement à la table logique elle-même. Pour plus d’informations sur les filtres omniprésents et propres à chaque table, consultez Filtrer les données de sources de données.

Agrégation

L’agrégation vous permet d’agréger des mesures. Vous pouvez également choisir de Regrouper les dates à un niveau de date spécifique, tel que Année, Mois, etc. Les exemples expliquent comment les données seront extraites pour chaque option d’agrégation choisie :

  • Données d’origine : Chaque enregistrement apparaît sur une ligne distincte. Vos données d’origine contiennent sept lignes.
  • Agrégation de données pour les dimensions visibles (sans regroupement) : Les enregistrements portant la même date et la même lettre ont été agrégés sur une seule ligne. Votre extrait contient cinq lignes.
  • Agrégation de données pour les dimensions visibles (regrouper les dates au niveau Mois) : Les dates ont été regroupées au niveau Mois et les enregistrements au sein de la même zone géographique ont été agrégés dans une seule ligne. Votre extrait contient trois lignes.
Données d’origineAgrégation sans regroupementAgrégation avec regroupement

Nombre de lignes

Vous pouvez extraire Toutes les lignes ou les N premières lignes. Tableau applique d’abord les filtres et les agrégations, puis extrait le nombre de lignes des résultats filtrés et agrégés. Les options du nombre de lignes dépendent du type de source de données à partir duquel vous obtenez l’extrait. Il se peut que l’option Échantillonnage ne s’affiche pas dans la boîte de dialogue Extraire les données, car certaines sources de données ne prennent pas en charge l’échantillonnage.

Remarque(s) : Tous les champs que vous masquez en premier dans la page Source de données ou dans l’onglet de feuille seront exclus de l’extrait. Cliquez sur le bouton Masquer tous les champs inutilisés pour supprimer les champs masqués de l’extrait.

Actualisation incrémentielle

La plupart des sources de données prennent en charge l’actualisation incrémentielle. Plutôt que d’actualiser la totalité de l’extrait, vous pouvez configurer l’actualisation de manière à ajouter uniquement les lignes nouvelles depuis la dernière extraction des données.

Par exemple, votre source de données peut être mise à jour tous les jours avec les nouvelles transactions de ventes. Plutôt que de recréer tous les jours la totalité de l’extrait, vous pouvez ajouter les nouvelles transactions de chaque jour.

Conseils relatifs à l’actualisation incrémentielle

Actualisation incrémentielle :

  • Dans Nombre de lignes, vous devez sélectionner Toutes les lignes.
  • L’actualisation incrémentielle ne sera pas disponible si vous activez l’agrégation.

Paramètres avancés :

  • Les paramètres avancés ne sont pas compatibles avec les filtres.

Conseils sur les extraits

Enregistrez votre classeur pour conserver la connexion à l’extrait

Une fois l’extrait créé, le classeur commence à utiliser la version d’extrait de vos données. Toutefois, la connexion à la version d’extrait de vos données n’est pas sauvegardée tant que vous n’avez pas enregistré le classeur. Cela signifie que si vous fermez le classeur sans l’enregistrer, il se connectera à la source de données d’origine lors de sa prochaine ouverture.

Permuter entre des données échantillonnées et un extrait entier

Lorsque vous utilisez un extrait volumineux, il peut être utile de créer un échantillon plus petit des données. Ainsi, vous pouvez configurer votre vue sans devoir exécuter de longues requêtes à chaque fois que vous ajoutez un champ à votre analyse. Vous pouvez facilement passer de l’utilisation de l’échantillon de données à l’utilisation de la source de données complète en sélectionnant l’option correspondante dans le menu Données.

Ne vous connectez pas directement à l’extrait

Lorsque vous enregistrez des extraits sur votre ordinateur, vous pouvez vous y connecter directement à l’aide d’un nouveau Tableau Desktop. Toutefois, cette opération est déconseillée pour les raisons suivantes :

  • Les noms des tables peuvent être différents. Les extraits utilisent des noms spéciaux pour garantir que chaque table a un nom unique, qui peut être difficilement compréhensible.
  • Vous ne pouvez pas mettre à jour ou actualiser l’extrait. Lorsque vous vous connectez directement à un extrait, Tableau considère cet extrait comme la source de données d’origine plutôt que comme une copie. Vous ne pourrez donc pas le relier à votre source de données d’origine.
  • La structure et les relations entre les tables seront perdues. La disposition et les connexions entre les tables sont stockées dans le fichier .tds plutôt que dans le fichier .hyper. Par conséquent, lorsque vous vous connectez directement au fichier .hyper, vous perdez ces informations. Si vous utilisez le stockage des tables logiques pour l’extrait, vous ne verrez aucune référence aux tables physiques d’origine.

N’utilisez pas d’extrait si vous vous connectez à une connexion virtuelle avec des fonctions utilisateur décrites dans la stratégie de données

Si une connexion virtuelle a une stratégie de données qui contient des Fonctions utilisateur(Le lien s’ouvre dans une nouvelle fenêtre) (par exemple, USERNAME()) et que vous vous y connectez à partir d’un classeur ou d’une source de données et que vous créez un extrait à cet emplacement, l’extrait ne contiendra que les lignes qui correspondent à la stratégie de données de la connexion virtuelle au moment de la création de l’extrait. Pour tirer parti d’une connexion virtuelle avec les fonctions utilisateur dans la stratégie de données, utilisez une connexion en direct du classeur ou de la source de données à la connexion virtuelle au lieu d’un extrait.

Supprimer l’extrait du classeur

Vous pouvez supprimer un extrait à tout moment en sélectionnant la source de données de l’extrait dans le menu Données, puis en sélectionnant Extrait > Supprimer. Lorsque vous supprimez un extrait, vous pouvez choisir de Supprimer l’extrait du classeur uniquement ou de Supprimer le fichier d’extrait. Cette dernière option supprime l’extrait de votre disque dur.

Supprimer la boîte de dialogue d’extraction.

Voir l’historique de l’extrait (Tableau Desktop)

Pour voir la date de la dernière mise à jour de l’extrait et d’autres détails, sélectionnez une source de données dans le menu Données, puis sélectionnez Extrait > Historique.

Si vous ouvrez un classeur enregistré avec un extrait et que Tableau ne peut pas localiser l’extrait, sélectionnez l’une des options suivantes dans la boîte de dialogue Extrait introuvable lorsque vous y êtes invité :

  • Localiser l’extrait : Sélectionnez cette option si l’extrait est présent, mais pas dans l’emplacement où Tableau l’a enregistré à l’origine. Cliquez sur OK pour ouvrir une boîte de dialogue Ouvrir un fichier où vous pouvez spécifier le nouvel emplacement pour le fichier d’extrait.
  • Supprimer l’extrait : Sélectionnez cette option si vous n’avez plus besoin de l’extrait. Cela équivaut à fermer la source de données. Toutes les feuilles de calcul ouvertes référençant la source de données sont supprimées.
  • Désactiver l’extrait : Utilisez la source de données d’origine à partir de laquelle l’extrait a été créé, au lieu de l’extrait.
  • Régénérer l’extrait : Recrée l’extrait. Tous les filtres et les autres personnalisations que vous avez spécifiés lors de la création initiale de l’extrait sont automatiquement appliqués.

Résoudre les problèmes liés aux extraits

  • La création d’un extrait prend un certain temps : selon la taille de votre ensemble de données, la création d’un extrait peut demander un certain temps. Toutefois, une fois que vous avez extrait les données et que vous les avez enregistrées sur votre ordinateur, les performances peuvent s’améliorer.
  • L’extrait n’est pas créé : Si votre ensemble de données contient un grand nombre de colonnes (par exemple, de l’ordre du millier), Tableau risque de ne pas pouvoir créer l’extrait dans tous les cas. Si vous rencontrez des problèmes, vous pouvez envisager d’extraire moins de colonnes ou de restructurer les données sous-jacentes.
  • La boîte de dialogue Enregistrer ne s’affiche pas ou l’extrait n’est pas créé depuis un fichier.twbx : si vous suivez la procédure ci-dessus pour extraire des données à partir d’un classeur complet, la boîte de dialogue Enregistrer ne s’affiche pas. Lorsqu’un extrait est créé à partir d’un classeur complet (.twbx), le fichier d’extrait est automatiquement enregistré dans le package de fichiers associé au classeur complet. Pour accéder au fichier d’extrait que vous avez créé à partir du classeur complet, vous devez décompresser le classeur. Pour plus d’informations, consultez Classeurs complets.

Mises à jour des fonctionnalités de l’extrait

Actualisation de sous-plage de dates pour les extraits incrémentiels

Les versions 2024.2 et ultérieures de Tableau permettent de spécifier une période supplémentaire pour extraire à nouveau les données précédemment extraites et capturer toutes les modifications qui auraient pu se produire. Pour plus d’informations, consultez Actualiser les extraits.

Actualisation incrémentielle

À partir de la version 2024.1, Tableau introduit une fonctionnalité qui permet aux utilisateurs d’effectuer des actualisations incrémentielles sur les extraits à l’aide d’une colonne à clé non unique. Il existe une nouvelle interface utilisateur qui prend en charge ces paramètres avancés.

Cette mise à jour introduit une étape supplémentaire dans le processus d’extraction. Lors d’une actualisation incrémentielle, Tableau supprime d’abord les lignes de l’extrait qui correspondent à la valeur la plus élevée précédemment enregistrée. Par la suite, Tableau interroge toutes les lignes dont la valeur est supérieure ou égale à la valeur la plus élevée précédente. Cette approche garantit que toutes les lignes supprimées sont prises en compte, ainsi que celles nouvellement ajoutées.

Extraits sur le Web

À partir de la version 2020.4, les extraits sont disponibles en mode de création Web et sur le serveur de contenu. Vous n’avez désormais plus besoin d’utiliser Tableau Desktop pour extraire vos sources de données. Pour plus d’informations, consultez Créer des extraits sur le Web.

Extraits de table logiques et physiques

Avec l’introduction des tables logiques et des tables physiques dans le modèle de données Tableau avec la version 2020.2, les options de stockage d’extraits sont passées des tables uniques et tables multiples aux tables logiques et tables physiques. Ces options décrivent mieux la façon dont les extraits seront stockés. Pour plus d’information, consultez Extraire vos données.

Obsolescence du format .tde

Lorsque vous créez un extrait, ce dernier utilise le format .hyper. Les extraits au format .hyper tirent parti du moteur de données amélioré, qui prend en charge des performances plus rapides d’analyse et de requête pour des ensembles de données plus volumineux. Depuis mars 2023, les extraits utilisant le format .tde sont obsolètes dans Tableau Cloud, Tableau Public et Tableau Server (version 2023.1.0). 2024.2 est la version la plus récente qui permet d’ouvrir les fichiers au format .tde. Pour plus d’informations, consultez Mise à niveau d’extraits vers le format .hyper.

Modifications apportées aux valeurs et aux repères dans la vue

Pour améliorer l’efficacité et l’évolutivité de l’extrait, les valeurs des extraits peuvent être calculées différemment à partir de certaines sources de données. Les modifications apportées au mode de calcul des valeurs peuvent affecter la manière dont les repères de votre vue sont renseignés. Dans quelques rares cas, les modifications peuvent entraîner un changement de forme de la vue, ou la rendre vide. Ces modifications peuvent également s’appliquer aux sources de données suivantes : sources de données multiconnexion, sources de données utilisant des connexions en direct à des données basées sur des fichiers, sources de données se connectant à des données Google Sheets, sources de données basées dans le nuage, sources de données composées uniquement d’extraits, et sources de données du connecteur de données Web.

Format des valeurs de date et de date/heure

Les extraits sont soumis à des règles cohérentes et strictes quant au mode d’interprétation des chaînes de date via les fonctions DATE, DATETIME et DATEPARSE. Ceci affecte le mode d’analyse des dates, ou les formats et les modèles de date autorisés pour ces fonctions. Plus spécifiquement, les règles peuvent être généralisées comme suit :

  1. Les dates sont évaluées puis analysées par colonne, et non pas ligne.
  2. Les dates sont évaluées puis analysées en fonction des paramètres régionaux de création du classeur, et non des paramètres régionaux de l’ordinateur sur lequel la classeur est ouvert.

Ces règles permettent d’améliorer l’efficacité des extraits et de produire des résultats conformes aux bases de données commerciales.

Raisons courantes des changements de valeurs de date et de date/heure

  • Lorsque les données sont ambiguës et peuvent être interprétées de différentes manières, la date sera interprétée selon le format que Tableau a déterminé pour cette colonne. Pour quelques exemples, consultez le Scénario 1 ci-dessous.
  • Lorsqu’une fonction doit analyser un format YYYY-MM-DD (ISO). Pour obtenir un exemple, consultez Scénario 2.
  • Lorsqu’une fonction analyse des années, elle est interprétée comme suit :
    • L’année « 07 » est interprétée comme « 2007 »
    • L’année « 17 » est interprétée comme « 2017 »
    • L’année « 30 » est interprétée comme « 2030 »
    • L’année « 69 » est interprétée comme « 2069 »
    • L’année « 70 » est interprétée comme « 1970 »

Causes courantes des valeurs nulles

  • Lorsqu’une fonction doit analyser plusieurs formats de date dans une seule colonne. Une fois que Tableau a déterminé le format de date, toutes les autres dates de la colonne qui dévient de ce format deviennent des valeurs nulles. Pour quelques exemples, consultez le Scénario 1 ci-dessous.
  • Lorsqu’une fonction doit analyser un format YYYY-MM-DD (ISO). Les valeurs dépassant ce qui est autorisé pour « YYYY », « MM » ou « DD » génèrent des valeurs nulles. Pour obtenir un exemple, consultez Scénario 2.
  • Lorsqu’une fonction doit analyser des valeurs de date contenant des caractères de fin. Par exemple, des suffixes et des mots-clés de fuseau horaire et d’heure d’été, par exemple « minuit », peuvent entraîner des valeurs nulles.
  • Lorsqu’une fonction doit analyser une date ou une heure non valide. Par exemple, 32/3/2024 entraîne une valeur nulle. Dans un autre exemple, 25 :01 :61 entraîne une valeur nulle.
  • Lorsqu’une fonction doit analyser des entrées contradictoires. Par exemple, supposons que le modèle soit « jj.MM (MMMM) a » et que la chaîne entrée soit « 1.09 (Août) 2024 », où « 9 » et « Août » sont tous deux des mois. Le résultat est une valeur Null parce que les valeurs de mois ne sont pas les mêmes.
  • Lorsqu’une fonction doit analyser des modèles contradictoires. Par exemple, un modèle spécifiant un mélange d’année grégorienne (a) et une semaine ISO (ss) entraîne des valeurs nulles.
Scénario 1

Supposons que votre classeur ait été créé avec des paramètres régionaux anglais qui utilisent une source de données d’un extrait .tde. Le tableau ci-dessous montre une colonne de données de type chaîne contenue dans la source de données de l’extrait.

10/31/2024
31/10/2024

12/10/2024

Sur la base des paramètres régionaux anglais spécifiques, le format de la colonne de date était conçu pour suivre le format MJA (mois, jour, année). Les tableaux suivants montrent ce que Tableau affiche en fonction de ces paramètres régionaux lorsque la fonction DATE est utilisée pour convertir des valeurs de chaîne en valeurs de date.

31 octobre 2024
31 octobre 2024
10 décembre 2024

Si l’extrait est ouvert selon des paramètres régionaux allemands, voici ce que vous voyez :

31 Oktober 2024
31 Oktober 2024
12 Oktober 2024

Toutefois, une fois que l’extrait a été ouvert dans des paramètres régionaux allemands en utilisant les versions 10.5 et ultérieures, le format JMA (jour, mois, année) des paramètres régionaux allemands est appliqué de manière stricte et entraîne une valeur Null parce que l’une des valeurs ne suit pas le format JMA.

Null
31 octobre 2024
12 octobre 2024
Scénario 2

Supposons que vous ayez une colonne de données de type chaîne contenue dans la source de données.

2024-10-31
2024-31-10

2024-12-10

2024-10-12

La date utilisant un format ISO, la colonne de date suit toujours le format YYYY-MM-DD. Les tableaux suivants montrent ce que Tableau affiche lorsque la fonction DATE est utilisée pour convertir des valeurs de chaîne en valeurs de date.

10 octobre 2024
Null
10 décembre 2024
12 octobre 2024

Ordre de tri et casse des valeurs

Les extraits prennent en charge le collationnement et peuvent donc trier de manière plus appropriée les chaînes qui ont des accents ou une casse différente.

Prenons par exemple une table de chaînes. En termes d’ordre de tri, cela signifie qu’une chaîne telle que Égypte est désormais classée correctement après Estonie et avant Fidji.

En matière de casse, les mêmes valeurs de chaîne sont considérées comme uniques et donc stockées en tant que valeurs individuelles.

Briser l’égalité dans les requêtes N principaux

Une requête N premiers dans votre extrait peut produire des valeurs en double pour une position spécifique dans un classement. Par exemple, supposons que vous créez un filtre 3 principaux. Les positions 3, 4 et 5 ont les mêmes valeurs. Le premier filtre renvoie les positions 1, 2 et 5.

Précision des valeurs en virgule flottante

Les extraits sont plus aptes à tirer parti des ressources matérielles disponibles sur un ordinateur et donc à effectuer des opérations mathématiques de manière hautement parallèle. Pour cette raison, les nombres réels peuvent être agrégés par des extraits .hyper dans un ordre différent. Lorsque les nombres sont agrégés dans un ordre différent, vous pouvez voir des valeurs différentes dans votre vue après la virgule décimale à chaque fois que l’agrégation est calculée. La raison est que les additions et les multiplications à virgule flottante ne sont pas nécessairement associatives. Cela signifie que (a + b) + c n’est pas nécessairement identique à a + (b + c). De plus, les nombres réels peuvent être agrégés dans un ordre différent parce que la multiplication en virgule flottante n’est pas nécessairement distributive. Cela signifie que (a x b) x c n’est pas nécessairement identique à a x b x c. Ce type de comportement d’arrondi en virgule flottante dans les extraits .hyper ressemble au comportement d’arrondi en virgule flottante dans les bases de données commerciales.

Par exemple, supposons que votre classeur contienne un filtre de curseur sur un champ agrégé comportant des valeurs en virgule flottante. Du fait que la précision des valeurs en virgule flottante a changé, le filtre peut désormais exclure un repère qui définit la limite supérieure ou inférieure de la plage de filtres. L’absence de ces nombres peut générer une vue vide. Pour résoudre ce problème, déplacez le curseur sur le filtre ou retirez ou ajoutez à nouveau le filtre.

Précision des agrégations

Les extraits optimisent les ensembles de données volumineux en tirant parti des ressources matérielles disponibles sur un ordinateur et sont donc capables de calculer des agrégations de manière hautement parallèle. Pour cette raison, les agrégations effectuées par des extraits .hyper peuvent s’apparenter aux résultats de bases de données commerciales davantage que les résultats fournis par des logiciels spécialisés dans les calculs statistiques. Si vous utilisez un ensemble de données de petite dimension ou que vous avez besoin d’un niveau supérieur de précision, vous pouvez envisager de réaliser les agrégations via des lignes de référence, des statistiques de fiches Résumé, ou des fonctions de calcul de table telles que la variance, l’écart-type, la corrélation ou la covariance.

API

Vous pouvez utiliser Extract API pour créer des extraits .hyper. Pour les tâches telles que la publication d’extraits, vous pouvez utiliser l’API REST de Tableau Server ou la bibliothèque du client Tableau Server (Python). Pour les tâches d’actualisation, vous pouvez également utiliser l’API REST de Tableau Server. Pour plus d’informations, consultez API Tableau Hyper.