Extraire vos données

S’applique à : Tableau Desktop

Un extrait de données est un sous-ensemble d’informations enregistré séparément de l’ensemble de données d’origine. Il répond à deux objectifs : améliorer les performances et utiliser les fonctionnalités de Tableau qui ne sont pas nécessairement disponibles ou prises en charge dans les données d’origine. En créant un extrait de données, vous réduisez efficacement le volume global de données en appliquant des filtres et en définissant d’autres limitations.

Une fois créé, un extrait de données peut être actualisé avec les données les plus récentes de la source d’origine. Lors du processus d’actualisation, vous pouvez effectuer une actualisation complète, qui remplacera tout le contenu existant de l’extrait, ou vous pouvez opter pour une actualisation incrémentielle de manière à ajouter uniquement les lignes qui sont nouvelles depuis la dernière actualisation.

Avantages des extraits

Gestion d’ensembles de données volumineux : les extraits peuvent gérer des quantités massives de données, jusqu’à plusieurs milliards de lignes. Les utilisateurs peuvent ainsi travailler efficacement avec de vastes ensembles de données.
Performances améliorées : l’interaction avec les vues qui utilisent les sources de données d’un extrait génère de meilleures performances par rapport aux vues connectées directement aux données d’origine. Les extraits optimisent les performances des requêtes, ce qui accélère l’analyse et la visualisation des données.
Fonctionnalité améliorée : les extraits donnent accès à des fonctionnalités Tableau supplémentaires qui ne sont pas nécessairement disponibles ni prises en charge par la source de données d’origine, telles que des fonctions spécifiques.
Accès aux données hors ligne (Tableau Desktop) : les extraits permettent un accès hors ligne aux données. Ainsi, même lorsque la source de données d’origine n’est pas disponible, les utilisateurs peuvent continuer d’enregistrer, de traiter et de gérer les données localement.

Créer un extrait

Il existe plusieurs moyens de créer un extrait. Seule l’approche principale est expliquée ci-dessous.

Connectez-vous aux données et configurez la source de données dans le volet Source de données, en haut à droite, sélectionnez Extrait, puis cliquez sur le lien Modifier pour ouvrir la boîte de dialogue Extraire des données.

L’option Extrait sélectionnée pour afficher le lien Modifier

Développez chaque section pour voir ses options ou sélectionnez Développer tout. Vous trouverez des informations détaillées sur chaque section plus loin dans cette rubrique.

Stockage des données : vous pouvez basculer entre Tables logiques et Tables physiques.
Filtres : configurez des filtres afin de limiter la quantité de données extraites en fonction des champs et de leurs valeurs.
Agrégation : sélectionnez Agréger les données pour les dimensions visibles pour agréger les mesures en utilisant l’agrégation par défaut. Vous pouvez également sélectionner Regrouper les dates dans un niveau de date spécifié, tel que Année, Mois, etc.
Nombre de lignes : définissez le nombre de lignes que vous souhaitez extraire. Vous pouvez extraire toutes les lignes, un échantillon ou les lignes N premiers.
Actualisation incrémentielle : configurez une actualisation incrémentielle basée sur une colonne et une plage de dates spécifiques. Vous pouvez également choisir si vous souhaitez ou non remplacer ou ajouter les dernières lignes.

Une fois que vous avez terminé, choisissez Enregistrer les paramètres.
Sélectionnez l’onglet Feuille. La création de l’extrait démarre alors.
Ensuite, sélectionnez l’emplacement d’enregistrement de l’extrait.
Entrez un nom pour le fichier d’extrait.
Sélectionnez Enregistrer. Si la boîte de dialogue d’enregistrement ne s’affiche pas, consultez la section Résoudre les problèmes liés aux extraits ci-dessous.

Description des paramètres d’extrait

Vous pouvez configurer de nombreux paramètres lorsque vous créez un extrait.

Stockage de données

Sous Stockage de données, vous pouvez sélectionner des tables logiques ou physiques. Les tables logiques stockent les données à l’aide d’une table d’extrait pour chaque table logique de la source de données. Les tables physiques, quant à elles, stockent les données à l’aide d’une table d’extrait pour chaque table physique dans la source de données.

Les options Tables logiques et Tables physiques n’affectent toutes deux que la manière dont les données de votre extrait sont stockées. Elles n’affectent pas la manière dont les tables de votre extrait s’affichent dans le volet Source de données.

Supposons, par exemple, que votre extrait soit composé d’une table logique contenant trois tables physiques. Si vous ouvrez directement le fichier d’extrait (.hyper) qui a été configuré pour utiliser l’option par défaut, Tables logiques, une seule table figure sur la page Source de données. Par contre, si vous ouvrez l’extrait à l’aide du fichier de la source de données complète (.tdsx) ou le fichier de la source de données (.tdsx) avec son extrait correspondant (fichier .hyper), vous voyez les trois tables dans le volet Source de données.

Tables logiques

Tableau utilise des tables logiques comme structure par défaut pour stocker les données d’extrait. Tableau vous recommande généralement d’utiliser l’option de stockage des données par défaut, Tables logiques, lorsque vous configurez et utilisez des extraits. La plupart des fonctionnalités auxquelles vous pourriez souhaiter accéder, comme les filtres d’extrait, l’agrégation, l’option N premiers ou les fonctions de transfert (RAWSQL), ne sont disponibles que si vous utilisez l’option Tables logiques. Vous ne pouvez toutefois pas ajouter des données à des extraits comportant plus d’une table logique.

Si vous choisissez l’option Tables logiques et que votre extrait contient des jointures, ces dernières sont appliquées lors de la création de l’extrait.

Tables physiques

Cette option exécute les jointures au moment de l’interrogation. Elle peut contribuer à améliorer les performances et à réduire la taille du fichier d’extrait, si vos données remplissent toutes les conditions suivantes :

Toutes les jointures entre les tables physiques sont des jointures d’égalité (=).
Les types de données des colonnes utilisées pour les relations ou les jointures sont identiques.
Aucune fonction directe (RAWSQL) n’est utilisée.
Aucune actualisation incrémentielle n’est configurée.
Aucun filtre d’extrait n’est configuré.
Aucune option N premiers ou d’échantillonnage n’est configurée.
Aucune donnée n’a besoin d’être ajoutée à l’extrait.

Conseils d’utilisation des tables physiques

Extraits plus volumineux que prévu : pour déterminer si l’extrait est plus volumineux que prévu, la somme des lignes dans l’extrait utilisant l’option Tables logiques doit être supérieure à la somme des lignes de toutes les tables combinées avant la création de l’extrait. Dans ce cas de figure, essayez plutôt d’utiliser l’option Tables physiques.

Options de filtrage : lorsque vous utilisez l’option Tables physiques, les autres options de réduction des données dans votre extrait (filtres d’extrait, agrégation, N principaux et échantillonnage, par exemple) sont désactivées. Si vous avez besoin de réduire les données dans un extrait utilisant l’option Tables multiples, envisagez de filtrer les données avant qu’elles ne soient intégrées dans Tableau Desktop en utilisant l’une des suggestions suivantes :

Toutes les jointures entre les tables physiques sont des jointures d’égalité (=).
Connectez-vous à vos données et définissez des filtres à l’aide de SQL personnalisé. Au lieu de vous connecter à une table de base de données, connectez-vous plutôt à vos données à l’aide de SQL personnalisé. Lorsque vous créez votre propre requête SQL personnalisée, assurez-vous qu’elle contient le niveau approprié de filtrage nécessaire pour réduire les données dans votre extrait. Pour plus d’informations sur la connexion à SQL personnalisé dans Tableau Desktop, voir Se connecter à une requête SQL personnalisée.
Définissez une vue dans la base de données. Si vous disposez d’un accès en écriture à votre base de données, envisagez de définir une vue de base de données contenant simplement les données nécessaires pour votre extrait puis connectez-vous à la vue de base de données depuis Tableau Desktop.

Sécurité au niveau des lignes avec les extraits : si vous souhaitez sécuriser les données d’extrait au niveau des lignes, il est recommandé d’utiliser l’option Tables physiques. Pour plus d’informations sur la sécurité au niveau des lignes dans Tableau, consultez Restreindre l’accès au niveau des lignes de données.

Filtres

Utilisez les filtres afin de limiter la quantité de données extraites en fonction de champs et de leurs valeurs.

Remarque : les filtres d’extrait dans les tables logiques sont systématiques (ils s’appliquent à l’ensemble de la source de données) pour les sources de données comportant une seule table de base. Pour les sources de données avec plusieurs tables de base utilisant des relations multi-faits, les filtres d’extrait s’appliquent par table et uniquement à la table logique elle-même. Pour plus d’informations sur les filtres systématiques et par table, consultez Filtrer les données de sources de données.

Agrégation

L’agrégation vous permet de regrouper des mesures. Vous pouvez également sélectionner l’option Regrouper les dates dans un niveau de date spécifique, tel que Année, Mois, etc. Les exemples ci-dessous expliquent comment les données seront extraites pour chaque option d’agrégation choisie :

Données d’origine : chaque enregistrement apparaît sur une ligne distincte. Les données d’origine comportent sept lignes.
Données agrégées pour les dimensions visibles (pas de regroupement) : les enregistrements portant la même date et la même lettre ont été agrégés sur une seule ligne. Votre extrait contient cinq lignes.
Agréger les dates pour les dimensions visibles (regrouper les dates au niveau Mois) : les dates ont été regroupées au niveau Mois et les enregistrements au sein de la même région ont été agrégés sur une seule ligne. Votre extrait contient trois lignes.

Données d’origine	Agrégation sans regroupement	Agrégation avec regroupement

Nombre de lignes

Vous pouvez extraire toutes les lignes ou les lignes N principaux. Tableau applique d’abord les filtres et les agrégations, puis extrait le nombre de lignes des résultats filtrés et agrégés. Les options de nombre de lignes dépendent du type de source de données à partir duquel vous obtenez l’extrait. Il est possible que vous ne voyiez pas l’option Échantillonnage dans la boîte de dialogue Extraire les données, car certaines sources de données ne prennent pas en charge cette option.

Remarque(s) : tous les champs que vous masquez en premier dans la page Source de données ou dans l’onglet Feuille seront exclus de l’extrait. Cliquez sur le bouton Masquer tous les champs inutilisés pour supprimer les champs masqués de l’extrait.

Actualisation incrémentielle

La plupart des sources de données prennent en charge l’actualisation incrémentielle. Plutôt que d’actualiser la totalité de l’extrait, vous pouvez configurer l’actualisation de manière à ajouter uniquement les lignes nouvelles depuis la dernière extraction des données.

Par exemple, votre source de données peut être mise à jour tous les jours avec les nouvelles transactions de ventes. Plutôt que de recréer tous les jours la totalité de l’extrait, vous pouvez simplement ajouter les nouvelles transactions du jour.

Conseils pour l’actualisation incrémentielle

Actualisation incrémentielle :

Dans Nombre de lignes, vous devez sélectionner Toutes les lignes.
L’actualisation incrémentielle n’est pas disponible si vous activez l’agrégation.

Paramètres avancés :

Les paramètres avancés ne sont pas compatibles avec les filtres.

Conseils pour la création d’extraits

Enregistrez votre classeur pour conserver la connexion à l’extrait

Une fois l’extrait créé, le classeur commence à utiliser la version d’extrait de vos données. Par contre, la connexion à la version d’extrait de vos données n’est pas enregistrée tant que vous n’avez pas enregistré le classeur. Cela signifie que si vous fermez le classeur sans l’enregistrer, il se connectera à la source de données d’origine lors de sa prochaine ouverture.

Permuter entre des données échantillonnées et un extrait entier

Lorsque vous travaillez avec un extrait volumineux, il peut être utile de créer un échantillon plus petit des données. Vous pourrez ainsi configurer votre vue sans avoir à exécuter des requêtes longues à chaque fois que vous ajoutez un champ à votre analyse. Vous pouvez facilement basculer entre l’utilisation des exemples de données et la source de données complète en sélectionnant l’option appropriée dans le menu Données.

Ne vous connectez pas directement à l’extrait

Lorsque vous enregistrez des extraits sur votre ordinateur, vous pouvez vous y connecter directement à l’aide d’une nouvelle instance Tableau Desktop. Cette opération est toutefois déconseillée pour les raisons suivantes :

Les noms des tables peuvent être différents. Les extraits utilisent une dénomination spéciale pour garantir que chaque table porte un nom unique, ce qui peut être difficile à comprendre.
Vous ne pouvez pas mettre à jour ni actualiser l’extrait. Lorsque vous vous connectez directement à un extrait, Tableau le considère comme la source de données d’origine, plutôt que comme une copie. Cela signifie que vous ne pouvez pas le relier à votre source de données d’origine.
La structure et les relations entre les tables seront perdues. La disposition et les connexions entre les tables sont stockées dans le fichier .tds, et non dans le fichier .hyper. Par conséquent, lorsque vous vous connectez directement au fichier .hyper, vous perdez ces informations. Si vous utilisez le stockage de tables logiques pour l’extrait, vous ne verrez aucune référence aux tables physiques d’origine.

N’utilisez pas d’extrait si vous vous connectez à une connexion virtuelle avec des fonctions utilisateur dans la stratégie de données

Si une connexion virtuelle possède une stratégie de données qui contient des Fonctions utilisateur(Le lien s’ouvre dans une nouvelle fenêtre) (par exemple, USERNAME()) et que vous vous y connectez à partir d’un classeur ou d’une source de données et que vous y créez un extrait, l’extrait contiendra uniquement les lignes qui correspondent à la stratégie de données de connexion virtuelle au moment de la création de l’extrait. Pour tirer parti d’une connexion virtuelle avec les fonctions utilisateur dans la stratégie de données, utilisez une connexion en direct à partir du classeur ou de la source de données à la connexion virtuelle au lieu d’un extrait.

Supprimer l’extrait du classeur

Vous pouvez supprimer un extrait à tout moment du menu Données en sélectionnant la source de données extraite > Extrait > Supprimer.

Lorsque vous supprimez un extrait, vous pouvez choisir de Supprimer l’extrait du classeur uniquement ou de Supprimer le fichier d’extrait. Cette dernière option supprime l’extrait de votre disque dur.

Boîte de dialogue Supprimer l’extrait.

Consulter l’historique de l’extrait (Desktop)

Pour voir la date de la dernière mise à jour de l’extrait et d’autres détails, sélectionnez une source de données dans le menu Données, puis sélectionnez Extrait > Historique.

Si vous ouvrez un classeur enregistré avec un extrait et que Tableau ne peut pas localiser l’extrait, sélectionnez l’une des options suivantes dans la boîte de dialogue Extrait introuvable lorsque vous y êtes invité :

Localiser l’extrait : Sélectionnez cette option si l’extrait est présent, mais pas dans l’emplacement où Tableau l’a enregistré à l’origine. Cliquez sur OK pour ouvrir une boîte de dialogue Ouvrir un fichier où vous pouvez spécifier le nouvel emplacement pour le fichier d’extrait.
Supprimer l’extrait : Sélectionnez cette option si vous n’avez plus besoin de l’extrait. Cela équivaut à fermer la source de données. Toutes les feuilles de calcul ouvertes référençant la source de données sont supprimées.
Désactiver l’extrait : Utilisez la source de données d’origine à partir de laquelle l’extrait a été créé, au lieu de l’extrait.
Régénérer l’extrait : Recrée l’extrait. Tous les filtres et les autres personnalisations que vous avez spécifiés lors de la création initiale de l’extrait sont automatiquement appliqués.

Résoudre les problèmes liés aux extraits

La création d’un extrait prend un certain temps : selon la taille de votre ensemble de données, la création d’un extrait peut demander un certain temps. Toutefois, une fois que vous avez extrait les données et que vous les avez enregistrées sur votre ordinateur, les performances peuvent s’améliorer.
L’extrait n’est pas créé : si votre ensemble de données contient un très grand nombre de colonnes (de l’ordre du millier), Tableau risque de ne pas pouvoir créer l’extrait dans tous les cas. Si vous rencontrez des problèmes, vous pouvez envisager d’extraire moins de colonnes ou de restructurer les données sous-jacentes.
La boîte de dialogue Enregistrer ne s’affiche pas ou l’extrait n’est pas créé depuis un fichier .twb : si vous suivez la procédure ci-dessus pour extraire des données à partir d’un classeur complet, la boîte de dialogue Enregistrer ne s’affiche pas. Lorsqu’un extrait est créé à partir d’un classeur complet (.twbx), le fichier d’extrait est automatiquement enregistré dans le package de fichiers associé au classeur complet. Pour accéder au fichier d’extrait que vous avez créé à partir du classeur complet, vous devez décompresser le classeur. Pour plus d’informations, consultez Classeurs complets.

Mise à jour des fonctionnalités des extraits

Plage de dates minimum à actualiser pour les extraits incrémentiels

À compter de la version Tableau 2024.2, vous pouvez spécifier une période supplémentaire pour réextraire les données précédemment extraites et capturer toutes les modifications éventuelles. Pour plus d’informations, consultez Actualiser les extraits.

Actualisation incrémentielle

Depuis la version 2024.1, Tableau a introduit une fonctionnalité qui permet aux utilisateurs d’effectuer des actualisations incrémentielles sur les extraits à l’aide d’une colonne de clés non uniques. Une nouvelle interface utilisateur prend en charge ces paramètres avancés.

Cette mise à jour introduit en outre une étape supplémentaire dans le processus d’extraction. Lors d’une actualisation incrémentielle, Tableau commence par supprimer les lignes de l’extrait qui correspondent à la valeur la plus élevée précédemment enregistrée. Ensuite, Tableau interroge toutes les lignes dont la valeur est supérieure ou égale à la valeur la plus élevée précédente. Cette approche garantit que toutes les lignes supprimées sont prises en compte, ainsi que celles nouvellement ajoutées.

Extraits sur le Web

À partir de la version 2020.4, les extraits sont disponibles en mode de création Web et sur le serveur de contenu. Vous n’avez désormais plus besoin d’utiliser Tableau Desktop pour extraire vos sources de données. Pour plus d’informations, consultez Créer des extraits sur le Web.

Extraits de table logiques et physiques

Avec l’introduction des tables logiques et des tables physiques dans le modèle de données Tableau avec la version 2020.2, les options de stockage d’extraits sont passées des tables uniques et tables multiples aux tables logiques et tables physiques. Ces options décrivent mieux la façon dont les extraits seront stockés. Pour plus d’informations, voir Extraire vos données.

Abandon du format .tde

Lorsque vous créez un extrait, ce dernier utilise le format .hyper. Les extraits au format .hyper tirent parti du moteur de données amélioré, qui prend en charge des performances plus rapides d’analyse et de requête pour des ensembles de données plus volumineux. Depuis mars 2023, les extraits utilisant le format .tde sont obsolètes dans Tableau Cloud, Tableau Public et Tableau Server (version 2023.1.0). La version 2024.2 est la dernière version capable d’ouvrir les fichiers au format .tde. Pour plus d’informations, consultez Mise à niveau d’extraits vers le format .hyper.

Modifications apportées aux valeurs et aux repères dans la vue

Pour améliorer l’efficacité et l’évolutivité des extraits, les valeurs incluses dans les extraits peuvent être calculées différemment à partir de certaines source de données. Les modifications apportées au mode de calcul des valeurs peuvent affecter la manière dont les repères de votre vue sont renseignés. Dans quelques rares cas, les modifications peuvent entraîner un changement de forme de la vue, ou la rendre vide. Ces modifications peuvent également s’appliquer aux sources de données suivantes : sources de données multiconnexion, sources de données utilisant des connexions en direct à des données basées sur des fichiers, sources de données se connectant à des données Google Sheets, sources de données basées sur le cloud, sources de données composées uniquement d’extraits, et sources de données WDC.

Format des valeurs de date et de date/heure

Les extraits sont soumis à des règles cohérentes et strictes quant au mode d’interprétation des chaînes de date via les fonctions DATE, DATETIME et DATEPARSE. Ceci affecte le mode d’analyse des dates, ou les formats et les modèles de date autorisés pour ces fonctions. Plus spécifiquement, les règles peuvent être généralisées comme suit :

Les dates sont évaluées puis analysées par colonne, et non pas ligne.
Les dates sont évaluées puis analysées en fonction des paramètres régionaux de création du classeur, et non des paramètres régionaux de l’ordinateur sur lequel le classeur est ouvert.

Ces règles permettent d’améliorer l’efficacité des extraits et de produire des résultats conformes aux bases de données commerciales.

Raisons courantes des changements de valeurs de date et de date/heure

Lorsque les données sont ambiguës et peuvent être interprétées de différentes manières, la date sera interprétée selon le format que Tableau a déterminé pour cette colonne. Pour quelques exemples, consultez Scénario 1 ci-dessous.
Lorsqu’une fonction doit analyser un format YYYY-MM-DD (ISO). Pour un exemple, consultez Scénario 2.
Lorsqu’une fonction analyse des années, ces dernières sont interprétées comme suit :
- L’année « 07 » est interprétée comme « 2007 »
- L’année « 17 » est interprétée comme « 2017 »
- L’année « 30 » est interprétée comme « 2030 »
- L’année « 69 » est interprétée comme « 2069 »
- L’année « 70 » est interprétée comme « 1970 »

Causes courantes des valeurs null

Lorsqu’une fonction doit analyser plusieurs formats de date dans une seule colonne. Une fois que Tableau a déterminé le format de date, toutes les autres dates de la colonne qui dévient de ce format deviennent des valeurs null. Pour quelques exemples, consultez Scénario 1 ci-dessous.
Lorsqu’une fonction doit analyser un format YYYY-MM-DD (ISO). Les valeurs dépassant ce qui est autorisé pour « YYYY », « MM » ou « DD » génèrent des valeurs null. Pour un exemple, consultez Scénario 2.
Lorsqu’une fonction doit analyser des valeurs de date contenant des caractères de fin. Par exemple, des suffixes et des mots-clés de fuseau horaire et d’heure d’été, par exemple « minuit », peuvent entraîner des valeurs null.
Lorsqu’une fonction doit analyser une date ou une heure non valide. Par exemple, 32/3/2024 entraîne une valeur null. Dans un autre exemple, 25:01:61 entraîne une valeur null.
Lorsqu’une fonction doit analyser des entrées contradictoires. Par exemple, supposons que le modèle soit « jj.MM (MMMM) a » et que la chaîne entrée soit « 1.09 (Août) 2024 », où « 9 » et « Août » sont tous deux des mois. Le résultat est une valeur null parce que les valeurs de mois ne sont pas les mêmes.
Lorsqu’une fonction doit analyser des modèles contradictoires. Par exemple, un modèle spécifiant un mélange d’année grégorienne (a) et une semaine ISO (ss) entraîne des valeurs null.

Scénario 1

Supposons que votre classeur ait été créé avec des paramètres régionaux anglais qui utilisent une source de données d’extrait .hyper. Le tableau ci-dessous montre une colonne de données de type chaîne contenue dans la source de données de l’extrait.

10/31/2024

31/10/2024

12/10/2024

Sur la base des paramètres régionaux anglais spécifiques, le format de la colonne de date était conçu pour suivre le format MJA (mois, jour, année). Les tableaux suivants montrent ce que Tableau affiche en fonction de ces paramètres régionaux lorsque la fonction DATE est utilisée pour convertir des valeurs de chaîne en valeurs de date.

October 31, 2024

December 10, 2024

Si l’extrait est ouvert selon des paramètres régionaux allemands, voici ce que vous voyez :

31 Oktober 2024

12 Oktober 2024

Toutefois, une fois que l’extrait est ouvert dans des paramètres régionaux allemands, le format JMA (jour, mois, année) des paramètres régionaux allemands est appliqué de manière stricte et entraîne une valeur Null parce que l’une des valeurs ne suit pas le format JMA.

Null

October 31, 2024

October 12, 2024

Scénario 2

Supposons que vous ayez une colonne de données de type chaîne contenue dans la source de données.

2024-10-31

2024-31-10

2024-12-10

2024-10-12

La date utilisant un format ISO, la colonne de date suit toujours le format YYYY-MM-DD. Les tableaux suivants montrent ce que Tableau affiche lorsque la fonction DATE est utilisée pour convertir des valeurs de chaîne en valeurs de date.

31/10/2024

Null

December 10, 2024

October 12, 2024

Modification du nombre de lignes

Dans une connexion en direct, Tableau respecte et utilise les paramètres de classement de la base de données source. Dans un extrait, les paramètres propres à Tableau sont utilisés et peuvent différer légèrement des règles appliquées dans la base de données source. Les données brutes restent les mêmes, mais la manière dont les données sont agrégées et affichées dans l’interface utilisateur peut ne pas concorder.

Quels que soient le type de connexion et les paramètres de classement, le nombre total de lignes peut être vérifié comme étant le même entre une connexion en direct et un extrait en examinant Afficher les données > Analyse des données complètes.

Ordre de tri et casse des valeurs

Les extraits prennent en charge l’interclassement et peuvent donc trier de manière plus appropriée les chaînes qui ont des accents ou une casse différente.

Prenons par exemple une table de chaînes. En termes d’ordre de tri, cela signifie qu’une chaîne telle que Égypte est désormais classée correctement après Estonie et avant Fidji.

En termes de casse, les mêmes valeurs de chaînes sont considérées comme uniques et sont donc stockées en tant que valeurs individuelles.

Briser l’égalité dans les requêtes N principaux

Une requête N principaux dans votre extrait peut produire des valeurs en double pour une position spécifique dans un classement. Par exemple, supposons que vous créez un filtre 3 principaux. Les positions 3, 4 et 5 ont les mêmes valeurs. Le filtre Principaux renvoie les positions 1, 2 et 5.

Précision des valeurs à virgule flottante

Les extraits sont plus aptes à tirer parti des ressources matérielles disponibles sur un ordinateur et donc à effectuer des opérations mathématiques de manière hautement parallèle. Pour cette raison, les nombres réels peuvent être agrégés par des extraits .hyper dans un ordre différent. Lorsque les nombres sont agrégés dans un ordre différent, vous pouvez voir des valeurs différentes dans votre vue après la virgule décimale à chaque fois que l’agrégation est calculée. La raison est que les additions et les multiplications à virgule flottante ne sont pas nécessairement associatives. Cela signifie que (a + b) + c n’est pas nécessairement identique à a + (b + c). De plus, les nombres réels peuvent être agrégés dans un ordre différent parce que la multiplication à virgule flottante n’est pas nécessairement distributive. Cela signifie que (a x b) x c n’est pas nécessairement identique à a x b x c. Ce type de comportement d’arrondi à virgule flottante dans les extraits .hyper ressemble au comportement d’arrondi à virgule flottante dans les bases de données commerciales.

Par exemple, supposons que votre classeur contienne un filtre de curseur sur un champ agrégé comportant des valeurs à virgules flottantes. Du fait que la précision des valeurs à virgule flottante a changé, le filtre peut désormais exclure un repère qui définit la limite supérieure ou inférieure de la plage de filtres. L’absence de ces nombres peut générer une vue vide. Pour résoudre ce problème, déplacez le curseur sur le filtre ou retirez ou ajoutez à nouveau le filtre.

Précision des agrégations

Les extraits optimisent les ensembles de données volumineux en tirant parti des ressources matérielles disponibles sur un ordinateur et sont donc capables de calculer des agrégations de manière hautement parallèle. Pour cette raison, les agrégations effectuées par des extraits .hyper peuvent s’apparenter aux résultats de bases de données commerciales davantage que les résultats fournis par des logiciels spécialisés dans les calculs statistiques. Si vous utilisez un ensemble de données de petite dimension ou que vous avez besoin d’un niveau supérieur de précision, vous pouvez envisager de réaliser les agrégations via des lignes de référence, des statistiques de fiches Résumé, ou des fonctions de calcul de table telles que la variance, l’écart-type, la corrélation ou la covariance.

API

Vous pouvez désormais utiliser l’API Extrait pour créer des extraits .hyper. Pour les tâches telles que la publication d’extraits, vous pouvez utiliser l’API REST de Tableau Server ou la bibliothèque du client Tableau Server (Python). Pour les tâches d’actualisation, vous pouvez également utiliser l’API REST de Tableau Server. Pour plus d’informations, consultez API Tableau Hyper.

Autres articles de cette section

Retour en haut

Merci de vos commentaires !

Avis correctement envoyé. Merci

Aide de Tableau Desktop et de la création Web