Examiner vos données

Utilisez les options de cette rubrique pour bien appréhender la composition de vos données et mieux comprendre les modifications que vous devez apporter, ainsi que l'effet des opérations que vous incluez dans le flux.

Vérifier les types de données affectés à vos données

Comme Tableau Desktop, Tableau Prep Builder interprète les données de vos champs lorsque vous faites glisser une connexion vers le volet Flux et lui attribue automatiquement un type de données. Étant que différentes bases de données peuvent gérer les données de différentes manières, l'interprétation de Tableau Prep Builder peut ne pas toujours être correcte.

Pour modifier un type de données, cliquez sur l'icône du type de données et sélectionnez le type de données correct dans le menu contextuel. Vous pouvez modifier des types de données « chaîne » ou « entier » en Date ou Date et heure, et Tableau Prep Builder déclenchera la fonction Auto DateParse (analyse automatique de date) pour modifier ces types de données. Comme Tableau Desktop, si la modification échoue, vous voyez des valeurs null dans les champs à la place, et vous pouvez créer un calcul pour effectuer la modification.

Pour plus d'informations sur l'utilisation de la fonction DateParse, consultez Convertir un champ en un champ de date(Link opens in a new window) dans l'aide de Tableau Desktop et la création Web.

Vous pouvez modifier le type de données dans votre étape des données entrantes après vous être connecté aux données à partir des sources de données suivantes :

  • Microsoft Excel
  • Fichiers texte
  • Fichiers PDF
  • Box
  • Dropbox
  • Google Drive
  • OneDrive

Pour toutes les autres sources de données, ajoutez une étape de nettoyage ou un autre type d’étape pour effectuer cette modification. Pour afficher la liste des options de nettoyage disponibles dans les différents types d’étapes, consultez À propos des opérations de nettoyage.

Consulter les informations de taille de vos données

Après vous être connecté à vos données, ajoutez une table au flux, puis ajoutez une étape. Vous pouvez utiliser le volet Profil pour voir l'état et la structure actuels de vos données et repérer les valeurs null et les données atypiques.

  • Nombre de fichiers et de lignes : dans le coin supérieur gauche du volet Profil, vous pouvez voir des informations qui résument le nombre de champs et de lignes dans les données à un point particulier du flux. Tableau Prep Builder arrondit au millier le plus proche. Dans l'exemple ci-dessous, l'ensemble de données comporte 21 champs et 3000 lignes.

    Lorsque vous survolez le nombre de champs et de lignes, vous pouvez voir le nombre exact de lignes (dans cet exemple, 2848) :


  • Taille de l'ensemble de données : utilisez un sous-ensemble de vos données en spécifiant le nombre de lignes à inclure dans l'onglet Échantillon de données du volet Entrée.

  • Échantillonné : pour vous permettre d'interagir directement avec vos données, Tableau Prep Builder utilise un sous-ensemble de vos données brutes. Le nombre de lignes est déterminé par les types de données et le nombre de champs rendus. Les champs de chaînes ont plus d'espace de stockage que les entiers, donc si vous avez 10 champs de chaînes dans votre ensemble de données, vous obtiendrez moins de lignes que si vous aviez 10 champs d'entiers. Un indicateur Échantillonné s'affiche en regard des informations de taille dans le volet Profil pour indiquer qu'il s'agit d'un sous-ensemble de votre ensemble de données. Pour plus d'informations sur les échantillons de données, consultez Configurer votre ensemble de données(Link opens in a new window).

  • Nombre de valeurs uniques : le nombre en regard de chaque en-tête de champ représente les valeurs distinctes contenues dans chaque champ. Tableau Prep Builder arrondit au millier le plus proche. Dans l'exemple ci-dessous, 3000 valeurs distinctes sont représentées dans le champ Description mais si vous survolez le nombre, vous pouvez voir le nombre exact de valeurs uniques.



Consulter la distribution des valeurs ou les valeurs uniques

Par défaut, Tableau Prep Builder regroupe les valeurs numériques, de date et de date/heure d'un champ en compartiments. Ces compartiments sont aussi connus sous le nom de classes. Les classes font en sorte que vous puissiez voir la distribution des valeurs dans leur ensemble, et identifier rapidement les valeurs atypiques et les valeurs null. La taille de la classe est calculée sur les valeurs minimum et maximum dans le champ et les valeurs null s'affichent toujours en haut de la distribution.

Par exemple, les dates de commande et d'expédition sont résumées ou « classées » par année. Chaque classe représente une année depuis janvier de l'année de début à janvier de l'année suivante, et étiquetée en conséquence. Étant donné que certains dates de ventes et dates d'expédition tombent dans la dernière partie de 2018 et 2019, une classe est créée pour l'année suivante pour ces valeurs.

Si un champ de données discrètes (ou de catégorie) contient de nombreuses lignes ou a une distribution si large qu'elle ne peut être affichée dans le champ sans défilement, vous pouvez voir une distribution résumée à droite du champ. Vous pouvez cliquer et faire défiler la distribution pour cibler des valeurs spécifiques.

Lorsque vos données contiennent des champs numériques ou de date, vous pouvez basculer sur une version détaillée (discrète) des valeurs ou une version résumée (continue) des valeurs. La vue résumée affiche la plage des valeurs dans un champ et la fréquence avec laquelle certaines valeurs apparaissent.

Ce basculement peut vous aider à isoler des valeurs uniques (comme le nombre d'enregistrements « 3 » dans un champ) ou la distribution de valeurs (comme la somme de tous les enregistrements « 3 » dans un champ)

Pour changer votre vue :

  1. Dans le volet Profil, le volet Résultats ou la grille de données, cliquez sur le menu Options supplémentaires pour un champ numérique ou de date.

  2. Dans le menu contextuel, sélectionnez Détails pour voir une version détaillée des valeurs, ou Résumé pour voir la version distribuée des valeurs.

Rechercher des champs et des valeurs

Dans le volet Profil ou le volet Résultats, vous pouvez rechercher des champs ou des valeurs qui vous intéressent particulièrement, et utiliser les résultats de la recherche pour filtrer vos données.

Pour rechercher des champs, entrez un terme de recherche complet ou partiel dans la zone de recherche de la barre d'outils.

Pour rechercher une valeur dans un champ :

  1. Cliquez sur l'icône Rechercher pour rechercher un champ et entrez une valeur.

  2. Pour utiliser des options de recherche avancées, cliquez sur le bouton Options de recherche....

  3. Pour utiliser les résultats de la recherche pour filtrer les données, sélectionnez Conserver uniquement ou Exclure.

    Dans le volet Flux, une icône de filtre apparaît au-dessus des étapes concernées.

Trier les valeurs et les champs

Vous pouvez utiliser les options de tri d'une fiche Profil pour trier les classes (le nombre de valeurs représentées par les barres de distribution) dans l'ordre croissant ou décroissant ou les valeurs de champs individuelles dans l'ordre alphabétique.

Pour réorganiser l'ordre de vos champs, dans le volet Profil, le volet Résultats ou la grille de Données, il vous suffit de sélectionner une fiche Profil ou un champ dans la grille de données et de le faire glisser jusqu'à ce qu'une ligne noire cible apparaisse. Ensuite, déposez-le sur place. Le volet Profil et la grille de données sont synchronisés afin que le champ apparaisse dans le même ordre aux deux emplacements.

Surligner les champs et les valeurs dans un flux

Tableau Prep Builder vous aide à trouver facilement des champs et des valeurs dans vos données de flux. Dans le volet Flux, tracez le point d'origine d'un champ et là où il est utilisé dans le flux, ou cliquez sur des valeurs individuelles dans une fiche Profil ou dans la grille des données pour surligner les valeurs associées ou identiques.

Tracer des champs dans un flux

Dans Tableau Prep Builder version 2018.3.3 et ultérieure, vous pouvez surligner tout point où un champ est utilisé dans un flux, et même son emplacement d'origine pour vous aider à repérer les valeurs manquantes ou corriger un flux lorsque vous ne voyez pas les résultats attendus.

Cliquez sur un champ dans le volet Profil dans une étape de nettoyage, ou dans le volet Résultats dans un autre type d'étape. Le volet Flux met en évidence le chemin où ce champ est utilisé.

Remarque : cette option n'est pas disponible pour les types d'étapes de données entrantes ou sortantes.

Consulter les valeurs associées

Vous pouvez utiliser le surlignage pour trouver des valeurs associées à travers les champs. Lorsque vous cliquez sur une valeur dans la fiche Profil dans le volet Profil ou le volet Résultats, toutes les valeurs associées dans les autres champs sont surlignées en bleu. La couleur bleu montre la distribution de la relation entre la valeur que vous avez sélectionnée et les valeurs dans les autres champs.

Par exemple, pour surligner les valeurs associées, dans le volet Profil, cliquez sur une valeur dans un champ. Les valeurs associées dans un autre champ deviennent bleues et et la proportion de la barre surlignée en bleu représente le degré d'association.

Surligner les valeurs identiques

Lorsque vous sélectionnez une valeur dans la grille de données, toutes les valeurs identiques sont également surlignées. Ces surlignages vous aident à identifier les tendances ou les irrégularités dans vos données.

Autres articles de cette section

Merci de vos commentaires ! Erreur lors de la soumission de votre commentaire. Réessayez ou envoyez-nous un message.