Examiner vos données

Remarque : depuis la version 2020.4.1, vous pouvez désormais créer et modifier des flux dans Tableau Server et Tableau Cloud. Le contenu de cette rubrique s’applique à toutes les plates-formes, sauf mention spécifique. Pour plus d’informations sur la création de flux sur le Web, consultez Tableau Prep sur le Web dans l’aide de Tableau Server(Le lien s’ouvre dans une nouvelle fenêtre) et Tableau Cloud(Le lien s’ouvre dans une nouvelle fenêtre).

Utilisez les options de cette rubrique pour bien appréhender la composition de vos données et mieux comprendre les modifications que vous devez apporter, ainsi que l’effet des opérations que vous incluez dans le flux.

Vérifier les types de données affectés à vos données

Comme Tableau Desktop, Tableau Prep interprète les données de vos champs lorsque vous faites glisser une connexion vers le volet Flux et lui attribue automatiquement un type de données. Étant donné que différentes bases de données peuvent gérer les données de différentes manières, il peut arriver que l’interprétation de Tableau Prep ne soit pas correcte.

Pour modifier un type de données, cliquez sur l’icône du type de données et sélectionnez le type de données correct dans le menu contextuel. Vous pouvez modifier des types de données « chaîne » ou « entier » en Date ou Date et heure, et Tableau Prep déclenchera la fonction Auto DateParse (analyse automatique de date) pour modifier ces types de données. Comme Tableau Desktop, si la modification échoue, vous voyez des valeurs null dans les champs à la place, et vous pouvez créer un calcul pour effectuer la modification.

Pour plus d’informations sur l’utilisation de la fonction DateParse, consultez Convertir un champ en un champ de date(Le lien s’ouvre dans une nouvelle fenêtre) dans l’aide de Tableau Desktop et la création Web.

Vous pouvez modifier le type de données dans votre étape des données entrantes après vous être connecté aux données à partir des sources de données suivantes :

  • Microsoft Excel
  • Fichiers texte
  • Fichiers PDF
  • Box
  • Dropbox
  • Google Drive
  • OneDrive

Pour toutes les autres sources de données, ajoutez une étape de nettoyage ou un autre type d’étape pour effectuer cette modification. Pour afficher la liste des options de nettoyage disponibles dans les différents types d’étapes, consultez À propos des opérations de nettoyage.

Consulter les informations de taille de vos données

Après vous être connecté à vos données, ajoutez une table au flux, puis ajoutez une étape. Vous pouvez utiliser le volet Profil pour voir l’état et la structure actuels de vos données et repérer les valeurs null et les données atypiques.

  • Nombre de fichiers et de lignes : dans le coin supérieur gauche du volet Profil, vous pouvez voir des informations qui résument le nombre de champs et de lignes dans les données à un point particulier du flux. Tableau Prep arrondit au millier le plus proche. Dans l’exemple ci-dessous, l’ensemble de données comporte 21 champs et 3000 lignes.

    Lorsque vous survolez le nombre de champs et de lignes, vous pouvez voir le nombre exact de lignes (dans cet exemple, 2848).


  • Taille de l’ensemble de données : utilisez un sous-ensemble de vos données en spécifiant le nombre de lignes à inclure dans l’onglet Échantillon de données du volet Entrée.

  • Échantillonné : pour vous permettre d’interagir directement avec vos données, Tableau Prep utilise un sous-ensemble de vos données brutes. Le nombre de lignes est déterminé par les types de données et le nombre de champs rendus. Les champs de chaînes ont plus d’espace de stockage que les entiers, donc si vous avez 10 champs de chaînes dans votre ensemble de données, vous obtiendrez moins de lignes que si vous aviez 10 champs d’entiers.

    Un indicateur Échantillonné s’affiche en regard des informations de taille dans le volet Profil pour indiquer qu’il s’agit d’un sous-ensemble de votre ensemble de données. Vous pouvez modifier la quantité de données que vous incluez dans votre flux. Lors de la création ou de la modification de flux sur le Web, des limites de données supplémentaires s’appliquent. Pour plus d’informations, consultez Définir la taille de votre échantillon de données.

  • Nombre de valeurs uniques : le nombre en regard de chaque en-tête de champ représente les valeurs distinctes contenues dans chaque champ. Tableau Prep arrondit au millier le plus proche. Dans l’exemple ci-dessous, 3000 valeurs distinctes sont représentées dans le champ Description mais si vous survolez le nombre, vous pouvez voir le nombre exact de valeurs uniques.



Consulter la distribution des valeurs ou les valeurs uniques

Par défaut, Tableau Prep regroupe les valeurs numériques, de date et de date/heure d’un champ en compartiments. Ces compartiments sont aussi connus sous le nom de classes. Les classes font en sorte que vous puissiez voir la distribution des valeurs dans leur ensemble, et identifier rapidement les valeurs atypiques et les valeurs null. La taille de la classe est calculée sur les valeurs minimum et maximum dans le champ et les valeurs null s’affichent toujours en haut de la distribution.

Par exemple, les dates de commande et d’expédition sont résumées ou « classées » par année. Chaque classe représente une année depuis janvier de l’année de début à janvier de l’année suivante, et étiquetée en conséquence. Étant donné que certains dates de ventes et dates d’expédition tombent dans la dernière partie de 2018 et 2019, une classe est créée pour l’année suivante pour ces valeurs.

Si un champ de données discrètes (ou de catégorie) contient de nombreuses lignes ou a une distribution si large qu’elle ne peut être affichée dans le champ sans défilement, vous pouvez voir une distribution résumée à droite du champ. Vous pouvez cliquer et faire défiler la distribution pour cibler des valeurs spécifiques.

Lorsque vos données contiennent des champs numériques ou de date, vous pouvez basculer sur une version détaillée (discrète) des valeurs ou une version résumée (continue) des valeurs. La vue résumée affiche la plage des valeurs dans un champ et la fréquence avec laquelle certaines valeurs apparaissent.

Ce basculement peut vous aider à isoler des valeurs uniques (comme le nombre d’enregistrements « 3 » dans un champ) ou la distribution de valeurs (comme la somme de tous les enregistrements « 3 » dans un champ)

Pour changer votre vue :

  1. Dans le volet Profil, le volet Résultats ou la grille de données, cliquez sur le menu Options supplémentaires pour un champ numérique ou de date.

  2. Dans le menu contextuel, sélectionnez Détails pour voir une version détaillée des valeurs, ou Résumé pour voir la version distribuée des valeurs.

Rechercher des champs et des valeurs

Dans le volet Profil ou le volet Résultats, vous pouvez rechercher des champs ou des valeurs qui vous intéressent particulièrement, et utiliser les résultats de la recherche pour filtrer vos données.

Depuis la version 2021.1.1, lorsque vous recherchez des champs, un nouvel indicateur s’affiche en vous indiquant le nombre de champs trouvés afin que vous puissiez mieux comprendre les résultats de votre recherche. Si aucun champ n’est trouvé, des messages supplémentaires s’affichent.

Pour rechercher des champs, entrez un terme de recherche complet ou partiel dans la zone de recherche de la barre d’outils.

Pour rechercher une valeur dans un champ :

  1. Cliquez sur l’icône Rechercher pour rechercher un champ et entrez une valeur.

  2. Pour utiliser des options de recherche avancées, cliquez sur le bouton Options de recherche ....

  3. Pour utiliser les résultats de la recherche pour filtrer les données, sélectionnez Conserver uniquement ou Exclure.

    Dans le volet Flux, une icône de filtre apparaît au-dessus des étapes concernées.

Copier des valeurs de champ dans la grille de données

Pris en charge dans Tableau Prep Builder et Tableau Server à partir de la version 2022.3 et dans Tableau Cloud à partir de la version 2022.2 (août).

Copiez facilement un ensemble sélectionné de valeurs à partir de la grille de données et collez-les dans un document tel que Microsoft Excel, des fichiers texte (.csv), des e-mails, etc. Vous pouvez même les copier et les coller dans l’éditeur SQL pour exécuter rapidement une requête SQL.

  1. Dans la grille de données, sélectionnez une ou plusieurs valeurs de champ à copier.
  2. Faites un clic droit ou Cmd-clic (MacOS) sur les valeurs de champ sélectionnées puis sélectionnez Copier dans le menu. Vous pouvez également utiliser les raccourcis clavier Ctrl+C ou cmd+C (MacOS) ou sélectionner Copier dans le menu ... de la barre d’outils.

  3. Collez les champs copiés dans votre document ou emplacement.

    Remarque : Édition > Copier ne copie pas actuellement les valeurs de champ de la grille de données.

Trier les valeurs et les champs

Volet Profil

Vous pouvez utiliser les options de tri d’une fiche Profil pour trier les classes (le nombre de valeurs représentées par les barres de distribution) dans l’ordre croissant ou décroissant ou les valeurs de champs individuelles dans l’ordre alphabétique.

Grille de données

Triez les détails au niveau des lignes pour vos champs dans l’ordre croissant ou décroissant.

Réorganiser les champs

La modification de l’ordre des champs à l’aide de liste est prise en charge à partir de la version 2022.2.1.

Vous pouvez modifier l’ordre des champs à partir du volet Profil, de la grille de données ou de la liste en les faisant glisser et en les déposant dans une nouvelle position.

Pour réorganiser l’ordre de vos champs :

  1. Dans le volet Profil, le volet Résultats, la grille de données ou la vue Liste, sélectionnez un(e) ou plusieurs fiches ou champs de profil.
  2. Faites glisser la fiche ou le champ de repère jusqu’à ce que la ligne de cible noire apparaisse.
  3. Déposez la fiche ou le champ de profil en place.
    Le volet Profil, la grille de données et la liste sont synchronisés afin que le champ apparaisse dans le même ordre aux deux emplacements. Le nouvel ordre des champs est persistant dans tous les produits Tableau lors de l’exécution et de la planification des flux.

Réorganisation d’une grille de données

Réorganisation d’une liste

Surligner les champs et les valeurs dans un flux

Tableau Prep vous aide à trouver facilement des champs et des valeurs dans vos données de flux. Dans le volet Flux, tracez le point d’origine d’un champ et là où il est utilisé dans le flux, ou cliquez sur des valeurs individuelles dans une fiche Profil ou dans la grille des données pour surligner les valeurs associées ou identiques.

Tracer des champs dans un flux

Dans Tableau Prep, vous pouvez surligner tout point où un champ est utilisé dans un flux, et même son emplacement d’origine pour vous aider à repérer les valeurs manquantes ou corriger un flux lorsque vous ne voyez pas les résultats attendus.

Cliquez sur un champ dans le volet Profil dans une étape de nettoyage, ou dans le volet Résultats dans un autre type d’étape. Le volet Flux met en évidence le chemin où ce champ est utilisé.

Remarque : cette option n’est pas disponible pour les types d’étapes de données entrantes ou sortantes.

Consulter les valeurs associées

Vous pouvez utiliser le surlignage pour trouver des valeurs associées à travers les champs. Lorsque vous cliquez sur une valeur dans la fiche Profil dans le volet Profil ou le volet Résultats, toutes les valeurs associées dans les autres champs sont surlignées en bleu. La couleur bleu montre la distribution de la relation entre la valeur que vous avez sélectionnée et les valeurs dans les autres champs.

Par exemple, pour surligner les valeurs associées, dans le volet Profil, cliquez sur une valeur dans un champ. Les valeurs associées dans un autre champ deviennent bleues et et la proportion de la barre surlignée en bleu représente le degré d’association.

Surligner les valeurs identiques

Lorsque vous sélectionnez une valeur dans la grille de données, toutes les valeurs identiques sont également surlignées. Ces surlignages vous aident à identifier les tendances ou les irrégularités dans vos données.

Merci de vos commentaires !Avis correctement envoyé. Merci