Examiner et filtrer vos données

Découvrez comment bien appréhender la composition de vos données pour mieux comprendre les modifications que vous devez apporter, ainsi que l'effet des opérations que vous incluez dans le flux.

Consulter les informations de taille de vos données

Après vous être connecté à vos données, ajoutez une table au flux, puis ajoutez une étape. Vous pouvez utiliser le volet Profil pour voir l'état et la structure actuels de vos données et repérer les valeurs null et les données atypiques.

  • Nombre de fichiers et de lignes : dans le coin supérieur gauche du volet Profil, vous pouvez voir des informations qui résument le nombre de champs et de lignes dans les données à un point particulier du flux. Tableau Prep Builder arrondit au millier le plus proche. Dans l'exemple ci-dessous, l'ensemble de données comporte 21 champs et 3ooo.

    Lorsque vous survolez le nombre de champs et de lignes, vous pouvez voir le nombre exact de lignes (dans cet exemple, 2848) :


  • Taille de l'ensemble de données : utilisez un sous-ensemble de vos données en spécifiant le nombre de lignes à inclure dans l'onglet Échantillon de données du volet Entrée.

  • Échantillonné : pour vous permettre d'interagir directement avec vos données, Tableau Prep Builder utilise un sous-ensemble de vos données brutes. Le nombre de lignes est déterminé par les types de données et le nombre de champs rendus. Les champs de chaînes ont plus d'espace de stockage que les entiers, donc si vous avez 10 champs de chaînes dans votre ensemble de données, vous obtiendrez moins de lignes que si vous aviez 10 champs d'entiers. Un indicateur Échantillonné s'affiche en regard des informations de taille dans le volet Profil pour indiquer qu'il s'agit d'un sous-ensemble de votre ensemble de données. Pour plus d'informations sur les échantillons de données, consultez « Configurer la taille de votre échantillon de données » dans Se connecter aux données.

  • Nombre de valeurs uniques : le nombre en regard de chaque en-tête de champ représente les valeurs distinctes contenues dans chaque champ. Tableau Prep Builder arrondit au millier le plus proche. Dans l'exemple ci-dessous, 3000 valeurs distinctes sont représentées dans le champ Description mais si vous survolez le nombre, vous pouvez voir le nombre exact de valeurs uniques.



Vérifier les types de données affectés à vos données

Comme Tableau Desktop, Tableau Prep Builder interprète les données de vos champs lorsque vous faites glisser une connexion vers le volet Flux et lui attribue automatiquement un type de données. Étant que différentes bases de données peuvent gérer les données de différentes manières, l'interprétation de Tableau Prep Builder peut ne pas toujours être correcte.

Pour modifier un type de données, cliquez sur l'icône du type de données et sélectionnez le type de données correct dans le menu contextuel. Vous pouvez modifier des types de données « chaîne » ou « entier » en « Date » et « Date et heure », et Tableau Prep Builder déclenchera la fonction Auto DateParse (analyse automatique de date) pour modifier ces types de données. Comme Tableau Desktop, si la modification échoue, vous voyez des valeurs null dans les champs à la place, et vous pouvez créer un calcul pour effectuer la modification.

Pour plus d'informations sur l'utilisation de la fonction DateParse, consultez Convertir un champ en un champ de date dans l'aide de Tableau Desktop et la création Web.

Attribuer des types de données à vos données

Pour faciliter l'identification des valeurs de champs non valides, vous pouvez attribuer un type de données à votre champ de la même manière que vous attribuez un type de données. Ceci indique à Tableau Prep Builder ce que vos valeurs de données représentent. Il peut ainsi valider automatiquement les valeurs et surligner celles qui ne sont pas valides pour ce rôle.

Les types de données indiquent à Tableau Prep Builder ce que les valeurs de champs signifient ou représentent. Par exemple, si vous avez des valeurs de champ pour des données géographiques, vous pouvez attribuer un type de données Ville. Tableau Prep Builder compare alors les valeurs du champ à un ensemble de valeurs de domaine ou de modèles connues pour identifier les valeurs qui ne correspondent pas.

Remarque : chaque champ est analysé indépendamment si bien qu'une valeur de Ville « Portland » dans l'État « Washington » du pays « États-Unis » peut ne pas être une combinaison valide de ville et d'État, mais elle ne sera pas identifiée comme telle parce qu'il s'agit d'un nom de ville valide.

Tableau Prep Builder prend en charge les types de données suivants :

  • E-mail

  • URL

  • Rôles géographiques (basés sur des données géographiques actuelles et identiques aux données utilisées par Tableau Desktop)

    • Aéroport
    • Indicatif régional (États-Unis)
    • CBSA/MSA
    • Ville
    • District électoral (États-Unis)
    • Pays/Région
    • Comté
    • NUTS Europe
    • État/Province
    • Code postal

Dans Tableau Prep Builder version 2019.1.4, si vous affectez un rôle géographique à un champ, vous pouvez également utiliser ce type de données pour associer et regrouper les valeurs avec la valeur standard définie par votre type de données. Pour plus d'informations sur le regroupement de valeurs à l'aide de types de données, consultez Regrouper des valeurs similaires par type de données.

Pour définir un type de données pour votre champ, procédez comme suit :

  1. Dans le volet Profil, le volet Résultats ou la grille de données, cliquez sur le type de données pour le champ.

  2. Sélectionnez le type de données pour le champ.

    Tableau Prep Builder compare les valeurs de données du champ aux valeurs de domaine ou modèles connues (pour l'e-mail ou l'URL) pour le type de données que vous sélectionnez et utilise un point d'exclamation rouge pour marquer toutes les valeurs qui ne correspondent pas.

  3. Cliquez sur la flèche déroulante pour le champ et dans la section Afficher les valeurs, sélectionnez une option pour afficher toutes les valeurs ou uniquement les valeurs qui sont valides ou non valides pour le type de données.

  4. Utilisez les options de nettoyage dans le menu Options supplémentairespour corriger les valeurs de champ qui ne sont pas valides. Pour plus d'informations sur le nettoyage de vos valeurs de champs, consultez Appliquer des opérations de nettoyage.

Consulter la distribution des valeurs ou les valeurs uniques

Par défaut, Tableau Prep Builder regroupe les valeurs numériques, de date et de date/heure d'un champ en compartiments. Ces compartiments sont aussi connus sous le nom de classes. Les classes font en sorte que vous puissiez voir la distribution des valeurs dans leur ensemble, et identifier rapidement les valeurs atypiques et les valeurs null. La taille de la classe est calculée sur les valeurs minimum et maximum dans le champ et les valeurs null s'affichent toujours en haut de la distribution.

Par exemple, les dates de commande et d'expédition sont résumées ou « classées » par année. Chaque classe représente une année depuis janvier de l'année de début à janvier de l'année suivante, et étiquetée en conséquence. Étant donné que certains dates de ventes et dates d'expédition tombent dans la dernière partie de 2018 et 2019, une classe est créée pour l'année suivante pour ces valeurs.

Si un champ de données discrètes (ou de catégorie) contient de nombreuses lignes ou a une distribution si large qu'elle ne peut être affichée dans le champ sans défilement, vous pouvez voir une distribution résumée à droite du champ. Vous pouvez cliquer et faire défiler la distribution pour cibler des valeurs spécifiques.

Lorsque vos données contiennent des champs numériques ou de date, vous pouvez basculer sur une version détaillée (discrète) des valeurs ou une version résumée (continue) des valeurs. La vue résumée affiche la plage des valeurs dans un champ et la fréquence avec laquelle certaines valeurs apparaissent.

Ce basculement peut vous aider à isoler des valeurs uniques (comme le nombre d'enregistrements « 3 » dans un champ) ou la distribution de valeurs (comme la somme de tous les enregistrements « 3 » dans un champ)

Pour changer votre vue :

  1. Dans le volet Profil, le volet Résultats ou la grille de données, cliquez sur le menu Options supplémentaires pour un champ numérique ou de date.

  2. Dans le menu contextuel, sélectionnez Détails pour voir une version détaillée des valeurs, ou Résumé pour voir la version distribuée des valeurs.

Trier les valeurs et les champs

Vous pouvez utiliser les options de tri d'une fiche Profil pour trier les classes (le nombre de valeurs représentées par les barres de distribution) dans l'ordre croissant ou décroissant, ou les valeurs de champs individuelles dans l'ordre alphabétique.

Pour réorganiser l'ordre de vos champs, dans le volet Profil, le volet Résultats ou la grille de Données, il vous suffit de sélectionner une fiche Profil ou un champ dans la grille de données et de le faire glisser jusqu'à ce qu'une ligne noire cible apparaisse. Ensuite, déposez-le sur place. Le volet Profil et la grille de données sont synchronisés afin que le champ apparaisse dans le même ordre aux deux emplacements.

Surligner les champs et les valeurs dans un flux

Tableau Prep Builder vous aide à trouver facilement des champs et des valeurs dans vos données de flux. Dans le volet Flux, tracez le point d'origine d'un champ et là où il est utilisé dans le flux, ou cliquez sur des valeurs individuelles dans une fiche Profil ou dans la grille des données pour surligner les valeurs associées ou identiques.

Tracer des champs dans un flux

Dans Tableau Prep Builder version 2018.3.3 et ultérieure, vous pouvez surligner tout point où un champ est utilisé dans un flux, et même son emplacement d'origine pour vous aider à repérer les valeurs manquantes ou corriger un flux lorsque vous ne voyez pas les résultats attendus.

Cliquez sur un champ dans le volet Profil dans une étape de nettoyage, ou dans le volet Résultats dans un autre type d'étape. Le volet Flux met en évidence le chemin où ce champ est utilisé.

Remarque : cette option n'est pas disponible pour les types d'étapes de données entrantes ou sortantes.

Consulter les valeurs associées

Vous pouvez utiliser le surlignage pour trouver des valeurs associées à travers les champs. Lorsque vous cliquez sur une valeur dans la fiche Profil dans le volet Profil ou le volet Résultats, toutes les valeurs associées dans les autres champs sont surlignées en bleu. La couleur bleu montre la distribution de la relation entre la valeur que vous avez sélectionnée et les valeurs dans les autres champs.

Par exemple, pour surligner les valeurs associées, dans le volet Profil, cliquez sur une valeur dans un champ. Les valeurs associées dans un autre champ deviennent bleues et et la proportion de la barre surlignée en bleu représente le degré d'association.

Surligner les valeurs identiques

Lorsque vous sélectionnez une valeur dans la grille de données, toutes les valeurs identiques sont également surlignées. Ces surlignages vous aident à identifier les tendances ou les irrégularités dans vos données.

Conserver ou supprimer des champs

Au fur et à mesure que vous travaillez avec vos données dans votre flux, vous voudrez peut-être supprimer les champs inutiles. Dans le volet Profil ou dans la grille de données de toute étape de nettoyage ou d'action, sélectionnez un ou plusieurs champs et cliquez avec le bouton droit de la souris ou Ctrl-clic (MacOS) et sélectionnez Supprimer pour supprimer les champs sélectionnés, ou sélectionnez Conserver uniquement (version 2019.2.2 et suivantes) pour ne conserver que les champs sélectionnés et supprimer tous les champs non sélectionnés.

Rechercher des champs et des valeurs

Dans le volet Profil ou le volet Résultats, vous pouvez rechercher des champs ou des valeurs qui vous intéressent particulièrement, et utiliser les résultats de la recherche pour filtrer vos données.

Pour rechercher des champs, entrez un terme de recherche complet ou partiel dans la zone de recherche de la barre d'outils.

Pour rechercher une valeur dans un champ :

  1. Cliquez sur l'icône Rechercher pour rechercher un champ et entrez une valeur.

  2. Pour utiliser des options de recherche avancées, cliquez sur le bouton Options de recherche ....

  3. Pour utiliser les résultats de la recherche pour filtrer les données, sélectionnez Conserver uniquement ou Exclure.

    Dans le volet Flux, une icône de filtre apparaît au-dessus des étapes concernées.

(Retour en haut)


Filtrer les valeurs

Une manière simple de filtrer une valeur consiste à la sélectionner dans une fiche Profil ou une grille de données, à faire un clic droit, puis à sélectionner Conserver uniquement ou Exclure. Vous pouvez également sélectionner Modifier la valeur pour modifier la valeur en ligne.

Vous pouvez filtrer les données à toute étape du flux. Pour ajouter un filtre, cliquez sur le menu Options supplémentairesdans la fiche Profil ou la grille de données.

Remarque : pour appliquer un filtre dans le menu Options supplémentaires de la grille de données, cliquez sur le bouton Masquer le volet Profil puis cliquez sur le menu Options supplémentaires pour le champ à filtrer.

Filtres disponibles pour chaque type de données

Type de données Filtres disponibles
Chaîne Calcul, Correspondance avec des caractères génériques, Valeurs null
Nombre Calcul, Plage de valeurs, Valeurs null
Date et heure Calcul, Plage de valeurs, Date relative, Valeurs null

Utiliser un filtre de calcul

Lorsque vous sélectionnez Calcul, la boîte de dialogue Ajouter un filtre s'ouvre. Entrez le calcul, vérifiez qu'il est valide et cliquez sur Enregistrer.

Utiliser un filtre Plage de valeurs

Lorsque vous sélectionnez Plage de valeurs, vous pouvez spécifier une plage ou définir des valeurs minimum ou maximum.

Utiliser un filtre Plage de dates

Lorsque vous sélectionnez Plage de dates, vous pouvez spécifier une plage de dates ou définir une date minimum ou maximum.

Utiliser un filtre Date relative

Lorsque vous sélectionnez Dates relatives, vous pouvez filtrer la plage de dates en fonction de l'année, du trimestre, du mois, de la semaine ou du jour. Vous pouvez également configurer un ancrage relatif à une date spécifique et inclure les valeurs null.

Utiliser un filtre Correspondance avec des caractères génériques

Lorsque vous sélectionnez Correspondance avec des caractères génériques, vous pouvez filtrer les valeurs de champ de manière à exclure ou conserver uniquement les valeurs répondant à vos critères. Dans l'éditeur de filtres, sélectionnez l'onglet Conserver uniquement ou Exclure, entrez une valeur de correspondance, puis définissez les critères pour renvoyer les valeurs que vous recherchez.

Les résultats filtrés s'affichent dans le volet gauche de l'éditeur de filtre afin que vous puissiez les consulter et expérimenter avec les résultats. Une fois que vous avez obtenu les résultats souhaités, cliquez sur Terminé pour appliquer votre modification.

Utiliser un filtre Valeurs null

Lorsque vous sélectionnez Valeurs Null, vous pouvez filtrer les valeurs du champ sélectionné de manière à afficher uniquement les valeurs null ou exclure toutes les valeurs null.

Merci pour votre feedback ! Une erreur s'est produite lors de l'envoi de votre feedback. Essayez à nouveau ou envoyez-nous un message.