Nettoyer et organiser les données
Remarque : depuis la version 2020.4.1, vous pouvez désormais créer et modifier des flux dans Tableau Server et Tableau Cloud. Le contenu de cette rubrique s’applique à toutes les plates-formes, sauf mention spécifique. Pour plus d’informations sur la création de flux sur le Web, consultez Tableau Prep sur le Web dans l’aide de Tableau Server(Le lien s’ouvre dans une nouvelle fenêtre) et Tableau Cloud(Le lien s’ouvre dans une nouvelle fenêtre).
Tableau Prep fournit diverses opérations de nettoyage que vous pouvez utiliser pour nettoyer et organiser vos données. Le nettoyage des données désordonnées facilite la combinaison et l’analyse de vos données ou permet à d’autres personnes de comprendre plus facilement vos données lorsque vous partagez vos ensembles de données.
Vous pouvez également nettoyer vos données à l’aide d’une étape de permutation ou une étape de script pour appliquer des scripts R ou Python à votre flux. Les étapes de script ne sont pas prises en charge dans Tableau Cloud. Pour plus d’informations, consultez Permuter vos données(Le lien s’ouvre dans une nouvelle fenêtre) ou Utiliser des scripts R et Python dans votre flux(Le lien s’ouvre dans une nouvelle fenêtre).
À propos des opérations de nettoyage
Vous nettoyez les données en appliquant des opérations de nettoyage telles que le filtrage, l’ajout, le changement de nom, la scission, le regroupement ou la suppression de champs. Vous pouvez effectuer des opérations de nettoyage dans la plupart des étapes de votre flux. Vous pouvez également effectuer des opérations de nettoyage dans la grille de données lors d’une étape de nettoyage.
Vous pouvez appliquer des opérations de nettoyage limitées à l’étape des données entrantes et vous ne pouvez pas appliquer d’opérations de nettoyage à l’étape de sortie. Pour plus d’informations sur l’application d’opérations de nettoyage à l’étape des données entrantes, consultez Appliquer des opérations de nettoyage à une étape des données entrantes(Le lien s’ouvre dans une nouvelle fenêtre).
Opérations de nettoyage disponibles
La table suivante montre les opérations de nettoyage disponibles dans chaque type d’étape :
Entrée | Nettoyage | Agrégation | Permutation | Jointure | Union | Nouvelles lignes | Sortie | |
Filtrer | X | X | X | X | X | X | X | |
Regrouper les valeurs | X | X | X | X | ||||
Nettoyer | X | X | X | X | X | |||
Convertir des dates | X | X | X | X | X | X | ||
Scinder les valeurs | X | X | X | X | X | |||
Renommer le champ | X | X | X | X | X | X | ||
Renommer les champs (en bloc) | X | |||||||
Dupliquer le champ | X | X | X | X | X | |||
Conserver uniquement le champ | X | X | X | X | X | X | X | |
Supprimer le champ | X | X | X | X | X | X | X | |
Créer un champ calculé | X | X | X | X | X | |||
Modifier la valeur | X | X | X | X | X | |||
Modifier le type de données | X | X | X | X | X | X | X |
À mesure que vous modifiez vos données, des annotations sont ajoutées à l’étape correspondante dans le volet Flux et une entrée est ajoutée dans le volet Modifications pour enregistrer vos actions. Si vous apportez des modifications dans l’étape des données entrantes, l’annotation s’affiche à gauche de l’étape dans le volet Flux et s’affiche dans le Profil d’entrée dans la liste des champs.
L’ordre d’application de vos modifications a une incidence. Les modifications apportées dans les types d’étape Agrégation, Permutation, Jointure et Union sont effectuées soit avant, soit après ces actions de nettoyage, selon l’emplacement du champ où vous effectuez la modification. L’emplacement où la modification a été effectuée s’affiche dans le volet Modifications de l’étape.
L’exemple suivant montre les modifications apportées à plusieurs champs dans une étape de jointure. La modification est effectuée avant l’action de jointure afin de générer des résultats corrigés.
Ordre des opérations
La table suivante montre où l’action de nettoyage est effectuée dans les types d’étape Agrégation, Permutation, Jointure et Union, selon l’emplacement du champ dans l’étape.
Action | Type d’étape : | Agrégation | Agrégation | Permutation | Permutation | Jointure | Jointure | Union | Union | Nouvelles lignes |
---|---|---|---|---|---|---|---|---|---|---|
Emplacement du champ : | Champs groupés | Champs agrégés | Pas en permutation | Créé à partir d’une permutation | Inclus dans un tableau* | Inclus dans les deux tableaux* | Champs incompatibles | Champs combinés | Champ utilisé pour générer des lignes | |
Filtrer | Avant l’agrégation | Après l’agrégation | Avant la permutation | Après la permutation | Avant la jointure | Après la jointure | Avant l’Union | Après l’Union | Après les nouvelles lignes | |
Regrouper les valeurs | N/A | N/A | Avant la permutation | Après la permutation | Avant la jointure | Après la jointure | Avant l’Union | Après l’Union | Après les nouvelles lignes | |
Nettoyer | N/A | N/A | Avant la permutation | Après la permutation | Avant la jointure | Après la jointure | Avant l’Union | Après l’Union | Après les nouvelles lignes | |
Convertir des dates | Avant l’agrégation | Après l’agrégation | Avant la permutation | Après la permutation | Avant la jointure | Après la jointure | Avant l’Union | Après l’Union | Après les nouvelles lignes | |
Scinder les valeurs | N/A | N/A | Avant la permutation | Après la permutation | Avant la jointure | Après la jointure | Avant l’Union | Après l’Union | Après les nouvelles lignes | |
Renommer le champ | N/A | N/A | Avant la permutation | Après la permutation | Avant la jointure | Après la jointure | Avant l’Union | Après l’Union | Avant les nouvelles lignes | |
Dupliquer le champ | N/A | N/A | Avant la permutation | Après la permutation | Avant la jointure | Après la jointure | Avant l’Union | Après l’Union | Après les nouvelles lignes | |
Conserver uniquement le champ | Après l’agrégation | Après l’agrégation | Avant la permutation | Après la permutation | Avant la jointure | Après la jointure | Avant l’Union | Après l’Union | Après les nouvelles lignes | |
Supprimer le champ | Supprime de l’agrégation | Supprime de l’agrégation | Avant la permutation | Après la permutation | Avant la jointure | Après la jointure | Avant l’Union | Après l’Union | Après les nouvelles lignes | |
Créer un champ calculé | N/A | N/A | Avant la permutation | Après la permutation | Après la jointure | Après la jointure | Avant l’Union | Après l’Union | Après les nouvelles lignes | |
Modifier la valeur | N/A | N/A | Avant la permutation | Après la permutation | Avant la jointure | Après la jointure | Avant l’Union | Après l’Union | Après les nouvelles lignes | |
Modifier le type de données | Avant l’agrégation | Après l’agrégation | Avant la permutation | Après la permutation | Avant la jointure | Avant la jointure | Avant l’Union | Après l’Union | Avant les nouvelles lignes |
Remarque : pour les jointures, si le champ est un champ calculé créé à l’aide d’un champ issu d’une autre table, la modification est appliquée avant la jointure. Si le champ est créé avec des champs issus des deux tables, la modification est appliquée après la jointure.
Appliquer des opérations de nettoyage
Pour appliquer des opérations de nettoyage à des champs, utilisez les options de la barre d’outils ou cliquez sur Options supplémentaires dans la fiche Profil du champ, la grille de données ou le volet Résultats pour ouvrir le menu.
Dans les types d’étape Agrégation, Permutation, Jointure et Union, le menu Options supplémentaires est disponible dans les fiches Profil du volet Résultats et la grille de données correspondante. Si vous effectuez les mêmes opérations ou actions de nettoyage à plusieurs reprises tout au long de votre flux, vous pouvez copier et coller vos étapes, vos actions ou même vos champs. Pour plus d’informations, voir Copier des étapes, des actions et des champs.
Barre d’outils du volet Profil | Menu déroulant |
---|---|
Sélectionner votre vue
Vous pouvez effectuer des opérations de nettoyage en dehors des volets Profil ou Résultats dans la grille de données ou dans la liste. Utilisez la barre d’outils de la vue (Tableau Prep Builder à partir de la version 2019.3.2 et sur le Web) pour modifier votre vue, puis cliquez sur Options supplémentaires sur un champ pour ouvrir le menu de nettoyage.
Afficher le volet Profil : il s’agit de la vue par défaut. Sélectionnez ce bouton pour revenir à la vue du volet Profil ou du volet Résultats.
Afficher la grille de données : réduisez le volet Profil ou Résultats pour développer et afficher uniquement la grille de données. Cette vue fournit une vue plus détaillée de vos données et peut être utile lorsque vous devez travailler avec des valeurs de champ spécifiques. Une fois que vous avez sélectionné cette option, cet état de vue persiste à travers toutes les étapes de votre flux, mais vous pouvez le modifier à tout moment.
Remarque : les opérations de nettoyage ne sont pas toutes disponibles dans la grille de données. Par exemple, si vous souhaitez modifier une valeur en ligne, vous devez utiliser le volet Profil.
Afficher la liste (Tableau Prep Builder à partir de la version 2019.3.2 et sur le Web) : Convertissez le volet Profil ou le volet Résultats en une liste. Une fois que vous avez sélectionné cette option, cet état de vue persiste à travers toutes les étapes de votre flux, mais vous pouvez le modifier à tout moment.
Dans cette vue, vous pouvez :
- Sélectionner et supprimer plusieurs lignes à l’aide de l’option X.
- (version 2021.1.4 et versions ultérieures) Sélectionner et masquer ou afficher plusieurs lignes à l’aide de l’option .
- (version 2021.2.1 et versions ultérieures) Renommer les champs en bloc.
Utilisez le menu Options supplémentaires pour appliquer des opérations aux champs sélectionnés.
Si vous affectez un type de données au champ ou sélectionnez Filtrer, Regrouper les valeurs, Nettoyer ou Scinder les valeurs, vous serez renvoyé à la vue Profil ou Résultats pour terminer ces actions. Toutes les autres options peuvent être exécutées dans la liste.
Utilisez la barre d’outils de la vue pour masquer le volet Profil et afficher uniquement la grille de données. Cliquez ensuite sur Options supplémentaires dans un champ de la grille de données pour ouvrir le menu de nettoyage. Cette vue fournit une vue plus détaillée de vos données et peut être utile lorsque vous devez travailler avec des valeurs de champ spécifiques. Une fois que vous avez sélectionné cette option, cet état de vue persiste à travers toutes les étapes de votre flux, mais vous pouvez le modifier à tout moment.
Remarque : les opérations de nettoyage ne sont pas toutes disponibles dans la grille de données. Par exemple, si vous souhaitez modifier une valeur en ligne, vous devez utiliser le volet Profil.
Suspendre les mises à jour des données pour améliorer les performances
Lorsque vous effectuez des opérations de nettoyage de vos données, Tableau Prep applique vos modifications au fur et à mesure pour vous présenter les résultats immédiatement. Pour gagner un temps de traitement précieux lorsque vous connaissez les modifications que vous devez apporter et so vous n’avez pas besoin de commentaires immédiats à chaque modification, vous pouvez améliorer les performances en suspendant les mises à jour des données.
Lorsque vous suspendez les mises à jour des données, vous pouvez effectuer toutes vos modifications en une seule fois, puis redémarrer les mises à jour pour voir vos résultats. Vous pouvez redémarrer les mises à jour des données et activer toutes les opérations disponibles à tout moment.
Remarque : lorsque vous suspendez les mises à jour des données, toutes les opérations qui vous demandent de voir vos valeurs seront désactivées. Par exemple, si vous voulez appliquer un filtre aux valeurs sélectionnées, vous devez voir les valeurs que vous voulez exclure.
Dans le menu du haut, cliquez sur Suspendre les mises à jour de données pour suspendre les mises à jour.
Tableau Prep convertit le volet Profil en une liste. Dans la liste, utilisez le menu Plus d’options pour appliquer des opérations aux champs sélectionnés. Si l’opération nécessite que vous voyiez vos valeurs, elle sera désactivée. Pour activer l’opération, vous devrez redémarrer les mises à jour des données.
Pour plus d’informations sur l’utilisation du mode Liste, voir Sélectionner votre vue.
Pour voir les résultats de vos modifications ou activer une fonctionnalité désactivée, redémarrez les mises à jour des données. Cliquez sur le bouton Redémarrer les mises à jour des données, cliquez sur le bouton Reprendre dans la boîte de dialogue du menu ou dans la bannière de message en haut du volet Flux.
Remarque : Tableau Prep Builder vous offre la possibilité de reprendre les mises à jour directement à partir du menu. Si vous modifiez des flux sur le Web, vous devrez reprendre les mises à jour à partir du menu supérieur.
Appliquer des opérations de nettoyage
Pour appliquer des opérations de nettoyage à un champ, procédez comme suit :
Remarque : vous pouvez effectuer des opérations de nettoyage dans une liste à partir de Tableau Prep Builder version 2019.3.2 et sur Tableau Server et Tableau Cloud à partir de la version 2020.4.
Dans le volet Profil, dans la grille de données, dans le volet Résultats ou dans la liste, sélectionnez le champ auquel vous souhaitez apporter des modifications.
Dans la barre d’outils ou le menu Options supplémentaires du champ, faites votre choix parmi les options suivantes :
Filtrer ou Filtrer les valeurs : sélectionnez l’une des options de filtre, faites un clic droit (ou Ctrl+clic sur MacOS) sur une valeur de champ pour conserver ou exclure des valeurs. Vous pouvez également utiliser le filtre Valeurs sélectionnées pour choisir et sélectionner les valeurs à filtrer, y compris les valeurs non comprises dans votre échantillon de flux. Pour plus d’informations sur les options de filtre, consultez Filtrer vos données(Le lien s’ouvre dans une nouvelle fenêtre).
Regrouper les valeurs (Regrouper et remplacer dans les versions précédentes) : sélectionnez manuellement les valeurs ou utilisez le regroupement automatique. Vous pouvez aussi sélectionner plusieurs valeurs dans la fiche Profil et faire un clic droit (ou Ctrl+clic sur MacOS) pour regrouper ou dégrouper des valeurs ou encore modifier la valeur de regroupement. Pour plus d’informations sur l’utilisation de l’option Regrouper les valeurs, consultez Associer automatiquement des valeurs à une valeur standard à l’aide de la correspondance approximative.
Nettoyer : faites votre choix dans la liste d’opérations de nettoyage rapides à appliquer à toutes les valeurs du champ.
Convertir des dates (Tableau Prep Builder à partir de la version 2020.1.4 et sur le Web) : pour les champs affectés à un type de données Date ou Date et heure, faites votre choix dans la liste d’opérations de nettoyage rapide DATEPART pour convertir vos valeurs de champ de date en une valeur d’entier représentant une année, un trimestre, un mois, une semaine, un jour, ou une valeur de date et d’heure.
À partir de la version 2021.1.4, vous pouvez également choisir parmi deux opérations de nettoyage rapide DATENAME, jour de la semaine ou nom du mois, pour convertir les valeurs de votre champ de date.
Année fiscale personnalisée (Tableau Prep Builder à partir de la version 2020.3.3 et sur le Web) : si votre année fiscale ne commence pas en janvier, vous pouvez définir un mois fiscal personnalisé pour convertir la date en utilisant ce mois au lieu du mois de janvier par défaut.
Ce paramètre s’applique par champ individuel, donc si vous souhaitez appliquer une année fiscale personnalisée à d’autres champs, répétez cette même étape.
Pour ouvrir la boîte de dialogue, dans le menu Options supplémentaires, sélectionnez Convertir les dates > Année fiscale personnalisée.
Scinder les valeurs : Scindez les valeurs automatiquement en fonction d’un séparateur commun ou utilisez la scission personnalisée pour spécifier la façon dont vous souhaitez scinder les valeurs de champ.
La scission automatique et la scission personnalisée fonctionnent de la même manière que dans Tableau Desktop. Pour plus d’information, consultez Fractionner un champ en champs multiples(Le lien s’ouvre dans une nouvelle fenêtre) dans l’aide de Tableau Desktop et l’aide de la création Web.
Renommer le champ : modifiez le nom du champ.
Dupliquer le champ (Tableau Prep Builder à partir de la version 2019.2.3 et sur le Web) : créez une copie de votre champ et de vos valeurs.
Conserver uniquement le champ (Tableau Prep Builder à partir de la version 2019.2.2 et sur le Web) : conservez uniquement le champ sélectionné et excluez tous les autres champs de l’étape.
Créer un champ calculé : écrivez un calcul personnalisé dans l’éditeur de calcul ou utilisez l’éditeur de calcul visuel (Tableau Prep Builder à partir de la version 2020.1.1 et sur le Web) pour créer des calculs de niveau de détail (LOD), de classement ou de nombre de lignes. Pour plus d’informations, consultez Créer des calculs de niveau de détail, de classement et de section.
- Publier en tant que type de données : créez des types de données personnalisés que vous pouvez ensuite appliquer à vos champs pour valider les valeurs des champs lors du nettoyage des données. Pour plus d’informations sur cette option, voir Créer des types de données personnalisés(Le lien s’ouvre dans une nouvelle fenêtre).
- Masquer le champ : si vous souhaitez conserver des champs dans votre flux mais que vous n’avez pas besoin de les nettoyer, vous pouvez les masquer au lieu de les supprimer. Pour plus d’informations, consultez Masquer des champs.
Supprimer (Supprimer le champ dans les versions précédentes) : supprimez le champ du flux.
Pour modifier une valeur, faites un clic droit ou Ctrl+clic (MacOS) sur une ou plusieurs valeurs, et sélectionnez Modifier la valeur puis entrez une nouvelle valeur. Vous pouvez également sélectionner Remplacer par une valeur null pour remplacer les valeurs par une valeur null ou double-cliquer sur un champ pour le modifier directement. Pour plus d’informations sur la modification des valeurs de champ, voir Modifier des valeurs de champ.
- Vérifiez le résultat de ces opérations dans le volet Profil, les volets Résumé ou la grille de données.
Renommer les champs en bloc
Pris en charge dans Tableau Prep Builder à partir de la version 2021.2.1. Pris en charge dans Tableau Prep sur le Web et dans Tableau Server et Tableau Cloud version 2021.2 et versions ultérieures.
Utilisez l’option Renommer les champs pour renommer plusieurs champs en bloc. Recherchez des parties d’un nom de champ pour le remplacer ou le supprimer, ou ajoutez des préfixes ou des suffixes à tous les champs ou à certains champs de votre ensemble de données.
Vous pouvez également appliquer automatiquement la même modification à tous les champs ajoutés par la suite qui correspondent à vos critères en cochant la case Renommer automatiquement les nouveaux champs lors de vos modifications.
Remarque : cette option n’est disponible que dans un type d’étape Nettoyage.
Dans une étape de Nettoyage, dans la barre d’outils, sélectionnez Renommer les champs.
Votre vue est automatiquement convertie en Liste et affiche tous les champs de votre flux. Vous pouvez utiliser l’option Rechercher dans la barre d’outils pour affiner vos résultats.
Tous les champs sont sélectionnés par défaut. Désélectionnez la case supérieure pour effacer la sélection de tous les champs et sélectionner manuellement uniquement les champs que vous souhaitez modifier.
- Dans le volet Renommer les champs, vous avez le choix entre les options suivantes :
Remplacer le texte : dans le champ Trouver le texte, recherchez le texte correspondant à l’aide des Options de recherche, puis saisissez le texte de remplacement dans le champ Remplacer par. Pour rechercher des espaces vides, appuyez sur la barre d’espace dans le champ Trouver le texte.
Remarque : le fait de renommer des champs ne peut pas résulter en des noms de champs vides ou en double.
- Ajouter un préfixe : ajoutez un texte au début de tous les noms de champs sélectionnés.
Ajouter un suffixe : ajoutez un texte à la fin de tous les noms de champs sélectionnés.
Au fur et à mesure que vous effectuez vos entrées, vos résultats s’affichent dans le volet Liste.
- (facultatif) Sélectionnez Renommer automatiquement les nouveaux champs pour appliquer automatiquement ces mêmes modifications aux nouveaux champs qui correspondent à vos critères de remplacement lorsque vos données sont actualisées.
Cliquez sur Renommer pour Appliquer les modifications et fermer le volet. Le bouton Renommer affiche le nombre de champs affectés par vos modifications.
Afficher vos modifications
Les différents types d’opérations de nettoyage sont représentés par des icônes à travers les différentes étapes de votre flux. Si plus de quatre types d’opérations sont appliqués à une étape, trois points de suspension apparaissent sur l’étape. Survolez ces icônes pour voir les annotations indiquant les opérations appliquées, ainsi que leur ordre d’exécution.
Dans Tableau Prep Builder à partir de la version 2019.1.3 et sur le Web, vous pouvez cliquer sur une annotation sur l’icône de modification dans une étape du volet Flux ou sur une fiche Profil dans le volet Profil ou Résultats. La modification et le champ affecté seront surlignés dans le volet Modifications ainsi que dans le volet Profil ou Résultats.
Vous pouvez également sélectionner une étape, puis développer le volet Modifications pour consulter les détails de chaque modification, éditer ou supprimer vos modifications, ou faire glisser des modifications vers le haut ou vers le bas pour changer leur ordre d’application. Vous pouvez aussi ajouter une description pour fournir un contexte aux autres utilisateurs. Pour plus d’informations sur l’ajout de descriptions à vos modifications, voir Ajouter des descriptions aux étapes du flux et aux actions de nettoyage(Le lien s’ouvre dans une nouvelle fenêtre).
Annotation sur le nettoyage | Suivi des modifications |
---|---|
Lorsque vous affichez les modifications pour une étape Agrégation, Permutation, Jointure ou Union, l’ordre dans lequel la modification est appliquée s’affiche avant ou après l’action de réorganisation. L’ordre de ces modifications est appliqué par le système et ne peut pas être modifié. Vous pouvez éditer et supprimer la modification.
Fusionner des champs
Si des champs contiennent les mêmes valeurs mais ont un nom différent, vous pouvez facilement les fusionner en un seul champ pour les combiner en faisant glisser un champ sur un autre. Lorsque vous fusionnez des champs, le champ cible devient le champ principal et le nom du champ cible persiste. Le champ que vous fusionnez sur le champ cible est supprimé.
Exemple :
Une union des données entrantes génère 3 champs contenant les mêmes valeurs. | Fusionner 3 champs en 1 |
Lorsque vous fusionnez des champs, Tableau Prep conserve tous les champs du champ cible et remplace toutes les valeurs null de ce champ par les valeurs issues des champs source que vous fusionnez avec le champ cible. Les champs source sont supprimés.
Exemple
Nom | Téléphone_Contact | Téléphone_Professionnel | Téléphone_Mobile | Téléphone_Domicile |
Bob | 123-4567 | 123-4567 | null | null |
Sally | null | null | 456-7890 | 789-0123 |
Fred | null | null | null | 567-8901 |
Emma | null | 234-5678 | 345-6789 | null |
Si vous fusionnez Téléphone_Professionnel, Téléphone_Mobile et Téléphone_Domicile avec le champ Téléphone_Contact, les autres champs sont supprimés et le résultat se présente ainsi :
Nom | Téléphone_Contact |
Bob | 123-4567 |
Sally | 456-7890 |
Fred | 567-8901 |
Emma | 234-5678 |
Pour fusionner des champs, procédez comme suit :
Faites glisser et déposez un champ sur un autre. Un indicateur Déposer pour fusionner les champs s’affiche.
Sélectionnez plusieurs champs et faites un clic droit dans la sélection pour ouvrir le menu contextuel, puis cliquez sur Fusionner les champs.
Sélectionnez plusieurs champs, puis cliquez sur Fusionner les champs dans la barre d’outils.
Pour savoir comment corriger des champs discordants suite à une union, consultez Corriger les champs non concordants.
Appliquer des opérations de nettoyage à l’aide de recommandations
Il peut parfois être difficile d’identifier l’opération de nettoyage nécessaire pour corriger les problèmes de vos données. Tableau Prep peut analyser vos données et recommander les opérations de nettoyage à appliquer automatiquement pour corriger rapidement les problèmes de vos champs de données ou identifier les problèmes afin que vous puissiez les corriger. Cette fonctionnalité est disponible dans tous les types d’étape, sauf les types d’étape Entrée, Sortie et Jointure.
Remarque : dans Tableau Prep Builder, si vous ne souhaitez pas utiliser cette fonctionnalité, désactivez-la. Dans le menu supérieur, accédez à Aide > Paramètres et Performances. Cliquez ensuite sur Activer les recommandations pour désélectionner la coche à côté du paramètre.
Les types de recommandation incluent :
Types de données
Filtrer
- Regrouper les valeurs (s’applique également aux champs avec des types de données depuis Tableau Prep Builder version 2019.2.3 et sur le Web)
Permuter des colonnes en lignes (Tableau Prep Builder à partir de la version 2019.4.2 et sur le Web)
- Remplacer des valeurs par des valeurs null
Supprimer des champs
Scinder (Tableau Prep Builder à partir de la version 2019.1.1 et sur le Web)
Remarque : cette option fonctionne spécifiquement avec les données contenues dans des fichiers texte de largeur fixe. Pour utiliser la recommandation de scission avec ce type de fichier, après vous être connecté à la source de données, dans l’étape des données entrantes, dans l’onglet Paramètres du texte, sélectionnez un caractère Séparateur de champs qui n’est pas utilisé dans les données afin que les données se chargent en tant que champ unique.
Supprimer des espaces
Appliquer les recommandations
Effectuez l’une des actions suivantes :
- Cliquez sur l’icône d’ampoule en haut à droite de la fiche Profil.
- Dans la barre d’outils, cliquez sur la flèche déroulante Recommandations pour afficher toutes les recommandations concernant votre ensemble de données et sélectionnez une recommandation dans la liste.
Cette option apparaît uniquement lorsque les modifications recommandées sont identifiées par Tableau Prep.
Pour appliquer la recommandation, survolez la fiche Recommandations puis cliquez sur Appliquer.
La modification est automatiquement appliquée et une entrée est ajoutée au volet Modifications. Pour supprimer la modification, cliquez sur Annuler dans le menu supérieur ou survolez la modification dans le volet Modifications puis cliquez sur le signe X pour la supprimer.
Si vous appliquez une recommandation pour la permutation des champs, une étape Permutation est automatiquement créée. Vous pouvez alors effectuer toute action de permutation supplémentaire, par exemple renommer les champs permutés ou permuter des champs supplémentaires.
Si Tableau Prep identifie d’autres recommandations suite à la modification, l’icône d’ampoule reste sur la fiche Profil jusqu’à ce qu’il n’y ait plus d’autres recommandations.
Répétez les étapes ci-dessus pour appliquer des modifications supplémentaires ou ignorez les modifications suggérées et utilisez les autres outils de nettoyage pour résoudre les problèmes de données.
Modifier des valeurs de champ
Plusieurs variations de la même valeur peuvent vous empêcher de résumer correctement vos données. Vous pouvez corriger ces variations rapidement et aisément en appliquant les options suivantes.
Remarque : toutes les modifications que vous apportez aux valeurs doivent être compatibles avec le type de champ de données.
Modifier une seule valeur
Dans la fiche Profil, cliquez sur la valeur à modifier puis entrez la nouvelle valeur. Une icône de groupe s’affiche à côté de la valeur.
Sinon, faites un clic droit sur une valeur et cliquez sur Modifier la valeur. La modification est enregistrée dans Suivi des modifications sur le côté gauche de l’écran.
Affichez les résultats dans le volet Profil et la grille de données.
Modifier plusieurs valeurs
Vous avez plusieurs possibilités pour modifier plusieurs valeurs à la fois. Par exemple, utilisez des opérations de nettoyage rapide pour supprimer la ponctuation de toutes les valeurs du champ, regrouper manuellement des valeurs en utilisant la sélection multiple ou regrouper automatiquement ensemble des valeurs à l’aide d’algorithmes de correspondance approximative qui trouvent les valeurs similaires, ou encore sélectionner plusieurs valeurs et les remplacer par des valeurs null.
Remarque : lorsque vous associez plusieurs valeurs à une seule valeur, le champ d’origine montre une icône de groupe à côté de la valeur. Elle vous indique quelles valeurs sont regroupées ensemble.
Modifier plusieurs valeurs en utilisant les opérations de nettoyage rapides
Cette option s’applique uniquement aux champs textuels.
Dans le volet Profil, le volet Résultats ou la grille de données, sélectionnez le champ à modifier.
Cliquez sur Options supplémentaires, sélectionnez Nettoyer, puis sélectionnez l’une des options suivantes:
Mettre en majuscule : modifiez toutes les valeurs en texte en majuscule.
Mettre en minuscule : modifiez toutes les valeurs en texte en minuscule.
Écrire les initiales en majuscules : mettez la première lettre en majuscules et les autres lettres en minuscules.
Supprimer les lettres : supprimez toutes les lettres et laissez uniquement les autres caractères.
Supprimer les nombres : supprimez tous les nombres et laissez les lettres et les autres caractères.
Supprimer la ponctuation : supprimez toutes la ponctuation.
Supprimer les espaces : supprimez les espaces de début et de fin.
- Supprimer les espaces supplémentaires : supprimez les espaces blancs de début et de fin, et remplacez les espaces blancs supplémentaires entre des caractères par un seul espace.
- Supprimer tous les espaces : supprimez tous les espaces blancs, y compris les espaces blancs de début et de fin, et tout espace blanc entre les caractères.
Vous pouvez empiler les opérations pour appliquer plusieurs opérations de nettoyage aux champs. Par exemple, commencez par sélectionner Supprimer > Supprimer les nombres puis sélectionnez Nettoyer > Supprimer la ponctuation pour supprimer tous les nombres et la ponctuation des valeurs de champ.
Pour annuler vos modifications, cliquez sur la flèche Annuler en haut du volet Flux ou supprimez la modification de la liste des modifications.
Regrouper et modifier plusieurs valeurs en ligne
Utilisez cette option pour sélectionner manuellement plusieurs valeurs et les regrouper sous une valeur standard dans la fiche Profil. Pour utiliser d’autres méthodes de regroupement des valeurs, consultez Associer manuellement plusieurs valeurs à une valeur standard et Associer automatiquement des valeurs à une valeur standard à l’aide de la correspondance approximative.
Dans la fiche Profil, sélectionnez le champ à modifier.
Appuyez sur Ctrl ou Maj+clic, ou Command ou Maj+clic (MacOS), et sélectionnez les valeurs que vous souhaitez regrouper.
Faites un clic droit et sélectionnez Groupe dans le menu contextuel. La valeur de la sélection sur laquelle vous faites un clic droit devient le nom par défaut du nouveau groupe, mais vous pouvez le modifier en ligne.
Pour modifier le nom du groupe, sélectionnez le champ groupé et modifiez la valeur ou faites un clic droit (ou Ctrl+clic sur un Mac) sur le champ groupé et sélectionnez Modifier la valeur dans le menu contextuel.
Pour dégrouper les valeurs d’un champ groupé, faites un clic droit sur le champ groupé, puis sélectionnez Dégrouper dans le menu contextuel.
Remplacer une ou plusieurs valeurs par une valeur null
Si vous souhaitez inclure des lignes de données dans votre analyse, mais exclure certaines valeurs de champ, vous pouvez les transformer en une valeur null.
Dans la fiche Profil, appuyez sur Ctrl ou Maj+clic, ou Command ou Maj+clic (sur Mac), et sélectionnez les valeurs que vous souhaitez modifier
Faites un clic droit ou Ctrl+clic (Mac), et sélectionnez Remplacer par une valeur null dans le menu. Les valeurs sont transformées en valeurs null et l’icône de groupe apparaît à côté de la valeur.
Associer manuellement plusieurs valeurs à une valeur standard
Utilisez l’option Regrouper les valeurs (Regrouper et remplacer dans les versions précédentes) pour associer la valeur d’un champ à une autre valeur ou sélectionner manuellement plusieurs valeurs à regrouper. Vous pouvez même ajouter de nouvelles valeurs pour configurer des relations de mappage afin d’organiser vos données.
Par exemple, imaginons qu’un champ comporte trois valeurs : Ma société, Ma société Incorporated et Ma société Inc. Ces valeurs représentent toutes trois la même entreprise, Ma société. Vous pouvez utiliser Regrouper les valeurs pour associer les valeurs Ma société Incorporated et Ma société Inc. à Ma société afin que les valeurs s’affichent toutes trois comme Ma société dans le champ.
Associer plusieurs valeurs à un champ sélectionné unique
Dans le volet Profil ou le volet Résultats, sélectionnez le champ à modifier.
Cliquez sur Options supplémentaires et sélectionnez Regrouper les valeurs (Regrouper et remplacer dans les versions précédentes) > Sélection manuelle dans le menu.
Dans le volet gauche de l’éditeur Regrouper les valeurs, sélectionnez la valeur de champ que vous souhaitez utiliser comme valeur de regroupement. Cette valeur s’affiche maintenant en haut du volet droit.
Dans la section inférieure du volet droit dans l’éditeur Regrouper les valeurs, sélectionnez les valeurs à ajouter au groupe.
Pour supprimer des valeurs du groupe, dans la section supérieure du volet droit, dans l’éditeur Regrouper les valeurs, désactivez la case à cocher à côté des valeurs.
Créer un groupe en sélectionnant plusieurs valeurs
Dans le volet Profil ou le volet Résultats, sélectionnez le champ à modifier.
Cliquez sur Options supplémentaires et sélectionnez Regrouper les valeurs (Regrouper et remplacer dans les versions précédentes) > Sélection manuelle dans le menu.
Dans le volet gauche de l’éditeur Regrouper les valeurs, sélectionnez plusieurs valeurs que vous souhaitez regrouper.
Dans le volet droit de l’éditeur Regrouper les valeurs, cliquez sur Regrouper les valeurs.
Un nouveau groupe est créé à l’aide de la dernière valeur sélectionnée comme nom de groupe. Pour modifier le nom du groupe, sélectionnez le champ groupé et modifiez la valeur ou faites un clic droit ou Ctrl+clic (MacOS) sur le champ groupé et sélectionnez Modifier la valeur dans le menu.
Ajouter et identifier des valeurs qui ne sont pas présentes dans l’ensemble de données
Si vous souhaitez associer des valeurs de votre ensemble de données à une nouvelle valeur qui n’existe pas, vous pouvez les ajouter à l’aide de Regrouper les valeurs (Regrouper et remplacer dans les versions précédentes). Afin que vous puissiez identifier rapidement les valeurs qui ne sont pas dans l’ensemble de données, ces valeurs sont marquées avec un point rouge à côté du nom de la valeur dans l’éditeur Regrouper les valeurs.
Par exemple, dans l’image ci-dessous, le Wyoming et le Nevada ne figurent pas dans l’ensemble de données.
Voici quelques raisons pour lesquelles une valeur peut ne pas être dans l’ensemble de données :
Vous venez d’ajouter la nouvelle valeur manuellement.
La valeur n’est plus dans les données.
La valeur est dans les données mais n’est pas dans l’ensemble de données échantillonné.
Pour ajouter une nouvelle valeur :
Dans le volet Profil ou le volet Résultats, sélectionnez le champ à modifier.
Cliquez sur Options supplémentaires et sélectionnez Regrouper les valeurs (Regrouper et remplacer dans les versions précédentes) > Sélection manuelle dans le menu contextuel.
Dans le volet gauche de l’éditeur Regrouper les valeurs, cliquez sur l’icône plus pour ajouter une nouvelle valeur.
Entrez une nouvelle valeur dans le champ et appuyez sur Entrée pour l’ajouter.
Dans le volet droit, sélectionnez les valeurs à associer à la nouvelle valeur.
- (Facultatif) Pour ajouter de nouvelles valeurs supplémentaires à votre valeur associée, cliquez sur le bouton plus dans le volet droit de l’éditeur Regrouper les valeurs.
Associer automatiquement des valeurs à une valeur standard à l’aide de la correspondance approximative
Pour rechercher et regrouper automatiquement des valeurs similaires, utilisez l’un des algorithmes de correspondance approximative. Les valeurs de champ sont regroupées sous la valeur qui apparaît le plus fréquemment. Consultez les valeurs regroupées, et ajoutez ou supprimez des valeurs dans le groupe comme nécessaire.
Si vous utilisez des types de données pour valider vos valeurs de champ, vous pouvez utiliser l’option Regrouper les valeurs (Regrouper et remplacer dans les versions précédentes) pour faire correspondre des valeurs non valides avec des valeurs valides. Pour plus d’informations, consultez Regrouper des valeurs similaires par type de données(Le lien s’ouvre dans une nouvelle fenêtre)
Choisissez l’une des options suivantes pour regrouper les valeurs :
Prononciation : trouvez et regroupez les valeurs ayant la même sonorité. Cette option utilise l’algorithme Metaphone 3 qui indexe les mots selon leur prononciation et est plus spécifiquement adapté aux mots anglais. Ce type d’algorithme est utilisé par de nombreux correcteurs orthographiques. Cette option n’est pas disponible pour les rôles de données.
Caractères communs : trouvez et regroupez les valeurs ayant des lettres et des nombres en commun. Cette option utilise l’algorithme d’empreinte digitale ngram qui indexe les mots par leurs caractères uniques après avoir supprimé la ponctuation, les doublons et les espaces blancs. Cet algorithme fonctionne quelle que soit la langue prise en charge. Cette option n’est pas disponible pour les rôles de données.
Par exemple, cet algorithme associerait les noms représentés sous la forme « John Smith » et « Smith, John » parce qu’ils génèrent tous deux la clé « hijmnost ». Cet algorithme ne prenant pas en considération la prononciation, la valeur « Tom Jhinois » aurait la même clé « hijmnost » et serait également inclus dans le groupe.
Orthographe : trouvez et regroupez les valeurs ayant la même orthographe. Cette option utilise l’algorithme de distance Levenshtein qui calcule une distance de modification entre deux valeurs de texte utilisant un seuil fixe par défaut. Elle les regroupe ensuite lorsque la distance de modification est inférieure à la valeur de seuil. Cet algorithme fonctionne quelle que soit la langue prise en charge.
Depuis Tableau Prep Builder version 2019.2.3, et sur le Web, cette option est disponible après l’application d’un type de données. Dans ce cas, il fait correspondre les valeurs invalides à la valeur valide la plus proche en utilisant la distance d’édition. Si la valeur standard ne se trouve pas dans votre exemple d’ensemble de données, Tableau Prep l’ajoute automatiquement et marque la valeur comme n’appartenant pas à l’ensemble de données d’origine.
Prononciation et orthographe (Tableau Prep Builder à partir de la version 2019.1.4 et sur le Web) : si vous affectez un type de données à vos champs, vous pouvez utiliser ce type de données pour associer et regrouper des valeurs avec la valeur standard définie par votre type de données. Cette option associe ensuite des valeurs non valides à la valeur valide la plus proche en fonction de l’orthographe et de la prononciation. Si la valeur standard ne se trouve pas dans votre exemple d’ensemble de données, Tableau Prep l’ajoute automatiquement et marque la valeur comme n’appartenant pas à l’ensemble de données d’origine. Cette option est celle qui convient le mieux aux mots anglais.
Pour plus d’informations consultez Nettoyer et organiser les données. Vous souhaitez en savoir plus sur ces algorithmes de correspondance approximative ? Consultez Regroupement automatisé dans Tableau Prep Builder(Le lien s’ouvre dans une nouvelle fenêtre) sur Tableau.com
Remarque : dans Tableau Prep Builder versions 2019.1.4 et 2019.2.1, cette option était appelée Correspondances des types de données.
Regrouper des valeurs similaires à l’aide de la correspondance floue
Dans le volet Profil ou le volet Résultats, sélectionnez le champ à modifier.
Cliquez sur Options supplémentaires et sélectionnez Regrouper les valeurs puis sélectionnez l’une de ces options :
Prononciation
Caractères communs
Orthographe
Tableau Prep Builder trouve et regroupe les valeurs qui correspondent et les remplace par la valeur qui se présente le plus fréquemment dans le groupe.
Consultez les regroupements, et ajoutez ou supprimez manuellement des valeurs, ou modifiez-le comme nécessaire. Cliquez ensuite sur Terminer.
Ajuster vos résultats lors du regroupement des valeurs de champ
Si vous regroupez des valeurs similaires par Orthographe ou Prononciation, vous pouvez modifier vos résultats en utilisant le curseur sur le champ afin d’ajuster le degré de rigidité des paramètres de regroupement.
Selon la manière dont vous définissez le curseur, vous pouvez avoir davantage de contrôle sur le nombre de valeurs incluses dans un groupe et le nombre de groupes créés. Par défaut, Tableau Prep détecte le paramètre de regroupement optimal et affiche le curseur dans cette position.
Lorsque vous modifiez le seuil, Tableau Prep analyse un échantillon des valeurs pour déterminer le nouveau regroupement. Les groupes générés à partir du paramètre sont sauvegardés et enregistrés dans le volet Modifications, mais le paramètre de seuil n’est pas enregistré. La prochaine fois que vous ouvrez l’éditeur Regrouper les valeurs, soit pour modifier votre changement existant, soit pour effectuer une nouvelle modification, le curseur de seuil est affiché dans la position par défaut, ce qui vous permet d’effectuer des ajustements en fonction de votre ensemble de données actuel.
Dans le volet Profil ou le volet Résultats, sélectionnez le champ à modifier.
Cliquez sur Options supplémentaires et sélectionnez Regrouper les valeurs (Regrouper et remplacer dans les versions précédentes) puis sélectionnez l’une de ces options :
Prononciation
Orthographe
Tableau Prep trouve et regroupe les valeurs qui correspondent et les remplace par la valeur qui se présente le plus fréquemment dans le groupe.
Dans le volet gauche de l’éditeur Regrouper les valeurs, faites glisser le curseur vers l’un des 5 niveaux de seuil pour modifier vos résultats.
Pour définir un seuil plus strict, déplacez le curseur vers la gauche. Il en résulte moins de correspondances et la création de moins de groupes inférieur. Pour définir un seuil moins strict, déplacez le curseur vers la droite. Il en résulte plus de correspondances et la création de plus de groupes.
- Cliquez sur Terminé pour enregistrer vos modifications.