Nettoyer et organiser les données

Tableau Prep Builder fournit diverses opérations de nettoyage que vous pouvez utiliser immédiatement pour nettoyer et organiser vos données. Le nettoyage des données désordonnées facilite la combinaison et l'analyse de vos données ou permet à d'autres personnes de comprendre plus facilement vos données lorsque vous partagez vos ensembles de données.

Vous pouvez également nettoyer vos données à l'aide d'une étape de permutation ou une étape de script pour appliquer des scripts R ou Python à votre flux. Pour plus d'informations, consultez Permuter vos données(Link opens in a new window) ou Utiliser des scripts R et Python dans votre flux(Link opens in a new window).

À propos des opérations de nettoyage

Remarque : certaines fonctions ou actions que vous incluez dans votre flux peuvent ne pas être compatibles avec la version de Tableau Server à laquelle vous êtes connecté. Vous ne pouvez pas programmer l'exécution avec Tableau Prep Conductor de flux qui incluent des fonctionnalités incompatibles. Pour plus d'informations sur la résolution des problèmes de compatibilité de version, consultez la rubrique Compatibilité de version avec Tableau Prep(Link opens in a new window).

Vous nettoyez les données en appliquant des opérations de nettoyage telles que le filtrage, l'ajout, le changement de nom, la scission, le regroupement ou la suppression de champs. Dans les versions précédentes, les opérations de nettoyage ne pouvaient être effectuées que dans le type d'étape Nettoyage. Dans Tableau Prep Builder version 2018.2.1 et versions ultérieures, vous pouviez également effectuer des opérations de nettoyage dans la grille de données lors d'une étape de nettoyage.

Dans Tableau Prep Builder version 2018.3.1 et versions ultérieures, vous pouvez effectuer des opérations de nettoyage dans la plupart des types d'étape de votre flux. Vous pouvez appliquer des opérations de nettoyage limitées à l'étape des données entrantes et vous ne pouvez pas appliquer d'opérations de nettoyage à l'étape de sortie. Pour plus d'informations sur l'application d'opérations de nettoyage à l'étape des données entrantes, consultez Appliquer des opérations de nettoyage à une étape des données entrantes(Link opens in a new window).

Opérations de nettoyage disponibles

La table suivante montre les opérations de nettoyage disponibles dans chaque type d'étape :

  Entrée Nettoyage Agrégation Permutation Jointure Union Sortie
Filtrer X X X X X X  
Regrouper les valeurs   X   X   X  
Nettoyer   X   X X X  
Convertir des dates   X X X X X  
Scinder les valeurs   X   X X X  
Renommer le champ X X X X X X  
Champ Dupliqué   X   X X X  
Conserver uniquement le champ X X X X X X  
Supprimer le champ X X X X X X  
Créer un champ calculé   X   X X X  
Modifier la valeur   X   X X X  
Modifier le type de données X X X X X X  

À mesure que vous modifiez vos données, des annotations sont ajoutées à l'étape correspondante dans le volet Flux et une entrée est ajoutée dans le volet Modifications pour enregistrer vos actions. Si vous apportez des modifications dans l'étape des données entrantes, l'annotation s'affiche à gauche de l'étape dans le volet Flux et s'affiche également dans le Profil d'entrée dans la liste des champs.

L'ordre d'application de vos modifications a une incidence. Les modifications apportées dans les types d'étape Agrégation, Permutation, Jointure et Union sont effectuées soit avant, soit après ces actions de réorganisation, selon l'emplacement du champ où vous effectuez la modification. L'emplacement où la modification a été effectuée s'affiche dans le volet Modifications de l'étape.

L'exemple suivant montre une modification de champ à partir d'une seule table dans une étape de jointure. La modification est effectuée avant l'action de jointure afin de générer des résultats corrigés.

Ordre des opérations

Les tableaux suivants montrent où l'action de nettoyage est effectuée dans les types d'étape Agrégation, Permutation, Jointure et Union, selon l'emplacement du champ dans l'étape.

Action Type d'étape : Agrégation Agrégation Permutation Permutation Jointure Jointure Union Union
  Emplacement du champ : Champs groupés Champs agrégés Pas en permutation Créé à partir d’une permutation Inclus dans un tableau* Inclus dans les deux tableaux* Champs incompatibles Champs combinés
Filtrer   Avant l’agrégation Après l’agrégation Avant la permutation Après la permutation Avant la jointure Après la jointure Avant l’Union Après l’Union
Regrouper les valeurs   N/A N/A Avant la permutation Après la permutation Avant la jointure Après la jointure Avant l’Union Après l’Union
Nettoyer   N/A N/A Avant la permutation Après la permutation Avant la jointure Après la jointure Avant l’Union Après l’Union
Convertir des dates   Avant l’agrégation Après l’agrégation Avant la permutation Après la permutation Avant la jointure Après la jointure Avant l’Union Après l’Union
Scinder les valeurs   N/A N/A Avant la permutation Après la permutation Avant la jointure Après la jointure Avant l’Union Après l’Union
Renommer le champ   Avant l’agrégation Après l’agrégation Avant la permutation Après la permutation Avant la jointure Après la jointure Avant l’Union Après l’Union
Champ Dupliqué   N/A N/A Avant la permutation Après la permutation Avant la jointure Après la jointure Avant l’Union Après l’Union
Conserver uniquement le champ   Après l’agrégation Après l’agrégation Avant la permutation Après la permutation Avant la jointure Après la jointure Avant l’Union Après l’Union
Supprimer le champ   Supprime de l’agrégation Supprime de l’agrégation Avant la permutation Après la permutation Avant la jointure Après la jointure Avant l’Union Après l’Union
Créer un champ calculé   N/A N/A Avant la permutation Après la permutation Après la jointure Après la jointure Avant l’Union Après l’Union
Modifier la valeur   N/A N/A Avant la permutation Après la permutation Avant la jointure Après la jointure Avant l’Union Après l’Union
Modifier le type de données   Avant l’agrégation Après l’agrégation Avant la permutation Après la permutation Avant la jointure Avant la jointure Avant l’Union Après l’Union

Remarque : pour les jointures, si le champ est un champ calculé créé à l'aide d'un champ issu d'une autre table, la modification est appliquée avant la jointure. Si le champ est créé avec des champs issus des deux tables, la modification est appliquée après la jointure.

Appliquer des opérations de nettoyage

Pour appliquer des opérations de nettoyage à des champs, utilisez les options de la barre d'outils ou cliquez sur Options supplémentaires dans la fiche Profil du champ, la grille de données ou le volet Résultats pour ouvrir le menu.

Dans les types d'étape Agrégation, Permutation, Jointure et Union, le menu Options supplémentaires est disponible dans les fiches Profil du volet Résultats et la grille de données correspondante. Si vous effectuez les mêmes opérations de nettoyage ou actions à plusieurs reprises tout au long de votre flux, vous pouvez copier et coller vos étapes, actions ou même champs. Pour plus d'informations, voir Copier des étapes, des actions et des champs.

Barre d'outils du volet Profil Menu déroulant

Sélectionner votre vue

Vous pouvez effectuer des opérations de nettoyage en dehors des volets Profil ou Résultats dans la grille de données ou dans la liste. Utilisez la barre d'outils de la vue (version 2019.3.2 et ultérieur) pour modifier votre vue, puis cliquez sur Options supplémentaires sur un champ pour ouvrir le menu de nettoyage.

  • Afficher le volet Profil : il s'agit de la vue par défaut. Sélectionnez ce bouton pour revenir à la vue du volet Profil ou du volet Résultats.

  • Afficher la grille de données : Réduisez le volet Profil ou Résultats pour développer et afficher uniquement la grille de données. Cette vue fournit une vue plus détaillée de vos données et peut être utile lorsque vous devez travailler avec des valeurs de champ spécifiques. Une fois que vous avez sélectionné cette option, cet état de vue persiste à travers toutes les étapes de votre flux, mais vous pouvez le modifier à tout moment.

    Remarque : les opérations de nettoyage ne sont pas toutes disponibles dans la grille de données. Par exemple, si vous souhaitez modifier une valeur en ligne, vous devez le faire dans le volet Profil.

  • Afficher la liste (version 2019.3.2 et ultérieur) : Convertissez le volet Profil ou le volet Résultats en une liste. Une fois que vous avez sélectionné cette option, cet état de vue persiste à travers toutes les étapes de votre flux, mais vous pouvez le modifier à tout moment.

    Vous pouvez sélectionner plusieurs lignes et cliquer sur X pour les supprimer ou utiliser le menu Options supplémentaires pour appliquer des opérations aux champs sélectionnés. Si vous affectez un type de données au champ ou sélectionnez Filtrer, Regrouper et Remplacer, Nettoyer ou Scinder les valeurs, vous êtes renvoyé à la vue Profil ou Résultats pour terminer ces actions. Toutes les autres options peuvent être exécutées dans la liste.

Version 2019.3.1 et versions antérieures

Utilisez la barre d'outils de la vue pour masquer le volet Profil et afficher simplement la grille de données. Cliquez ensuite sur Options supplémentaires dans un champ de la grille de données pour ouvrir le menu de nettoyage. Cette vue fournit une vue plus détaillée de vos données et peut être utile lorsque vous devez travailler avec des valeurs de champ spécifiques. Une fois que vous avez sélectionné cette option, cet état de vue persiste à travers toutes les étapes de votre flux, mais vous pouvez le modifier à tout moment.

Remarque : les opérations de nettoyage ne sont pas toutes disponibles dans la grille de données. Par exemple, si vous souhaitez modifier une valeur en ligne, vous devez le faire dans le volet Profil.

Suspendre les mises à jour des données pour améliorer les performances

Lorsque vous effectuez des opérations de nettoyage de vos données, Tableau Prep Builder applique vos modifications au fur et à mesure pour vous présenter les résultats immédiatement. Mais si vous savez exactement quelles modifications vous souhaitez apporter et que vous n'avez pas besoin d'un feedback immédiat à chaque modification, ou que vous souhaitez simplement améliorer les performances, vous pouvez interrompre les mises à jour des données pour gagner un temps de traitement précieux. Lorsque vous suspendez les mises à jour des données, vous pouvez effectuer toutes vos modifications en une seule fois, puis redémarrer les mises à jour pour voir vos résultats. Vous pouvez redémarrer les mises à jour des données et activer toutes les opérations disponibles à tout moment.

Remarque : lorsque vous suspendez les mises à jour des données, toutes les opérations qui vous demandent de voir vos valeurs seront désactivées. Par exemple, si vous voulez appliquer un filtre aux valeurs sélectionnées, vous devez voir les valeurs que vous voulez exclure.

  1. Dans le menu du haut, cliquez sur Suspendre les mises à jour de données pour suspendre les mises à jour.

  2. Tableau Prep Builder convertit le volet Profil en une liste. Dans la liste, utilisez le menu Plus d'options pour appliquer des opérations aux champs sélectionnés. Si l'opération nécessite que vous voyiez vos valeurs, elle sera désactivée. Pour activer l'opération, vous devrez redémarrer les mises à jour des données.

    Pour plus d'informations sur l'utilisation du mode Liste, voir Sélectionner votre vue.

  3. Pour voir les résultats de vos modifications ou activer une fonctionnalité désactivée, redémarrez les mises à jour des données. Cliquez sur le bouton Redémarrer les mises à jour des données, cliquez sur le bouton Reprendre dans la boîte de dialogue du menu ou dans la bannière de message en haut du volet Flux.

Appliquer des opérations de nettoyage

Pour appliquer des opérations de nettoyage à un champ, procédez comme suit :

Remarque : vous pouvez effectuer des opérations de nettoyage dans une liste à partir de la version 2019.3.2.

  1. Dans le volet Profil, dans la grille de données, dans le volet Résultats ou dans la liste, sélectionnez le champ auquel vous souhaitez apporter des modifications.

  2. Dans la barre d'outils ou le menu Options supplémentaires du champ, faites votre choix parmi les options suivantes :

    • Filtrer ou Filtrer les valeurs : sélectionnez l'une des options de filtre, faites un clic droit (ou Ctrl+clic sur MacOS) sur une valeur de champ pour conserver ou exclure des valeurs. Vous pouvez également utiliser le filtre Valeurs sélectionnées pour choisir et sélectionner les valeurs à filtrer, y compris les valeurs non comprises dans votre échantillon de flux. Pour plus d'informations sur les options de filtre, consultez Filtrer vos données(Link opens in a new window).

    • Regrouper les valeurs (Regrouper et remplacer dans les versions précédentes) : sélectionnez manuellement les valeurs ou utilisez le regroupement automatique. Vous pouvez aussi sélectionner plusieurs valeurs dans la fiche Profil et faire un clic droit (Ctrl+clic sur MacOS) pour regrouper ou dégrouper des valeurs ou encore modifier la valeur de regroupement. Pour plus d'informations sur l'utilisation de l'option Regrouper les valeurs, consultez Associer automatiquement des valeurs à une valeur standard à l'aide de la correspondance approximative.

    • Nettoyer : faites votre choix dans la liste d'opérations de nettoyage rapides à appliquer à toutes les valeurs du champ.

    • Convertir des dates (version 2020.1.4 et ultérieur) : pour les champs affectés à un type de données Date ou Date et heure, faites votre choix dans la liste d'opérations de nettoyage rapide DATEPART pour convertir vos valeurs de champ de date en une valeur d’entier représentant une année, un trimestre, un mois, une semaine, un jour, ou une valeur de date et d’heure.
      • Année fiscale personnalisée (version 2020.3.3 et versions ultérieures) : si votre année fiscale ne commence pas en janvier, définissez un mois fiscal personnalisé pour convertir la date à l’aide de ce mois au lieu du mois de janvier par défaut. Ce paramètre s’applique par champ individuel, donc si vous souhaitez appliquer une année fiscale personnalisée à d’autres champs, répétez cette même étape. Pour ouvrir la boîte de dialogue, dans le menu Options supplémentaires, sélectionnez Convertir les dates > Année fiscale personnalisée.

    • Scinder les valeurs : Scindez les valeurs automatiquement en fonction d'un séparateur commun ou utilisez la scission personnalisée pour spécifier la façon dont vous souhaitez scinder les valeurs de champ.

      La scission automatique et la scission personnalisée fonctionnent de la même manière que dans Tableau Desktop. Pour plus d'information, consultez Fractionner un champ en champs multiples(Link opens in a new window) dans l'aide de Tableau Desktop et l'aide de la création Web.

    • Renommer le champ : modifiez le nom du champ.

    • Dupliquer le champ (version 2019.2.3 et ultérieur) : créez une copie de votre champ et de vos valeurs.

    • Conserver uniquement le champ (version 2019.2.2 et ultérieur) : conservez uniquement le champ sélectionné et excluez tous les autres champs dans l’étape.

    • Créer un champ calculé : écrivez un calcul personnalisé dans l’éditeur de calcul ou utilisez l’éditeur de calcul visuel (version 2020.1.1 et ultérieur) pour créer des calculs de détail, de classement ou de nombre de lignes. Pour plus d’informations, consultez Créer des calculs de niveau de détail et de classement.

    • Supprimer (Supprimer le champ dans les versions précédentes) : supprimez le champ du flux.

      Remarque : depuis la version 2019.3.1, vous pouvez utiliser l'option Publier en tant que type de données pour créer des types de données personnalisés que vous pouvez ensuite appliquer à vos champs pour valider les valeurs des champs lors du nettoyage des données. Pour plus d'informations sur cette option, voir Créer des types de données personnalisés (version 2019.3.1 et ultérieur)(Link opens in a new window).

  3. Pour modifier une valeur, faites un clic droit ou Ctrl+clic (MacOS) sur une ou plusieurs valeurs, et sélectionnez Modifier la valeur puis entrez une nouvelle valeur. Vous pouvez également sélectionner Remplacer par une valeur null pour remplacer les valeurs par une valeur null ou double-cliquer sur un champ pour le modifier directement. Pour plus d’informations sur la modification des valeurs de champ, voir Modifier des valeurs de champ.

  4. Vérifiez le résultat de ces opérations dans le volet Profil, les volets Résumé ou la grille de données.

Afficher vos modifications

Les différents types d'opérations de nettoyage sont représentés par des icônes à travers les différentes étapes de votre flux. Si plus de quatre types d'opérations sont appliqués à une étape, trois points de suspension apparaissent sur l'étape. Survolez ces icônes pour voir les annotations indiquant les opérations appliquées, ainsi que leur ordre d'exécution.

Dans Tableau Prep Builder version 2019.1.3 et versions ultérieures, vous pouvez cliquer sur une annotation sur l'icône de modification dans une étape du volet Flux ou sur une fiche Profil dans le volet Profil ou Résultats. La modification et le champ affecté seront surlignés dans le volet Modifications ainsi que dans le volet Profil ou Résultats.

Vous pouvez également sélectionner une étape, puis développer le volet Modifications pour consulter les détails de chaque modification, éditer ou supprimer vos modifications, ou faire glisser des modifications vers le haut ou vers le bas pour changer leur ordre d'application. Dans Tableau Prep Builder 2019.1.1, vous pouvez ajouter une description pour fournir un contexte à d'autres utilisateurs. Pour plus d'informations sur l'ajout de descriptions à vos modifications, voir Ajouter des descriptions aux étapes du flux et aux actions de nettoyage(Link opens in a new window)

Annotation sur le nettoyage Suivi des modifications

Lorsque vous affichez les modifications pour une étape Agrégation, Permutation, Jointure ou Union, l'ordre dans lequel la modification est appliquée s'affiche avant ou après l'action de réorganisation. L'ordre de ces modifications est appliqué par le système et ne peut pas être modifié. Vous pouvez éditer et supprimer la modification.

Fusionner des champs

Si des champs contiennent les mêmes valeurs mais ont un nom différent, vous pouvez facilement les fusionner en un seul champ pour les combiner en faisant glisser un champ sur un autre. Lorsque vous fusionnez des champs, le champ cible devient le champ principal et le nom du champ cible persiste. Le champ que vous fusionnez sur le champ cible est supprimé.

Exemple :

une union de caractères génériques a pour résultat 3 champs contenant les mêmes valeurs. Fusionner 3 champs en 1

Lorsque vous fusionnez des champs, Tableau Prep Builder conserve tous les champs du champ cible et remplace toutes les valeurs null de ce champ par les valeurs issues des champs source que vous fusionnez avec le champ cible. Les champs source sont supprimés.

Exemple

Nom Téléphone_Contact Téléphone_Professionnel Téléphone_Mobile Téléphone_Domicile
Bob 123-4567 123-4567 null null
Sally null null 456-7890 789-0123
Fred null null null 567-8901
Emma null 234-5678 345-6789 null

Si vous fusionnez Téléphone_Professionnel, Téléphone_Mobile et Téléphone_Domicile avec le champ Téléphone_Contact, les autres champs sont supprimés et le résultat se présente ainsi :

Nom Téléphone_Contact
Bob 123-4567
Sally 456-7890
Fred 567-8901
Emma 234-5678

Pour fusionner des champs, procédez comme suit :

  • Faites glisser et déposez un champ sur un autre. Un indicateur Déposer pour fusionner les champs s'affiche.

  • Sélectionnez plusieurs champs et faites un clic droit dans la sélection pour ouvrir le menu contextuel, puis cliquez sur Fusionner les champs.

  • Sélectionnez plusieurs champs, puis cliquez sur Fusionner les champs dans la barre d'outils.

Pour savoir comment corriger des champs discordants suite à une union, consultez Corriger les champs non concordants.

Appliquer les opérations de nettoyage selon les recommandations (version 2018.3.2 et ultérieur)

Il peut parfois être difficile d'identifier l'opération de nettoyage nécessaire pour corriger les problèmes de vos données. Tableau Prep Builder peut analyser vos données et recommander les opérations de nettoyage à appliquer automatiquement pour corriger rapidement les problèmes de vos champs de données ou identifier les problèmes afin que vous puissiez les corriger. Cette fonctionnalité est disponible dans tous les types d'étape, sauf les types d'étape Entrée, Sortie et Jointure.

Remarque : si vous ne souhaitez pas utiliser cette fonctionnalité, désactivez-la. Dans le menu supérieur, accédez à Aide > Paramètres et Performances. Cliquez ensuite sur Activer les recommandations pour désélectionner la coche à côté du paramètre.

Les types de recommandation incluent :

  • Types de données

  • Filtrer

  • Regrouper les valeurs (s’applique également aux champs avec des types de données à partir de la version 2019.2.3)
  • Permuter les colonnes en lignes (2019.4.2 et ultérieur)

  • Remplacer des valeurs par des valeurs null
  • Supprimer des champs

  • Scission (version 2019.1.1 et ultérieur)

    Remarque : cette option fonctionne spécifiquement avec les données contenues dans des fichiers texte de largeur fixe. Pour utiliser la recommandation de scission avec ce type de fichier, après vous être connecté à la source de données, dans l'étape des données entrantes, dans l'onglet Paramètres du texte, sélectionnez un caractère Séparateur de champs qui n'est pas utilisé dans les données afin que les données se chargent en tant que champ unique.

  • Supprimer des espaces

Appliquer les recommandations

  1. Effectuez l'une des actions suivantes :

    • Cliquez sur l'icône d'ampoule en haut à droite de la fiche Profil.
    • Dans la barre d'outils, cliquez sur la flèche déroulante Recommandations pour afficher toutes les recommandations concernant votre ensemble de données et sélectionnez une recommandation dans la liste.

    Cette option apparaît uniquement lorsque les modifications recommandées sont identifiées par Tableau Prep Builder.

  2. Pour appliquer la recommandation, survolez la fiche Recommandations puis cliquez sur Appliquer.

    La modification est automatiquement appliquée et une entrée est ajoutée au volet Modifications. Pour supprimer la modification, cliquez sur Annuler dans le menu supérieur ou survolez la modification dans le volet Modifications puis cliquez sur le signe X pour la supprimer.

    Si vous appliquez une recommandation pour la permutation des champs (version 2019.4.2 et ultérieur), une étape Permutation est automatiquement créée dans laquelle vous pouvez effectuer toute action de permutation supplémentaire, par exemple renommer les champs permutés ou permuter des champs supplémentaires.

  3. Si Tableau Prep Builder identifie d’autres recommandations résultant du changement, l’icône Ampoule reste sur la carte de profil jusqu’à ce qu’aucune autre recommandation ne soit trouvée.

    Répétez les étapes ci-dessus pour appliquer des modifications supplémentaires ou ignorez les modifications suggérées et utilisez les autres outils de nettoyage de Tableau Prep Builder pour résoudre les problèmes de données.

Modifier des valeurs de champ

Plusieurs variations de la même valeur peuvent vous empêcher de résumer correctement vos données. Vous pouvez corriger ces variations rapidement et aisément en appliquant les options suivantes dans Tableau Prep Builder.

Remarque : toutes les modifications que vous apportez aux valeurs doivent être compatibles avec le type de champ de données.

Modifier une seule valeur

  1. Dans la fiche Profil, cliquez sur la valeur à modifier puis entrez la nouvelle valeur. Une icône de groupe s'affiche à côté de la valeur.

    Sinon, faites un clic droit sur une valeur et cliquez sur Modifier la valeur. La modification est enregistrée dans Suivi des modifications sur le côté gauche de l'écran.

  2. Affichez les résultats dans le volet Profil et la grille de données.

Modifier plusieurs valeurs

Vous avez plusieurs possibilités pour modifier plusieurs valeurs à la fois. Par exemple, utilisez des opérations de nettoyage rapide pour supprimer la ponctuation de toutes les valeurs du champ, regrouper manuellement des valeurs en utilisant la sélection multiple ou regrouper automatiquement ensemble des valeurs à l'aide d'algorithmes de correspondance approximative qui trouvent les valeurs similaires, ou encore sélectionner plusieurs valeurs et les remplacer par des valeurs null.

Remarque : lorsque vous associez plusieurs valeurs à une seule valeur, le champ d'origine montre une icône de groupe à côté de la valeur. Elle vous indique quelles valeurs sont regroupées ensemble.

Modifier plusieurs valeurs en utilisant les opérations de nettoyage rapides

Cette option s'applique uniquement aux champs textuels.

  1. Dans le volet Profil, le volet Résultats ou la grille de données, sélectionnez le champ à modifier.

  2. Cliquez sur Options supplémentaires, sélectionnez Nettoyer, puis sélectionnez l'une des options suivantes:

    • Mettre en majuscule : modifiez toutes les valeurs en texte en majuscule.

    • Mettre en minuscule : modifiez toutes les valeurs en texte en minuscule.

    • Supprimer les lettres : supprimez toutes les lettres et laissez uniquement les autres caractères.

    • Supprimer les nombres : supprimez tous les nombres et laissez les lettres et les autres caractères.

    • Supprimer la ponctuation : supprimez toutes la ponctuation.

    • Supprimer les espaces : supprimez les espaces de début et de fin.

    • Supprimer les espaces supplémentaires (version 2018.3.3 et ultérieure) : supprimez les espaces blancs de début et de fin, et remplacez les espaces blancs supplémentaires entre des caractères par un seul espace.
    • Supprimer tous les espaces (version 2018.3.3 et ultérieure) : supprimez tous les espaces blancs, y compris les espaces blancs de début et de fin, et tout espace blanc entre les caractères.

    Vous pouvez empiler les opérations pour appliquer plusieurs opérations de nettoyage aux champs. Par exemple, commencez par sélectionner Supprimer > Supprimer les nombres puis sélectionnez Nettoyer > Supprimer la ponctuation pour supprimer tous les nombres et la ponctuation des valeurs de champ.

  3. Pour annuler vos modifications, cliquez sur la flèche Annuler en haut du volet Flux ou supprimez la modification de la liste des modifications.

Regrouper et modifier plusieurs valeurs en ligne

Utilisez cette option pour sélectionner manuellement plusieurs valeurs et les regrouper sous une valeur standard dans la fiche Profil. Pour utiliser d’autres méthodes de regroupement des valeurs, consultez Associer manuellement plusieurs valeurs à une valeur standard et Associer automatiquement des valeurs à une valeur standard à l'aide de la correspondance approximative.

  1. Dans la fiche Profil, sélectionnez le champ à modifier.

  2. Appuyez sur Ctrl ou Maj+clic, ou Command ou Maj+clic (MacOS), et sélectionnez les valeurs que vous souhaitez regrouper.

  3. Faites un clic droit et sélectionnez Groupe dans le menu contextuel. La valeur de la sélection sur laquelle vous faites un clic droit devient le nom par défaut du nouveau groupe, mais vous pouvez le modifier en ligne.

  4. Pour modifier le nom du groupe, sélectionnez le champ groupé et modifiez la valeur ou faites un clic droit (ou Ctrl+clic sur un Mac) sur le champ groupé et sélectionnez Modifier la valeur dans le menu contextuel.

  5. Pour dégrouper les valeurs d'un champ groupé, faites un clic droit sur le champ groupé, puis sélectionnez Dégrouper dans le menu contextuel.

Remplacer une ou plusieurs valeurs par une valeur null

Si vous souhaitez inclure des lignes de données dans votre analyse, mais exclure certaines valeurs de champ, vous pouvez les transformer en une valeur null.

  1. Dans la fiche Profil, appuyez sur Ctrl ou Maj+clic, ou Command ou Maj+clic (sur Mac), et sélectionnez les valeurs que vous souhaitez modifier

  2. Faites un clic droit ou Ctrl+clic (Mac), et sélectionnez Remplacer par une valeur null dans le menu. Les valeurs sont transformées en valeurs null et l'icône de groupe apparaît à côté de la valeur.

Associer manuellement plusieurs valeurs à une valeur standard

Remarque : pour utiliser cette fonctionnalité, vous devez être autorisé à créer des tables temporaires dans votre schéma, sans quoi le flux risque de ne pas s’exécuter.

Utilisez l'option Regrouper les valeurs (Regrouper et remplacer dans les versions précédentes) pour associer la valeur d'un champ à une autre valeur ou sélectionner manuellement plusieurs valeurs à regrouper. Vous pouvez même ajouter de nouvelles valeurs pour configurer des relations de mappage afin d'organiser vos données.

Par exemple, imaginons qu'un champ comporte trois valeurs : Ma société, Ma société Incorporated et Ma société Inc. Ces valeurs représentent toutes trois la même entreprise, Ma société. Vous pouvez utiliser Regrouper les valeurs pour associer les valeurs Ma société Incorporated et Ma société Inc. à Ma société afin que les valeurs s'affichent toutes trois comme Ma société dans le champ.

Associer plusieurs valeurs à un champ sélectionné unique

  1. Dans le volet Profil ou le volet Résultats, sélectionnez le champ à modifier.

  2. Cliquez sur Options supplémentaires et sélectionnez Regrouper les valeurs (Regrouper et remplacer dans les versions précédentes) > Sélection manuelle dans le menu.

  3. Dans le volet gauche de l'éditeur Regrouper les valeurs, sélectionnez la valeur de champ que vous souhaitez utiliser comme valeur de regroupement. Cette valeur s'affiche maintenant en haut du volet droit.

  4. Dans la section inférieure du volet droit dans l'éditeur Regrouper les valeurs, sélectionnez les valeurs à ajouter au groupe.

    Pour supprimer des valeurs du groupe, dans la section supérieure du volet droit, dans l'éditeur Regrouper les valeurs, désactivez la case à cocher à côté des valeurs.

Créer un groupe en sélectionnant plusieurs valeurs

  1. Dans le volet Profil ou le volet Résultats, sélectionnez le champ à modifier.

  2. Cliquez sur Options supplémentaires et sélectionnez Regrouper les valeurs (Regrouper et remplacer dans les versions précédentes) > Sélection manuelle dans le menu.

  3. Dans le volet gauche de l'éditeur Regrouper les valeurs, sélectionnez plusieurs valeurs que vous souhaitez regrouper.

  4. Dans le volet droit de l'éditeur Regrouper les valeurs, cliquez sur Regrouper les valeurs.

    Un nouveau groupe est créé à l'aide de la dernière valeur sélectionnée comme nom de groupe. Pour modifier le nom du groupe, sélectionnez le champ groupé et modifiez la valeur ou faites un clic droit ou Ctrl+clic (MacOS) sur le champ groupé et sélectionnez Modifier la valeur dans le menu.

    Ajouter et identifier des valeurs qui ne sont pas présentes dans l'ensemble de données

    Si vous souhaitez associer des valeurs de votre ensemble de données à une nouvelle valeur qui n'existe pas, vous pouvez les ajouter à l'aide de Regrouper les valeurs (Regrouper et remplacer dans les versions précédentes). Afin que vous puissiez identifier rapidement les valeurs qui ne sont pas dans l'ensemble de données, ces valeurs sont marquées avec un point rouge à côté du nom de la valeur dans l'éditeur Regrouper les valeurs.

    Par exemple, dans l'image ci-dessous, le Wyoming et le Nevada ne figurent pas dans l'ensemble de données.

    Voici quelques raisons pour lesquelles une valeur peut ne pas être dans l'ensemble de données :

    • Vous venez d'ajouter la nouvelle valeur manuellement.

    • La valeur n'est plus dans les données.

    • La valeur est dans les données mais n'est pas dans l'ensemble de données échantillonné.

    Pour ajouter une nouvelle valeur :

    1. Dans le volet Profil ou le volet Résultats, sélectionnez le champ à modifier.

    2. Cliquez sur Options supplémentaires et sélectionnez Regrouper les valeurs (Regrouper et remplacer dans les versions précédentes) > Sélection manuelle dans le menu contextuel.

    3. Dans le volet gauche de l'éditeur Regrouper les valeurs, cliquez sur l'icône plus pour ajouter une nouvelle valeur.

    4. Entrez une nouvelle valeur dans le champ et appuyez sur Entrée pour l'ajouter.

    5. Dans le volet droit, sélectionnez les valeurs à associer à la nouvelle valeur.

    6. (Facultatif) Pour ajouter de nouvelles valeurs supplémentaires à votre valeur associée, cliquez sur le bouton plus dans le volet droit de l'éditeur Regrouper les valeurs.

Associer automatiquement des valeurs à une valeur standard à l'aide de la correspondance approximative

Remarque : lors de l’utilisation de cette fonctionnalité, vous devez être autorisé à créer des tables temporaires dans votre schéma, sans quoi le flux risque de ne pas s’exécuter.

Pour rechercher et regrouper automatiquement des valeurs similaires, utilisez l'un des algorithmes de correspondance approximative. Les valeurs de champ sont regroupées sous la valeur qui apparaît le plus fréquemment. Consultez les valeurs regroupées, et ajoutez ou supprimez des valeurs dans le groupe comme nécessaire.

Si vous utilisez des types de données pour valider vos valeurs de champ, vous pouvez utiliser l'option Regrouper les valeurs (Regrouper et remplacer dans les versions précédentes) pour faire correspondre des valeurs non valides avec des valeurs valides. Pour plus d'informations, consultez Regrouper des valeurs similaires par type de données(Link opens in a new window)

Choisissez l'une des options suivantes pour regrouper les valeurs :

  • Prononciation : trouvez et regroupez les valeurs ayant la même sonorité. Cette option utilise l'algorithme Metaphone 3 qui indexe les mots selon leur prononciation et est plus spécifiquement adapté aux mots anglais. Ce type d'algorithme est utilisé par de nombreux correcteurs orthographiques. Cette option n’est pas disponible pour les rôles de données.

  • Caractères communs : trouvez et regroupez les valeurs ayant des lettres et des nombres en commun. Cette option utilise l'algorithme d'empreinte digitale ngram qui indexe les mots par leurs caractères uniques après avoir supprimé la ponctuation, les doublons et les espaces blancs. Cet algorithme fonctionne quelle que soit la langue prise en charge. Cette option n’est pas disponible pour les rôles de données.

    Par exemple, cet algorithme associerait les noms représentés sous la forme « John Smith » et « Smith, John » parce qu'ils génèrent tous deux la clé « hijmnost ». Cet algorithme ne prenant pas en considération la prononciation, la valeur « Tom Jhinois » aurait la même clé « hijmnost » et serait également inclus dans le groupe.

  • Orthographe : trouvez et regroupez les valeurs ayant la même orthographe. Cette option utilise l'algorithme de distance Levenshtein qui calcule une distance de modification entre deux valeurs de texte utilisant un seuil fixe par défaut. Elle les regroupe ensuite lorsque la distance de modification est inférieure à la valeur de seuil. Cet algorithme fonctionne quelle que soit la langue prise en charge.

    A partir de la version 2019.2.3 de Tableau Prep Builder, cette option est disponible après l’application d’un type de données. Dans ce cas, il fait correspondre les valeurs invalides à la valeur valide la plus proche en utilisant la distance d’édition. Si la valeur standard ne se trouve pas dans votre exemple d'ensemble de données, Tableau Prep Builder l'ajoute automatiquement et marque la valeur comme n'appartenant pas à l'ensemble de données d'origine.

  • Prononciation et orthographe (version 2019.1.4 et ultérieur) : si vous affectez un type de données à vos champs, vous pouvez utiliser ce type de données pour associer et regrouper des valeurs avec la valeur standard définie par votre type de données. Cette option associe ensuite des valeurs non valides à la valeur valide la plus proche en fonction de l’orthographe et de la prononciation. Si la valeur standard ne se trouve pas dans votre exemple d'ensemble de données, Tableau Prep Builder l'ajoute automatiquement et marque la valeur comme n'appartenant pas à l'ensemble de données d'origine. Cette option est celle qui convient le mieux aux mots anglais.

    Pour plus d’informations, consultez Nettoyer et organiser les données.

    Remarque : dans Tableau Prep Builder versions 2019.1.4 et 2019.2.1, cette option était appelée Correspondances des types de données.

Regrouper des valeurs similaires à l’aide de la correspondance floue

  1. Dans le volet Profil ou le volet Résultats, sélectionnez le champ à modifier.

  2. Cliquez sur Options supplémentaires et sélectionnez Regrouper les valeurs puis sélectionnez l'une de ces options :

    • Prononciation

    • Caractères communs

    • Orthographe

    Tableau Prep Builder trouve et regroupe les valeurs qui correspondent et les remplace par la valeur qui se présente le plus fréquemment dans le groupe.

  3. Consultez les regroupements, et ajoutez ou supprimez manuellement des valeurs, ou modifiez-le comme nécessaire. Cliquez ensuite sur Terminer.

Ajuster vos résultats lors du regroupement des valeurs de champ

Si vous regroupez des valeurs similaires par Orthographe ou Prononciation, vous pouvez modifier vos résultats en utilisant le curseur sur le champ afin d'ajuster le degré de rigidité des paramètres de regroupement.

Selon la manière dont vous définissez le curseur, vous pouvez avoir davantage de contrôle sur le nombre de valeurs incluses dans un groupe et le nombre de groupes créés. Par défaut, Tableau Prep Builder détecte le paramètre de regroupement optimal et affiche le curseur dans cette position.

Lorsque vous modifiez le seuil, Tableau Prep Builder analyse un échantillon des valeurs pour déterminer le nouveau regroupement. Les groupes générés à partir du paramètre sont sauvegardés et enregistrés dans le volet Modifications, mais le paramètre de seuil n'est pas enregistré. La prochaine fois que vous ouvrez l'éditeur Regrouper les valeurs, soit pour modifier votre changement existant, soit pour effectuer une nouvelle modification, le curseur de seuil est affiché dans la position par défaut, ce qui vous permet d'effectuer des ajustements en fonction de votre ensemble de données actuel.

  1. Dans le volet Profil ou le volet Résultats, sélectionnez le champ à modifier.

  2. Cliquez sur Options supplémentaires et sélectionnez Regrouper les valeurs (Regrouper et remplacer dans les versions précédentes) puis sélectionnez l'une de ces options :

    • Prononciation

    • Orthographe

    Tableau Prep Builder trouve et regroupe les valeurs qui correspondent et les remplace par la valeur qui apparaît le plus fréquemment dans le groupe.

  3. Dans le volet gauche de l'éditeur Regrouper les valeurs, faites glisser le curseur vers l'un des 5 niveaux de seuil pour modifier vos résultats.

    Pour définir un seuil plus strict, déplacez le curseur vers la gauche. Il en résulte moins de correspondances et la création de moins de groupes inférieur. Pour définir un seuil moins strict, déplacez le curseur vers la droite. Il en résulte plus de correspondances et la création de plus de groupes.

  4. Cliquez sur Terminé pour enregistrer vos modifications.

Autres articles de cette section

Merci de vos commentaires ! Erreur lors de la soumission de votre commentaire. Réessayez ou envoyez-nous un message.