Utiliser les rôles de données pour valider vos données

Remarque : les propriétaires de sources de données et les administrateurs Tableau peuvent ajouter des synonymes de noms et de valeurs de champs de données spécifiques pour Parlez aux données. Pour plus d’informations sur l’utilisation des rôles de données pour Parlez aux données, consultez Ajouter des synonymes pour la fonctionnalité « Parlez aux données »(Le lien s’ouvre dans une nouvelle fenêtre) dans l’aide de Tableau Desktop.

Remarque : La fonctionnalité Parlez aux données de Tableau sera supprimée de Tableau Cloud février 2024 et de Tableau Server version 2024.2.

Utilisez les rôles de données pour identifier rapidement si les valeurs d’un champ sont valides ou non. Tableau Prep fournit un ensemble standard de rôles de données parmi lesquels vous pouvez faire votre choix. Vous pouvez autrement créer vos propres rôles à l’aide de valeurs de champ uniques dans votre ensemble de données.

Lorsque vous affectez un rôle de données, Tableau Prep compare les valeurs standard définies pour le rôle de données aux valeurs de votre champ. Toutes les valeurs qui ne correspondent pas sont marquées d’un point d’exclamation rouge. Vous pouvez filtrer votre champ de manière à ne voir que les valeurs valides ou non valides et prendre les mesures appropriées pour les corriger. Une fois que vous avez attribué un rôle de données à vos champs, vous pouvez utiliser l’option Regrouper les valeurs pour regrouper et associer des valeurs non valides à des valeurs valides en fonction de l’orthographe et de la prononciation.

Remarque : depuis la version 2020.4.1, vous pouvez désormais créer et modifier des flux dans Tableau Server et Tableau Cloud. Le contenu de cette rubrique s’applique à toutes les plates-formes, sauf mention spécifique. Pour plus d’informations sur la création de flux sur le Web, consultez Tableau Prep sur le Web(Le lien s’ouvre dans une nouvelle fenêtre) dans l’aide de Tableau Server.

Attribuer des rôles de données standard à vos données

Attribuez les rôles de données fournis par Tableau Prep à votre champ de la même manière que vous affectez un type de données. Le rôle de données identifie ce que vos valeurs de données représentent si bien que Tableau Prep peut automatiquement valider les valeurs et mettre en surbrillance celles qui ne sont pas valides pour ce rôle.

Par exemple, si vous avez des valeurs de champ pour des données géographiques, vous pouvez attribuer un rôle de données Ville. Tableau Prep compare alors les valeurs de champ à un ensemble de valeurs de domaine connues pour identifier les valeurs qui ne correspondent pas.

Remarque : chaque champ est analysé indépendamment si bien qu’une valeur de Ville « Portland » dans l’État « Washington » du pays « États-Unis » peut ne pas être une combinaison valide de ville et d’État, mais elle ne sera pas identifiée comme telle parce qu’il s’agit d’un nom de ville valide.

Tableau Prep Builder prend en charge les rôles de données suivants :

  • Courriel

  • URL

  • Rôles géographiques (basés sur des données géographiques actuelles et identiques aux données utilisées par Tableau Desktop)

    • Aéroport
    • Indicatif régional (É.-U.)
    • CBSA/MSA
    • Ville
    • Circonscription (É.-U.)
    • Pays/région
    • Comté
    • NUTS Europe
    • État/province
    • Code postal

Conseil : dans Tableau Prep Builder version 2019.1.4 et sur le Web, si vous affectez un rôle géographique à un champ, vous pouvez également utiliser ce rôle de données pour associer et regrouper les valeurs avec la valeur standard définie par votre rôle de données. Pour plus d’informations sur le regroupement de valeurs à l’aide de rôles de données, consultez Nettoyer et organiser les données(Le lien s’ouvre dans une nouvelle fenêtre).

Pour attribuer un rôle de données à un champ, procédez comme suit :

  1. Dans le volet Profil, le volet Résultats ou la grille de données, cliquez sur le type de données pour le champ.

  2. Sélectionnez le rôle de données pour le champ.

    Tableau Prep compare les valeurs de données du champ aux valeurs de domaine ou modèles connus (pour le courriel ou l’URL) pour le rôle de données que vous sélectionnez et utilise un point d’exclamation rouge pour marquer toutes les valeurs qui ne correspondent pas.

  3. Cliquez sur la flèche déroulante pour le champ et dans la section Afficher les valeurs, sélectionnez une option pour afficher toutes les valeurs ou uniquement les valeurs qui sont valides ou non valides pour le rôle de données.

  4. Utilisez les options de nettoyage dans le menu Options supplémentairespour corriger les valeurs de champ qui ne sont pas valides. Pour plus d’informations sur le nettoyage de vos valeurs de champs, consultez À propos des opérations de nettoyage(Le lien s’ouvre dans une nouvelle fenêtre).

Créer des rôles de données personnalisés

Important : Les rôles de données personnalisés seront supprimés dans Tableau Cloud en février 2024 et dans la version 2024.2 de Tableau Server.

Depuis Tableau Prep Builder version 2019.3.1 et sur le Web, vous pouvez créer vos propres rôles de données personnalisés à l’aide des valeurs de champ de vos ensembles de données. Vous créez alors un ensemble standard de valeurs que vous-même ou d’autres personnes pouvez utiliser pour valider vos valeurs de champ lors du nettoyage des données. Sélectionnez le champ que vous souhaitez utiliser, appliquez des opérations de nettoyage si nécessaire, puis publiez-le sur Tableau Server ou Tableau Cloud pour l’utiliser dans votre flux ou partager vos rôles de données avec d’autres utilisateurs.

Si vous créez des rôles de données personnalisés lors de la modification de flux sur le Web, vous pouvez publier le rôle de données personnalisé directement sur le serveur auquel vous êtes connecté.

Exigences

  • Vous pouvez créer des rôles de données personnalisés à partir de champs individuels dans votre ensemble de données. La création de rôles de données personnalisés à partir d’une combinaison de champs n’est pas prise en charge.
  • La publication de rôles de données dans des projets avec des autorisations verrouillées n’est pas prise en charge.
  • Vous pouvez créer des rôles de données personnalisés uniquement pour les champs affectés à un type de données Chaîne et Nombre (entier).
  • Lorsque vous créez un rôle de données personnalisé, Tableau Prep crée, dans votre flux, une étape de sortie spécifique à la publication du rôle de données.
  • La publication de rôles de données personnalisés sur plusieurs sites dans le même flux n’est pas prise en charge. Si vous publiez le flux, vous devez publier le rôle de données personnalisé sur le même site ou serveur sur lequel le flux est publié.
  • Les rôles de données personnalisés sont spécifiques au site, au serveur et au projet où vous les publiez. Tous les utilisateurs ayant des autorisations sur l’emplacement peuvent utiliser le rôle de données personnalisé, mais doivent être connectés au site ou au serveur pour le sélectionner ou l’appliquer. Les rôles de données personnalisés reçoivent l’autorisation par défaut pour le groupe Tous les utilisateurs pour les nouveaux projets au lieu de l’autorisation Aucune.
  • Les rôles de données personnalisés ne sont pas spécifiques à une version. Lors de l’application d’un rôle de données personnalisé, la version la plus récente est appliquée.
  • Après la publication sur Tableau Server ou Tableau Cloud, l’utilisateur ayant accès au site, au serveur et au projet peut visualiser tous les rôles de données dans cet emplacement.
  • Pour modifier un rôle de données, vous devez effectuer vos modifications dans ou Tableau Prep Builder dans le flux sur le Web, puis republier le rôle de données en utilisant le même nom pour le remplacer. Ce processus est similaire à la modification d’une source de données publiée.

Créer un rôle de données personnalisé

  1. Dans le volet Profil, dans la grille de données ou dans le volet Résultats, sélectionnez le champ que vous souhaitez utiliser pour créer un rôle de données personnalisé.

  2. Cliquez sur Options supplémentaires pour le champ et sélectionnez Publier en tant que rôle de données.

  3. Sélectionnez le serveur ou le projet où vous souhaitez publier le rôle de données.

  4. Cliquez sur Exécuter le flux pour créer le rôle de données. Une fois le processus de publication terminé avec succès, vous pouvez afficher votre rôle de données dans Tableau Server ou Tableau Cloud. Le traitement du rôle de données peut prendre un certain temps en fonction de la charge pesant sur votre site Tableau Server ou Tableau Cloud. Si votre rôle de données n’est pas disponible immédiatement, attendez quelques minutes, puis essayez de le sélectionner à nouveau.

Appliquer un rôle de données personnalisé

  1. Dans le volet Profil, le volet Résultats ou la grille de données, cliquez sur le rôle de données pour le champ auquel vous souhaitez appliquer le rôle de données personnalisé.

  2. Sélectionnez Personnalisé, puis sélectionnez le rôle de données que vous souhaitez appliquer au champ.

    Important : dans Tableau Prep Builder, assurez-vous d’être connecté au site ou au serveur où le rôle de données a été publié, sinon vous ne verrez pas cette option.

    Tableau Prep compare les valeurs de données du champ aux valeurs de domaine connues du rôle de données que vous sélectionnez et marque les valeurs qui ne correspondent pas à un point d’exclamation rouge.

  3. Cliquez sur la flèche déroulante pour le champ et dans la section Afficher les valeurs, sélectionnez une option pour afficher toutes les valeurs ou uniquement les valeurs qui sont valides ou non valides pour le rôle de données.

  4. Utilisez les options de nettoyage dans le menu Options supplémentairespour corriger les valeurs de champ qui ne sont pas valides. Pour plus d’informations sur le nettoyage de vos valeurs de champs, consultez À propos des opérations de nettoyage(Le lien s’ouvre dans une nouvelle fenêtre).

Afficher et gérer des rôles de données personnalisés

Vous pouvez afficher et gérer vos rôles de données personnalisés publiés sur Tableau Server et Tableau Cloud. Vous pouvez afficher tous les rôles de données personnalisés publiés sur votre site ou votre serveur. Cliquez sur Plus d’actions pour un rôle de données sélectionné afin de le déplacer vers un autre projet, modifier les autorisations ou le supprimer.

Regrouper des valeurs similaires par rôle de données

Remarque : dans Tableau Prep Builder versions 2019.1.4 et 2019.2.1, cette option était étiquetée Correspondances des rôles de données.

Si vous affectez un rôle de données géographiques à une rubrique, vous pouvez utiliser les valeurs du rôle de données pour regrouper et associer les valeurs de votre champ en fonction de l’orthographe et de la prononciation afin de les normaliser. Vous pouvez utiliser Orthographe ou Orthographe et prononciation pour regrouper et associer les valeurs non valides aux valeurs valides.

Ces options utilisent la valeur standard définie par le rôle de données. Si la valeur standard ne se trouve pas dans votre exemple d’ensemble de données, Tableau Prep l’ajoute automatiquement et marque la valeur comme n’appartenant pas à l’ensemble de données d’origine. Pour plus d’informations sur l’attribution de rôles de données à des champs, consultez Attribuer des rôles de données standard à vos données.

Si vous souhaitez utiliser des rôles de données pour regrouper des valeurs, procédez comme suit.

  1. Dans le volet Profil, le volet Résultats ou la grille de données, cliquez sur le type de données pour le champ.

  2. Sélectionnez l’un des rôles de données suivants pour le champ :

    • Aéroport
    • Ville
    • Pays/région
    • Comté
    • État/province

    Depuis Tableau Prep Builder version 2019.3.2 et sur le Web, vous pouvez également choisir parmi vos rôles de données personnalisés.

    Rôles de données type (version 2019.1.4 et versions ultérieures)Rôles de données personnalisés (version 2019.3.2 et versions ultérieures)

    Tableau Prep compare les valeurs de données du champ aux valeurs de domaine connues du rôle de données que vous sélectionnez et marque les valeurs qui ne correspondent pas à un point d’exclamation rouge.

  3. Cliquez sur Options supplémentaires, sélectionnez Regrouper les valeurs (Regrouper et remplacer dans les versions précédentes), puis sélectionnez l’une des options suivantes :

    • Orthographe : fait correspondre les valeurs invalides aux valeurs valides les plus proches qui diffèrent par l’ajout, la suppression ou la substitution de caractères.
    • Prononciation et orthographe : fait correspondre les valeurs non valides à la valeur valide la plus similaire en fonction de l’orthographe et de la prononciation.

    Vous pouvez également cliquer sur l’icône Recommandationsdans le champ pour appliquer la recommandation au groupe et remplacer les valeurs non valides par des valeurs valides. Cette option utilise l’option Prononciation + Orthographe dans Regrouper les valeurs.

    Tableau Prep compare les valeurs par orthographe ou orthographe et prononciation, puis regroupe les valeurs similaires sous la valeur normalisée pour le rôle de données. Si la valeur standardisée ne figure pas dans votre ensemble de données, elle est ajoutée et marquée avec un point rouge.

Merci de vos commentaires!Votre commentaire s été envoyé avec succès. Merci!