Utiliser les types de données pour valider vos données

Remarque : les propriétaires de sources de données et les administrateurs Tableau peuvent ajouter des synonymes de noms et de valeurs de champs de données spécifiques pour Parlez aux données. Pour plus d’informations sur l’utilisation des types de données pour Parlez aux données, consultez Ajouter des synonymes pour la fonctionnalité « Parlez aux données »(Le lien s’ouvre dans une nouvelle fenêtre) dans l’aide de Tableau Desktop.

Utilisez les types de données pour identifier rapidement si les valeurs d'un champ sont valides ou non. Tableau Prep fournit un ensemble standard de types de données parmi lesquels vous pouvez faire votre choix. Vous pouvez sinon créer vos propres types à l'aide de valeurs de champ uniques dans votre ensemble de données.

Lorsque vous affectez un type de données, Tableau Prep compare les valeurs standard définies pour le type de données aux valeurs de votre champ. Toutes les valeurs qui ne correspondent pas sont marquées d'un point d'exclamation rouge. Vous pouvez filtrer votre champ de manière à ne voir que les valeurs valides ou non valides et prendre les mesures appropriées pour les corriger. Une fois que vous avez attribué un type de données à vos champs, vous pouvez utiliser l'option Regrouper les valeurs pour regrouper et associer des valeurs non valides à des valeurs valides en fonction de l'orthographe et de la prononciation.

Remarque : depuis la version 2020.4.1, vous pouvez désormais créer et modifier des flux dans Tableau Server et Tableau Online. Le contenu de cette rubrique s’applique à toutes les plates-formes, sauf mention spécifique. Pour plus d’informations sur la création de flux sur le Web, consultez Tableau Prep sur le Web(Le lien s’ouvre dans une nouvelle fenêtre) dans l’aide de Tableau Server.

Attribuer des types de données standard à vos données

Attribuez les types de données fournis par Tableau Prep à votre champ de la même manière que vous affectez un type de données. Le type de données identifie ce que vos valeurs de données représentent si bien que Tableau Prep peut automatiquement valider les valeurs et surligner celles qui ne sont pas valides pour ce type.

Par exemple, si vous avez des valeurs de champ pour des données géographiques, vous pouvez attribuer un type de données Ville. Tableau Prep compare alors les valeurs de champ à un ensemble de valeurs de domaine connues pour identifier les valeurs qui ne correspondent pas.

Remarque : chaque champ est analysé indépendamment si bien qu'une valeur de Ville « Portland » dans l'État « Washington » du pays « États-Unis » peut ne pas être une combinaison valide de ville et d'État, mais elle ne sera pas identifiée comme telle parce qu'il s'agit d'un nom de ville valide.

Tableau Prep Builder prend en charge les types de données suivants :

  • E-mail

  • URL

  • Rôles géographiques (basés sur des données géographiques actuelles et identiques aux données utilisées par Tableau Desktop)

    • Aéroport
    • Indicatif régional (É.-U.)
    • CBSA/MSA
    • Ville
    • Circonscription (É.-U.)
    • Pays/région
    • Comté
    • NUTS Europe
    • État/province
    • Code postal

Conseil : dans Tableau Prep Builder depuis la version 2019.1.4 et sur le Web, si vous affectez un rôle géographique à un champ, vous pouvez également utiliser ce type de données pour associer et regrouper les valeurs avec la valeur standard définie par votre type de données. Pour plus d'informations sur le regroupement de valeurs à l'aide de types de données, consultez Nettoyer et organiser les données(Le lien s’ouvre dans une nouvelle fenêtre).

Pour attribuer un type de données à un champ, procédez comme suit :

  1. Dans le volet Profil, le volet Résultats ou la grille de données, cliquez sur le type de données pour le champ.

  2. Sélectionnez le type de données pour le champ.

    Tableau Prep compare les valeurs de données du champ aux valeurs de domaine ou modèles connus (pour l'e-mail ou l'URL) pour le type de données que vous sélectionnez et utilise un point d'exclamation rouge pour marquer toutes les valeurs qui ne correspondent pas.

  3. Cliquez sur la flèche déroulante pour le champ et dans la section Afficher les valeurs, sélectionnez une option pour afficher toutes les valeurs ou uniquement les valeurs qui sont valides ou non valides pour le type de données.

  4. Utilisez les options de nettoyage dans le menu Options supplémentairespour corriger les valeurs de champ qui ne sont pas valides. Pour plus d'informations sur le nettoyage de vos valeurs de champs, consultez À propos des opérations de nettoyage(Le lien s’ouvre dans une nouvelle fenêtre).

Créer des types de données personnalisés

Depuis Tableau Prep Builder version 2019.3.1 et sur le Web, vous pouvez créer vos propres types de données personnalisés à l'aide des valeurs de champ de vos ensembles de données. Vous créez alors un ensemble standard de valeurs que vous-même ou d'autres personnes pouvez utiliser pour valider vos valeurs de champ lors du nettoyage des données. Sélectionnez le champ que vous souhaitez utiliser, appliquez des opérations de nettoyage si nécessaire, puis publiez-le sur Tableau Server ou Tableau Online pour l'utiliser dans votre flux ou partager vos types de données avec d'autres utilisateurs.

Si vous créez des types de données personnalisés lors de la modification de flux sur le Web, vous pouvez publier le type de données personnalisé directement sur le serveur auquel vous êtes connecté.

Exigences

  • Vous pouvez créer des types de données personnalisés à partir de champs individuels dans votre ensemble de données. La création de types de données personnalisés à partir d'une combinaison de champs n'est pas prise en charge.
  • Vous pouvez créer des types de données personnalisés uniquement pour les champs affectés à un type de données Chaîne et Nombre (entier).
  • Lorsque vous créez un type de données personnalisé, Tableau Prep crée, dans votre flux, une étape de sortie spécifique à la publication du type de données.
  • La publication de types de données personnalisés sur plusieurs sites dans le même flux n'est pas prise en charge. Si vous publiez le flux, vous devez publier le type de données personnalisé sur le même site ou serveur sur lequel le flux est publié.
  • Les types de données personnalisés sont spécifiques au site, au serveur et au projet où vous les publiez. Tous les utilisateurs ayant des autorisations sur l'emplacement peuvent utiliser le type de données personnalisé, mais doivent être connectés au site ou au serveur pour le sélectionner ou l'appliquer. Les types de données personnalisés reçoivent l'autorisation par défaut pour le groupe Tous les utilisateurs pour les nouveaux projets au lieu de l’autorisation Aucune.
  • Les types de données personnalisés ne sont pas spécifiques à une version. Lors de l'application d'un type de données personnalisé, la version la plus récente est appliquée.
  • Après la publication sur Tableau Server ou Tableau Online, l'utilisateur ayant accès au site, au serveur et au projet peut visualiser tous les types de données dans cet emplacement.
  • Pour modifier un type de données, vous devez effectuer vos modifications dans ou Tableau Prep Builder dans le flux sur le Web, puis republier le type de données en utilisant le même nom pour le remplacer. Ce processus est similaire à la modification d’une source de données publiée.

Créer un type de données personnalisé

  1. Dans le volet Profil, dans la grille de données ou dans le volet Résultats, sélectionnez le champ que vous souhaitez utiliser pour créer un type de données personnalisé.

  2. Cliquez sur Options supplémentaires pour le champ et sélectionnez Publier en tant que type de données.

  3. Sélectionnez le serveur ou le projet où vous souhaitez publier le flux.

  4. Cliquez sur Exécuter le flux pour créer le type de données. Une fois le processus de publication terminé avec succès, vous pouvez afficher votre type de données dans Tableau Server ou Tableau Online. Le traitement du type des données peut prendre un certain temps en fonction de la charge pesant sur votre site Tableau Server ou Tableau Online. Si votre type de données n'est pas disponible immédiatement, attendez quelques minutes, puis essayez de le sélectionner à nouveau.

Appliquer un type de données personnalisé

  1. Dans le volet Profil, le volet Résultats ou la grille de données, cliquez sur le type de données pour le champ auquel vous souhaitez appliquer le type de données personnalisé.

  2. Sélectionnez Personnalisé, puis sélectionnez le type de données que vous souhaitez appliquer au champ.

    Important : dans Tableau Prep Builder, assurez-vous d'être connecté au site ou au serveur où le type de données a été publié, sinon vous ne verrez pas cette option.

    Tableau Prep compare les valeurs de données du champ aux valeurs de domaine connues du type de données que vous sélectionnez et marque les valeurs qui ne correspondent pas à un point d’exclamation rouge.

  3. Cliquez sur la flèche déroulante pour le champ et dans la section Afficher les valeurs, sélectionnez une option pour afficher toutes les valeurs ou uniquement les valeurs qui sont valides ou non valides pour le type de données.

  4. Utilisez les options de nettoyage dans le menu Options supplémentairespour corriger les valeurs de champ qui ne sont pas valides. Pour plus d'informations sur le nettoyage de vos valeurs de champs, consultez À propos des opérations de nettoyage(Le lien s’ouvre dans une nouvelle fenêtre).

Afficher et gérer des types de données personnalisés

Vous pouvez afficher et gérer vos types de données personnalisés publiés sur Tableau Server et Tableau Online. Vous pouvez afficher tous les types de données personnalisés publiés sur votre site ou votre serveur. Cliquez sur Plus d'actions pour un type de données sélectionné afin de le déplacer vers un autre projet, modifier les autorisations ou le supprimer.

Regrouper des valeurs similaires par type de données

Remarque : dans Tableau Prep Builder versions 2019.1.4 et 2019.2.1, cette option était appelée Correspondances des types de données.

Si vous affectez un type de données géographiques à une rubrique, vous pouvez utiliser les valeurs du type de données pour regrouper et associer les valeurs de votre champ en fonction de l’orthographe et de la prononciation afin de les normaliser. Vous pouvez utiliser Orthographe ou Orthographe et prononciation pour regrouper et associer les valeurs non valides aux valeurs valides.

Ces options utilisent la valeur standard définie par le type de données. Si la valeur standard ne se trouve pas dans votre exemple d'ensemble de données, Tableau Prep l'ajoute automatiquement et marque la valeur comme n'appartenant pas à l'ensemble de données d'origine. Pour plus d’informations sur l’attribution de types de données à des champs, consultez Attribuer des types de données standard à vos données.

Si vous souhaitez utiliser des types de données pour regrouper des valeurs, procédez comme suit.

  1. Dans le volet Profil, le volet Résultats ou la grille de données, cliquez sur le type de données pour le champ.

  2. Sélectionnez l’un des types de données suivants pour le champ :

    • Aéroport
    • Ville
    • Pays/région
    • Comté
    • État/province

    Depuis Tableau Prep Builder version 2019.3.2 et sur le Web, vous pouvez également choisir parmi vos types de données personnalisés.

    Types de données standard (version 2019.1.4 et ultérieur) Types de données personnalisés (version 2019.3.2 et ultérieur)

    Tableau Prep compare les valeurs de données du champ aux valeurs de domaine connues du type de données que vous sélectionnez et marque les valeurs qui ne correspondent pas à un point d’exclamation rouge.

  3. Cliquez sur Options supplémentaires, sélectionnez Regrouper les valeurs (Regrouper et remplacer dans les versions précédentes), puis sélectionnez l'une des options suivantes :

    • Orthographe : fait correspondre les valeurs invalides aux valeurs valides les plus proches qui diffèrent par l’ajout, la suppression ou la substitution de caractères.
    • Prononciation et orthographe : fait correspondre les valeurs non valides à la valeur valide la plus similaire en fonction de l’orthographe et de la prononciation.

    Vous pouvez également cliquer sur l'icône Recommandationsdans le champ pour appliquer la recommandation au groupe et remplacer les valeurs non valides par des valeurs valides. Cette option utilise l'option Prononciation + Orthographe dans Regrouper les valeurs.

    Tableau Prep compare les valeurs par orthographe ou orthographe et prononciation, puis regroupe les valeurs similaires sous la valeur normalisée pour le type de données. Si la valeur standardisée ne figure pas dans votre ensemble de données, elle est ajoutée et marquée avec un point rouge.

Merci de vos commentaires !