Modélisation prédictive avec des repères générés

Si vous utilisez Tableau depuis un certain temps, vous avez peut-être entendu parler de l’expression « densification des données ». Il s’agit d’un processus selon lequel les repères sont générés par Tableau et ajoutés à la vue, même s’ils repères ne sont pas pris en charge par des enregistrements dans la source de données sous-jacentes. Vous pouvez utiliser ce processus pour étendre un axe de date, ou, si vous travaillez avec des fonctions de modélisation prédictive, pour afficher les prédictions.

Visionnez une vidéo : pour une discussion approfondie sur la densification des données, consultez cette présentation de TC19 : Qu’avez-vous fait à vos données ? Une exploration de l’imputation et de la densification des données.

Pour en savoir plus : consultez ce billet de blog consacré à la densification des données par Data Plus Science.

Calculer des prédictions sur des valeurs manquantes

Vous pouvez par exemple souhaiter ajouter des prédictions pour des dates futures. Par défaut, les valeurs manquantes dans Tableau ne s’affichent pas, mais vous pouvez générer ces repères comme suit :

  1. Faites un clic droit (Ctrl+clic sur Mac) sur l’en-tête de date ou de classe.

  2. Sélectionnez Afficher les valeurs manquantes.

    Menu contextuel en pile avec sélection de l'option Afficher les valeurs manquantes

  3. Ce n’est toutefois pas suffisant pour réaliser des prédictions sur ces repères générés. Si vous essayiez d’effectuer un calcul sur ces repères (qu’il s’agisse d’un calcul de prédiction ou non), Tableau retournerait des valeurs null. Ce comportement est attendu puisque ces repères sont basés sur des valeurs manquantes qui n’existent pas.

    Pour faire des prédictions sur ces valeurs manquantes, ouvrez le menu Analyse en haut, puis sélectionnez Déduire les propriétés des valeurs manquantes.

    Menu Analyse avec sélection de l’option Déduire les propriétés des valeurs manquantes

    Remarque : par défaut, l'option Déduire les propriétés des valeurs manquantes est désactivée, même lorsque l’option Afficher les valeurs manquantes est activée. Vous pouvez appliquer ce paramètre à tout champ ou axe pouvant être étendu à l’aide de l'option Afficher les valeurs manquantes.

Exemple de prédictions sur les repères générés

Explorons maintenant ce comportement de plus près. Nous allons comparer trois illustrations différentes montrant comment les paramètres Afficher les valeurs manquantes et Déduire les propriétés des valeurs manquantes peuvent affecter votre visualisation, selon que l’un ou les deux paramètres sont activés ou désactivés. Pour suivre, téléchargez le classeur suivant depuis Tableau Public : Predictions on Missing Values (Prédictions sur les valeurs manquantes).

Nous avons inclus des prédictions utilisant ATTR(DAY([Order Date])) comme prédicteur. Ce n’est pas le meilleur prédicteur pour les données (il renvoie des prédictions inadéquates), mais pour les besoins de cet article, il illustre bien l'option Déduire les propriétés des valeurs manquantes.

Chaque visualisation comprend les quatre mêmes mesures sur l’étagère Lignes, comme indiqué ci-dessous:

  • Ligne 1 : SUM([Profit])
  • Ligne 2 : RUNNING_SUM(SUM([Profit]))
  • Ligne 3 : ATTR(DAY([Order Date]))
  • Ligne 4 : MODEL_QUANTILE(0.5, SUM([Profit]),ATTR(DAY([Order Date])))

Illustration 1

Illustration 1

Dans l’image ci-dessus, les deux paramètres Afficher les valeurs manquantes et Déduire les propriétés des valeurs manquantes, qui sont les paramètres par défaut dans Tableau, sont désactivés.

Vous verriez la même visualisation si Déduire les propriétés des valeurs manquantes était activé et que Afficher les valeurs manquantes était désactivé. En effet, Déduire les propriétés des valeurs manquantes dépend de l’activation de l’option Afficher les valeurs manquantes.

Illustration 2

Illustration 2

Dans l’image ci-dessus, Afficher les valeurs manquantes est activé et Déduire les propriétés des valeurs manquantes est désactivé. Par défaut, le paramètre Déduire les propriétés des valeurs manquantes est désactivé, même lorsque Afficher les valeurs manquantes est activé.

Notez que dans cette situation, nous ne calculons pas une valeur pour ATTR sur DAY([Order Date]) pour les valeurs manquantes (ligne 3). Nous générons une prédiction pour les dates densifiées, mais elles sont identiques pour toutes les dates manquantes, puisque nous ne sommes pas en mesure de déduire la valeur ATTR(DAY([Order Date]) réelle, comme indiqué dans la ligne 3. En fait, ces repères sont calculés comme si DAY([Order Date]) était nul.

Illustration 3

Illustration 3

Dans cette image, les deux propriétés Afficher les valeurs manquantes et Déduire les propriétés des valeurs manquantes sont activées, illustrant le paramètre Déduire les propriétés des valeurs manquantes en action.

Comme vous pouvez le voir, puisque nous sommes en mesure de déduire ATTR(DAY([Order Date])) (ligne 3), nous pouvons l’utiliser dans les prédictions dans la ligne 4, en renvoyant une belle courbe lisse de prédictions.

Merci de vos commentaires !