Types d’explication dans Explique-moi les données

Chaque fois que vous sélectionnez un nouveau repère dans une visualisation ou un tableau de bord et que vous exécutez Explique-moi les données, Tableau exécute une nouvelle analyse statistique en prenant en compte ce repère et les données sous-jacentes du classeur. Les explications possibles sont affichées dans des sections que vous pouvez développer dans le volet du Guide des données. Pour plus d’informations sur la façon dont Explique-moi les données analyse et évalue les explications, consultez Comment fonctionne Explique-moi les données .

Explorer les valeurs sous-jacentes

Cette section répertorie les explications de chaque mesure pouvant être expliquée (appelée mesures cibles). Chaque explication répertoriée ici décrit une relation avec les valeurs de la mesure cible qui sont testées sur le repère analysé. Appuyez-vous sur votre compréhension pratique et votre expérience concrète des données pour déterminer si les relations trouvées par Explique-moi les données sont pertinentes et méritent d’être explorées.

Dans cet exemple, la distance parcourue est la mesure cible.

Caractéristiques sous-jacentes

Ces explications décrivent comment les enregistrements sous-jacents des repères dans la vue peuvent contribuer à la valeur agrégée de la mesure expliquée. Les attributs de repère peuvent inclure des Valeurs extrêmes, des Valeurs null, le Nombre d’enregistrements ou la Valeur moyenne du repère.

Remarque : pour les définitions des termes courants utilisés dans les explications, voir Termes et concepts dans les explications(Le lien s’ouvre dans une nouvelle fenêtre) .

Valeurs extrêmes

Ce type d’explication indique si un ou plusieurs enregistrements ont des valeurs significativement supérieures ou inférieures à la plupart des enregistrements. Si l’explication est soutenue par un modèle, cela indique que la valeur extrême affecte la mesure cible du repère analysé.

Lorsqu’un repère contient des valeurs extrêmes, cela ne signifie pas automatiquement qu’il s’agit de valeurs atypiques ou que vous devriez l’exclure de la vue. Ce choix dépend de votre analyse. L’explication souligne simplement une valeur extrême dans le repère. Par exemple, elle pourrait révéler une valeur erronée dans un enregistrement où une banane coûte 10 dollars au lieu de 10 cents. Ou encore, elle pourrait révéler qu’un vendeur en particulier a eu un excellent trimestre.

Remarque : cette explication doit être activée par l’auteur pour être visible en mode d’affichage pour un classeur publié. Pour plus d’informations, consultez Contrôler l’accès à Explique-moi les données.

Cette explication montre :

  • Le nombre d’enregistrements sous-jacents dans le repère analysé.
  • La ou les valeurs extrêmes contribuant à la valeur de la mesure cible.
  • La distribution des valeurs dans le repère.
  • Les détails de l’enregistrement correspondant à chaque valeur de distribution.

Possibilités d’exploration :

  • Survolez un cercle dans le graphique pour voir sa valeur correspondante.
  • Sélectionnez la flèche gauche ou droite sous la liste des détails pour faire défiler les détails de l’enregistrement.
  • Le cas échéant, cliquez sur Afficher les données complètes, puis sur l’onglet Données complètes pour afficher tous les enregistrements d’une table.
  • Sélectionnez l’icône Ouvrir pour voir une version plus grande de la visualisation.

Prochaines étapes d’analyse :

  • Si le nombre d’enregistrements est faible, comparez ces valeurs à la valeur extrême.
  • Si la valeur extrême est nettement supérieure ou inférieure aux autres valeurs d’enregistrement, excluez-la et réfléchissez à la façon dont elle modifie la valeur du repère analysé.
  • Lorsque vous examinez les données avec et sans la valeur extrême, profitez-en pour appliquer vos connaissances pratiques sur les données.

 

Dans cet exemple, une seule valeur extrême de 463 heures de location contribue à la somme plus élevée que prévu du temps total de location de 613 heures.

Le fait qu’une personne ait oublié de raccrocher le vélo lorsqu’elle l’a rendu pourrait expliquer cette valeur élevée. Dans ce cas, l’auteur peut souhaiter exclure cette valeur pour une analyse future.

 

Visualiser la différence

Cette section montre :

  • Comment la valeur du repère analysé change en cas d’exclusion de la valeur extrême.

 

 

 

 

 

 

 

Possibilités d’exploration :

  • Sélectionnez l’icône Ouvrir pour voir une version plus grande de la visualisation.
  • Explorez la différence avec et sans la ou les valeurs extrêmes.
  • Les auteurs peuvent ouvrir la vue en tant que nouvelle feuille et appliquer un filtre pour exclure la valeur extrême.

Prochaines étapes d’analyse :

  • Si la valeur extrême est nettement supérieure ou inférieure aux autres valeurs d’enregistrement, excluez-la et voyez comment elle modifie la valeur du repère analysé.
  • Lorsque vous examinez les données avec et sans valeur extrême, profitez-en pour appliquer vos connaissances pratiques sur les données.
 

Dans cet exemple, lorsque la valeur extrême de 483 est exclue, le repère analysé cesse d’être élevé par rapport aux autres repères de la vue. D’autres repères se distinguent désormais. L’auteur pourrait vouloir explorer les autres repères pour déterminer pourquoi ces autres emplacements affichent davantage d’heures de location de vélos.

Valeurs null

Le type d’explication Valeurs null signale les situations où il y a une quantité plus importante que prévu de données manquantes dans un repère. Il indique la fraction des valeurs de mesures cible qui sont null et comment les valeurs null peuvent contribuer à la valeur agrégée de cette mesure.

Cette explication montre :

  • Le pourcentage de valeurs null dans la mesure cible pour le repère analysé (cercle bleu).

Possibilités d’exploration :

  • Survolez chaque cercle du nuage de points pour voir ses détails.
  • Faites défiler pour mieux voir le graphique.
  • Sélectionnez l’icône Ouvrir pour voir une version plus grande de la visualisation.

Prochaines étapes d’analyse :

  • Excluez éventuellement les valeurs null du repère pour une analyse plus approfondie.
 

Dans cet exemple, le pourcentage de valeurs null dans la mesure cible est affiché sous la forme d’un cercle bleu.

Nombre d’enregistrements

Ce type d’explication décrit dans quel cas le nombre d’enregistrements sous-jacents est corrélé à la somme. L’analyse a trouvé une relation entre le nombre d’enregistrements agrégés dans un repère et la valeur réelle du repère.

Bien que cela puisse sembler évident, ce type d’explication vous aide à déterminer si la valeur du repère est affectée par l’ampleur des valeurs de ses enregistrements ou simplement en raison du nombre d’enregistrements dans le repère analysé.

Cette explication montre :

  • Le nombre d’enregistrements dans la mesure cible pour le repère analysé (barre bleu foncé).
  • Le nombre d’enregistrements dans la mesure cible pour les autres repères dans la visualisation source (barre bleu clair).

Possibilités d’exploration :

  • Survolez chaque barre pour voir ses détails.
  • Faites défiler pour mieux voir le graphique.
  • Sélectionnez l’icône Ouvrir pour voir une version plus grande de la visualisation.

Prochaines étapes d’analyse :

  • Comparez si les valeurs individuelles des enregistrements sont faibles ou élevées, ou si le nombre d’enregistrements dans le repère analysé est faible ou élevé.
  • Les auteurs, s’ils sont surpris par un nombre élevé d’enregistrements, devraient peut-être normaliser les données.
 

Dans cet exemple, le nombre d’enregistrements pour la distance parcourue et est répertorié pour chaque valeur de mois d’utilisation, qui est une dimension dans la visualisation d’origine. Août affiche la valeur de distance parcourue totale la plus élevée.

Vous pouvez déterminer si le mois d’août affiche la valeur la plus élevée pour la distance parcourue parce que davantage de trajets ont eu lieu en août, ou si la distance parcourue est plus élevée parce que certains trajets étaient plus longs.

Valeur moyenne du repère

Ce type d’explication décrit dans quels cas la moyenne d’une mesure est corrélée à la somme. Comparez si la valeur moyenne est faible ou élevée, ou si le nombre d’enregistrements est faible ou élevé.

Cette explication montre :

  • La moyenne de la mesure cible pour chaque valeur d’une dimension utilisée dans la visualisation source.

Possibilités d’exploration :

  • Survolez chaque barre pour voir ses détails.
  • Faites défiler pour mieux voir le graphique.
  • Sélectionnez l’icône Ouvrir pour voir une version plus grande de la visualisation.

Prochaines étapes d’analyse :

  • Comparez si la valeur moyenne est faible ou élevée, ou si le nombre d’enregistrements est faible ou élevé. Par exemple, les bénéfices sont-ils élevés parce que vous avez vendu beaucoup d’articles ou parce que vous avez vendu des articles chers ?
  • Essayez de comprendre pourquoi le repère analysé a une valeur moyenne nettement supérieure ou inférieure.

 

 

Dans cet exemple, la distance parcourue moyenne pour le mois d’août n’est pas nettement supérieure ou inférieure à celle de la plupart des mois. Cela suggère que la distance parcourue est plus élevée pour le mois d’août parce qu’il y a eu plus de trajets en août, plutôt que des personnes effectuant des trajets plus longs.

 

Valeur unique ayant un impact

Utilisez cette explication pour comprendre la composition des valeurs d’enregistrement qui constituent le repère analysé.

Ce type d’explication identifie lorsqu’une valeur unique dans une dimension non visualisée peut contribuer à la valeur agrégée du repère analysé. Une dimension non visualisée est une dimension qui existe dans la source de données, mais qui n’est pas utilisée dans la vue actuellement.

Cette explication indique quand chaque enregistrement sous-jacent d’une dimension a la même valeur, ou quand une valeur de dimension se distingue parce qu’un grand nombre ou un petit nombre d’enregistrements ont la même valeur unique pour le repère analysé.

Remarque : pour les définitions des termes courants utilisés dans les explications, voir Termes et concepts dans les explications(Le lien s’ouvre dans une nouvelle fenêtre) .

Cette explication montre :
  • Le pourcentage du nombre d’enregistrements pour une valeur unique d’une dimension pour le repère analysé (barre bleue) par rapport à tous les repères (barre grise) dans la visualisation source.
  • Le pourcentage du nombre d’enregistrements pour toutes les autres valeurs d’une dimension pour le repère analysé (barre bleue) par rapport à tous les repères (barre grise) dans la visualisation source.
  • La moyenne de la mesure cible pour la valeur unique d’une dimension dans le repère analysé (barre bleue) par rapport à tous les repères (barre grise).
  • La moyenne de la mesure cible pour toutes les autres valeurs d’une dimension pour le repère analysé (barre bleue) par rapport à tous les repères (barre grise) dans la visualisation source.

Possibilités d’exploration :

  • Survolez chaque barre pour voir ses détails.
  • Sélectionnez l’icône Ouvrir pour voir une version plus grande de la visualisation.

Prochaines étapes d’analyse :

  • Utilisez cette explication pour comprendre la composition des valeurs d’enregistrement qui constituent le repère analysé.
  • Les auteurs peuvent vouloir créer une nouvelle visualisation pour explorer toute dimension non visualisée mise en évidence dans cette explication.
 

Dans cet exemple, l’analyse statistique a révélé que de nombreux trajets provenaient du quartier de la gare de Back Bay. Notez que le quartier de la gare est une dimension non visualisée qui a une certaine relation avec la distance parcourue dans les données sous-jacentes de la visualisation source.

 

Principaux contributeurs

Utilisez cette explication pour voir les valeurs qui composent la plus grande fraction du repère analysé.

Pour une agrégation COUNT, les principaux contributeurs affichent les valeurs de dimension avec le plus d’enregistrements. Pour SUM, cette explication affiche les valeurs de dimension avec la plus grande somme partielle.

 

Dimensions ayant un impact

Utilisez cette explication pour comprendre la composition des valeurs d’enregistrement qui constituent le repère analysé.

Ce type d’explication montre que la distribution d’une dimension non visualisée peut contribuer à la valeur agrégée du repère analysé. Ce type d’explication est utilisé pour les sommes, les totaux et les moyennes des mesures cibles. Une dimension non visualisée est une dimension qui existe dans la source de données, mais qui n’est pas utilisée dans la vue actuellement.

Remarque : pour les définitions des termes courants utilisés dans les explications, voir Termes et concepts dans les explications(Le lien s’ouvre dans une nouvelle fenêtre) .

Cette explication montre :
  • Le pourcentage du nombre d’enregistrements pour toutes les valeurs d’une dimension pour le repère analysé (barre bleue) par rapport à toutes les valeurs d’une dimension pour tous les repères (barre grise) dans la visualisation source.
  • La moyenne de la mesure cible pour toutes les valeurs d’une dimension pour le repère analysé (barre bleue) par rapport à toutes les valeurs d’une dimension pour tous les repères (barre grise).

Possibilités d’exploration :

  • Survolez chaque barre pour voir ses détails.
  • Faites défiler pour mieux voir le graphique.
  • Sélectionnez l’icône Ouvrir pour voir une version plus grande de la visualisation.

Prochaines étapes d’analyse :

  • Utilisez cette explication pour comprendre la composition des valeurs d’enregistrement qui constituent le repère analysé.
  • Les auteurs peuvent vouloir créer une nouvelle visualisation pour explorer toutes les dimensions non visualisées mises en évidence dans cette explication.
 

Dans cet exemple, l’analyse statistique a révélé que davantage de trajets ont été effectués depuis South Sation et le MIT, et moins de trajets depuis Charles Circle et Kendall, par rapport aux trajets effectués pour les repères en général.

Notez que le nom de la gare est une dimension non visualisée qui a une certaine relation avec la distance parcourue dans les données sous-jacentes de la visualisation source.

 

Mesures ayant un impact

Ce type d’explication montre que la moyenne d’une mesure non visualisée peut contribuer à la valeur agrégée du repère analysé. Une mesure non visualisée est une mesure qui existe dans la source de données, mais qui n’est pas utilisée dans la vue actuellement.

Cette explication peut révéler une relation linéaire ou quadratique entre la mesure non visualisée et la mesure cible.

Remarque : pour les définitions des termes courants utilisés dans les explications, voir Termes et concepts dans les explications(Le lien s’ouvre dans une nouvelle fenêtre) .

Cette explication montre :
  • La relation entre la somme de la mesure cible et la moyenne d’une mesure non visualisée pour le repère analysé (cercle bleu) et tous les repères (cercles gris) dans la vue.
  • Si la somme de la mesure cible est élevée ou faible parce que la valeur moyenne de la mesure non visualisée est élevée ou faible.

Possibilités d’exploration :

  • Survolez chaque cercle pour voir ses détails.
  • Sélectionnez l’icône Ouvrir pour voir une version plus grande de la visualisation.

Prochaines étapes d’analyse :

  • Les auteurs peuvent vouloir créer une nouvelle visualisation pour explorer toutes les mesures non visualisées mises en évidence dans cette explication.
 

Dans cet exemple, l’une des raisons possibles pour lesquelles la distance parcourue est élevée est que le temps total moyen de location est également élevé.

Autres éléments à explorer

Cette section fournit les raisons possibles pour lesquelles le repère analysé est unique ou inhabituel. Ces explications :

  • N’expliquent pas pourquoi la valeur de ce repère est ce qu’elle est.
  • Ne sont en aucun cas liées à la valeur des mesures dans la visualisation source.
  • Ne tiennent compte d’aucune mesure cible.

Autres dimensions intéressantes

Utilisez cette explication pour comprendre la composition des valeurs d’enregistrement qui constituent le repère analysé.

La distribution d’une dimension non visualisée dans le repère analysé est inhabituelle par rapport à la distribution des valeurs pour tous les autres repères dans la vue. Une dimension non visualisée est une dimension qui existe dans la source de données, mais qui n’est pas utilisée dans la vue actuellement.

Remarque : pour les définitions des termes courants utilisés dans les explications, voir Termes et concepts dans les explications(Le lien s’ouvre dans une nouvelle fenêtre) .

Cette explication montre :
  • Le pourcentage du nombre d’enregistrements pour toutes les valeurs d’une dimension pour le repère analysé (barre bleue) par rapport à toutes les valeurs d’une dimension pour tous les repères (barre grise) dans la visualisation source.

Possibilités d’exploration :

  • Survolez chaque barre pour voir ses détails.
  • Faites défiler pour mieux voir le graphique.
  • Sélectionnez l’icône Ouvrir pour voir une version plus grande de la visualisation.

Prochaines étapes d’analyse :

  • Utilisez cette explication pour comprendre la composition des valeurs d’enregistrement qui constituent le repère analysé.
  • Les auteurs peuvent vouloir créer une nouvelle visualisation pour explorer toutes les dimensions non visualisées mises en évidence dans cette explication.
 

Dans cet exemple, un pourcentage élevé d’enregistrements est associé à un temps couvert. Étant donné que les données concernent la location de vélos à Boston et que le repère analysé est la distance parcourue pour le mois d’août, nous pouvons supposer que le temps est généralement chaud et humide. Les gens ont peut-être loué des vélos plus souvent par temps couvert pour éviter la chaleur. Il est également possible qu’il y ait eu plus de jours couverts en août.

 

Merci de vos commentaires !Avis correctement envoyé. Merci