Types d’explication dans Explique-moi les données
Chaque fois que vous sélectionnez un nouveau repère dans une visualisation ou un tableau de bord et que vous exécutez Explique-moi les données, Tableau exécute une nouvelle analyse statistique en prenant en compte ce repère et les données sous-jacentes du classeur. Les explications possibles sont affichées dans des sections que vous pouvez développer dans le volet du Guide des données. Pour plus d’informations sur la façon dont Explique-moi les données analyse et évalue les explications, consultez Comment fonctionne Explique-moi les données .
Explorer les valeurs sous-jacentes
Cette section répertorie les explications de chaque mesure pouvant être expliquée (appelée mesures cibles). Chaque explication répertoriée ici décrit une relation avec les valeurs de la mesure cible qui sont testées sur le repère analysé. Appuyez-vous sur votre compréhension pratique et votre expérience concrète des données pour déterminer si les relations trouvées par Explique-moi les données sont pertinentes et méritent d’être explorées.
Caractéristiques sous-jacentes
Ces explications décrivent comment les enregistrements sous-jacents des repères dans la vue peuvent contribuer à la valeur agrégée de la mesure expliquée. Les attributs de repère peuvent inclure des Valeurs extrêmes, des Valeurs null, le Nombre d’enregistrements ou la Valeur moyenne du repère.
Remarque : pour les définitions des termes courants utilisés dans les explications, voir Termes et concepts dans les explications(Le lien s’ouvre dans une nouvelle fenêtre) .
Valeurs extrêmes
Ce type d’explication indique si un ou plusieurs enregistrements ont des valeurs significativement supérieures ou inférieures à la plupart des enregistrements. Si l’explication est soutenue par un modèle, cela indique que la valeur extrême affecte la mesure cible du repère analysé.
Lorsqu’un repère contient des valeurs extrêmes, cela ne signifie pas automatiquement qu’il s’agit de valeurs atypiques ou que vous devriez l’exclure de la vue. Ce choix dépend de votre analyse. L’explication souligne simplement une valeur extrême dans le repère. Par exemple, elle pourrait révéler une valeur erronée dans un enregistrement où une banane coûte 10 dollars au lieu de 10 cents. Ou encore, elle pourrait révéler qu’un vendeur en particulier a eu un excellent trimestre.
Remarque : cette explication doit être activée par l’auteur pour être visible en mode d’affichage pour un classeur publié. Pour plus d’informations, consultez Contrôler l’accès à Explique-moi les données.
Cette explication montre :
Possibilités d’exploration :
Prochaines étapes d’analyse :
| Dans cet exemple, une seule valeur extrême de 463 heures de location contribue à la somme plus élevée que prévu du temps total de location de 613 heures. Le fait qu’une personne ait oublié de raccrocher le vélo lorsqu’elle l’a rendu pourrait expliquer cette valeur élevée. Dans ce cas, l’auteur peut souhaiter exclure cette valeur pour une analyse future.
| |
Visualiser la différenceCette section montre :
Possibilités d’exploration :
Prochaines étapes d’analyse :
| Dans cet exemple, lorsque la valeur extrême de 483 est exclue, le repère analysé cesse d’être élevé par rapport aux autres repères de la vue. D’autres repères se distinguent désormais. L’auteur pourrait vouloir explorer les autres repères pour déterminer pourquoi ces autres emplacements affichent davantage d’heures de location de vélos. |
Valeurs null
Le type d’explication Valeurs null signale les situations où il y a une quantité plus importante que prévu de données manquantes dans un repère. Il indique la fraction des valeurs de mesures cible qui sont null et comment les valeurs null peuvent contribuer à la valeur agrégée de cette mesure.
Cette explication montre :
Possibilités d’exploration :
Prochaines étapes d’analyse :
| Dans cet exemple, le pourcentage de valeurs null dans la mesure cible est affiché sous la forme d’un cercle bleu. |
Nombre d’enregistrements
Ce type d’explication décrit dans quel cas le nombre d’enregistrements sous-jacents est corrélé à la somme. L’analyse a trouvé une relation entre le nombre d’enregistrements agrégés dans un repère et la valeur réelle du repère.
Bien que cela puisse sembler évident, ce type d’explication vous aide à déterminer si la valeur du repère est affectée par l’ampleur des valeurs de ses enregistrements ou simplement en raison du nombre d’enregistrements dans le repère analysé.
Cette explication montre :
Possibilités d’exploration :
Prochaines étapes d’analyse :
| Dans cet exemple, le nombre d’enregistrements pour la distance parcourue et est répertorié pour chaque valeur de mois d’utilisation, qui est une dimension dans la visualisation d’origine. Août affiche la valeur de distance parcourue totale la plus élevée. Vous pouvez déterminer si le mois d’août affiche la valeur la plus élevée pour la distance parcourue parce que davantage de trajets ont eu lieu en août, ou si la distance parcourue est plus élevée parce que certains trajets étaient plus longs. |
Valeur moyenne du repère
Ce type d’explication décrit dans quels cas la moyenne d’une mesure est corrélée à la somme. Comparez si la valeur moyenne est faible ou élevée, ou si le nombre d’enregistrements est faible ou élevé.
Cette explication montre :
Possibilités d’exploration :
Prochaines étapes d’analyse :
| Dans cet exemple, la distance parcourue moyenne pour le mois d’août n’est pas nettement supérieure ou inférieure à celle de la plupart des mois. Cela suggère que la distance parcourue est plus élevée pour le mois d’août parce qu’il y a eu plus de trajets en août, plutôt que des personnes effectuant des trajets plus longs. |
Valeur unique ayant un impact
Utilisez cette explication pour comprendre la composition des valeurs d’enregistrement qui constituent le repère analysé.
Ce type d’explication identifie lorsqu’une valeur unique dans une dimension non visualisée peut contribuer à la valeur agrégée du repère analysé. Une dimension non visualisée est une dimension qui existe dans la source de données, mais qui n’est pas utilisée dans la vue actuellement.
Cette explication indique quand chaque enregistrement sous-jacent d’une dimension a la même valeur, ou quand une valeur de dimension se distingue parce qu’un grand nombre ou un petit nombre d’enregistrements ont la même valeur unique pour le repère analysé.
Remarque : pour les définitions des termes courants utilisés dans les explications, voir Termes et concepts dans les explications(Le lien s’ouvre dans une nouvelle fenêtre) .
Cette explication montre :
Possibilités d’exploration :
Prochaines étapes d’analyse :
| Dans cet exemple, l’analyse statistique a révélé que de nombreux trajets provenaient du quartier de la gare de Back Bay. Notez que le quartier de la gare est une dimension non visualisée qui a une certaine relation avec la distance parcourue dans les données sous-jacentes de la visualisation source. |
Principaux contributeurs
Utilisez cette explication pour voir les valeurs qui composent la plus grande fraction du repère analysé.
Pour une agrégation COUNT, les principaux contributeurs affichent les valeurs de dimension avec le plus d’enregistrements. Pour SUM, cette explication affiche les valeurs de dimension avec la plus grande somme partielle.
Dimensions ayant un impact
Utilisez cette explication pour comprendre la composition des valeurs d’enregistrement qui constituent le repère analysé.
Ce type d’explication montre que la distribution d’une dimension non visualisée peut contribuer à la valeur agrégée du repère analysé. Ce type d’explication est utilisé pour les sommes, les totaux et les moyennes des mesures cibles. Une dimension non visualisée est une dimension qui existe dans la source de données, mais qui n’est pas utilisée dans la vue actuellement.
Remarque : pour les définitions des termes courants utilisés dans les explications, voir Termes et concepts dans les explications(Le lien s’ouvre dans une nouvelle fenêtre) .
Cette explication montre :
Possibilités d’exploration :
Prochaines étapes d’analyse :
| Dans cet exemple, l’analyse statistique a révélé que davantage de trajets ont été effectués depuis South Sation et le MIT, et moins de trajets depuis Charles Circle et Kendall, par rapport aux trajets effectués pour les repères en général. Notez que le nom de la gare est une dimension non visualisée qui a une certaine relation avec la distance parcourue dans les données sous-jacentes de la visualisation source. |
Mesures ayant un impact
Ce type d’explication montre que la moyenne d’une mesure non visualisée peut contribuer à la valeur agrégée du repère analysé. Une mesure non visualisée est une mesure qui existe dans la source de données, mais qui n’est pas utilisée dans la vue actuellement.
Cette explication peut révéler une relation linéaire ou quadratique entre la mesure non visualisée et la mesure cible.
Remarque : pour les définitions des termes courants utilisés dans les explications, voir Termes et concepts dans les explications(Le lien s’ouvre dans une nouvelle fenêtre) .
Cette explication montre :
Possibilités d’exploration :
Prochaines étapes d’analyse :
| Dans cet exemple, l’une des raisons possibles pour lesquelles la distance parcourue est élevée est que le temps total moyen de location est également élevé. |
Autres éléments à explorer
Cette section fournit les raisons possibles pour lesquelles le repère analysé est unique ou inhabituel. Ces explications :
- N’expliquent pas pourquoi la valeur de ce repère est ce qu’elle est.
- Ne sont en aucun cas liées à la valeur des mesures dans la visualisation source.
- Ne tiennent compte d’aucune mesure cible.
Autres dimensions intéressantes
Utilisez cette explication pour comprendre la composition des valeurs d’enregistrement qui constituent le repère analysé.
La distribution d’une dimension non visualisée dans le repère analysé est inhabituelle par rapport à la distribution des valeurs pour tous les autres repères dans la vue. Une dimension non visualisée est une dimension qui existe dans la source de données, mais qui n’est pas utilisée dans la vue actuellement.
Remarque : pour les définitions des termes courants utilisés dans les explications, voir Termes et concepts dans les explications(Le lien s’ouvre dans une nouvelle fenêtre) .
Cette explication montre :
Possibilités d’exploration :
Prochaines étapes d’analyse :
| Dans cet exemple, un pourcentage élevé d’enregistrements est associé à un temps couvert. Étant donné que les données concernent la location de vélos à Boston et que le repère analysé est la distance parcourue pour le mois d’août, nous pouvons supposer que le temps est généralement chaud et humide. Les gens ont peut-être loué des vélos plus souvent par temps couvert pour éviter la chaleur. Il est également possible qu’il y ait eu plus de jours couverts en août. |