Descriptions des prévisions

La boîte de dialogue Décrire la prévision décrit les modèles de prévision que Tableau a calculés pour votre visualisation.

Lorsque la prévision est activée, vous pouvez ouvrir cette boîte de dialogue en sélectionnant Analyse > Prévision > Décrire la prévision.

Les informations contenues dans la boîte de dialogue Décrire la prévision sont en lecture seule. Toutefois, vous pouvez cliquer sur Copier dans le presse-papier, puis coller le contenu de l’écran dans un document.

La boîte de dialogue Décrire la prévision comporte deux onglets : un onglet Résumé et un onglet Modèles.

Décrire la prévision – Onglet Résumé

L’onglet Résumé décrit les modèles de prévisions créés par Tableau, ainsi que les tendances générales que Tableau a découvertes dans les données.

Options utilisées pour créer des prévisions

Cette section résume les options que Tableau a utilisées pour créer les prévisions. Il s’agit d’options que Tableau a sélectionnées automatiquement ou que vous avez spécifiées dans la boîte de dialogue Options des prévisions.

  • Série chronologique : le champ de date continue utilisé pour définir la série chronologique. Dans certains cas, cette valeur peut ne pas être une date. Voir Prévision en l’absence de date dans la vue.

  • Mesures : mesures pour lesquelles les valeurs sont estimées.

  • Transfert des prévisions : durée et plage de dates de la prévision.

  • Prévision basée sur : plage de dates des données réelles utilisée pour créer la prévision.

  • Ignorer la dernière : nombre de périodes non considérées à la fin des données actuelles ; les données prévisionnelles s’affichent pour ces périodes. Cette valeur est déterminée par l’option Ignorer la dernière de la boîte de dialogue Options des prévisions.

  • Modèle saisonnier : durée du cycle saisonnier que Tableau a trouvé dans les données, ou Aucun si aucun cycle saisonnier n’a été trouvé dans les prévisions.

Tables de résumé des prévisions

Pour chaque mesure faisant l’objet d’une prévision, une table de résumé est affichée. Celle-ci décrit la prévision. Si la vue est divisée en plusieurs volets en utilisant les dimensions, une colonne est insérée dans chaque table qui identifie les dimensions. Les champs des tables de résumé des prévisions sont les suivants :

  • Initial : valeur et intervalle de prédiction de la première période de prévision.

  • Modification depuis le début : différence entre le premier et le dernier point d’estimation de prévision. L’intervalle entre ces deux points est affiché dans l’en-tête de la colonne. Lorsque des valeurs sont sous la forme de pourcentages, ce champ affiche la différence de pourcentage depuis la première période de prévision.

  • Effet de saison : ces champs s’affichent pour les modèles identifiés comme ayant un caractère saisonnier, à savoir un modèle de variation qui se répète au fil du temps. Ils affichent la valeur haute et basse du composant saisonnier du dernier cycle saisonnier entier dans la série chronologique regroupant les valeurs réelles et de prévision. Le composant saisonnier exprime la déviation à partir de la tendance et avoisine donc zéro pendant une saison.

  • Contribution : manière dont la tendance et la saisonnalité contribuent à la prévision. Ces valeurs sont toujours exprimées en pourcentages et ne peuvent dépasser 100 %.

  • Qualité : indique le degré de précision entre la prévision et les données réelles. Les valeurs possibles sont BON, OK et FAIBLE. Une prévision naïve est une prévision dans laquelle il est estimé que la valeur de la période suivante sera identique à la valeur de la période actuelle. La qualité est exprimée par rapport à une prévision naïve. Par exemple, OK signifie qu’il y a de fortes chances pour que la marge d’erreur de notre prévision soit moins importante que celle d’une prévision naïve ; BONNE signifie que notre prévision a moins de deux fois moins d’erreurs et PAUVRE signifie que notre prévision a plus d’erreurs.

Décrire la prévision – Onglet Modèles

L’onglet Modèles fournit des statistiques plus exhaustives et des valeurs de coefficient de lissage pour les modèles de lissage exponentiel de Holt-Winters sous-jacents aux prévisions. Pour chaque mesure faisant l’objet d’une prévision, une table de résumé est affichée. Celle-ci décrit les modèles de prévisions que Tableau a créés pour la mesure. Si la vue est divisée en plusieurs volets en utilisant les dimensions, une colonne est insérée dans chaque table qui identifie les dimensions. La table contient les sections suivantes :

Modèle

Indique si les composants Niveau, Tendance ou Saison font partie du modèle utilisé pour générer la prévision. Chaque composant a l’une des valeurs suivantes :

  • Aucun : le composant n’est pas présent dans le modèle.

  • Additif : le composant est présent et est ajouté aux autres composants pour créer la valeur de prévision globale.

  • Multiplicatif : le composant est présent et est multiplié par les autres composants pour créer la valeur de prévision globale.

Métriques de qualité

Cet ensemble de valeurs fournit des informations statistiques sur la qualité du modèle.

ValeurDéfinition
EQM : Erreur quadratique moyenne racine
EAM : Erreur absolue moyenne

EAMD : Erreur absolue moyenne discrétisée.

EAMD mesure le degré de l’erreur comparé à celui de l’erreur d’une prévision en une étape en tant que ratio. Une prévision discrétisée estime que quelle que soit la valeur aujourd’hui, elle sera identique demain. Ainsi, une valeur EAMD de 0,5 signifie que votre prévision présentera probablement moitié moins d’erreurs qu’une prévision discrétisée, ce qui est mieux qu’une valeur EAMD de 1, laquelle n’est pas mieux qu’une prévision discrétisée. Puisque qu’il s’agit d’une statistique normalisée définie pour toutes les valeurs qui jauge les erreurs de manière lissée, cette métrique est excellente pour la comparaison de la qualité de différentes méthodes de prévision.

L’avantage de EAMD par rapport à la métrique classique EAMP est qu’elle est définie pour des séries temporelles qui contiennent zéro, contrairement à la métrique EAMP. De plus, EAMD accorde un poids égal aux erreurs tandis que EAMP accorde un poids plus important aux erreurs positives et/ou extrêmes.

EAMP : Erreur absolue moyenne en pourcentage.

EAMD mesure le degré de l’erreur comparé à celui de vos données, en tant que pourcentage. Ainsi, une valeur EAMP de 20 % est meilleure qu’une valeur EAMP de 60 %. Les erreurs reflètent les différences entre les valeurs de réponse, estimées par le modèle, et les valeurs de réponse réelles de chaque valeur explicative dans vos données. Puisqu’il s’agit d’une statistique normalisée, il est possible de l’utiliser pour comparer la qualité de modèles différents calculés dans Tableau. Toutefois, cette statistique manque de fiabilité pour certaines comparaisons, car elle jauge certains types d’erreurs de manière plus approfondie que d’autres. Elle est également mal définie pour les données présentant des valeurs zéro.

AIC : Akaike information criterion (critère d’informations Akaike, en anglais).

AIC est une mesure de la qualité du modèle, développé par Hirotugu Akaike, qui pénalise les modèles complexes pour empêcher le surajustement. Dans cette définition, k est le nombre de paramètres estimé, y compris les états initiaux, et SSE est la somme des erreurs au carré.

Dans les définitions précédentes, les variables apparaissent comme suit :

VariableSignification
tIndex d’une période dans une série chronologique.
nLongueur de la série chronologique.
mNombre de périodes dans une saison / un cycle.
A(t)Valeur réelle de la série chronologique à la période t.
F(t)Valeur prévisionnelle obtenue à la période t.

Les valeurs résiduelles sont : e(t) = F(t)-A(t)

Coefficients de lissage

En fonction du rythme d’évolution des composants de niveau, de tendance ou de saisonnalité des données, les coefficients de lissage sont optimisés pour pondérer les valeurs des données plus récentes davantage que celles des données plus anciennes, de façon à minimiser les erreurs de prévision plus avancées dans un échantillon. Alpha est le coefficient de lissage de niveau, bêta le coefficient de lissage de tendance et gamma le coefficient de lissage saisonnier. Plus un coefficient de lissage est proche de 1, moins le lissage est réalisé, autorisant de rapides modifications au niveau des composants et une confiance élevée dans les données récentes. Plus un coefficient de lissage est proche de 0, plus le lissage est réalisé, autorisant des modifications progressives au niveau des composants et une moindre confiance dans les données récentes.

 

Merci de vos commentaires !Avis correctement envoyé. Merci