Visualiser la loi de Benford
La loi de Benford est une loi mathématique qui énonce que le premier chiffre significatif, ou le plus à gauche, dans de nombreuses sources de données empiriques a une fréquence de distribution très spécifique. Plus précisément, le nombre 1 apparaît en tant que premier chiffre significatif environ 30 % du temps, et à mesure qu’ils augmentent, les nombres apparaissent moins fréquemment, avec le chiffre 9 qui apparaît moins de 5 % du temps. Lorsque des fraudeurs fabriquent des données, ils ne savent pas nécessairement créer des données factices conformes à la loi de Benford, ce qui, dans certains cas, rend possible la détection des données factices ou du moins créent des doutes quant à leur véracité.
Cet article décrit comment appliquer la loi de Benford aux données de ventes, à l’aide de la source de données Exemple - Hypermarché fournie avec Tableau Desktop.
Le processus nécessite que vous procédiez ainsi :
- Créez des champs calculés à utiliser dans votre vue.
- Paramétrez la vue.
Les sections suivantes répartissent ces procédures en des instructions spécifiques.
Créer des champs calculés à utiliser dans votre vue
- Dans le champ Analyse, sélectionnez Créer un champ calculé pour ouvrir l’éditeur de calcul. Nommez le calcul Leftmost Integer et entrez ou collez ce qui suit dans la zone de formule :
LEFT(STR([Sales]),1)
- Créez un second champ calculé et appelez-le Loi de Benford. Entrez ou collez ce qui suit dans la zone de formule :
LOG(INT([Leftmost Integer])+1)-LOG(INT([Leftmost Integer]))
Paramétrer la vue
- Dans le volet Données, faites glisser Leftmost Integer vers Colonnes, puis faites glisser Orders(Count) vers Lignes.
- Cliquez sur CNT(Orders) sur Lignes et choisissez Calcul de table rapide > Pourcentage du total.
Votre vue affiche maintenant la répartition des premiers chiffres, et la taille des barres (décroissante de la gauche vers la droite) suggère que les données, dans ce cas, sont conformes à la loi de Benford. Nous pouvons toutefois aller plus loin pour cadrer les données en ajoutant des répartitions de référence.
- Depuis le volet Données, faites glisser Benfords Law vers Détails sur la fiche Repères. Cliquez sur Benfords Law sur la fiche Repères et sélectionnez Mesure > Minimum.
- Passez du volet Données au volet Analyse et faites glisser Bande de distribution dans la vue. Déposez sur Cellule.
Remarque : les bandes de distribution sont prises en charge sur les plates-formes Web à partir de Tableau 10.2.
- Dans la boîte de dialogue Modifier une ligne, bande ou zone de référence, effectuez les tâches suivantes :
Cliquez dans le champ Valeur pour afficher un ensemble d’options supplémentaire :
- Dans la zone Pourcentages, entrez
80,100,120
.Ceci indique que vous souhaitez des bandes s’étendant de 80 à 100 , et de 100 à 120 %. Vous devez ensuite indiquer la valeur à laquelle les pourcentages font référence.
- Dans le champ Pourcentage de, choisissez MIN(Loi de Benford).
Le champ Valeur doit maintenant afficher
80%,100%,120% of Average Min. Benfords Law
.
Les étapes restantes permettent de configurer l’apparence des bandes de référence :
- Définissez Étiquette sur Aucune.
- Définissez Ligne sur la ligne la plus fine disponible.
- Choisissez Remplir en-dessous.
- Dans Remplir, sélectionnez Feu rouge.
- Cliquez ensuite sur OK pour quitter la boîte de dialogue Modifier une ligne, bande ou zone de référence.
- Cliquez sur le bouton de la barre d’outils pour afficher les étiquettes de repère :
La vue obtenue devrait ressembler à celle-ci :
Même si Superstore correspond à des données de démonstration, ces dernières sont réalistes dans la mesure où elles sont conformes à la loi de Benford. Les barres bleues qui indiquent les pourcentages réels des chiffres initiaux sont parfaitement alignées avec la valeur 100% (c’est-à-dire la ligne qui sépare la zone verte de la zone jaune dans les bandes de distribution) affichant les valeurs Benford attendues dans la vue.