De wet van Benford visualiseren
De wet van Benford is een wiskundige wet die stelt dat het leidende of meest linkse cijfer in veel praktijkgerichte databronnen op een zeer specifieke manier wordt verdeeld. Concreet komt het getal 1 ongeveer 30% van de tijd voor als het leidende cijfer, en naarmate getallen groter worden, komen ze minder vaak voor, waarbij het getal 9 minder dan 5% van de tijd voorkomt. Wanneer fraudeurs data verzinnen, weten ze misschien niet dat ze valse data moeten creëren die voldoen aan de wet van Benford, en in sommige gevallen maakt dit het mogelijk om valse data te detecteren of op zijn minst twijfel te zaaien over de juistheid ervan.
In dit artikel wordt beschreven hoe u de wet van Benford kunt toepassen op verkoopdata met behulp van de databron Steekproef - Superstore die is geleverd bij Tableau Desktop.
Voor het proces moet u het volgende doen:
- Berekende velden maken om te gebruiken in uw weergave.
- De weergave instellen.
In de volgende secties worden deze procedures onderverdeeld in specifieke instructies.
Berekende velden maken om te gebruiken in uw weergave
- In het menu Analyse selecteert Berekend veld maken om de berekeningseditor te openen. Geef de berekening de naam Meest linkse gehele getal en typ of plak het volgende in het formulegebied:
LEFT(STR([Sales]),1)
- Maak een tweede berekend veld en geef het de naam de wet van Benford. Typ of plak het volgende in het formulegebied:
LOG(INT([Leftmost Integer])+1)-LOG(INT([Leftmost Integer]))
De weergave instellen
- Vanaf het deelvenster Data sleept u Meest linkse gehele getal naar Kolommen, en sleept u vervolgens Orders (aantal) naar Rijen.
- Klik op CNT (Orders) in Rijen en kies Snelle tabelberekening > Percentage van totaal.
Uw weergave toont nu de verdeling van de eerste cijfers, en het formaat van de balken (van links naar rechts afnemend) suggereert dat de data in dit geval in overeenstemming zijn met de wet van Benford. Maar we kunnen meer doen om de data in kaart te brengen door referentiedistributies toe te voegen.
- Vanaf het deelvenster Data sleept u de wet van Benford naar Details op de kaart Markeringen. Klik op de wet van Benford op de kaart Markeringen en selecteer Meetwaarde > Minimum.
- Schakel over van het deelvenster Data naar het deelvenster Analyse en sleep Distributieband in de weergave. Plaats dit op Cel.
Opmerking: Distributiebanden worden ondersteund op webplatforms vanaf Tableau 10.2.
- In het dialoogvenster Referentielijn, Band of Box bewerken doet u het volgende:
Klik in het veld Waarde om een extra set met opties weer te geven:
- Typ in het gebied Percentages
80,100,120
.Dit geeft aan dat u banden wilt die variëren van 80 tot 100 procent en van 100 tot 120 procent. Vervolgens geeft u aan op welke waarde de percentages betrekking hebben.
- In het veld Percentage van, kiest u MIN (wet van Benford).
Het veld Waarde zou nu moeten luiden
80%,100%,120% of Average Min. Benfords Law
.
Met de overige stappen configureert u de vormgeving van de referentiebanden:
- Stel Label in op Geen.
- Stel Lijn in op de dunste beschikbare lijn.
- Kies Hieronder invullen.
- Bij Invullen, selecteert u Rood verkeerslicht.
- Klik op OK om het dialoogvenster Referentielijn, Band of Box bewerken te verlaten.
- Klik op de werkbalkknop om markeringslabels weer te geven:
De voltooide weergave zou er als volgt uit moeten zien:
Hoewel Superstore demodata zijn, zijn deze realistisch voor de bepaling of deze voldoen aan de wet van Benford. De blauwe balken die de daadwerkelijke percentages van de initiële cijfers aangeven, komen heel goed overeen met de 100%-waarde (dat wil zeggen de lijn die de groene zone scheidt van de gele zone in de distributiebanden) die de verwachte Benford-waarden in de weergave toont.