Visualisieren des Benfordschen Gesetzes

Beim Benfordschen Gesetz handelt es sich um ein mathematisches Gesetz, das besagt, dass die führende oder ganz links gelegene Ziffer in vielen realen Datenquellen in einer ganz bestimmten Art und Weise verteilt ist. Insbesondere die Zahl 1 wird in 30 % der Fälle als führende Ziffer angezeigt. Je höher die Zahlen sind, umso seltener kommen sie vor, die Zahl 9 kommt beispielsweise in weniger als 5 % der Fälle vor. Wenn Personen in betrügerischer Absicht Daten fingieren, wissen sie unter Umständen nicht, wie Daten fingiert werden, damit sie dem Benfordschen Gesetz entsprechen. Und so ist es in manchen Fällen möglich, gefälschte Daten als solche zu erkennen oder zumindest Zweifel an der Richtigkeit der Daten zu wecken.

In diesem Abschnitt wird die Anwendung des Benfordschen Gesetzes auf Umsatzdaten beschrieben. Verwendet wird hierfür die Datenquelle Beispiel ‒ Superstore, die im Lieferumfang von Tableau Desktop enthalten ist.

Im Rahmen des Prozesses müssen Sie Folgendes tun:

  1. Erstellen Sie berechnete Felder zur Verwendung in Ihrer Ansicht.
  2. Richten Sie die Ansicht ein.

In den folgenden Abschnitten werden diese Verfahren in bestimmte Anweisungen aufgegliedert.

Erstellen von berechneten Feldern zur Verwendung in Ihrer Ansicht

  1. Wählen Sie Berechnetes Feld erstellen im Menü Analyse aus, um den Berechnungs-Editor zu öffnen. Benennen Sie die Berechnung mit Leftmost Integer (Zahl links außen), und geben oder fügen Sie Folgendes in den Formelbereich ein:

    LEFT(STR([Sales]),1)

  2. Erstellen Sie ein zweites berechnetes Feld, und benennen Sie es Benfordsches Gesetz. Geben oder fügen Sie Folgendes in den Formelbereich ein:

    LOG(INT([Leftmost Integer])+1)-LOG(INT([Leftmost Integer]))

Einrichten der Ansicht

  1. Ziehen Sie im Bereich Daten den Wert Leftmost Integer (Zahl links außen) zu Spalten und dann Orders(Count) zu Zeilen.
  2. Klicken Sie unter "Zeilen" auf CNT(Orders), und wählen Sie dann Schnelle Tabellenberechnung > Prozent der Gesamtsumme.

    In Ihrer Ansicht wird nun die Verteilung der ersten Ziffern dargestellt. Anhand der Größe der Balken (die von links nach rechts abnimmt) lässt sich erkennen, dass die Daten in diesem Fall mit dem Benfordschen Gesetz übereinstimmen. Durch das Hinzufügen von Referenzverteilungen wird eine weitere Einordnung der Daten ermöglicht.

  3. Ziehen Sie Benfordsches Gesetz im Bereich Daten zu "Detail" auf der Karte "Markierungen". Klicken Sie auf der Karte "Markierungen" auf Benfordsches Gesetz, und wählen Sie Kennzahl > Minimum aus.
  4. Gehen Sie vom Bereich Daten zum Bereich Analytik, und ziehen Sie das Distributionsband in die Ansicht. Das Ziel zum Ablegen ist Zelle.

    Hinweis: Distributionsbänder werden auf Webplattformen ab Version Tableau 10.2 unterstützt.

  5. Gehen Sie im Dialogfeld "Referenzlinie, -band oder -feld bearbeiten" wie folgt vor:
    1. Klicken Sie in das Wertefeld, um einen zusätzlichen Optionssatz anzuzeigen:

    2. Geben Sie im Bereich für Prozentsätze die Zeichenfolge 80,100,120 ein.

      So geben Sie an, dass Sie Bänder für die Bereiche 80 bis 100 Prozent und von 100 bis 120 Prozent möchten. Als Nächstes legen Sie fest, auf welchen Wert sich die Prozentwerte beziehen.

    3. Wählen Sie im Feld für den Prozentwert die Option MIN(Benfords Law) (MIN(Benfordsches Gesetz)).

      Im Feld "Wert" sollte nun Folgendes angezeigt werden: 80%,100%,120% of Average Min. Benfords Law.

    In den verbleibenden Schritten wird das Erscheinungsbild der Referenzbänder konfiguriert:

    1. Legen Sie für die Option Beschriftung den Wert Keine fest.
    2. Legen Sie für Linie die geringstmögliche Strichstärke fest.
    3. Wählen Sie Unten füllen.
    4. Wählen Sie für die Füllung den Wert Rote Ampel.
    5. Klicken Sie auf OK, um das Dialogfeld "Referenzlinie, -band oder -feld bearbeiten" zu schließen.
  6. Klicken Sie auf die Schaltfläche auf der Symbolleiste, um die Markierungsbeschriftungen anzuzeigen:

Die Ansicht sollte nach Fertigstellung wie folgt aussehen:

Bei der Datenquelle "Superstore" handelt es sich zwar um Beispieldaten, sie sind aber im Hinblick auf die Übereinstimmung mit dem Benfordschen Gesetz durchaus realistisch. Die blauen Balken, die die tatsächlichen Prozentwerte der Anfangsziffern angeben, passen sehr gut zu dem Wert für 100 % (d. h. die Linie, die den grünen Bereich vom gelben Bereich in den Distributionsbändern trennt), der die erwarteten Benfordschen Werte in der Ansicht darstellt.

Vielen Dank für Ihr Feedback!Ihr Feedback wurde erfolgreich übermittelt. Vielen Dank.