直觀顯示班佛定律
本福德定律是一種數學定律,該定律指出許多現實資料來源中的前導數位或最左邊的數位以非常特定的方式分佈。具體來說,數字 1 在大約 30% 的時間中作為前導數位出現,並且隨著數位逐漸變大,它們會出現得較少,數字 9 出現的時間少於 5%。當欺詐者偽造資料時,他們可能不知道要去建立符合本福德定律的假資料,在某些情況下,可能會檢測偽造資料或者至少對資料的真實性表示懷疑。
本文介紹如何使用隨 Tableau Desktop 一起提供的[範例 - 超級市場]資料來源將本福德定律應用於銷售資料。
該過程需要您執行以下操作:
- 建立要在檢視中使用的導出欄位。
- 設定檢視。
以下部分將這些步驟分解為具體的說明。
建立要在檢視中使用的計算欄位
- 在「分析」功能表中,選取「建立導出欄位」,以開啟導出編輯器。將計算命名為 [Leftmost Integer] (最左邊的整數),並在公式區域中鍵入或貼上以下內容:
LEFT(STR([Sales]),1)
- 建立另一個計算欄位並將其命名為 [Benfords Law] (本福德定律)。在公式區域中鍵入或貼上以下內容:
LOG(INT([Leftmost Integer])+1)-LOG(INT([Leftmost Integer]))
設定檢視
- 在「資料」窗格中,將「最左邊的整數」拖曳至「欄」,然後將「訂單(計數)」拖曳至「列」。
- 按一下「列」上的「CNT(訂單)」,然後選擇「快速表計算」>「總計百分比」。
您的檢視現在會顯示第一個數位的分佈情況,條形大小(從左到右逐漸減小)表明在這種情況下的資料符合本福德定律。但我們可以透過新增引用分佈來執行更多操作以構造資料。
- 從「資料」窗格中,將「班佛定律」拖曳至「標記」卡片上的「詳細資訊」。按一下「標記」卡片上的「班佛定律」,然後選取「度量」>「最小值」。
- 從 [資料] 窗格切換到 [分析] 窗格,然後將 [分佈區間] 拖到檢視中。將其放在 [儲存格] 上。
附註:從 Tableau 10.2 開始,Web 平台上支援分佈區間。
- 在 [編輯輔助線、參考區間或參考箱] 對話方塊中,執行以下任務:
按一下 [值] 欄位以查看其他選項群組:
- 在 [百分比] 區域中,鍵入
80,100,120
。這會指定您希望區間介於 80% 到 100% 以及 100% 到 120%。接下來,您將指定百分比將引用的值。
- 在 [百分比] 欄位中,選取 [MIN(Benfords Law)] 。
[值] 欄位現在應該顯示為
80%,100%,120% of Average Min. Benfords Law
。
其餘步驟用於設定參考區間的外觀:
- 將 [標籤] 設定為 [無] 。
- 將 [線] 設定為最細的可用線。
- 選取 [向下填充] 。
- 從 [填充] 中,選取 [停止信號燈] 。
- 按一下 [確定] 結束 [編輯輔助線、參考區間或參考箱] 對話方塊。
- 按一下工具列按鈕以顯示標記標籤:
完成的檢視應如下所示:
即使 Superstore 是示範資料,它也是達到符合本福德定律程度的現實資料。藍色條表明初始數字實際百分比與在檢視中顯示預期本福德值的 100% 值(即,將分佈區間中的綠色區域與和黃色區域分隔開的線)完全一致。