แสดงกฎของเบนฟอร์ดเป็นภาพ
"กฎของเบนฟอร์ด" คือ กฎทางคณิตศาสตร์ที่ระบุว่าเลขหน้าหรือซ้ายสุดของแหล่งข้อมูลในชีวิตจริงจำนวนมากมีการกระจายในลักษณะที่เฉพาะเจาะจง โดยเฉพาะอย่างยิ่ง เลข 1 ที่เป็นเลขหน้าประมาณ 30% ของเวลา และเมื่อตัวเลขมีค่ามากขึ้นตัวเลขเหล่านั้นก็เกิดขึ้นไม่บ่อยนัก โดยที่เลข 9 เกิดขึ้นน้อยกว่า 5% ของเวลา เมื่อนักต้มตุ๋นปลอมแปลงข้อมูลขึ้นมา พวกเขาอาจไม่รู้ว่าจะต้องสร้างข้อมูลปลอมที่สอดคล้องกับกฎของเบนฟอร์ด และในบางกรณีทำให้สามารถตรวจจับข้อมูลเท็จหรืออย่างน้อยทำให้เกิดข้อสงสัยเกี่ยวกับความถูกต้องของข้อมูลได้
บทความนี้อธิบายวิธีใช้ "กฎของเบนฟอร์ดกับข้อมูลการขาย" โดยใช้แหล่งข้อมูล ตัวอย่าง - Superstore ที่อยู่ใน Tableau Desktop
คุณจำเป็นต้องดำเนินการตามกระบวนการต่อไปนี้:
- สร้างฟิลด์ที่คำนวณเพื่อใช้ในมุมมองของคุณ
- ตั้งค่ามุมมอง
ส่วนต่อไปนี้จะแบ่งขั้นตอนเหล่านี้ออกเป็นคำแนะนำที่เฉพาะเจาะจง
สร้างฟิลด์ที่คำนวณเพื่อใช้ในมุมมองของคุณ
- ในเมนูการวิเคราะห์ ให้เลือกสร้างฟิลด์ที่คำนวณเพื่อเปิดตัวแก้ไขการคำนวณ ตั้งชื่อการคำนวณ จำนวนเต็มซ้ายสุด และพิมพ์หรือวางข้อมูลในช่องสูตรดังต่อไปนี้:
LEFT(STR([Sales]),1)
- สร้างฟิลด์คำนวณที่สองและตั้งชื่อว่า กฎของเบนฟอร์ด พิมพ์หรือวางข้อมูลในช่องสูตรดังต่อไปนี้:
LOG(INT([Leftmost Integer])+1)-LOG(INT([Leftmost Integer]))
ตั้งค่ามุมมอง
- จากแผง ข้อมูล ให้ลาก จำนวนเต็มซ้ายสุด ไปยัง คอลัมน์ จากนั้นลาก คำสั่งซื้อ(จำนวน) ไปยัง แถว
- คลิก CNT(คำสั่งซื้อ) บนแถวและเลือก การคำนวณตารางแบบด่วน > เปอร์เซ็นต์ของทั้งหมด
มุมมองของคุณตอนนี้แสดงการกระจายของตัวเลขหลักแรก และขนาดของกราฟแท่ง (ลดลงจากซ้ายไปขวา) แสดงว่าข้อมูลในกรณีนี้เป็นไปตามกฎของเบนฟอร์ด แต่เราสามารถดำเนินการมากขึ้นเพื่อกำหนดกรอบข้อมูลโดยการเพิ่มการกระจายการอ้างอิง
- จากแผง ข้อมูล ให้ลาก กฎของเบนฟอร์ด ไปยัง "รายละเอียด" บนการ์ด "เครื่องหมาย" คลิก กฎของเบนฟอร์ด บนการ์ด "เครื่องหมาย" และเลือก การวัดผล > ขั้นต่ำ
- สลับจากแผง ข้อมูล ไปยังแผง วิเคราะห์ และลาก ช่วงการกระจาย ลงในมุมมอง วางลงบน เซลล์
หมายเหตุ: แพลตฟอร์มเว็บตั้งแต่ Tableau 10.2 ขึ้นไปรองรับ "ช่วงการกระจาย"
- ในกล่องโต้ตอบ "แก้ไขเส้นอ้างอิง ช่วง หรือกล่อง" ให้ดำเนินการดังต่อไปนี้:
คลิกในฟิลด์ "ค่า" เพื่อดูเซตตัวเลือกเพิ่มเติมดังนี้:
- ในช่อง "เปอร์เซ็นต์" ให้พิมพ์
80,100,120
ซึ่งระบุว่าคุณต้องการให้มีช่วงตั้งแต่ 80 ถึง 100 เปอร์เซ็นต์และตั้งแต่ 100 ถึง 120 เปอร์เซ็นต์ ต่อมาคุณจะต้องระบุค่าที่เปอร์เซ็นต์กำลังอ้างอิง
- ใน เปอร์เซ็นต์ ของฟิลด์ ให้เลือก MIN(กฎของเบนฟอร์ด)
ตอนนี้ในฟิลด์ "ค่า" ควรอ่านว่า
80%,100%,120% of Average Min. Benfords Law
ขั้นตอนที่เหลือคือการกำหนดลักษณะของช่วงการอ้างอิง
- กำหนด ป้ายกำกับ เป็น ไม่มี
- กำหนด เส้น เป็นเส้นที่บางที่สุด
- เลือก เติมด้านล่าง
- จาก เติม ให้เลือก ไฟจราจร
- คลิก ตกลง เพื่อออกจากกล่องโต้ตอบ "แก้ไขเส้นอ้างอิง ช่วง หรือกล่อง"
- คลิกปุ่มแถบเครื่องมือเพื่อแสดงป้ายกำกับของเครื่องหมาย:
มุมมองสุดท้ายควรมีลักษณะดังนี้:
แม้ว่า Superstore จะเป็นข้อมูลสาธิต แต่ก็มีความสมจริงซึ่งเป็นไปตามกฎของเบนฟอร์ด แท่งสีน้ำเงินแสดงเปอร์เซ็นต์ที่แท้จริงของตัวเลขหลักแรกซึ่งจัดเรียงสัมพันธ์กับค่า 100% (นั่นคือ เส้นที่แยกโซนสีเขียวออกจากโซนสีเหลืองในช่วงการกระจาย) ซึ่งแสดงค่าเบนฟอร์ดที่คาดการณ์ในมุมมอง