การทำงานของฟังก์ชันการสร้างแบบจำลองเชิงคาดการณ์ใน Tableau
คุณสามารถเพิ่มเส้นแนวโน้มและการพยากรณ์ไปยังการแสดงเป็นภาพได้ แต่ตอนนี้คุณทำได้มากกว่านี้โดยใช้ประสิทธิภาพการทำงานของเครื่องมือทางสถิติเพื่อสร้างแบบจำลองที่เข้าใจวิธีแจกแจงข้อมูลของคุณไปรอบๆ เส้นแนวโน้มหรือเส้นถดถอย ก่อนหน้านี้ผู้ใช้ต้องผสานรวม Tableau กับ R และ Python เพื่อทำการคำนวณทางสถิติขั้นสูงและแสดงเป็นภาพใน Tableau คุณสามารถใช้ฟังก์ชันการสร้างแบบจำลองแบบคาดการณ์เพื่อทำการคาดการณ์จากข้อมูลของคุณโดยรวมไว้ในการคำนวณตารางได้แล้วตอนนี้ หากต้องการข้อมูลเพิ่มเติม โปรดดู เปลี่ยนค่าต่างๆ ด้วยการคำนวณตาราง
ฟังก์ชันการสร้างแบบจำลองแบบคาดการณ์เหล่านี้ช่วยให้คุณสามารถเลือกเป้าหมายและตัวคาดการณ์โดยอัปเดตตัวแปร และแสดงแบบจำลองต่างๆ เป็นภาพด้วยการรวมตัวคาดการณ์ที่แตกต่างกัน คุณจะสามารถกรอง รวม และแปลงข้อมูลได้ในทุกระดับของรายละเอียดและแบบจำลอง ดังนั้นการคาดการณ์จะคำนวณใหม่โดยอัตโนมัติเพื่อจับคู่ข้อมูลของคุณ
หากต้องการดูตัวอย่างโดยละเอียดที่แสดงวิธีการสร้างการคำนวณการคาดการณ์โดยใช้ฟังก์ชันเหล่านี้ โปรดดู ตัวอย่าง - สำรวจอายุคาดเฉลี่ยของเพศหญิงด้วยฟังก์ชันการสร้างแบบจำลองเชิงคาดการณ์
ฟังก์ชันการสร้างแบบจำลองแบบคาดการณ์พร้อมให้ใช้งานใน Tableau
MODEL_PERCENTILE
ไวยากรณ์ | MODEL_PERCENTILE(
|
คำนิยาม | แสดงผลความน่าจะเป็น (ระหว่าง 0 ถึง 1) ของค่าที่คาดหวังซึ่งน้อยกว่าหรือเท่ากับเครื่องหมายที่สังเกตได้ ซึ่งกำหนดโดยนิพจน์เป้าหมายและตัวคาดการณ์อื่นๆ นี่คือฟังก์ชันการแจกแจงแบบคาดการณ์ภายหลัง หรือที่เรียกว่าฟังก์ชันการกระจายสะสม (CDF) |
ตัวอย่าง | MODEL_PERCENTILE( SUM([Sales]),COUNT([Orders])) |
MODEL_QUANTILE
ไวยากรณ์ | MODEL_QUANTILE(
|
คำนิยาม | แสดงผลค่าตัวเลขเป้าหมายภายในช่วงที่น่าจะเป็นซึ่งกำหนดโดยนิพจน์เป้าหมายและตัวคาดการณ์อื่นๆ ที่ควอนไทล์ที่ระบุ นี่คือควอนไทล์แบบคาดการณ์ภายหลัง |
ตัวอย่าง | MODEL_QUANTILE(0.5, SUM([Sales]), COUNT([Orders])) |
ประสิทธิภาพการทำงานของฟังก์ชันการสร้างแบบจำลองแบบคาดการณ์
ลองดูตัวอย่างการใช้ข้อมูลเงินเดือนโดยเริ่มต้นด้วย MODEL_QUANTILE
ในตัวอย่างด้านล่าง MODEL_QUANTILE ใช้เพื่อแสดงเปอร์เซ็นต์ไทล์ที่ 10 และเปอร์เซ็นต์ที่ 90 ของการแจกแจงที่คาดหวังสำหรับชุดข้อมูลเดียวกัน จากข้อมูลที่มีอยู่และการใช้แบบจำลองการถดถอยเชิงเส้น เครื่องมือทางสถิติกำหนดไว้ว่ามีความเป็นไปได้ 90% ที่เงินเดือนสูงสุดสำหรับแต่ละตำแหน่งจะต่ำกว่าเส้นสีเขียว และมีความเป็นไปได้ 10% ที่เงินเดือนขั้นต่ำสำหรับแต่ละตำแหน่งจะต่ำกว่าเส้นสีน้ำเงิน
กล่าวอีกนัยหนึ่ง ด้วยควอนไทล์ที่กำหนดไว้ที่ 0.9 แบบจำลองนี้คาดการณ์ว่าเงินเดือนทั้งหมดจะอยู่ที่หรือต่ำกว่าเส้นสีเขียว 90% ของเวลาดังกล่าว เส้นสีฟ้ากำหนดไว้ที่ .1 หรือ 10% ดังนั้นมีเพียง 10% ของเงินเดือนเท่านั้นที่จะอยู่ที่หรือต่ำกว่าเส้นสีฟ้าโดยมีค่าผกผัน (90%) อยู่เหนือเส้นสีฟ้า
ข้อมูลเหล่านี้จะนำเสนอการกำหนดช่วงที่คาดการณ์ได้ 80% ของจุดที่อาจเกิดขึ้นในอนาคตหรือข้อมูลที่ไม่มีการสังเกตจะอยู่ในช่วงนี้
ต่อไปเรามาดูกันว่า MODEL_PERCENTILE ซึ่งเป็นค่าผกผันของ MODEL_QUANTILE จะช่วยให้เราเข้าใจข้อมูลได้มากขึ้นอย่างไร
คุณสามารถระบุค่าผิดปกติของชุดข้อมูลได้โดยใช้ฟังก์ชัน MODEL_PERCENTILE MODEL_PERCENTILE จะบอกคุณในฐานะเปอร์เซ็นต์ไทล์ ซึ่งเครื่องหมายที่สังเกตได้อยู่ในช่วงของค่าที่เป็นไปได้สำหรับแต่ละเครื่องหมาย หากเปอร์เซ็นต์ไทล์ใกล้เคียง 0.5 มาก ค่าที่สังเกตได้จะใกล้เคียงกับค่ามัธยฐานที่คาดการณ์ไว้มาก หากเปอร์เซ็นต์ไทล์ใกล้เคียง 0 หรือ 1 ค่าที่สังเกตได้จะอยู่ที่ขอบเขตด้านล่างหรือด้านบนของช่วงแบบจำลองและคาดคะเนไม่ได้อย่างสัมพันธ์กัน
ด้านล่างนี้เราได้ใช้ MODEL_PERCENTILE เป็นสีสำหรับการแสดงเงินเดือนเป็นภาพในครึ่งบนของภาพเพื่อช่วยให้เราเข้าใจว่าคาดคะเนค่าใดได้มากที่สุด
รายละเอียดไวยากรณ์ของฟังก์ชันการสร้างแบบจำลองแบบคาดการณ์
MODEL_QUANTILE คืออะไร
MODEL_QUANTILE จะคำนวณควอนไทล์แบบคาดการณ์ด้านหลังหรือค่าที่คาดหวังสำหรับควอนไทล์ที่ระบุ
- ควอนไทล์: อาร์กิวเมนต์แรกเป็นจำนวนระหว่าง 0 ถึง 1 โดยบ่งชี้ว่าควรคาดการณ์ควอนไทล์ใด ตัวอย่างเช่น 0.5 ระบุว่าค่ามัธยฐานจะถูกคาดการณ์
- นิพจน์เป้าหมาย: อาร์กิวเมนต์ที่สองคือตัวชี้วัดที่จะคาดการณ์หรือ “กำหนดเป้าหมาย”
- นิพจน์ตัวคาดการณ์: อาร์กิวเมนต์ที่สามคือตัวคาดการณ์ที่ใช้ในการคาดการณ์ ตัวคาดการณ์อาจเป็นมิติข้อมูล ตัวชี้วัด หรือทั้งสองอย่างก็ได้
ผลลัพธ์คือจำนวนที่อยู่ในช่วงความน่าจะเป็น
คุณสามารถใช้ MODEL_QUANTILE เพื่อสร้างช่วงความเชื่อมั่น ค่าที่ขาดหายไป เช่น วันที่ในอนาคต หรือสร้างหมวดหมู่ที่ไม่มีอยู่ในชุดข้อมูลเบื้องหลัง
MODEL_PERCENTILE คืออะไร
MODEL_PERCENTILE จะคำนวณหาฟังก์ชันการกระจายแบบคาดการณ์ด้านหลังหรือที่เรียกว่าฟังก์ชันการแจกแจงสะสม (CDF) ซึ่งจะคำนวณควอนไทล์ของค่าเฉพาะระหว่าง 0 ถึง 1, ค่าผกผันของ MODEL_QUANTILE
- นิพจน์เป้าหมาย:อาร์กิวเมนต์แรกคือตัวชี้วัดเป้าหมายโดยระบุค่าที่จะประเมิน
- นิพจน์ตัวคาดการณ์: อาร์กิวเมนต์ที่สองคือตัวคาดการณ์ที่ใช้ในการคาดการณ์
- อาร์กิวเมนต์เพิ่มเติมเป็นตัวเลือกและรวมอยู่ในการควบคุมการคาดการณ์
สังเกตว่าไวยากรณ์การคำนวณมีความคล้ายกันโดย MODEL_QUANTILE มีอาร์กิวเมนต์พิเศษของควอนไทล์ที่กำหนด
ผลลัพธ์คือความน่าจะเป็นของค่าที่คาดหวังจะน้อยกว่าหรือเท่ากับค่าที่สังเกตและแสดงในเครื่องหมาย
คุณสามารถใช้ MODEL_PERCENTILE เพื่อแสดงสหสัมพันธ์และความสัมพันธ์ภายในฐานข้อมูลของคุณได้ หาก MODEL_PERCENTILE แสดงค่าที่ใกล้เคียงกับ 0.5 เครื่องหมายที่สังเกตได้จะใกล้เคียงกับค่ามัธยฐานของช่วงค่าที่คาดการณ์ไว้โดยพิจารณาจากตัวคาดการณ์อื่นๆ ที่คุณเลือกไว้ หาก MODEL_PERCENTILE แสดงค่าที่ใกล้เคียงกับ 0 หรือ 1 เครื่องหมายที่สังเกตได้จะใกล้เคียงกับช่วงล่างหรือช่วงบนของค่าที่แบบจำลองคาดการณ์ไว้โดยพิจารณาจากตัวคาดการณ์อื่นๆ ที่คุณเลือกไว้
สำหรับผู้ใช้ขั้นสูง มีอาร์กิวเมนต์ตัวเลือกอื่นอีกสองรายการที่คุณสามารถรวมไว้เพื่อควบคุมการคาดการณ์ได้ หากต้องการข้อมูลเพิ่มเติม โปรดดู การทำให้เป็นมาตรฐานและการเพิ่มในการสร้างแบบจำลองแบบคาดการณ์
มีการคำนวณอะไรบ้าง
ข้อมูลการป้อนที่ใช้สร้างแบบจำลองคือเมทริกซ์ที่แต่ละเครื่องหมายเป็นแถว และคอลัมน์เป็นนิพจน์เป้าหมายและนิพจน์ตัวคาดการณ์ที่ได้รับการประเมินสำหรับแต่ละเครื่องหมาย แถวใดก็ตามที่ระบุไว้ในการแสดงเป็นภาพคือสิ่งที่กำหนดแถวสำหรับชุดข้อมูลที่คำนวณโดยเครื่องมือทางสถิติ
มาดูตัวอย่างด้านล่าง แถว (และเครื่องหมาย) จะกำหนดโดยตำแหน่งงานและคอลัมน์จะเป็นนิพจน์เป้าหมาย MEDIAN([Annual Rt]) สิ่งเหล่านี้จะตามด้วยตัวเลือกตัวคาดการณ์เพิ่มเติม MEDIAN([Tenure in Months (Measure)] และ ATTR([Department Generic (group)]
หากต้องการข้อมูลเพิ่มเติมเกี่ยวกับข้อมูลที่ใช้สร้างแบบจำลองและสร้างการคาดการณ์ โปรดดู “คำนวณโดยใช้” และ “การแบ่งพาร์ติชันข้อมูล” ใน “แบบจำลองแบบคาดการณ์”
รองรับแบบจำลองใดบ้าง
ฟังก์ชันการสร้างแบบจำลองแบบคาดการณ์รองรับการถดถอยเชิงเส้น การถดถอยเชิงเส้นแบบปกติ และการถดถอยของกระบวนการเกาส์เซียน แบบจำลองเหล่านี้รองรับกรณีการใช้งานและประเภทการคาดการณ์ที่แตกต่างกัน รวมถึงมีข้อจำกัดที่แตกต่างกัน หากต้องการข้อมูลเพิ่มเติม โปรดดู การเลือกแบบจำลองแบบคาดการณ์
การเลือกตัวคาดการณ์ของคุณ
ตัวคาดการณ์สามารถเป็นฟิลด์ใดก็ได้ในแหล่งข้อมูล เช่น การวัดผลหรือมิติข้อมูล รวมถึงฟิลด์ที่คำนวณ
ตัวอย่างเช่น สมมติว่ามีชุดข้อมูลที่ประกอบด้วยฟิลด์ [เมือง], [รัฐ] และ [ภูมิภาค] ซึ่งมีระเบียน [เมือง] หลายรายการอยู่ใน [รัฐ] และระเบียน [รัฐ] หลายรายการใน [ภูมิภาค]
ในการแสดงเป็นภาพที่ใช้ [รัฐ] เป็นเครื่องหมาย ตัวคาดการณ์ ATTR([รัฐ]) หรือ ATTR([ภูมิภาค])จะทำงานเป็นตัวคาดการณ์ อย่างไรก็ตาม ตัวคาดการณ์ ATTR([เมือง]) จะเปลี่ยนกลับไปเป็น * เนื่องจากมีหลายเมืองอยู่ในรัฐที่แสดงเป็นภาพ ดังนั้นจึงไม่สามารถใช้เป็นตัวคาดการณ์ได้ กล่าวอีกนัยหนึ่ง รวมถึงตัวคาดการณ์ที่มีระดับของรายละเอียดต่ำกว่าการแสดงเป็นภาพจะไม่เพิ่มมูลค่าให้กับการคาดการณ์ ในกรณีส่วนใหญ่ ตัวคาดการณ์ที่มีระดับของรายละเอียดต่ำกว่าที่การแสดงเป็นภาพจะประเมิน * และทั้งหมดจะได้รับการดำเนินการเหมือนกัน
อย่างไรก็ตาม หากมีการใช้ชุดข้อมูลเดียวกันเพื่อสร้างการแสดงเป็นภาพที่ใช้ [เมือง] เป็นเครื่องหมาย, ATTR([เมือง]), ATTR([รัฐ]) และ ATTR([ภูมิภาค]) ทั้งหมดสามารถใช้เป็นตัวคาดการณ์ได้อย่างสำเร็จ หากต้องการข้อมูลเพิ่มเติมเกี่ยวกับการใช้ฟังก์ชัน ATTR โปรดดูเมื่อไหร่ควรใช้ฟังก์ชันแอตทริบิวต์ (ATTR)
มิติข้อมูลและการวัดผลไม่จำเป็นต้องแสดงเป็นภาพ (ในมุมมองหรือการแสดงเป็นภาพ) เพื่อรวมไว้เป็นตัวคาดการณ์ หากต้องการข้อมูลเพิ่มเติม โปรดดู การเลือกตัวคาดการณ์
คำแนะนำ
การคำนวณการคาดการณ์จะใช้งานได้ดีที่สุดดังนี้
เพื่อคาดการณ์ค่าสำหรับระเบียนแต่ละรายการโดยที่แต่ละเครื่องหมายในการแสดงเป็นภาพแสดงถึงเอนทิตีที่แยกกัน เช่น ผลิตภัณฑ์ การขาย บุคคล และอื่นๆ แทนที่จะเป็นข้อมูลแบบรวม เนื่องจาก Tableau ถือว่าแต่ละเครื่องหมายมีแนวโน้มเท่ากันแม้ว่าเครื่องหมายหนึ่งรายการจะประกอบด้วยระเบียน 100 รายการและเครื่องหมายอื่นจะประกอบด้วยระเบียนละหนึ่งรายการ เครื่องมือทางสถิติไม่ได้พิจารณาเครื่องหมายตามจำนวนของระเบียนที่สร้างขึ้น
- การคาดการณ์ค่าสำหรับนิพจน์เป้าหมายแบบรวมโดยใช้ SUM และ COUNT
ข้อจำกัด
คุณต้องใช้ฟิลด์ที่คำนวณเพื่อขยายอนุกรมเวลาในอนาคต หากต้องการข้อมูลเพิ่มเติม โปรดดู การคาดการณ์อนาคต
ตัวคาดการณ์ควรอยู่ในระดับรายละเอียดเดียวกันหรือสูงกว่ามุมมอง หมายความว่าหากมุมมองของคุณรวมกันตามรัฐ คุณควรใช้รัฐหรือภูมิภาคเป็นตัวคาดการณ์แต่ไม่ใช่เมือง หากต้องการข้อมูลเพิ่มเติม โปรดดู การเลือกตัวคาดการณ์
การคำนวณการคาดการณ์หยุดทำงานเมื่อไหร่
ไม่ว่าคุณจะใช้แบบจำลองใดก็ตาม คุณต้องมีจุดข้อมูลอย่างน้อยสามจุดในแต่ละขอบเขตเพื่อให้แบบจำลองแสดงผลการตอบกลับ
หากคุณได้ระบุการถดถอยของกระบวนการเกาส์เซียนเป็นแบบจำลอง สามารถใช้ได้ในการคำนวณแบบคาดการณ์ด้วยตัวคาดการณ์มิติข้อมูลแบบเรียงลำดับหนึ่งตัวและตัวคาดการณ์มิติข้อมูลแบบไม่เรียงลำดับจำนวนใดก็ได้ ไม่รองรับการวัดผลเป็นตัวคาดการณ์ในการคาดการณ์แบบการถดถอยของกระบวนการเกาส์เซียน แต่สามารถใช้ในการคำนวณการถดถอยเชิงเส้นแบบเชิงเส้นและแบบสม่ำเสมอ หากต้องการข้อมูลเพิ่มเติมเกี่ยวกับการเลือกแบบจำลอง โปรดดู การเลือกแบบจำลองแบบคาดการณ์
หากการคำนวณของคุณใช้ ATTR[รัฐ] เป็นตัวคาดการณ์และการแสดงเป็นภาพของคุณยังรวม “รัฐ” เป็นเครื่องหมายแต่ไม่มีฟิลด์อื่นๆ ในระดับของรายละเอียดที่ต่ำกว่า เช่น เมือง คุณจะส่งกลับข้อผิดพลาด เพื่อป้องกันปัญหานี้ เพียงตรวจสอบให้แน่ใจว่าไม่มีความสัมพันธ์แบบหนึ่งต่อหนึ่งระหว่างเครื่องหมายและหมวดหมู่ตัวคาดการณ์
หากต้องการข้อมูลเพิ่มเติมเกี่ยวกับปัญหาเหล่านี้และปัญหาการคาดการณ์อื่นๆ โปรดดู แก้ไขข้อผิดพลาดในฟังก์ชันการสร้างแบบจำลองแบบคาดการณ์
คำถามที่พบบ่อย
เครื่องหมายในกลุ่มตัวคาดการณ์แบบหลายกลุ่ม
หากมีการรวมแถวรวมจากข้อมูลที่มีอยู่ภายในกลุ่มตัวคาดการณ์แบบหลายกลุ่ม ค่าของฟังก์ชัน ATTR จะเป็นค่าพิเศษของหลายค่า ตัวอย่างเช่น ทุกเมืองที่มีอยู่ในหลายรัฐจะมีค่าที่คาดการณ์เหมือนกัน (เว้นแต่จะมีตัวคาดการณ์อื่นๆ ที่แตกต่างกัน) เมื่อเลือกตัวคาดการณ์ คุณควรใช้ตัวคาดการณ์ที่มีระดับของรายละเอียดเดียวกันกับการแสดงเป็นภาพหรือสูงกว่า และหากต้องการข้อมูลเพิ่มเติมเกี่ยวกับฟังก์ชัน ATTR โปรดดู เมื่อไหร่ควรใช้ฟังก์ชันแอตทริบิวต์ (ATTR)
จะเกิดอะไรขึ้นหากการรวม ATTR แสดงค่า *
* คือค่าที่ต่างกัน หาก ATTR แสดง * สำหรับทุกเครื่องหมาย คุณจะมีตัวคาดการณ์ที่มีค่าคงที่ซึ่งจะถูกเพิกเฉย ซึ่งเหมือนกับการไม่รวมตัวคาดการณ์นั้นเลย
หาก ATTR แสดง * สำหรับบางเครื่องหมายแต่ไม่ทั้งหมด จะถือว่าเป็นหมวดหมู่ที่ค่า * ทั้งหมดได้รับการพิจารณาว่าเหมือนกัน สถานการณ์นี้เหมือนกับสถานการณ์ข้างต้น ซึ่งมีเครื่องหมายอยู่ในกลุ่มตัวคาดการณ์แบบหลายกลุ่ม
กรณีที่ใช้ตัวเลือกเมนูการคำนวณตาราง “คำนวณโดยใช้”
ฟังก์ชันนี้ทำงานคล้ายกับ “คำนวณโดยใช้” ในการคำนวณตารางอื่นๆ หากต้องการข้อมูลเพิ่มเติม โปรดดู “คำนวณโดยใช้” และ “การแบ่งพาร์ติชันข้อมูล” ใน “แบบจำลองแบบคาดการณ์”
ทำไมจึงเกิดข้อผิดพลาด
มีสาเหตุหลายประการที่ทำให้คุณอาจพบข้อผิดพลาดเมื่อใช้ฟังก์ชันการสร้างแบบจำลองแบบคาดการณ์ หากต้องการดูขั้นตอนการแก้ปัญหาโดยละเอียด โปรดดู แก้ไขข้อผิดพลาดในฟังก์ชันการสร้างแบบจำลองแบบคาดการณ์