การเลือกแบบจำลองแบบคาดการณ์

ฟังก์ชันการสร้างแบบจำลองแบบคาดการณ์รองรับการถดถอยเชิงเส้น การถดถอยเชิงเส้นแบบปกติ และการถดถอยของกระบวนการเกาส์เซียน แบบจำลองเหล่านี้รองรับกรณีการใช้งานและประเภทการคาดการณ์ที่แตกต่างกัน รวมถึงมีข้อจำกัดที่แตกต่างกัน

แบบจำลองที่รองรับ

การถดถอยเชิงเส้น

การถดถอยเชิงเส้น(ลิงก์จะเปิดในหน้าต่างใหม่) (เรียกอีกอย่างว่าการถดถอยด้วยวิธีกําลังสองน้อยที่สุดหรือ OLS) จะทำงานได้ดีที่สุดเมื่อมีตัวคาดการณ์อย่างน้อยหนึ่งตัวที่มีความสัมพันธ์เชิงเส้นระหว่างการคาดการณ์กับเป้าหมายการคาดการณ์ โดยที่ตัวคาดการณ์นั้นไม่ได้รับผลกระทบจากเงื่อนไขพื้นฐานเดียวกันและไม่แสดงสองอินสแตนซ์ของข้อมูลเดียวกัน (เช่น ยอดขายที่แสดงเป็นทั้งดอลลาร์และยูโร) การถดถอยเชิงเส้นเป็นแบบจำลองเริ่มต้นสำหรับฟังก์ชันการสร้างแบบจำลองแบบคาดการณ์ใน Tableau หากคุณไม่ได้ระบุแบบจำลอง ระบบก็จะใช้การถดถอยเชิงเส้น คุณสามารถระบุแบบจำลองนี้ได้อย่างชัดเจนโดยใส่ "model=linear” เป็นอาร์กิวเมนต์แรกในการคำนวณตารางของคุณ

ตัวอย่าง:

MODEL_QUANTILE(
"model=linear",
0.5,
SUM([Sales]),
ATTR(DATETRUNC('month',([Order Date]))
)

การถดถอยเชิงเส้นแบบปกติ

การถดถอยเชิงเส้นแบบปกติ(ลิงก์จะเปิดในหน้าต่างใหม่)จะใช้ได้ดีที่สุดเมื่อมีความสัมพันธ์เชิงเส้นโดยประมาณระหว่างตัวแปรอิสระตั้งแต่สองตัวขึ้นไป หรือเรียกว่า ภาวะร่วมเส้นตรงหลายตัวแปร (Multicollinearity)(ลิงก์จะเปิดในหน้าต่างใหม่) ซึ่งมักพบเห็นได้ในชุดข้อมูลจริง หากต้องการใช้แบบจำลองนี้แทนการถดถอยเชิงเส้นเริ่มต้น ให้ใส่ "model=rl” เป็นอาร์กิวเมนต์แรกในการคำนวณตารางของคุณ

ตัวอย่าง:

MODEL_QUANTILE(
"model=rl",
0.5,
SUM([Sales]),
ATTR(DATETRUNC('month',([Order Date]))
)

การถดถอยของกระบวนการเกาส์เซียน

การถดถอยของกระบวนการเกาส์เซียน(ลิงก์จะเปิดในหน้าต่างใหม่) จะทำงานได้ดีที่สุดเมื่อสร้างการคาดการณ์ในโดเมนต่อเนื่อง เช่น เวลาหรือช่องว่าง หรือเมื่อมีความสัมพันธ์แบบไม่เชิงเส้นระหว่างตัวแปรกับเป้าหมายการคาดการณ์ การถดถอยของกระบวนการแบบเกาส์เซียนใน Tableau ต้องมีมิติข้อมูลแบบเรียงลำดับเพียงมิติเดียวเป็นตัวคาดการณ์ แต่อาจรวมมิติข้อมูลแบบไม่เรียงลำดับเป็นตัวคาดการณ์ได้เช่นกัน โปรดทราบว่าไม่สามารถใช้การวัดผลเป็นตัวคาดการณ์ในการถดถอยของกระบวนการเกาส์เซียนใน Tableau ได้ หากต้องการใช้แบบจำลองนี้แทนการถดถอยเชิงเส้นเริ่มต้น ให้ใส่ "model=gp" เป็นอาร์กิวเมนต์แรกในการคำนวณตารางของคุณ

หมายเหตุ: มิติข้อมูลแบบเรียงลำดับคือค่าใดๆ ที่สามารถจัดลำดับได้ เช่น MONTH มิติข้อมูลแบบไม่เรียงข้อมูลคือค่าใดๆ ที่มีค่าไม่มีลำดับภายใน เช่น เพศหรือสี

ตัวอย่าง:

MODEL_PERCENTILE(
"model=gp",
AVG([Days to Ship Actual]),
ATTR(DATETRUNC('month',([Order Date])))
)


คุณสามารถเลือกแบบจำลองของคุณโดยใช้เกณฑ์ด้านล่างต่อไปนี้เป็นการแก้ปัญหาเบื้องต้น

  • การถดถอยเชิงเส้น (ค่าเริ่มต้น): ใช้เมื่อคุณมีตัวคาดการณ์เพียงตัวเดียว และตัวคาดการณ์ดังกล่าวมีความสัมพันธ์เชิงเส้นกับเมตริกเป้าหมายของคุณ

  • การถดถอยเชิงเส้นแบบปกติ: ใช้เมื่อคุณมีตัวคาดการณ์หลายตัว โดยเฉพาะอย่างยิ่งเมื่อตัวคาดการณ์เหล่านั้นมีความสัมพันธ์เชิงเส้นกับเมตริกเป้าหมาย และตัวคาดการณ์เหล่านั้นมีแนวโน้มที่จะได้รับผลกระทบจากความสัมพันธ์หรือแนวโน้มพื้นฐานที่คล้ายคลึงกัน

  • การถดถอยของกระบวนการเกาส์เซียน: ใช้เมื่อคุณมีตัวคาดการณ์เวลาหรือพื้นที่ หรือเมื่อคุณมีการใช้ตัวคาดการณ์ที่อาจไม่มีความสัมพันธ์เชิงเส้นกับเมตริกเป้าหมาย

ขอบคุณสำหรับข้อเสนอแนะของคุณส่งข้อเสนอแนะของคุณเรียบร้อยแล้ว ขอขอบคุณ