คำอธิบายการพยากรณ์
กล่องโต้ตอบอธิบายการพยากรณ์จะอธิบายแบบจำลองการพยากรณ์ที่ Tableau คำนวณเพื่อการแสดงภาพของคุณ
เมื่อเปิดใช้งานการพยากรณ์ คุณสามารถเปิดกล่องโต้ตอบนี้ได้โดยเลือก การวิเคราะห์ > การพยากรณ์ > อธิบายการพยากรณ์
ข้อมูลในกล่องโต้ตอบอธิบายการพยากรณ์เป็นแบบอ่านเท่านั้น แต่คุณสามารถคลิกคัดลอกไปยังคลิปบอร์ด แล้ววางเนื้อหาบนหน้าจอในเอกสารที่สามารถแก้ไขได้
กล่องโต้ตอบอธิบายการพยากรณ์มีสองแท็บ ได้แก่ แท็บสรุปและแท็บแบบจำลอง
อธิบายการพยากรณ์ - แท็บสรุป
แท็บสรุปจะอธิบายแบบจำลองการพยากรณ์ที่ Tableau สร้างขึ้น รวมถึงรูปแบบทั่วๆ ไปที่ Tableau ค้นพบในข้อมูล
ตัวเลือกที่ใช้สร้างการพยากรณ์
ส่วนนี้จะสรุปตัวเลือกที่ Tableau ใช้ในการสร้างการพยากรณ์ Tableau เลือกตัวเลือกเหล่านี้กโดยอัตโนมัติหรือระบุไว้ในกล่องโต้ตอบตัวเลือกการพยากรณ์
อนุกรมเวลา—ฟิลด์วันที่ต่อเนื่องที่ใช้ในการกำหนดอนุกรมเวลา ในบางกรณี ค่านี้อาจไม่ใช่วันที่จริง โปรดดูการพยากรณ์เมื่อไม่มีวันที่ในมุมมอง
การวัด—การวัดค่าที่พยากรณ์ไว้
พยากรณ์ล่วงหน้า—ความยาวและช่วงวันที่ของการพยากรณ์
พยากรณ์ตาม—ช่วงวันที่ของข้อมูลจริงที่ใช้สร้างการพยากรณ์
ละเว้นล่าสุด—ตัวเลขช่วงเวลาที่ตอนท้ายของข้อมูลจริงที่ถูกละเว้น โดยที่ข้อมูลการพยากรณ์จะแสดงสำหรับช่วงเวลาเหล่านี้ ค่านี้กำหนดโดยตัวเลือกละเว้นล่าสุดในกล่องโต้ตอบตัวเลือกการพยากรณ์
รูปแบบตามฤดูกาล—ความยาวของรอบฤดูกาลที่ Tableau พบในข้อมูล หรือ “เว้นว่างไว้” หากไม่พบรอบฤดูกาลในการพยากรณ์ใดๆ เลย
ตารางสรุปการพยากรณ์
สำหรับแต่ละการวัดที่พยากรณ์ ตารางสรุปจะแสดงขึ้นเพื่ออธิบายการพยากรณ์ หากมุมมองไม่แยกย่อยเป็นหลายแผงเมื่อใช้มิติข้อมูล คอลัมน์จะแทรกไปในแต่ละตารางที่ระบุมิติข้อมูล ฟิลด์ในตารางสรุปการพยากรณ์ ได้แก่
ค่าเริ่มต้น—ค่าและช่วงการพยากรณ์ของช่วงเวลาการพยากรณ์ครั้งแรก
เปลี่ยนจากค่าเริ่มต้น—ความแตกต่างระหว่างจุดประมาณการพยากรณ์จุดแรกและจุดสุดท้าย ช่วงเวลาสำหรับทั้งสองจุดดังกล่าวจะแสดงในส่วนหัวของคอลัมน์ เมื่อค่าแสดงเป็นเปอร์เซ็นต์ ฟิลด์นี้จะแสดงเปอร์เซ็นต์การเปลี่ยนแปลงจากช่วงเวลาการพยากรณ์ครั้งแรก
เอฟเฟกต์ตามฤดูกาล—ฟิลด์เหล่านี้จะแสดงแบบจำลองที่ระบุว่ามีฤดูกาล นั่นคือรูปแบบการผันแปรที่เกิดขึ้นซ้ำๆ เมื่อเวลาผ่านไป โดยจะแสดงค่าสูงและต่ำขององค์ประกอบตามฤดูกาลของรอบฤดูกาลเต็มล่าสุดในอนุกรมเวลาที่รวค่าจริงและค่าการพยากรณ์ องค์ประกอบตามฤดูกาลแสดงถึงการเบี่ยงเบนจากแนวโน้มและแตกต่างกันไปราวๆ เลขศูนย์และมีผลรวมเป็นศูนย์ตลอดฤดูกาล
การมีส่วนร่วม—ขอบเขตที่แนวโน้มและฤดูกาลมีส่วนในการพยากรณ์ ค่าเหล่านี้แสดงเป็นเปอร์เซ็นต์และรวมกันได้ 100% เสมอ
คุณภาพ—ระบุว่าการพยากรณ์ตรงกับข้อมูลจริงมากน้อยเพียงใด ค่าที่ระบุได้คือ GOOD, OK และ POOR ระบบจะกำหนดให้การพยากรณ์อย่างง่ายเป็นการพยากรณ์ที่จะประมาณกาว่ารค่าของช่วงเวลาถัดไปจะเหมือนกันกับค่าของช่วงเวลาปัจจุบัน คุณภาพจะแสดงถึงความสัมพันธ์กับการพยากรณ์อย่างง่าย ดังนั้น OK จึงหมายความว่าการพยากรณ์มีแนวโน้มที่จะมีข้อผิดพลาดน้อยกว่าการพยากรณ์อย่างง่าย GOOD หมายความว่าการพยากรณ์มีข้อผิดพลาดน้อยกว่าครึ่งหนึ่ง และ POOR หมายความว่าการพยากรณ์มีข้อผิดพลาดมากกว่า
อธิบายการพยากรณ์ - แท็บแบบจำลอง
แท็บแบบจำลองจะให้สถิติที่ละเอียดมากขึ้นและค่าสัมประสิทธิ์การปรับเรียบสำหรับแบบจำลองการปรับเรียบแบบเอ็กซ์โปเนนเชียลของ Holt-Winters ที่เป็นพื้นฐานของการพยากรณ์ สำหรับแต่ละการวัดที่พยากรณ์ ตารางจะแสดงถึงการอธิบายแบบจำลองการพยากรณ์ที่ Tableau สร้างขึ้นเพื่อการวัด หากมุมมองไม่แยกย่อยเป็นหลายแผงเมื่อใช้มิติข้อมูล คอลัมน์จะแทรกไปในแต่ละตารางที่ระบุมิติข้อมูล ตารางแบ่งเป็นส่วนต่อไปนี้:
แบบจำลอง
ระบุว่าองค์ประกอบ ระดับ แนวโน้ม หรือฤดูกาลเป็นส่วนหนึ่งของแบบจำลองที่ใช้ในการสร้างการพยากรณ์หรือไม่ ค่าสำหรับแต่ละองค์ประกอบคือค่าใดค่าหนึ่งต่อไปนี้:
ไม่มี—องค์ประกอบไม่มีอยู่ในแบบจำลอง
เพิ่มเติม—มีองค์ประกอบอยู่และถูกเพิ่มไปยังองค์ประกอบอื่นๆ เพื่อสร้างค่าการคาดการณ์โดยรวม
ทวีคูณ—มีองค์ประกอบอยู่และทวีคูณไปยังองค์ประกอบอื่นๆ เพื่อสร้างค่าการคาดการณ์โดยรวม
เมตริกคุณภาพ
ชุดค่านี้ให้ข้อมูลทางสถิติเกี่ยวกับคุณภาพของแบบจำลอง
ค่า | คำนิยาม |
RMSE: รากของค่าเฉลี่ยข้อผิดพลาดยกกําลังสอง | |
MAE: ค่าเฉลี่ยข้อผิดพลาดสัมบูรณ์ | |
MASE: ค่าเฉลี่ยสเกลข้อผิดพลาดสัมบูรณ์ MASE จะวัดขนาดของข้อผิดพลาดเปรียบเทียบกับขนาดของข้อผิดพลาดของการพยากรณ์ล่วงหน้าอย่างง่ายเป็นอัตราส่วน การพยากรณ์อย่างง่ายจะถือว่าค่าของวันนี้จะเป็นค่าเดียวกันกับวันพรุ่งนี้ ดังนั้น MASE ที่ 0.5 หมายความว่าการพยากรณ์ของคุณมีแนวโน้มที่จะมีข้อผิดพลาดเพียงครึ่งเดียวของการพยากรณ์อย่างง่าย ซึ่งดีกว่า MASE ที่ 1.0 ที่ไม่ได้ดีไปกว่าพยากรณ์อย่างง่าย เนื่องจากนี่เป็นสถิติแบบนอร์มัลไลซ์นซึ่งกำหนดไว้สำหรับค่าทั้งหมด และให้น้ำหนักกับข้อผิดพลาดอย่างเท่าเทียมกัน จึงทำให้เป็นเมตริกที่ยอดเยี่ยมสำหรับการเปรียบเทียบคุณภาพของวิธีการพยากรณ์ต่างๆ ข้อดีของ MASE เหนือเมตริก MAPE โดยทั่วไปคือ MASE ถูกกำหนดไว้สำหรับอนุกรมเวลาที่มีค่าศูนย์ ในขณะที่ MAPE ไม่ใช่ และ MASE ยังให้น้ำหนักข้อผิดพลาดอย่างเท่าเทียมกัน ในขณะที่ MAPE ให้น้ำหนักข้อผิดพลาดเชิงบวกและ/หรือข้อผิดพลาดที่รุนแรงกว่ามาก | |
MAPE: ค่าเฉลี่ยเปอร์เซ็นต์ข้อผิดพลาดสัมบูรณ์ MAPE จะวัดขนาดของข้อผิดพลาดเปรียบเทียบกับขนาดของข้อมูลของคุณเป็นเปอร์เซ็นต์ ดังนั้น MAPE 20% จึงดีกว่า MAPE 60% ข้อผิดพลาดคือความแตกต่างระหว่างค่าการตอบสนองที่แบบจำลองประมาณการ และค่าการตอบสนองจริงสำหรับค่าที่ใช้ในการอธิบายแต่ละรายการในข้อมูลของคุณ เนื่องจากเป็นสถิติที่แบบนอร์มัลไลซ์ จึงสามารถใช้เพื่อเปรียบเทียบคุณภาพของแบบจำลองต่างๆ ที่คำนวณใน Tableau ได้ อย่างไรก็ตาม การเปรียบเทียบบางรายการนั้นไม่น่าเชื่อถือ เนื่องจากให้น้ำหนักข้อผิดพลาดบางประเภทมากกว่าประเภทอื่น นอกจากนี้ ยังไม่ได้มีการกำหนดสำหรับข้อมูลที่มีค่าศูนย์ | |
AIC: เกณฑ์ข้อมูล Akaike AIC เป็นเมตริกวัดคุณภาพแบบจำลองที่พัฒนาโดย Hirotugu Akaike ซึ่งจะลงโทษแบบจำลองที่ซับซ้อนเพื่อป้องกันไม่ให้ Overfitting ในคำจำกัดความนี้ k คือจำนวนพารามิเตอร์โดยประมาณ รวมถึงสถานะเริ่มต้น และ SSE คือผลรวมของข้อผิดพลาดยกกำลังสอง |
ในคำจำกัดความก่อนหน้านี้ ตัวแปรมีดังนี้:
ตัวแปร | ความหมาย |
t | ดัชนีของช่วงเวลาในอนุกรมเวลา |
n | ความยาวของอนุกรมเวลา |
m | จำนวนช่วงเวลาในฤดูกาล/รอบ |
A(t) | ค่าจริงของอนุกรมเวลาที่ช่วงเวลา t |
F(t) | ค่าที่พอดีหรือพยากรณ์ไว้ที่ช่วงเวลา t |
ส่วนที่เหลือคือ: e(t) = F(t)-A(t)
สัมประสิทธิ์การปรับให้เรียบ
ขึ้นอยู่กับอัตราการพัฒนาในระดับ แนวโน้ม หรือองค์ประกอบตามฤดูกาลของข้อมูล ค่าสัมประสิทธิ์การปรับให้เรียบได้รับการปรับให้เหมาะสมเพื่อให้น้ำหนักค่าของข้อมูลล่าสุดมากกว่าค่าที่เก่ากว่า ดังนั้นข้อผิดพลาดของการพยากรณ์ล่วงหน้าภายในตัวอย่างจะลดลง Alpha คือค่าสัมประสิทธิ์การปรับระดับให้เรียบ ส่วน beta คือค่าสัมประสิทธิ์การปรับแนวโน้มให้เรียบ และ gamma คือค่าสัมประสิทธิ์การปรับให้เรียบตามฤดูกาล ยิ่งค่าสัมประสิทธิ์การปรับให้เรียบใกล้เคียงกับ 1.00 มากเท่าใด การปรับให้เรียบก็จะน้อยลงเท่านั้น ซึ่งช่วยให้เปลี่ยนแปลงองค์ประกอบได้อย่างรวดเร็วและต้องอาศัยข้อมูลล่าสุดเป็นอย่างมาก ยิ่งค่าสัมประสิทธิ์การปรับให้เรียบใกล้เคียงกับ 0.00 มากเท่าใด การปรับให้เรียบก็จะมากขึ้นเท่านั้น ซึ่งช่วยให้ค่อยๆ เปลี่ยนแปลงองค์ประกอบและอาศัยข้อมูลล่าสุดน้อยลง