การแก้ไขข้อผิดพลาดในฟังก์ชันการสร้างแบบจำลองแบบคาดการณ์
เมื่อใช้ ฟังก์ชันการสร้างแบบจำลองแบบคาดการณ์ ใน Tableau คุณอาจพบกับข้อผิดพลาดเมื่อเพิ่มการคำนวณไปยังการแสดงเป็นภาพ ซึ่งสิ่งนี้เกิดขึ้นจากการผสมผสานตัวคาดการณ์และองค์ประกอบการแสดงเป็นภาพที่นำไปสู่การคำนวณเชิงคณิตศาสตร์ที่ไม่ถูกต้อง
โดยทั่วไปแล้ว สิ่งแรกที่ควรลองคือการตรวจสอบมิติข้อมูล คำนวณโดยใช้ อีกครั้ง ต่อไป ให้ตรวจสอบว่าไม่มีข้อมูลที่ไม่สอดคล้องกันจากระดับของรายละเอียดที่ระบุในตัวคาดการณ์ของคุณ และระดับของรายละเอียดในมุมมอง และตรวจสอบว่าตัวคาดการณ์ของคุณให้ข้อมูลที่เกี่ยวข้องกับแบบจำลองตามการแสดงเป็นภาพปัจจุบัน
ในบทความนี้ เราจะอธิบายปัญหาทั่วไปหลายประการอย่างละเอียด และวิธีที่คุณสามารถแก้ไขปัญหาดังกล่าว
ข้อผิดพลาดเกี่ยวกับฟังก์ชันการสร้างแบบจำลองแบบคาดการณ์มักเกิดขึ้นจากปัญหาอย่างน้อยหนึ่งประการต่อไปนี้ โดยขึ้นอยู่กับแบบจำลองที่ใช้
ข้อผิดพลาดทั่วไป
- มิติข้อมูล "คำนวณโดยใช้" ที่ไม่ถูกต้อง
- ตัวคาดการณ์มิติข้อมูลขัดแย้งกับระดับของรายละเอียดที่แสดงเป็นภาพ
- ตัวคาดการณ์หลายรายการขัดแย้งซึ่งกันและกัน
- มีข้อมูลไม่เพียงพอต่อการสร้างแบบจำลอง
- ไม่สามารถสร้างแบบจำลองที่เสร็จสมบูรณ์จากข้อมูลที่ให้ไว้
ข้อผิดพลาดจากการถดถอยของกระบวนการเกาส์เซียน
- การถดถอยของกระบวนการเกาส์เซียนกำหนดให้ใช้มิติข้อมูลที่มีลำดับเดียว
- การถดถอยของกระบวนการเกาส์เซียนรองรับเฉพาะมิติข้อมูลที่เป็นตัวคาดการณ์เท่านั้น
- ไม่มีข้อมูลการฝึกอบรมสำหรับเป้าหมายการคาดการณ์อย่างน้อยหนึ่งเป้าหมาย
- มีเครื่องหมายมากกว่า 5,000 รายการ
มิติข้อมูล "คำนวณโดยใช้" ที่ไม่ถูกต้อง
ขณะแสดงฟังก์ชันการสร้างแบบจำลองแบบคาดการณ์เป็นภาพ จะต้องมีการระบุมิติข้อมูล "คำนวณโดยใช้" ขอแนะนำให้คุณเลือกมิติข้อมูลที่เฉพาะเจาะจง (เช่น ภูมิภาค หรือ หมวดหมู่) แทนมิติข้อมูลเชิงทิศทาง (เช่น ตารางตรงข้ามแล้วลง หรือ แผงตรงข้าม)
เนื่องจากคุณอาจรวมฟังก์ชันการสร้างแบบจำลองแบบคาดการณ์หลายรายการในการแสดงเป็นภาพหรือแดชบอร์ด การเลือกมิติข้อมูลการแบ่งขอบเขตที่เฉพาะเจาะจงจะช่วยให้แน่ใจว่าคุณกำลังสร้างแบบจำลองด้วยเซตข้อมูลเบื้องหลังเดียวกันสำหรับแต่ละฟังก์ชัน หรืออีกนัยหนึ่งคือ การเปรียบเทียบผลลัพธ์จากแบบจำลองที่เหมือนกัน
หากต้องการข้อมูลเพิ่มเติมเกี่ยวกับการกำหนดทิศทางและการแบ่งขอบเขต โปรดดู เปลี่ยนค่าต่างๆ ด้วยการคำนวณตาราง
เมื่อทำงานร่วมกับฟังก์ชันการสร้างแบบจำลองแบบคาดการณ์ต่างๆ คุณจะต้องดำรงความสอดคล้องกันทั่วทั้งการสร้างอินสแตนซ์ที่ต่างกัน ทั้งในการวนซ้ำต่างๆ ของแบบจำลองของคุณ (เช่น เมื่อคุณเลือกตัวคาดการณ์ที่ต่างกัน) และในการแสดงเป็นภาพที่ต่างกัน การใช้มิติข้อมูล "คำนวณโดยใช้" เชิงทิศทางจะเปิดโอกาสให้การเปลี่ยนแปลงเพียงเล็กน้อยในข้อมูลที่แสดงเป็นภาพของคุณส่งผลกระทบอย่างเห็นได้ชัดต่อข้อมูลที่นำมาใช้เพื่อสร้างแบบจำลอง และจึงส่งผลต่อความถูกต้องและความสอดคล้องกันทั่วทั้งการแสดงเป็นภาพรายการต่างๆ
คุณอาจมองเห็น ค่า null หากไม่มีการระบุมิติข้อมูล "คำนวณโดยใช้" หรือหากมีการเลือกมิติข้อมูล "คำนวณโดยใช้" ที่ไม่ถูกต้อง
มิติข้อมูล "คำนวณโดยใช้" ที่ไม่ถูกต้องประกอบไปด้วยสิ่งต่อไปนี้:
- เซลล์: มิติข้อมูลนี้จะส่งผลให้มีการใช้จุดข้อมูลเดียวเพื่อสร้างแบบจำลองเสมอ และจะไม่สำเร็จ
- มิติข้อมูลที่ซ้อนกันในระดับสูงกว่า (ตัวอย่างเช่น หากภูมิภาค และ รัฐ มีการนำไปแสดงเป็นภาพทั้งคู่บนแกน โดยที่มีการสร้างเครื่องหมายสำหรับ รัฐ แต่จัดกลุ่มตาม ภูมิภาค) หากมีการเลือก ภูมิภาค เป็นมิติข้อมูลในการแบ่งขอบเขต ระบบจะคืนค่า null เนื่องจากไม่มีการทำเครื่องหมายอย่างเป็นทางการสำหรับ ภูมิภาค ในมุมมองนี้
ในการแสดงเป็นภาพข้างต้น มิติข้อมูล "คำนวณโดยใช้" ที่ถูกต้องได้แก่ รัฐ และ หมวดหมู่ การแบ่งขอบเขตข้อมูลตาม รัฐ หรือตาม หมวดหมู่ ให้ผลลัพธ์เครื่องหมายที่ถูกต้องหลายรายการที่สามารถนำไปสร้างแบบจำลองได้
ภูมิภาค แม้จะระบุว่าเป็นตัวเลือก "คำนวณโดยใช้" แต่ไม่ได้สร้างเครื่องหมายใดในระดับของรายละเอียดในมุมมองนี้ และจึงไม่สามารถใช้ในการแบ่งขอบเขตข้อมูลได้
หากต้องการข้อมูลเพิ่มเติม โปรดดู “คำนวณโดยใช้” และ “การแบ่งพาร์ติชันข้อมูล” ใน “แบบจำลองแบบคาดการณ์”
ตัวคาดการณ์มิติข้อมูลขัดแย้งกับระดับของรายละเอียดที่แสดงเป็นภาพ
ตัวคาดการณ์มิติข้อมูลต้องอยู่ในระดับของรายละเอียดเดียวกันกับที่มีการแสดงเป็นภาพหรือ สูงกว่า กล่าวคือ หากคุณแสดงข้อมูลเป็นภาพตาม รัฐ คุณสามารถใช้ รัฐ, ภูมิภาค หรือ ประเทศ เป็นตัวคาดการณ์ได้ แต่การใช้ เมือง เป็นตัวคาดการณ์จะทำให้เกิดข้อผิดพลาด เนื่องจากมีเมืองหลายเมืองอยู่ภายในรัฐ ตัวคาดการณ์นี้จะแก้ไขเป็น * สำหรับทุกเครื่องหมายและจะไม่ส่งคืนข้อมูลที่มีความหมาย และจึงทำให้ Tableau เพิกเฉย
ตัวคาดการณ์มิติข้อมูลแต่ละรายการจะต้องรวม ฟังก์ชัน ATTR ด้วย ตัวอย่างเช่น:
MODEL_PERCENTILE(SUM([Sales]), ATTR([State]), ATTR([Category])
ตัวคาดการณ์หลายรายการขัดแย้งซึ่งกันและกัน
ตัวคาดการณ์แต่ละรายการที่ใช้ภายในฟังก์ชันการสร้างแบบจำลองแบบคาดการณ์จะต้องให้ข้อมูลที่เป็นอิสระไปยังการคำนวณ หากตัวคาดการณ์สองรายการที่เลือกมีค่าเท่ากันทุกประการ เป็นเวอร์ชันที่ปรับขนาด หรือเป็นการแปลงย้อนกลับซึ่งกันและกัน ฟังก์ชันการสร้างแบบจำลองแบบคาดการณ์จะส่งคืนข้อผิดพลาดเมื่อแสดงเป็นภาพ
ตัวอย่างเช่น เซตข้อมูลที่ติดตามสภาพอากาศเมื่อเวลาผ่านไปอาจมีสองฟิลด์: IsRain และ IsClear ทั้งสองฟิลด์คือค่าแปลงย้อนกลับซึ่งกันและกัน นั่นก็คือ IsClear = True เมื่อ IsRain = False และเช่นเดียวกันในทางกลับกัน การรวมทั้ง IsClear และ IsRain เป็นตัวคาดการณ์ในฟังก์ชันการสร้างแบบจำลองแบบคาดการณ์เดียวจะส่งคืนข้อผิดพลาด
โดยกรณีข้างต้นจะเป็นจริงสำหรับทั้งการวัดผลและมิติข้อมูลในฐานะตัวคาดการณ์
ในทั้งสองกรณี ข้อผิดพลาดนี้จะแก้ไขได้ด้วยการแก้ไขตัวคาดการณ์ของคุณเพื่อนำตัวคาดการณ์ที่มีความสัมพันธ์กันสูงออก หากต้องการข้อมูลเพิ่มเติม โปรดดู การเลือกตัวคาดการณ์
มีข้อมูลไม่เพียงพอต่อการสร้างแบบจำลอง
ต้องมีเครื่องหมายอย่างน้อยสามรายการภายในการแบ่งขอบเขตเพื่ออนุญาตให้ฟังก์ชันการสร้างแบบจำลองแบบคาดการณ์สร้างแบบจำลองและสร้างการคาดการณ์ หากมีเครื่องหมายสองรายการหรือน้อยกว่าในเซตข้อมูลที่นิยามโดยข้อมูลที่ดูและมิติข้อมูล "คำนวณโดยใช้" ฟังก์ชันการสร้างแบบจำลองแบบคาดการณ์จะส่งคืนผลลัพธ์ที่เป็น null
วิธีแก้ไขปัญหานี้ ให้แก้ไขระดับของรายละเอียดของคุณ พารามิเตอร์กรองข้อมูลของคุณ หรือมิติข้อมูล "คำนวณโดยใช้" ของคุณเพื่อให้การแบ่งขอบเขตแต่ละรายการมีเครื่องหมายมากกว่าสองรายการ
ไม่สามารถสร้างแบบจำลองที่เสร็จสมบูรณ์จากข้อมูลที่ให้ไว้
ข้อผิดพลาดนี้จะปรากฏหากมีความขัดแย้งกันระหว่างตัวคาดการณ์ที่เลือก ระดับของรายละเอียดที่แสดงเป็นภาพ และ/หรือมิติข้อมูล "คำนวณโดยใช้" จนกระทั่งเป็นไปไม่ได้ที่จะใช้ตัวคาดการณ์เพื่อสร้างแบบจำลอง
ตัวอย่างเช่น ลองมาดูการคำนวณ MODEL_QUANTILE นี้:
MODEL_QUANTILE(0.5, MEDIAN([Profit]), ATTR(MONTH([Order Date])))
การนำการคำนวณนี้ไปใช้กับการแสดงเป็นภาพ โดยที่แต่ละเครื่องหมายแทนที่ค่า รัฐ จะส่งคืนข้อผิดพลาดด้านล่างนี้:
เนื่องจากไม่ได้มีการใช้ วันที่สั่งซื้อ เพื่อแสดงข้อมูลเป็นภาพหรือแบ่งเซกเมนต์ข้อมูล ฟังก์ชันการสร้างแบบจำลองแบบคาดการณ์จะไม่สามารถใช้ตัวคาดการณ์ที่ระบุเพื่อสร้างแบบจำลองได้
วิธีการแก้ไข:
- อัปเดตการแสดงเป็นภาพของคุณให้รวมตัวคาดการณ์เป็นมิติข้อมูล
- อัปเดตฟังก์ชันของคุณให้นำตัวคาดการณ์ที่ไม่เกี่ยวข้องออก
ทั้งนี้ควรตระหนักว่าข้อผิดพลาดนี้บ่งบอกถึงความไม่สอดคล้องกันระหว่างการแสดงเป็นภาพและตัวคาดการณ์ที่เฉพาะเจาะจงของการคำนวณตาราง การคำนวณเดียวกันนี้อาจทำงานได้โดยไม่มีปัญหาหากนำไปใช้กับการแสดงเป็นภาพที่รวม วันที่สั่งซื้อ เป็นมิติข้อมูล
การถดถอยของกระบวนการเกาส์เซียนกำหนดให้ใช้มิติข้อมูลที่มีลำดับเดียว
คุณจะต้องรวมมิติข้อมูลที่มีลำดับเดียวเป็นตัวคาดการณ์ หากต้องการใช้การถดถอยของกระบวนการเกาส์เซียน คุณสามารถรวมมิติข้อมูลที่ ไม่มีลำดับ เป็นตัวคาดการณ์เพิ่มเติมได้ การวัดผลไม่สามารถนำมาใช้เป็นตัวคาดการณ์ได้กับการถดถอยของกระบวนการเกาส์เซียน
หากคุณพบข้อผิดพลาดนี้ ให้เพิ่มตัวคาดการณ์มิติข้อมูลที่เรียงลำดับไปยังการคำนวณตารางของคุณ ให้นำตัวคาดการณ์มิติข้อมูลที่เรียงลำดับที่เป็นส่วนเกินออก หรือระบุว่าให้ใช้หนึ่งในมิติข้อมูลที่เรียงลำดับเป็นมิติข้อมูลที่ไม่เรียงลำดับ
เนื่องจากการถดถอยของกระบวนการเกาส์เซียนเหมาะสมสำหรับการใช้งานกับข้อมูลอนุกรมเวลามากที่สุด การทำเช่นนี้มักใช้ตัวคาดการณ์ในรูปแบบที่อิงตามเวลา เช่น ATTR(DATETRUNC('month',[Order Date])) สามารถนำ date_part ใดๆ มาใช้ในนิพจน์ DATETRUNC ก็ได้ แต่ date_part จะต้องอยู่ในระดับเดียวกันหรือสูงกว่าการแสดงเป็นภาพ หากการแสดงเป็นภาพใช้ WEEK([Order Date]) เป็นระดับการรวมข้อมูล หากเป็นเช่นนั้น date_part ต้องเป็น 'week','month','quarter' ฯลฯ โดยที่ไม่สามารถเป็น 'dayofyear', 'day', 'weekday', 'hour' ฯลฯ
โปรดทราบว่าเนื่องจาก ATTR(MONTH([Date])) ส่งคืนค่าสตริง จึงทำให้ไม่ทำงานในฐานะตัวคาดการณ์มิติข้อมูลที่เรียงลำดับ เว้นแต่จะมีการระบุด้วยตนเอง คุณทำเช่นนี้ได้ด้วยการระบุ "ordered" ต่อหลังตัวคาดการณ์ทันที ดังเช่นด้านล่างนี้:
MODEL_PERCENTILE(
"model=gp",
SUM([Sales]),
"ordered",ATTR(MONTH([Order Date]))
)
หากคุณต้องการรวมมิติข้อมูลเวลาหลายรายการในตัวคาดการณ์ คุณจะต้องระบุว่ารายการใดที่คุณต้องการใช้เป็นมิติข้อมูลที่ไม่เรียงลำดับ คุณทำเช่นนี้ได้ด้วยการรวม "unordered" โดยตรงก่อนมิติข้อมูลนั้นๆ ดังเช่นด้านล่างนี้:
MODEL_PERCENTILE(
"model=gp",
SUM([Sales]),
ATTR(DATETRUNC('month',[Order Date]))
"unordered",ATTR(DATETRUNC('year',[Order Date]))
)
การพยายามใช้การคำนวณข้างต้นโดยไม่ระบุ "unordered" ด้านหน้า ATTR(DATETRUNC('year',[Order Date]) จะส่งคืนข้อผิดพลาด
นอกจากนี้ การกำหนดทิศทาง (หรือ "คำนวณโดยใช้") สำหรับการถดถอยของกระบวนการเกาส์เซียนจะต้องกำหนดไปยังฟิลด์เดียวกันกับตัวคาดการณ์มิติข้อมูลที่เรียงลำดับ
โดยจะสามารถเลือกการกำหนดทิศทาง (หรือ "คำนวณโดยใช้") ได้เพียงรายการเดียวสำหรับทุกแบบจำลอง
การถดถอยของกระบวนการเกาส์เซียนรองรับเฉพาะมิติข้อมูลที่เป็นตัวคาดการณ์เท่านั้น
คุณไม่สามารถใช้การวัดผลใดๆ เป็นตัวคาดการณ์ได้กับการถดถอยของกระบวนการเกาส์เซียน นำตัวคาดการณ์ที่เป็นการวัดผลออก
ข้อจำกัดนี้มีผลเฉพาะกับฟังก์ชันการสร้างแบบจำลองแบบคาดการณ์ที่ระบุการถดถอยของกระบวนการเกาส์เซียน ฟังก์ชันการถดถอยเชิงเส้น (หรือค่าเริ่มต้นที่เป็น OLS) และฟังก์ชันการถดถอยเชิงเส้นแบบปกติล้วนรองรับการวัดผลเป็นตัวคาดการณ์
ไม่มีข้อมูลการฝึกอบรมสำหรับเป้าหมายการคาดการณ์อย่างน้อยหนึ่งเป้าหมาย
การถดถอยของกระบวนการเกาส์เซียนกำหนดให้การแบ่งขอบเขตข้อมูลแต่ละรายการมีจุดข้อมูลอย่างน้อย n จุดเพื่อสร้างแบบจำลองแบบคาดการณ์และส่งคืนการคาดการณ์ หากคุณพบข้อผิดพลาดนี้ ให้แก้ไขการคาดการณ์ของคุณ
มีเครื่องหมายมากกว่า 5,000 รายการ
การถดถอยของกระบวนการเกาส์เซียนรองรับเฉพาะในการแสดงเป็นภาพที่มีเครื่องหมายน้อยกว่า 5,000 รายการ วิธีแก้ไขปัญหานี้ ให้อัปเดตระดับของรายละเอียดของคุณเพื่อลดจำนวนเครื่องหมาย หรือเลือกแบบจำลองทางสถิติอื่น