ตัวอย่าง - สำรวจอายุคาดเฉลี่ยของเพศหญิงด้วยฟังก์ชันการสร้างแบบจำลองเชิงคาดการณ์
ตัวอย่างนี้ใช้แหล่งข้อมูลที่บันทึกไว้ของตัวชี้วัดของโลกที่มาพร้อมกับ Tableau เราจะใช้ฟังก์ชันการสร้างแบบจำลองเชิงคาดการณ์ MODEL_QUANTILE และ MODEL_PERCENTILE เพื่อสำรวจความสัมพันธ์ระหว่างการใช้จ่ายด้านสุขภาพต่อหัว อายุคาดเฉลี่ยของเพศหญิง และอัตราการเกิด
มาเริ่มต้นกันด้วยการแสดงเป็นภาพที่เปรียบเทียบการใช้จ่ายด้านสุขภาพของแต่ละประเทศกับอายุคาดเฉลี่ยของเพศหญิง หากต้องการติดตามและเข้าถึงมุมมองและแดชบอร์ดที่สร้างไว้ล่วงหน้า หรือเพื่อดูโซลูชัน ให้ดาวน์โหลดเวิร์กบุ๊กต่อไปนี้จาก Tableau Public: การสร้างแบบจำลองเชิงคาดการณ์ของอายุคาดเฉลี่ยของเพศหญิง
การใช้ MODEL_PERCENTILE
ขั้นแรกเราจะประเมินอายุคาดเฉลี่ยและค่าใช้จ่ายด้านสุขภาพสำหรับเครื่องหมายที่แสดงทั้งหมด การดำเนินการนี้จะช่วยให้ Tableau สร้างแบบจำลองจากเครื่องหมายเหล่านั้นและแสดงเปอร์เซ็นต์ไทล์สำหรับแต่ละแบบจำลองภายในแบบจำลอง
ขั้นตอนที่ 1: สร้างการคำนวณการคาดการณ์
หากคุณมี Tableau Server หรือ Tableau Cloud และต้องการเขียนบนเว็บแทนใน Tableau Desktop ให้เผยแพร่เวิร์กบุ๊กไปยัง Tableau Server คลิกเวิร์กบุ๊ก เลือกเวิร์กบุ๊ก จากนั้นใต้ “การดำเนินการ” ให้เลือกแก้ไขเวิร์กบุ๊ก
หลังจากที่เปิดเวิร์กบุ๊ก หลายๆ ชีตจะแสดงขึ้นมา คุณจะใช้ชีตเหล่านั้นเพื่อสร้างมุมมองของคุณ
ในเวิร์กบุ๊กตัวเริ่มต้น ให้คลิกชีตตัวเริ่มต้นแบบเปอร์เซ็นไทล์
เปิดเมนูการวิเคราะห์ที่ด้านบน จากนั้นเลือกสร้างฟิลด์ที่คำนวณ
ในตัวแก้ไขการคำนวณ ให้ทำดังนี้:
ตั้งชื่อการคำนวณ: ความคาดหวังและการใช้จ่ายเป็นเปอร์เซ็นต์ไทล์
ป้อนสูตรต่อไปนี้:
MODEL_PERCENTILE(AVG([Life Expectancy Female]), LOG(MEDIAN([Health Exp/Capita])))
คลิกตกลง
การคำนวณการคาดการณ์ได้เพิ่มเป็นฟิลด์ที่คำนวณในแผงข้อมูลแล้ว
การคำนวณนี้ใช้อายุคาดเฉลี่ยเป็นนิพจน์เป้าหมายและค่าใช้จ่ายด้านสุขภาพตามค่าค่ามัธยฐานเป็นตัวคาดการณ์ ในกรณีนี้ เราใช้การแปลงลอการิทึมบนแกนการใช้จ่ายด้านสุขภาพเช่นเดียวกับตัวคาดการณ์
ขั้นตอนที่ 2: เพิ่มการคำนวณการคาดการณ์ลงในมุมมอง
ในการแสดงเป็นภาพข้างต้น คุณสามารถเห็นการใช้จ่ายด้านสุขภาพของแต่ละประเทศเมื่อเทียบกับอายุคาดเฉลี่ยของเพศหญิงที่กรองจากปี 2012
ตอนนี้ลองเพิ่มการคำนวณ MODEL_PERCENTILE ลงในมุมมองและดูว่าเราจะได้รับข้อมูลเชิงลึกใดบ้าง
ลากความคาดหวังและการใช้จ่ายเป็นเปอร์เซ็นต์ไทล์ไปยังสีบนการ์ดเครื่องหมาย
คลิกลูกศรดรอปดาวน์บนปุ่ม แล้วเลือก คำนวณโดยใช้ > ประเทศ/ภูมิภาค
คลิกสีบนการ์ดเครื่องหมาย แล้วคลิกแก้ไขสี
ใต้ “ชุดสี” ให้เลือกสีส้ม-ฟ้าที่แตกต่างกัน
เลือกช่องทำเครื่องหมายสีแบบขั้นบันได
เลือกช่องทำเครื่องหมายย้อนกลับ
คลิกตกลง
คุณจะเห็นการแจกแจงของประเทศที่อายุคาดเฉลี่ยสำหรับสุขภาพสูงกว่าและต่ำกว่าที่คาดการณ์ไว้โดยขึ้นอยู่กับระดับการใช้จ่าย สังเกตว่าโดยทั่วไปแล้วเครื่องหมายสีแดงเข้มหมายความว่าอายุคาดเฉลี่ยสูงโดยสัมพันธ์กับการใช้จ่ายด้านการดูแลสุขภาพ สีน้ำเงินเข้มหมายความว่าอายุคาดเฉลี่ยต่ำโดยสัมพันธ์กับการใช้จ่ายด้านการดูแลสุขภาพ และสีเทาหมายความว่าอายุคาดเฉลี่ยใกล้เคียงกับสิ่งที่แบบจำลองคาดหวัง โดยขึ้นอยู่กับระดับการใช้จ่ายด้านการดูแลสุขภาพ
ขั้นตอนที่ 3: จัดกลุ่มผลลัพธ์ตามสี
เพื่อวิเคราะห์ให้ง่ายขึ้น ลองใช้การคำนวณการคาดการณ์ในการคำนวณใหม่เพื่อจัดกลุ่มผลลัพธ์ เราจะสร้างกลุ่มเพื่อให้เครื่องหมายเหนือเปอร์เซ็นไทล์ที่ 90 และต่ำกว่าเปอร์เซ็นไทล์ที่ 10 มีการจัดกลุ่มให้เข้ากัน เครื่องหมายในช่วงเปอร์เซ็นไทล์ที่ 80 -90 และช่วงเปอร์เซ็นไทล์ที่ 10 -20 จะมีการจัดกลุ่มให้เข้ากัน เรายังจะไฮไลต์เครื่องหมายที่มีค่า null และจัดการเครื่องหมายเหล่านั้นในภายหลังโดยใช้ฟังก์ชันการสร้างแบบจำลองแบบคาดการณ์อื่นๆ MODEL_QUANTILE
ในตัวแก้ไขการคำนวณ ให้ทำดังนี้:
ตั้งชื่อการคำนวณ: เปอร์เซ็นต์ไทล์ตามสี
ป้อนสูตรต่อไปนี้:
IF
ISNULL([Percentile Expectancy vs Spending])
THEN "Null"
ELSEIF [Percentile Expectancy vs Spending] >=0.9 OR
[Percentile Expectancy vs Spending] <=0.1
THEN "<10th & >90th percentile"
ELSEIF [Percentile Expectancy vs Spending] >=0.8 OR
[Percentile Expectancy vs Spending] <=0.2
THEN "<20th & >80th percentile"
ELSEIF [Percentile Expectancy vs Spending] >=0.7 OR
[Percentile Expectancy vs Spending] <=0.3
THEN "<30th & >70th percentile"
ELSEIF [Percentile Expectancy vs Spending] >=0.6 OR
[Percentile Expectancy vs Spending] <=0.4
THEN "<40th & >60th percentile"
ELSE "50th percentile +-10"
ENDเพิ่มการคำนวณใหม่ไปยังสีบนการ์ดเครื่องหมาย
คลิกลูกศรดรอปดาวน์บนปุ่ม แล้วเลือก คำนวณโดยใช้ > ประเทศ/ภูมิภาค
คลิก “สี” บนการ์ดเครื่องหมาย แล้วคลิกแก้ไขสี
ปรับสีเพื่อให้เห็นแนวโน้มได้ดียิ่งขึ้น ในกรณีนี้ ลองใช้ชุดสีไฟจราจรและใช้สีเทาสำหรับค่า null
คลิกตกลง
เมื่อดูที่เครื่องหมายสีส้มที่มุม ให้สังเกตว่าสหรัฐอเมริกาใช้จ่าย $8,895 ต่อประชากรเพศหญิงสำหรับอายุคาดเฉลี่ยที่ 81 ปี เมื่อดูตามแกน X ทางซ้าย คุณจะเห็นว่าประเทศอื่นๆ ใช้จ่ายน้อยกว่าและมีอายุคาดเฉลี่ยเท่ากัน
แบบจำลองจะประเมินจุดแข็งของความสัมพันธ์ในแต่ละจุด ซึ่งสหรัฐอเมริกาอยู่ใกล้กับจุดสูงสุดของช่วงที่คาดหวังของแบบจำลอง
ขั้นตอนที่ 4: เปรียบเทียบอายุคาดเฉลี่ยกับอัตราการเกิด
ถัดไป มาดูกันที่การแสดงเป็นภาพที่เปรียบเทียบอายุคาดเฉลี่ยของเพศหญิงกับอัตราการเกิด สังเกตว่ามีความสัมพันธ์เชิงลบระหว่างอัตราการเกิดและอายุคาดเฉลี่ยของเพศหญิง อย่างไรก็ตาม ไม่ได้หมายความว่าอัตราการเกิดที่สูงขึ้นทำให้อายุคาดเฉลี่ยของเพศหญิงลดลง อาจมีปัจจัยเพิ่มเติมที่ส่งผลกระทบต่อทั้งอัตราการเกิดและอายุคาดเฉลี่ยของเพศหญิงที่ไม่แสดงได้ในมุมมองนี้ของข้อมูล แต่ลองเพิ่มแบบจำลองและดูว่าแบบจำลองคาดว่าอายุคาดเฉลี่ยของเพศหญิงจะสูงขึ้นหรือต่ำลงเมื่อพิจารณาจากค่าใช้จ่ายด้านสุขภาพ
ในชีตอัตราการเกิด ให้เพิ่มการคำนวณการคาดการณ์เปอร์เซ็นต์ไทล์ตามสีลงในสีบนการ์ดเครื่องหมายเพื่อนำมาใช้ในมุมมอง
คลิกลูกศรดรอปดาวน์บนปุ่ม แล้วเลือก คำนวณโดยใช้ > ประเทศ/ภูมิภาค
คลิก “สี” บนการ์ดเครื่องหมาย แล้วคลิกแก้ไขสี แก้ไขสีเหมือนเดิมโดยใช้ชุดสีไฟจราจร แล้วก็สีเทาสำหรับค่า null
คลิกตกลง
ตอนนี้ข้อมูลมีการแจกแจงมากขึ้น แถบสีแดงที่มุมขวาล่างคือจุดที่อายุคาดเฉลี่ยต่ำสุดแต่อัตราการเกิดสูงสุดและค่าใช้จ่ายด้านการดูแลสุขภาพสัมพันธ์กับอายุคาดเฉลี่ยที่ต่ำ เมื่อพิจารณาเครื่องหมายสีแดงทั้งสองในจตุภาคบนซ้าย ซึ่งเกี่ยวข้องกับแอลเบเนียและอาร์เมเนียว่า คุณจะสังเกตเห็นว่าทั้งสองประเทศมีอายุคาดเฉลี่ยของเพศหญิงสูงกว่า อัตราการเกิดต่ำกว่า และค่าใช้จ่ายด้านสุขภาพต่ำ
จากที่คุณเห็น เราสามารถใช้ MODEL_PERCENTILE เพื่อระบุว่าทั้งสองประเทศนี้มีค่าผิดปกติ: แม้ว่าทั้งสองประเทศจะมีค่าใช้จ่ายในการดูแลสุขภาพที่ค่อนข้างต่ำ แต่ก็ยังมีอายุคาดเฉลี่ยที่ค่อนข้างสูงซึ่งอยู่ในบริบทของอัตราการเกิด
ตอนนี้ มาดูวิธีใช้ฟังก์ชันการสร้างแบบจำลองแบบคาดการณ์อีกแบบ MODEL_QUANTILE เพื่อทำการวิเคราะห์ต่อไป
การใช้ MODEL_QUANTILE
MODEL_QUANTILE ใช้เพื่อสร้างการคาดการณ์แบบตัวเลขหากคำนึงถึงเปอร์เซ็นต์ไทล์เป้าหมาย นิพจน์เป้าหมาย และตัวคาดการณ์ คือค่าผกผันของ MODEL_PERCENTILE
โปรดทราบว่าเรามีค่า null หลายค่าในผลลัพธ์ของเรา ซึ่งหมายความว่าบางประเทศไม่มีข้อมูลค่าใช้จ่ายด้านสุขภาพ เราจะใช้ MODEL_QUANTILE เพื่อประมาณค่าที่ขาดหายไปเหล่านั้น
ขั้นตอนที่ 1: สร้างการคำนวณการคาดการณ์
เราได้ทำงานกับการคำนวณนี้:
MODEL_PERCENTILE(AVG([Life Expectancy Female]), LOG(MEDIAN([Health Exp/Capita])))
อันดับแรก เราต้องการกลับฟังก์ชันนี้เพื่อแสดงการคาดการณ์สำหรับค่าใช้จ่ายด้านการดูแลสุขภาพตามอายุคาดเฉลี่ยของเพศหญิง
ในเวิร์กบุ๊กตัวเริ่มต้น ให้คลิกชีตตัวเริ่มต้นควอนไทล์
เปิดเมนูการวิเคราะห์ที่ด้านบน จากนั้นเลือกสร้างฟิลด์ที่คำนวณ
ในตัวแก้ไขการคำนวณ ให้ทำดังนี้:
- ตั้งชื่อการคำนวณ: ควอนไทล์ของความคาดหวังและการใช้จ่าย
ป้อนสูตรต่อไปนี้:
POWER(10, MODEL_QUANTILE(0.5, LOG(MEDIAN([Health Exp/Capita])), AVG([Life Expectancy Female])))
ลองแยกย้อยข้อมูลการคำนวณนี้เพื่อทำความเข้าใจให้ดีขึ้น:
- เราเริ่มต้นด้วย MODEL_QUANTILE ซึ่งอาร์กิวเมนต์แรกคือ 0.5 โดยระบุเปอร์เซ็นต์ไทล์ที่จะคาดการณ์
- นิพจน์เป้าหมายคือค่ามัธยฐานของค่าใช้จ่ายด้านสุขภาพต่อหัว
- ตัวคาดการณ์คืออายุคาดเฉลี่ยของเพศหญิง
- นอกจากนี้ เราสรุปข้อมูลฟังก์ชันภายในฟังก์ชัน POWER เพื่อแปลงนิพจน์เป้าหมายที่แปลงบันทึกกลับเป็นดอลลาร์
คลิกตกลง
การคำนวณการคาดการณ์ได้เพิ่มเป็นฟิลด์ที่คำนวณในแผงข้อมูลแล้ว
ขั้นตอนที่ 2: เพิ่มการคำนวณการคาดการณ์ลงในมุมมอง
ลากควอนไทล์ของความคาดหวังและการใช้จ่ายไปยังเคล็ดลับเครื่องมือบนการ์ดเครื่องหมาย
คลิกลูกศรดรอปดาวน์บนปุ่ม แล้วเลือก คำนวณโดยใช้ > ประเทศ/ภูมิภาค
คลิกเคล็ดลับเครื่องมือบนการ์ดเครื่องหมายและเพิ่มแถวสำหรับการคาดการณ์ MODEL_QUANTILE:
ตั้งชื่อแถวเคล็ดลับเครื่องมือ: การใช้จ่ายด้านสุขภาพที่คาดการณ์ไว้จากอายุคาดเฉลี่ยของเพศหญิง:
คลิกแทรกและเลือกการคำนวณเพื่อตรวจสอบว่าเคล็ดลับเครื่องมือจะแสดงการคาดการณ์ที่ไม่ซ้ำกันของเครื่องหมายแบบไดนามิกในขณะที่คุณโต้ตอบกับการแสดงเป็นภาพ
คลิกตกลง
ในขณะนี้การคำนวณ MODEL_QUANTILE มีเพียงหนึ่งตัวคาดการณ์: อายุคาดเฉลี่ยของเพศหญิง สังเกตว่าในขณะที่คุณย้ายจากซ้ายไปขวา ให้ดูเคล็ดลับเครื่องมือสำหรับเครื่องหมายที่มีอายุคาดเฉลี่ยที่เท่ากัน โดยแต่ละเครื่องหมายมีการใช้จ่ายด้านสุขภาพที่คาดการณ์ไว้เหมือนกัน ค่าใช้จ่ายด้านสุขภาพที่คาดการณ์ไว้จากอายุคาดเฉลี่ยของของอินโดนีเซียอยู่ที่ 336 ดอลลาร์แต่สำหรับฟิจิ อียิปต์ และประเทศอื่นๆ ที่มีอายุคาดเฉลี่ยของเพศหญิงเท่ากัน
เนื่องจากแบบจำลองนี้แสดงค่าใช้จ่ายโดยประมาณเหมือนกันสำหรับแต่ละเครื่องหมาย เนื่องจากเราใช้ตัวคาดการณ์เพียงตัวเดียว (อายุคาดเฉลี่ยของเพศหญิง) แบบจำลองจะให้ผลลัพธ์ที่เหมือนกันสำหรับเครื่องหมายทั้งหมดที่ตัวคาดการณ์มีค่าเท่ากัน คุณสามารถเพิ่มความแตกต่างอื่นๆ ให้กับแบบจำลองโดยการเพิ่มตัวคาดการณ์
ขั้นตอนที่ 3: เพิ่มการคาดการณ์ด้วยตัวคาดการณ์ที่สอง
ในขณะที่สร้างการคาดการณ์ คุณควรพิจารณาว่าฟิลด์ใดจะเป็นตัวคาดการณ์ที่ดีสำหรับค่าเป้าหมายของคุณและรวมไว้ในการคำนวณของคุณ คุณสามารถรวมมิติข้อมูลและการวัดผลต่างๆ เข้าด้วยกันได้ ตัวอย่างเช่น เราสามารถเพิ่ม GDP, ประชากร และฟิลด์อื่นๆ เป็นตัวคาดการณ์เพื่อปรับปรุงการคาดการณ์ของเรา ในกรณีนี้ ให้เพิ่มภูมิภาค
ในตัวแก้ไขการคำนวณ ให้ทำดังนี้:
ตั้งชื่อการคำนวณ: ควอนไทล์ของการใช้จ่ายกับความคาดหวังและภูมิภาค
ป้อนสูตรต่อไปนี้ ซึ่งเหมือนกับการคำนวณก่อนหน้านี้แต่เพิ่มภูมิภาคเป็นตัวคาดการณ์:
POWER(10, MODEL_QUANTILE(0.5, LOG(MEDIAN([Health Exp/Capita])), AVG([Life Expectancy Female]), ATTR([Region])))
คลิกตกลง
ถัดไป เพิ่มการคำนวณใหม่ไปยังเคล็ดลับเครื่องมือบนการ์ดเครื่องหมาย
คลิกเคล็ดลับเครื่องมือ และเพิ่มบรรทัดอื่นเพื่ออธิบายการคาดการณ์ใหม่ เช่น การใช้จ่ายด้านสุขภาพที่คาดการณ์ไว้จากอายุคาดเฉลี่ยของเพศหญิงและภูมิภาค:
ตอนนี้เคล็ดลับเครื่องมือจะแสดงการคาดการณ์ทั้งสองอย่าง
ขั้นตอนที่ 4: เปรียบเทียบค่าจริงกับค่าที่คาดการณ์ไว้
สำหรับขั้นตอนสุดท้ายในการวิเคราะห์ คุณยังสามารถสร้างการคำนวณการคาดการณ์ที่รวมค่าจริงและค่าที่คาดการณ์ไว้ด้วยกัน ในตัวอย่างของเรา ลองแสดงค่าใช้จ่ายด้านสุขภาพที่เกิดขึ้นจริงเมื่อมีและค่าใช้จ่ายโดยประมาณเมื่อไม่มี
ในตัวแก้ไขการคำนวณ ให้ทำดังนี้:
ตั้งชื่อการคำนวณ: ค่าจริงของการใช้จ่ายด้านสุขภาพเทียบกับค่าที่คาดการณ์
ป้อนสูตรต่อไปนี้ซึ่งจะแสดงค่าตัวเลขของการคาดการณ์:
ROUND(IFNULL(AVG([Health Exp/Capita]),[Quantile_HE/Cap_LEF,Region]),0)
คลิกตกลง
สร้างการคำนวณอีกวิธีดังนี้:
ตั้งชื่อการคำนวณ: การใช้จ่ายด้านสุขภาพจริงเทียบกับแท็กการคาดการณ์
ป้อนสูตรต่อไปนี้ ซึ่งจะทำหน้าที่เป็นป้ายกำกับสำหรับการคำนวณข้างต้น:
STR(IF ISNULL(AVG([Health Exp/Capita])) THEN "(Estimate)" ELSE "(Actual)" END)
คลิกตกลง
ถัดไป เพิ่มการคำนวณทั้งสองไปยังเคล็ดลับเครื่องมือบนการ์ดเครื่องหมาย
คลิกเคล็ดลับเครื่องมือและเพิ่มบรรทัดอื่นเพื่ออธิบายการคำนวณใหม่:
ค่าใช้จ่ายด้านสุขภาพต่อหัว (จริงหรือโดยประมาณ):
แทรกการคำนวณใหม่ทีละรายการ
คลิกตกลง
ในขณะที่โต้ตอบกับการแสดงเป็นภาพ คุณสามารถดูค่าใช้จ่ายด้านสุขภาพต่อหัวของแต่ละประเทศหรือดูค่าประมาณหากค่าที่แท้จริงขาดหายไป (null) จากข้อมูล
คุณสามารถใช้ฟังก์ชันการสร้างแบบจำลองแบบคาดการณ์ใน Tableau เพื่อรับข้อมูลเชิงลึกจากข้อมูลของคุณได้ง่ายๆ