เมื่อใดควรใช้แบบจำลองความสัมพันธ์แบบหลายข้อเท็จจริง
แบบจำลองความสัมพันธ์แบบหลายข้อเท็จจริงคือแบบจำลองข้อมูลที่ช่วยให้คุณเพิ่มตารางที่ไม่เกี่ยวข้องในแหล่งข้อมูลเดียว จากนั้นใช้ฟิลด์ที่เกี่ยวข้องในระหว่างการวิเคราะห์การแสดงเป็นภาพเพื่อเชื่อมตารางเข้าด้วยกันตามบริบท ข้อมูลมีอยู่ภายในแหล่งข้อมูลเดียว ซึ่งต่างจากการผสมผสาน แนวคิดของแหล่งข้อมูลหลักและรองจะไม่มีผลและไม่มีข้อมูลจากการรวมด้านซ้าย ไม่เหมือนกับแบบจำลองข้อมูลตารางเดียว ตารางฐานหลายตารางจะรักษาบริบทของตัวเอง เกี่ยวกับตารางที่ใช้ร่วมกันระหว่างกัน แบบจำลองข้อมูลความสัมพันธ์แบบหลายข้อเท็จจริงช่วยให้คุณมีทางเลือกมากขึ้นในการทำการวิเคราะห์แบบหลายข้อเท็จจริงใน Tableau
ลองจินตนาการว่าคุณต้องการวิเคราะห์สภาพอากาศและแนวโน้มยอดขายไอศกรีมร่วมกัน สภาพอากาศและยอดขายไอศกรีมเกิดขึ้นในเวลาและสถานที่เฉพาะ แต่ไม่มีการเชื่อมโยงโดยตรงระหว่างยอดขายไอศกรีมและสภาพอากาศ ข้อมูลเหล่านี้ไม่เกี่ยวข้องซึ่งทั้งสองเกี่ยวข้องกับแนวคิดร่วมกันเกี่ยวกับวันที่และตำแหน่งที่ตั้ง
คำถามนี้มีส่วนช่วยในการการสร้างแบบจำลองความสัมพันธ์แบบหลายข้อเท็จจริง ยอดขายไอศกรีมและสภาพอากาศสามารถเพิ่มเป็นตารางฐานและเกี่ยวข้องกับวันที่และตำแหน่งที่ตั้ง ซึ่งเป็นตารางที่ใช้ร่วมกันได้
เพราะเหตุใดเราจึงสร้างความสามารถในการจำลองตารางที่ไม่เกี่ยวข้องกัน
การวิเคราะห์มักเกี่ยวข้องกับการนำตารางข้อมูลที่ไม่มีความสัมพันธ์โดยตรงมารวมกัน แต่ทั้งสองเกี่ยวข้องกับข้อมูลทั่วไปที่เหมือนกัน (เช่น วันที่หรือตำแหน่งที่ตั้ง) แบบจำลองความสัมพันธ์แบบหลายข้อเท็จจริงรองรับการเชื่อมโยงความหมายแบบหลวมๆ โดยการแนะนำแนวคิดของระดับความเกี่ยวข้องและความสามารถในการสร้างแบบจำลองข้อมูลที่มีตารางฐานหลายตารางที่ไม่เกี่ยวข้องกัน
การสร้างความสัมพันธ์ทางความหมายเป็นคำที่ใช้เพื่ออธิบายว่าข้อมูลรวมกันอย่างแน่นหนาเพียงใด การรวมกันหรือการผนวกเป็นการสร้างความสัมพันธ์ที่แน่นแฟ้น โดยนำหลายตารางมารวมกันเป็นตารางกายภาพใหม่ที่เป็นตารางเดียว ความสัมพันธ์เป็นการสร้างความสัมพันธ์ที่หลวมกว่าระหว่างตารางที่เชื่อมโยงตารางเข้าด้วยกันอย่างมีเหตุผล โดยคงสถานะที่แตกต่างกันเป็นตารางที่แยกจากกัน ยิ่งไปกว่านั้นตามสเปกตรัมการสร้างความสัมพันธ์ทางความหมายก็คือการผสานข้อมูล โดยที่ผลลัพธ์จากแหล่งข้อมูลที่แยกจากกันจะรวมกันเป็นภาพโดยพิจารณาจากองค์ประกอบที่ใช้ร่วมกันระหว่างแหล่งข้อมูลทั้งสอง แบบจำลองความสัมพันธ์แบบหลายข้อเท็จจริงอยู่ใกล้กับจุดสิ้นสุดของสเปกตรัมที่ผสานกัน แต่อยู่ภายในแหล่งข้อมูลเดียวแทนที่จะอยู่ในแหล่งข้อมูลต่างๆ
แบบจำลองความสัมพันธ์แบบหลายข้อเท็จจริงซึ่งเป็นแบบจำลองข้อมูลที่มีหลายตารางฐาน จะอนุญาตให้ใช้ตารางที่ไม่เกี่ยวข้องในแบบจำลองได้ ตราบเท่าที่มีตารางที่ใช้ร่วมกันอยู่ในแบบจำลองเช่นกัน ในระหว่างการวิเคราะห์ ฟิลด์จากตารางที่ใช้ร่วมกันจะ “เชื่อม” ตารางข้อมูลที่ไม่เกี่ยวข้องเข้าด้วยกันโดยอิงตามมิติข้อมูลที่ใช้ร่วมกันซึ่งมีเหมือนกัน (เช่น เกิดขึ้นในที่เดียวกันหรือเวลาเดียวกัน) ประโยชน์ทั้งหมดของความสัมพันธ์จะยังคงอยู่ รวมถึงการรักษารายละเอียดของแต่ละตาราง หรือระดับรายละเอียดดั้งเดิม
เช่นเดียวกับแบบจำลองข้อมูลตารางฐานเดียว Tableau จะกำหนดประเภทการรวมที่ดีที่สุดเพื่อใช้เบื้องหลังตามโครงสร้างของการแสดงเป็นภาพ แต่ในแบบจำลองความสัมพันธ์แบบหลายข้อเท็จจริง ตัวเลือกการรวมจะขยายเพื่อให้ครอบคลุมการรวมภายนอกและแบบไขว้เพื่อจัดการกับระดับความเกี่ยวข้องที่แตกต่างกัน หากต้องการข้อมูลเพิ่มเติม โปรดดูเกี่ยวกับแบบจำลองข้อมูลความสัมพันธ์แบบหลายข้อเท็จจริง
ชื่อมาจากที่ไหนบ้าง
ความสัมพันธ์แบบหลายข้อเท็จจริงได้ชื่อมาจากการวิเคราะห์แบบหลายข้อเท็จจริง ในแบบจำลองคลังข้อมูล ข้อมูลจะได้รับการจัดเก็บไว้ในตารางข้อเท็จจริงส่วนกลางที่ล้อมรอบด้วยตารางมิติข้อมูล ในบริบทนี้ ข้อเท็จจริงหมายถึงการวัดผลหรือเมตริก ซึ่งเป็นฟิลด์ตัวเลขของข้อมูลที่เก็บข้อเท็จจริงเกี่ยวกับข้อมูล นั่นก็คือการวัดผลของ Tableau ตารางมิติข้อมูลประกอบด้วยคุณลักษณะเกี่ยวกับข้อเท็จจริงเหล่านี้
สคีมาตามตารางข้อเท็จจริงมักมีโครงสร้างเป็นรูปดาวหรือเกล็ดหิมะขึ้นอยู่กับวิธีการจัดระเบียบตารางมิติข้อมูล เมื่อจำเป็นต้องทำการวิเคราะห์ข้ามตารางข้อเท็จจริง เรียกว่าการวิเคราะห์แบบหลายข้อเท็จจริง การวิเคราะห์จะดำเนินการในบริบทของตารางมิติข้อมูลทั่วไป ซึ่งเรียกว่ามิติข้อมูลที่ใช้ร่วมกันหรือมิติข้อมูลที่สอดคล้อง ใน Tableau คุณสามารถสร้างแบบจำลองข้อมูลเหล่านี้โดยใช้ความสัมพันธ์ ดังนั้นเราจึงตั้งชื่อชุดความสามารถนี้ว่าความสัมพันธ์แบบหลายข้อเท็จจริง
เมื่อใดควรใช้แบบจำลองข้อมูลความสัมพันธ์แบบหลายข้อเท็จจริง
หากข้อมูลของคุณประกอบด้วยตารางที่เกี่ยวข้องกันทั้งหมด คุณสามารถใช้แหล่งข้อมูลตารางฐานเดียวที่สร้างขึ้นด้วยความสัมพันธ์ได้ แบบจำลองความสัมพันธ์แบบหลายข้อเท็จจริงเรียกว่าเมื่อข้อมูลของคุณครอบคลุมแนวคิดที่แตกต่างกัน ไม่ว่าจะเป็นในรูปแบบของตารางแบบหลายข้อเท็จจริง หรือบริบทที่ไม่เกี่ยวข้องกัน
เมื่อใดก็ตามที่เป็นไปได้ ให้สร้างแหล่งข้อมูลของคุณด้วยตารางฐานเดียว ในแบบจำลองข้อมูลตารางฐานเดียว ทุกตารางมีความสัมพันธ์กัน และไม่จำเป็นต้องพิจารณาระดับของความเกี่ยวข้อง ใช้ความสัมพันธ์แบบหลายข้อเท็จจริงเมื่อมีการเรียกโครงสร้างแบบจำลองข้อมูลนั้นเท่านั้น
การวิเคราะห์แบบหลายข้อเท็จจริง
การวิเคราะห์แบบหลายข้อเท็จจริงเป็นกรณีการใช้งานหลักสำหรับความสัมพันธ์แบบหลายข้อเท็จจริงใน Tableau ในตัวอย่างนี้ ข้อเท็จจริง A และข้อเท็จจริง B ใช้วันที่ของตารางร่วมกัน
ในการสร้างแบบจำลองนี้ใน Tableau ตารางข้อเท็จจริงจะกลายเป็นตารางฐานและมีการสร้างความสัมพันธ์ขาเข้าหลายรายการสำหรับตารางมิติข้อมูลที่ใช้ร่วมกัน
สถานการณ์อื่น ๆ
อย่างไรก็ตาม แบบจำลองข้อมูลความสัมพันธ์แบบหลายข้อเท็จจริงไม่ได้มีไว้สำหรับการวิเคราะห์แบบหลายข้อเท็จจริงเท่านั้น Tableau ไม่กำหนดให้มีคำจำกัดความที่เข้มงวดของตารางข้อเท็จจริงหรือมิติข้อมูล ตารางใดก็ได้ที่สามารถเป็นตารางฐานได้ (แม้ว่าจะควรเหมาะกับลักษณะของตารางฐานก็ตาม) บางสถานการณ์ที่ระบุแหล่งข้อมูลแบบหลายตารางฐานอาจมีประโยชน์ ได้แก่
- การผ่านขั้นตอนต่างๆ เช่น ตารางฐานสำหรับการสมัคร ใบรับรองผลการเรียน และกิจกรรมศิษย์เก่าสำหรับตารางนักเรียนที่ใช้ร่วมกัน
- บริบทที่แตกต่างกันสำหรับเหตุการณ์เดียวกัน เช่น ตารางฐานสำหรับเหตุการณ์การนัดหมายทางการแพทย์และใบแจ้งหนี้โดยมีตารางที่ใช้ร่วมกันเพื่อกำหนดบริบทให้กับแพทย์หรือผู้ป่วย
- โดเมนต่างๆ ที่อาจสัมพันธ์กัน เช่น สถานการณ์ที่ก่อนหน้านี้จะจัดการได้ดีที่สุดด้วยการผสานข้อมูล เช่น ยอดขายไอศกรีมและสภาพอากาศที่สัมพันธ์กันผ่านตารางวันที่และตำแหน่งที่ตั้งที่ใช้ร่วมกัน
เรียนรู้เพิ่มเติมเกี่ยวกับเวลาที่ความสัมพันธ์แบบหลายข้อเท็จจริงมีประโยชน์ในบล็อกโพสต์ Tableau นี้: เวลาและวิธีใช้ความสัมพันธ์แบบหลายข้อเท็จจริงใน Tableau
ระบุตารางฐาน
ในรูปแบบความสัมพันธ์แบบหลายข้อเท็จจริง การกำหนดทิศทางมีความสำคัญ กล่าวคือ ตารางใดเป็นตารางฐานทางด้านซ้ายของแบบจำลอง และตารางใดที่ใช้ร่วมกันแบบดาวน์สตรีมจะส่งผลต่อวิธีประเมินความสัมพันธ์เพื่อส่งคืนผลลัพธ์การวิเคราะห์
พิจารณาแนวคิดแบบหูกระต่ายเกี่ยวกับใบแจ้งหนี้ การนัดหมาย แพทย์ และผู้ป่วย
วิธีที่ถูกต้องในการสร้างแบบจำลองข้อมูลใน Tableau คือการใช้ใบแจ้งหนี้และการนัดหมายเป็นตารางฐาน และโดยให้แพทย์และผู้ป่วยเป็นตารางที่ใช้ร่วมกัน (ไม่ใช่โดยให้แพทย์และผู้ป่วยเป็นตารางฐาน)
ถูกต้อง: ใบแจ้งหนี้และการนัดหมายเป็นตารางฐาน | ไม่ถูกต้อง: แพทย์และผู้ป่วยเป็นตารางฐาน |
ตามแนวคิดแล้ว ผู้ป่วย (หรือแพทย์) คือเอนทิตีที่เชื่อมเหตุการณ์ของการนัดหมายและเหตุการณ์ของใบแจ้งหนี้เข้าด้วยกัน
หากแบบจำลองข้อมูลของคุณเป็นแบบย้อนกลับ (เช่น โดยมีแพทย์และผู้ป่วยเป็นตารางฐาน แทนที่จะเป็นการนัดหมายและใบแจ้งหนี้) ลักษณะการเชื่อมสำหรับการรวมภายนอกจะไม่มีประโยชน์เท่าไหร่ การวิเคราะห์ของคุณอาจแสดงการวัดผลที่กำหนดขอบเขตตารางและความคลุมเครือจำนวนมาก หากคุณพบว่าตัวเองมีฟิลด์ที่เกี่ยวข้องอย่างคลุมเครือซึ่งคุณไม่คาดคิด ให้ประเมินตารางที่คุณใช้เป็นตารางฐานอีกครั้ง และดูว่าแบบจำลองข้อมูลของคุณจำเป็นต้องกลับรายการหรือไม่
ลักษณะของตารางฐานและตารางที่ใช้ร่วมกัน
หากคุณกำลังทำการวิเคราะห์แบบหลายข้อเท็จจริง ตารางข้อเท็จจริงจะกลายเป็นตารางฐาน และตารางมิติข้อมูลที่ใช้ร่วมกันจะเป็นตารางที่ใช้ร่วมกัน Tableau ไม่จำเป็นต้องยึดถือคุณลักษณะตารางข้อเท็จจริงและมิติข้อมูลอย่างเคร่งครัด อย่างไรก็ตาม มีแอตทริบิวต์บางอย่างที่สามารถช่วยคุณระบุได้ว่าตารางใดควรเป็นตารางฐานและตารางที่ใช้ร่วมกัน
ตารางฐาน | ตารางที่ใช้ร่วมกัน |
ตารางข้อเท็จจริงในสคีมาคลังข้อมูล | ตารางมิติข้อมูลที่ใช้ร่วมกันหรือสอดคล้องกันในสคีมาคลังข้อมูล |
เฉพาะเจาะจงกับบริบทหรือการวิเคราะห์ (ข้อมูลเที่ยวบิน, ปริมาณการใช้พลังงาน) | แนวคิดที่สอดคล้องกันในบริบทต่างๆ (ข้อมูล, ตำแหน่งที่ตั้ง) |
วัดผลอย่างเข้มข้น | มิติข้อมูลเบื้องต้น |
อัปเดต/ทำธุรกรรมบ่อยยิ่งขึ้น (การนัดหมายทางการแพทย์, ใบสั่งยา, ข้อมูลสำคัญ) | มีเสถียรภาพ/ทนทานมากขึ้น (แพทย์, ผู้ป่วย) |
มีฟิลด์คีย์นอก | มีฟิลด์คีย์หลัก |
ตามเหตุการณ์ (ตารางเรียน, เกรดในงานที่มอบหมาย) | ตามเอนทิตี (นักเรียน, ห้องเรียน) |
โปรดทราบว่าหากมีตารางกลางระหว่างตารางฐานและตารางที่ใช้ร่วมกัน คุณก็สามารถสลับเป็นตารางฐานโดยไม่ต้องเปลี่ยนแปลงแบบจำลองข้อมูลโดยพื้นฐาน (เช่น ข้อมูลห้องนั่งเล่นและยอดขายไอศกรีมในตัวอย่างแรก) สิ่งสำคัญคือตารางใดเป็นอัปสตรีมของตารางที่ใช้ร่วมกันและตารางใดใช้ร่วมกัน
ลองใช้ตารางฐานเพิ่มเติมแทน
มีสถานการณ์ต่างๆ ที่อาจบ่งชี้ว่าคุณควรสร้างแบบจำลองความสัมพันธ์แบบหลายข้อเท็จจริงที่มีตารางฐานหลายตาราง แทนที่จะเป็นแหล่งข้อมูลตารางฐานเดียว
- หากคุณกำลังพยายามสร้างแหล่งข้อมูลที่มีวงจร ตารางดาวน์สตรีมควรเป็นตารางฐานอื่นแทน
- หากคุณมีชุดของตารางที่เกี่ยวข้องกับส่วนคำสั่งความสัมพันธ์ชุดเดียวกัน (เช่น วันที่และตำแหน่งที่ตั้ง) ควรดึงมิติข้อมูลเหล่านั้นออกและสร้างเป็นตารางที่ใช้ร่วมกันแทน
- สิ่งนี้มีประโยชน์อย่างยิ่งเนื่องจากส่วนคำสั่งความสัมพันธ์หลายรายการจะต้องเป็นจริงทั้งหมด (ตามตรรกะคือ AND) เพื่อให้ตารางเกี่ยวข้องกับระเบียนเหล่านั้น
- หากคุณต้องการวิเคราะห์ระเบียนที่อาจเป็นจริงในแต่ละครั้ง (OR ตามบริบท) จะมีความยืดหยุ่นนี้จากการตั้งค่าแบบจำลองข้อมูลด้วยตารางมิติข้อมูลที่ใช้ร่วมกันแทน
- หากคุณใช้การผสมผสานแต่ต้องการให้การผสมผสานเทียบเท่ากันโดยไม่มีแหล่งข้อมูลหลักและรอง ให้สร้างแบบจำลองข้อมูลที่รวมแหล่งข้อมูลจากการผสมผสานกับฟิลด์การเชื่อมโยงในตารางหรือตารางที่ใช้ร่วมกัน