เมื่อใดควรใช้แบบจำลองความสัมพันธ์แบบหลายข้อเท็จจริง

แบบจำลองความสัมพันธ์แบบหลายข้อเท็จจริงคือแบบจำลองข้อมูลที่ช่วยให้คุณเพิ่มตารางที่ไม่เกี่ยวข้องในแหล่งข้อมูลเดียว จากนั้นใช้ฟิลด์ที่เกี่ยวข้องในระหว่างการวิเคราะห์การแสดงเป็นภาพเพื่อเชื่อมตารางเข้าด้วยกันตามบริบท ข้อมูลมีอยู่ภายในแหล่งข้อมูลเดียว ซึ่งต่างจากการผสมผสาน แนวคิดของแหล่งข้อมูลหลักและรองจะไม่มีผลและไม่มีข้อมูลจากการรวมด้านซ้าย ไม่เหมือนกับแบบจำลองข้อมูลตารางเดียว ตารางฐานหลายตารางจะรักษาบริบทของตัวเอง เกี่ยวกับตารางที่ใช้ร่วมกันระหว่างกัน แบบจำลองข้อมูลความสัมพันธ์แบบหลายข้อเท็จจริงช่วยให้คุณมีทางเลือกมากขึ้นในการทำการวิเคราะห์แบบหลายข้อเท็จจริงใน Tableau

ลองจินตนาการว่าคุณต้องการวิเคราะห์สภาพอากาศและแนวโน้มยอดขายไอศกรีมร่วมกัน สภาพอากาศและยอดขายไอศกรีมเกิดขึ้นในเวลาและสถานที่เฉพาะ แต่ไม่มีการเชื่อมโยงโดยตรงระหว่างยอดขายไอศกรีมและสภาพอากาศ ข้อมูลเหล่านี้ไม่เกี่ยวข้องซึ่งทั้งสองเกี่ยวข้องกับแนวคิดร่วมกันเกี่ยวกับวันที่และตำแหน่งที่ตั้ง

คำถามนี้มีส่วนช่วยในการการสร้างแบบจำลองความสัมพันธ์แบบหลายข้อเท็จจริง ยอดขายไอศกรีมและสภาพอากาศสามารถเพิ่มเป็นตารางฐานและเกี่ยวข้องกับวันที่และตำแหน่งที่ตั้ง ซึ่งเป็นตารางที่ใช้ร่วมกันได้

แบบจำลองข้อมูลหลายตารางฐานพร้อมตารางฐานสองตารางและตารางที่ใช้ร่วมกันสองตาราง

แบบจำลองข้อมูลหลายตารางฐาน โดยมีตารางที่ไม่เกี่ยวข้องสองตาราง (ยอดขายไอศกรีมและสภาพอากาศ) และตารางที่ใช้ร่วมกันสองตาราง (วันที่และตำแหน่งที่ตั้ง) มีตารางระดับกลาง, ข้อมูลห้องนั่งเล่น, ระหว่างยอดขายไอศกรีมและตำแหน่งที่ตั้ง

เพราะเหตุใดเราจึงสร้างความสามารถในการจำลองตารางที่ไม่เกี่ยวข้องกัน

การวิเคราะห์มักเกี่ยวข้องกับการนำตารางข้อมูลที่ไม่มีความสัมพันธ์โดยตรงมารวมกัน แต่ทั้งสองเกี่ยวข้องกับข้อมูลทั่วไปที่เหมือนกัน (เช่น วันที่หรือตำแหน่งที่ตั้ง) แบบจำลองความสัมพันธ์แบบหลายข้อเท็จจริงรองรับการเชื่อมโยงความหมายแบบหลวมๆ โดยการแนะนำแนวคิดของระดับความเกี่ยวข้องและความสามารถในการสร้างแบบจำลองข้อมูลที่มีตารางฐานหลายตารางที่ไม่เกี่ยวข้องกัน

  • การสร้างความสัมพันธ์ทางความหมายเป็นคำที่ใช้เพื่ออธิบายว่าข้อมูลรวมกันอย่างแน่นหนาเพียงใด การรวมกันหรือการผนวกเป็นการสร้างความสัมพันธ์ที่แน่นแฟ้น โดยนำหลายตารางมารวมกันเป็นตารางกายภาพใหม่ที่เป็นตารางเดียว ความสัมพันธ์เป็นการสร้างความสัมพันธ์ที่หลวมกว่าระหว่างตารางที่เชื่อมโยงตารางเข้าด้วยกันอย่างมีเหตุผล โดยคงสถานะที่แตกต่างกันเป็นตารางที่แยกจากกัน ยิ่งไปกว่านั้นตามสเปกตรัมการสร้างความสัมพันธ์ทางความหมายก็คือการผสานข้อมูล โดยที่ผลลัพธ์จากแหล่งข้อมูลที่แยกจากกันจะรวมกันเป็นภาพโดยพิจารณาจากองค์ประกอบที่ใช้ร่วมกันระหว่างแหล่งข้อมูลทั้งสอง แบบจำลองความสัมพันธ์แบบหลายข้อเท็จจริงอยู่ใกล้กับจุดสิ้นสุดของสเปกตรัมที่ผสานกัน แต่อยู่ภายในแหล่งข้อมูลเดียวแทนที่จะอยู่ในแหล่งข้อมูลต่างๆ

แบบจำลองความสัมพันธ์แบบหลายข้อเท็จจริงซึ่งเป็นแบบจำลองข้อมูลที่มีหลายตารางฐาน จะอนุญาตให้ใช้ตารางที่ไม่เกี่ยวข้องในแบบจำลองได้ ตราบเท่าที่มีตารางที่ใช้ร่วมกันอยู่ในแบบจำลองเช่นกัน ในระหว่างการวิเคราะห์ ฟิลด์จากตารางที่ใช้ร่วมกันจะ “เชื่อม” ตารางข้อมูลที่ไม่เกี่ยวข้องเข้าด้วยกันโดยอิงตามมิติข้อมูลที่ใช้ร่วมกันซึ่งมีเหมือนกัน (เช่น เกิดขึ้นในที่เดียวกันหรือเวลาเดียวกัน) ประโยชน์ทั้งหมดของความสัมพันธ์จะยังคงอยู่ รวมถึงการรักษารายละเอียดของแต่ละตาราง หรือระดับรายละเอียดดั้งเดิม

เช่นเดียวกับแบบจำลองข้อมูลตารางฐานเดียว Tableau จะกำหนดประเภทการรวมที่ดีที่สุดเพื่อใช้เบื้องหลังตามโครงสร้างของการแสดงเป็นภาพ แต่ในแบบจำลองความสัมพันธ์แบบหลายข้อเท็จจริง ตัวเลือกการรวมจะขยายเพื่อให้ครอบคลุมการรวมภายนอกและแบบไขว้เพื่อจัดการกับระดับความเกี่ยวข้องที่แตกต่างกัน หากต้องการข้อมูลเพิ่มเติม โปรดดูเกี่ยวกับแบบจำลองข้อมูลความสัมพันธ์แบบหลายข้อเท็จจริง

ชื่อมาจากที่ไหนบ้าง

ความสัมพันธ์แบบหลายข้อเท็จจริงได้ชื่อมาจากการวิเคราะห์แบบหลายข้อเท็จจริง ในแบบจำลองคลังข้อมูล ข้อมูลจะได้รับการจัดเก็บไว้ในตารางข้อเท็จจริงส่วนกลางที่ล้อมรอบด้วยตารางมิติข้อมูล ในบริบทนี้ ข้อเท็จจริงหมายถึงการวัดผลหรือเมตริก ซึ่งเป็นฟิลด์ตัวเลขของข้อมูลที่เก็บข้อเท็จจริงเกี่ยวกับข้อมูล นั่นก็คือการวัดผลของ Tableau ตารางมิติข้อมูลประกอบด้วยคุณลักษณะเกี่ยวกับข้อเท็จจริงเหล่านี้

สคีมาตามตารางข้อเท็จจริงมักมีโครงสร้างเป็นรูปดาวหรือเกล็ดหิมะขึ้นอยู่กับวิธีการจัดระเบียบตารางมิติข้อมูล เมื่อจำเป็นต้องทำการวิเคราะห์ข้ามตารางข้อเท็จจริง เรียกว่าการวิเคราะห์แบบหลายข้อเท็จจริง การวิเคราะห์จะดำเนินการในบริบทของตารางมิติข้อมูลทั่วไป ซึ่งเรียกว่ามิติข้อมูลที่ใช้ร่วมกันหรือมิติข้อมูลที่สอดคล้อง ใน Tableau คุณสามารถสร้างแบบจำลองข้อมูลเหล่านี้โดยใช้ความสัมพันธ์ ดังนั้นเราจึงตั้งชื่อชุดความสามารถนี้ว่าความสัมพันธ์แบบหลายข้อเท็จจริง

เมื่อใดควรใช้แบบจำลองข้อมูลความสัมพันธ์แบบหลายข้อเท็จจริง

หากข้อมูลของคุณประกอบด้วยตารางที่เกี่ยวข้องกันทั้งหมด คุณสามารถใช้แหล่งข้อมูลตารางฐานเดียวที่สร้างขึ้นด้วยความสัมพันธ์ได้ แบบจำลองความสัมพันธ์แบบหลายข้อเท็จจริงเรียกว่าเมื่อข้อมูลของคุณครอบคลุมแนวคิดที่แตกต่างกัน ไม่ว่าจะเป็นในรูปแบบของตารางแบบหลายข้อเท็จจริง หรือบริบทที่ไม่เกี่ยวข้องกัน

เมื่อใดก็ตามที่เป็นไปได้ ให้สร้างแหล่งข้อมูลของคุณด้วยตารางฐานเดียว ในแบบจำลองข้อมูลตารางฐานเดียว ทุกตารางมีความสัมพันธ์กัน และไม่จำเป็นต้องพิจารณาระดับของความเกี่ยวข้อง ใช้ความสัมพันธ์แบบหลายข้อเท็จจริงเมื่อมีการเรียกโครงสร้างแบบจำลองข้อมูลนั้นเท่านั้น

การวิเคราะห์แบบหลายข้อเท็จจริง

การวิเคราะห์แบบหลายข้อเท็จจริงเป็นกรณีการใช้งานหลักสำหรับความสัมพันธ์แบบหลายข้อเท็จจริงใน Tableau ในตัวอย่างนี้ ข้อเท็จจริง A และข้อเท็จจริง B ใช้วันที่ของตารางร่วมกัน

แบบจำลองข้อมูลแบบหลายข้อเท็จจริง

ในการสร้างแบบจำลองนี้ใน Tableau ตารางข้อเท็จจริงจะกลายเป็นตารางฐานและมีการสร้างความสัมพันธ์ขาเข้าหลายรายการสำหรับตารางมิติข้อมูลที่ใช้ร่วมกัน

แบบจำลองข้อมูลความสัมพันธ์แบบหลายข้อเท็จจริง

สถานการณ์อื่น ๆ

อย่างไรก็ตาม แบบจำลองข้อมูลความสัมพันธ์แบบหลายข้อเท็จจริงไม่ได้มีไว้สำหรับการวิเคราะห์แบบหลายข้อเท็จจริงเท่านั้น Tableau ไม่กำหนดให้มีคำจำกัดความที่เข้มงวดของตารางข้อเท็จจริงหรือมิติข้อมูล ตารางใดก็ได้ที่สามารถเป็นตารางฐานได้ (แม้ว่าจะควรเหมาะกับลักษณะของตารางฐานก็ตาม) บางสถานการณ์ที่ระบุแหล่งข้อมูลแบบหลายตารางฐานอาจมีประโยชน์ ได้แก่ 

  • การผ่านขั้นตอนต่างๆ เช่น ตารางฐานสำหรับการสมัคร ใบรับรองผลการเรียน และกิจกรรมศิษย์เก่าสำหรับตารางนักเรียนที่ใช้ร่วมกัน
  • บริบทที่แตกต่างกันสำหรับเหตุการณ์เดียวกัน เช่น ตารางฐานสำหรับเหตุการณ์การนัดหมายทางการแพทย์และใบแจ้งหนี้โดยมีตารางที่ใช้ร่วมกันเพื่อกำหนดบริบทให้กับแพทย์หรือผู้ป่วย
  • โดเมนต่างๆ ที่อาจสัมพันธ์กัน เช่น สถานการณ์ที่ก่อนหน้านี้จะจัดการได้ดีที่สุดด้วยการผสานข้อมูล เช่น ยอดขายไอศกรีมและสภาพอากาศที่สัมพันธ์กันผ่านตารางวันที่และตำแหน่งที่ตั้งที่ใช้ร่วมกัน

เรียนรู้เพิ่มเติมเกี่ยวกับเวลาที่ความสัมพันธ์แบบหลายข้อเท็จจริงมีประโยชน์ในบล็อกโพสต์ Tableau นี้: เวลาและวิธีใช้ความสัมพันธ์แบบหลายข้อเท็จจริงใน Tableau

ระบุตารางฐาน

ในรูปแบบความสัมพันธ์แบบหลายข้อเท็จจริง การกำหนดทิศทางมีความสำคัญ กล่าวคือ ตารางใดเป็นตารางฐานทางด้านซ้ายของแบบจำลอง และตารางใดที่ใช้ร่วมกันแบบดาวน์สตรีมจะส่งผลต่อวิธีประเมินความสัมพันธ์เพื่อส่งคืนผลลัพธ์การวิเคราะห์

พิจารณาแนวคิดแบบหูกระต่ายเกี่ยวกับใบแจ้งหนี้ การนัดหมาย แพทย์ และผู้ป่วย

แบบจำลองข้อมูลแบบหูกระต่ายที่มีใบแจ้งหนี้และการนัดหมายด้านนอก และแพทย์และคนไข้ตรงกลาง

วิธีที่ถูกต้องในการสร้างแบบจำลองข้อมูลใน Tableau คือการใช้ใบแจ้งหนี้และการนัดหมายเป็นตารางฐาน และโดยให้แพทย์และผู้ป่วยเป็นตารางที่ใช้ร่วมกัน (ไม่ใช่โดยให้แพทย์และผู้ป่วยเป็นตารางฐาน)

ถูกต้อง: ใบแจ้งหนี้และการนัดหมายเป็นตารางฐาน

ไม่ถูกต้อง: แพทย์และผู้ป่วยเป็นตารางฐาน

แบบจำลองข้อมูลแบบหลายตารางฐานที่มีใบแจ้งหนี้และการนัดหมายเป็นฐาน และแพทย์และผู้ป่วยเป็นตารางที่ใช้ร่วมกันแบบดาวน์สตรีมแบบจำลองข้อมูลแบบหลายตารางฐานที่มีแพทย์และผู้ป่วยเป็นตารางฐาน และใบแจ้งหนี้และการนัดหมายเป็นตารางที่ใช้ร่วมกันแบบดาวน์สตรีม

ตามแนวคิดแล้ว ผู้ป่วย (หรือแพทย์) คือเอนทิตีที่เชื่อมเหตุการณ์ของการนัดหมายและเหตุการณ์ของใบแจ้งหนี้เข้าด้วยกัน

หากแบบจำลองข้อมูลของคุณเป็นแบบย้อนกลับ (เช่น โดยมีแพทย์และผู้ป่วยเป็นตารางฐาน แทนที่จะเป็นการนัดหมายและใบแจ้งหนี้) ลักษณะการเชื่อมสำหรับการรวมภายนอกจะไม่มีประโยชน์เท่าไหร่ การวิเคราะห์ของคุณอาจแสดงการวัดผลที่กำหนดขอบเขตตารางและความคลุมเครือจำนวนมาก หากคุณพบว่าตัวเองมีฟิลด์ที่เกี่ยวข้องอย่างคลุมเครือซึ่งคุณไม่คาดคิด ให้ประเมินตารางที่คุณใช้เป็นตารางฐานอีกครั้ง และดูว่าแบบจำลองข้อมูลของคุณจำเป็นต้องกลับรายการหรือไม่

ลักษณะของตารางฐานและตารางที่ใช้ร่วมกัน

หากคุณกำลังทำการวิเคราะห์แบบหลายข้อเท็จจริง ตารางข้อเท็จจริงจะกลายเป็นตารางฐาน และตารางมิติข้อมูลที่ใช้ร่วมกันจะเป็นตารางที่ใช้ร่วมกัน Tableau ไม่จำเป็นต้องยึดถือคุณลักษณะตารางข้อเท็จจริงและมิติข้อมูลอย่างเคร่งครัด อย่างไรก็ตาม มีแอตทริบิวต์บางอย่างที่สามารถช่วยคุณระบุได้ว่าตารางใดควรเป็นตารางฐานและตารางที่ใช้ร่วมกัน

ตารางฐาน

ตารางที่ใช้ร่วมกัน

ตารางข้อเท็จจริงในสคีมาคลังข้อมูล

ตารางมิติข้อมูลที่ใช้ร่วมกันหรือสอดคล้องกันในสคีมาคลังข้อมูล

เฉพาะเจาะจงกับบริบทหรือการวิเคราะห์

(ข้อมูลเที่ยวบิน, ปริมาณการใช้พลังงาน)

แนวคิดที่สอดคล้องกันในบริบทต่างๆ

(ข้อมูล, ตำแหน่งที่ตั้ง)

วัดผลอย่างเข้มข้น

มิติข้อมูลเบื้องต้น

อัปเดต/ทำธุรกรรมบ่อยยิ่งขึ้น

(การนัดหมายทางการแพทย์, ใบสั่งยา, ข้อมูลสำคัญ)

มีเสถียรภาพ/ทนทานมากขึ้น

(แพทย์, ผู้ป่วย)

มีฟิลด์คีย์นอก

มีฟิลด์คีย์หลัก

ตามเหตุการณ์

(ตารางเรียน, เกรดในงานที่มอบหมาย)

ตามเอนทิตี

(นักเรียน, ห้องเรียน)

โปรดทราบว่าหากมีตารางกลางระหว่างตารางฐานและตารางที่ใช้ร่วมกัน คุณก็สามารถสลับเป็นตารางฐานโดยไม่ต้องเปลี่ยนแปลงแบบจำลองข้อมูลโดยพื้นฐาน (เช่น ข้อมูลห้องนั่งเล่นและยอดขายไอศกรีมในตัวอย่างแรก) สิ่งสำคัญคือตารางใดเป็นอัปสตรีมของตารางที่ใช้ร่วมกันและตารางใดใช้ร่วมกัน

ลองใช้ตารางฐานเพิ่มเติมแทน

มีสถานการณ์ต่างๆ ที่อาจบ่งชี้ว่าคุณควรสร้างแบบจำลองความสัมพันธ์แบบหลายข้อเท็จจริงที่มีตารางฐานหลายตาราง แทนที่จะเป็นแหล่งข้อมูลตารางฐานเดียว

  • หากคุณกำลังพยายามสร้างแหล่งข้อมูลที่มีวงจร ตารางดาวน์สตรีมควรเป็นตารางฐานอื่นแทน
  • หากคุณมีชุดของตารางที่เกี่ยวข้องกับส่วนคำสั่งความสัมพันธ์ชุดเดียวกัน (เช่น วันที่และตำแหน่งที่ตั้ง) ควรดึงมิติข้อมูลเหล่านั้นออกและสร้างเป็นตารางที่ใช้ร่วมกันแทน
    • สิ่งนี้มีประโยชน์อย่างยิ่งเนื่องจากส่วนคำสั่งความสัมพันธ์หลายรายการจะต้องเป็นจริงทั้งหมด (ตามตรรกะคือ AND) เพื่อให้ตารางเกี่ยวข้องกับระเบียนเหล่านั้น
    • หากคุณต้องการวิเคราะห์ระเบียนที่อาจเป็นจริงในแต่ละครั้ง (OR ตามบริบท) จะมีความยืดหยุ่นนี้จากการตั้งค่าแบบจำลองข้อมูลด้วยตารางมิติข้อมูลที่ใช้ร่วมกันแทน
  • หากคุณใช้การผสมผสานแต่ต้องการให้การผสมผสานเทียบเท่ากันโดยไม่มีแหล่งข้อมูลหลักและรอง ให้สร้างแบบจำลองข้อมูลที่รวมแหล่งข้อมูลจากการผสมผสานกับฟิลด์การเชื่อมโยงในตารางหรือตารางที่ใช้ร่วมกัน
ขอบคุณสำหรับข้อเสนอแนะของคุณส่งข้อเสนอแนะของคุณเรียบร้อยแล้ว ขอขอบคุณ