ผสมผสานข้อมูลของคุณ

การผสานข้อมูลเป็นวิธีหนึ่งในการรวมข้อมูลจากหลายแหล่ง การผสานข้อมูลจะนำข้อมูลอื่นๆ จากแหล่งข้อมูลรองและแสดงร่วมกับข้อมูลจากแหล่งข้อมูลหลักโดยตรงในมุมมอง

การผสานข้อมูลนั้นเป็นประโยชน์อย่างยิ่งเมื่อความสัมพันธ์ที่ผสมผสาน หรือฟิลด์การเชื่อมโยงนั้นต้องแตกต่างกันไปในแต่ละชีต หรือเมื่อรวมแหล่งข้อมูลที่เผยแพร่แล้ว

ตัวเลือกในการรวมข้อมูล

มีวิธีมากมายในการรวมข้อมูล แต่ละวิธีนั้นมีข้อดีและข้อเสียของตนเอง

ความสัมพันธ์ เป็นวิธีตามค่าเริ่มต้น และสามารถใช้ได้กับอินสแตนซ์ส่วนใหญ่ รวมถึงการข้ามตารางร่วมกับระดับของรายละเอียด ความสัมพันธ์นั้นยืดหยุ่นและปรับเปลี่ยนให้เข้ากับโครงสร้างของการวิเคราะห์บนชีตได้ตามลักษณะของชีตได้ อย่างไรก็ตาม คุณไม่สามารถสร้างความสัมพันธ์ระหว่างตารางข้อมูลที่เผยแพร่ได้

ผสาน รวมตารางโดยการเพิ่มคอลัมน์ของข้อมูลให้กับเค้าโครงแถวที่เหมือนกันทั้งหมด วิธีนี้อาจทำให้เกิดการสูญหายของข้อมูลหรือการทำซ้ำได้หากตารางต่างๆ นั้นอยู่ในระดับรายละเอียดที่ต่างกัน และจะต้องสร้างการรวมก่อนจึงจะสามารถเริ่มการวิเคราะห์ได้ คุณไม่สามารถใช้แหล่งข้อมูลที่เผยแพร่ในการรวมได้

ผสมผสาน ต่างกับความสัมพันธ์หรือการรวม การผสมผสานนั้นจะไม่รวมข้อมูลเข้าด้วยกันได้โดยตรง แต่ในทางกลับกัน การผสมผสานจะสืบค้นแต่ละแหล่งข้อมูลโดยแยกกัน รวบรวมผลลัพธ์ในระดับที่เหมาะสม จากนั้นจะแสดงผลลัพธ์ร่วมกันในมุมมอง เนื่องด้วยเหตุนี้ การผสมผสานจึงสามารถใช้ได้กับระดับรายละเอียดมากมายและทำงานร่วมกับแหล่งข้อมูลที่เผยแพร่แล้วได้ด้วย การผสมผสานจะไม่สร้างแหล่งข้อมูลแบบผสมผสานใหม่ (จึงไม่สามารถเผยแพร่เป็น "แหล่งข้อมูลแบบผสม” ได้) แต่จะเป็นผลลัพธ์แบบผสมผสานที่แสดงเป็นภาพต่อชีต

ขั้นตอนในการผสานข้อมูล

การผสานข้อมูลจะดำเนินขึ้นในแต่ละชีตและจะสร้างขึ้นเมื่อฟิลด์จากแหล่งข้อมูลรองนั้นถูกใช้ในมุมมอง

หากต้องการสร้างการผสมผสานในเวิร์กบุ๊ก คุณต้องเชื่อมต่อกับแหล่งข้อมูลอย่างน้อยสองแหล่ง จากนั้นจึงนำฟิลด์จากแหล่งข้อมูลหนึ่งไปยังชีต ซึ่งจะกลายเป็นแหล่งข้อมูลหลัก สลับไปยังอีกแหล่งข้อมูลและใช้ฟิลด์จากชีตเดียวกันนั้น และแหล่งข้อมูลนั้นจะกลายเป็นแหล่งข้อมูลรอง ไอคอนเชื่อมโยงจะปรากฏขึ้นที่แผงข้อมูล ซึ่งบ่งชี้ว่าได้ใช้งานฟิลด์ใดในการผสมผสานแหล่งข้อมูล

  1. โปรดแน่ใจว่าเวิร์กบุ๊กมีแหล่งข้อมูลหลายแหล่ง เพิ่มแหล่งข้อมูลรองโดยไปที่ ข้อมูล > แหล่งข้อมูลใหม่

    เคล็ดลับ: การผสมผสานจะต้องใช้แหล่งข้อมูลสองแหล่งขึ้นไป โดยเป็นรายการที่แยกกันในแผงข้อมูล การเพิ่มการเชื่อมต่อเพิ่มเติมไปยังแหล่งข้อมูลแรกจะทำให้เกิดความสัมพันธ์และการรวมที่หน้าแหล่งข้อมูล

  2. ลากฟิลด์มายังมุมมอง แหล่งข้อมูลนี้จะเป็นแหล่งข้อมูลหลัก
  3. สลับไปยังอีกแหล่งข้อมูลและตรวจสอบว่ามีความสัมพันธ์แบบผสมผสานอยู่กับแหล่งข้อมูลหลัก
    • หากมีไอคอนฟิลด์การเชื่อมโยง () ปรากฏอยู่ แหล่งข้อมูลนั้นจะถูกลิงก์โดยอัตโนมัติ ตราบใดที่มีลิงก์ที่ใช้งานได้อยู่อย่างน้อยหนึ่งลิงก์ก็สามารถผสานข้อมูลได้
    • หากมีไอคอนลิงก์เสีย () ปรากฏอยู่ ให้คลิกที่ไอคอนที่อยู่ถัดจากฟิลด์นั้นซึ่งควรลิงก์แหล่งข้อมูลทั้งสองเข้าด้วยกัน เครื่องหมายทับจะหายไป ซึ่งแสดงว่าลิงก์ที่ใช้งานอยู่
    • หากไอคอนลิงก์ไม่ปรากฏขึ้นถัดจากฟิลด์ที่ต้องการ โปรดดู กำหนดความสัมพันธ์การผสานสำหรับการผสาน
  4. ลากฟิลด์มายังมุมมองจากแหล่งข้อมูลรอง

ทันทีที่มีการใช้งานแหล่งข้อมูลรองในมุมมองเดียวกันนั้น เท่ากับว่าได้มีการผสานเกิดขึ้น ในตัวอย่างด้านล่าง แหล่งข้อมูลหลักของเราคือ การดัดแปลงภาพยนตร์ และแหล่งข้อมูลรองคือ ร้านหนังสือ

  • แหล่งข้อมูลหลักนั้นจะบ่งชี้ด้วยเครื่องหมายติ๊กถูกสีน้ำเงินที่แหล่งข้อมูล ฟิลด์จากแหล่งข้อมูลหลักที่ใช้ในมุมมองนั้นจะไม่มีเครื่องหมายบ่งชี้
  • แหล่งข้อมูลรองจะบ่งชี้ด้วยเครื่องหมายติ๊กถูกสีส้มที่แหล่งข้อมูล และแถบสีส้มที่ด้านล่างของแผงข้อมูล ฟิลด์จากแหล่งข้อมูลรองที่ใช้ในมุมมองนั้นจะมีเครื่องหมายติ๊กถูกสีส้ม

ทำความเข้าใจแหล่งข้อมูลหลักและรอง

การผสานข้อมูลนั้นจะต้องมีแหล่งข้อมูลหลักและหนึ่งแหล่งข้อมูลรองเป็นอย่างน้อย แหล่งข้อมูลแรกที่ใช้ในมุมมองจะเป็นแหล่งข้อมูลหลักและเป็นตัวกำหนดมุมมอง ซึ่งอาจทำให้เกิดการจำกัดข้อมูลจากแหล่งข้อมูลรอง มีเพียงข้อมูลที่มีความเกี่ยวข้องกับแหล่งข้อมูลหลักเท่านั้นที่จะปรากฏในมุมมอง สามารถเปรียบเทียบได้กับการผนวกทางซ้าย

ตัวอย่างเช่น หากแหล่งข้อมูลหลักมรฟิลด์เดือนที่ประกอบไปด้วยเดือนเมษายน พฤษภาคม และมิถุนายน มุมมองใดๆ ที่สร้างโดยเกี่ยวข้องกับเดือนจะแสดงเพียงเดือนเมษายน พฤษภาคม และมิถุนายน แม้แหล่งข้อมูลรองจะมีเดือนครบทั้งสิบสองก็ตาม หากการวิเคราะห์ที่คุณต้องการนั้นมีสิบสองเดือน โปรดสลับการเลือกใช้แหล่งข้อมูลหลักโดยการสร้างชีตใหม่และใช้อีกแหล่งข้อมูลก่อน

เรียนรู้เพิ่มเติม: ผลกระทบของการเรียงแหล่งข้อมูล

ตัวอย่างต่อไปนี้ใช้แหล่งข้อมูลเดียวกันที่ลิงก์กันในฟิลด์เดียวกัน และการแสดงเป็นภาพนั้นสร้างขึ้นด้วยวิธีเดียวกันทั้งสองครั้ง ความแตกต่างของผลลัพธ์นั้นขึ้นอยู่กับว่าใช้แหล่งข้อมูลใดเป็นแหล่งข้อมูลหลัก

  1. ตรงนี้ ฟิลด์เดือนจากแหล่งข้อมูล Rainfall นั้นถูกนำเข้ามายังมุมมองก่อน เนื่องจาก Rainfall ประกอบไปด้วยสามเดือนเท่านั้น เมื่อชุดข้อมูล Pollen ถูกเพิ่มมาเป็นแหล่งข้อมูลรอง จึงมีเพียงสามเดือนเท่านั้นที่แสดงอยู่ในมุมมอง
  2. ภาพถ่ายหน้าจอของผลิตภัณฑ์และการแสดงเป็นภาพด้วยข้อมูลเพียงสามเดือนเท่านั้น
  3. ที่อีกชีต ฟิลด์เดือนจากแหล่งข้อมูล Pollen นั้นถูกนำเข้ามายังมุมมองก่อน ละมีการแสดงเดือนทั้งหมดสิบสองเดือน เมื่อชุดข้อมูล Rainfall นั้นถูกเพิ่มมาเป็นชุดข้อมูลรอง Rainfall จึงแสดงเพียงแค่สามเดือนในชุดข้อมูลนั้นเท่านั้น
  4. ภาพถ่ายหน้าจอของผลิตภัณฑ์และการแสดงเป็นภาพด้วยข้อมูลสิบสองเดือน

การทำงานในแหล่งข้อมูลที่ผสาน

เนื่องจากธรรมชาติของการผสานข้อมูล จึงมีสิ่งที่คุณควรคำนึงถึงเมื่อทำงานร่วมกับแหล่งข้อมูลที่ผสาน

การทำการคำนวณกับฟิลด์จากแหล่งข้อมูลมากกว่าหนึ่งแหล่งนั้นอาจมีความแตกต่างจากการคำนวณทั่วไปเล็กน้อย ต้องสร้างการคำนวณในแหล่งข้อมูลเดียว ด้านบนของตัวแก้ไขการคำนวณจะระบุว่าการคำนวณนั้นอยู่ในแหล่งข้อมูลใด

  • การรวม ฟิลด์ใดๆ ที่ใช้จากแหล่งข้อมูลอื่นจะเข้าร่วมกันเป็นการรวม ซึ่งเป็นผลรวมตามค่าเริ่มต้น แต่สามารถแก้ไขได้ เนื่องจากการคำนวณไม่สามารถผสมอาร์กิวเมนต์ที่เป็นการรวบรวมและอาร์กิวเมนต์ที่ใช่การรวบรวมเข้าด้วยกันได้ ดังนั้นฟิลด์จากแหล่งข้อมูลโฮสต์ของการคำนวณนั้นก็จะต้องเป็นแบบรวบรวมไปด้วย (ที่ภาพด้านล่าง การรวม SUM ถูกเพิ่มเข้ามาโดยอัตโนมัติ และการรวม sum ถูกเพิ่มเข้ามาโดยผู้ใช้เอง)
  • Dot notation. ฟิลด์ใดที่ใช้อ้างอิงในการคำนวณที่เป็นของแหล่งข้อมูลอื่นจะอ้างอิงกับแหล่งข้อมูลนั้นๆ โดยใช้ Dot Notation (ที่ภาพด้านล่าง สำหรับการคำนวณที่สร้างใน ตัวอย่าง - Superstore ฟิลด์เป้าหมายยอดขายกลายเป็น [Sales.Targets].[Sales Target] เมื่อการคำนวณถูกสร้างใน Sales Targets ฟิลด์ยอดขายจะกลายเป็น [ตัวอย่าง - Superstore].[Sales])
  • ซึ่งเป็นเวอร์ชันที่เหมือนกันกับการคำนวณเดียวกันที่สร้างในแต่ละแหล่งข้อมูล ในทั้งสองกรณี จะเท่ากับ SUM(ยอดขาย) / SUM(เป้าหมายยอดขาย)

นอกเหนือจากการจัดการกับการคำนวณแต่ละแบบโดยต่างกันแล้ว ยังมีข้อกำหนดบางประการกับแหล่งข้อมูลรองด้วย คุณอาจไม่สามารถทำการจัดเรียงตามฟิลด์จากแหล่งข้อมูลรองได้ และตัวกรองการดำเนินการอาจไม่สามารถทำงานได้ตามที่คาดกับข้อมูลที่ผสาน หากต้องการข้อมูลเพิ่มเติม โปรดดู ปัญหาการผสมผสานข้อมูลอื่นๆ

กำหนดความสัมพันธ์การผสานสำหรับการผสาน

เพื่อให้ Tableau รู้ว่าควรจะผสานข้อมูลจากหลายแหล่งอย่างไร จึงจำเป้นจะต้องมีมิติข้อมูลที่ตรงกันหรือมิติข้อมูลระหว่างแหล่งข้อมูลทั้งสอง มิติข้อมูลที่ตรงกันนั้นเรียกว่าฟิลด์ที่เชื่อมโยงกัน ฟิลด์ที่เชื่อมโยงกันที่ใช้งานได้นั้นจะระบุไว้ที่แผงข้อมูลสำหรับแหล่งข้อมูลรอง พร้อมกับไอคอนลิงก์ที่ใช้งานได้ () และฟิลด์ที่สามารถลิงก์ได้จะระบุโดยมีไอคอนลิงก์ที่เสียหาย () ฟิลด์การเชื่อมโยงไม่ได้ระบุไว้ในแหล่งข้อมูลหลัก

ตัวอย่างเช่น ในการผสานข้อมูลธุรกรรมและโควตา ฟิลด์ข้อมูลภูมิศาสตร์ควรจะเป็นฟิลด์เชื่อมโนง เพื่อให้คุณสามารถวิเคราะห์ทั้งโควต้าและประสิทธิภาพที่มีต่อโควตานั้นๆ ได้

หมายเหตุ: เพื่อให้การผสานทำงานได้ ฟิลด์ที่เชื่อมโยงควรจะมีค่าหรือสมาชิกที่เหมือนกันด้วย Tableau จะสร้างมุมมองของข้อมูลที่ผสานจากข้อมูลที่มีร่วมกัน ตัวอย่างเช่น หาก สี เป็นฟิลด์ที่เชื่อมโยงกันในแหล่งข้อมูลทั้งสอง Tableau จะจับคู่ข้อมูล “สีม่วง” จากแหล่งข้อมูลหลักและ “สีม่วง” จากแหล่งข้อมูลรอง แต่ “สีฟอ.” จะไม่ถูกแมปเข้ากับ “สีฟ้าอ่อน” อย่างถูกต้อง ดังนั้นควรจะต้องแก้ไขชื่อของฝั่งใดฝั่งหนึ่ง เช่นเดียวกับการเปลี่ยนชื่อฟิลด์เพื่อให้ Tableau สามารถระบุฟิลด์ที่เชื่อมโยงกันได้ คุณก็สามารถเปลี่ยนชื่อแทนของสมาชิกในฟิลด์เหล่านั้นได้ หากต้องการข้อมูลเพิ่มเติม โปรดดู สร้างชื่อแทนเพื่อเปลี่ยนชื่อสมาชิกในมุมมอง

สร้างการเชื่อมโยง

หากฟิลด์ที่เชื่อมโยงในแหล่งข้อมูลหลักและแหล่งข้อมูลรองนั้นมีชื่อเหมือนกัน Tableau จะสร้างความสัมพันธ์ขึ้นมาโดยอัตโนมัติ เมื่อได้สร้างแหล่งข้อมูลหลักขึ้นมาแล้ว (ซึ่งก็คือฟิลด์ที่ใช้ในมุมมอง) และได้เลือกแหล่งข้อมูลรองที่แผงข้อมูลแล้ว ฟิลด์ใดๆ ที่มีชื่อเหมือนกันระหว่างทั้งสองแหล่งข้อมูลจะแสดงไอคอนลิงก์ ( หรือ ) ในแหล่งข้อมูลรอง หากฟิลด์ที่เกี่ยวข้องจากแหล่งข้อมูลหลักนั้นถูกใช้ในมุมมอง ลิงก์ก็จะทำงานโดยอัตโนมัติ

หากไม่มีไอคอนลิงก์ที่แหล่งข้อมูลรอง คุณอาจจะต้องช่วยให้ Tableau สร้างลิงก์ด้วยหนึ่งในสองวิธีต่อไปนี้: 

  1. หากมิติข้อมูลที่มีเหมือนกันนั้นไม่ได้มีชื่อเหมือนกัน (เช่น “ชื่อเรื่อง” และ “ชื่อหนังสือ”) การเปลี่ยนชื่อฝั่งใดฝั่งหนึ่งจะทำให้ Tableau รู้ว่าทั้งสองนั้นเป็นมิติข้อมูลที่มีเหมือนกันและสร้างลิงก์ขึ้นมา

  2. นอกจากนั้น คุณยังสามารถกำหนดความสัมพันธ์ระหว่างฟิลด์ได้ด้วยตนเองในแหล่งข้อมูลหลักและรอง ดูด้านล่างหากต้องการข้อมูลเพิ่มเติมเกี่ยวกับการสร้างความสัมพันธ์ลิงก์ด้วยตนเอง

โดยสามารถมีฟิลด์ที่เชื่อมโยงกันที่ทำงานอยู่หรืออาจเป็นไปได้ได้มากกว่าหนึ่ง ตามความจำเป็น คลิกที่ไอคอนลิงก์ที่เสียหาย () ที่แผงข้อมูลเพื่อทำให้ความสัมพันธ์ทำงาน

การกำหนดความสัมพันธ์การเชื่อมโยงด้วยตนเอง

หากมิติข้อมูลที่มีร่วมกันนั้นไม่ได้มีชื่อเหมือนกัน คุณสามารถแมปความสัมพันธ์ระหว่างกันได้ด้วยตนเอง

  1. เลือก ข้อมูล > แก้ไขความสัมพันธ์การผสาน...

  2. ที่กล่องโต้ตอบความสัมพันธ์การผสาน ให้ยืนยันว่าเลือกแหล่งข้อมูลหลักแล้วจากรายการดรอปดาวน์ แหล่งข้อมูลหลัก

  3. เลือกแหล่งข้อมูลรองที่แผงแหล่งข้อมูลรอง ความสัมพันธ์แบบผสมผสานอัตโนมัติใดก็ตามที่มีอยู่จะมองเห็นได้ (และสามารถลบได้โดยวางเมาส์เหนือแถวนั้น แล้วคลิก x) เลือก กำหนดเอง ในรายการความสัมพันธ์ จากนั้นคลิกที่ เพิ่ม

  4. ในกล่องโต้ตอบ “เพิ่ม/แก้ไขการแมปฟิลด์” ให้ทำดังนี้:

    1. เลือกฟิลด์จากแหล่งข้อมูลหลัก

    2. เลือกฟิลด์ที่เปรียบเทียบได้จากแหล่งข้อมูลรอง

    3. คลิกตกลง

      ในตัวอย่างนี้ กลุ่มจะแมปกับกลุ่มลูกค้า

      ผลิตภัณฑ์ UI สำหรับกล่องโต้ตอบ “เพิ่ม/แก้ไขความสัมพันธ์”

      เคล็ดลับ: สำหรับวันที่ คุณสามารถระบุความสัมพันธ์ได้อย่างแม่นยำ ขยายฟิลด์วันที่และเลือกส่วนของวันที่ที่ต้องการ เช่น วันที่ เดือน หรือปีนั้นๆ และอื่นๆ

  5. สร้างการแมปฟิลด์ได้ตามจำนวนที่ต้องการ จากนั้นคลิกตกลง

การเชื่อมโยงมากกว่าหนึ่้ง

เช่นเดียวกับความสัมพันธ์หรือการรวม บางครั้งการเชื่อมโยงระหว่างแหล่งข้อมูลนั้นก็เกิดขึ้นมากกว่าหนึ่งฟิลด์ ตัวอย่างเช่น หากโควตายอดขายของภูมิภาคนั้นเป็นแบบรายเดือน การผสานระหว่างข้อมูลยอดขายแบบธุรกรรมและข้อมูลโควต้าจะต้องมีทั้งตามภูมิภาคและตามแต่ละเดือนเพื่อสร้างข้อมูลที่ถูกต้องและนำมาร่วมกันในมุมมอง คุณสามารถสร้างการเชื่อมโยงได้หลายรายการในเวลาเดียวกัน

เรียนรู้เพิ่มเติมที่ผลกระทบของฟิลด์การเชื่อมโยงมากกว่าหนึ่ง

เมื่อผสานข้อมูลตามฟิลด์ที่มากกว่าหนึ่ง ค่าจะถูกรวมเข้าในมุมมองเมื่อการรวมข้อมูลจากฟิลด์เหล่านั้นตรงกันกับชุดข้อมูลทั้งสองเท่านั้น ลองดูตัวอย่างเพื่อทำความเข้าใจกันดีกว่า

เรามีสองตาราง หนึ่งตารางคือนกที่นักชมนกได้เห็น และอีกตารางคือนกที่มีคนรายงานว่าถูกพบเห็น

และ

หากเราสร้างมุมมองแบบผสานด้วยฟิลด์ นักชมนก และ จำนวนของนก จากแหล่งข้อมูลหลัก (นกที่ถูกพบเห็น) และนำฟิลด์ จำนวนรายงาน จากแหล่งข้อมูลรอง (นกที่ถูกรายงาน) Tableau จะผสานเข้ากับ นักชมนก โดยอัตโนมัติ

เราเห็นได้ว่านักชมนก ก. นั้นเห็นนกสามตัวและรายงานสองตัว ข. เห็นนกสี่ตัวและรายงานหนึ่งตัว และ ค. เห็นนก 8 ตัวและรายงานสองตัว

แต่ก็มีฟิลด์ที่เชื่อมโยงที่เป็นไปได้อีกหนึ่งฟิลด์ ก็คือ สายพันธุ์ที่พบเห็น ทำไมถึงไม่ผสานฟิลด์นี้ด้วยกันล่ะ การทำเช่นนั้นจะเกิดความแตกต่างหรือไม่ 

จะเกิดความแตกต่างขึ้นมากทีเดียว เราเห็นได้ว่ามีเพียงรายงานเดียวจากนักชมนก ก. และ ค. ส่วน ข. คือค่า null เกิดอะไรขึ้น 

กลายเป็นว่านักชมนกเหล่านี้นั้นไม่ได้ซื่อสัตย์เสียเท่าไหร่ ในขณะที่พวกเขารายงานการพบเห็นนกด้วยการป้อนข้อมูลบันทึกรายวัน (แถบสีฟ้าที่ภาพด้านบน) สายพันธุ์ที่พวกเขารายงานว่าพบเห็นนั้นไม่ได้ตรงกับสิ่งที่ตนพบเห็นจริงๆ (สังเกตุค่า null ที่คอลัมน์ที่สอง จากแหล่งข้อมูลรอง นกที่ถูกพบเห็น) เมื่อสนับสนุนการรายงานด้วยรูปภาพ (แถบสีส้ม) พวกเขานั้นซื่อสัตย์ (ทั้งสองคอลัมน์ของสายพันธุ์ที่พบเห็นนั้นตรงกัน)

เนื่องจากรายงานทั้งสามนั้นไม่ตรงกันในส่วนของสายพันธุ์ แถวข้อมูลเหล่านั้นจึงถูกตัดทิ้งไปเมื่อใช้สายพันธุ์ที่พบเป็นฟิลด์การเชื่อมโยง มุมมองนั้นแสดงเพียงข้อมูลที่มีค่าที่ตรงกันของทั้งสองฟิลด์ที่เชื่อมโยง

สรุป

ดังนั้นโปรดระวังเมื่อทำการเชื่อมโยงฟิลด์หลายฟิลด์ ถึงแม้ว่าการคลิกที่ไอคอนและสร้างลิงก์ที่ทำงานนั้นจะเป็นเรื่องง่าย และการลิงก์เกินและลิงก์กับฟิลด์ที่ไม่ต้องการนั้นอาจส่งผลกระทบที่ร้ายแรงกับการวิเคราะห์ได้

ความแตกต่างระหว่างการรวมและการผสานข้อมูล

การผสานข้อมูลนั้นจะสร้างการผนวกทางซ้ายแบบดั้งเดิม ข้อแตกต่างสำคัญของทั้งสองคือเมื่อเกิดการรวมขึ้น การรวมจะรวมข้อมูลเข้าด้วยกันและรวมผลบวก การผสานจะรวมและทำให้ข้อมูลอยู่ด้วยกัน

ผนวกทางซ้าย

เมื่อคุณใช้การผนวกทางซ้ายเพื่อรวมข้อมูล จะมีการส่งการสืบค้นไปยังฐานข้อมูลที่เกิดการผนวกขึ้น การผนวกทางซ้ายจะส่งคืนแถวทั้งหมดจากตารางทางซ้ายและแถวที่เกี่ยวข้องทั้งหมดจากตารางทางขวา ผลลัพธ์ของการผนวกจะถูกส่งกลับไปยัง Tableau และรวมเข้าด้วยกันเพื่อแสดงเป็นภาพ

การผนวกทางซ้ายจะใช้แถวทั้งหมดจากตารางทางซ้าย จะส่งคืนค่าคอลัมน์ที่มีร่วมกันคือ ID ผู้ใช้และ ID Patron ที่มีข้อมูลที่เกี่ยวข้องจากตารางจากขวา หรือไม่เช่นนั้นก็จะเป็นค่า null

 

สมมติว่าคุณมีตารางที่เหมือนกัน แต่การจัดลำดับตรงข้ามกัน การผนวกทางซ้ายใหม่จะให้ผลลัพธ์ที่ไม่เหมือนกัน และอีกครั้ง การผนวกทางซ้ายจะรวมข้อมูลทั้งหมดจากตารางใหม่ทางซ้าย แต่จะไม่สนใจแถวทั้งหมดจากตารางทางขวา แถวของตารางซึ่งเป็น ID ผู้ใช้ = 4 จะไม่ถูกรวมไว้เนื่องจากไม่มีแถวของ Patron ID = 4 ที่ตารางด้านซ้าย

การผสานข้อมูล

เมื่อคุณใช้การผสานข้อมูลในการรวมข้อมูล จะมีการส่งการสืบค้นไปยังฐานข้อมูลสำหรับแต่ละแหล่งข้อมูลที่ใช้ในชีตนั้น ผลลัพธ์ของการสืบค้นจะถูกส่งกลับไปยัง Tableau และรวมเข้าด้วยกันเพื่อแสดงร่วมกันเป็นภาพ

หมายเหตุ: การรวมการวัดผลนั้นตรงไปตรงมา เราสามารถใช้ผลรวม ค่าเฉลี่ย สูงสุด หรือการรวมตัวเลขอื่นๆ ได้อย่างง่ายดาย ค่าที่วัดนั้นจะถูกรวมตามวิธีที่รวมฟิลด์ในมุมมอง อย่างไรก็ตาม ฟิลด์ทั้งหมดจากแหล่งข้อมูลรองจะต้องถูกรวมด้วย แล้วจะเป็นเช่นไรกับมิติข้อมูล ค่าของมิติข้อมูลจะถูกรวมโดยใช้ฟังก์ชันการรวม ATTR ซึ่งจะคืนค่าเดี่ยวของแถวทั้งหมดในแหล่งข้อมูลรอง หากมีค่าหลายค่าอยู่ในแถวเหล่านั้น จะมีการแสดงเครื่องหมายดอกจันทน์ (*) ไว้ โดยสามารถตีความได้ว่า “มีค่าหลายค่าในแหล่งข้อมูลรองสำหรับสัญลักษณ์นี้ในมุมมอง”

มุมมองจะใช้ค่าทั้งหมดจากแหล่งข้อมูลหลัก (ทำหน้าที่เป็นตารางทางซ้าย) และแถวที่เกี่ยวข้องจากแหล่งข้อมูลรอง (ตารางทางขวา) ตามฟิลด์การเชื่อมโยง

สมมติว่าคุณมีตารางต่อไปนี้ ฟิลด์ที่เชื่อมโยงคือ ID ผู้ใช้ และ Patron ID ไม่ใช่ทุกค่าที่สามารถเป็นส่วนหนึ่งของตารางผลลัพธ์ได้ เนื่องจากต่อไปนี้

  • แถวของตารางด้านซ้ายไม่มีแถวที่เกี่ยวข้องที่เข้าคู่กับตารางด้านขวา ตามที่ระบุโดยค่า null ในผลลัพธ์

  • มีค่าที่เกี่ยวข้องหลายค่าในแถวในตารางด้านขวา ตามที่ระบุด้วยเครื่องหมายดอกจันทน์ (*) ในผลลัพธ์

เมื่อมีการวัดผลมาเกี่ยวข้อง การวัดผลนั้นจะถูกรวมด้วย ดังที่เห็นดังต่อไปนี้

สำคัญ: เครื่องหมายดอกจันทนฺ์ (*) ในมุมมองที่มีข้อมูลที่ผสานนั้นบ่งชี้ถึงค่าหลายค่า ซึ่งสามารถแก้ไขได้โดยการยืนยันว่ามีค่าที่เข้าคู่กันค่าเดียวในแหล่งข้อมูลรองสำหรับแต่ละสัญลักษณ์ในแหล่งข้อมูลหลัก โดยสามารถทำได้โดยการสลับแหล่งข้อมูลหลักและรอง หากต้องการข้อมูลเพิ่มเติม โปรดดู แก้ปัญหาการผสานข้อมูล

การผสานข้อมูลในทันที

  • การผสานข้อมูลนั้นเกิดขึ้นที่แต่ละชีตโดยแยกกัน
  • ลำดับการใช้ฟิลด์จะเป็นตัวกำหนดว่าแหล่งข้อมูลใดที่เป็นแหล่งข้อมูลหลัก และแหล่งข้อมูลใดที่เป็นแหล่งข้อมูลรอง
  • แหล่งข้อมูลหลักจะบ่งชี้ด้วยเครื่องหมายติ๊กถูกสีฟ้า และแหล่งข้อมูลรองและฟิลด์จากแหล่งข้อมูลรองจะกำกับด้วยเครื่องหมายติ๊กถูกสีส้ม
  • จะสามารถระบุฟิลด์ที่เชื่อมโยงได้โดยอัตโนมัติโดยอ้างอิงจากชื่อฟิลด์ที่เชื่อมโยงหรือสามารถสร้างความสัมพันธ์ในการผสานได้โดยกำหนดเอง
  • การผสานข้อมูลนั้นมีการทำงานคล้ายกับการผนวกทางซ้าย ซึ่งอาจทำให้เกิดการสูญหายของข้อมูลจากแหล่งข้อมูลรองได้
  • อาจปรากฏเครื่องหมายดอกจันทน์ (*) ได้ ซึ่งบ่งชี้ว่ามีค่ามิติข้อมูลหลายค่าในสัญลักษณ์เดียว เนื่องจากการผสานข้อมูลนั้นจะใช้ผลลัพธ์การรวมและรวมผลลัพธ์นั้นเข้าในมุมมอง
  • สามารถใช้แหล่งข้อมูลรองเพื่อเปลี่ยนชื่อแทนค่าฟิลด์ในแหล่งข้อมูลหลักได้ หากต้องการข้อมูลเพิ่มเติม โปรดดู ตั้งชื่อแทนค่าฟิลด์โดยใช้การผสานข้อมูล

ข้อจำกัดของการผสานข้อมูล

  • มีข้อจำกัดในการผสานข้อมูลการรวมที่ไม่ใช่การเพิ่ม เช่น COUNTD, MEDIAN และ RAWSQLAGG หากต้องการข้อมูลเพิ่มเติม โปรดดู แก้ปัญหาการผสานข้อมูล
  • ไม่สามารถเผยแพร่แหล่งข้อมูลที่ผสานเป็นหน่วยได้ แต่ในทางกลับกัน สามารถเผยแพร่แหล่งข้อมูลโดยแยกกัน (ไปยังเซิร์ฟเวอร์เดียวกัน) และผสานแหล่งข้อมูลที่เผยแพร่ไปแล้วนั้นได้
  • ข้อมูลจากแหล่งข้อมูลรองจะต้องเป็นค่ารวมในการคำนวณเสมอ
  • หากคุณผสานแหล่งข้อมูล Cube แหล่งข้อมูลนั้นจะต้องเป็นแหล่งข้อมูลหลัก
ขอบคุณสำหรับข้อเสนอแนะของคุณส่งข้อเสนอแนะของคุณเรียบร้อยแล้ว ขอขอบคุณ