แยกข้อมูลของคุณ
การแยกข้อมูลคือชุดย่อยของข้อมูลที่บันทึกแยกต่างหากจากชุดข้อมูลต้นฉบับ โดยมีจุดประสงค์สองประการ: เพื่อปรับปรุงประสิทธิภาพและเพื่อใช้ฟีเจอร์ของ Tableau ที่อาจไม่พร้อมใช้งานหรือรองรับในข้อมูลต้นฉบับ ด้วยการสร้างการแยกข้อมูล คุณสามารถลดปริมาณข้อมูลทั้งหมดได้อย่างมีประสิทธิภาพโดยการใช้ตัวกรองและการตั้งค่าข้อจำกัดอื่นๆ
หลังจากสร้างการแยกข้อมูลแล้ว จะสามารถรีเฟรชด้วยข้อมูลล่าสุดจากแหล่งข้อมูลต้นฉบับได้ ในระหว่างกระบวนการรีเฟรช คุณสามารถเลือกได้อย่างยืดหยุ่นระหว่างการรีเฟรชแบบเต็ม ซึ่งจะแทนที่เนื้อหาที่มีอยู่ทั้งหมดในการแยกข้อมูล หรือการรีเฟรชแบบเพิ่มหน่วย ซึ่งจะรวมเฉพาะแถวใหม่นับตั้งแต่การรีเฟรชก่อนหน้า
ประโยชน์ของการแยกข้อมูล
- การจัดการชุดข้อมูลขนาดใหญ่: การแยกข้อมูลสามารถจัดการข้อมูลจำนวนมหาศาล แม้กระทั่งหลายพันล้านแถว วิธีนี้ช่วยให้ผู้ใช้สามารถทำงานกับชุดข้อมูลขนาดใหญ่ได้อย่างมีประสิทธิภาพ
- ประสิทธิภาพที่ปรับปรุง: การโต้ตอบกับมุมมองที่ใช้แหล่งข้อมูลการแยกจะให้ประสิทธิภาพดีขึ้นเมื่อเปรียบเทียบกับมุมมองที่เชื่อมต่อโดยตรงกับข้อมูลต้นฉบับ การแยกข้อมูลช่วยเพิ่มประสิทธิภาพการค้นหา ซึ่งส่งผลให้การวิเคราะห์ข้อมูลและการแสดงเป็นภาพเร็วขึ้น
- ฟังก์ชันที่ได้รับการปรับปรุง: การแยกข้อมูลช่วยให้สามารถเข้าถึงฟังก์ชัน Tableau เพิ่มเติมที่อาจไม่พร้อมใช้งานหรือรองรับโดยแหล่งข้อมูลต้นฉบับ เช่น ฟังก์เฉพาะ
- การเข้าถึงข้อมูลแบบออฟไลน์ (Tableau Desktop): การแยกข้อมูลช่วยให้สามารถเข้าถึงข้อมูลแบบออฟไลน์ได้ ซึ่งหมายความว่าแม้ว่าแหล่งข้อมูลต้นฉบับจะไม่พร้อมใช้งาน ผู้ใช้ยังสามารถบันทึก จัดการ และทำงานกับข้อมูลภายในเครื่องได้
สร้างการแยกข้อมูล
มีหลายวิธีในการสร้างการแยกข้อมูล แต่แนวทางหลักจะอธิบายไว้ด้านล่าง
- หลังจากเชื่อมต่อข้อมูลของคุณและตั้งค่าแหล่งข้อมูลในหน้า “แหล่งข้อมูล” แล้ว ให้เลือกการแยกข้อมูลที่มุมขวาบนแล้วเลือกลิงก์แก้ไขเพื่อเปิดกล่องโต้ตอบ “แยกข้อมูล”
- ขยายแต่ละส่วนเพื่อดูตัวเลือกหรือเลือกขยายทั้งหมด ข้อมูลเพิ่มเติมในแต่ละส่วนจะนำเสนอเพิ่มเติมในหัวข้อนี้
- การจัดเก็บข้อมูลการจัดเก็บข้อมูล: เลือกระหว่างตารางตรรกะหรือตารางกายภาพ
- ตัวกรอง: ตั้งค่าตัวกรองเพื่อให้ระบบจำกัดจำนวนข้อมูลที่จะแยกตามฟิลด์และค่าของตัวกรอง
- การรวบรวม: เลือกข้อมูลแบบรวมสำหรับมิติข้อมูลที่มองเห็นได้เพื่อรวมการวัดผลโดยใช้การรวมที่เป็นค่าเริ่มต้น คุณยังสามารถเลือกสะสมวันที่ไปจนถึงระดับวันที่กำหนด เช่น ปี เดือน เป็นต้น
- จำนวนแถว: ตั้งค่าจำนวนแถวที่คุณต้องการแยกข้อมูล คุณสามารถแยกแถวทั้งหมด ตัวอย่างหรือแถว Top N ได้
- การรีเฟรชแบบเพิ่มหน่วย: ตั้งค่าการรีเฟรชแบบเพิ่มหน่วยตามคอลัมน์และช่วงวันที่ที่ระบุ คุณสามารถเลือกได้ว่าจะแทนที่หรือผนวกแถวสุดท้ายหรือไม่
- เมื่อเสร็จสิ้น ให้เลือกบันทึกการตั้งค่า
- คลิกแท็บชีต วิธีนี้จะเริ่มการสร้างการแยกข้อมูล
- ถัดไป เลือกตำแหน่งเพื่อบันทึกการแยกข้อมูล
- ป้อนชื่อไฟล์การแยกข้อมูล
- เลือกบันทึก หากกล่องโต้ตอบ “บันทึก” ไม่ปรากฏ โปรดดูส่วนแก้ปัญหาการแยกข้อมูล
คำอธิบายการตั้งค่าการแยกข้อมูล
คุณสามารถกำหนดค่าการตั้งค่าต่างๆ ได้มากมายเมื่อสร้างการแยกข้อมูล
ภายใต้การจัดเก็บข้อมูล คุณสามารถเลือกตารางตรรกะหรือกายภาพได้ จัดเก็บข้อมูลโดยใช้ตารางการแยกข้อมูลหนึ่งตารางในตารางตรรกะแต่ละตารางในแหล่งข้อมูล ในทางกลับกัน จัดเก็บข้อมูลโดยใช้ตารางกายภาพในตารางการแยกข้อมูลหนึ่งตารางสำหรับตารางกายภาพแต่ละตารางในแหล่งข้อมูล
ทั้งตัวเลือกตารางตรรกะและตารางกายภาพจะมีผลกับวิธีการจัดเก็บข้อมูลในการแยกข้อมูลของคุณเท่านั้น ตัวเลือกไม่มีผลกับวิธีแสดงตารางในการแยกข้อมูลของคุณในหน้า “แหล่งข้อมูล”
ตัวอย่างเช่น สมมติว่าการแยกข้อมูลของคุณประกอบด้วยตารางตรรกะหนึ่งตารางที่มีตารางกายภาพสามตาราง หากคุณเปิดไฟล์การแยกข้อมูล (.hyper) ที่กำหนดค่าให้ใช้ตัวเลือกเริ่มต้นเป็นตารางตรรกะโดยตรง คุณจะเห็นตารางเดียวที่แสดงในหน้าแหล่งข้อมูล แต่ถ้าหากคุณเปิดการแยกข้อมูลโดยใช้ไฟล์แหล่งข้อมูลแบบแพ็กเกจ (.tdsx) หรือไฟล์แหล่งข้อมูล (.tdsx) ที่มีไฟล์การแยกข้อมูลที่สอดคล้องกัน (.hyper) คุณจะเห็นตารางทั้งสามบนหน้าแหล่งข้อมูล
ตารางตรรกะ
Tableau ใช้ตารางตรรกะเป็นโครงสร้างเริ่มต้นสำหรับการจัดเก็บข้อมูลการแยก โดยทั่วไป Tableau จะแนะนำให้คุณใช้ตัวเลือกการจัดเก็บข้อมูลเริ่มต้นอย่างตารางตรรกะเมื่อตั้งค่าและใช้งานการแยกข้อมูล ฟีเจอร์หลายอย่างที่คุณอาจต้องการ เช่น ตัวกรองการแยกข้อมูล, การรวบรวม, N สูงสุด หรือฟังก์ชันส่งผ่าน (RAWSQL) จะพร้อมใช้งานสำหรับคุณเท่านั้นหากคุณใช้ตัวเลือกตารางตรรกะ อย่างไรก็ตาม คุณจะไม่สามารถผนวกข้อมูลเข้ากับการแยกข้อมูลที่มีตารางเชิงตรรกะมากกว่าหนึ่งตารางได้
หากคุณเลือกตัวเลือกตารางตรรกะและการแยกข้อมูลของคุณมีการรวม ระบบจะนำการรวมไปใช้เมื่อมีการสร้างการแยกข้อมูล
ตารางกายภาพ
ตัวเลือกนี้จะทำการรวมเมื่อค้นหาและอาจปรับปรุงประสิทธิภาพและช่วยลดขนาดของไฟล์แยกข้อมูลได้ หากข้อมูลของคุณตรงตามเงื่อนไขทั้งหมดต่อไปนี้
- การรวมทั้งหมดระหว่างตารางกายภาพเป็นการรวมที่เสมอกัน (=)
- ประเภทข้อมูลของคอลัมน์ที่ใช้สำหรับความสัมพันธ์หรือการรวมจะเหมือนกัน
- ไม่มีฟังก์ชันส่งผ่าน (RAWSQL) ที่ใช้
- ไม่มีการรีเฟรชแบบเพิ่มหน่วยที่กำหนดค่า
- ไม่มีตัวกรองการแยกข้อมูลที่กำหนดค่า
- ไม่มี Top N หรือการสุ่มตัวอย่างที่กำหนดค่า
- ไม่จำเป็นต้องผนวกข้อมูลกับการแยกข้อมูล
เคล็ดลับในการทำงานกับตารางกายภาพ
การแยกข้อมูลที่มีขนาดใหญ่เกินคาด: ในการประเมินว่าการแยกข้อมูลมีขนาดใหญ่กว่าที่ควรหรือไม่ ผลรวมแถวในการแยกข้อมูลที่ใช้ตัวเลือก “ตารางกายภาพ” ต้องสูงกว่าผลรวมแถวของตารางที่รวมกันทั้งหมดก่อนจะสร้างการแยกข้อมูล หากคุณพบเจอสถานการณ์นี้ ให้ลองใช้ตัวเลือกตารางกายภาพ
ตัวเลือกการกรอง: เมื่อใช้ตัวเลือก “ตารางกายภาพ” ระบบจะปิดใช้งานตัวเลือกอื่นๆ เพื่อช่วยลดข้อมูลในการแยกข้อมูล เช่น ตัวกรองการแยกข้อมูล, การรวม, N สูงสุด และการสุ่มตัวอย่าง หากคุณจำเป็นต้องลดข้อมูลในการแยกข้อมูลที่ใช้ตัวเลือก “ตารางกายภาพ” ให้พิจารณากรองข้อมูลก่อนนำไปไว้ใน Tableau Desktop โดยใช้คำแนะนำข้อใดข้อหนึ่งต่อไปนี้
- การรวมทั้งหมดระหว่างตารางกายภาพเป็นการรวมที่เสมอกัน (=)
เชื่อมต่อกับข้อมูลของคุณและกำหนดตัวกรองโดยใช้ SQL แบบปรับแต่งเอง แทนที่จะเชื่อมต่อกับตารางฐานข้อมูล ให้เชื่อมต่อกับข้อมูลของคุณโดยใช้ SQL แบบปรับแต่งเองแทน เมื่อสร้างการค้นหา SQL แบบปรับแต่งเอง โปรดตรวจสอบว่ามีระดับการกรองที่เหมาะสมซึ่งคุณต้องใช้เพื่อลดข้อมูลในการแยกข้อมูลของคุณ หากต้องการข้อมูลเพิ่มเติมเกี่ยวกับ SQL แบบปรับแต่งเองใน Tableau Desktop โปรดดูเชื่อมต่อกับการค้นหา SQL แบบปรับแต่งเอง
กำหนดมุมมองในฐานข้อมูล หากคุณมีสิทธิ์เขียนในฐานข้อมูลของคุณ ให้พิจารณากำหนดมุมมองฐานข้อมูลที่มีเพียงข้อมูลที่คุณต้องใช้ในการแยกข้อมูล แล้วจึงเชื่อมต่อกับมุมมองฐานข้อมูลจาก Tableau Desktop
การรักษาความปลอดภัยระดับแถวพร้อมการแยกข้อมูล: หากคุณต้องการรักษาความปลอดภัยของการแยกข้อมูลในระดับแถว ขอแนะนำให้ใช้ตัวเลือก “ตารางกายภาพ” เพื่อแก้ไขกรณีนี้ หากต้องการข้อมูลเพิ่มเติมเกี่ยวกับการรักษาความปลอดภัยระดับแถวใน Tableau โปรดดู จำกัดการเข้าถึงที่ระดับแถวข้อมูล
ตัวกรอง
ใช้ตัวกรองเพื่อจำกัดจำนวนข้อมูลที่จะแยกตามฟิลด์และค่าของตัวกรอง
หมายเหตุ: ตัวกรองการแยกข้อมูลในตาราตรรกะใช้งานอย่างแพร่หลาย (ใช้กับแหล่งข้อมูลทั้งหมด) สำหรับแหล่งข้อมูลที่มีตารางฐานข้อมูลเดียว หากต้องการดูแหล่งข้อมูลที่มีตารางฐานข้อมูลหลายตารางโดยใช้ความสัมพันธ์แบบหลายข้อเท็จจริง ตัวกรองการแยกจะแยกตามตารางและใช้ได้กับตารางตรรกะเท่านั้น หากต้องการข้อมูลเพิ่มเติมเกี่ยวกับตัวกรองแบบแพร่หลายและแบบต่อตาราง โปรดดูกรองข้อมูลจากแหล่งข้อมูล
การรวบรวม
การรวบรวมกลุ่มช่วยให้คุณสามารถรวบรวมการวัดผลได้ คุณยังสามารถเลือกสะสมวันไปจนถึงระดับวันที่ระบุ เช่น ปี เดือน เป็นต้น ตัวอย่างนี้แสดงให้เห็นวิธีแยกข้อมูลสำหรับตัวเลือกการรวบรวมที่คุณสามารถเลือกได้แต่ละตัวเลือก
- ข้อมูลต้นฉบับ: ระเบียนแต่ละรายการจะแสดงเป็นแถวแยกกัน คุณมีข้อมูลอยู่เจ็ดแถวในข้อมูลต้นฉบับ
- รวบรวมข้อมูลสำหรับมิติข้อมูลที่มองเห็น (ไม่ต้องสะสม)- ระเบียนที่มีวันที่และตัวอักษรเดียวกันได้รับการรวบรวมไว้ในแถวเดียว มีการแยกข้อมูลอยู่ห้าแถว
- รวบรวมข้อมูลสำหรับมิติข้อมูลที่มองเห็น (สะสมวันที่เป็นเดือน): มีการสะสมวันจนเป็นระดับเดือนและบันทึกที่อยู่ในภูมิภาคเดียวกันจะรวมกันเป็นแถวเดียว มีการแยกข้อมูลอยู่สามแถว
ข้อมูลดั้งเดิม | การรวบรวมโดยไม่ต้องสะสม | การรวบรวมโดยมีการสะสม |
![]() | ![]() | ![]() |
จำนวนแถว
คุณสามารถแยกข้อมูลแถวทั้งหมดหรือบนแถว Top N ได้ Tableau จะใช้ตัวกรองและการรวมก่อน จากนั้นจึงแยกข้อมูลจำนวนแถวออกจากผลลัพธ์ที่กรองและรวมแล้วนั้นๆ ตัวเลือกจำนวนแถวจะขึ้นอยู่กับประเภทของแหล่งข้อมูลที่คุณนำมาแยกข้อมูล คุณอาจไม่เห็นตัวเลือกการสุ่มตัวอย่างในกล่องโต้ตอบ “แยกข้อมูล” เนื่องจากแหล่งข้อมูลบางแหล่งไม่รองรับการสุ่มตัวอย่าง
หมายเหตุ: ฟิลด์ที่คุณซ่อนไว้ก่อนในหน้า “แหล่งข้อมูล” หรือบนแท็บชีตจะไม่ถูกแยกออกจากการแยกข้อมูล คลิกปุ่มซ่อนทุกฟิลด์ที่ไม่ได้ใช้เพื่อลบฟิลด์ที่ซ่อนอยู่ออกจากการแยกข้อมูล
แหล่งข้อมูลส่วนใหญ่รองรับการรีเฟรชแบบเพิ่มหน่วย ซึ่งแทนที่จะรีเฟรชการแยกข้อมูลทั้งหมด คุณสามารถกำหนดค่าการรีเฟรชให้เพิ่มเฉพาะแถวที่เป็นแถวใหม่นับจากครั้งล่าสุดที่คุณทำการแยกข้อมูล
ตัวอย่างเช่น คุณอาจมีแหล่งข้อมูลที่อัปเดตธุรกรรมการขายใหม่ๆ เข้าไปเป็นประจำทุกวัน ซึ่งแทนที่จะสร้างการแยกข้อมูลทั้งหมดใหม่อีกครั้งทุกวัน คุณสามารถเพิ่มแค่ธุรกรรมใหม่ๆ ที่เกิดขึ้นในวันนั้นๆ ได้
เคล็ดลับการรีเฟรชแบบเพิ่มหน่วย
การรีเฟรชแบบเพิ่มหน่วย:
- ในจำนวนแถว คุณต้องเลือกทุกแถว.
- การรีเฟรชแบบเพิ่มหน่วยจะไม่สามารถใช้งานได้หากคุณเปิดใช้งานการรวบรวม
การตั้งค่าขั้นสูง:
- การตั้งค่าขั้นสูงเข้ากันไม่ได้กับตัวกรอง
เคล็ดลับการแยกข้อมูล
บันทึกเวิร์กบุ๊กเพื่อรักษาการเชื่อมต่อกับการแยกข้อมูล
หลังจากสร้างการแยกข้อมูลแล้ว เวิร์กบุ๊กจะเริ่มใช้เวอร์ชันการแยกข้อมูลของคุณ แต่การเชื่อมต่อกับเวอร์ชันการแยกข้อมูลของคุณจะไม่ได้รับการบันทึกไว้จนกว่าคุณจะบันทึกเวิร์กบุ๊ก นั่นหมายความว่า หากคุณปิดเวิร์กบุ๊กโดยไม่ได้บันทึกเวิร์กบุ๊กก่อน เวิร์กบุ๊กจะเชื่อมต่อกับแหล่งข้อมูลเดิมในครั้งถัดไปที่คุณเปิด
สลับระหว่างตัวอย่างข้อมูลและการแยกข้อมูลทั้งหมด
เมื่อคุณทำการแยกข้อมูลขนาดใหญ่ การสร้างตัวอย่างข้อมูลที่มีขนาดเล็กลงอาจเป็นประโยชน์ วิธีนี้ช่วยให้คุณสามารถตั้งค่ามุมมองโดยไม่ต้องเรียกใช้การค้นหาที่ใช้เวลานานทุกครั้งที่คุณเพิ่มฟิลด์ลงในการวิเคราะห์ของคุณ คุณสามารถสลับระหว่างการใช้ข้อมูลตัวอย่างและแหล่งข้อมูลทั้งหมดได้อย่างง่ายดายโดยเลือกตัวเลือกที่เหมาะสมในเมนู “ข้อมูล”
อย่าเชื่อมต่อกับการแยกข้อมูลโดยตรง
เมื่อคุณบันทึกการแยกข้อมูลลงในคอมพิวเตอร์ คุณสามารถเชื่อมต่อได้โดยตรงโดยใช้ Tableau Desktop ใหม่ได้ อย่างไรก็ตาม ไม่แนะนำให้ดำเนินการเช่นนี้เนื่องจากเหตุผลบางประการต่อไปนี้
- ชื่อของตารางอาจแตกต่างกัน การแยกข้อมูลใช้การตั้งชื่อพิเศษเพื่อให้แน่ใจว่าแต่ละตารางมีชื่อเฉพาะ ซึ่งอาจเข้าใจได้ยาก
- คุณไม่สามารถอัปเดตหรือรีเฟรชการแยกข้อมูลได้ เมื่อคุณเชื่อมต่อโดยตรงกับการแยกข้อมูล Tableau จะพิจารณาว่าเป็นแหล่งข้อมูลต้นฉบับ แทนที่จะเป็นสำเนา ซึ่งหมายความว่าคุณไม่สามารถเชื่อมโยงกลับไปยังแหล่งข้อมูลต้นฉบับของคุณได้
- โครงสร้างและความสัมพันธ์ระหว่างตารางจะหายไป การจัดเรียงและการเชื่อมต่อระหว่างตารางจะได้รับการจัดเก็บในรูปแบบไฟล์ .tds ไม่ใช่ไฟล์ .hyper ดังนั้น เมื่อคุณเชื่อมต่อโดยตรงกับไฟล์ .hyper คุณจะสูญเสียข้อมูลนี้ หากคุณใช้พื้นที่จัดเก็บตารางตรรกะสำหรับการแยกข้อมูล คุณจะไม่เห็นข้อมูลอ้างอิงใดๆ ไปยังตารางกายภาพต้นฉบับ
อย่าใช้การแยกข้อมูลหากคุณเชื่อมต่อกับการเชื่อมต่อแบบเสมือนด้วยฟังก์ชันผู้ใช้ในนโยบายข้อมูล
หากการเชื่อมต่อเสมือนมีนโยบายข้อมูลที่ประกอบด้วย ฟังก์ชันผู้ใช้(ลิงก์จะเปิดในหน้าต่างใหม่) (ตัวอย่างเช่น, USERNAME()
) และคุณเชื่อมต่อจากเวิร์กบุ๊กหรือแหล่งข้อมูลและสร้างการแยกข้อมูลไว้ที่นั่น การแยกข้อมูลจะมีเฉพาะแถวที่ตรงกับนโยบายข้อมูลการเชื่อมต่อแบบเสมือนในขณะที่สร้างการแยกข้อมูลเท่านั้น หากต้องการใช้ประโยชน์จากการเชื่อมต่อแบบเสมือนกับฟังก์ชันของผู้ใช้ในนโยบายข้อมูล ให้ใช้การเชื่อมต่อแบบเรียลไทม์จากเวิร์กบุ๊กหรือแหล่งข้อมูลไปยังการเชื่อมต่อแบบเสมือนแทนการแยกข้อมูล
ลบการแยกข้อมูลออกจากเวิร์กบุ๊ก
คุณสามารถลบการแยกข้อมูลได้ทุกเมื่อโดยเลือกแหล่งข้อมูลการแยกในเมนูข้อมูล แล้วเลือก เมื่อคุณลบการแยกข้อมูล คุณสามารถเลือกได้ว่าจะลบการแยกข้อมูลออกจากเวิร์กบุ๊กเท่านั้นหรือลบไฟล์การแยกข้อมูล ตัวเลือกหลังจะลบการแยกข้อมูลออกจากฮาร์ดไดรฟ์ของคุณ
ดูประวัติการแยกข้อมูล (Tableau Desktop)
คุณจะเห็นเวลาที่อัปเดตการแยกข้อมูลล่าสุดและรายละเอียดอื่นๆ โดยเลือกแหล่งข้อมูลในเมนูข้อมูล แล้วเลือก
หากคุณเปิดเวิร์กบุ๊กที่บันทึกไว้กับการแยกข้อมูลและ Tableau ไม่พบการแยกข้อมูลนั้น ให้เลือกตัวเลือกใดตัวเลือกหนึ่งต่อไปนี้ในกล่องโต้ตอบ “ไม่พบการแยกข้อมูล” ที่ปรากฏ
- ค้นหาการแยกข้อมูล: เลือกตัวเลือกนี้หากมีการแยกข้อมูลอยู่ แต่ไม่อยู่ในตำแหน่งเดิมที่ Tableau บันทึกไว้ คลิกตกลงเพื่อเปิดกล่องโต้ตอบ “เปิดไฟล์” ซึ่งคุณสามารถระบุตำแหน่งใหม่ของไฟล์การแยกข้อมูลได้
- ลบการแยกข้อมูล: เลือกตัวเลือกนี้หากคุณไม่จำเป็นต้องใช้การแยกข้อมูลนั้นแล้ว ซึ่งเท่ากับเป็นการปิดแหล่งข้อมูล เวิร์กชีตที่เปิดทั้งหมดซึ่งอ้างอิงแหล่งข้อมูลดังกล่าวจะถูกลบ
- ปิดใช้งานการแยกข้อมูล: ใช้แหล่งข้อมูลเดิมที่ใช้สร้างการแยกข้อมูล แทนที่จะใช้การแยกข้อมูล
- สร้างการแยกข้อมูลใหม่: สร้างการแยกข้อมูลขึ้นใหม่อีกครั้ง ตัวกรองทั้งหมดและการปรับแต่งอื่นๆ ที่คุณระบุตอนสร้างการแยกข้อมูลขึ้นครั้งแรกจะถูกนำมาใช้โดยอัตโนมัติ
แก้ปัญหาการแยกข้อมูล
- การสร้างการแยกข้อมูลใช้เวลานาน: การสร้างการแยกข้อมูลอาจใช้เวลานาน ทั้งนี้ขึ้นอยู่กับขนาดชุดข้อมูลของคุณ แต่หลังจากที่คุณแยกข้อมูลและบันทึกลงในคอมพิวเตอร์แล้ว ประสิทธิภาพอาจดีขึ้น
- ระบบไม่สร้างการแยกข้อมูล: หากชุดข้อมูลของคุณมีคอลัมน์จำนวนมาก (เช่น หลายพันคอลัมน์) Tableau อาจไม่สามารถสร้างการแยกข้อมูลได้ในบางกรณี หากคุณประสบปัญหา ให้พิจารณาแยกข้อมูลคอลัมน์จำนวนน้อยลง หรือปรับโครงสร้างข้อมูลเบื้องหลัง
- กล่องโต้ตอบ “บันทึก” ไม่ปรากฏหรือระบบไม่สร้างการแยกข้อมูลจาก .twbx: หากคุณทำตามขั้นตอนก่อนหน้านี้เพื่อแยกข้อมูลจากเวิร์กบุ๊กแบบแพ็กเกจ กล่องโต้ตอบ “บันทึก” จะไม่ปรากฏ เมื่อสร้างการแยกข้อมูลจากเวิร์กบุ๊กแบบแพ็กเกจ (.twbx) ไฟล์การแยกข้อมูลจะจัดเก็บไว้อัตโนมัติในแพ็กเกจไฟล์ที่เชื่อมโยงกับเวิร์กบุ๊กแบบแพ็กเกจ หากต้องการเข้าถึงไฟล์การแยกข้อมูลที่คุณสร้างจากเวิร์กบุ๊กแบบแพ็กเกจ คุณต้องคลายแพ็กเกจเวิร์กบุ๊กก่อน หากต้องการข้อมูลเพิ่มเติม โปรดดูเวิร์กบุ๊กแบบแพ็กเกจ
อัปเดตฟีเจอร์การแยกข้อมูล
การรีเฟรชแบบช่วงย่อยสำหรับการแยกข้อมูลแบบเพิ่มหน่วย
ใน Tableau เวอร์ชัน 2024.2 และใหม่กว่า คุณสามารถระบุช่วงเวลาเพิ่มเติมเพื่อดึงข้อมูลที่แยกออกมาก่อนหน้านี้อีกครั้ง และบันทึกการเปลี่ยนแปลงใดๆ ที่อาจเกิดขึ้น หากต้องการข้อมูลเพิ่มเติม โปรดดูรีเฟรชการแยกข้อมูล
การรีเฟรชแบบเพิ่มหน่วย
ตั้งแต่เวอร์ชัน 2024.1 เป็นต้นไป Tableau จะแนะนำฟีเจอร์ที่ช่วยให้ผู้ใช้ทำการรีเฟรชแบบเพิ่มหน่วยในการแยกข้อมูลโดยใช้คอลัมน์คีย์ที่ซ้ำกัน มี UI ใหม่ที่รองรับการตั้งค่าขั้นสูงเหล่านี้
การอัปเดตครั้งนี้มีขั้นตอนเพิ่มเติมในกระบวนการแยกข้อมูล ในระหว่างการรีเฟรชแบบเพิ่มหน่วย อันดับแรก Tableau จะลบแถวออกจากการแยกข้อมูลที่ตรงกับค่าสูงสุดที่บันทึกไว้ก่อนหน้านี้ ต่อจากนั้น Tableau จะค้นหาแถวทั้งหมดที่มีค่าสูงกว่าหรือเท่ากับค่าสูงสุดก่อนหน้า วิธีนี้ช่วยให้แน่ใจว่าแถวที่ถูกลบใดๆ จะได้รับการพิจารณา รวมถึงแถวที่เพิ่มใหม่ด้วย
การแยกข้อมูลในเว็บ
ตั้งแต่เวอร์ชัน 2020.4 เป็นต้นไป การแยกข้อมูลจะพร้อมใช้งานในการเขียนเว็บและเซิร์ฟเวอร์เนื้อหา ตอนนี้คุณจะไม่ต้องใช้ Tableau Desktop เพื่อแยกแหล่งข้อมูลแล้ว หากต้องการข้อมูลเพิ่มเติม โปรดดู สร้างการแยกข้อมูลบนเว็บ
การแยกข้อมูลตารางเชิงตรรกะและตารางกายภาพ
เนื่องจากมีการเปิดใช้ตารางเชิงตรรกะและตารางกายภาพในโมเดลข้อมูล Tableau เวอร์ชัน 2020.2 ตัวเลือกการจัดเก็บการแยกข้อมูลจึงได้เปลี่ยนจากตารางเดียวและหลายตารางมาเป็นตารางเชิงตรรกะและตารางกายภาพ ตัวเลือกเหล่านี้จะอธิบายวิธีการจัดเก็บการแยกข้อมูลได้ดีขึ้น หากต้องการข้อมูลเพิ่มเติม โปรดดู แยกข้อมูลของคุณ
การเลิกใช้รูปแบบ .tde
เมื่อคุณสร้างการแยกข้อมูล ข้อมูลจะใช้รูปแบบ .hyper การแยกข้อมูลในรูปแบบ .hyper ใช้ประโยชน์จากเครื่องมือสำหรับข้อมูลที่พัฒนาขึ้น ซึ่งรองรับการดำเนินการวิเคราะห์และค้นหาที่รวดเร็วกว่าเดิมสำหรับชุดข้อมูลที่ใหญ่ขึ้น ตั้งแต่เดือนมีนาคม 2023 การแยกข้อมูลโดยใช้รูปแบบ .tde จะเลิกใช้งานใน Tableau Cloud, Tableau Public และ Tableau Server (เวอร์ชัน 2023.1.0) เวอร์ชัน 2024.2 เป็นเวอร์ชันล่าสุดที่สามารถเปิดไฟล์รูปแบบ .tde ได้ หากต้องการข้อมูลเพิ่มเติม โปรดดู การอัปเกรดการแยกข้อมูลเป็นรูปแบบ .hyper
เพื่อปรับปรุงประสิทธิภาพและความสามารถในการปรับขนาดของการแยกข้อมูล ค่าในการแยกข้อมูลสามารถคำนวณได้แตกต่างกันจากแหล่งข้อมูลบางแหล่ง การเปลี่ยนแปลงวิธีการคำนวณค่าอาจส่งผลต่อการแสดงเครื่องหมายในมุมมองของคุณ ในบางกรณีที่เกิดขึ้นได้น้อย การเปลี่ยนแปลงอาจส่งผลให้มุมมองของคุณเปลี่ยนรูปร่างหรือกลายเป็นช่องว่าง การเปลี่ยนแปลงเหล่านี้ยังอาจมีผลกับแหล่งข้อมูลหลายการเชื่อมต่อ แหล่งข้อมูลที่ใช้การเชื่อมต่อแบบสดไปยังแหล่งข้อมูลแบบไฟล์ แหล่งข้อมูลที่เชื่อมต่อไปยังข้อมูล Google ชีต แหล่งข้อมูลแบบคลาวด์ แหล่งข้อมูลแบบแยกข้อมูลเท่านั้น และแหล่งข้อมูล WDC
รูปแบบค่าวันที่และวันที่และเวลา
การแยกข้อมูลจะอยู่ภายใต้กฎที่สอดคล้องกันและเข้มงวดเกี่ยวกับวิธีแปลข้อมูลสตริงวันที่ผ่านฟังก์ชัน DATE, DATETIME และ DATEPARSE ซึ่งจะส่งผลต่อวิธีการแยกวิเคราะห์วันที่ หรือรูปแบบและแบบแผนวันที่ซึ่งสามารถใช้ฟังก์ชันเหล่านี้ได้ โดยสามารถระบุกฎโดยสรุปได้ดังนี้
- วันที่จะได้รับการประเมินและแยกวิเคราะห์ตามคอลัมน์ ไม่ใช่แถว
- วันที่จะได้รับการประเมินและแยกวิเคราะห์ตามภาษาในพื้นที่ที่สร้างเวิร์กบุ๊ก ไม่ใช่ภาษาของคอมพิวเตอร์ที่เปิดเวิร์กบุ๊ก
กฎเหล่านี้ช่วยให้การแยกข้อมูลมีประสิทธิภาพมากขึ้นและสร้างผลลัพธ์ที่สอดคล้องกับฐานข้อมูลทางการค้า
สาเหตุที่พบบ่อยของการเปลี่ยนแปลงค่าวันที่และวันที่และเวลา
- เมื่อวันที่ไม่ชัดเจนและสามารถแปลข้อมูลได้หลายวิธี ระบบจะแปลข้อมูลวันที่ตามรูปแบบที่ Tableau ได้กำหนดสำหรับคอลัมน์นั้น ตัวอย่างเช่น ดูสถานการณ์ที่ 1 ด้านล่าง
- เมื่อฟังก์ชันต้องแยกวิเคราะห์รูปแบบ ปปปป-ดด-วว (ISO) ตัวอย่างเช่น ดูสถานการณ์ที่ 2
- เมื่อฟังก์ชันแยกวิเคราะห์ปี จะมีการตีความข้อมูลดังนี้
- ปี “07” จะแปลข้อมูลเป็น “2007”
- ปี “17” จะแปลข้อมูลเป็น “2017”
- ปี “30” จะแปลข้อมูลเป็น “2030”
- ปี “69” จะแปลข้อมูลเป็น “2069”
- ปี “70” จะแปลข้อมูลเป็น “1970”
สาเหตุที่พบบ่อยของค่า null
- เมื่อฟังก์ชันต้องแยกวิเคราะห์วันที่หลายรูปแบบในคอลัมน์เดียว หลังจาก Tableau กำหนดรูปแบบวันที่ วันที่อื่นๆ ทั้งหมดในคอลัมน์ที่ได้รับจากรูปแบบจะเป็นค่า null ตัวอย่างเช่น ดูสถานการณ์ที่ 1 ด้านล่าง
- เมื่อฟังก์ชันต้องแยกวิเคราะห์รูปแบบ ปปปป-ดด-วว (ISO) ค่าที่เกินค่าที่อนุญาตสำหรับ “YYYY” หรือ “MM” หรือ “DD” จะทำให้เกิดค่า null ตัวอย่างเช่น ดูสถานการณ์ที่ 2
- เมื่อฟังก์ชันต้องแยกวิเคราะห์ค่าวันที่ที่มีอักขระต่อท้าย ตัวอย่างเช่น โซนเวลาและคำต่อท้ายและคีย์เวิร์ดเวลาออมแสง เช่น “เที่ยงคืน” จะทำให้เกิดค่า null
- เมื่อฟังก์ชันต้องแยกวิเคราะห์วันที่หรือเวลาที่ไม่ถูกต้อง ตัวอย่างเช่น 3/32/2024 จะทำให้เกิดค่า null อีกตัวอย่างคือ 25:01:61 จะทำให้เกิดค่า null
- เมื่อฟังก์ชันต้องแยกวิเคราะห์ค่าอินพุตที่ขัดแย้งกัน ตัวอย่างเช่น สมมติว่ารูปแบบคือ “dd.MM (MMMM) y” และสตริงอินพุตคือ “1.09 (สิงหาคม) 2024” ขณะที่ทั้ง “9” และ “สิงหาคม” เป็นเดือน ผลลัพธ์จะเป็นค่า null เพราะค่าเดือนไม่เหมือนกัน
- เมื่อฟังก์ชันต้องแยกวิเคราะห์รูปแบบที่ขัดแย้งกัน ตัวอย่างเช่น รูปแบบที่ระบุทั้งปีแบบเกรกอเรียน (y) และสัปดาห์แบบ ISO (ww) จะทำให้เกิดค่า null
สถานการณ์ที่ 1
สมมติว่าคุณมีเวิร์กบุ๊กที่สร้างเป็นภาษาอังกฤษและใช้แหล่งข้อมูลการแยก .tde ตารางหลังจากนี้แสดงคอลัมน์ข้อมูลสตริงที่อยู่ในแหล่งข้อมูลของการแยกข้อมูล
10/31/2024 |
10/31/2024 |
12/10/2024 |
ตามรูปแบบภาษาอังกฤษที่เฉพาะเจาะจง รูปแบบของคอลัมน์วันที่ถูกกำหนดให้เป็นรูปแบบ ดวป (เดือน วัน และปี) ตารางต่อไปนี้แสดงค่าที่ Tableau แสดงผลตามภาษานี้เมื่อใช้ฟังก์ชัน DATE เพื่อแปลงค่าสตริงเป็นค่าวันที่
10/31/2024 |
10/31/2024 |
12/10/2024 |
หากเปิดการแยกข้อมูลเป็นภาษาเยอรมัน คุณจะเห็นค่าต่อไปนี้
31 Oktober 2024 |
31 Oktober 2024 |
12 Oktober 2024 |
อย่างไรก็ตาม หลังจากเปิดการแยกข้อมูลเป็นภาษาเยอรมันโดยใช้เวอร์ชัน 10.5 และใหม่กว่า รูปแบบ DMY (วัน เดือน และปี) ของภาษาเยอรมันจะบังคับใช้อย่างเคร่งครัดและทำให้เกิดค่า null เนื่องจากค่าใดค่าหนึ่งไม่เป็นไปตามรูปแบบ DMY
ค่า Null |
10/31/2024 |
12 ตุลาคม 2024 |
สถานการณ์ที่ 2
สมมติว่าคุณมีคอลัมน์ข้อมูลสตริงที่มีอยู่ในแหล่งข้อมูล
10/31/2024 |
2024-31-10 |
12/10/2024 |
2024-10-12 |
เนื่องจากวันที่ใช้รูปแบบ ISO คอลัมน์วันที่จึงอยู่ในรูปแบบ YYYY-MM-DD เสมอ ตารางต่อไปนี้แสดงค่าที่ Tableau แสดงผลเมื่อใช้ฟังก์ชัน DATE เพื่อแปลงค่าสตริงเป็นค่าวันที่
10 ตุลาคม 2024 |
ค่า null |
12/10/2024 |
12 ตุลาคม 2024 |
การคำนึงถึงลำดับการจัดเรียงและตัวพิมพ์เล็กและตัวพิมพ์ใหญ่
การแยกข้อมูลรองรับการตรวจเทียบ ดังนั้นจึงสามารถจัดเรียงค่าสตริงที่มีอักขระการออกเสียงหรือมีตัวพิมพ์เล็กและตัวพิมพ์ใหญ่แตกต่างกันได้อย่างถูกต้องมากขึ้น
ตัวอย่างเช่น สมมติว่าคุณมีตารางค่าสตริง ในแง่ของลำดับการจัดเรียง นั่นหมายความว่าค่าสตริงอย่าง Égypte จะเรียงอยู่หลัง Estonie และก่อน Fidji อย่างถูกต้อง
ในส่วนของตัวพิมพ์ใหญ่ ค่าสตริงเดียวกันนี้จะถือเป็นค่าไม่ซ้ำกัน ดังนั้นจึงจะจัดเก็บเป็นค่าแยกต่างหาก
การแยกการเชื่อมต่อในการค้นหา N สูงสุด
การค้นหา Top N ในการแยกข้อมูลของคุณสามารถสร้างค่าที่ซ้ำกันสำหรับตำแหน่งเฉพาะในอันดับได้ ตัวอย่างเช่น สมมติว่าคุณสร้างตัวกรอง 3 ค่าสูงสุด ตำแหน่งที่ 3, 4 และ 5 มีค่าเดียวกัน ตัวกรองด้านบนจะคืนค่าตำแหน่ง 1, 2 และ 5
ความแม่นยำของค่าทศนิยม
การแยกข้อมูลจะใช้ประโยชน์ทรัพยากรฮาร์ดแวร์ที่มีบนคอมพิวเตอร์ได้ดีขึ้น ดังนั้นจึงสามารถดำเนินการทางคณิตศาสตร์ไปพร้อมกันได้มาก ด้วยเหตุนี้ จำนวนจริงอาจรวมอยู่ในการแยกข้อมูล .hyper ในลำดับที่แตกต่างออกไป เมื่อจำนวนรวมอยู่ในลำดับที่แตกต่างออกไป คุณจึงอาจเห็นค่าที่แตกต่างในมุมมองหลังจุดทศนิยมในแต่ละครั้งที่คำนวณการรวมค่า เนื่องจากการบวกและการคูณทศนิยมไม่ได้จำเป็นต้องสัมพันธ์กัน นั่นคือ (a + b) + c ไม่จำเป็นต้องเหมือนกับ a + (b + c) นอกจากนั้น จำนวนจริงยังอาจรวมในลำดับที่ต่างออกไปเนื่องจากการคูณทศนิยมไม่ได้จำเป็นต้องมีการแจกแจง นั่นคือ (a x b) x c ไม่จำเป็นต้องเหมือนกับ a x b x c ลักษณะการปัดเศษทศนิยมประเภทนี้ในการแยกข้อมูล .hyper จะเหมือนกับลักษณะการปัดเศษทศนิยมในฐานข้อมูลทางการค้า
ตัวอย่างเช่น สมมติว่าเวิร์กบุ๊กของคุณมีตัวกรองแถบเลื่อนในฟิลด์ค่ารวมที่ประกอบด้วยค่าทศนิยม เนื่องจากความแม่นยำของค่าทศนิยมได้เปลี่ยนไป ตัวกรองจึงอาจไม่รวมเครื่องหมายที่กำหนดขอบเขตสูงหรือต่ำของช่วงตัวกรอง จำนวนที่หายไปเหล่านี้อาจทำให้แสดงมุมมองว่างเปล่า ในการแก้ไขปัญหานี้ ให้ย้ายแถบเลื่อนบนตัวกรองหรือลบและเพิ่มตัวกรองอีกครั้ง
ความแม่นยำของการรวม
การแยกข้อมูลเพิ่มประสิทธิภาพให้ชุดข้อมูลขนาดใหญ่โดยใช้ประโยชน์ทรัพยากรฮาร์ดแวร์ที่มีบนคอมพิวเตอร์ได้ดีขึ้น ดังนั้นจึงสามารถคำนวณการรวมไปพร้อมกันได้มาก ด้วยเหตุนี้ การรวมที่ดำเนินการในการแยกข้อมูล .hyper จึงอาจเหมือนผลลัพธ์จากฐานข้อมูลทางการค้ามากกว่าผลลัพธ์จากซอฟต์แวร์ที่เชี่ยวชาญในการคำนวณเชิงสถิติ หากคุณทำงานโดยใช้ชุดข้อมูลขนาดเล็กหรือต้องการความแม่นยำในระดับสูงขึ้้น ให้พิจารณาทำการรวมผ่านเส้นอ้างอิง สถิติการ์ดข้อมูลสรุป หรือฟังก์ชันการคำนวณตาราง เช่น ผลต่าง ค่าเบี่ยงเบนมาตรฐาน สหสัมพันธ์ หรือค่าความแปรปรวนร่วม
คุณสามารถใช้ Extract API เพื่อสร้างการแยกข้อมูล .hyper ได้ สำหรับทาสก์ต่างๆ เช่น การเผยแพร่การแยกข้อมูล คุณสามารถใช้ Tableau Server REST API หรือไลบรารี Tableau Server Client (Python) ได้ สำหรับงานรีเฟรช คุณสามารถใช้ Tableau Server REST API ได้ด้วยเช่นกัน หากต้องการข้อมูลเพิ่มเติม โปรดดู Tableau Hyper API