แยกข้อมูลของคุณ
การแยกข้อมูลเป็นชุดข้อมูลย่อยที่บันทึกไว้ ซึ่งคุณสามารถใช้เพื่อปรับปรุงประสิทธิภาพหรือใช้ประโยชน์จากฟังก์ชัน Tableau ที่ไม่พร้อมใช้งานหรือไม่รองรับในข้อมูลดั้งเดิมของคุณ เมื่อคุณสร้างการแยกข้อมูล คุณสามารถลดจำนวนข้อมูลรวมได้โดยใช้ตัวกรองและการกำหนดค่าขีดจำกัดอื่นๆ หลังจากสร้างการแยกข้อมูลแล้ว คุณสามารถรีเฟรชด้วยข้อมูลจากข้อมูลดั้งเดิมได้ เมื่อรีเฟรชข้อมูล คุณสามารถเลือกทำการรีเฟรชเต็มรูปแบบ ซึ่งจะแทนที่เนื้อหาทั้งหมดในการแยกข้อมูล หรือทำการรีเฟรชแบบเพิ่มหน่วย ซึ่งจะเพิ่มเฉพาะแถวใหม่นับตั้งแต่การรีเฟรชครั้งก่อนหน้า
การแยกข้อมูลเป็นประโยชน์เนื่องด้วยหลายเหตุผลดังต่อไปนี้
รองรับชุดข้อมูลขนาดใหญ่ขึ้น: คุณสามารถสร้างการแยกข้อมูลที่มีข้อมูลหลายพันล้านแถวได้
ช่วยปรับปรุงประสิทธิภาพ: เมื่อคุณโต้ตอบกับมุมมองที่ใช้แหล่งข้อมูลการแยก คุณมักจะได้รับประสิทธิภาพดีกว่าเมื่อโต้ตอบกับมุมมองโดยอาศัยการเชื่อมต่อกับข้อมูลดั้งเดิม
รองรับฟังก์ชันเพิ่มเติม: การแยกข้อมูลช่วยให้คุณได้ใช้ประโยชน์จากฟังก์ชันของ Tableau ที่ไม่พร้อมใช้งานหรือไม่ได้รองรับในข้อมูลดั้งเดิม เช่น ความสามารถในการคำนวณการนับจำนวนที่แตกต่างกัน
ให้การเข้าถึงข้อมูลของคุณแบบออฟไลน์: หากคุณใช้ Tableau Desktop การแยกข้อมูลจะช่วยให้คุณบันทึกและใช้งานข้อมูลในเครื่องได้เมื่อข้อมูลดั้งเดิมไม่พร้อมใช้งาน ตัวอย่างเช่น เมื่อคุณเดินทางอยู่
การเปลี่ยนแปลงล่าสุดในการแยกข้อมูล
การแยกข้อมูลในเว็บ
ตั้งแต่เวอร์ชัน 2020.4 เป็นต้นไป การแยกข้อมูลจะพร้อมใช้งานในการเขียนเว็บและเซิร์ฟเวอร์เนื้อหา ตอนนี้คุณจะไม่ต้องใช้ Tableau Desktop เพื่อแยกแหล่งข้อมูลแล้ว หากต้องการข้อมูลเพิ่มเติม โปรดดู สร้างการแยกข้อมูลบนเว็บ
การแยกข้อมูลตารางเชิงตรรกะและตารางกายภาพ
เนื่องจากมีการเปิดใช้ตารางเชิงตรรกะและตารางกายภาพในโมเดลข้อมูล Tableau เวอร์ชัน 2020.2 ตัวเลือกการจัดเก็บการแยกข้อมูลจึงได้เปลี่ยนจากตารางเดียวและหลายตารางมาเป็นตารางเชิงตรรกะและตารางกายภาพ ตัวเลือกเหล่านี้จะอธิบายวิธีการจัดเก็บการแยกข้อมูลได้ดีขึ้น หากต้องการข้อมูลเพิ่มเติม โปรดดู ตัดสินใจว่าควรจัดเก็บข้อมูลที่แยกอย่างไร
การเลิกใช้รูปแบบ .tde
หมายเหตุ: ตั้งแต่เดือนมีนาคม 2023 การแยกข้อมูลโดยใช้รูปแบบ .tde จะเลิกใช้งานใน Tableau Cloud, Tableau Public และ Tableau Server (เวอร์ชัน 2023.1.0) หากต้องการข้อมูลเพิ่มเติม โปรดดู การอัปเกรดการแยกข้อมูลเป็นรูปแบบ .hyper
ตั้งแต่เวอร์ชัน 10.5 เป็นต้นไป เมื่อคุณสร้างการแยกข้อมูลใหม่ การแยกข้อมูลจะใช้รูปแบบ .hyper การแยกข้อมูลในรูปแบบ .hyper ใช้ประโยชน์จากเครื่องมือสำหรับข้อมูลที่พัฒนาขึ้น ซึ่งรองรับการดำเนินการวิเคราะห์และค้นหาที่รวดเร็วกว่าเดิมสำหรับชุดข้อมูลที่ใหญ่ขึ้น
เช่นเดียวกันนั้น เมื่อทำงานที่เกี่ยวข้องกับการแยกข้อมูลในการแยกข้่อมูล .tde โดยใช้เวอร์ชัน 10.5 และใหม่กว่า การแยกข้อมูลจะอัปเกรดเป็นการแยกข้อมูล .hyper หลังจากการแยกข้อมูล .tde อัปเกรดเป็นการแยกข้อมูล .hyper แล้ว จะไม่สามารถเปลี่ยนกลับไปเป็นการแยกข้อมูล .tde ได้ หากต้องการข้อมูลเพิ่มเติม โปรดดู การอัปเกรดการแยกข้อมูลเป็นรูปแบบ .hyper
การเปลี่ยนแปลงค่าและเครื่องหมายในมุมมอง
เพื่อเป็นการปรับปรุงประสิทธิภาพและความสามารถในการปรับขนาด ค่าในการแยกข้อมูลจะสามารถนำไปคำนวณในรูปแบบที่แตกต่างออกไปในเวอร์ชัน 10.5 และใหม่กว่า เมื่อเทียบกับเวอร์ชัน 10.4 และเก่ากว่า การเปลี่ยนแปลงวิธีการคำนวณค่าอาจส่งผลต่อการแสดงเครื่องหมายในมุมมองของคุณ ในบางกรณีที่เกิดขึ้นได้น้อย การเปลี่ยนแปลงอาจส่งผลให้มุมมองของคุณเปลี่ยนรูปร่างหรือกลายเป็นช่องว่าง การเปลี่ยนแปลงเหล่านี้ยังอาจมีผลกับแหล่งข้อมูลหลายการเชื่อมต่อ แหล่งข้อมูลที่ใช้การเชื่อมต่อแบบสดไปยังแหล่งข้อมูลแบบไฟล์ แหล่งข้อมูลที่เชื่อมต่อไปยังข้อมูล Google ชีต แหล่งข้อมูลแบบคลาวด์ แหล่งข้อมูลแบบแยกข้อมูลเท่านั้น และแหล่งข้อมูล WDC
เพื่อให้เข้าใจความแตกต่างบางประการที่คุณอาจเห็นในมุมมองเมื่อใช้เวอร์ชัน 2022.4 โปรดดูส่วนด้านล่าง
รูปแบบค่าวันที่และวันที่และเวลา
ในเวอร์ชัน 10.5 และใหม่กว่า การแยกข้อมูลจะอยู่ภายใต้กฎที่สอดคล้องกันและเข้มงวดยิ่งขึ้นเกี่ยวกับวิธีแปลข้อมูลสตริงวันที่ผ่านฟังก์ชัน DATE, DATETIME และ DATEPARSE ซึ่งจะส่งผลต่อวิธีการแยกวิเคราะห์วันที่ หรือรูปแบบและแบบแผนวันที่ซึ่งสามารถใช้ฟังก์ชันเหล่านี้ได้ โดยสามารถระบุกฎโดยสรุปได้ดังนี้
- วันที่จะได้รับการประเมินและแยกวิเคราะห์ตามคอลัมน์ ไม่ใช่แถว
- วันที่จะได้รับการประเมินและแยกวิเคราะห์ตามภาษาในพื้นที่ที่สร้างเวิร์กบุ๊ก ไม่ใช่ภาษาของคอมพิวเตอร์ที่เปิดเวิร์กบุ๊ก
กฎใหม่เหล่านี้ช่วยให้การแยกข้อมูลมีประสิทธิภาพมากขึ้นและสร้างผลลัพธ์ที่สอดคล้องกับฐานข้อมูลทางการค้า
อย่างไรก็ตาม โดยเฉพาะในกรณีการใช้งานระหว่างประเทศที่เวิร์กบุ๊กสร้างขึ้นในภาษาที่ต่างจากภาษาที่ใช้เปิดเวิร์กบุ๊กหรือเซิร์ฟเวอร์ที่เผยแพร่เวิร์กบุ๊กไป กฎเหล่านี้อาจทำให้คุณเห็น 1.) ค่าวันที่และวันที่และเวลาเปลี่ยนไปเป็นค่าวันที่และวันที่และเวลาอื่น หรือ 2.) ค่าวันที่และวันที่และเวลาเปลี่ยนไปเป็นค่า Null เมื่อค่าวันที่และวันที่และเวลาเปลี่ยนไปเป็นค่าวันที่และวันที่และเวลาอื่นหรือเปลี่ยนไปเป็นค่า Null ก็มักเป็นตัวบ่งบอกว่ามีปัญหาเกิดขึ้นกับข้อมูลเบื้องหลัง
นี่เป็นสาเหตุบางส่วนที่พบบ่อยซึ่งทำให้คุณอาจเห็นค่าวันที่และวันที่และเวลาเปลี่ยนไปในแหล่งข้อมูลการแยกเมื่อใช้เวอร์ชัน 10.5 และใหม่กว่า
สาเหตุที่พบบ่อยของการเปลี่ยนแปลงค่าวันที่และวันที่และเวลา | สาเหตุที่พบบ่อยของค่า null |
---|---|
|
|
สถานการณ์วันที่สมมติ 1
สมมติว่าคุณมีเวิร์กบุ๊กที่สร้างเป็นภาษาอังกฤษและใช้แหล่งข้อมูลการแยก .tde ตารางด้านล่างแสดงคอลัมน์ข้อมูลสตริงที่อยู่ในแหล่งข้อมูลของการแยกข้อมูล
31/10/2018 |
10/31/2018 |
10/12/2018 |
ตามรูปแบบภาษาอังกฤษที่เฉพาะเจาะจง รูปแบบของคอลัมน์วันที่ถูกกำหนดให้เป็นรูปแบบ ดวป (เดือน วัน และปี) ตารางต่อไปนี้แสดงค่าที่ Tableau แสดงผลตามภาษานี้เมื่อใช้ฟังก์ชัน DATE เพื่อแปลงค่าสตริงเป็นค่าวันที่
October 31, 2018 |
October 31, 2018 |
December 10, 2018 |
หากเปิดการแยกข้อมูลเป็นภาษาเยอรมัน คุณจะเห็นค่าต่อไปนี้
31 Oktober 2018 |
31 Oktober 2018 |
12 Oktober 2018 |
อย่างไรก็ตาม หลังจากเปิดการแยกข้อมูลเป็นภาษาเยอรมันโดยใช้เวอร์ชัน 10.5 และใหม่กว่า รูปแบบ DMY (วัน เดือน และปี) ของภาษาเยอรมันจะบังคับใช้อย่างเคร่งครัดและทำให้เกิดค่า Null เนื่องจากค่าใดค่าหนึ่งไม่เป็นไปตามรูปแบบ DMY
ค่า Null |
October 31, 2018 |
October 12, 2018 |
สถานการณ์วันที่สมมติ 2
สมมติว่าคุณมีอีกเวิร์กบุ๊กที่สร้างเป็นภาษาอังกฤษและใช้แหล่งข้อมูลการแยก .tde ตารางด้านล่างแสดงคอลัมน์ข้อมูลวันที่เป็นตัวเลขในแหล่งข้อมูลการแยก
1112018 |
1212018 |
1312018 |
1412018 |
ตามรูปแบบภาษาอังกฤษที่เฉพาะเจาะจง รูปแบบของคอลัมน์วันที่ถูกกำหนดให้เป็นรูปแบบ ดวป (เดือน วัน และปี) ตารางต่อไปนี้แสดงค่าที่ Tableau แสดงผลตามภาษานี้เมื่อใช้ฟังก์ชัน DATE เพื่อแปลงค่าตัวเลขเป็นค่าวันที่
1/11/2018 |
1/12/2018 |
ค่า Null |
ค่า Null |
สถานการณ์วันที่สมมติ 3
สมมติว่าคุณมีเวิร์กบุ๊กที่ใช้แหล่งข้อมูลการแยก .tde ตารางด้านล่างแสดงคอลัมน์ข้อมูลสตริงที่อยู่ในแหล่งข้อมูลของการแยกข้อมูล
2018-10-31 |
2018-31-10 |
2018-12-10 |
2018-10-12 |
เนื่องจากวันที่ใช้รูปแบบ ISO คอลัมน์วันที่จึงอยู่ในรูปแบบ YYYY-MM-DD เสมอ ตารางต่อไปนี้แสดงค่าที่ Tableau แสดงผลเมื่อใช้ฟังก์ชัน DATE เพื่อแปลงค่าสตริงเป็นค่าวันที่
October 10, 2018 |
ค่า Null |
December 10, 2018 |
October 12, 2018 |
หมายเหตุ: ในเวอร์ชัน 10.4 (และเก่ากว่า) รูปแบบ ISO และรูปแบบวันที่อื่นๆ อาจสร้างผลลัพธ์ที่แตกต่างกันไปตามภาษาในพื้นที่ที่สร้างเวิร์กบุ๊กขึ้น ตัวอย่างเช่น หากเป็นภาษาอังกฤษ ทั้ง 2018-12-10 และ 2018/12/10 อาจสร้างค่าเป็น December 12, 2o18 อย่างไรก็ตาม ถ้าหากเป็นภาษาเยอรมัน 2018-12-10 อาจสร้างค่าเป็น December 12, 2018 และ 2018/12/10 อาจสร้างค่าเป็น October 12, 2018
การคำนึงถึงลำดับการจัดเรียงและตัวพิมพ์เล็กและตัวพิมพ์ใหญ่
การแยกข้อมูลรองรับการตรวจเทียบ ดังนั้นจึงสามารถจัดเรียงค่าสตริงที่มีอักขระการออกเสียงหรือมีตัวพิมพ์เล็กและตัวพิมพ์ใหญ่แตกต่างกันได้อย่างถูกต้องมากขึ้น
ตัวอย่างเช่น สมมติว่าคุณมีตารางค่าสตริง ในแง่ของลำดับการจัดเรียง นั่นหมายความว่าค่าสตริงอย่าง Égypte จะเรียงอยู่หลัง Estonie และก่อน Fidji อย่างถูกต้อง
เกี่ยวกับข้อมูล Excel:
ในแง่ของตัวพิมพ์เล็กและตัวพิมพ์ใหญ่ นั่นหมายความว่าวิธีที่ Tableau จัดเก็บค่าได้เปลี่ยนแปลงไประหว่างเวอร์ชัน 10.4 (และเก่ากว่า) กับเวอร์ชัน 10.5 (และใหม่กว่า) อย่างไรก็ตาม กฎการจัดเรียงและการเปรียบเทียบค่าไม่ได้เปลี่ยนแปลงไป ในเวอร์ชัน 10.4 (และเก่ากว่า) ค่าสตริงอย่าง “House” “HOUSE” และ “houSe” จะถือว่าเหมือนกันและจัดเก็บด้วยค่าแสดงแทนเพียงค่าเดียว ในเวอร์ชัน 10.5 (และใหม่กว่า) ค่าสตริงเดียวกันนี้จะถือเป็นค่าไม่ซ้ำกัน ดังนั้นจึงจะจัดเก็บเป็นค่าแยกต่างหาก หากต้องการข้อมูลเพิ่มเติม โปรดดู เปลี่ยนวิธีคำนวณค่าต่างๆ
การแยกการเชื่อมต่อในการค้นหา N สูงสุด
เมื่อการค้นหา N สูงสุดในการแยกข้อมูลสร้างค่าซ้ำกันในตำแหน่งเฉพาะเจาะจงของอันดับ ตำแหน่งที่แยกการเชื่อมต่ออาจแตกต่างออกไปเมื่อใช้เวอร์ชัน 10.5 และใหม่กว่า ตัวอย่างเช่น สมมติว่าคุณสร้างตัวกรอง 3 ค่าสูงสุด ตำแหน่งที่ 3, 4 และ 5 มีค่าเดียวกัน เมื่อใช้เวอร์ชัน 10.4 และเก่ากว่า ตัวกรองอันดับสูงสุดอาจส่งคืนตำแหน่ง 1, 2 และ 3 อย่างไรก็ตาม เมื่อใช้เวอร์ชัน 10.5 และใหม่กว่า ตัวกรองอันดับสูงสุดอาจส่งคืนตำแหน่ง 1, 2 และ 5
ความแม่นยำของค่าทศนิยม
การแยกข้อมูลจะใช้ประโยชน์ทรัพยากรฮาร์ดแวร์ที่มีบนคอมพิวเตอร์ได้ดีขึ้น ดังนั้นจึงสามารถดำเนินการทางคณิตศาสตร์ไปพร้อมกันได้มาก ด้วยเหตุนี้ จำนวนจริงอาจรวมอยู่ในการแยกข้อมูล .hyper ในลำดับที่แตกต่างออกไป เมื่อจำนวนรวมอยู่ในลำดับที่แตกต่างออกไป คุณจึงอาจเห็นค่าที่แตกต่างในมุมมองหลังจุดทศนิยมในแต่ละครั้งที่คำนวณการรวมค่า เนื่องจากการบวกและการคูณทศนิยมไม่ได้จำเป็นต้องสัมพันธ์กัน นั่นคือ (a + b) + c ไม่ได้จำเป็นต้องเหมือนกับ a + (b + c) นอกจากนั้น จำนวนจริงยังอาจรวมในลำดับที่ต่างออกไปเนื่องจากการคูณทศนิยมไม่ได้จำเป็นต้องมีการแจกแจง นั่นคือ (a x b) x c ไม่จำเป็นต้องเหมือนกับ a x b x c ลักษณะการปัดเศษทศนิยมประเภทนี้ในการแยกข้อมูล .hyper จะเหมือนกับลักษณะการปัดเศษทศนิยมในฐานข้อมูลทางการค้า
ตัวอย่างเช่น สมมติว่าเวิร์กบุ๊กของคุณมีตัวกรองแถบเลื่อนในฟิลด์ค่ารวมที่ประกอบด้วยค่าทศนิยม เนื่องจากความแม่นยำของค่าทศนิยมได้เปลี่ยนไป ตัวกรองจึงอาจไม่รวมเครื่องหมายที่กำหนดขอบเขตสูงหรือต่ำของช่วงตัวกรอง จำนวนที่หายไปเหล่านี้อาจทำให้แสดงมุมมองว่างเปล่า ในการแก้ไขปัญหานี้ ให้ย้ายแถบเลื่อนบนตัวกรองหรือลบและเพิ่มตัวกรองอีกครั้ง
ความแม่นยำของการรวม
การแยกข้อมูลเพิ่มประสิทธิภาพให้ชุดข้อมูลขนาดใหญ่โดยใช้ประโยชน์ทรัพยากรฮาร์ดแวร์ที่มีบนคอมพิวเตอร์ได้ดีขึ้น ดังนั้นจึงสามารถคำนวณการรวมไปพร้อมกันได้มาก ด้วยเหตุนี้ การรวมที่ดำเนินการในการแยกข้อมูล .hyper จึงอาจเหมือนผลลัพธ์จากฐานข้อมูลทางการค้ามากกว่าผลลัพธ์จากซอฟต์แวร์ที่เชี่ยวชาญในการคำนวณเชิงสถิติ หากคุณทำงานโดยใช้ชุดข้อมูลขนาดเล็กหรือต้องการความแม่นยำในระดับสูงขึ้้น ให้พิจารณาทำการรวมผ่านเส้นอ้างอิง สถิติการ์ดข้อมูลสรุป หรือฟังก์ชันการคำนวณตาราง เช่น ผลต่าง ค่าเบี่ยงเบนมาตรฐาน สหสัมพันธ์ หรือค่าความแปรปรวนร่วม
เกี่ยวกับตัวเลือกทำการคำนวณทันทีสำหรับการแยกข้อมูล
หากใช้ตัวเลือกทำการคำนวณทันทีในการแยกข้อมูล .tde โดยใช้ Tableau Desktop เวอร์ชันเก่า ฟิลด์ที่คำนวณบางรายการจะเป็นจริง ดังนั้นจึงได้รับการคำนวณล่วงหน้าและจัดเก็บไว้ในการแยกข้อมูล หากคุณอัปเกรดจากการแยกข้อมูล .tde ไปเป็นการแยกข้อมูล .hyper การคำนวณที่เป็นจริงในการแยกข้อมูลของคุณก่อนหน้านี้จะไม่รวมอยู่ด้วย คุณต้องใช้ตัวเลือกทำการคำนวณทันทีอีกครั้งเพื่อให้แน่ใจว่าการคำนวณที่เป็นจริงรวมอยู่ในการแยกข้อมูลหลังจากอัปเกรดการแยกข้อมูล หากต้องการข้อมูลเพิ่มเติม โปรดดู ทำการคำนวณในการแยกข้อมูล
Extract API ใหม่
คุณสามารถใช้ Extract API 2.0 เพื่อสร้างการแยกข้อมูล .hyper ได้ สำหรับงานที่คุณเคยทำโดยใช้ Tableau SDK เช่น การเผยแพร่การแยกข้อมูล คุณสามารถใช้ Tableau Server REST API หรือไลบรารี Tableau Server Client (Python) ได้ สำหรับงานรีเฟรช คุณสามารถใช้ Tableau Server REST API ได้ด้วยเช่นกัน หากต้องการข้อมูลเพิ่มเติม โปรดดู Tableau Hyper API
สร้างการแยกข้อมูล
แม้ว่าจะมีหลายตัวเลือกในเวิร์กโฟลว์ของ Tableau สำหรับสร้างการแยกข้อมูล แต่วิธีหลักคือวิธีที่อธิบายไว้ที่ด้านล่าง
หลังจากเชื่อมต่อข้อมูลของคุณและตั้งค่าแหล่งข้อมูลบนหน้าแหล่งข้อมูลแล้ว ให้เลือกการแยกข้อมูลที่มุมขวาบนแล้วคลิกลิงก์แก้ไขเพื่อเปิดกล่องโต้ตอบการแยกข้อมูล
(ไม่บังคับ) กำหนดค่าตัวเลือกต่อไปนี้อย่างน้อยหนึ่งตัวเลือกเพื่อแจ้งให้ Tableau ทราบถึงวิธีการจัดเก็บข้อมูลที่แยก กำหนดตัวกรองสำหรับข้อมูลที่แยก และจำกัดจำนวนข้อมูลในข้อมูลที่แยกได้
ตัดสินใจว่าควรจัดเก็บข้อมูลที่แยกอย่างไร
คุณสามารถเลือกให้ Tableau จัดเก็บข้อมูลในข้อมูลที่แยกของคุณโดยใช้โครงสร้างหนึ่งในสองโครงสร้างนี้ได้ (สคีมา): ตารางเชิงตรรกะ (สคีมาแบบนอร์มัลไลซ์) หรือตารางเชิงกายภาพ (สคีมาแบบนอร์มัลไลซ์) หากต้องการข้อมูลเพิ่มเติมเกี่ยวกับตารางเชิงตรรกะและตารางกายภาพ โปรดดู แบบจำลองข้อมูล Tableau
ตัวเลือกที่คุณเลือกจะขึ้นอยู่กับสิ่งที่คุณต้องการ
จัดเก็บข้อมูลโดยใช้ตารางการแยกข้อมูลหนึ่งตารางสำหรับตารางตรรกะแต่ละตารางในแหล่งข้อมูล ระบบจะผสานรวมตารางทางกายภาพที่กำหนดตารางเชิงตรรกะและจัดเก็บไว้กับตารางเชิงตรรกะนั้นๆ ตัวอย่างเช่น หากแหล่งข้อมูลถูกสร้างขึ้นจากตารางตรรกะเดียว ข้อมูลก็จะถูกเก็บไว้ในตารางเดียว หากแหล่งข้อมูลประกอบด้วยตารางเชิงตรรกะสามตาราง (แต่ละตารางประกอบด้วยตารางกายภาพหลายตาราง) ข้อมูลที่แยกจะถูกเก็บไว้เป็นสามตาราง โดยมีตารางหนึ่งๆ สำหรับตารางเชิงตรรกะแต่ละตาราง
เลือกตารางเชิงตรรกะเมื่อคุณต้องการจำกัดจำนวนข้อมูลในการแยกข้อมูลของคุณด้วยการแยกข้อมูลพร็อพเพอร์ตี้เพิ่มเติม เช่น การแยกข้อมูลตัวกรอง, การรวม, บนสุด N รายการ หรือฟีเจอร์อื่นๆ ที่ต้องใช้ข้อมูลดีนอร์มัลไลซ์ และยังใช้เมื่อข้อมูลของคุณใช้ฟังก์ชันส่งผ่าน (RAWSQL) อีกด้วย นี่คือโครงสร้างที่เป็นค่าเริ่มต้นซึ่ง Tableau ใช้เพื่อเก็บข้อมูลที่แยก หากคุณใช้ตัวเลือกนี้เมื่อการแยกข้อมูลของคุณมีการรวม ระบบจะนำการรวมไปใช้เมื่อมีการสร้างการแยกข้อมูล
จัดเก็บข้อมูลโดยใช้ตารางการแยกข้อมูลหนึ่งตารางสำหรับตารางกายภาพแต่ละตารางในแหล่งข้อมูล
เลือกตารางกายภาพ หากข้อมูลที่แยกของคุณประกอบด้วยตารางที่รวมกับการรวมที่เสมอกันอย่างน้อยหนึ่งรายการและตรงตามเงื่อนไขการใช้ตัวเลือก “ตารางกายภาพ” ที่ระบุด้านล่าง หากคุณใช้ตัวเลือกนี้ การรวมจะดำเนินการในเวลาค้นหา
ตัวเลือกนี้สามารถปรับปรุงประสิทธิภาพและช่วยลดขนาดของไฟล์แยกข้อมูลได้ หากต้องการข้อมูลเพิ่มเติมเกี่ยวกับวิธีที่ Tableau แนะนำให้คุณใช้ตัวเลือก “ตารางกายภาพ” โปรดดู เคล็ดลับการใช้ตัวเลือก “ตารางกายภาพ” ในบางกรณี คุณยังสามารถใช้ตัวเลือกนี้แก้ปัญหาการรักษาความปลอดภัยระดับแถวแบบชั่วคราวได้อีกด้วย หากต้องการข้อมูลเพิ่มเติมเกี่ยวกับการรักษาความปลอดภัยระดับแถวโดยใช้ Tableau โปรดดู จำกัดการเข้าถึงที่ระดับแถวข้อมูล
เงื่อนไขการใช้ตัวเลือก “ตารางกายภาพ”
หากต้องการจัดเก็บการแยกข้อมูลของคุณโดยใช้ตัวเลือกตารางกายภาพ ข้อมูลในการแยกข้อมูลของคุณจะต้องเป็นไปตามเงื่อนไขทั้งหมดที่แสดงด้านล่าง
- การรวมทั้งหมดระหว่างตารางกายภาพเป็นการรวมที่เสมอกัน (=)
- ประเภทข้อมูลของคอลัมน์ที่ใช้สำหรับความสัมพันธ์หรือการรวมจะเหมือนกัน
- ไม่มีการใช้ฟังก์ชันส่งผ่าน (RAWSQL)
- ไม่มีการกำหนดค่าการรีเฟรชแบบเพิ่มหน่วย
- ไม่มีการแยกข้อมูลตัวกรองที่กำหนดค่า
- ไม่มีการกำหนดค่าบนสุด N รายการหรือการสุ่มตัวอย่าง
เมื่อระบบจัดเก็บการแยกข้อมูลเป็นตารางกายภาพ คุณจะไม่สามารถผนวกข้อมูลเข้าไปได้ สำหรับตารางเชิงตรรกะ คุณจะไม่สามารถผนวกข้อมูลเข้ากับการแยกข้อมูลที่มีตารางเชิงตรรกะมากกว่าหนึ่งตารางได้
หมายเหตุ: ทั้งตัวเลือก “ตารางเชิงตรรกะ” และ “ตารางกายภาพ” จะมีผลกับวิธีการจัดเก็บข้อมูลในการแยกข้อมูลของคุณเท่านั้น ตัวเลือกไม่มีผลกับวิธีแสดงตารางในการแยกข้อมูลของคุณในหน้า “แหล่งข้อมูล”
ตัวอย่างเช่น สมมติว่าการแยกข้อมูลของคุณประกอบด้วยตารางเชิงตรรกะหนึ่งตารางที่มีตารางกายภาพสามตาราง หากคุณเปิดไฟล์การแยกข้อมูล (.hyper) ที่กำหนดค่าให้ใช้ตัวเลือกเริ่มต้นเป็นตารางเชิงตรรกะโดยตรง คุณจะเห็นตารางเดียวที่แสดงในหน้าแหล่งข้อมูล แต่ถ้าหากคุณเปิดการแยกข้อมูลโดยใช้ไฟล์แหล่งข้อมูลแบบแพ็กเกจ (.tdsx) หรือไฟล์แหล่งข้อมูล (.tdsx) ที่มีไฟล์การแยกข้อมูลที่สอดคล้องกัน (.hyper) คุณจะเห็นตารางทั้งสามที่ประกอบด้วยการแยกข้อมูลบนหน้าแหล่งข้อมูล
กำหนดจำนวนข้อมูลที่จะแยก
คลิกเพิ่มเพื่อกำหนดตัวกรองอย่างน้อยหนึ่งตัวกรอง เพื่อให้ระบบจำกัดจำนวนข้อมูลที่จะแยกตามฟิลด์และค่าของตัวกรอง
รวมข้อมูลในการแยกข้อมูล
เลือกข้อมูลแบบรวมสำหรับมิติข้อมูลที่มองเห็นได้เพื่อรวมการวัดผลโดยใช้การรวมที่เป็นค่าเริ่มต้น การรวมข้อมูลจะรวมแถว ซึ่งสามารถลดขนาดของไฟล์แยกข้อมูลและเพิ่มประสิทธิภาพได้
เมื่อคุณเลือกที่จะรวมข้อมูล คุณยังสามารถเลือกสะสมวันไปจนถึงระดับวันที่ที่ระบุ เช่น ปี เดือน เป็นต้น ตัวอย่างด้านล่างแสดงให้เห็นวิธีแยกข้อมูลสำหรับตัวเลือกการรวมที่คุณสามารถเลือกได้แต่ละตัวเลือก
ข้อมูลดั้งเดิม ระเบียนแต่ละรายการจะแสดงเป็นแถวแยกกัน คุณมีข้อมูลอยู่เจ็ดแถว ข้อมูลแบบรวมสำหรับมิติข้อมูลที่มองเห็นได้ (ไม่มีการสะสม)
ระเบียนที่มีวันที่และภูมิภาคเดียวกันจะถูกรวมกันเป็นแถวเดียว มีการแยกข้อมูลอยู่ห้าแถว ข้อมูลแบบรวมสำหรับมิติข้อมูลที่มองเห็นได้
(สะสมวันเป็นเดือน)มีการสะสมวันจนเป็นระดับเดือนและบันทึกที่อยู่ในภูมิภาคเดียวกันจะรวมกันเป็นแถวเดียว มีการแยกข้อมูลอยู่สามแถว เลือกแถวที่จะแยก
เลือกจำนวนแถวที่คุณต้องการแยก
คุณสามารถแยกแถวทั้งหมดหรือบนสุด N แถวได้ Tableau จะใช้ตัวกรองและการรวมก่อน จากนั้นจึงแยกข้อมูลจำนวนแถวออกจากผลลัพธ์ที่กรองและรวมแล้วนั้นๆ ตัวเลือกจำนวนแถวจะขึ้นอยู่กับประเภทของแหล่งข้อมูลที่คุณนำมาแยกข้อมูลออก
แหล่งข้อมูลบางแหล่งไม่รองรับการสุ่มตัวอย่าง ดังนั้น คุณอาจไม่เห็นตัวเลือกการสุ่มตัวอย่างในกล่องโต้ตอบ “แยกข้อมูล”
ฟิลด์ที่คุณซ่อนไว้ก่อนในหน้า “แหล่งข้อมูล” หรือบนแท็บชีตจะไม่ถูกแยกข้อมูล คลิกปุ่มซ่อนทุกฟิลด์ที่ไม่ได้ใช้เพื่อลบฟิลด์ที่ซ่อนอยู่ออกจากการแยกข้อมูล
เมื่อเสร็จแล้ว ให้คลิกตกลง
คลิกแท็บชีต เมื่อคลิกแท็บชีต ระบบจะเริ่มสร้างการแยกข้อมูล
ในกล่องโต้ตอบที่ปรากฏตามมา ให้เลือกจุดที่จะบันทึกการแยกข้อมูล ใส่ชื่อไฟล์การแยกข้อมูล แล้วคลิกบันทึก
หากกล่องโต้ตอบ “บันทึก” ไม่ปรากฏขึ้น โปรดดูส่วนแก้ปัญหาการแยกข้อมูลที่ด้านล่าง
เคล็ดลับทั่วไปสำหรับการใช้งานการแยกข้อมูล
บันทึกเวิร์กบุ๊กเพื่อรักษาการเชื่อมต่อกับการแยกข้อมูล
หลังจากสร้างการแยกข้อมูลแล้ว เวิร์กบุ๊กจะเริ่มใช้เวอร์ชันการแยกข้อมูลของคุณ แต่การเชื่อมต่อกับเวอร์ชันการแยกข้อมูลของคุณจะไม่ได้เก็บรักษาไว้จนกว่าคุณจะบันทึกเวิร์กบุ๊ก นั่นหมายความว่า หากคุณปิดเวิร์กบุ๊กโดยไม่ได้บันทึกเวิร์กบุ๊กก่อน เวิร์กบุ๊กจะเชื่อมต่อกับแหล่งข้อมูลเดิมในครั้งถัดไปที่คุณเปิด
สลับระหว่างตัวอย่างข้อมูลและการแยกข้อมูลทั้งหมด
เมื่อคุณใช้งานการแยกข้อมูลขนาดใหญ่ คุณอาจต้องสร้างการแยกข้อมูลด้วยตัวอย่างข้อมูลเพื่อให้สามารถตั้งค่ามุมมองโดยไม่ต้องทำการค้นหาอย่างยาวนานทุกครั้งที่วางฟิลด์ลงในแถบบนแท็บชีต จากนั้นคุณจะสามารถสลับระหว่างการใช้การแยกข้อมูล (ด้วยตัวอย่างข้อมูล) และการใช้แหล่งข้อมูลทั้งหมดโดยเลือกแหล่งข้อมูลที่เมนูข้อมูล แล้วเลือกใช้การแยกข้อมูล
อย่าเชื่อมต่อกับการแยกข้อมูลโดยตรง
เนื่องจากการแยกข้อมูลบันทึกอยู่ในระบบไฟล์ของคุณ จึงสามารถใช้อินสแตนซ์ Tableau Desktop ใหม่เชื่อมต่อกับการแยกข้อมูลได้โดยตรง แต่เราไม่แนะนำให้ดำเนินการเช่นนี้เนื่องจากเหตุผลบางประการต่อไปนี้
- ชื่อตารางจะไม่เหมือนกัน ตารางที่จัดเก็บในการแยกข้อมูลของคุณจะใช้ชื่อพิเศษเพื่อยืนยันว่าชื่อจะไม่ซ้ำกัน และอาจจะอ่านไม่ออก
- คุณไม่สามารถรีเฟรชการแยกข้อมูลได้ เมื่อเชื่อมต่อกับการแยกข้อมูลโดยตรง Tableau จะถือว่าไฟล์เป็นแหล่งข้อมูลจริง ซึ่งต่างจากการลอกแบบข้อมูลเบื้องหลัง ดังนั้นจึงไม่สามารถเชื่อมโยงกลับไปยังแหล่งข้อมูลของคุณได้
- โมเดลข้อมูลและความสัมพันธ์จะหายไป โมเดลข้อมูลและความสัมพันธ์ระหว่างตารางจะจัดเก็บในไฟล์ .tds ไม่ใช่ในไฟล์ .hyper ข้อมูลนี้จึงจะสูญหายไปเมื่อเชื่อมต่อกับไฟล์ .hyper โดยตรง นอกจากนี้ หากคุณเชื่อมต่อโดยใช้การจัดเก็บตารางเชิงตรรกะ คุณจึงจะไม่เห็นข้อมูลอ้างอิงใดๆ ไปยังตารางกายภาพเบื้องหลังเดิม
ลบการแยกข้อมูลออกจากเวิร์กบุ๊ก
คุณสามารถลบการแยกข้อมูลได้ทุกเมื่อโดยเลือกแหล่งข้อมูลการแยกในเมนูข้อมูล แล้วเลือก เมื่อคุณลบการแยกข้อมูล คุณสามารถเลือกได้ว่าจะลบการแยกข้อมูลออกจากเวิร์กบุ๊กเท่านั้นหรือลบไฟล์การแยกข้อมูล ตัวเลือกหลังจะลบการแยกข้อมูลออกจากฮาร์ดไดรฟ์ของคุณ
ดูประวัติการแยกข้อมูล
คุณจะเห็นเวลาที่อัปเดตการแยกข้อมูลล่าสุดและรายละเอียดอื่นๆ โดยเลือกแหล่งข้อมูลในเมนูข้อมูล แล้วเลือก
หากคุณเปิดเวิร์กบุ๊กที่บันทึกไว้กับการแยกข้อมูลและ Tableau ไม่พบการแยกข้อมูลนั้น ให้เลือกตัวเลือกใดตัวเลือกหนึ่งต่อไปนี้ในกล่องโต้ตอบ “ไม่พบการแยกข้อมูล” ที่ปรากฏ
ค้นหาการแยกข้อมูล: เลือกตัวเลือกนี้หากมีการแยกข้อมูลอยู่ แต่ไม่อยู่ในตำแหน่งเดิมที่ Tableau บันทึกไว้ คลิกตกลงเพื่อเปิดกล่องโต้ตอบ “เปิดไฟล์” ซึ่งคุณสามารถระบุตำแหน่งใหม่ของไฟล์การแยกข้อมูลได้
ลบการแยกข้อมูล: เลือกตัวเลือกนี้หากคุณไม่จำเป็นต้องใช้การแยกข้อมูลนั้นแล้ว ซึ่งเท่ากับเป็นการปิดแหล่งข้อมูล เวิร์กชีตที่เปิดทั้งหมดซึ่งอ้างอิงแหล่งข้อมูลดังกล่าวจะถูกลบ
ปิดใช้งานการแยกข้อมูล: ใช้แหล่งข้อมูลเดิมที่ใช้สร้างการแยกข้อมูล แทนที่จะใช้การแยกข้อมูล
สร้างการแยกข้อมูลใหม่: สร้างการแยกข้อมูลขึ้นใหม่อีกครั้ง ตัวกรองทั้งหมดและการปรับแต่งอื่นๆ ที่คุณระบุตอนสร้างการแยกข้อมูลขึ้นครั้งแรกจะถูกนำมาใช้โดยอัตโนมัติ
เคล็ดลับการใช้ตัวเลือก “ตารางกายภาพ”
โดยทั่วไป Tableau จะแนะนำให้คุณใช้ตัวเลือกการจัดเก็บข้อมูลเริ่มต้นอย่างตารางเชิงตรรกะเมื่อตั้งค่าและใช้งานการแยกข้อมูล ในหลายๆ ครั้ง บางฟีเจอร์ที่คุณต้องใช้กับการแยกข้อมูล เช่น ตัวกรองการแยกข้อมูล จะพร้อมให้คุณใช้งานเมื่อคุณใช้ตัวเลือก “ตารางกายภาพ” เท่านั้น
ตัวเลือก “ตารางกายภาพ” สำหรับการแยกข้อมูลที่มีขนาดใหญ่กว่าที่คาดการณ์
ควรใช้งานตัวเลือก “ตารางกายภาพ” อย่างจำกัดเพื่อเป็นตัวช่วยในบางสถานการณ์ เช่น เมื่อแหล่งข้อมูลของคุณเป็นไปตามเงื่อนไขการใช้ตัวเลือก “ตารางกายภาพ” และการแยกข้อมูลมีขนาดใหญ่กว่าที่คาดการณ์ ในการประเมินว่าการแยกข้อมูลมีขนาดใหญ่กว่าที่ควรหรือไม่ ผลรวมแถวในการแยกข้อมูลที่ใช้ตัวเลือก “ตารางกายภาพ” ต้องสูงกว่าผลรวมแถวของตารางที่รวมกันทั้งหมดก่อนจะสร้างการแยกข้อมูล หากคุณพบเจอสถานการณ์นี้ ให้ลองใช้ตัวเลือก “ตารางกายภาพ” แทน
คำแนะนำตัวเลือกการกรองเมื่อใช้ตัวเลือก “ตารางกายภาพ”
เมื่อใช้ตัวเลือก “ตารางกายภาพ” ระบบจะปิดใช้งานตัวเลือกอื่นๆ เพื่อช่วยลดข้อมูลในการแยกข้อมูล เช่น ตัวกรองการแยกข้อมูล, การรวม, N สูงสุด และการสุ่มตัวอย่าง หากคุณจำเป็นต้องลดข้อมูลในการแยกข้อมูลที่ใช้ตัวเลือก “ตารางกายภาพ” ให้พิจารณากรองข้อมูลก่อนนำไปไว้ใน Tableau Desktop โดยใช้คำแนะนำข้อใดข้อหนึ่งต่อไปนี้
เชื่อมต่อกับข้อมูลของคุณและกำหนดตัวกรองโดยใช้ SQL แบบปรับแต่งเอง: เชื่อมต่อกับข้อมูลของคุณโดยใช้ SQL แบบปรับแต่งเองแทนการเชื่อมต่อกับตารางฐานข้อมูล เมื่อสร้างการค้นหา SQL แบบปรับแต่งเอง โปรดตรวจสอบว่ามีระดับการกรองที่เหมาะสมซึ่งคุณต้องใช้เพื่อลดข้อมูลในการแยกข้อมูลของคุณ หากต้องการข้อมูลเพิ่มเติมเกี่ยวกับ SQL แบบปรับแต่งเองใน Tableau Desktop โปรดดู เชื่อมต่อกับการค้นหา SQL แบบปรับแต่งเอง
กำหนดมุมมองในฐานข้อมูล: หากคุณมีสิทธิ์เขียนในฐานข้อมูลของคุณ ให้พิจารณากำหนดมุมมองฐานข้อมูลที่มีเพียงข้อมูลที่คุณต้องใช้ในการแยกข้อมูล แล้วจึงเชื่อมต่อกับมุมมองฐานข้อมูลจาก Tableau Desktop
การรักษาความปลอดภัยระดับแถวที่มีการแยกข้อมูล
หากคุณต้องการรักษาความปลอดภัยของการแยกข้อมูลในระดับแถว ขอแนะนำให้ใช้ตัวเลือก “ตารางกายภาพ” เพื่อแก้ไขกรณีนี้ หากต้องการข้อมูลเพิ่มเติมเกี่ยวกับการรักษาความปลอดภัยระดับแถวใน Tableau โปรดดู จำกัดการเข้าถึงที่ระดับแถวข้อมูล
แก้ปัญหาการแยกข้อมูล
การสร้างการแยกข้อมูลใช้เวลานาน: การสร้างการแยกข้อมูลอาจใช้เวลานาน ทั้งนี้ขึ้นอยู่กับขนาดชุดข้อมูลของคุณ แต่หลังจากที่คุณแยกข้อมูลและบันทึกลงในคอมพิวเตอร์แล้ว ประสิทธิภาพอาจดีขึ้น
ระบบไม่สร้างการแยกข้อมูล: หากชุดข้อมูลของคุณมีคอลัมน์จำนวนมาก (เช่น หลายพันคอลัมน์) Tableau อาจไม่สามารถสร้างการแยกข้อมูลได้ในบางกรณี หากคุณประสบปัญหา ให้พิจารณาแยกข้อมูลคอลัมน์จำนวนน้อยลง หรือปรับโครงสร้างข้อมูลเบื้องหลัง
กล่องโต้ตอบ “บันทึก” ไม่ปรากฏ หรือระบบไม่สร้างการแยกข้อมูลจาก .twbx: หากคุณทำตามขั้นตอนข้างต้นเพื่อแยกข้อมูลจากเวิร์กบุ๊กแบบแพ็กเกจ กล่องโต้ตอบ “บันทึก” จะไม่ปรากฏ เมื่อสร้างการแยกข้อมูลจากเวิร์กบุ๊กแบบแพ็กเกจ (.twbx) ไฟล์การแยกข้อมูลจะจัดเก็บไว้อัตโนมัติในแพ็กเกจไฟล์ที่เชื่อมโยงกับเวิร์กบุ๊กแบบแพ็กเกจ หากต้องการเข้าถึงไฟล์การแยกข้อมูลที่คุณสร้างจากเวิร์กบุ๊กแบบแพ็กเกจ คุณต้องคลายแพ็กเกจเวิร์กบุ๊กก่อน หากต้องการข้อมูลเพิ่มเติม โปรดดูเวิร์กบุ๊กแบบแพ็กเกจ