รีเฟรชการแยกข้อมูล
เมื่อข้อมูลต้นฉบับมีการเปลี่ยนแปลง คุณสามารถรีเฟรชการแยกข้อมูลได้ด้วย Desktop โดยเลือกแหล่งข้อมูลในเมนูข้อมูล แล้วเลือก การแยกข้อมูลสามารถตั้งค่าได้สองวิธี ได้แก่ รีเฟรชแบบเต็มหรือรีเฟรชแบบเพิ่มหน่วย
ด้วยการรีเฟรชแบบเต็ม ข้อมูลทั้งหมดในการแยกข้อมูลจะถูกแทนที่ด้วยข้อมูลล่าสุดจากแหล่งข้อมูลต้นฉบับ การรีเฟรชแบบเพิ่มหน่วยจะมีสองรูปแบบ: เพิ่มเฉพาะแถวใหม่ตั้งแต่การรีเฟรชครั้งล่าสุด หรือกำหนดระยะเวลาตั้งแต่วันที่รีเฟรชเพื่อรีเฟรช แนวทางที่สองที่เป็นทางเลือกนั้นจะกล่าวถึงความจำเป็นในการอัปเดตการแยกข้อมูลหากมีความเป็นไปได้ที่ข้อมูลที่แยกข้อมูลแล้วอาจมีการเปลี่ยนแปลงในแหล่งข้อมูล หากคุณต้องการรายละเอียดเพิ่มเติมเกี่ยวกับวิธีแยกข้อมูล โปรดดูแยกข้อมูลของคุณ
หมายเหตุ: นอกจากนี้คุณสามารถตั้งการรีเฟรชการแยกข้อมูลให้ทำงานอัตโนมัติได้โดยใช้ยูทิลิตีบรรทัดคำสั่งการแยกข้อมูลใน Tableau
หากคุณต้องการรีเฟรชการแยกข้อมูล ให้สังเกตดูรูปแบบไฟล์ของการแยกข้อมูลก่อนที่คุณจะลงมือรีเฟรชการแยกข้อมูล หากคุณทำการรีเฟรชการแยกข้อมูล .tde
โดยใช้เวอร์ชัน 2022.4 หรือใหม่กว่า การแยกข้อมูลจะอัปเกรดเป็นการแยกข้อมูล .hyper
โดยอัตโนมัติ แม้ว่าการอัปเกรดไปใช้การแยกข้อมูล .hyper
จะมีประโยชน์มากมาย แต่คุณจะไม่สามารถเปิดการแยกข้อมูลกับ Tableau Desktop เวอร์ชันก่อนหน้าได้ หากต้องการข้อมูลเพิ่มเติม โปรดดู การอัปเกรดการแยกข้อมูลเป็นรูปแบบ .hyper
หมายเหตุ: ไม่รองรับไฟล์ .tde ไม่ได้รับการสนับสนุในรูปแบบใดๆ อีกต่อไปหลังจากเวอร์ชัน 2024.2 ของ Tableau และจะต้องอัปเกรดเป็นรูปแบบ .hyper จึงจะใช้ได้
ตามค่าเริ่มต้นแล้ว การแยกข้อมูลจะถูกกำหนดค่าไว้ให้รีเฟรชแบบเต็มรูปแบบ ซึ่งหมายความว่าทุกครั้งที่คุณรีเฟรชการแยกข้อมูล ทุกแถวจะถูกแทนที่ด้วยข้อมูลในแหล่งข้อมูลตั้งต้น แม้ว่าการรีเฟรชเช่นนี้จะช่วยให้มั่นใจว่าคุณมีสำเนาที่เหมือนกันกับข้อมูลตั้งต้นอย่างแน่นอน แต่การรีเฟรชแบบเต็มรูปแบบอาจใช้เวลานานมากและสิ้นเปลืองฐานข้อมูล ทั้งนี้ขึ้นอยู่กับขนาดของการแยกข้อมูล หากมีการแยกข้อมูลใดที่ไม่ได้ถูกกำหนดค่าไว้ให้รีเฟรชแบบเพิ่มหน่วย การเลือกรีเฟรชการแยกข้อมูลดังกล่าวจะส่งผลให้ระบบดำเนินการรีเฟรชการแยกข้อมูลแบบเต็มรูปแบบ
เผยแพร่ไปยัง Tableau Server
หากคุณวางแผนที่จะเผยแพร่การแยกข้อมูลเพื่อใช้เป็นแหล่งข้อมูลสำหรับ Tableau Server คุณสามารถวางกำหนดการเพื่อให้รีเฟรชการแยกข้อมูลในระหว่างการเผยแพร่ได้
คล้ายคลึงกันนี้ หากคุณวางแผนที่จะเผยแพร่การแยกข้อมูลในเวิร์กบุ๊กสำหรับ Tableau Server คุณสามารถวางกำหนดการเพื่อให้รีเฟรชการแยกข้อมูลในระหว่างการเผยแพร่ได้เช่นกัน หากต้องการข้อมูลเพิ่มเติม โปรดดู กำหนดเวลาการรีเฟรชการแยกข้อมูลเมื่อคุณเผยแพร่เวิร์กบุ๊ก
เผยแพร่ไปยัง Tableau Cloud
หากคุณวางแผนที่จะเผยแพร่การแยกข้อมูลเพื่อใช้เป็นแหล่งข้อมูลสำหรับ Tableau Cloud ตัวเลือกรีเฟรชข้อมูลที่คุณสามารถใช้งานได้จะขึ้นอยู่กับลักษณะของแหล่งข้อมูลของคุณ หากต้องการข้อมูลเพิ่มเติมเกี่ยวกับการรีเฟรชข้อมูลจากแหล่งข้อมูลที่เจาะจง โปรดดู ตัวเลือกการรีเฟรชการแยกข้อมูลตามแหล่งข้อมูล
แหล่งข้อมูลส่วนใหญ่รองรับการรีเฟรชแบบเพิ่มหน่วย ซึ่งแทนที่จะรีเฟรชการแยกข้อมูลทั้งหมด คุณสามารถกำหนดค่าการรีเฟรชให้เพิ่มเฉพาะแถวที่เป็นแถวใหม่นับจากครั้งล่าสุดที่คุณทำการแยกข้อมูล
ตัวอย่างเช่น คุณอาจมีแหล่งข้อมูลที่อัปเดตธุรกรรมการขายใหม่ๆ เข้าไปเป็นประจำทุกวัน ซึ่งแทนที่จะสร้างการแยกข้อมูลทั้งหมดใหม่อีกครั้งทุกวัน คุณสามารถเพิ่มแค่ธุรกรรมใหม่ๆ ที่เกิดขึ้นในวันนั้นๆ ได้ จากนั้นคุณอาจจะทำการรีเฟรชแบบเต็มรูปแบบสัปดาห์ละครั้งเพื่อให้มั่นใจว่าคุณมีข้อมูลใหม่ล่าสุดอย่างครบถ้วน
นอกจากนี้ คุณยังสามารถกำหนดค่าการตั้งค่าเพิ่มเติมเพื่อกำหนดช่วงเวลาในการลบข้อมูลที่เกี่ยวข้องทั้งหมดจากการแยกข้อมูลที่มีอยู่ และรีเฟรชโดยสมบูรณ์ โดยเลือกการเปลี่ยนแปลงหรือการเพิ่มใดๆ นับตั้งแต่การรีเฟรชครั้งสุดท้ายในช่วงเวลาดังกล่าว
คอลัมน์ที่ไม่ซ้ำกัน
ตั้งแต่เวอร์ชัน 2024.1 เป็นต้นไป Tableau จะแนะนำฟีเจอร์ที่ช่วยให้ผู้ใช้ทำการรีเฟรชแบบเพิ่มหน่วยในการแยกข้อมูลโดยใช้คอลัมน์คีย์ที่ซ้ำกัน การอัปเดตครั้งนี้มีขั้นตอนเพิ่มเติมในกระบวนการนี้
การรีเฟรชแบบช่วงย่อยสำหรับการแยกข้อมูลแบบเพิ่มหน่วย
ใน Tableau เวอร์ชัน 2024.2 และใหม่กว่า คุณสามารถระบุช่วงเวลาเพิ่มเติมเพื่อดึงข้อมูลที่แยกออกมาก่อนหน้านี้อีกครั้ง และบันทึกการเปลี่ยนแปลงใดๆ ที่อาจเกิดขึ้น สิ่งนี้ดำเนินการด้วยฟิลด์ช่วงวันที่ขั้นต่ำที่จะรีเฟรช สิ่งนี้มีประโยชน์หาก (ตัวอย่าง) แหล่งข้อมูลอนุญาตให้มีการแทรกและการแก้ไขย้อนหลังภายในระยะเวลาที่กำหนด เมื่อกำหนดค่าแล้ว การแยกข้อมูลแบบเพิ่มหน่วยจะดึงข้อมูลใหม่ รวมถึงข้อมูลที่แยกออกมาก่อนหน้านี้จากช่วงเวลาที่กำหนด
หลังจากเลือกตัวเลข (เช่น 2) และช่วงเวลา (เช่น เดือน) ข้อความช่วยเหลือด้านล่างนี้จะอัปเดตเพื่อสะท้อนถึงตัวเลือกของคุณ (“ข้อมูล 2 เดือนล่าสุดจากวันที่รีเฟรชจะได้รับการรีเฟรชเสมอ”) หากไม่ได้ระบุช่วงเวลา ระบบจะดึงเฉพาะเนื้อหาที่ใหม่กว่าในการแยกข้อมูลที่มีอยู่เท่านั้น
ทำความเข้าใจเกี่ยวกับการรีเฟรชแบบช่วงย่อย
การกำหนดค่าการรีเฟรชแบบช่วงย่อยให้เหมาะกับคุณที่สุดจะขึ้นอยู่กับความถี่ที่คุณวางแผนจะรีเฟรชการแยกข้อมูล ความถี่ในการอัปเดตแหล่งข้อมูล และปริมาณข้อมูลที่โดยปกติจะอัปเดตในแต่ละช่วงเวลา สิ่งสำคัญคือต้องเข้าใจวิธีที่ Tableau ตีความตัวเลือกการกำหนดค่าการแยกข้อมูลของคุณ เพื่อให้แน่ใจว่าการแยกข้อมูลนั้นมีข้อมูลตามที่คุณคาดหวัง
- เมื่อป้อนหน่วยเวลาจำนวนหนึ่ง Tableau จะตีความว่าดึงข้อมูลทั้งหมดจากหน่วยเวลาที่มีอยู่ รวมถึงข้อมูลที่มีค่าหน่วย X เพิ่มเติม ตัวอย่าง: หากคุณตั้งค่าเป็น 3 เดือน ระบบจะดึงข้อมูลทั้งหมดจากเดือนปัจจุบัน รวมถึงข้อมูลของ 3 เดือนก่อนหน้าด้วย หากวันที่ปัจจุบันคือ 1 เมษายน ระบบจะดึงข้อมูลทั้งหมดจากเดือนเมษายน (ในกรณีนี้คือ 1 วัน) บวกกับข้อมูลทั้งหมดจากเดือนมกราคม กุมภาพันธ์ และมีนาคม หรือข้อมูลประมาณ 91 วัน การเรียกใช้การรีเฟรชแบบเดียวกันในวันที่ 28 เมษายน จะดึงข้อมูลจาก 28 วันในเดือนเมษายน บวกกับ 3 เดือนก่อนหน้า หรือข้อมูลประมาณ 118 วัน
- เพื่อการควบคุมและความสอดคล้องที่ละเอียดที่สุด แนวทางปฏิบัติที่ดีที่สุดคือการใช้หน่วยเวลาที่เล็กที่สุดที่เหมาะสมกับข้อมูลของคุณ (เช่น วัน) หากต้องการรีเฟรชข้อมูล 90 วันก่อนหน้าเสมอรวมทั้งวันรีเฟรช ให้เลือก 90 เป็นตัวเลข และเลือกวันเป็นช่วงเวลา
- Tableau แนะนำให้คุณสร้างข้อมูลโดยอิงตามฟิลด์วันที่/เวลาที่สะท้อนถึงวันที่/เวลาที่ป้อนระเบียน หากฟิล์ดวันที่ที่ใช้ในการกำหนดการแยกข้อมูลมีวันที่ในอนาคตรวมอยู่ด้วย (เช่น "วันจัดส่งคำสั่งซื้อที่วางแผนไว้") ผลลัพธ์ที่ใช้แอตทริบิวต์รีเฟรชช่วงย่อยอาจไม่เป็นไปตามที่คุณคาดหวัง ตัวอย่าง: การรีเฟรชแบบเพิ่มหน่วยจะถูกตั้งค่าให้ดึงข้อมูลสองเดือนก่อนหน้าจากวันที่รีเฟรช เป็นวันที่ 1 เมษายน แต่มีระเบียนในฐานข้อมูลที่ฟิลด์วันที่มีค่าย้อนหลังไปถึง 6 เดือนในอนาคต ซึ่งก็คือวันที่ 1 กันยายน เมื่อการรีเฟรชเกิดขึ้นในตัวอย่างนี้ จะมีการดึงเฉพาะข้อมูลจากเดือนเมษายน (เดือนที่รีเฟรชปัจจุบัน) และข้อมูล 2 เดือนก่อนหน้าเท่านั้น หากมีการเปลี่ยนแปลงเกิดขึ้นในแหล่งข้อมูลสำหรับแถวที่เชื่อมโยงกับวันที่ในอนาคตเหล่านี้เกินเดือนเมษายน จะไม่ได้รับการอัปเดต
- หากมีข้อมูลใหม่มากกว่าในแหล่งข้อมูลที่ต้องรีเฟรชมากกว่าระยะเวลาที่กำหนดไว้ ข้อมูลพิเศษที่ดึงมาจะเริ่มต้น ณ จุดที่มีข้อมูลใหม่พร้อมใช้งาน ตัวอย่างเช่น หากคุณกำหนดค่าช่วงย่อยเฉพาะ 2 วันก่อนหน้า แต่การรีเฟรชครั้งล่าสุดเกิดขึ้นเมื่อ 10 วันที่แล้ว ระบบจะดึงข้อมูลใหม่ทั้งหมดจาก 10 วันที่ผ่านมารวมทั้งข้อมูลที่ดึงออกมาก่อนหน้านี้เพิ่มอีก 2 วัน
หมายเหตุ: หากโครงสร้างข้อมูลของข้อมูลต้นทางมีการเปลี่ยนแปลง (เช่น มีการเพิ่มคอลัมน์ใหม่) คุณจะต้องทำการรีเฟรชการแยกข้อมูลแบบเต็มก่อนที่จะเริ่มทำการรีเฟรชแบบเพิ่มหน่วยอีกครั้งได้
ทำตามขั้นตอนเหล่านี้เพื่อตั้งค่าการแยกข้อมูลที่จะรีเฟรชแบบเพิ่มหน่วย หรือแก้ไขการแยกข้อมูลทั้งหมดที่มีอยู่เพื่อใช้การรีเฟรชแบบเพิ่มหน่วย
เลือกแหล่งข้อมูลบนเมนูข้อมูล แล้วเลือกการแยกข้อมูล
ในกล่องโต้ตอบการแยกข้อมูล ให้เลือกแถวทั้งหมดเป็นจำนวนแถวที่จะแยกข้อมูล คุณจะสามารถกำหนดการรีเฟรชแบบเพิ่มหน่วยได้เฉพาะเมื่อคุณแยกข้อมูลแถวทั้งหมดในฐานข้อมูล
หมายเหตุ: คุณสามารถเพิ่มหน่วยให้ตัวอย่างการแยกข้อมูลได้
ขยายส่วนการรีเฟรชแบบเพิ่มหน่วยและตรวจสอบการรีเฟรชแบบเพิ่มหน่วย
ระบุคอลัมน์ในฐานข้อมูลที่จะนำมาใช้ในการระบุแถวใหม่
ตัวอย่างเช่น คุณสามารถเลือกฟิลด์ “วันที่” หรือ ID ที่เพิ่มขึ้นแบบซ้ำๆ เมื่อเพิ่มแถวไปยังฐานข้อมูล
(ไม่บังคับ) หากคุณเลือกคอลัมน์ “วันที่” หรือ “วันที่และเวลา” ใน Tableau คุณสามารถรีเฟรชข้อมูลบางส่วนได้โดยระบุช่วงวันที่ที่ต้องการ กำหนดจำนวนวันและระบุมาตราส่วนวันที่/เวลาเพื่อสร้างช่วงวันที่ขั้นต่ำสำหรับการรีเฟรช (เช่น 14 วันนับจากวันที่รีเฟรช)
(ไม่บังคับ) หากไม่มีการกำหนดช่วงการรีเฟรชขั้นต่ำ ให้ขยายการตั้งค่าขั้นสูงเพื่อกำหนดวิธีการดึงข้อมูลแถวใหม่ คุณสามารถแทนที่แถวล่าสุดที่เพิ่มด้วยการรีเฟรชค่าเท่ากับหรือมากกว่าค่าที่บันทึกไว้ล่าสุด หรือเลือกที่จะเก็บแถวล่าสุดที่เพิ่มโดยเฉพาะการรีเฟรชการแยกข้อมูลเท่านั้นด้วยค่าที่มากกว่าค่าที่บันทึกล่าสุด
เพื่อดำเนินการให้เสร็จสิ้น ให้เลือกบันทึกการตั้งค่า
หมายเหตุ: การรีเฟรชแบบเพิ่มหน่วยจะไม่สามารถใช้ได้หากคุณเปิดใช้งานการรวบรวม
หมายเหตุ: เมื่อเพิ่มตัวกรอง การตั้งค่าขั้นสูงสำหรับการรีเฟรชแบบเพิ่มหน่วยจะปรากฏเป็นสีเทา และการตั้งค่าเริ่มต้นของ “อย่าแทนที่แถวล่าสุดที่เพิ่ม” จะถูกบังคับใช้ จุดประสงค์คือเพื่อหลีกเลี่ยงข้อขัดแย้งใดๆ ที่อาจเกิดขึ้นระหว่างเกณฑ์ตัวกรองบางอย่างและตรรกะการรีเฟรชแบบเพิ่มหน่วยขั้นสูงที่จะ “แทนที่แถวล่าสุดที่เพิ่ม”
ข้อควรพิจารณาในการรีเฟรชการแยกข้อมูล
การแก้ไขการแยกข้อมูล
หากคุณกำลังแก้ไขการแยกข้อมูลที่มีอยู่ การรีเฟรชครั้งล่าสุดจะแสดงเพื่อให้คุณมั่นใจได้ว่าคุณกำลังอัปเดตการแยกข้อมูลด้วยข้อมูลวันที่ถูกต้อง
การรีเฟรชแบบเต็ม
การรีเฟรชแบบเต็มจะแทนที่ทุกแถวด้วยข้อมูลในแหล่งข้อมูลต้นฉบับทุกครั้งที่คุณรีเฟรชการแยกข้อมูล การรีเฟรชแบบเต็มอาจใช้เวลานานกว่าและสิ้นเปลืองฐานข้อมูล
ความแม่นยำของเวลา/วันที่และการแยกข้อมูล
เครื่องมือสำหรับข้อมูลซึ่งเป็นกลไกสำคัญที่ Tableau ใช้สร้างการแยกข้อมูล จะจัดเก็บค่าเวลาที่แม่นยำในระดับสูงสุด 3 ตำแหน่งทศนิยม หากคุณระบุคอลัมน์วันที่และเวลาหรือการประทับเวลาสำหรับระบุแถวใหม่โดยใช้คอลัมน์ และฐานข้อมูลของคุณใช้ความแม่นยำที่สูงกว่า Tableau ก็อาจส่งผลให้คุณมีแถวที่ซ้ำกันหลังจากทำการรีเฟรชแบบเพิ่มหน่วย ตัวอย่างเช่น หากฐานข้อมูลมีสองแถว แถวหนึ่งเป็นค่าวันที่และเวลา 2015-03-13 17:30:56.502352
และอีกแถวเป็นค่าวันที่และเวลา 2015-03-13 17:30:56.502852
Tableau จะจัดเก็บทั้งสองแถวโดยใช้ค่าวันที่และเวลา 2015-03-13 17:30:56.502
ซึ่งส่งผลให้เกิดแถวซ้ำ
คุณสามารถดูประวัติว่ามีการรีเฟรชครั้งล่าสุดเมื่อใดได้ด้วยการเลือกแหล่งข้อมูลหนึ่งในเมนูข้อมูลแล้วเลือก
กล่องโต้ตอบประวัติการแยกข้อมูลจะแสดงวันที่และเวลาของการรีเฟรชแต่ละครั้ง ระบุว่าเป็นแบบเต็มรูปแบบหรือแบบเพิ่มหน่วย และบอกจำนวนแถวที่เพิ่ม หากเป็นการรีเฟรชมาจากไฟล์ ประวัติก็จะแสดงชื่อไฟล์ต้นทางด้วยเช่นกัน