ล้างข้อมูลจาก Excel, CSV, PDF และ Google ชีตด้วยเครื่องมือแปลข้อมูล
เมื่อติดตามข้อมูลในสเปรดชีต Excel คุณจะสร้างข้อมูลเหล่านี้โดยคำนึงถึงอินเทอร์เฟซผู้ใช้เป็นหลัก หากต้องการทำให้สเปรดชีตอ่านง่าย คุณอาจต้องมีสิ่งต่างๆ เช่น ชื่อ ส่วนหัวแบบซ้อน บันทึกย่อ อาจมีแถวและคอลัมน์ว่างเพื่อเพิ่มพื้นที่ว่าง และคุมีหลายแท็บของข้อมูลด้วยได้เช่นกัน
เมื่อต้องการวิเคราะห์ข้อมูลนี้ใน Tableau แอตทริบิวต์ที่ดูสวยงามเหล่านี้จะทำให้ Tableau แปลข้อมูลข้อมูลของคุณได้ยากมาก แต่เครื่องมือแปลข้อมูลสามารถช่วยเรื่องนี้ได้
เคล็ดลับ: แม้ว่าจะไม่มีการรองรับ Excel Add-In ของ Tableau อีกต่อไป แต่เครื่องมือแปลข้อมูลก็สามารถช่วยคุณปรับแต่งข้อมูลเพื่อการวิเคราะห์ใน Tableau ได้
เครื่องมือแปลข้อมูลทำหน้าที่อะไร
เครื่องมือแปลข้อมูลสามารถช่วยให้คุณเริ่มต้นเมื่อคุณล้างข้อมูล โดยสามารถตรวจจับสิ่งต่างๆ เช่น ชื่อ บันทึกย่อ ส่วนท้าย เซลล์ว่าง และอื่นๆ รวมถึงข้ามไปเพื่อระบุฟิลด์และค่าจริงในชุดข้อมูลของคุณได้
อีกทั้งยังสามารถตรวจจับตารางเพิ่มเติมและตารางย่อยเพื่อให้คุณทำงานกับชุดย่อยของข้อมูลของคุณโดยไม่ขึ้นกับข้อมูลอื่นๆ
หลังจากที่เครื่องมือแปลข้อมูลทำงานแล้ว คุณสามารถตรวจสอบการทำงานของเครื่องมือแปลข้อมูลว่าบันทึกข้อมูลที่ต้องการและระบุได้อย่างถูกต้อง จากนั้น คุณสามารถทำการปรับเปลี่ยนที่จำเป็นได้
เมื่อเลือกข้อมูลที่ต้องการใช้งานแล้ว คุณยังต้องทำขั้นตอนการล้างเพิ่มเติมบางอย่าง เช่น การเปลี่ยนรูปแบบข้อมูล การแบ่งฟิลด์ หรือการเพิ่มตัวกรอง เพื่อให้ได้ข้อมูลในแบบที่คุณต้องการก่อนเริ่มการวิเคราะห์
หมายเหตุ: หากต้องการล้างข้อมูลของคุณมากกว่าที่เครื่องมือแปลข้อมูลจะช่วยคุณได้ โปรดลองใช้ Tableau Prep(ลิงก์จะเปิดในหน้าต่างใหม่)
เปิดเครื่องมือแปลข้อมูลและตรวจสอบผลลัพธ์
จากแผงเชื่อมต่อ ให้เชื่อมต่อกับสเปรดชีต Excel หรือตัวเชื่อมต่ออื่นๆ ที่รองรับเครื่องมือแปลข้อมูล เช่น ไฟล์ Text (.csv), ไฟล์ PDF หรือ Google ชีต
ลากตารางไปที่แคนวาส (หากจำเป็น) จากนั้นในหน้าแหล่งข้อมูลในแผงด้านซ้าย ให้เลือกกล่องทำเครื่องหมายใช้เครื่องมือแปลข้อมูล เพื่อดูว่าเครื่องมือแปลข้อมูลสามารถช่วยล้างข้อมูลของคุณได้หรือไม่
หมายเหตุ: เมื่อคุณล้างข้อมูลด้วยเครื่องมือแปลข้อมูล เครื่องมือแปลข้อมูลจะล้างข้อมูลทั้งหมดที่เกี่ยวข้องกับการเชื่อมต่อในแหล่งข้อมูล ทั้งนี้ เครื่องมือแปลข้อมูลจะไม่เปลี่ยนแปลงข้อมูลเบื้องหลัง
ในแผง “ข้อมูล” ให้คลิกลิงก์ตรวจสอบผลลัพธ์เพื่อตรวจสอบผลลัพธ์ของเครื่องมือแปลข้อมูล
สำเนาแหล่งข้อมูลของคุณจะเปิดขึ้นใน Excel บนแท็บคีย์สำหรับเครื่องมือแปลข้อมูล ตรวจสอบคีย์เพื่อดูวิธีอ่านผลลัพธ์
คลิกแต่ละแท็บเพื่อดูว่าเครื่องมือแปลข้อมูลมีการแปลข้อมูลแหล่งข้อมูลอย่างไร
หากเครื่องมือแปลข้อมูลพบตารางเพิ่มเติมหรือที่เรียกว่าตารางที่พบหรือตารางย่อย ตารางเหล่านี้จะถูกระบุในแท็บ <ชื่อชีต>_ตารางย่อยโดยระบุช่วงของเซลล์ นอกจากนี้ยังมีแท็บแยกต่างหากสำหรับแต่ละตารางย่อยด้วย ซึ่งเป็นรหัสสีเพื่อระบุส่วนหัวและแถวข้อมูล
หากเครื่องมือแปลข้อมูลไม่มีผลลัพธ์ที่คาดหวัง ให้ล้างกล่องทำเครื่องหมายล้างด้วยเครื่องมือแปลข้อมูล เพื่อใช้แหล่งข้อมูลเดิม
หากต้องการแทนที่ตารางปัจจุบันด้วยตารางที่พบ ให้ลากตารางปัจจุบันออกจากแคนวาส แล้วลากตารางที่พบที่คุณต้องการใช้ไปยังแคนวาส
หากเครื่องมือแปลข้อมูลระบุช่วงของตารางที่พบไม่ถูกต้อง หลังจากที่คุณลากตารางที่พบไปยังแคนวาสแล้ว ให้คลิกลูกศรรายการดรอปดาวน์บนตารางนั้น แล้วเลือกแก้ไขตารางที่พบเพื่อปรับมุมของตารางที่พบ (เซลล์บนซ้ายและเซลล์ล่างขวาของตาราง)
เมื่อมีข้อมูลที่ต้องการใช้งานแล้ว คุณสามารถใช้การทำความสะอาดเพิ่มเติมกับข้อมูลของคุณเพื่อวิเคราะห์ได้
ตัวอย่างเครื่องมือแปลข้อมูล
ในตัวอย่างนี้ เรากำลังเชื่อมต่อกับสเปรดชีต Excel ที่มีข้อมูลอาชญากรรมรุนแรงตามเมืองและรัฐสำหรับปี 2016 สเปรดชีตนี้ประกอบด้วยหลายตารางในแผ่นเดียวและการจัดรูปแบบพิเศษบางอย่าง
ชื่อ
ผสานเซลล์ส่วนหัว
พื้นที่ว่างพิเศษ
ตารางย่อย
การจัดรูปแบบพิเศษในสเปรดชีตนี้ทำให้ Tableau ระบุได้ยากว่าส่วนหัวและค่าของฟิลด์คืออะไร
แต่จะอ่านข้อมูลในแนวตั้งและกำหนดค่าเริ่มต้น F1, F2, F3 (ฟิลด์ 1, ฟิลด์ 2, ฟิลด์ 3) ให้กับแต่ละคอลัมน์แทน เซลล์ว่างจะอ่านเป็นค่า null
หากต้องการดูว่าเครื่องมือแปลข้อมูลสามารถช่วยล้างชุดข้อมูลนี้ได้หรือไม่ ให้เราเลือกใช้เครื่องมือแปลข้อมูล
เครื่องมือแปลข้อมูลตรวจพบส่วนหัวที่เหมาะสมสำหรับฟิลด์ ลบการจัดรูปแบบพิเศษออก และพบตารางย่อยหลายตาราง ตารางย่อยจะแสดงอยู่ในส่วนชีตในแผงข้อมูล และตั้งชื่อโดยใช้ชื่อชีตต้นฉบับและช่วงเซลล์สำหรับแต่ละตารางย่อย
ในตัวอย่างนี้มีตารางย่อยสามตาราง: Crimes 2016 A4:H84, Crimes 2016 K5:L40 และ Crimes 2016 O5:P56
หากต้องการตรวจสอบผลลัพธ์ของเครื่องมือแปลข้อมูลให้ละเอียดยิ่งขึ้น ให้เราคลิกลิงก์ตรวจสอบผลลัพธ์ในแผงข้อมูลเพื่อดูสำเนาของสเปรดชีตที่มีคำอธิบายประกอบ
ในที่นี้ เราจะเห็นสำเนาของข้อมูลต้นฉบับซึ่งเป็นรหัสสีเพื่อระบุว่าข้อมูลใดระบุเป็นข้อมูลส่วนหัว และข้อมูลใดระบุเป็นค่าฟิลด์
แท็บถัดไปจะแสดงตารางย่อยที่เครื่องมือแปลข้อมูลพบ โดยสรุปตามช่วงของเซลล์
ในตัวอย่างนี้ ตารางย่อยแรก Crimes 2016 A4:H84 มีข้อมูลสำคัญที่เราต้องการใช้งาน หากต้องการใช้ตารางนี้เป็นตารางข้อมูล เราสามารถลากตารางเดิมออกจากแคนวาส แล้วลากตารางใหม่ไปยังแคนวาสได้
เมื่อเราได้ข้อมูลที่เราต้องการใช้ในแคนวาสแล้ว เราก็สามารถทำล้างข้อมูลเพิ่มเติมได้ ตัวอย่างเช่น เราสามารถ:
เปลี่ยนชื่อฟิลด์เพื่อแสดงชื่อเมือง รัฐ และเดือน
เปลี่ยนรูปแบบข้อมูลฟิลด์เดือน
ลากในตารางย่อยที่สาม Crimes 2016 o5:P56 และรวมในตารางย่อยแรกของเราบนฟิลด์รัฐe เพื่อรวมประชากรของรัฐสำหรับการวิเคราะห์ของเรา
ซ่อนฟิลด์ที่ซ้ำกันที่เพิ่มมาจากการเข้าร่วม
ผลลัพธ์อาจมีลักษณะดังนี้:
ตอนนี้เราพร้อมที่จะเริ่มวิเคราะห์ข้อมูลของเราใน Tableau แล้ว
เมื่อเครื่องมือแปลข้อมูลไม่พร้อมใช้งาน
ตัวเลือกเครื่องมือแปลข้อมูลอาจไม่พร้อมใช้งานเนื่องจากสาเหตุต่อไปนี้:
แหล่งข้อมูลอยู่ในรูปแบบที่ Tableau สามารถแปลข้อมูลได้อยู่แล้ว: หาก Tableau Desktop ไม่ต้องการความช่วยเหลือเพิ่มเติมจากเครื่องมือแปลข้อมูลเพื่อจัดการการจัดรูปแบบเฉพาะหรือข้อมูลที่ไม่เกี่ยวข้อง ตัวเลือกเครื่องมือแปลข้อมูลจะไม่สามารถใช้ได้
หลายแถวหรือหลายคอลัมน์: ตัวเลือกเครื่องมือแปลข้อมูลไม่พร้อมใช้งานเมื่อข้อมูลของคุณมีแอตทริบิวต์ต่อไปนี้:
ข้อมูลมีมากกว่า 2,000 คอลัมน์
ข้อมูลมีมากกว่า 3,000 แถวและมากกว่า 150 คอลัมน์
ไม่รองรับแหล่งข้อมูล:เครื่องมือแปลข้อมูลใช้ได้กับ Microsoft Excel, ไฟล์ Text (.csv), ไฟล์ PDF และ Google ชีตเท่านั้น สำหรับ Excel ข้อมูลของคุณต้องอยู่ในรูปแบบ .xls หรือ .xlsx