ล้างข้อมูลจาก Excel, CSV, PDF และ Google ชีตด้วยเครื่องมือแปลข้อมูล

เมื่อติดตามข้อมูลในสเปรดชีต Excel คุณจะสร้างข้อมูลเหล่านี้โดยคำนึงถึงอินเทอร์เฟซผู้ใช้เป็นหลัก หากต้องการทำให้สเปรดชีตอ่านง่าย คุณอาจต้องมีสิ่งต่างๆ เช่น ชื่อ ส่วนหัวแบบซ้อน บันทึกย่อ อาจมีแถวและคอลัมน์ว่างเพื่อเพิ่มพื้นที่ว่าง และคุมีหลายแท็บของข้อมูลด้วยได้เช่นกัน

เมื่อต้องการวิเคราะห์ข้อมูลนี้ใน Tableau แอตทริบิวต์ที่ดูสวยงามเหล่านี้จะทำให้ Tableau แปลข้อมูลข้อมูลของคุณได้ยากมาก แต่เครื่องมือแปลข้อมูลสามารถช่วยเรื่องนี้ได้

เคล็ดลับ: แม้ว่าจะไม่มีการรองรับ Excel Add-In ของ Tableau อีกต่อไป แต่เครื่องมือแปลข้อมูลก็สามารถช่วยคุณปรับแต่งข้อมูลเพื่อการวิเคราะห์ใน Tableau ได้

เครื่องมือแปลข้อมูลทำหน้าที่อะไร

เครื่องมือแปลข้อมูลสามารถช่วยให้คุณเริ่มต้นเมื่อคุณล้างข้อมูล โดยสามารถตรวจจับสิ่งต่างๆ เช่น ชื่อ บันทึกย่อ ส่วนท้าย เซลล์ว่าง และอื่นๆ รวมถึงข้ามไปเพื่อระบุฟิลด์และค่าจริงในชุดข้อมูลของคุณได้

อีกทั้งยังสามารถตรวจจับตารางเพิ่มเติมและตารางย่อยเพื่อให้คุณทำงานกับชุดย่อยของข้อมูลของคุณโดยไม่ขึ้นกับข้อมูลอื่นๆ

หลังจากที่เครื่องมือแปลข้อมูลทำงานแล้ว คุณสามารถตรวจสอบการทำงานของเครื่องมือแปลข้อมูลว่าบันทึกข้อมูลที่ต้องการและระบุได้อย่างถูกต้อง จากนั้น คุณสามารถทำการปรับเปลี่ยนที่จำเป็นได้

เมื่อเลือกข้อมูลที่ต้องการใช้งานแล้ว คุณยังต้องทำขั้นตอนการล้างเพิ่มเติมบางอย่าง เช่น การเปลี่ยนรูปแบบข้อมูล การแบ่งฟิลด์ หรือการเพิ่มตัวกรอง เพื่อให้ได้ข้อมูลในแบบที่คุณต้องการก่อนเริ่มการวิเคราะห์

หมายเหตุ: หากต้องการล้างข้อมูลของคุณมากกว่าที่เครื่องมือแปลข้อมูลจะช่วยคุณได้ โปรดลองใช้ Tableau Prep(ลิงก์จะเปิดในหน้าต่างใหม่)

เปิดเครื่องมือแปลข้อมูลและตรวจสอบผลลัพธ์

  1. จากแผงเชื่อมต่อ ให้เชื่อมต่อกับสเปรดชีต Excel หรือตัวเชื่อมต่ออื่นๆ ที่รองรับเครื่องมือแปลข้อมูล เช่น ไฟล์ Text (.csv), ไฟล์ PDF หรือ Google ชีต

  2. ลากตารางไปที่แคนวาส (หากจำเป็น) จากนั้นในหน้าแหล่งข้อมูลในแผงด้านซ้าย ให้เลือกกล่องทำเครื่องหมายใช้เครื่องมือแปลข้อมูล เพื่อดูว่าเครื่องมือแปลข้อมูลสามารถช่วยล้างข้อมูลของคุณได้หรือไม่

    หมายเหตุ: เมื่อคุณล้างข้อมูลด้วยเครื่องมือแปลข้อมูล เครื่องมือแปลข้อมูลจะล้างข้อมูลทั้งหมดที่เกี่ยวข้องกับการเชื่อมต่อในแหล่งข้อมูล ทั้งนี้ เครื่องมือแปลข้อมูลจะไม่เปลี่ยนแปลงข้อมูลเบื้องหลัง

  3. ในแผง “ข้อมูล” ให้คลิกลิงก์ตรวจสอบผลลัพธ์เพื่อตรวจสอบผลลัพธ์ของเครื่องมือแปลข้อมูล

    สำเนาแหล่งข้อมูลของคุณจะเปิดขึ้นใน Excel บนแท็บคีย์สำหรับเครื่องมือแปลข้อมูล ตรวจสอบคีย์เพื่อดูวิธีอ่านผลลัพธ์

  4. คลิกแต่ละแท็บเพื่อดูว่าเครื่องมือแปลข้อมูลมีการแปลข้อมูลแหล่งข้อมูลอย่างไร

    หากเครื่องมือแปลข้อมูลพบตารางเพิ่มเติมหรือที่เรียกว่าตารางที่พบหรือตารางย่อย ตารางเหล่านี้จะถูกระบุในแท็บ <ชื่อชีต>_ตารางย่อยโดยระบุช่วงของเซลล์ นอกจากนี้ยังมีแท็บแยกต่างหากสำหรับแต่ละตารางย่อยด้วย ซึ่งเป็นรหัสสีเพื่อระบุส่วนหัวและแถวข้อมูล

    หากเครื่องมือแปลข้อมูลไม่มีผลลัพธ์ที่คาดหวัง ให้ล้างกล่องทำเครื่องหมายล้างด้วยเครื่องมือแปลข้อมูล เพื่อใช้แหล่งข้อมูลเดิม

  5. หากต้องการแทนที่ตารางปัจจุบันด้วยตารางที่พบ ให้ลากตารางปัจจุบันออกจากแคนวาส แล้วลากตารางที่พบที่คุณต้องการใช้ไปยังแคนวาส

    หากเครื่องมือแปลข้อมูลระบุช่วงของตารางที่พบไม่ถูกต้อง หลังจากที่คุณลากตารางที่พบไปยังแคนวาสแล้ว ให้คลิกลูกศรรายการดรอปดาวน์บนตารางนั้น แล้วเลือกแก้ไขตารางที่พบเพื่อปรับมุมของตารางที่พบ (เซลล์บนซ้ายและเซลล์ล่างขวาของตาราง)

  6. เมื่อมีข้อมูลที่ต้องการใช้งานแล้ว คุณสามารถใช้การทำความสะอาดเพิ่มเติมกับข้อมูลของคุณเพื่อวิเคราะห์ได้

ตัวอย่างเครื่องมือแปลข้อมูล

ในตัวอย่างนี้ เรากำลังเชื่อมต่อกับสเปรดชีต Excel ที่มีข้อมูลอาชญากรรมรุนแรงตามเมืองและรัฐสำหรับปี 2016 สเปรดชีตนี้ประกอบด้วยหลายตารางในแผ่นเดียวและการจัดรูปแบบพิเศษบางอย่าง

  1. ชื่อ

  2. ผสานเซลล์ส่วนหัว

  3. พื้นที่ว่างพิเศษ

  4. ตารางย่อย

การจัดรูปแบบพิเศษในสเปรดชีตนี้ทำให้ Tableau ระบุได้ยากว่าส่วนหัวและค่าของฟิลด์คืออะไร

แต่จะอ่านข้อมูลในแนวตั้งและกำหนดค่าเริ่มต้น F1, F2, F3 (ฟิลด์ 1, ฟิลด์ 2, ฟิลด์ 3) ให้กับแต่ละคอลัมน์แทน เซลล์ว่างจะอ่านเป็นค่า null

หากต้องการดูว่าเครื่องมือแปลข้อมูลสามารถช่วยล้างชุดข้อมูลนี้ได้หรือไม่ ให้เราเลือกใช้เครื่องมือแปลข้อมูล

เครื่องมือแปลข้อมูลตรวจพบส่วนหัวที่เหมาะสมสำหรับฟิลด์ ลบการจัดรูปแบบพิเศษออก และพบตารางย่อยหลายตาราง ตารางย่อยจะแสดงอยู่ในส่วนชีตในแผงข้อมูล และตั้งชื่อโดยใช้ชื่อชีตต้นฉบับและช่วงเซลล์สำหรับแต่ละตารางย่อย

ในตัวอย่างนี้มีตารางย่อยสามตาราง: Crimes 2016 A4:H84, Crimes 2016 K5:L40 และ Crimes 2016 O5:P56

หากต้องการตรวจสอบผลลัพธ์ของเครื่องมือแปลข้อมูลให้ละเอียดยิ่งขึ้น ให้เราคลิกลิงก์ตรวจสอบผลลัพธ์ในแผงข้อมูลเพื่อดูสำเนาของสเปรดชีตที่มีคำอธิบายประกอบ

ในที่นี้ เราจะเห็นสำเนาของข้อมูลต้นฉบับซึ่งเป็นรหัสสีเพื่อระบุว่าข้อมูลใดระบุเป็นข้อมูลส่วนหัว และข้อมูลใดระบุเป็นค่าฟิลด์

แท็บถัดไปจะแสดงตารางย่อยที่เครื่องมือแปลข้อมูลพบ โดยสรุปตามช่วงของเซลล์

ในตัวอย่างนี้ ตารางย่อยแรก Crimes 2016 A4:H84 มีข้อมูลสำคัญที่เราต้องการใช้งาน หากต้องการใช้ตารางนี้เป็นตารางข้อมูล เราสามารถลากตารางเดิมออกจากแคนวาส แล้วลากตารางใหม่ไปยังแคนวาสได้

เมื่อเราได้ข้อมูลที่เราต้องการใช้ในแคนวาสแล้ว เราก็สามารถทำล้างข้อมูลเพิ่มเติมได้ ตัวอย่างเช่น เราสามารถ:

  • เปลี่ยนชื่อฟิลด์เพื่อแสดงชื่อเมือง รัฐ และเดือน

  • เปลี่ยนรูปแบบข้อมูลฟิลด์เดือน

  • ลากในตารางย่อยที่สาม Crimes 2016 o5:P56 และรวมในตารางย่อยแรกของเราบนฟิลด์รัฐe เพื่อรวมประชากรของรัฐสำหรับการวิเคราะห์ของเรา

  • ซ่อนฟิลด์ที่ซ้ำกันที่เพิ่มมาจากการเข้าร่วม

ผลลัพธ์อาจมีลักษณะดังนี้:

ตอนนี้เราพร้อมที่จะเริ่มวิเคราะห์ข้อมูลของเราใน Tableau แล้ว

เมื่อเครื่องมือแปลข้อมูลไม่พร้อมใช้งาน

ตัวเลือกเครื่องมือแปลข้อมูลอาจไม่พร้อมใช้งานเนื่องจากสาเหตุต่อไปนี้:

  • แหล่งข้อมูลอยู่ในรูปแบบที่ Tableau สามารถแปลข้อมูลได้อยู่แล้ว: หาก Tableau Desktop ไม่ต้องการความช่วยเหลือเพิ่มเติมจากเครื่องมือแปลข้อมูลเพื่อจัดการการจัดรูปแบบเฉพาะหรือข้อมูลที่ไม่เกี่ยวข้อง ตัวเลือกเครื่องมือแปลข้อมูลจะไม่สามารถใช้ได้

  • หลายแถวหรือหลายคอลัมน์: ตัวเลือกเครื่องมือแปลข้อมูลไม่พร้อมใช้งานเมื่อข้อมูลของคุณมีแอตทริบิวต์ต่อไปนี้:

    • ข้อมูลมีมากกว่า 2,000 คอลัมน์

    • ข้อมูลมีมากกว่า 3,000 แถวและมากกว่า 150 คอลัมน์

  • ไม่รองรับแหล่งข้อมูล:เครื่องมือแปลข้อมูลใช้ได้กับ Microsoft Excel, ไฟล์ Text (.csv), ไฟล์ PDF และ Google ชีตเท่านั้น สำหรับ Excel ข้อมูลของคุณต้องอยู่ในรูปแบบ .xls หรือ .xlsx

 

ขอบคุณสำหรับข้อเสนอแนะของคุณส่งข้อเสนอแนะของคุณเรียบร้อยแล้ว ขอขอบคุณ