ล้างข้อมูลจาก Excel, CSV, PDF และ Google ชีตด้วยเครื่องมือแปลข้อมูล

เมื่อติดตามข้อมูลในสเปรดชีต Excel คุณจะสร้างข้อมูลเหล่านี้โดยคำนึงถึงอินเทอร์เฟซผู้ใช้เป็นหลัก หากต้องการทำให้สเปรดชีตอ่านง่าย คุณอาจต้องมีสิ่งต่างๆ เช่น ชื่อ ส่วนหัวแบบซ้อน บันทึกย่อ อาจมีแถวและคอลัมน์ว่างเพื่อเพิ่มพื้นที่ว่าง และคุมีหลายแท็บของข้อมูลด้วยได้เช่นกัน

เมื่อต้องการวิเคราะห์ข้อมูลนี้ใน Tableau แอตทริบิวต์ที่ดูสวยงามเหล่านี้จะทำให้ Tableau แปลข้อมูลข้อมูลของคุณได้ยากมาก แต่เครื่องมือแปลข้อมูลสามารถช่วยเรื่องนี้ได้

เคล็ดลับ: แม้ว่าจะไม่มีการรองรับ Excel Add-In ของ Tableau อีกต่อไป แต่เครื่องมือแปลข้อมูลก็สามารถช่วยคุณปรับแต่งข้อมูลเพื่อการวิเคราะห์ใน Tableau ได้

เครื่องมือแปลข้อมูลทำหน้าที่อะไร

เครื่องมือแปลข้อมูลสามารถช่วยให้คุณเริ่มต้นเมื่อคุณล้างข้อมูล โดยสามารถตรวจจับสิ่งต่างๆ เช่น ชื่อ บันทึกย่อ ส่วนท้าย เซลล์ว่าง และอื่นๆ รวมถึงข้ามไปเพื่อระบุฟิลด์และค่าจริงในชุดข้อมูลของคุณได้

อีกทั้งยังสามารถตรวจจับตารางเพิ่มเติมและตารางย่อยเพื่อให้คุณทำงานกับชุดย่อยของข้อมูลของคุณโดยไม่ขึ้นกับข้อมูลอื่นๆ

หลังจากที่เครื่องมือแปลข้อมูลทำงานแล้ว คุณสามารถตรวจสอบการทำงานของเครื่องมือแปลข้อมูลว่าบันทึกข้อมูลที่ต้องการและระบุได้อย่างถูกต้อง จากนั้น คุณสามารถทำการปรับเปลี่ยนที่จำเป็นได้

เมื่อเลือกข้อมูลที่ต้องการใช้งานแล้ว คุณยังต้องทำขั้นตอนการล้างเพิ่มเติมบางอย่าง เช่น การเปลี่ยนรูปแบบข้อมูล การแบ่งฟิลด์ หรือการเพิ่มตัวกรอง เพื่อให้ได้ข้อมูลในแบบที่คุณต้องการก่อนเริ่มการวิเคราะห์

หมายเหตุ: หากต้องการล้างข้อมูลของคุณมากกว่าที่เครื่องมือแปลข้อมูลจะช่วยคุณได้ โปรดลองใช้ Tableau Prep(ลิงก์จะเปิดในหน้าต่างใหม่)

เปิดเครื่องมือแปลข้อมูลและตรวจสอบผลลัพธ์

  1. จากแผงเชื่อมต่อ ให้เชื่อมต่อกับสเปรดชีต Excel หรือตัวเชื่อมต่ออื่นๆ ที่รองรับเครื่องมือแปลข้อมูล เช่น ไฟล์ Text (.csv), ไฟล์ PDF หรือ Google ชีต

  2. ลากตารางไปที่แคนวาส (หากจำเป็น) จากนั้นในหน้าแหล่งข้อมูลในแผงด้านซ้าย ให้เลือกกล่องทำเครื่องหมายใช้เครื่องมือแปลข้อมูล เพื่อดูว่าเครื่องมือแปลข้อมูลสามารถช่วยล้างข้อมูลของคุณได้หรือไม่

    ช่องทำเครื่องหมาย “ใช้เครื่องมือแยกวิเคราะห์ข้อมูล” ที่แผงด้านซ้ายของหน้าแหล่งข้อมูล

    หมายเหตุ: เมื่อคุณล้างข้อมูลด้วยเครื่องมือแปลข้อมูล เครื่องมือแปลข้อมูลจะล้างข้อมูลทั้งหมดที่เกี่ยวข้องกับการเชื่อมต่อในแหล่งข้อมูล ทั้งนี้ เครื่องมือแปลข้อมูลจะไม่เปลี่ยนแปลงข้อมูลเบื้องหลัง

  3. ในแผง “ข้อมูล” ให้คลิกลิงก์ตรวจสอบผลลัพธ์เพื่อตรวจสอบผลลัพธ์ของเครื่องมือแปลข้อมูล

    ลิงก์ตรวจสอบผลลัพธ์ในแผงข้อมูล

    สำเนาแหล่งข้อมูลของคุณจะเปิดขึ้นใน Excel บนแท็บคีย์สำหรับเครื่องมือแปลข้อมูล ตรวจสอบคีย์เพื่อดูวิธีอ่านผลลัพธ์

    แท็บคีย์สำหรับเครื่องมือแยกวิเคราะห์ข้อมูลพร้อมข้อมูลเกี่ยวกับวิธีการอ่านผลลัพธ์

  4. คลิกแต่ละแท็บเพื่อดูว่าเครื่องมือแปลข้อมูลมีการแปลข้อมูลแหล่งข้อมูลอย่างไร

    หากเครื่องมือแปลข้อมูลพบตารางเพิ่มเติมหรือที่เรียกว่าตารางที่พบหรือตารางย่อย ตารางเหล่านี้จะถูกระบุในแท็บ <ชื่อชีต>_ตารางย่อยโดยระบุช่วงของเซลล์ นอกจากนี้ยังมีแท็บแยกต่างหากสำหรับแต่ละตารางย่อยด้วย ซึ่งเป็นรหัสสีเพื่อระบุส่วนหัวและแถวข้อมูล

    หากเครื่องมือแปลข้อมูลไม่มีผลลัพธ์ที่คาดหวัง ให้ล้างกล่องทำเครื่องหมายล้างด้วยเครื่องมือแปลข้อมูล เพื่อใช้แหล่งข้อมูลเดิม

    ช่องทำเครื่องหมาย “ล้างด้วยเครื่องมือแยกวิเคราะห์ข้อมูล”

  5. หากต้องการแทนที่ตารางปัจจุบันด้วยตารางที่พบ ให้ลากตารางปัจจุบันออกจากแคนวาส แล้วลากตารางที่พบที่คุณต้องการใช้ไปยังแคนวาส

    หากเครื่องมือแปลข้อมูลระบุช่วงของตารางที่พบไม่ถูกต้อง หลังจากที่คุณลากตารางที่พบไปยังแคนวาสแล้ว ให้คลิกลูกศรรายการดรอปดาวน์บนตารางนั้น แล้วเลือกแก้ไขตารางที่พบเพื่อปรับมุมของตารางที่พบ (เซลล์บนซ้ายและเซลล์ล่างขวาของตาราง)

    เมนู “แก้ไขตารางที่พบ” พร้อมตัวเลือกเพื่อปรับช่วงของตารางที่พบ

  6. เมื่อมีข้อมูลที่ต้องการใช้งานแล้ว คุณสามารถใช้การทำความสะอาดเพิ่มเติมกับข้อมูลของคุณเพื่อวิเคราะห์ได้

ตัวอย่างเครื่องมือแปลข้อมูล

ในตัวอย่างนี้ เรากำลังเชื่อมต่อกับสเปรดชีต Excel ที่มีข้อมูลอาชญากรรมรุนแรงตามเมืองและรัฐสำหรับปี 2016 สเปรดชีตนี้ประกอบด้วยหลายตารางในแผ่นเดียวและการจัดรูปแบบพิเศษบางอย่าง

สเปรดชีต Excel ที่ไฮไลต์การจัดรูปแบบเพิ่มเติม รวมถึงชื่อเรื่อง เซลล์ส่วนหัวที่ผสาน ช่องว่างพิเศษ และตารางย่อย

  1. ชื่อ

  2. ผสานเซลล์ส่วนหัว

  3. พื้นที่ว่างพิเศษ

  4. ตารางย่อย

การจัดรูปแบบพิเศษในสเปรดชีตนี้ทำให้ Tableau ระบุได้ยากว่าส่วนหัวและค่าของฟิลด์คืออะไร

แต่จะอ่านข้อมูลในแนวตั้งและกำหนดค่าเริ่มต้น F1, F2, F3 (ฟิลด์ 1, ฟิลด์ 2, ฟิลด์ 3) ให้กับแต่ละคอลัมน์แทน เซลล์ว่างจะอ่านเป็นค่า null

ผลลัพธ์จากสเปรดชีตที่มีการจัดรูปแบบพิเศษแสดงข้อมูลที่อ่านในแนวตั้ง กำหนดค่าเริ่มต้นให้กับแต่ละคอลัมน์ และเซลล์ว่างจะถูกอ่านเป็นค่า null

หากต้องการดูว่าเครื่องมือแปลข้อมูลสามารถช่วยล้างชุดข้อมูลนี้ได้หรือไม่ ให้เราเลือกใช้เครื่องมือแปลข้อมูล

เครื่องมือแปลข้อมูลตรวจพบส่วนหัวที่เหมาะสมสำหรับฟิลด์ ลบการจัดรูปแบบพิเศษออก และพบตารางย่อยหลายตาราง ตารางย่อยจะแสดงอยู่ในส่วนชีตในแผงข้อมูล และตั้งชื่อโดยใช้ชื่อชีตต้นฉบับและช่วงเซลล์สำหรับแต่ละตารางย่อย

ในตัวอย่างนี้มีตารางย่อยสามตาราง: Crimes 2016 A4:H84, Crimes 2016 K5:L40 และ Crimes 2016 O5:P56

ผลลัพธ์หลังจากใช้เครื่องมือแยกวิเคราะห์ข้อมูล ซึ่งสามารถระบุหัวเรื่องฟิลด์ที่ถูกต้องและลบการจัดรูปแบบและตารางย่อยที่เกินจำเป็นออกไป

หากต้องการตรวจสอบผลลัพธ์ของเครื่องมือแปลข้อมูลให้ละเอียดยิ่งขึ้น ให้เราคลิกลิงก์ตรวจสอบผลลัพธ์ในแผงข้อมูลเพื่อดูสำเนาของสเปรดชีตที่มีคำอธิบายประกอบ

ในที่นี้ เราจะเห็นสำเนาของข้อมูลต้นฉบับซึ่งเป็นรหัสสีเพื่อระบุว่าข้อมูลใดระบุเป็นข้อมูลส่วนหัว และข้อมูลใดระบุเป็นค่าฟิลด์

สำเนาของข้อมูลต้นฉบับที่มีรหัสสีเพื่อระบุข้อมูลส่วนหัวเป็นสีแดงและค่าฟิลด์เป็นสีเขียว

แท็บถัดไปจะแสดงตารางย่อยที่เครื่องมือแปลข้อมูลพบ โดยสรุปตามช่วงของเซลล์

ตารางย่อยที่พบเครื่องมือแยกวิเคราะห์ข้อมูล ระบุตามช่วงเซลล์

ในตัวอย่างนี้ ตารางย่อยแรก Crimes 2016 A4:H84 มีข้อมูลสำคัญที่เราต้องการใช้งาน หากต้องการใช้ตารางนี้เป็นตารางข้อมูล เราสามารถลากตารางเดิมออกจากแคนวาส แล้วลากตารางใหม่ไปยังแคนวาสได้

เพิ่มตารางใหม่ลงในแคนวาสแล้ว

เมื่อเราได้ข้อมูลที่เราต้องการใช้ในแคนวาสแล้ว เราก็สามารถทำล้างข้อมูลเพิ่มเติมได้ ตัวอย่างเช่น เราสามารถ:

  • เปลี่ยนชื่อฟิลด์เพื่อแสดงชื่อเมือง รัฐ และเดือน

  • เปลี่ยนรูปแบบข้อมูลฟิลด์เดือน

  • ลากในตารางย่อยที่สาม Crimes 2016 o5:P56 และรวมในตารางย่อยแรกของเราบนฟิลด์รัฐe เพื่อรวมประชากรของรัฐสำหรับการวิเคราะห์ของเรา

  • ซ่อนฟิลด์ที่ซ้ำกันที่เพิ่มมาจากการเข้าร่วม

ผลลัพธ์อาจมีลักษณะดังนี้:

ตัวอย่างผลลัพธ์หลังจากการล้างข้อมูลแล้ว

ตอนนี้เราพร้อมที่จะเริ่มวิเคราะห์ข้อมูลของเราใน Tableau แล้ว

เมื่อเครื่องมือแปลข้อมูลไม่พร้อมใช้งาน

ตัวเลือกเครื่องมือแปลข้อมูลอาจไม่พร้อมใช้งานเนื่องจากสาเหตุต่อไปนี้:

  • แหล่งข้อมูลอยู่ในรูปแบบที่ Tableau สามารถแปลข้อมูลได้อยู่แล้ว: หาก Tableau Desktop ไม่ต้องการความช่วยเหลือเพิ่มเติมจากเครื่องมือแปลข้อมูลเพื่อจัดการการจัดรูปแบบเฉพาะหรือข้อมูลที่ไม่เกี่ยวข้อง ตัวเลือกเครื่องมือแปลข้อมูลจะไม่สามารถใช้ได้

  • หลายแถวหรือหลายคอลัมน์: ตัวเลือกเครื่องมือแปลข้อมูลไม่พร้อมใช้งานเมื่อข้อมูลของคุณมีแอตทริบิวต์ต่อไปนี้:

    • ข้อมูลมีมากกว่า 2,000 คอลัมน์

    • ข้อมูลมีมากกว่า 3,000 แถวและมากกว่า 150 คอลัมน์

  • ไม่รองรับแหล่งข้อมูล:เครื่องมือแปลข้อมูลใช้ได้กับ Microsoft Excel, ไฟล์ Text (.csv), ไฟล์ PDF และ Google ชีตเท่านั้น สำหรับ Excel ข้อมูลของคุณต้องอยู่ในรูปแบบ .xls หรือ .xlsx