ไฟล์ PDF

บทความนี้อธิบายวิธีการเชื่อมต่อ Tableau กับข้อมูลไฟล์ PDF และการสร้างแหล่งข้อมูล

หมายเหตุ Tableau ไม่รองรับภาษาที่เขียนจากขวาไปซ้าย (RTL) หาก PDF ของคุณเป็นภาษา RTL อักขระอาจแสดงตามลำดับย้อนกลับใน Tableau

สร้างการเชื่อมต่อและสแกนตารางในเอกสารของคุณ

  1. เปิด Tableau และไปที่ส่วน เชื่อมต่อ แล้วคลิก ไฟล์ PDF

  2. เลือกไฟล์ที่คุณต้องการเชื่อมต่อแล้วคลิกเปิด

  3. ในกล่องโต้ตอบ “สแกนไฟล์ PDF” ให้ระบุหน้าในไฟล์ที่คุณต้องการให้ Tableau สแกนตาราง คุณสามารถเลือกสแกนตารางในทุกหน้า หน้าเดียว หรือบางหน้า

    หมายเหตุ การสแกนจะนับหน้าแรกของไฟล์ว่าเป็นหน้า 1 เหมือนกับโปรแกรมอ่าน PDF ส่วนใหญ่ เมื่อคุณสแกนตาราง ให้ระบุหมายเลขหน้าที่โปรแกรมอ่าน PDF แสดง ไม่ใช่หมายเลขหน้าที่จะใช้ในเอกสารนั้น ซึ่งอาจเริ่มจากหน้า 1 หรือหน้าใดก็ได้

    ตัวอย่างเช่น หากคุณต้องการใช้ “Table 1” จากรูปภาพด้านล่าง โปรแกรมอ่าน PDF จะแสดงหมายเลข และไฟล์ .pdf จะแสดงหมายเลขอื่น การสแกนตารางอย่างถูกต้อง ให้ระบุหมายเลขหน้าที่โปรแกรมอ่าน PDF แสดง ในตัวอย่างนี้คุณจะระบุหน้า 15

  4. บนหน้าแหล่งข้อมูล ให้ทำดังนี้

    1. (ไม่บังคับ) เลือกชื่อแหล่งข้อมูลเริ่มต้นที่ด้านบนของหน้า แล้วป้อนชื่อแหล่งข้อมูลที่ไม่ซ้ำกันสำหรับใช้ใน Tableau ตัวอย่างเช่น ใช้แบบแผนการตั้งชื่อแหล่งข้อมูลที่ช่วยให้ผู้ใช้รายอื่นๆ ของแหล่งข้อมูลทราบแหล่งข้อมูลที่จะเชื่อมต่อได้ ระบบจะสร้างชื่อเริ่มต้นโดยอัตโนมัติตามชื่อไฟล์

    2. หากไฟล์ของคุณมีหนึ่งตาราง ให้คลิกแท็บชีตเพื่อเริ่มต้นการวิเคราะห์ หรือลากตารางจากแผงด้านซ้ายไปยังแคนวาส แล้วคลิกแท็บชีตเพื่อเริ่มต้นการวิเคราะห์

      เกี่ยวกับตารางในแผงด้านซ้าย

      ตารางที่ระบุไว้ในไฟล์ .pdf มีชื่อที่ไม่ซ้ำกันและแสดงอยู่ในแผงด้านซ้ายหลังจากการสแกน ตัวอย่างเช่น คุณอาจเห็นชื่อตารางเป็น “Page 1, Table 1” ส่วนแรกของชื่อตารางบ่งบอกหน้าของไฟล์ .pdf ที่เป็นที่มาของตาราง ส่วนที่สองของชื่อตารางบ่งบอกลำดับของตารางที่ระบุ หาก Tableau ระบุตารางมากกว่าหนึ่งตารางในหนึ่งหน้า ส่วนที่สองของชื่อตารางจะบ่งบอกสิ่งหนึ่งจากสองสิ่งนี้ 

      • Tableau ระบุตารางที่เป็นเอกลักษณ์อีกตารางหนึ่ง หรือตารางย่อยในหน้านั้น
      • Tableau ตีความตารางในหน้านั้นเป็นอย่างอื่น Tableau อาจทำการตีความตารางหลายแบบ ทั้งนี้ขึ้นอยู่กับวิธีการแสดงตารางในไฟล์ .pdf ของคุณ

ตัวอย่างแหล่งข้อมูลไฟล์ PDF

นี่คือตัวอย่างของแหล่งข้อมูลไฟล์ PDF 

เพิ่มข้อมูล

เพิ่มข้อมูลในแหล่งข้อมูลของคุณโดยเพิ่มตารางหรือเชื่อมต่อข้อมูลในฐานข้อมูลอื่น

  • เพิ่มข้อมูลจากไฟล์ปัจจุบัน 

    • ลากตารางเพิ่มเติมจากแผงด้านซ้ายไปยังแคนวาสเพื่อรวมข้อมูลโดยใช้การผนวกหรือการรวม หากต้องการข้อมูลเพิ่มเติม โปรดดู รวมข้อมูลของคุณหรือผนวกข้อมูลของคุณ

    • หากหน้าที่สแกนในขั้นตอนที่ 3 ข้างต้นไม่สร้างตารางที่คุณต้องการในแผงด้านซ้าย ให้คลิกลูกศรดรอปดาวน์ถัดจากการเชื่อมต่อ “ไฟล์ PDF” แล้วคลิก สแกนไฟล์ PDF อีกครั้ง คุณจะใช้ตัวเลือกนี้เพื่อสร้างการสแกนใหม่ ซึ่งคุณจะสามารถระบุหน้าอื่นในไฟล์ .pdf ที่คุณจะสแกนตารางได้

  • เพิ่มข้อมูลจากฐานข้อมูลอื่น ในแผงด้านซ้าย ให้คลิก เพิ่ม ถัดจาก “การเชื่อมต่อ” หากต้องการข้อมูลเพิ่มเติม โปรดดู รวมข้อมูลของคุณ

    หากตัวเชื่อมต่อที่คุณต้องการไม่ปรากฏในแผงด้านซ้าย ให้เลือกข้อมูล > แหล่งข้อมูลใหม่เพื่อเพิ่มแหล่งข้อมูลใหม่ หากต้องการข้อมูลเพิ่มเติม โปรดดู ผสมผสานข้อมูลของคุณ

ตั้งค่าตัวเลือกตาราง

คุณสามารถตั้งค่าตัวเลือกตารางได้ บนแคนวาส ให้คลิกลูกศรดรอปดาวน์ของตาราง แล้วระบุว่าจะให้ข้อมูลใส่ชื่อฟิลด์ไว้ในแถวแรกหรือไม่ หากเป็นเช่นนั้น ชื่อเหล่านี้จะกลายเป็นชื่อฟิลด์ใน Tableau หากไม่ใส่ชื่อฟิลด์ Tableau จะสร้างชื่อฟิลด์โดยอัตโนมัติ คุณสามารถเปลี่ยนชื่อฟิลด์ได้ในภายหลัง

ใช้เครื่องมือแปลข้อมูลในการล้างข้อมูล

หาก Tableau ตรวจพบว่าเครื่องมือดังกล่าวสามารถช่วยเพิ่มประสิทธิภาพแหล่งข้อมูลสำหรับการวิเคราะห์ได้ Tableau จะแจ้งให้คุณใช้ “เครื่องมือแปลข้อมูล” “เครื่องมือแปลข้อมูล” สามารถตรวจพบตารางย่อยที่คุณใช้และนำการจัดรูปแบบที่ไม่ซ้ำกันซึ่งอาจทำให้เกิดปัญหาภายหลังในการวิเคราะห์ออกได้ หากต้องการข้อมูลเพิ่มเติม โปรดดู ล้างข้อมูลจาก Excel, CSV, PDF และ Google ชีตด้วยเครื่องมือแปลข้อมูล

ผนวกตารางในไฟล์ .pdf ของคุณ

คุณสามารถผนวกตารางในไฟล์ของคุณได้ หากต้องการข้อมูลเพิ่มเติมเกี่ยวกับการผนวก โปรดดูผนวกข้อมูลของคุณ

เมื่อคุณใช้การค้นหาด้วยสัญลักษณ์แทนเพื่อผนวกตาราง ผลการค้นหาจะอยู่แค่ในขอบเขตของหน้าที่สแกนในไฟล์แรกที่คุณเชื่อมต่อเท่านั้น ตัวอย่างเช่น หากคุณมีไฟล์สามไฟล์ ได้แก่ A.pdf, B.pdf และ C.pdf ไฟล์แรกที่คุณเชื่อมต่อคือ A และคุณจำกัดการสแกนตารางไว้แค่หน้า 1 เมื่อคุณใช้การค้นหาด้วยสัญลักษณ์แทนเพื่อผนวกตารางจากไฟล์ B และC ด้วย ตารางเพิ่มเติมที่อยู่ในการผนวกจะมาจากหน้า 1 ของ B และหน้า 1 ของ C เท่านั้น

คำแนะนำในการทำงานกับไฟล์ .pdf

คำแนะนำต่อไปนี้จะช่วยคุณในการทำงานกับไฟล์ .pdf ใน Tableau

  • ใช้ตัวเชื่อมต่อ “ไฟล์ PDF” เพื่อระบุเฉพาะตารางในไฟล์ .pdf ของคุณเท่านั้น

    เป้าหมายหลักของตัวเชื่อมต่อ “ไฟล์ PDF” คือเพื่อค้นหาและระบุ ตาราง ในไฟล์ .pdf ของคุณ ดังนั้นตัวเชื่อมต่อนี้จะไม่สนใจข้อมูลอื่นๆ ในไฟล์ที่ดูเหมือนว่าไม่ได้เป็นส่วนหนึ่งของตาราง รวมทั้งชื่อ คำอธิบาย และข้อความเชิงอรรถ หากระบบจัดเก็บข้อมูลที่เกี่ยวข้องไว้ในพื้นที่ใดพื้นที่หนึ่งดังกล่าว เช่น ในชื่อตาราง คุณสามารถใช้ Tableau ส่งออกข้อมูลไฟล์ .pdf เป็นไฟล์ .csv ก่อน จากนั้นเพิ่มข้อมูลที่จัดเก็บไว้ในชื่อตารางด้วยตนเอง แล้วเชื่อมต่อกับไฟล์ .csv แทน หากต้องการข้อมูลเพิ่มเติม โปรดดู ส่งออกข้อมูลเป็นไฟล์ .csv

  • ใช้ตารางมาตรฐาน

    โดยทั่วไปแล้ว Tableau ทำงานได้ดีที่สุดกับตารางมาตรฐานที่ใช้รูปแบบตาราง

    ตารางในไฟล์ .pdf ของคุณควรมีส่วนหัวของคอลัมน์อยู่ในบรรทัดเดียวและมีค่าในแถวอยู่ในบรรทัดเดียวดังที่แสดงไว้ในตัวอย่างด้านล่าง

    สีและแรเงาที่ใช้ในหรือทั่วตารางอาจส่งผลต่อการระบุตาราง

    คุณอาจต้องล้างข้อมูลบางอย่างในตารางหรือแก้ไขตารางที่มีการจัดรูปแบบที่เป็นเอกลักษณ์ด้วยตนเองนอก Tableau การจัดรูปแบบที่เป็นเอกลักษณ์อาจมีส่วนหัวแบบลำดับชั้น ชื่อส่วนหัวที่ครอบคลุมหลายบรรทัด ค่าในแถวที่ครอบคลุมหลายบรรทัด ส่วนหัวที่เอียงมุม และตารางที่ซ้อนกันดังที่แสดงไว้ในตัวอย่างด้านล่าง

    หมายเหตุ Tableau ไม่รองรับการเชื่อมต่อกับไฟล์ .pdf ที่สร้างจากซอฟต์แวร์สแกน (การอ่านอักขระด้วยแสง)

  • ตรวจสอบความถูกต้องของข้อมูล

    คุณต้องตรวจสอบความถูกต้องของข้อมูลในตารางที่ Tableau ระบุไว้ในไฟล์ .pdf ของคุณ คุณสามารถตรวจสอบความถูกต้องของข้อมูลได้โดยใช้ตารางกริดข้อมูล หรือใช้เวิร์กบุ๊กผลลัพธ์หากคุณใช้ “เครื่องมือแปลข้อมูล”

  • หลีกเลี่ยงตารางที่ครอบคลุมหลายหน้า

    หากไฟล์ .pdf ของคุณมีตารางที่ครอบคลุมหลายหน้า Tableau จะตีความตารางนั้นว่าเป็นหลายตาราง คุณต้องผนวกตารางไว้เป็นหนึ่งเดียวเพื่อแก้ไขปัญหานี้ หากต้องการข้อมูลเพิ่มเติม โปรดดู ผนวกข้อมูลของคุณ

  • แก้ไขชื่อไฟล์ .pdf ที่มีอักขระ Unicode

    หลังจากเชื่อมต่อกับไฟล์ .pdf ที่มีอักขระ Unicode อยู่ในชื่อไฟล์ คุณอาจเห็นข้อผิดพลาดต่อไปนี้

    คุณต้องแก้ไขชื่อไฟล์โดยใช้อักขระที่ไม่ได้เป็น Unicode แล้วเชื่อมต่อกับไฟล์ .pdf อีกครั้ง

  • อย่าใช้ไฟล์ .pdf ที่มีการป้องกันด้วยรหัสผ่าน

    หลังจากเชื่อมต่อกับไฟล์ .pdf และสแกนตารางแล้ว คุณอาจเห็นข้อผิดพลาดต่อไปนี้

    Tableau แสดงข้อผิดพลาดนี้เมื่อไฟล์ .pdf ของคุณมีการป้องกันด้วยรหัสผ่านและระบบไม่สามารถเข้าถึงเนื้อหาของไฟล์ได้ Tableau ไม่รองรับการเชื่อมต่อกับไฟล์ .pdf ที่มีการป้องกันด้วยรหัสผ่าน

  • ค่าชื่อแทนที่ตีความไม่เหมือนกันหรือไม่ถูกต้อง

    ในตารางกริดข้อมูล คุณจะเห็นว่าระบบตีความค่าบางค่าแตกต่างไปจากไฟล์ .pdf คุณสามารถแก้ไขการตีความนี้ได้โดยใช้ชื่อแทนเพื่อแก้ไขชื่อของค่าเฉพาะภายในฟิลด์

    ตัวอย่างเช่น หากคุณเห็นตารางต่อไปนี้หลังจากเชื่อมต่อกับไฟล์ .pdf ระบบตีความอักษรย่อของรัฐบางรัฐเป็นตัวอักษรพิมพ์เล็ก ซึ่งมีการไฮไลต์เป็นสีน้ำเงิน

    คุณสามารถแก้ปัญหานี้ได้โดยใช้ชื่อแทนเพื่อเปลี่ยนอักษรย่อที่เป็นตัวพิมพ์เล็กเป็นตัวพิมพ์ใหญ่ ซึ่งทำได้โดยการคลิกลูกศรดรอปดาวน์ถัดจากชื่อคอลัมน์ แล้วเลือก ชื่อแทน

  • แก้ไขส่วนหัวของคอลัมน์ที่ระบบตีความว่าเป็นค่าในตาราง

    ในตารางกริดข้อมูล คุณอาจเห็นว่าระบบตีความส่วนหัวของคอลัมน์ในไฟล์ .pdf ว่าเป็นค่าในตาราง ซึ่งเป็นสิ่งที่เกิดขึ้นได้ หากไฟล์ .pdf ของคุณมีตารางที่มีการจัดรูปแบบที่เป็นเอกลักษณ์หรือมีส่วนหัวแบบลำดับชั้น ในเหตุการณ์นี้ ให้ลองใช้ “เครื่องมือแปลข้อมูล” ก่อน หาก “เครื่องมือแปลข้อมูล” แก้ปัญหานี้ไม่ได้ ให้ลองแก้ไขชื่อคอลัมน์ด้วยตนเองให้เป็นชื่อที่เหมาะสม แล้วกรองชื่อคอลัมน์ที่ระบบมองว่าเป็นค่าโดยใช้ตัวกรองแหล่งข้อมูล

    ตัวอย่างเช่น หากคุณเห็นตารางต่อไปนี้หลังจากเชื่อมต่อกับไฟล์ .pdf ระบบตีความส่วนหัวของตารางจากไฟล์ .pdf เป็นค่าในตาราง ซึ่งมีการไฮไลต์เป็นสีน้ำเงิน

    วิธีหนึ่งที่คุณจะแก้ปัญหาส่วนหัวนี้ได้คือต้องทำตามขั้นตอนต่อไปนี้

    1. ดับเบิลคลิกชื่อคอลัมน์ แล้วแก้ไขชื่อจาก F1 เป็น “ปี” ทำซ้ำขั้นตอนนี้สำหรับ F2 ไปจนถึง F4 โดยแก้ไขชื่อเป็น “ถ่านหิน” “ก๊าซ” และ “น้ำมัน”

    2. คลิกไอคอนประเภทข้อมูลของคอลัมน์ “ปี” แล้วเปลี่ยนประเภทข้อมูลเป็นตัวเลข ซึ่งจะทำให้ค่าที่ไม่ได้เป็นตัวเลขในคอลัมน์นี้กลายเป็นค่าว่าง

    3. ในมุมขวาบนของหน้าแหล่งข้อมูล ให้คลิก เพิ่ม จากนั้นคลิกปุ่ม เพิ่ม แล้วเลือกฟิลด์ “ปี”

    4. ในกล่องโต้ตอบ “ตัวกรอง” ให้เลือกทั้งกล่องทำเครื่องหมาย ค่าว่าง และ ไม่รวม

      ระบบจะลบแถวในคอลัมน์ “ปี” ที่มีค่าว่างออกจากตารางกริดข้อมูล ซึ่งจะส่งผลต่อแถวของคอลัมน์อื่นๆ ในตาราง

เกี่ยวกับไฟล์ .ttde และ .hhyper

คุณอาจสังเกตเห็นไฟล์ .ttde หรือ .hhyper เมื่อนำทางไปยังไดเรกทอรีของคอมพิวเตอร์ เมื่อคุณสร้างแหล่งข้อมูล Tableau ที่เชื่อมต่อกับข้อมูลของคุณ Tableau จะสร้างไฟล์ .ttde หรือ .hhyper ไฟล์นี้เรียกอีกอย่างว่าการแตกข้อมูลแฝง ใช้เพื่อช่วยเพิ่มความเร็วในการโหลดแหล่งข้อมูลของคุณใน Tableau Desktop แม้ว่าการแตกข้อมูลแฝงจะมีข้อมูลเบื้องหลังและข้อมูลอื่นๆ ที่คล้ายกับการแตกข้อมูล Tableau มาตรฐาน แต่การแตกข้อมูลแฝงจะถูกบันทึกในรูปแบบอื่นและไม่สามารถใช้เพื่อกู้คืนข้อมูลของคุณได้

หมายเหตุ: ไฟล์ .tde ไม่รองรับ Tableau เวอร์ชันเกิน 2024.2 อีกต่อไป ขณะนี้การแยกข้อมูลทั้งหมดอยู่ในรูปแบบ .hyper

 

ดูเพิ่มเติม

ขอบคุณสำหรับข้อเสนอแนะของคุณส่งข้อเสนอแนะของคุณเรียบร้อยแล้ว ขอขอบคุณ