Amazon S3

บทความนี้อธิบายวิธีการเชื่อมต่อ Tableau กับตัวเชื่อมต่อ Amazon S3 แบบไม่มีไดรเวอร์และตั้งค่าแหล่งข้อมูล

ก่อนที่คุณจะเริ่มต้น

ก่อนที่คุณจะเริ่มต้น ให้รวบรวมข้อมูลการเชื่อมต่อดังนี้

  • รีเจี้ยน AWS ของบัคเก็ต S3 ของคุณ

  • ชื่อบักเก็ต S3

  • คีย์การเข้าถึง AWS IAM ของคุณสำหรับบัคเก็ต S3 ของคุณ (ID คีย์และคีย์การเข้าถึงข้อมูลลับ)

สิทธิ์

ตรวจสอบว่าผู้ใช้ AWS IAM ของคุณมีสิทธิ์อ่านสำหรับบัคเก็ต S3 ของคุณ

คำแนะนำ

คำแนะนำต่อไปนี้สามารถช่วยเพิ่มประสิทธิภาพการทำงานได้

  • ประสิทธิภาพสูงสุดจะเกิดขึ้นได้หากไคลเอ็นต์ทำงานในสภาพแวดล้อม AWS (เช่น Tableau Desktop หรือ Server ที่ติดตั้งในอินสแตนซ์ EC2 หรือใช้ Tableau Cloud)
  • การสนับสนุนบัคเก็ตข้ามรีเจี้ยนใช้งานได้ แต่ประสิทธิภาพจะแย่กว่าการเข้าถึงรีเจี้ยนเดียวกัน อาจมีค่าใช้จ่ายเพิ่มเติมเนื่องจากค่าธรรมเนียมข้อมูลขาออก

ทำการเชื่อมต่อและตั้งค่าแหล่งข้อมูล

  1. เปิดใช้งาน Tableau และภายใต้เชื่อมต่อ เลือก Amazon S3 จากรายการตัวเชื่อมต่อเพิ่มเติม
  2. เลือกติดตั้งและรีสตาร์ท Tableau เพื่อติดตั้งตัวเชื่อมต่อ
  3. หลังจากที่ Tableau รีสตาร์ท ให้ไปที่เชื่อมต่อ แล้วเลือก Amazon S3 จากรายการตัวเชื่อมต่อที่ติดตั้ง
  4. ป้อนรีเจี้ยนบัคเก็ต, ชื่อบัคเก็ต, ID คีย์การเข้าถึง และคีย์การเข้าถึงข้อมูลลับ
  5. เลือกเข้าสู่ระบบ
  6. ในเนื้อหาของบัคเก็ต ให้เลือกไฟล์ที่คุณต้องการเชื่อมต่อ
  7. เลือกเชื่อมต่อ

ตั้งค่าแหล่งข้อมูล

ทำตามขั้นตอนต่อไปนี้เพื่อตั้งค่าแหล่งข้อมูล

  1. (ไม่บังคับ) เลือกชื่อแหล่งข้อมูลเริ่มต้นที่ด้านบนของหน้า
  2. ป้อนชื่อแหล่งข้อมูลที่ไม่ซ้ำกันที่จะใช้ใน Tableau
  3. ลากไฟล์อย่างน้อยหนึ่งรายการที่คุณต้องการเชื่อมต่อจากแผงด้านซ้ายไปยังแคนวาส
  4. หากต้องการเริ่มการวิเคราะห์ ให้เลือกแท็บชีต 1

ผนวกข้อมูลของคุณ

คุณสามารถผนวกไฟล์จากบัคเก็ต S3 ของคุณได้ หากต้องการข้อมูลเพิ่มเติมเกี่ยวกับการผนวก โปรดดูผนวกข้อมูลของคุณ เพื่อทำการผนวกไวด์การ์ดที่รวมไฟล์ในโฟลเดอร์ย่อย โฟลเดอร์รูทหรือบัคเก็ตต้องมีอย่างน้อยหนึ่งไฟล์ ซึ่งตรงกับโครงสร้างของไฟล์ที่อยู่ในโฟลเดอร์ย่อยเพื่อรวมไว้ในการผนวก ไฟล์นี้เป็นไฟล์แรกที่คุณเชื่อมต่อเมื่อสร้างการผนวก

ปัญหาและข้อจำกัดที่ทราบ

ส่วนต่อไปนี้มีปัญหาและข้อจำกัดที่ทราบ ซึ่งอาจส่งผลต่อการดำเนินการที่สำเร็จของคุณเมื่อใช้ตัวเชื่อมต่อ Amazon S3

หมายเหตุ: ขณะนี้ยังไม่รองรับตัวเชื่อมต่อนี้ในการเขียนเว็บของ Tableau Prep หรือการเชื่อมต่อแบบเสมือน

ปัญหาและข้อจำกัดที่ทราบเกี่ยวกับการตรวจสอบสิทธิ์
  • รองรับเฉพาะการตรวจสอบสิทธิ์คีย์ข้อมูลลับ/คีย์การเข้าถึงของ ผู้ใช้ Amazon IAM ที่ไม่มีโทเค็นเซสชันเท่านั้น

การเผยแพร่ปัญหาและข้อจำกัดที่ทราบ
  • เวิร์กบุ๊กและแหล่งข้อมูลต้องได้รับการเผยแพร่โดยใช้ตัวเลือกการตรวจสอบสิทธิ์สำหรับ “รหัสผ่านแบบฝัง” ขณะนี้ยังไม่รองรับ “แจ้งผู้ใช้”

ปัญหาและข้อจำกัดที่ทราบเกี่ยวกับการผนวก
  • เฉพาะ Tableau Desktop เท่านั้นที่รองรับการผนวกไวลด์การ์ด
  • การเขียนเว็บรองรับเฉพาะการผนวกด้วยตนเองที่ผู้ใช้กำหนด (การลากไฟล์)
ปัญหาและข้อจำกัดที่ทราบเกี่ยวกับประเภทไฟล์
  • ขณะนี้รองรับไฟล์ Parque, .csv, .gz ที่บีบอัด และ Excel
  • ตามการออกแบบ ข้อมูลทั้งหมดนำเข้าในรูปแบบสตริง
  • คุณไม่สามารถผนวกหรือรวมไฟล์หลายประเภทในการเชื่อมต่อเดียวได้ (เช่น Parquet และ .csv เข้าด้วยกัน)
  • ขณะนี้รองรับเฉพาะไฟล์ .csv ที่คั่นด้วยเครื่องหมายจุลภาคเท่านั้น
  • ขนาดไฟล์จำกัดคือ 15GB
  • ผลลัพธ์สะสมของการรวมหรือการผนวกต้องไม่เกิน 15GB
  • ขณะนี้ไฟล์ Excel ต้องไม่เกิน ~100 mb เนื่องจากปัญหาด้านประสิทธิภาพกับโปรแกรมแยกวิเคราะห์ไฟล์ Excel ในตัวเชื่อมต่อ
ปัญหาและข้อจำกัดที่ทราบเพิ่มเติมเกี่ยวกับ ไฟล์ Parquet
  • ไฟล์ Parquet ต้องอยู่ในรูปแบบที่อธิบายไว้ในเอกสาร Hyper API ของเรา
  • ไม่รองรับคอลัมน์ที่ซ้อนกันและประเภท MAP และ LIST ที่ซ้อนกัน
  • ไม่รองรับประเภท BSON, UUID และ ENUM
  • ไม่รองรับประเภททางกายภาพของ FIXED_LEN_BYTE_ARRAY ที่ไม่มีประเภทตรรกะหรือที่แปลงแล้ว
  • รองรับประเภท DECIMAL ได้สูงสุด 8 ไบต์ (ทศนิยม 18 หลัก) ลองใช้สองเท่าหากคุณต้องการทศนิยมมากกว่า 18 หลัก
  • ไม่รองรับประเภท TIME_MILLIS และ TIME_NANOS ลองใช้ TIME_MICROS แทน
  • ไม่รองรับการเข้ารหัส BIT_PACKED ที่เลิกใช้งานแล้ว ไฟล์ Parquet ล่าสุดไม่ควรใช้การเข้ารหัสนี้ เนื่องจากมีการเลิกใช้งานมานานกว่าครึ่งทศวรรษแล้ว
  • ไม่รองรับการเข้ารหัส DELTA_LENGTH_BYTE_ARRAY และการเข้ารหัส BYTE_STREAM_SPLIT ล่าสุดเนื่องจากไม่ได้เขียนโดยไลบรารีใดๆ หากคุณพบไฟล์ Parquet ใดๆ ที่ใช้การเข้ารหัสเหล่านี้ โปรดแจ้งให้เราทราบ
  • การบีบอัดที่รองรับ ได้แก่ SNAPPY, GZIP, ZSTD และ LZ4_RAW

ดูเพิ่มเติม