Amazon EMR Hadoop Hive

บทความนี้อธิบายวิธีการเชื่อมต่อ Tableau กับฐานข้อมูล Amazon EMR (Elastic MapReduce) Hadoop Hive และตั้งค่าแหล่งข้อมูล

Note: ตั้งแต่เวอร์ชัน 2018.2 เป็นต้นไป Tableau จะรองรับเฉพาะ Amazon EMR Hadoop Hive และไม่รองรับ Impala Amazon ไม่ให้บริการไดรเวอร์ Impala อีกต่อไปแล้ว

ก่อนที่คุณจะเริ่มต้น

ก่อนที่คุณจะเริ่มต้น ให้รวบรวมข้อมูลการเชื่อมต่อนี้

  • ชื่อของเซิร์ฟเวอร์ที่โฮสต์ฐานข้อมูลที่คุณต้องการเชื่อมต่อและหมายเลขพอร์ต

  • วิธีการตรวจสอบสิทธิ์

    • ไม่มีการตรวจสอบสิทธิ์

    • Kerberos

    • ชื่อผู้ใช้

    • ชื่อผู้ใช้และรหัสผ่าน

    • Microsoft Azure HDInsight Service (ตั้งแต่เวอร์ชัน 10.2.1)

  • ตัวเลือกการส่งจะขึ้นอยู่กับวิธีการตรวจสอบสิทธิ์ที่คุณเลือกและมีข้อมูลดังต่อไปนี้

    • ไบนารี

    • SASL

    • HTTP

  • ข้อมูลเข้าสู่ระบบจะขึ้นอยู่กับวิธีการตรวจสอบสิทธิ์ที่คุณเลือกและมีข้อมูลดังต่อไปนี้

    • ชื่อผู้ใช้

    • รหัสผ่าน

    • ขอบเขต

    • โฮสต์ FQDN

    • ชื่อบริการ

    • เส้นทาง HTTP

  • คุณกำลังเชื่อมต่อกับเซิร์ฟเวอร์ SSL อยู่ใช่ไหม

  • (ไม่บังคับ) คำสั่ง SQL เริ่มต้นที่จะทำงานทุกครั้งที่ Tableau เชื่อมต่อ

ต้องมีไดรเวอร์

ตัวเชื่อมต่อนี้ต้องการไดรเวอร์เพื่อติดต่อกับฐานข้อมูล คุณอาจติดตั้งไดรเวอร์ที่จำเป็นบนคอมพิวเตอร์อยู่แล้ว หากไม่ได้มีการติดตั้งไดรเวอร์ในคอมพิวเตอร์ของคุณ Tableau จะแสดงข้อความในกล่องโต้ตอบการเชื่อมต่อพร้อมลิงก์ไปยังหน้าดาวน์โหลดไดรเวอร์(ลิงก์จะเปิดในหน้าต่างใหม่) ซึ่งคุณจะพบลิงก์ของไดรเวอร์และคำแนะนำในการติดตั้ง

หมายเหตุ: ตรวจสอบว่าคุณใช้ไดรเวอร์ล่าสุดที่มีอยู่ หากต้องการไดรเวอร์ล่าสุด โปรดดู Amazon EMR Hadoop Hive(ลิงก์จะเปิดในหน้าต่างใหม่) ในหน้าดาวน์โหลดไดรเวอร์ของ Tableau

ทำการเชื่อมต่อและตั้งค่าแหล่งข้อมูล

  1. เปิด Tableau และเลือก Amazon EMR Hadoop Hive ในส่วนเชื่อมต่อ หากต้องการดูรายการการเชื่อมต่อข้อมูลทั้งหมด โปรดเลือกเพิ่มเติมในส่วนไปยังเซิร์ฟเวอร์ จากนั้นทำตามขั้นตอนต่อไปนี้

    1. ป้อนชื่อเซิร์ฟเวอร์ที่โฮสต์ฐานข้อมูลและหมายเลขพอร์ตที่จะใช้

    2. เลือกการตรวจสอบสิทธิ์ที่จะใช้ในรายการดรอปดาวน์การตรวจสอบสิทธิ์ ข้อมูลที่คุณได้รับแจ้งให้ระบุจะขึ้นอยู่กับวิธีการตรวจสอบสิทธิ์ที่คุณเลือก

    3. หากใช้รายการดรอปดาวน์การส่งได้ ให้เลือกประเภทการส่งที่ต้องการใช้

    4. (ไม่บังคับ) เลือก เริ่มต้น SQL เพื่อระบุคำสั่ง SQL ที่จะเรียกใช้เมื่อเริ่มต้นทุกการเชื่อมต่อ เช่น เมื่อคุณเปิดเวิร์กบุ๊ก รีเฟรชการแยกข้อมูล เข้าสู่ระบบ Tableau Server หรือเผยแพร่ไปยัง Tableau Server สำหรับข้อมูลเพิ่มเติม โปรดดูที่ เรียกใช้ SQL เริ่มต้น

    5. เลือกเข้าสู่ระบบ

      เลือกตัวเลือกต้องใช้ SSL เมื่อเชื่อมต่อกับเซิร์ฟเวอร์ SSL

      หาก Tableau ไม่สามารถทำการเชื่อมต่อได้ ให้ตรวจสอบว่าข้อมูลเข้าสู่ระบบนั้นถูกต้อง หากคุณยังไม่สามารถเชื่อมต่อได้ คอมพิวเตอร์ของคุณกำลังพบปัญหาขณะค้นหาเซิร์ฟเวอร์ ติดต่อผู้ดูแลเครือข่ายหรือผู้ดูแลระบบฐานข้อมูลของคุณ

  2. บนหน้าแหล่งข้อมูล ให้ทำดังนี้ 

    1. (ไม่บังคับ) เลือกชื่อแหล่งข้อมูลเริ่มต้นที่ด้านบนของหน้า แล้วป้อนชื่อแหล่งข้อมูลที่ไม่ซ้ำกันสำหรับใช้ใน Tableau ตัวอย่างเช่น ใช้แบบแผนการตั้งชื่อแหล่งข้อมูลที่ช่วยให้ผู้ใช้รายอื่นๆ ของแหล่งข้อมูลทราบแหล่งข้อมูลที่จะเชื่อมต่อได้

    2. ค้นหาไอคอนการค้นหาหรือป้อนชื่อสคีมาในกล่องข้อความและเลือกไอคอนการค้นหา จากนั้นเลือกสคีมาจากรายการดรอปดาวน์สคีมา

    3. เลือกไอคอนการค้นหาหรือป้อนชื่อตารางและเลือกไอคอนการค้นหา จากนั้นเลือกตารางในกล่องข้อความตาราง

    4. ลากตารางไปยังแคนวาส แล้วเลือกแท็บชีตเพื่อเริ่มต้นการวิเคราะห์

    5. ใช้ SQL แบบปรับแต่งเองเพื่อเชื่อมต่อกับการค้นหาเฉพาะแทนที่จะเป็นแหล่งข้อมูลทั้งหมด หากต้องการข้อมูลเพิ่มเติม โปรดดู เชื่อมต่อกับการค้นหา SQL แบบปรับแต่งเอง

เข้าสู่ระบบบน Mac

หากคุณใช้ Tableau Desktop บน Mac เมื่อคุณป้อนชื่อเซิร์ฟเวอร์เพื่อเชื่อมต่อ ให้ใช้ชื่อโดเมนที่มีคุณสมบัติครบถ้วน เช่น mydb.test.ourdomain.lan แทนชื่อโดเมนแบบสัมพัทธ์ เช่น mydb หรือ mydb.test

หรือคุณสามารถเพิ่มโดเมนไปยังรายชื่อโดเมนค้นหาสำหรับคอมพิวเตอร์ Mac เพื่อให้เวลาที่คุณเชื่อมต่อจะได้ระบุเพียงแค่ชื่อเซิร์ฟเวอร์เท่านั้น หากต้องการอัปเดตรายชื่อโดเมนค้นหา ให้ไปที่การอ้างอิงระบบ > เครือข่าย > ขั้นสูง จากนั้นเปิดแท็บDNS

ทำงานกับข้อมูล Hadoop Hive

ทำงานกับข้อมูลวันที่/เวลา

Tableau สามารถรองรับประเภท TIMESTAMP และ DATE อย่างไรก็ตาม หากคุณจัดเก็บข้อมูลวันที่/เวลาเป็นสตริงใน Hive โปรดอย่าลืมจัดเก็บข้อมูลดังกล่าวในรูปแบบ ISO (YYYY-MM-DD) ด้วย คุณสามารถสร้างฟิลด์ที่คำนวณที่ใช้ฟังก์ชัน DATEPARSE หรือ DATE เพื่อแปลงสตริงเป็นรูปแบบวันที่/เวลาได้ ใช้ DATEPARSE() เมื่อทำงานกับการแยกข้อมูล หรือไม่ก็ใช้ DATE() หากต้องการข้อมูลเพิ่มเติม โปรดดูฟังก์ชันวันที่

หากต้องการข้อมูลเพิ่มเติมเกี่ยวกับประเภทข้อมูล Hive โปรดดูวันที่(ลิงก์จะเปิดในหน้าต่างใหม่)บนเว็บไซต์ Apache Hive

การส่งคืนค่า null

ระบบจะส่งคืนค่า null เมื่อคุณเปิดเวิร์กบุ๊กใน Tableau 9.0.1 และใหม่กว่า และ 8.3.5 และเวอร์ชัน 8.3.x ที่ใหม่กว่าที่สร้างขึ้นในเวอร์ชันก่อนหน้า และมีข้อมูลวันที่/เวลาที่จัดเก็บเป็นสตริงในรูปแบบที่ Hive ไม่รองรับ หากต้องการการแก้ไขปัญหานี้ ให้เปลี่ยนประเภทฟิลด์กลับเป็นสตริงและสร้างฟิลด์ที่คำนวณโดยใช้ DATEPARSE() หรือ DATE() เพื่อแปลงวันที่ ใช้ DATEPARSE() เมื่อทำงานกับการแยกข้อมูล หรือไม่ก็ใช้ฟังก์ชัน DATE()

ข้อจำกัดเวลาแฝงสูง

Hive เป็นระบบแบบกลุ่มและยังไม่สามารถตอบคำถามทั่วไปที่มากมายด้วยการตอบสนองที่รวดเร็วมากนัก ข้อจำกัดนี้อาจทำให้ยากต่อการสำรวจชุดข้อมูลใหม่ๆ หรือการทดสอบกับฟิลด์ที่คำนวณ เทคโนโลยี SQL-on-Hadoop ที่ใหม่กว่าบางรายการ (เช่น โครงการ Impala's Impala และ Hortonworks ของ Cloudera) ได้รับการออกแบบมาเพื่อแก้ปัญหาเกี่ยวกับข้อจำกัดนี้เรียบร้อยแล้ว

 

ดูเพิ่มเติม

ขอบคุณสำหรับข้อเสนอแนะของคุณส่งข้อเสนอแนะของคุณเรียบร้อยแล้ว ขอขอบคุณ