Hortonworks Hadoop Hive
บทความนี้อธิบายวิธีการเชื่อมต่อ Tableau กับฐานข้อมูล Hortonworks Hadoop Hive และตั้งค่าแหล่งข้อมูล
ก่อนที่คุณจะเริ่มต้น ให้รวบรวมข้อมูลการเชื่อมต่อนี้
ชื่อของเซิร์ฟเวอร์ที่โฮสต์ฐานข้อมูลที่คุณต้องการเชื่อมต่อ
วิธีการตรวจสอบสิทธิ์
ไม่มีการตรวจสอบสิทธิ์
Kerberos
ชื่อผู้ใช้
ชื่อผู้ใช้และรหัสผ่าน
Microsoft Azure HDInsight Service (ตั้งแต่เวอร์ชัน 10.2.1)
ตัวเลือกการส่งจะขึ้นอยู่กับวิธีการตรวจสอบสิทธิ์ที่คุณเลือกและมีข้อมูลดังต่อไปนี้
ไบนารี
SASL
HTTP
ข้อมูลเข้าสู่ระบบจะขึ้นอยู่กับวิธีการตรวจสอบสิทธิ์ที่คุณเลือกและมีข้อมูลดังต่อไปนี้
ชื่อผู้ใช้
รหัสผ่าน
ขอบเขต
โฮสต์ FQDN
ชื่อบริการ
เส้นทาง HTTP
คุณกำลังเชื่อมต่อกับเซิร์ฟเวอร์ SSL อยู่ใช่ไหม
(ไม่บังคับ) คำสั่ง SQL เริ่มต้นที่จะทำงานทุกครั้งที่ Tableau เชื่อมต่อ
ต้องมีไดรเวอร์
ตัวเชื่อมต่อนี้ต้องการไดรเวอร์เพื่อติดต่อกับฐานข้อมูล หากไม่ได้มีการติดตั้งไดรเวอร์ในคอมพิวเตอร์ของคุณ Tableau จะแสดงข้อความในกล่องโต้ตอบการเชื่อมต่อพร้อมลิงก์ไปยังหน้าดาวน์โหลดไดรเวอร์(ลิงก์จะเปิดในหน้าต่างใหม่) ซึ่งคุณจะพบลิงก์ของไดรเวอร์และคำแนะนำในการติดตั้ง
หมายเหตุ: ตรวจสอบว่าคุณใช้ไดรเวอร์ล่าสุดที่มีอยู่ หากต้องการไดรเวอร์ล่าสุด โปรดดู Hortonworks Hadoop Hive(ลิงก์จะเปิดในหน้าต่างใหม่) ในหน้าดาวน์โหลดไดรเวอร์ของ Tableau
เปิด Tableau และเลือก Hortonworks Hadoop Hive ในส่วนเชื่อมต่อ หากต้องการดูรายการการเชื่อมต่อข้อมูลทั้งหมด โปรดเลือกเพิ่มเติมในส่วนไปยังเซิร์ฟเวอร์ จากนั้นทำตามขั้นตอนต่อไปนี้
ป้อนชื่อเซิร์ฟเวอร์ที่โฮสต์ฐานข้อมูล
เลือกการตรวจสอบสิทธิ์ที่จะใช้ในรายการดรอปดาวน์การตรวจสอบสิทธิ์
ป้อนข้อมูลที่คุณเห็นข้อความแจ้งให้ระบุ ข้อมูลที่คุณได้รับแจ้งจะขึ้นอยู่กับวิธีการตรวจสอบสิทธิ์ที่คุณเลือก
(ไม่บังคับ) เลือก เริ่มต้น SQL เพื่อระบุคำสั่ง SQL ที่จะเรียกใช้เมื่อเริ่มต้นทุกการเชื่อมต่อ เช่น เมื่อคุณเปิดเวิร์กบุ๊ก รีเฟรชการแยกข้อมูล เข้าสู่ระบบ Tableau Server หรือเผยแพร่ไปยัง Tableau Server หากต้องการข้อมูลเพิ่มเติม โปรดดูเรียกใช้ SQL เริ่มต้น
เลือกเข้าสู่ระบบ
เลือกตัวเลือกต้องใช้ SSL เมื่อเชื่อมต่อกับเซิร์ฟเวอร์ SSL
หาก Tableau ไม่สามารถทำการเชื่อมต่อได้ ให้ตรวจสอบว่าข้อมูลเข้าสู่ระบบนั้นถูกต้อง หากคุณยังไม่สามารถเชื่อมต่อได้ คอมพิวเตอร์ของคุณกำลังพบปัญหาขณะค้นหาเซิร์ฟเวอร์ โปรดติดต่อผู้ดูแลเครือข่ายหรือผู้ดูแลฐานข้อมูลเพื่อขอความช่วยเหลือ
บนหน้าแหล่งข้อมูล ให้ทำดังนี้
(ไม่บังคับ) เลือกชื่อแหล่งข้อมูลเริ่มต้นที่ด้านบนของหน้า แล้วป้อนชื่อแหล่งข้อมูลที่ไม่ซ้ำกันสำหรับใช้ใน Tableau ตัวอย่างเช่น ใช้แบบแผนการตั้งชื่อแหล่งข้อมูลที่ช่วยให้ผู้ใช้รายอื่นๆ ของแหล่งข้อมูลทราบแหล่งข้อมูลที่จะเชื่อมต่อได้
ค้นหาไอคอนการค้นหาหรือป้อนชื่อสคีมาในกล่องข้อความและเลือกไอคอนการค้นหา จากนั้นเลือกสคีมาจากรายการดรอปดาวน์สคีมา
เลือกไอคอนการค้นหาหรือป้อนชื่อตารางและเลือกไอคอนการค้นหา จากนั้นเลือกตารางในกล่องข้อความตาราง
ลากตารางไปยังแคนวาส แล้วเลือกแท็บชีตเพื่อเริ่มต้นการวิเคราะห์
ใช้ SQL แบบปรับแต่งเองเพื่อเชื่อมต่อกับการค้นหาเฉพาะแทนที่จะเป็นแหล่งข้อมูลทั้งหมด หากต้องการข้อมูลเพิ่มเติม โปรดดู เชื่อมต่อกับการค้นหา SQL แบบปรับแต่งเอง
หมายเหตุ: ฐานข้อมูลประเภทนี้รองรับเฉพาะการดำเนินการรวมด้วยเครื่องหมายเท่ากับ (=) เท่านั้น
หากคุณใช้ Tableau Desktop บน Mac เมื่อคุณป้อนชื่อเซิร์ฟเวอร์เพื่อเชื่อมต่อ ให้ใช้ชื่อโดเมนที่มีคุณสมบัติครบถ้วน เช่น mydb.test.ourdomain.lan แทนชื่อโดเมนแบบสัมพัทธ์ เช่น mydb หรือ mydb.test
หรือคุณสามารถเพิ่มโดเมนไปยังรายชื่อโดเมนค้นหาสำหรับคอมพิวเตอร์ Mac เพื่อให้เวลาที่คุณเชื่อมต่อจะได้ระบุเพียงแค่ชื่อเซิร์ฟเวอร์เท่านั้น หากต้องการอัปเดตรายชื่อโดเมนค้นหา ให้ไปที่การอ้างอิงระบบ > เครือข่าย > ขั้นสูง จากนั้นเปิดแท็บDNS
ทำงานกับข้อมูลวันที่/เวลา
Tableau สามารถรองรับประเภท TIMESTAMP และ DATE อย่างไรก็ตาม หากคุณจัดเก็บข้อมูลวันที่/เวลาเป็นสตริงใน Hive โปรดอย่าลืมจัดเก็บข้อมูลดังกล่าวในรูปแบบ ISO (YYYY-MM-DD) ด้วย คุณสามารถสร้างฟิลด์ที่คำนวณที่ใช้ฟังก์ชัน DATEPARSE หรือ DATE เพื่อแปลงสตริงเป็นรูปแบบวันที่/เวลาได้ ใช้ DATEPARSE() เมื่อทำงานกับการแยกข้อมูล หรือไม่ก็ใช้ DATE() หากต้องการข้อมูลเพิ่มเติม โปรดดูฟังก์ชันวันที่
หากต้องการข้อมูลเพิ่มเติมเกี่ยวกับประเภทข้อมูล Hive โปรดดูวันที่(ลิงก์จะเปิดในหน้าต่างใหม่)บนเว็บไซต์ Apache Hive
การส่งคืนค่า null
ระบบจะส่งคืนค่า null เมื่อคุณเปิดเวิร์กบุ๊กใน Tableau 9.0.1 และใหม่กว่า และ 8.3.5 และเวอร์ชัน 8.3.x ที่ใหม่กว่าที่สร้างขึ้นในเวอร์ชันก่อนหน้า และมีข้อมูลวันที่/เวลาที่จัดเก็บเป็นสตริงในรูปแบบที่ Hive ไม่รองรับ หากต้องการการแก้ไขปัญหานี้ ให้เปลี่ยนประเภทฟิลด์กลับเป็นสตริงและสร้างฟิลด์ที่คำนวณโดยใช้ DATEPARSE() หรือ DATE() เพื่อแปลงวันที่ ใช้ DATEPARSE() เมื่อทำงานกับการแยกข้อมูล หรือไม่ก็ใช้ฟังก์ชัน DATE()
ข้อจำกัดเวลาแฝงสูง
Hive เป็นระบบแบบกลุ่มและยังไม่สามารถตอบคำถามทั่วไปที่มากมายด้วยการตอบสนองที่รวดเร็วมากนัก ข้อจำกัดนี้อาจทำให้ยากต่อการสำรวจชุดข้อมูลใหม่ๆ หรือการทดสอบกับฟิลด์ที่คำนวณ เทคโนโลยี SQL-on-Hadoop ที่ใหม่กว่าบางรายการ (เช่น โครงการ Impala's Impala และ Hortonworks ของ Cloudera) ได้รับการออกแบบมาเพื่อแก้ปัญหาเกี่ยวกับข้อจำกัดนี้เรียบร้อยแล้ว
คอลัมน์ที่ตัดทอนใน Tableau
ความยาวคอลัมน์สตริงเริ่มต้นสำหรับ Hortonworks Hadoop Hive คือ 255 อักขระ หากต้องการข้อมูลเพิ่มเติมเติมเกี่ยวกับตัวเลือกการกำหนดค่าไดรเวอร์ ODBC ของ Hortonworks Hive และข้อมูลเฉพาะเกี่ยวกับ DefaultStringColumnLength โปรดดู คู่มือผู้ใช้ไดรเวอร์ ODBC ของ Hive(ลิงก์จะเปิดในหน้าต่างใหม่) จาก Hortonworks
ดูเพิ่มเติม
- ตั้งค่าแหล่งข้อมูล เพิ่มข้อมูลเพิ่มเติมลงในแหล่งข้อมูลนี้หรือเตรียมข้อมูลของคุณก่อนที่คุณจะวิเคราะห์
- สร้างแผนภูมิและวิเคราะห์ข้อมูล เริ่มการวิเคราะห์ข้อมูลของคุณ