Spark SQL
本文介紹如何將 Tableau 連線到 Spark SQL 資料庫並設定資料來源。Tableau 可連線到 Spark 版本 1.2.1 及更高版本。
您可以使用 Spark SQL 連接器連線到 Azure HDInsight、Azure Data Lake、Databricks 或 Apache Spark 上的 Spark 叢集。
開始之前
在開始之前,請收集以下連線資訊:
- 託管要連線到的資料庫的伺服器的名稱以及埠號
- 驗證方法:
- 無驗證
- Kerberos
- 使用者名稱
- 使用者名稱和密碼
- Microsoft Azure HDInsight 服務
- 傳輸。您的選取取決於您選取的驗證方法,並且可能包括以下各項:
- 二進位
- SASL
- HTTP
- 登入認證。您的選取取決於您選取的驗證方法,並且可能包括以下各項:
- 使用者名
- 密碼
- 領域
- 主機 FQDN
- 服務名稱
- HTTP 路徑
- 是否要連線到 SSL 伺服器?
- (可選)要在每次 Tableau 連線時執行的初始 SQL 語句
需要驅動程式
此連接器需要驅動程式才能與資料庫通訊。如果電腦上未安裝該驅動程式,Tableau 會在連線對話方塊中顯示一條訊息,其中包含指向驅動程式下載(連結在新視窗開啟)頁面的連結,您可在該頁面中找到驅動程式連結和安裝說明。
進行連線並設定資料來源
啟動 Tableau,並在 [連線] 下選取 [Spark SQL] 。有關資料連線的完整清單,請在 [至伺服器] 下面選取 [更多]。然後執行以下操作:
- 輸入託管資料庫的伺服器的名稱和要使用的埠號。
- 使用 SparkThriftServer 連線到資料庫。請注意,提供了傳統的 SharkServer 和 SharkServer2 連線供您使用,但 Tableau 不支援這些連線。
- 選取驗證方法。然後,根據您的選取輸入提示您輸入的資訊。
- 選取登入。
- 如果伺服器有密碼保護,而您不在 Kerberos 環境中,則您必須輸入使用者名和密碼。
- 在連線到 SSL 伺服器時,選中 [需要 SSL] 核取方塊。
- (可選)選取 [初始 SQL]以指定要在每次連線開始時(例如開啟活頁簿、重新整理擷取、登入到 Tableau Server 或發佈到 Tableau Server 時)執行的 SQL 命令。有關詳情,請參閱執行初始 SQL。
在資料來源頁面上,執行下列操作:
(可選)在頁面頂端選取預設資料來源名稱,然後輸入要在 Tableau 中使用的唯一資料來源名稱。舉例來說,使用可幫助其他資料來源使用者推斷出要連線的資料來源的資料來源命名約定。
- 從 [結構描述] 下拉清單中,選取搜尋圖示,或在文字方塊中輸入結構描述名稱並選取搜尋圖示,然後選取結構描述。
- 在 [表] 文字方塊中,選取搜尋圖示或輸入表名稱並選取搜尋圖示,將表拖到畫布,然後選取工作表標籤以開始分析。
使用自訂 SQL 連線到特定查詢,而非整個資料來源。有關詳情,請參閱連線到自訂 SQL 查詢。
如果 Tableau 無法建立連線,請驗證您的認證是否正確。如果仍然無法連線,則說明您的電腦在定位伺服器時遇到問題。請聯絡您的網路系統管理員或資料庫管理員。
附註:從 2018.3 版開始,Spark SQL 的 Kerberos 驗證支援委派。2018.2 和較早版本不支援委派,這表示在較早版本中要將工作簿或資料來源發佈到 Tableau Server 時,無法使用 [Viewer 認證] 做為 [驗證] 方法;只能使用 [伺服器執行身分帳戶]。
登入到 Mac
如果在 Mac 上使用 Tableau Desktop,則在輸入伺服器名稱進行連線時,請使用完整網域名稱(例如 mydb.test.ourdomain.lan)而不是相對的網域名稱(例如 mydb 或 mydb.test)。
或者,可以將網域新增到 Mac 電腦的「搜尋網域」的清單中,以便在您連線時,只需要提供伺服器名稱。若要更新「搜尋網域」的清單,請轉到「系統喜好設定」>「網路」>「進階」,然後開啟「DNS」索引標籤。
另請參閱
- Databricks 和 Tableau(連結在新視窗開啟) - 閱讀 Databricks 網站上的 Tableau 使用者指南。