Databricks

本文介绍如何将 Tableau 连接到 Databricks 数据库并设置数据源。

开始之前

在开始之前,请收集以下连接信息:

  • 承载要连接到的数据库的服务器的名称
  • 数据源的 HTTP 路径
  • 身份验证方法:
    • Databricks 登录名(推荐)
    • 个人访问令牌
  • 要与您选择的身份验证方法一起使用的登录凭据:
    • Databricks 登录详细信息 (OAuth)
    • 个人访问令牌密码
  • 获取 Databricks 计算资源的连接详细信息。
  • (可选)要在每次 Tableau 连接时运行的初始 SQL 语句

需要驱动程序

此连接器需要驱动程序才能与数据库通信。如果计算机上未安装该驱动程序,Tableau 将在连接对话框中显示一条错误消息,其中包含指向驱动程序下载(链接在新窗口中打开)页面的链接,您可在该页面中找到驱动程序链接和安装说明。

进行连接并设置数据源

  1. 启动 Tableau,并在“连接”下选择“Databricks”。有关数据连接的完整列表,请在“至服务器”下选择“更多”。然后执行以下操作:

    1. 输入“服务器主机名”
    2. 输入数据源的“HTTP 路径”
    3. 选择身份验证方法: Databricks 登录名(推荐)或个人访问令牌

      注意:使用 Databricks 用户名和密码的基本身份验证已于 2024 年 7 月终止。有关详细信息,请参见 Databricks 管理密码的生命周期终止(链接在新窗口中打开)

    4. 输入您选择的身份验证方法的登录凭据:

    5. (可选)选择“初始 SQL”以指定要在每次连接开始时(例如打开工作簿、刷新数据提取、登录到 Tableau Server 或发布到 Tableau Server 时)运行的 SQL 命令。有关详细信息,请参见运行初始 SQL
    6. 选择“登录”

      如果 Tableau 无法建立连接,请验证您的凭据是否正确。如果仍然无法连接,则说明您的计算机在定位服务器时遇到问题。请与您的网络管理员或数据库管理员联系以获得更多帮助。

  2. 在数据源页面上,执行下列操作:

    1. (可选)在页面顶部选择默认数据源名称,然后输入要在 Tableau 中使用的唯一数据源名称。例如,使用可帮助其他数据源用户推断出要连接的数据源的数据源命名约定。

    2. “架构”下,选择一个架构,或使用文本框按名称搜索架构。
    3. “表”下,选择表或使用文本框按名称搜索表。
    4. 将表拖到画布,然后选择工作表标签以开始分析。

      使用自定义 SQL 连接到特定查询,而非整个数据源。有关详细信息,请参见连接到自定义 SQL 查询

登录到 Mac

如果在 Mac 上使用 Tableau Desktop,则在输入服务器名称进行连接时,请使用完全限定的域名(例如 mydb.test.ourdomain.lan)而不是相对域名(例如 mydb 或 mydb.test)。

或者,可以将域添加到 Mac 计算机的“搜索域”的列表中,以便在您连接时,只需要提供服务器名称。若要更新“搜索域”的列表,请转到“系统首选项”>“网络”>“高级”,然后打开“DNS”选项卡。

Databricks 最佳做法和疑难解答

 

若要了解有关优化工作簿、连接和常规 Tableau 性能的详细信息,优化工作簿性能中提供了大量的建议。

有关使用将 Tableau 与 Databricks 群集结合使用时的最佳做法和疑难解答的信息,请参见 Databricks 网站上的 Tableau(链接在新窗口中打开) 主题。

另请参见

感谢您的反馈!您的反馈已成功提交。谢谢!