关于 Data Connect

Data Connect 允许 Tableau Cloud 用户访问您的私有网络或云服务上的数据源。Data Connect 采用责任共担模式运行。在这种模型中,客户提供物理或虚拟计算资源,Tableau 在这些资源上托管和管理 Data Connect Kubernetes 群集。

在您的环境中,Data Connect Kubernetes 群集负责监督一组容器。容器支持由一个或多个代理组成的运行时环境。代理是运行任务并实现组织之间跨防火墙安全通信的程序。

Data Connect 服务包括:

  • 群集监控和故障排除:Tableau 监控 Data Connect 代理的运行状况和使用情况。收集遥测数据是为了确保以最有效、最有效率的方式使用资源。

  • 群集维护:升级自动部署,群集运维由 Tableau 拥有并全权执行。Data Connect 会根据需求和可用的计算池自动优化您的工作负载部署。

  • 警报监控:持续提供事件管理,以快速解决问题并限制业务影响。

连接器支持

Data Connect 支持与 Linux 版 Tableau Bridge 支持的相同连接器。若要全面了解连接选项,请参阅与 Bridge 的连接

环境支持

Data Connect 目前支持本地和 VCP 环境:Amazon Web Services (AWS)、Microsoft Azure 和 Google Cloud Platform (GCP)。Data Connect 节点与单个 Tableau Cloud 站点兼容。节点必须与数据安装在同一个网络中。因此,客户应为每个站点的每个专用网络规划至少三个节点,以保持服务的可用性。Data Connect 节点必须专用于 Data Connect。您不能将任何其他容器部署到 Tableau 拥有的群集。并且您不能为 Data Connect 使用现有群集。

架构

Data Connect 架构由三个主要组件和责任边界组成。虽然存在一些重叠,但 Tableau 主要负责应用程序和业务流程层,而客户负责基础设施(计算、操作系统、网络和存储)及其位置。

  1. Tableau Cloud → 业务流程服务

  2. Kubernetes 群集 → 业务流程服务

  3. Kubernetes 群集 → 容器

  4. Tableau 用户 → Tableau Cloud

  5. Data Connect 代理( 容器)→ Tableau Cloud

  6. Data Connect 代理( 容器)→ 客户数据库

安全性

请参见Data Connect 安全性

Data Connect 组件

Data Connect 解决方案的主要组件是群集。群集是一个由一个或多个节点组成的 Kubernetes 群集。每个 Kubernetes 节点至少托管一个容器,而该容器又托管 Data Connect 代理。代理执行实时和数据提取查询。

池是网络规则的逻辑分组,用于指定哪些群集应该完成特定的查询。在部署规划的上下文中,池托管一组端点(域或 IP 地址),以实现负载平衡。域包括私有云数据、关系数据、文件数据等。

为了允许群集访问和刷新数据源,每个池都被分配给一个群集。为了分配负载,您可以向群集添加多个池。

部署概述

首先,在每台 Linux 服务器上运行一个脚本。此脚本在您的环境中配置 Tableau 管理的 Kubernetes 群集。Kubernetes 群集由 Tableau 管理。

配置 Kubernetes 后,将 Docker 容器部署到群集。然后,Tableau 将在容器内部署并远程管理 Data Connect 代理。与 Tableau 建立此配置后,您将映射连接到您的私有网络数据源。

有关部署 Data Connect 的详细信息,请下载白皮书使用 Tableau Cloud 访问您的私有网络数据 - Data Connect 和 Tableau Bridge 最佳实践(链接在新窗口中打开)

数据库连接

查询由群集中的 Data Connect 代理进行管理。您的数据直接从 Data Connect 代理传输到 Tableau Cloud。Data Connect 不需要外部网络访问、防火墙漏洞或远程机器访问。

  1. 代理使用安全 WebSockets (wss://) 建立到 Tableau Cloud Data Connect 服务的持久连接。然后,客户端等待 Tableau Cloud 的请求。

    • 对于具有实时连接或虚拟连接的数据源,Tableau Cloud 向 Data Connect 代理发起查询。
    • 对于包含使用刷新计划的数据提取连接的数据源,客户端接收刷新计划请求,并使用适用于数据源 (.tds) 文件的安全连接 (https://) 来联系 Tableau Cloud
  2. 代理使用作业请求中包含的凭据连接到私有网络数据。

  3. 数据库返回查询的结果。

  4. Data Connect 代理接收有效负载并将其返回给 Data Connect 服务。