规划您的 Data Connect 部署

Data Connect 是面向 Tableau Cloud Enterprise 和 Tableau+ 客户的付费订阅服务。购买 Data Connect 后,站点管理员将能够在 Tableau Cloud 的设置页面中配置该服务。

基础设施规格

  • 计算:托管 Data Connect 的位置。这可以是裸机或虚拟机,可以位于私有网络或云中。

  • 操作系统 (OS) :受支持的 Linux 发行版的最新版本和修补版本。

  • 存储:分配存储空间以托管操作系统、Data Connect 及其在执行刷新时创建的数据提取。

  • 网络:计算必须能够连接到您的数据源和公共互联网上的两个位置。

节点规格

节点数

生产工作负载最小值:每个网络三个节点

开发/测试工作负载最小值:每个网络一个节点

vCPU最低:8 个 vCPU
建议:16 个 vCPU 或更多
内存最低:16 GB
建议:64 GB 或更多
根卷

最低:100 GB

建议:200 GB

可变卷

最低:100 GB

建议:200 GB

存储(两个磁盘)

重要信息:辅助磁盘必须是原始的且未格式化。

根磁盘
最低:200 GB 磁盘空间
建议:大于 300 GB

辅助磁盘
最低:200 GB
建议:大于 500 GB

权限主机的 root 访问权限

Linux 操作系统

支持的发行版RHEL-8
RHEL-9
Ubuntu-20.04
Ubuntu-22.04

网络规格

有关 Data Connect 组件关系的详细信息,请参见架构

代理筛选请参见可选的转发代理筛选
在端口 443(应用程序层)上与 Tableau Cloud 双向通信每个 Tableau Cloud pod 的 IP 地址范围都是唯一的。若要确定您的 IP 地址范围,请参见授权访问发布到 Tableau Cloud 的云数据(链接在新窗口中打开)
在端口 80(应用程序层)上的认证验证出站请求
在端口 443 上进行出站 TLS 客户端身份验证,并进行双向 TLS 身份验证
(业务流程层)
52.42.211.235
52.10.6.79
35.167.70.143
完全限定域名 (FQDN) 的出站列表
(业务流程层)
tunnel.rafay-edge.net
api.rafay.dev
control.rafay.dev
fluentd-aggr.rafay-edge.net
influxdb01.core.rafay-edge.net
debug.core.rafay-edge.net
edge.core.rafay-edge.net
registry.rafay-edge.net
app.rafay.dev
console.rafay.dev
*.connector.kubeapi-proxy.rafay.dev
*.user.kubeapi-proxy.rafay.dev
event.core.rafay-edge.net
repo.rafay-edge.net
*.connector.cdrelay.rafay.dev
*.user.cdrelay.rafay.dev
*.connector.infrarelay.rafay.dev
*.user.infrarelay.rafay.dev

内部网络

群集节点需要与 Tableau Desktop 相同的数据源网络访问权限。

入站网络规则

若要在环境中的节点之间启用通信,请在节点上为这些端口配置网络规则。

端口范围:

  • 53,TCP
  • 6443,TCP
  • 2379-2380,TCP
  • 10250,10255,TCP
  • 10259,10251,TCP
  • 10257,10252,TCP
  • 30000-32767,TCP
  • 8285,8472,UDP
  • 8500,TCP
  • 8600,UDP
  • 8301,TCP/UDP
  • 9099,TCP
  • 5656,TCP
  • 4789,UDP
Tableau Cloud 权限站点管理员角色和访问数据源的凭据。
数据源Data Connect 当前支持且可通过群集进行网络访问的数据源的身份验证方法。

数据库访问

Data Connect 使用 Tableau 连接器连接到不同数据库来使数据保持最新。其中一些连接器需要驱动程序来与数据库通信。若要获取 Data Connect 支持的连接器的驱动程序,请转到 Tableau 驱动程序下载并筛选到 Linux。Data Connect 仅支持 Linux 驱动程序。确保使用针对每个数据库列出的说明。

数据库身份验证

数据源、Prep Conductor 流程或虚拟连接所连接到的基础数据通常需要身份验证。如果需要身份验证,发布者或所有者可以配置如何获取数据库凭据。

数据源

数据源的身份验证配置选项包括“提示用户”“嵌入式密码”

  • 如果数据源设置为提示用户,则数据库凭据不会随连接一起存储。这意味着,打开数据源(或使用数据源的工作簿)的用户必须输入自己的数据库凭据才能访问数据。

  • 如果数据源设置为包含嵌入的密码,则数据库凭据将随连接一起保存,并由访问数据源(或刷新数据源)的任何人使用。

有关详细信息,请参见设置凭据以访问您发布的数据(链接在新窗口中打开)

Tableau Prep Conductor 和虚拟连接

数据库凭据存储在 Prep 流程或虚拟连接中。对于 Prep 流程,凭据在 Prep Conductor 流程运行时使用。对于虚拟连接,任何访问虚拟连接的人都可以使用这些凭据。

有关数据源凭证管理的详细信息,请参见Data Connect 安全性

容量规划

管理员可以使用多种工具来管理 Data Connect 上的工作负载容量。

Data Connect 服务的组件包括私有网络、池、群集和节点。

群集管理

Data Connect 群集是访问指定私有网络内的数据的节点群集。这些节点可以访问其网络内已配置为访问的任何数据库。该群集所有节点上的所有 Bridge 客户端都可以处理有权访问群集的任何站点的工作负载。为了增加群集的容量,您可以向群集添加节点以增加吞吐量或增加计算机的大小(CPU、内存等)。

使用池实现负载平衡

每个群集使用一个池来平衡群集中所有 Bridge 客户端的流量负载。每个群集内有多个节点可确保您有多个 Bridge 客户端可用于处理与池相关的流量。对于添加到池的每个域,到该域的所有流量都会在群集中实现负载平衡。无法将域添加到站点上的多个池中。这种设计可确保流量得到适当的路由。

站点限制

对 Data Connect 交付的作业强制实施站点限制,以确保 Tableau Cloud 上的所有客户都能获得良好的体验。强制实施的限制与针对 Tableau Bridge 强制实施的限制相同,因为 Data Connect 代表您部署 Tableau Bridge 来为数据库查询提供服务。有关这些限制的详细信息,请参见Bridge 站点容量

有关容量规划的详细信息,请下载白皮书使用 Tableau Cloud 访问您的私有网络数据

感谢您的反馈!您的反馈已成功提交。谢谢!