硬件平台

此内容是T ableau Blueprint 的一部分,这是一个成熟度框架,允许您放大并改进组织使用数据来推动影响的方式。若要开始您的旅程,请参加我们的评估(链接在新窗口中打开)

注:此主题仅适用于 Tableau Server。

Tableau Server 可以安装在本地的物理或虚拟机上,也可以安装在云端,并支持 Windows 和 Linux 操作系统。要确定您的硬件平台和规模,请考虑以下因素:您的环境、数据源和管理(用于提供自助式数据访问)、所有用户的潜在工作负载以及实际使用情况数据。如果这是您第一次部署 Tableau Server,则应重点关注环境标准和数据源。对于现有部署,除了环境和数据源之外,您还将分析 Tableau Server 数据以评估工作负载和使用情况。

硬件要求

无论选择在哪里部署 Tableau Server,大小合适的硬件都是至关重要的。与其他软件应用程序相比,您应该更加频繁地评估 Server 利用率和用户参与度,更加频繁地调整规模,更加频繁地更改拓扑,以便让您的规划与不断发展的业务需求相协调。请在下方通过对应的链接找到符合贵企业标准的硬件平台并查看相关内容:

  • Google Compute Engine 虚拟机类型和大小 (Windows | Linux)

如果在云中部署 Tableau Server,专用硬件和静态 RAM 分配可消除资源争用导致的性能差异。如果比较在意成本,虚拟硬件也是可行的。我们建议您测试自己的基础架构,以找到最适合您需求的配置。有关如何进行此测试的示例,请参阅白皮书 Tableau 达到 EC2 速度(英文)。(此实验是在 AWS 上进行的,但测试理论适用于任何云提供商。)

确定初始大小

您的 Tableau 客户团队可以评估您的要求并协助您确定规模。在 Tableau 的初始部署中,假设有 10% 的活动用户(向 Tableau Server 发出的交互式并发请求,包括在笔记本计算机或移动设备上使用仪表板、Web 制作,以及连接和查询已发布数据源),您的估算应该是每个 8 核节点 600-800 个 Explorer。这仅仅是一个起点,不应被视为在初始阶段结束后还需要沿用的规模调整规则。生产服务器的每个内核至少应该有 8GB 的 RAM 内存。对于少于 40 核的群集,请使用 8 核节点;对于大于 40 核的群集,请使用 16 核节点。规划硬件容量时,必须考虑到每种许可证类型的相对工作负载。假设一个 Explorer 计为 1 名用户,则一个 Creator 的相对工作负载为 2.4 名用户,而一个 Viewer 的相对工作负载为 0.75 名用户。您可以使用这些工作负载系数来估计群集的容量。下表在每一行显示了等效工作负载示例:

 

Creator

Explorer

Viewer

工作负载 1

25

300

586

工作负载 2

50

333

462

工作负载 3

75

234

514

工作负载 4

100

171

518

 

Creator、Explorer 和 Viewer 的实际工作负载可能会因 Tableau Server 功能的使用情况而异,例如连接数据、Web 制作,以及查看内容并与之交互的频率。随着更多的用户完成入门流程并开始创建和使用内容,您应该监视硬件和内容的使用情况,以便使用来自硬件监视工具和 Tableau Server 的存储库的数据,针对如何调整规模做出明智的决定。更多信息,请参阅 Tableau 监视Tableau 用户参与度和采用率的测量

可扩展性

在新部署和现有部署中,目标都是主动维护充足的可用性、容量和余量,并最大程度地减少资源争用。与其他企业平台一样,Tableau Server 通过添加处理器、内存和/或磁盘来进行纵向扩展,或者通过向群集添加更多节点来进行横向扩展。根据您的独特环境、数据、工作负载和使用情况,Tableau Server 可通过添加硬件资源,以近乎线性的方式实现扩展。应该定期执行 Tableau 维护中概述的负载测试和容量规划。

可扩展性和性能在很大程度上取决于外部系统,例如数据源、数据量、网络速度、用户工作负载和工作簿设计,这些因素可能会随着部署的推进而迅速改变。例如,即便初始部署具有规模适当的硬件配置,计划外的用户加入、未受监视的使用、低效的工作簿、不完善的数据提取设计以及高峰时的数据刷新计划仍可能对服务器性能和用户体验产生重大影响,各种独立事件会产生积累效应,导致性能降低。更多信息,请参阅 Tableau Server 可扩展性白皮书

在云中部署 Tableau Server 时,您可以利用 Tableau 平台的所有现有扩展功能,包括 Hot Topology。此外,只需重新启动 Server,您就可以更改支持该平台的基础计算机,只要它们的公共 IP 地址不变即可。

对于单节点部署,您也可以在停机期间关闭 Tableau Server 计算机,以降低计算机成本。对多节点群集执行此操作将使 Tableau 处于降级状态。但是,您可以利用 Hot Topology 来对 Tableau Server 进程分配进行响应式调整,从而使您可以调整计算机成本和容量需求之间的平衡。不支持根据需求来终止或实例化计算机的自动扩缩功能。

Server 环境

除生产环境外,Tableau 还建议使用一个测试环境来测试升级和 Server 拓扑更改。您的生产环境将使用具有内容验证、提升和认证流程(都在同一个环境中)的生产和沙盒项目来支持现代分析。有关这些内容管理流程的更多信息,请参阅 Tableau 管控。生产和测试环境应具有相同的硬件规格、服务器拓扑和配置。这样,管理员就能够通过还原回生产内容,在测试环境中测试升级并参与测试计划。

某些组织的 IT 策略需要使用开发、QA 和生产三个环境 ,来将内容开发、测试和使用的用例隔离到不同的 Tableau Server 安装中。如果您的组织有这样的要求,则必须为这三种环境中的每一种分别提供许可证,因为它们将被视为三个生产环境(Tableau 的《最终用户许可协议》中定义)。生产和 QA 环境应具有相同的规格、服务器拓扑和配置。如果需要运行三个单独的环境,请尽量不要在现代分析平台中复制传统的瀑布式开发周期。用户可能更喜欢 QA 环境,因为它可以绕开严格的政策,还可以避免将内容传送到生产环境时可能出现的延迟。因此,您应该使用 Tableau Advanced Management 中的 Content Migration Tool,或使用基于 Tableau 的 REST API 自定义工作流脚本来自动执行将内容迁移到生产 Server 的流程,从而实现良好的平衡。开发环境不必具有与生产环境和 QA 环境完全相同的硬件规格,除非您要将开发环境用于升级测试或参与 Beta 计划。

高可用性

您应该根据可用性要求安装和配置 Tableau,并通过添加附加节点来提高容量和/或实现高可用性 (Windows | Linux)。为了支持关键用例,您应该部署配有外部负载平衡器的高可用性 (HA) 群集配置 (Windows | Linux)。

Tableau Server 的高可用性安装至少具有三个节点,并且在不同节点上设置了关键进程(存储库、文件存储/数据引擎和协调服务)的多个冗余实例。目的是通过消除单点故障、启用故障检测(并在可能的情况下进行故障转移)来最大程度地减少系统停机时间。更多信息,请参阅 Tableau Server 高可用性白皮书

请按照以下模式构建 HA 集群:

  1. 安装初始节点,并允许具有体系结构感知功能的智能安装程序配置进程 (Windows | Linux)。主动存储库位于节点 1 上。
  2. 将进程配置复制到其他 VizQL 节点,以确保冗余 (Windows | Linux)。被动存储库位于节点 2 上。节点 3 进程将镜像复制节点 1 和 2,但没有存储库进程。
  3. 添加协调服务系统和客户端文件服务 (Windows | Linux)。
  4. 添加外部负载平衡器 (Windows | Linux)。

3 节点 Tableau Server HA 部署(注意:协调服务和客户端文件服务未明确显示)

对专用节点的需求会随着时间的推移而变化。应将包含大量数据提取以及需要频繁进行数据提取刷新的工作负载,与呈现交互式可视化的工作负载隔离开来。在包含大量数据提取的环境中,大多数数据源都是数据提取。包含少量超大型数据提取或者大量小型数据提取的部署都应该归入这个类别。需要频繁刷新数据提取(例如在一天中的工作时间内刷新数次)的部署应该隔离到专用的后台程序节点上。为了隔离后台程序进程的工作负载,请添加专用的后台程序节点,以确保冗余,如下面的节点 4 和节点 5 所示。您可以使用节点角色,配置在 Tableau Server 安装中的什么位置处理特定类型的工作负载。节点角色功能允许您将资源专用于特定工作负载并进行扩展。要详细了解如何为后台程序和文件存储配置节点角色,请参阅通过节点角色管理工作负载

5 节点 Tableau Server HA 部署(注意:协调服务和客户端文件服务未明确显示)

 

从 2019.3 开始,您可以将 Tableau Server 存储库部署到 Amazon Relational Database Service (RDS)。Tableau Server 存储库是用于存储有关所有用户交互、数据提取刷新等数据的 PostgreSQL 数据库。Amazon RDS 为 PostgreSQL 提供了内置的可扩展性、可靠性、高可用性和安全性。通过与 AWS 集成来配置 Tableau Server 外部存储库,您将能够充分利用部署云的这些额外优势。更多信息,请参阅 Tableau Server 外部存储库

在公共云中部署 Tableau Server 时,您可以通过一些选择来进一步降低停机风险。举例来说;您既可以将 Tableau Server 的每个节点部署在单独的虚拟网络中,也可以将其部署在不同的可用区/区域中。但是,对环境进行分隔可能会有代价,因为这会增加整个系统的延迟。在最终确定环境之前,请考虑同时对性能和可用性进行测试,以确保您为自己的数据社区实现适当的平衡。Tableau Server 不支持跨区域部署多节点群集。

灾难恢复

针对 Tableau 环境制定灾难恢复 (DR) 计划时,要考虑两个主要因素:恢复时间目标 (RTO) 和恢复点目标 (RPO)。RTO 可以衡量企业在完全恢复之前可以接受的停机时间,它会影响将备份还原到备用群集的频率以及基础架构投资量。RPO 衡量企业可以容忍多大的数据丢失量,它会影响您需要的系统备份频率。对于 Tableau Server,RPO 不能少于完成 Server 完整备份所需的时间。下表说明了如何规划一系列 RTO 要求:

 

高 RTO

中 RTO

低 RTO

出现中断时获得的新硬件/虚拟机

计算机已预配但当前未运行

始终采用与生产环境相同的配置和拓扑来运行的专用硬件

安装 Tableau Server

已安装 Tableau Server

备份定期还原到 DR 环境

将备份还原到新环境

将最新备份还原到冷备用环境

可以更新外部负载均衡器/DNS 路由,使其指向 DR 环境

几小时或几天

几小时

几分钟

 

无论您是在本地还是在云端托管 Tableau Server,备份过程都是相同的。使用 TSM Backup 命令生成 Tableau Server 的备份,并将该备份还原到新计算机上。不支持生成 Tableau Server 计算机快照,然后在新计算机上进行还原。如需更多信息,请参阅任务关键可靠性,了解高可用性和灾难恢复概念并下载白皮书。

感谢您的反馈!您的反馈已成功提交。谢谢!