计划您的部署

安装和配置 Tableau Server 的单一计算机部署非常简单。本章将使您快速入门。

您需要能够回答的问题

在运行安装程序之前,您必须具有以下问题的答案:

  • 您将如何许可您的安装?

  • 用户将如何向 Tableau Server 进行身份验证?

  • Tableau Server 将如何访问数据源?

  • 您将需要什么硬件?

本章将帮助您回答这些问题。

Tableau Server 许可模式

Tableau Server 短期许可证附带了两种不同的许可证指标:基于用户和基于内核。短期许可证(也称为订阅许可证)允许您在指定的时间期内使用和更新 Tableau Server。

Tableau 提供多种类型基于用户的短期许可证,这些许可证以不同的价位授予一系列能力,同时使组织能够灵活地支付组织中各种类型的用户所需的数据分析和数据可视化能力的费用。

基于用户的指标

基于用户的许可证确切指定对于 Tableau Server 您可以有多少各种类型(Creator、Explorer 或 Viewer(查看者))的指定用户。只要用户总数不超过许可证允许的数值,您就可以利用这些许可证在群集中的一台计算机或多台计算机上部署 Tableau Server。

与 Tableau Server 内容交互(发布、查看、下载等)的每个用户都必须登录服务器。(我们将在后面讨论如何在 Tableau Server 上创建用户身份,以及用户登录方式选项。)单个用户可以在多个站点和项目上工作,甚至可以对不同的站点具有不同的权限。从许可的角度来看,用户只不过是 Tableau Server 上的用户身份。

基于内核的指标

利用基于内核的许可证,您可以在特定数目的 CPU 内核(Link opens in a new window)上运行 Tableau Server。对于基于内核的许可,您可以将 Tableau Server 安装在单节点或多节点群集上,只要所有节点的内核总数不超过已获许可的内核数即可。基于内核的许可不会限制系统中的用户帐户数。这可能包括允许与嵌入式视图进行交互但却不必登录到 Tableau Server 来这么做的来宾用户。

使用基于内核的许可模式时,一个重要的考虑事项将是性能,因为一定数量的内核在不影响服务器响应性的情况下只能支持那么多的用户。根据服务器上工作簿的复杂性、数据提取使用量、用户并发性和交互深度,每个内核可以支持 10-100 位用户,并且您仍然可以期待合理的性能。

请注意,如果您打算在虚拟机 (VM) 上安装 Tableau Server,请检查 VM 的规格,这些规格或许可以使用 vCUP 列出。

选择许可证

您选择的许可证的类型取决于用户使用 Tableau Server 的方式。下面是几种情况:

  • 您具有一个小工作组,其中只有少量用户将发布和查看工作簿。在这种情况下,您可能会先使用一个适用于 10(或更多,如果您有更多用户)位用户的许可证。

  • 您有一个小工作组,其中的用户将发布和管理工作簿,但是将向公司中的数百或数千人提供视图。对于这种情况,您或许要先使用一个允许用户数不受限制的基于内核的许可证。

您可以更改使用的许可证指标 — 举例来说,如果您需要支持的用户数量增多,则可以将基于用户的许可证更改为基于内核的许可证。

如果您仍在决定将获得的许可证的类型,请定义您预计的方案,并联系 Tableau(Link opens in a new window),以讨论将最能满足您的需求的许可证和指标。您还可以在 Tableau Server 联机帮助中了解更多信息。请参见许可概述(Link opens in a new window)

身份存储:使用外部还是本地身份存储?

您必须在安装过程中选择这些模式之一;您无法在以后更改这些身份存储,除非您重新安装 Tableau Server。如果正在与 IT 部门合作,您将需要与负责身份管理的人员联系,来帮助规划和实现您的身份存储模式。您可以让他们参考 Tableau Server 联机帮助中的此身份存储主题来了解详细信息。

您的组织是否运行 Active Directory 或其他 LDAP 目录服务?这些被视为“外部身份存储”。如果组织使用外部身份存储,则您可能也需要将该其与 Tableau Server 一起使用。如果您的组织不使用 Active Directory 或另一个 LDAP 目录服务,您会将 Tableau Server 配置为使用本地身份存储。

您选择的身份存储方法决定了您如何计划用户配置、站点和服务器管理以及数据和客户端访问模型。不支持混合模式功能,在混合模式中,一些用户通过外部目录进行管理,一些通过本地 Tableau 服务器计算机进行管理。如果您的一些用户不在公司的目录服务中并且需要进行访问,则您必须在本地配置和管理所有用户。

本节描述这两种选项以及如何计划任一身份存储模式。您计划进行用户身份验证的方式将指明您管理身份的方式。我们介绍了身份验证的意义,以及 Tableau Server 如何与像 Kerberos、OpenID 和 SAML 等其他身份验证技术集成的基础知识。

什么是身份验证?

身份验证将确认用户的身份:用户是谁。无论何时登录到服务器或网站,您提供的凭据(通常是用户名和密码)都会验证您的身份。

Tableau Server 有其自己的用户标识和身份验证系统,使您能够确定谁能登录到 Tableau Server。在 Tableau 服务器上,必须将访问服务器的每个用户表示为用户身份,即帐户。(实际上,我们已经提到过来宾用户功能,此功能允许匿名用户访问服务器,但是现在,我们不讨论它。)

作为管理员,您将确定想要在 Tableau 中创建这些用户帐户的方式。创建用户并分配权限的过程称为“配置”。配置用户是几个步骤中的第一步,在此步骤中会出现关于使用外部目录与本地身份存储的问题。

得知也可以使用 Tableau 命令行工具 (tabcmd) 或 REST API 来配置用户,您的 IT 部门可能会很高兴。

本地身份存储

如果您要在不运行外部目录的组织中安装 Tableau Server,或者无法连接到外部目录,那么您必须将 Tableau Server 配置为使用本地身份存储。

如果包含本地身份存储的 Tableau Server,则 Tableau Server 将对用户进行身份验证。这意味着,当用户想要访问 Tableau Server 时,Tableau Server 将提示用户输入用户名和密码,并确定是否对他们进行身份验证。

如果配置包含本地身份存储的 Tableau Server,您可以通过以下方法配置用户:在服务器 Web 管理工具中一次一个地创建用户,或者通过 CSV 文件导入用户名和密码。

单点登录:OpenID、SAML 和 Kerberos 身份验证

安装后,您可以使用单点登录 (SSO) 提供程序配置 Tableau Server。利用 SSO,用户不必显式登录到 Tableau Server。而是会重复使用用户已经用于身份验证(例如,通过登录到您的公司网络)的凭据向 Tableau Server 验证用户的身份,并且,用户可跳过在 Tableau Server 中输入用户名和密码的步骤。

Tableau Server 支持以下类型的 SSO 解决方案:OpenID、SAML 和 Kerberos。我们未在本指南中包括有关如何配置任何这些 SSO 解决方案的明确说明。但是,重要的是要了解关于使用 Active Directory、LDAP 目录还是本地身份验证的决定对 SSO 有何影响:

  • OpenID 需要本地身份存储。

  • Kerberos 需要 Windows Active Directory。

  • SAML 使用外部目录或内部身份存储。

有关这些选项的详细信息,请参见本章末尾的链接。

数据访问

运行安装程序之前需要考虑的另一个因素是数据访问。了解您的用户将如何访问数据对于以下部署变量很重要:

  • 运行身份服务帐户。运行身份服务帐户是 Tableau Server 在访问服务器上的资源时使用的 Windows 帐户(“运行身份”)。例如,Tableau Server 会读写安装了 Tableau Server 的计算机上的文件。从 Windows 的角度来看,Tableau Server 执行此操作使用的是运行身份服务帐户。

    默认情况下,运行身份服务帐户已设置为称为网络服务的本地帐户。对于某些情况,通常是简单情况,这没有问题。然而,Tableau Server 通常必须访问外部数据源,如关系数据库、网络共享或云数据。Tableau Server 将尝试以运行身份服务帐户访问这些资源,因此该帐户必须具有对这些资源的权限。

  • 硬件计划。硬件计划中的一个重要因素是预计 Tableau Server 将访问、存储、提供和管理数据的方式。下一节讨论 Tableau Server 管理数据的方式,以及该管理方式对您的服务器配置计划方式可能产生的影响。

数据位于何处?

Tableau 的设计基于以下假设:您在很多地方有数据,并且数据源可以是各种不同类型 - 电子表格、数据库、基于云的存储等。如果您的组织只在一个地方有数据,则您可以通过对该单一数据源进行优化来简化您的 Tableau Server 部署。

然而,如果您的用户将连接到多个不同的数据源,则您将需要确定 Tableau Server 将登录到各种数据源的方式,以及用户需要的由给定数据源所提供的数据“新鲜度”。

数据“新鲜度”和性能

您的用户在 Tableau Desktop 中创建的所有工作簿都先从数据开始。除非用户将要在其计算机上访问本地文件,否则他们应连接到数据源 - 如关系数据库、网络共享中的文件或云中的数据。自助分析的主要目标是提供一种体验,让用户能够进入到实时提出问题和回答问题的创造性流程中。为了启用流程,您的用户需要快速、不间断地访问最相关的数据。

如果数据不完整、过时,或者如果用户必须等待加载数据,则您的组织将不会充分发挥 Tableau 自助分析的潜能。数据新鲜度与性能之间的平衡在很大程度依赖于用户是与实时数据进行交互,还是要使用数据提取。

了解数据提取与实时连接之间的差异

让我们花片刻时间描述一下数据提取与实时连接之间的差异,然后我们会探讨它们的折衷和优点。

Tableau Server 数据提取是从数据源中复制的数据的快照。数据提取可以提供卓越的性能,因为数据提取包含工作簿需要的所有数据。请将数据提取看作是加载到 Tableau Server 的数据的缓存,用于快速查询、分析和呈现。

另一个选项是实时连接。将 Tableau 数据源配置为使用实时连接时,Tableau Server 会对数据源运行查询并缓存数据。这意味着当用户请求数据时,始终可以提供新鲜的数据。您可以配置此缓存的保留时长,或者配置在用户每次加载使用实时数据的视图时是否应该刷新缓存。

当用户将工作簿发布到 Tableau Server 时,他们可以选择想要该工作簿访问数据源的方式:

  • 提取数据并随工作簿一起将数据打包为 .twbx 文件,然后发布打包的工作簿。当其他用户在 Tableau Server 上查看已发布的工作簿时,Tableau Server 会使用嵌入式数据提取来呈现视图。在这种情况下,每个工作簿都具有它自己的数据提取,即使不同的工作簿一开始就连接到同一数据库或其他来源也不例外。可以(由用户)手动或(按计划)自动刷新数据提取。

  • 提取数据并将数据提取发布到服务器作为保存的数据源。当其他用户在 Tableau Server 上查看文件时,服务器将使用在该服务器上托管和管理的数据提取来呈现视图。在这种情况下,您可以将 Tableau Server 配置为手动或按计划从基础数据源中刷新数据提取。通过在 Tableau Server 上将数据作为数据提取来托管,可以减少重复并减少到基础源数据库的流量。服务器将缓存单一重复使用的数据提取,后来的 Viewer(查看者)加载该数据提取要快得多。

  • 使用实时数据连接。如果发布一个使用实时连接的工作簿,则会创建一个 Tableau Server 数据源。数据源配置包括一个指向数据源的指针,并且可以在数据源中包括作者的嵌入式(和加密型)凭据。或者,工作簿作者可以不在工作簿中包含其凭据。在这种情况下,其他用户打开工作簿时必须输入凭据,然后工作簿才会连接到数据源;或者数据源可以使用 Tableau Server 帐户(运行身份服务帐户)。

在数据新鲜度上下文中,最新数据将由数据源实时连接来提供。然而,如果有大量的数据、数据需要复杂的查询、数据库运行缓慢,或者数据不经常改变,则性能通常比数据提取更好。如果用户使用数据提取,则建议您创建数据提取刷新计划。

何时使用数据提取

  • 用户需要深入分析存储在传统数据库上或者存储在高度延迟或负担过重的数据资源上的大量数据。

  • 用户需要脱机访问数据,例如当他们在异地旅行或呈现时。

  • 用户将制定不依赖于实时数据的分析决策。

  • 用户需要处理合并自多个来源的数据。

  • 用户将要使用小型数据集对分析进行原型设计。这可以保持快速进行开发,并且可以减少网络和数据库的负荷。(当他们完成开发时,他们可以切换到实时连接。)

作为 Tableau Server 管理员,您可以创建数据提取刷新计划。在刷新过程中,Tableau Server 会查询实时数据源,并使用最新版本的数据更新数据提取。对数据提取刷新频率的唯一实际限制就是基础数据源的性能 - 即,运行更新数据提取所需的查询所能达到的速度。(一般情况下,建议您将数据提取刷新工作安排在下班时间进行,因为刷新工作可能会耗用大量 CPU。)

何时使用实时连接

  • 您的用户需要最新或实时数据做出业务决策。

  • 您有专门用于执行 Tableau Server 分析的数据库硬件。数据库的查询负荷基本上是工作簿复杂度的函数。对于复杂的工作簿,传统关系数据库的查询负荷可能很明显,因为计算工作会转移到数据库。

  • 您在为实时分析而优化的数据库中托管数据。大多数大数据和云数据库解决方案旨在进行实时的特殊分析。诸如 Hadoop 之类的其他解决方案可能不发达并且可能具有不同的性能结果,具体取决于像数据大小、连接方法和配置等因素。

数据源身份验证和运行身份服务帐户

您的 Tableau Server 实例必须连接到外部数据源(除非您的所有用户将在其工作簿中保存和嵌入数据提取)。

Tableau Server 可以连接到 40 多个不同的数据源。所有数据源都要求进行某种身份验证才能访问。虽然每个来源及其身份验证方案的完整叙述不在本文档范围之内,但是我们就 Tableau Server 如何连接到数据源进行一些归纳总结。

此练习的重点是让您确定配置为本地网络服务帐户的默认运行身份服务帐户是否将满足您的需求。对于很多客户来说,默认的网络服务帐户没有足够的权限,无法访问其用户所需的数据。因此,必须用 Active Directory 域帐户更新运行身份服务帐户。

默认情况下,运行身份服务帐户已设置为称为网络服务的本地帐户。以下情况下使用默认网络服务帐户:

  • 对 Tableau Server 使用本地身份验证。

  • 组织中的所有用户都在要上载到 Tableau Server 的工作簿中包括提取的数据。

  • 您的用户通过 Tableau Server 访问的外部数据源不需要 Windows NT 集成安全性或 Kerberos。在大多数数据访问方案中,Microsoft SQL Server、MSAS、Teradata 和 Oracle 数据库需要 Windows NT 集成安全性。

了解 Tableau Server 用于用户运行身份的帐户的安全含义很重要。具体而言,如果 Tableau Server 必须访问组织中的其他服务器、文件共享或数据库,则为用户运行身份配置的帐户将用于访问这些资源。为用户运行身份配置的帐户还必须具有本地 Tableau Server 计算机的提升权限。一般的最佳安全做法是将所有用户帐户的范围局限于所需的最低权限。当您计划将配置为用户运行身份的帐户时,我们会向您提供同样的建议。

网络共享上的文件

驻留在网络共享上且配置为实时数据连接的数据(诸如 CSV 和 Excel 文件之类的文件)通过运行身份服务帐户来访问。

虽然网络服务帐户可用于访问同一 Active Directory 域中远程计算机上的资源,但是我们不建议对这种情况使用默认帐户。如果 Tableau Server 必须连接到组织中网络共享上的文件,则改为配置用户运行身份的域帐户。

关系数据库和云数据

许多关系数据库不需要用户运行身份凭据进行身份验证。云数据源也是如此。而用户通常使用其自己的凭据访问这些数据源,或者作为管理员的您可以在 Tableau Server 中的数据源配置上设置凭据。

这就是说,只有为服务器配置运行身份服务帐户时,Tableau Server 才能访问某些关系数据库(例如 Microsoft SQL 和 MSAS)。当用户发布工作簿时,许多数据库允许用户指定运行身份服务帐户。

Kerberos 委派(通常配置有 Microsoft SQL Server)需要作为域成员的运行身份服务帐户。因此,您必须更改默认的运行身份服务帐户。

运行身份服务帐户准则

如果在绝大多数数据源在 Active Directory 上下文中进行身份验证的环境中操作,则可能需要将用户运行身份配置为使用域帐户,而不是使用默认的本地网络服务帐户。您可以随时更新用户运行身份,但考虑到此帐户对于 Tableau Server 的正常运行是如此之重要,我们建议在部署过程中适当地对其进行设置。

在安装 Tableau Server 之前,您应该创建一个将配置为运行身份服务帐户的域用户帐户。

对于将为用户运行身份创建的帐户,请遵循以下准则:

  • 如果要向管理 Active Directory 中的用户的 IT 专业人员请求帐户,则告诉此人您需要 Tableau Server 服务帐户。“服务帐户”是适用于用户运行身份所表示的帐户类型的 IT 行话:这是服务进行身份验证以及访问网络上的资源所使用的帐户。

  • 在 Active Directory 中针对 Tableau Server 运行身份服务帐户创建专用帐户。换言之,不要使用现有帐户。通过使用专用帐户,您可以确保只能通过 Tableau Server 用户运行身份来访问您针对 Tableau Server 授权的数据资源。

  • 请不要使用具有任何类型域管理权限的帐户。事实上,当您在 Active Directory 中创建帐户时,就会创建域用户。请不要将您创建的帐户添加到不必提升帐户权限的任何 Active Directory 安全组中。

  • 为这一个帐户授予目录中数据源的权限。如前所述,将用于用户运行身份的帐户只需要适当数据源和网络共享的读取访问权限。

  • 请记下为此帐户设置的密码过期时间。创建日历或任务事件以便提醒您更改密码。每当更新用户帐户密码时,您都需要在“服务器配置”中更新密码。

  • 当您运行安装程序并指定运行身份服务帐户时,TabAdmin 进程将对运行 Tableau Server 的计算机上的用户授予权限。在某些情况下,您可能需要设置附加权限。运行安装程序一章中描述了这些情况。

操作系统要求

支持以下 64 位 Microsoft Windows Server 操作系统:

  • Windows Server 2012

  • Windows Server 2012 R2

  • Windows Server 2016

  • Windows Server 2019

硬件要求

您将需要哪种服务器硬件?若要安装 Tableau Server,您的计算机必须满足最低硬件要求(Link opens in a new window)。如果要在其中进行安装的计算机未满足这些要求,则安装程序无法运行。

以上链接中指定的最低硬件要求真的只建议用于试用和可行性测试用途。不建议在只满足最低要求的生产环境中运行 Tableau Server。我们具有取而代之的硬件最低要求建议

安装类型

处理器

CPU

RAM

可用磁盘空间

单节点

  • 64 位(x64 芯片组)
  • 必须支持 SSE4.2 和 POPCNT 指令集
  • 不支持基于 ARM 的处理器

8 核,2.0 GHz 或更高频率

32 GB

50 GB

如果要将 Tableau Prep Conductor 添加到 Tableau Server 安装,我们建议您添加另一个节点,并将其专用于运行 Tableau Server Prep Conductor。此节点应至少有 4 个内核(8 个 vCPU)和 16 GB RAM。

多节点和企业部署

请与 Tableau 联系以获得技术指导。

节点必须满足或超过最低硬件推荐配置,但以下情况除外:

  • 运行后台程序的节点,其中 4 个内核是可接受的。

  • 专用于 Tableau Prep Conductor 的节点:最少 4 个内核(8 个 vCPU)和 16 GB RAM。

重要信息:在初始化 TSM 之前,无法检查磁盘空间要求。

  • 可用磁盘空间在 Tableau Server 安装程序解压缩之后计算而得。安装程序使用约 1 GB 空间。您可能需要分配额外的磁盘空间,具体情况视各种因素(比如您是否将使用数据提取)而定。

  • 外部文件存储的网络附加存储空间要求:如果计划将 Tableau Server 配置为包含外部文件存储,则需要估计专用于网络附加存储的存储空间。

    估算存储空间:必须考虑发布和刷新数据提取所需的存储空间。此外,还必须考虑存储库备份的大小,除非您按照选项 2:单独备份存储库主题中的描述特别选择了单独进行存储库备份的选项。

    • 数据提取:
      • 考虑将发布到 Tableau Server 的数据提取的数量,以及每个数据提取的大小。通过将若干数据提取发布到 Tableau Server 并随后检查使用的磁盘空间来测试您的需求。您可以使用这一磁盘空间量来帮助您算出一段时间内有多少数据提取将发布到 Tableau Server,以及每个现有数据提取的大小将如何增长。
      • 考虑数据提取刷新期间临时目录所需的空间。在刷新期间存储数据提取的临时目录需要的磁盘空间可能最多要比数据提取的最终文件大小大三倍。

    • 存储库备份:
      • 若要获取存储库数据的估计值,请检查 <data directory>/pgsql/data/base 目录的大小。

      • 若要获取存储库数据的确切大小,请打开备份文件并使用 workgroup.pg_dump 文件的大小。
  • 内核数基于“物理”内核。物理内核可能表示实际服务器硬件或虚拟机 (VM) 上的内核。出于计算内核数的目的,将忽略超线程。

  • 显示的 RAM 是单节点安装的最低推荐配置。举例来说,根据活动、用户数以及后台作业,RAM 越多,您的安装运行得就更好。

理想情况下,您可以专门使计算机只承载 Tableau Server。例如,为了获得最佳性能,承载 Tableau Server 的计算机也不应该运行其他应用程序,或者不应该运行整个防病毒扫描解决方案。我们也不鼓励在同一台计算机上运行其他数据库。如果您的服务器计算机也需要运行其他应用程序,在计划服务器能力大小时,您需要考虑这些应用程序的共享资源负荷。

为了确定推荐的最低硬件配置是否将适合您的目标,请考虑您的用户将与 Tableau Server 交互的方式。本指南假定您要为多达 100 位用户的用户群安装 Tableau Server。然而,硬件要求在更大程度上将取决于同时存在的有效用户(也称为并发用户)数。要求还取决于请求 Tableau Server 刷新这些用户做出业务决策所依赖的数据提取的频率。

我们的最低硬件要求建议应该适用于多达 10 位有效用户同时在 Tableau Server 上与内容进行交互的单服务器安装。此建议还假定了全部安排在下班时间进行的低频率数据提取刷新。

如果这听起来像是您的情况,则跳过本节的其余部分,然后设置硬件并继续执行运行安装程序

如果您不确定最低硬件建议是否满足您的需求,请阅读本节的其余部分,以获取有关如何确定部署的正确硬件规格的指导。

硬件升级

本节重点讲述何时可能应该根据少数关键变量考虑增加必要的硬件资源以针对特定的使用量配置文件进行优化。

繁忙的工作簿处理

如果您预计与服务器上的内容进行交互的同时存在的有效用户数会超过 10 位,或者这些用户全部都与实时连接进行交互,请考虑将服务器的 RAM 增加到 64 GB。此外,请考虑将流行数据源转换为数据提取,在这种情况下,具有 64 GB RAM 的安装通常可为多达 60 位同时存在的有效用户提供服务。

频繁的数据提取刷新

正如上一节中所述,访问 Tableau 内容的用户经常与在服务器上提取和管理的数据进行交互。可以为每个数据源配置 Tableau Server 刷新这些数据提取的频率。建议尽可能在非工作时间运行计划的数据提取,但对于任务关键型数据而言,这并非总是可行。

每个数据提取刷新进程都会耗用整个处理器进程,并且非常占用 RAM。数据提取刷新得越频繁,就应该添加越多的内核和 RAM 以专门用于数据提取刷新进程。特别是在默认的服务器配置中,如果您希望同时计划多个数据提取刷新,则在释放内核和后台程序进程之前,这些数据提取刷新将按顺序进行并排队。如果需要同时刷新多个数据提取,则应该将 Tableau Server 配置为使用两个或更多个后台程序进程。有关这方面的详细信息,请参见本章末尾的链接。

我们推荐的最低硬件假定您将在非工作时间刷新您的绝大部分数据提取。此方法被认为是低刷新数据使用量配置文件

中等数据刷新使用量配置文件是指每小时刷新一次数据提取。在这种情况下,建议内核数至少为 16,RAM 至少为 128 GB。

如果您的数据提取超过 500 个,或者您刷新数据提取以支持实时数据分析,那么这被认为是高数据刷新使用量配置文件。这种情况将超出本指南的范围,您应该与 Tableau 顾问一起设计您的部署。

Tableau Server 上承载的数据提取越多,您的计算机就需要越多的物理硬盘空间。集中管理的数据提取会减少重复数据,重复数据在具有打包数据的工作簿中很常见。

请转到运行安装程序继续。

其他资源

感谢您的反馈!