计划您的部署

安装和配置 Tableau Server 的单一计算机部署非常简单。本章将使您快速入门。

您需要能够回答的问题

在运行安装程序之前,您必须具有以下问题的答案:

  • 您将如何许可您的安装?

  • 用户将如何向 Tableau Server 进行身份验证?

  • Tableau Server 将如何访问数据源?

  • 您将需要什么硬件?

本章将帮助您回答这些问题。

Tableau Server 许可模式

Tableau Server 短期许可证附带了两种不同的许可证指标:基于用户和基于内核。短期许可证(也称为订阅许可证)允许您在指定的时间期内使用和更新 Tableau Server。

Tableau 提供多种类型基于用户的短期许可证,这些许可证以不同的价位授予一系列能力,同时使组织能够灵活地支付组织中各种类型的用户所需的数据分析和数据可视化能力的费用。

基于用户的指标

基于用户的许可证确切指定对于 Tableau Server 您可以有多少各种类型(Creator、Explorer 或 Viewer(查看者))的指定用户。只要用户总数不超过许可证允许的数值,您就可以利用这些许可证在群集中的一台计算机或多台计算机上部署 Tableau Server。

与 Tableau Server 内容交互(发布、查看、下载等)的每个用户都必须登录服务器。(我们将在后面讨论如何在 Tableau Server 上创建用户身份,以及用户登录方式选项。)单个用户可以在多个站点和项目上工作,甚至可以对不同的站点具有不同的权限。从许可的角度来看,用户只不过是 Tableau Server 上的用户身份。

基于内核的指标

利用基于内核的许可证,您可以在特定数目的 CPU 内核(链接在新窗口中打开)上运行 Tableau Server。对于基于内核的许可,您可以将 Tableau Server 安装在单节点或多节点群集上,只要所有节点的内核总数不超过已获许可的内核数即可。基于内核的许可不会限制系统中的用户帐户数。这可能包括允许与嵌入式视图进行交互但却不必登录到 Tableau Server 来这么做的来宾用户。

使用基于内核的许可模式时,一个重要的考虑事项将是性能,因为一定数量的内核在不影响服务器响应性的情况下只能支持那么多的用户。根据服务器上工作簿的复杂性、数据提取使用量、用户并发性和交互深度,每个内核可以支持 10-100 位用户,并且您仍然可以期待合理的性能。

请注意,如果您打算在虚拟机 (VM) 上安装 Tableau Server,请检查 VM 的规格,这些规格或许可以使用 vCUP 列出。

选择许可证

您选择的许可证的类型取决于用户使用 Tableau Server 的方式。下面是几种情况:

  • 您具有一个小工作组,其中只有少量用户将发布和查看工作簿。在这种情况下,您可能会先使用一个适用于 10(或更多,如果您有更多用户)位用户的许可证。

  • 您有一个小工作组,其中的用户将发布和管理工作簿,但是将向公司中的数百或数千人提供视图。对于这种情况,您或许要先使用一个允许用户数不受限制的基于内核的许可证。

您可以更改使用的许可证指标 — 举例来说,如果您需要支持的用户数量增多,则可以将基于用户的许可证更改为基于内核的许可证。

如果您仍在决定将获得的许可证的类型,请定义您预计的方案,并联系 Tableau(链接在新窗口中打开),以讨论将最能满足您的需求的许可证和指标。您还可以在 Tableau Server 联机帮助中了解更多信息。请参见许可概述(链接在新窗口中打开)

身份存储:使用外部还是本地身份存储?

您必须在安装过程中选择这些模式之一;您无法在以后更改这些身份存储,除非您重新安装 Tableau Server。如果正在与 IT 部门合作,您将需要与负责身份管理的人员联系,来帮助规划和实现您的身份存储模式。您可以让他们参考 Tableau Server 联机帮助中的此身份存储主题来了解详细信息。

您的组织是否运行 Active Directory 或其他 LDAP 目录服务?这些被视为“外部身份存储”。如果组织使用外部身份存储,则您可能也需要将该其与 Tableau Server 一起使用。如果您的组织不使用 Active Directory 或另一个 LDAP 目录服务,您会将 Tableau Server 配置为使用本地身份存储。

您选择的身份存储方法决定了您如何计划用户配置、站点和服务器管理以及数据和客户端访问模型。不支持混合模式功能,在混合模式中,一些用户通过外部目录进行管理,一些通过本地 Tableau 服务器计算机进行管理。如果您的一些用户不在公司的目录服务中并且需要进行访问,则您必须在本地配置和管理所有用户。

本节描述这两种选项以及如何计划任一身份存储模式。您计划进行用户身份验证的方式将指明您管理身份的方式。我们介绍了身份验证的意义,以及 Tableau Server 如何与像 Kerberos、OpenID 和 SAML 等其他身份验证技术集成的基础知识。

什么是身份验证?

身份验证将确认用户的身份:用户是谁。无论何时登录到服务器或网站,您提供的凭据(通常是用户名和密码)都会验证您的身份。

Tableau Server 有其自己的用户标识和身份验证系统,使您能够确定谁能登录到 Tableau Server。在 Tableau 服务器上,必须将访问服务器的每个用户表示为用户身份,即帐户。(实际上,我们已经提到过来宾用户功能,此功能允许匿名用户访问服务器,但是现在,我们不讨论它。)

作为管理员,您将确定想要在 Tableau 中创建这些用户帐户的方式。创建用户并分配权限的过程称为“配置”。配置用户是几个步骤中的第一步,在此步骤中会出现关于使用外部目录与本地身份存储的问题。

得知也可以使用 Tableau 命令行工具 (tabcmd) 或 REST API 来配置用户,您的 IT 部门可能会很高兴。

本地身份存储

如果您要在不运行外部目录的组织中安装 Tableau Server,或者无法连接到外部目录,那么您必须将 Tableau Server 配置为使用本地身份存储。

如果包含本地身份存储的 Tableau Server,则 Tableau Server 将对用户进行身份验证。这意味着,当用户想要访问 Tableau Server 时,Tableau Server 将提示用户输入用户名和密码,并确定是否对他们进行身份验证。

如果配置包含本地身份存储的 Tableau Server,您可以通过以下方法配置用户:在服务器 Web 管理工具中一次一个地创建用户,或者通过 CSV 文件导入用户名和密码。

单点登录:OpenID、SAML 和 Kerberos 身份验证

安装后,您可以使用单点登录 (SSO) 提供程序配置 Tableau Server。利用 SSO,用户不必显式登录到 Tableau Server。而是会重复使用用户已经用于身份验证(例如,通过登录到您的公司网络)的凭据向 Tableau Server 验证用户的身份,并且,用户可跳过在 Tableau Server 中输入用户名和密码的步骤。

Tableau Server 支持以下类型的 SSO 解决方案:OpenID、SAML 和 Kerberos。我们未在本指南中包括有关如何配置任何这些 SSO 解决方案的明确说明。但是,重要的是要了解关于使用 Active Directory、LDAP 目录还是本地身份验证的决定对 SSO 有何影响:

  • OpenID 需要本地身份存储。

  • Kerberos 需要 Windows Active Directory。

  • SAML 使用外部目录或内部身份存储。

有关这些选项的详细信息,请参见本章末尾的链接。

数据访问

在计划 Tableau Server 安装时,您需要考虑用户访问数据的方式,以及 Tableau Server 将如何与那些数据源交互。出于服务器规模调整和硬件计划的目的,这是在此阶段最相关的信息。

数据位于何处?

Tableau 的设计基于以下假设:您在很多地方有数据,并且数据源可以是各种不同类型 - 电子表格、数据库、基于云的存储等。如果您的组织只在一个地方有数据,则您可以通过对该单一数据源进行优化来简化您的 Tableau Server 部署。

然而,如果您的用户将连接到多个不同的数据源,则您将需要确定 Tableau Server 将登录到各种数据源的方式,以及用户需要的由给定数据源所提供的数据“新鲜度”。

数据“新鲜度”和性能

您的用户在 Tableau Desktop 中创建的所有工作簿都先从数据开始。除非用户将要在其计算机上访问本地文件,否则他们应连接到数据源 - 如关系数据库、网络共享中的文件或云中的数据。自助分析的主要目标是提供一种体验,让用户能够进入到实时提出问题和回答问题的创造性流程中。为了启用流程,您的用户需要快速、不间断地访问最相关的数据。

如果数据不完整、过时,或者如果用户必须等待加载数据,则您的组织将不会充分发挥 Tableau 自助分析的潜能。数据新鲜度与性能之间的平衡在很大程度依赖于用户是与实时数据进行交互,还是要使用数据提取。

了解数据提取与实时连接之间的差异

让我们花片刻时间描述一下数据提取与实时连接之间的差异,然后我们会探讨它们的折衷和优点。

Tableau Server 数据提取是从数据源中复制的数据的快照。数据提取可以提供卓越的性能,因为数据提取包含工作簿需要的所有数据。请将数据提取看作是加载到 Tableau Server 的数据的缓存,用于快速查询、分析和呈现。

另一个选项是实时连接。将 Tableau 数据源配置为使用实时连接时,Tableau Server 会对数据源运行查询并缓存数据。这意味着当用户请求数据时,始终可以提供新鲜的数据。您可以配置此缓存的保留时长,或者配置在用户每次加载使用实时数据的视图时是否应该刷新缓存。

当用户将工作簿发布到 Tableau Server 时,他们可以选择想要该工作簿访问数据源的方式:

  • 提取数据并随工作簿一起将数据打包为 .twbx 文件,然后发布打包的工作簿。当其他用户在 Tableau Server 上查看已发布的工作簿时,Tableau Server 会使用嵌入式数据提取来呈现视图。在这种情况下,每个工作簿都具有它自己的数据提取,即使不同的工作簿一开始就连接到同一数据库或其他来源也不例外。可以(由用户)手动或(按计划)自动刷新数据提取。

  • 提取数据并将数据提取发布到服务器作为保存的数据源。当其他用户在 Tableau Server 上查看文件时,服务器将使用在该服务器上托管和管理的数据提取来呈现视图。在这种情况下,您可以将 Tableau Server 配置为手动或按计划从基础数据源中刷新数据提取。通过在 Tableau Server 上将数据作为数据提取来托管,可以减少重复并减少到基础源数据库的流量。服务器将缓存单一重复使用的数据提取,后来的 Viewer(查看者)加载该数据提取要快得多。

  • 使用实时数据连接。如果发布一个使用实时连接的工作簿,则会创建一个 Tableau Server 数据源。数据源配置包括一个指向数据源的指针,并且可以在数据源中包括作者的嵌入式(和加密型)凭据。或者,工作簿作者可以不在工作簿中包含其凭据。在这种情况下,其他用户打开工作簿时必须输入凭据,然后工作簿才会连接到数据源;或者数据源可以使用 Tableau Server 帐户(运行身份服务帐户)。

在数据新鲜度上下文中,最新数据将由数据源实时连接来提供。然而,如果有大量的数据、数据需要复杂的查询、数据库运行缓慢,或者数据不经常改变,则性能通常比数据提取更好。如果用户使用数据提取,则建议您创建数据提取刷新计划。

何时使用数据提取

  • 用户需要深入分析存储在传统数据库上或者存储在高度延迟或负担过重的数据资源上的大量数据。

  • 用户需要脱机访问数据,例如当他们在异地旅行或呈现时。

  • 用户将制定不依赖于实时数据的分析决策。

  • 用户需要处理合并自多个来源的数据。

  • 用户将要使用小型数据集对分析进行原型设计。这可以保持快速进行开发,并且可以减少网络和数据库的负荷。(当他们完成开发时,他们可以切换到实时连接。)

作为 Tableau Server 管理员,您可以创建数据提取刷新计划。在刷新过程中,Tableau Server 会查询实时数据源,并使用最新版本的数据更新数据提取。对数据提取刷新频率的唯一实际限制就是基础数据源的性能 - 即,运行更新数据提取所需的查询所能达到的速度。(一般情况下,建议您将数据提取刷新工作安排在下班时间进行,因为刷新工作可能会耗用大量 CPU。)

何时使用实时连接

  • 您的用户需要最新或实时数据做出业务决策。

  • 您有专门用于执行 Tableau Server 分析的数据库硬件。数据库的查询负荷基本上是工作簿复杂度的函数。对于复杂的工作簿,传统关系数据库的查询负荷可能很明显,因为计算工作会转移到数据库。

  • 您在为实时分析而优化的数据库中托管数据。大多数大数据和云数据库解决方案旨在进行实时的特殊分析。诸如 Hadoop 之类的其他解决方案可能不发达并且可能具有不同的性能结果,具体取决于像数据大小、连接方法和配置等因素。

操作系统要求

支持 Linux 的以下发行版:

  • Red Hat Enterprise Linux (RHEL) 7.3 及更高版本(非 8.x),以及 Amazon Linux 2

  • CentOS 7.3 及更高版本(非 8.x)

  • Oracle Linux 7.3 及更高版本(非 8.x)

  • Ubuntu 16.04 LTS 和 18.04 LTS 的最新版本(非 17.04)

  • Debian 9

有关 Linux 发行版的其他说明:

  • Red Hat Enterprise Linux (RHEL)、CentOS、Oracle Linux 和 Amazon Linux 发行版在本文档中统称为类似于 RHEL 的发行版。

  • 不支持 RHEL 8。

  • 不支持 Ubuntu 的非 LTS 版本。

  • 不支持 Ubuntu 版本 17.04。

  • 不支持以前版本的 CentOS 和 Ubuntu,因为 Tableau Server 需要 systemd 来管理进程。

  • 文件后缀名为 .deb 的安装程序版本安装在 Ubuntu 和 Debian 分发版上。

  • 不支持自定义内核。

硬件要求

您将需要哪种服务器硬件?若要安装 Tableau Server,您的计算机必须满足最低硬件要求(链接在新窗口中打开)。如果要在其中进行安装的计算机未满足这些要求,则安装程序无法运行。

以上链接中指定的最低硬件要求真的只建议用于试用和可行性测试用途。不建议在只满足最低要求的生产环境中运行 Tableau Server。我们具有取而代之的硬件最低要求建议

安装类型

处理器

CPU

RAM

可用磁盘空间

单节点

  • 64 位
  • 必须支持 SSE4.2 和 POPCNT 指令集
  • 不支持基于 ARM 的处理器

8 核,2.0 GHz 或更高频率

32 GB

50 GB

如果要将 Tableau Prep Conductor 添加到 Tableau Server 安装,我们建议您添加另一个节点,并将其专用于运行 Tableau Server Prep Conductor。此节点应至少有 4 个内核(8 个 vCPU)和 16 GB RAM。

多节点和企业部署

请与 Tableau 联系以获得技术指导。

节点必须满足或超过最低硬件推荐配置,但以下情况除外:

  • 运行后台程序的节点,其中 4 个内核是可接受的。

  • 专用于 Tableau Prep Conductor 的节点:最少 4 个内核(8 个 vCPU)和 16 GB RAM。

重要信息:在初始化 TSM 之前,无法检查磁盘空间要求。如果您没有足够的空间,则直到安装 Tableau Server 软件包之后才会告诉您。

50 GB 可用磁盘空间,最少为 /opt 目录分配 15 GB,其余分配给用于数据存储的 /var 目录。

  • 可用磁盘空间在 Tableau Server 安装程序解压缩之后计算而得。安装程序使用约 1 GB 空间。您可能需要分配额外的磁盘空间,具体情况视各种因素(比如您是否将使用数据提取)而定。

    Tableau Server 核心程序必须安装在至少具有 15 GB 可用磁盘空间的目录中。如果尝试在没有足够空间的计算机上安装 Tableau Server,Tableau Server 软件包将会安装,但您将无法继续执行安装程序。默认情况下,安装位置为 /opt 目录。在 RHEL 发行版上,您可以更改 Tableau Server 的安装路径。

    如果打算大量使用数据提取,则您可能需要分配额外的磁盘空间。您可以在安装过程中为数据(数据提取)存储指定其他目录。

  • 内核数基于“物理”内核。物理内核可能表示实际服务器硬件或虚拟机 (VM) 上的内核。出于计算内核数的目的,将忽略超线程。

  • 显示的 RAM 是单节点安装的最低推荐配置。举例来说,根据活动、用户数以及后台作业,RAM 越多,您的安装运行得就更好。

理想情况下,您可以专门使计算机只承载 Tableau Server。例如,为了获得最佳性能,承载 Tableau Server 的计算机也不应该运行其他应用程序,或者不应该运行整个防病毒扫描解决方案。我们也不鼓励在同一台计算机上运行其他数据库。如果您的服务器计算机也需要运行其他应用程序,在计划服务器能力大小时,您需要考虑这些应用程序的共享资源负荷。

为了确定推荐的最低硬件配置是否将适合您的目标,请考虑您的用户将与 Tableau Server 交互的方式。本指南假定您要为多达 100 位用户的用户群安装 Tableau Server。然而,硬件要求在更大程度上将取决于同时存在的有效用户(也称为并发用户)数。要求还取决于请求 Tableau Server 刷新这些用户做出业务决策所依赖的数据提取的频率。

我们的最低硬件要求建议应该适用于多达 10 位有效用户同时在 Tableau Server 上与内容进行交互的单服务器安装。此建议还假定了全部安排在下班时间进行的低频率数据提取刷新。

如果这听起来像是您的情况,则跳过本节的其余部分,然后设置硬件并继续执行运行安装程序

如果您不确定最低硬件建议是否满足您的需求,请阅读本节的其余部分,以获取有关如何确定部署的正确硬件规格的指导。

硬件升级

本节重点讲述何时可能应该根据少数关键变量考虑增加必要的硬件资源以针对特定的使用量配置文件进行优化。

繁忙的工作簿处理

如果您预计与服务器上的内容进行交互的同时存在的有效用户数会超过 10 位,或者这些用户全部都与实时连接进行交互,请考虑将服务器的 RAM 增加到 64 GB。此外,请考虑将流行数据源转换为数据提取,在这种情况下,具有 64 GB RAM 的安装通常可为多达 60 位同时存在的有效用户提供服务。

频繁的数据提取刷新

正如上一节中所述,访问 Tableau 内容的用户经常与在服务器上提取和管理的数据进行交互。可以为每个数据源配置 Tableau Server 刷新这些数据提取的频率。建议尽可能在非工作时间运行计划的数据提取,但对于任务关键型数据而言,这并非总是可行。

每个数据提取刷新进程都会耗用整个处理器进程,并且非常占用 RAM。数据提取刷新得越频繁,就应该添加越多的内核和 RAM 以专门用于数据提取刷新进程。特别是在默认的服务器配置中,如果您希望同时计划多个数据提取刷新,则在释放内核和后台程序进程之前,这些数据提取刷新将按顺序进行并排队。如果需要同时刷新多个数据提取,则应该将 Tableau Server 配置为使用两个或更多个后台程序进程。有关这方面的详细信息,请参见本章末尾的链接。

我们推荐的最低硬件假定您将在非工作时间刷新您的绝大部分数据提取。此方法被认为是低刷新数据使用量配置文件

中等数据刷新使用量配置文件是指每小时刷新一次数据提取。在这种情况下,建议内核数至少为 16,RAM 至少为 128 GB。

如果您的数据提取超过 500 个,或者您刷新数据提取以支持实时数据分析,那么这被认为是高数据刷新使用量配置文件。这种情况将超出本指南的范围,您应该与 Tableau 顾问一起设计您的部署。

Tableau Server 上承载的数据提取越多,您的计算机就需要越多的物理硬盘空间。集中管理的数据提取会减少重复数据,重复数据在具有打包数据的工作簿中很常见。

请转到运行安装程序继续。

其他资源

感谢您的反馈!