从初始节点故障中恢复

您在其上安装 Tableau 的第一台计算机(“初始节点”)有一些独特的特性。有两个进程只能在初始节点上运行,无法转移到任何其他节点(出现故障的情况下除外),即许可证服务(许可证管理器)和 TSM 控制器(管理控制器)。

还有两个其他进程最初包括在初始节点上,但可添加或转移到其他节点,即 CFS(客户端文件服务)和协调服务。

如果初始节点存在问题,并且您在其他节点上有冗余进程,Tableau Server 可继续运行长达 72 小时,之后缺少许可服务的问题才会对其他进程产生影响。在初始节点出现故障后,您的用户可继续登录并且查看和使用其内容,但您将无法重新配置 Tableau Server,原因是您没有管理控制器的访问权限。这意味着,您应特别注意要尽快将两个独有的进程转移到另一个正在运行的节点。如果初始节点因为在相对短的时间内可恢复的原因(例如,您可纠正的硬件故障)而出现故障,您应首先尝试在不使用下面的过程的情况下恢复节点。

注意:本文中的步骤要求服务器停机并可能有破坏性,因此只应在初始节点发生灾难性故障时使用。如果无法让初始节点再次恢复运行,请使用下面的步骤将关键 TSM 进程转移到群集中的另一个节点。

Tableau 包括一个脚本,可自动将这些进程移到您的其他现有节点之一,使您能恢复对 TSM 的访问并保持 Tableau Server 运行。根据您的安装如何配置为包含 CFS 和协调服务,您可能还需要执行步骤来重新部署这些服务。

一般要求

  • 如果初始节点只运行客户端文件服务 (CFS) 的实例,您需要将该进程添加到另一个节点。Tableau Server 至少需要一个 CFS 实例。有关详细信息,请参见配置客户端文件服务
  • 在设置多节点 Tableau Server 安装过程中,您应该已部署一个协调服务整体。以下过程假定在初始节点出现问题之前部署了一个协调整体。有关部署协调服务整体的详细信息,请参阅部署协调服务整体

注意:此操作包括可能需要使用 TSM 命令行执行的步骤。若要使用 TSM CLI,您需要在安装中的一个节点上对命令行具有管理员访问权限,并需要 TSM 管理员凭据来运行 TSM 命令。

将 TSM 控制器和许可证服务移到另一个节点

如果初始节点出现问题,则需要在另一个节点上启动 TSM 控制器和许可服务。请按照以下步骤使控制器和许可服务在另一个节点上工作。

  1. 在仍然工作的节点上,运行控制器恢复脚本。为此,请打开命令提示符,导航到 Tableau Server 的脚本目录 (默认情况下:C:\Program Files\Tableau\Tableau Server\packages\scripts.<version_code>\ ),并键入以下命令:

    move-tsm-controller -n <nodeID>

    其中“nodeID”是要让 TSM 控制器在其中运行的节点的 ID。例如:

    move-tsm-controller -n node2

  2. 关闭并重新打开命令窗口,并通过键入以下命令验证管理控制器是否正在节点上运行:

    tsm status -v

  3. 停止 Tableau Server

    tsm stop

  4. 将许可证服务添加到节点:

    tsm topology set-process -pr licenseservice -n <nodeID> -c 1

  5. 从原始节点中移除旧的许可证服务,其中“nodeID”是出现故障的初始节点:

    tsm topology set-process -pr licenseservice -n <nodeID> -c 0

  6. 如果初始节点仅在运行 CFS 的实例,请将 CFS 添加到此节点:

    tsm topology set-process -pr clientfileservice -n node2 -c 1

  7. (可选)您还可以添加在初始节点上运行但不在此节点上运行的其他进程。例如,要添加缓存服务器:

    tsm topology set-process -pr cacheserver -n node2 -c 1

  8. 应用更改:

    tsm pending-changes apply

    pending-changes apply 命令将显示一条提示,告知您此命令将重新启动 Tableau Server(如果服务器正在运行)。即使服务器已停止,提示也会显示,但在这种情况下不会重新启动。您可以使用 --ignore-prompt 选项隐藏提示,但这样做不会改变重新启动行为。有关详细信息,请参阅tsm pending-changes apply

  9. 重新启动 TSM 管理控制器:

    net stop tabadmincontroller_0

    net start tabadmincontroller_0

    注意:您必须以管理员身份通过命令提示符运行这些命令。根据您的计算机的配置方式,您可能需要在 C:\Windows\System32 文件夹中运行这些命令。

    注意:tabadmincontroller 可能需要几分钟才会重新启动。如果尝试在下一步中控制器重新启动之前应用待定更改,则 TSM 将无法连接到控制器。您可以使用 tsm status -v 命令验证控制器是否正在运行。Tableau Server 管理控制器应列为“正在运行”。

  10. 应用待定更改(看上去可能不会有任何更改,但是此步骤是必需的):

    tsm pending-changes apply

  11. 在新控制器节点上激活 Tableau Server 许可证:

    tsm licenses activate -k <product-key>

  12. 验证是否正确激活了许可证:

    tsm licenses list

  13. 如果初始节点正在运行协调服务,则需要部署一个不包含该节点的新协调服务整体。如果您有一个三节点群集并且初始节点运行的是协调服务,则您必须在另一个节点上部署新的单实例协调服务整体,并清理旧的整体。在此示例中,协调服务的单个实例会部署到第二个节点:

    tsm topology deploy-coordination-service -n <nodeID2>

    等待服务器完全切换到新的整体。

  14. 当服务器切换到新的整体后,请清理旧的整体。

    不要太早执行此操作。在运行清理命令之前,必须等待服务器完全切换到新的整体,否则可能会永久性损坏 Tableau。有关部署协调服务整体的详细信息,包括有关确定服务器已准备就绪的详细说明,请参见部署协调服务整体

    tsm topology cleanup-coordination-service

  15. 如果初始节点运行的是文件存储实例,则需要删除该实例:

    tsm topology filestore decommission -n <nodeID> --delete-filestore

    其中 nodeID 是出现故障的初始节点。

  16. 如果您在上面部署的新协调服务整体是单个节点整体,请使用 --ignore-warnings 标志应用挂起的更改:

    tsm pending-changes apply --ignore-warnings

  17. 删除初始节点,其中 nodeID 是出现故障的初始节点:

    tsm topology remove-nodes -n <nodeID>

  18. 如果您在上面部署的新协调服务整体是单个节点整体,请使用 --ignore-warnings 标志应用挂起的更改:

    tsm pending-changes apply --ignore-warnings

  19. 启动 Tableau Server

    tsm start

    此时服务器应会启动,并且您将能够使用 TSM 来配置它。下一步是替换初始节点,以使群集拥有原来的节点数。如何执行此操作取决于您是否要重用出现故障的节点。我们建议您仅在能够确定故障原因时才重用该节点,并执行步骤来防止故障重新发生。

  20. 如果打算重用原始节点,您首先需要从中完全移除 Tableau。通过运行 tableau-server-obliterate 脚本来执行此操作。有关执行此操作的详细信息,请参见从计算机中移除 Tableau Server

  21. 在全新的计算机上,或在完全移除 Tableau 后的原始计算机上,使用原始安装程序和从现在运行许可服务和管理控制器的节点中生成的引导程序来安装 Tableau。有关如何执行此操作的详细信息,请参见安装和配置附加节点

    最佳做法是配置在原始节点出现故障时丢失的任何进程,确保群集完全冗余。您可能需要将进程从新的初始节点转移到新添加的附加节点来复制原始配置。举例来说,如果初始节点之前只运行网关和文件存储,您可能需要以相同的方式配置新初始节点。

  22. 使节点按所需的方式启动并运行后,您还应重新部署一个新的协调服务整体。有关详细信息,请参阅部署协调服务整体

 

感谢您的反馈! 提交反馈时出错。请重试,或向我们发送消息