排查因服务故障导致的作业失败

从 Tableau Server 版本 2021.1 开始,一组新的错误消息可帮助您了解作业何时因服务问题而失败。本主题解释了这些消息及其含义。

错误消息将以这种格式显示:

<nodeId>
<service>_<instanceId>.<version>: <error>

有四种类别的错误:

  • 缺少状态 - 如果服务无法报告其状态,例如,如果节点已关闭、tabadminagent 无法报告状态,或者服务以导致其依赖服务无法安装方式发生故障后,这将显示为“缺少状态”错误。
  • 更新配置失败 - 如果服务无法更新其配置文件,这将显示为“更新配置失败”错误。这可能会在升级期间尝试将挂起的更改应用于新服务时发生。查看服务的控制应用日志 <dataDir>/tabsvc/logs/<service>/control-<service>_<nodeId>-<instanceId>,了解有关错误的更多详细信息。
  • 未能达到请求的状态。当前状态:<currentState> - 如果无法安装/移除/启动/停止服务,则会导致“未能达到请求的状态”错误。在升级过程中安装新服务并移除旧服务时,可能会发生这种情况。<currentState> 可能的选项包括:DEPLOY_FAILED、INSTALL_FAILED、DISABLE_FAILED、ENABLE_FAILED、CONFIGURE_FAILED、UNINSTALL_FAILED、REMOVE_FAILED。最常见的选项包括:INSTALL_FAILED、UNINSTALL_FAILED 和 REMOVE_FAILED。查看服务的控制应用日志 <dataDir>/tabsvc/logs/<service>/control-<service>_<nodeId>-<instanceId>,了解有关错误的更多详细信息。
  • 启动/停止失败。当前状态:<currentStatus> - 如果应该运行的服务停止或应该停止的服务继续运行,则会发生这种情况。<currentStatus> 中可能的值包括:ACTIVE、BUSY、PASSIVE、UNLICENSED、DOWN、STATUS_UNAVAILABLE 和 DEGRADED。前三个(ACTIVE、BUSY、PASSIVE)被视为“正在运行”状态。最后四个是“已停止”状态。查看主服务日志 <dataDir>/tabsvc/logs/<service>/<service>_<nodeId>-<instanceId>.log,了解有关错误的更多详细信息。

错误消息的示例包括:

This job failed due to unexpected error: 'ServiceOperationTimeoutException'
One or more services failed to reach their expected state.
node1:
     vizportal_0.2021.4.0.0: Failed to reach requested state. Current state: INSTALL_FAILED

从版本 2021.3 开始,为第二种和第三种错误类型添加了额外的错误消息,这些错误消息将与控制应用日志中发现的错误相匹配。