硬件监视

此内容是T ableau Blueprint 的一部分,这是一个成熟度框架,允许您放大并改进组织使用数据来推动影响的方式。若要开始您的旅程,请参加我们的评估(链接在新窗口中打开)

任何应用程序的可靠性和性能都无法脱离运行该应用程序的硬件。定期监视所部署的 Tableau Server 的底层基础结构是否存在容量限制非常重要,这样做可以防止系统过载,无论是物理服务器还是虚拟机,无论在本地还是在云端。系统管理员应监视 CPU、内存使用情况、存储 I/O、存储空间和网络带宽利用率。

Tableau Server

Resource Monitoring Tool 从 2019.3 版本开始提供,作为 Tableau Advanced Management 的一个组件进行许可;用户使用包含其所有功能的 Web 用户界面,即可全面了解 Tableau Server 的运行状况。Resource Monitoring Tool Agent 在 Tableau 群集中的每个节点上运行,以监视其硬件使用情况、性能和活动,这些信息会由 Resource Monitoring Tool Master Server 进行整理。使用 WMI 以每秒数次的频率对处理器、内存、磁盘队列和网络进行采样以产生平均值。环境关闭事件(记录为严重事件)默认以 15 秒的轮询间隔进行监视,并遵循“三次”规则。如果连续三次轮询都返回脱机状态,或者在 30 秒内没有回复,则会创建一个严重事件。更多信息,请参阅性能环境关闭。

最佳做法建议:

要保持足够的余量并降低资源限制的可能性,请根据硬件规格计算以下值,并将 Resource Monitoring Tool 硬件事件阈值设置为:

  • CPU 超过 80%,持续 5 分钟
  • 可用内存少于 25%
  • 可用磁盘少于 20%

根据贵企业的监视方法,可以使用基于代理的企业监视服务或使用 Windows 上的 PerfMon示例工作簿)来进行硬件监视。Linux 管理员将使用 sysstat 工具或 vmstat 来收集要在工作簿中分析的数据,这与 Windows 版本类似。在虚拟平台(如 VMware、HyperV 或 Citrix)或公共云(包括 AWS (CloudWatch)、Microsoft Azure(Azure 门户)和 Google Cloud Platform (Google Stackdriver))上部署时,这些平台都提供了自己的实用程序来监视其虚拟机的运行状况。这些工具通常支持对基础结构进行自动监视,并在超出利用率预设阈值 (75-85%) 时发出通知。

您也可以使用 TabMon,这是一款免费的开源 Tableau Server 群集监视工具。TabMon 提供可通过 Tableau Desktop 分析的结构化输出。更多信息,请观看 (TabMon 示例工作簿之旅),其中介绍了如何在 Tableau Server 进程级别监视 CPU、内存使用情况、存储 I/O、存储空间和网络带宽。此信息将帮助您了解何时扩展 Tableau Server。在 TabMon.config 文件中,您应该每隔 300 秒监视一次,并以 30 天为间隔保留数据,以便管理数据库的规模。

Tableau Cloud

Tableau Cloud 的优势之一在于它是一款 SaaS(软件即服务)分析平台,因此由 Tableau 进行管理和优化。如果您是连接到本地数据,则应监视 Tableau Bridge 的可用性和活动情况。作为站点管理员,您可以通过多种方式来监视 Tableau Bridge 客户端。

请务必注意,数据源所有者是在数据源运行失败时会收到电子邮件的用户。在集中管理的模型中尤其要注意这一点,因为 Bridge 客户端的所有者是站点管理员,在出现问题以及需要排查故障时,通常有必要请他们参与进来。由于他们不会自动收到通知,因此不是 Bridge 客户端所有者的数据源所有者通常会设置自动向站点管理员转发电子邮件的功能,以便他们能及时了解最新出现的问题。

作为数据源发布者,您如果认为某次数据提取所用的时间异常多,可以采取多种做法来排查故障。通过 Bridge 进行的数据提取刷新包含两个环节:先通过 Bridge 在本地进行数据提取,再将该数据提取发送到 Cloud 并使其变为可用状态。为了排查出可能造成该问题的原因,不妨在 Tableau Desktop 中进行同样的数据提取,然后将提取时长与 Bridge 所用的提取时长进行对比,这可能是比较周全的做法。如有任何异常,都应报给您的 Tableau 联系人,以便 Tableau 进行审查并提供相关支持。

 

感谢您的反馈!您的反馈已成功提交。谢谢!