硬體監控
此內容是 Tableau Blueprint 的一部分,這是一個成熟度架構,可讓您放大並改進組織使用資料推動影響的方式。請使用我們的評估(連結在新視窗開啟)開啟您的旅程。
任何應用程式只有搭配與其執行的硬體才會可靠且達到高效能。定期監控 Tableau Server 部署的基礎架構是否受到容量限制相當重要,以避免系統(無論是實體伺服器還是虛擬機器)、內部部署或雲端環境負擔過重。系統管理員應監控 CPU、記憶體使用率、儲存 I/O、儲存空間和網路頻寬使用。
Tableau Server
Resource Monitoring Tool 屬於 Tableau Advanced Management 授權的一部分,自 2019.3 版起,此工具會透過網路使用者介面提供所有功能,讓使用者能全方位掌握 Tableau Server 的健康狀態。Resource Monitoring Tools Agent 在 Tableau 叢集中的每個節點上執行,以監控由 Resource Monitoring Tool Master Server 整理的硬體運用、效能和活動。使用 WMI 每秒對處理器、記憶體、磁碟佇列和網路進行多次取樣以得出平均值。在預設情況下,記錄為嚴重的「環境關閉」事件在 15 秒的輪詢間隔中進行監控,並遵守三振規則。如果狀態在三個連續的輪詢間隔中處於離線狀態,或在 30 秒內未回覆,則將建立重大事件。如需詳細資訊,請參閱效能和環境關閉。
最佳做法建議:
為了保持預留空間足夠並降低發生資源受限的可能,請根據您的硬體規格計算下列值,並根據這些值設定 Resource Monitoring Tool 的硬體事件閾值:
- CPU 超過 80% 持續 5 分鐘
- 可用記憶體不足 25%
- 磁碟少於 20%
根據您的企業監控方法,可以使用代理程式型企業監控服務或 Windows 上的 PerfMon(範例工作簿)完成硬體監控。Linux 管理員將使用 sysstat 工具或 vmstat 收集要在類似於 Windows 版本的工作簿中進行分析的資料。在 VMware、HyperV 或 Citrix 等虛擬平台上或在 AWS (CloudWatch)、Microsoft Azure(Azure 入口網站)和 Google Cloud Platform (Google Stackdriver) 的公用雲端中部署時,這些平台有本身的公用程式可監控虛擬機器的使用情況。這些工具通常支援自動監控您的基礎結構,並在超出預設的 75-85% 運用閾值時發出警示。
另外,TabMon 是免費提供的開放原始碼 Tableau Server 叢集監控工具。TabMon 提供使用 Tableau Desktop 分析的結構化輸出。如需詳細資訊,請觀看 TabMon 範例工作簿引導,其中介紹如何在 Tableau Server 程序層級監控 CPU、記憶體使用率、儲存 I/O、儲存空間和網路頻寬。這些資訊將協助您瞭解何時擴展 Tableau Server。在 TabMon.config 檔案中,您應該每 300 秒監控一次,並將資料保留 30 天的間隔以管理資料庫的大小。
Tableau Cloud
Tableau Cloud 的好處之一是系統會由 Tableau 管理和最佳化,因為它是 SaaS 分析平台。如果您正在連線到內部資料,則應監視 Tableau Bridge 的可用性和活動。身為站台管理員,您可以透過以下幾種方式監視 Tableau Bridge 用戶端:
- 使用內建的管理檢視監視即時連線的資料來源流量
- 在站台設定頁面上監視用戶端狀態
- 使用內建的管理檢視監視 Bridge 擷取效能
- 設定擷取重新整理通知的資料來源擁有者
需要注意的是,資料來源擁有者是指當資料來源發生故障時,會收到電子郵件的使用者。這點在集中管理模式下特別息息相關,因為 Bridge 用戶端的擁有者是站台管理員,當發生問題需要排除故障時,通常需要他們的介入。因為他們不會自動收到通知,所以不是 Bridge 用戶端擁有者的資料來源擁有者一般都會設定自動轉寄電子郵件給站台管理員,讓他們及時瞭解問題。
身為資料來源發佈者,如果您認為擷取需要花費比平常多的時間,可執行幾個疑難排解的方法。透過 Bridge 重新整理擷取有兩個元素:用 Bridge 在本機擷取,然後將該擷取項目傳送到 Online 並使其變為可用的項目。為了杜絕造成該問題的潛在原因,可能的謹慎做法是在 Tableau Desktop 中擷取相同的擷取項目,並將擷取持續時間與 Bridge 擷取該項目所需時間進行比較。如果發生任何異常情況,您應將其回報給您的 Tableau 聯絡人來檢查並取得支援。