

Zabbix一手應用問答
Q1 Zabbix支持集成scom,splunk等其他的監控系統的告警和性能數據嗎?
A1 Zabbix支持通過API或者數據庫ETL集成其他系統或者平臺。除此之外,當SCOM、SPLUNK等數據收集上來時,也可以通過調用Zabbix_sender的方式集成到zabbix中。
Q2 跟BMC相比的話 ,除了價格,Zabbix有一些什么其它的優勢呢?
A2 Zabbix有很多優勢,如可擴展,接口豐富,易于同其他平臺集成。支持各種平臺的Agent使其在深度和廣度上超越了大多數的監控工具。
Q3 支持基于動態基線的閾值告警嗎?
A3 不支持,但在最新的版本中支持預測。
Q4 一臺機器上有多個進程或者多個端口等監控也是通過LLD去實現嗎?
A4 可以自定義發現原型來實現LLD。
Q5 如果長時間沒采集到值,是否可以告警通知出來?
A5 可以,Zabbix支持nodata報警,即當沒收到值的時候,將報警發出。
Q6 Zabbix可以實現apm的監控嗎?
A6 根據需求可以部分或者全部實現,Zabbix支持原生的JMX監控。
Q7 agent端和server端需要開通哪些端口?
A7 Zabbix本身只需要開通10050,10051端口(主動、被動監控)。如需要監控Agent端其他服務(如80,443等),則需要額外開通。
Q8 我們遇到一個問題,通過ZabbixAPI創建監控項,然后通過pyzabbixSender推送數值到Zabbix,但是不能即可成功,這是什么原因呢,必須要等到一段時候后才能成功。
A8 Zabbix Server和Proxy同步時定期的,在早期版本默認時3600s,需要修改conf文件以加快同步周期。
Q9 我們的系統內部的主機也高達1.1w,但是我們遇到了很多隊列積壓的問題,修改了很多Cache的大小,還是效果不佳。
A9 是否需要修改cache大小取決于Zabbix
internal check中的busy或者free的百分比,與queue沒有直接關系。queue的堆積可能是網絡延遲、agent端的響應緩慢造成的,需要具體分析。
Q10 Zabbix的自動發現是基于安裝客戶端的主機么?
A10 Zabbix的自動發現功能可以基于客戶端,也可以基于協議(如http,ftp),按指定的規則將符合規則的主機加入監控。
Q11 Zabbix加載更多的面板會影響性能嗎?
A11 加載更多的面板會導致Zabbix數據庫的讀壓力增加。如果可以進行合理調優,那么影響不大。
Q12 現在推薦哪個版本呢?
A12 最新的版本是3.4,如果是開源使用建議使用這個版本。如果需要商業支持,可以考慮3.0LTS,以獲得更多的商業支持生命周期。
Q13 什么樣的規則(通過什么方式)可以區分自動發現的機器是windows還是linux的主機?
A13 首先網絡發現的網段的操作系統需要安裝Zabbix
Agent,可以通過網絡發現,并配置獲得的key為system.uname。Windows系統,key的返回會包含Windows這個字符串;同樣的linux系統也會包含“Linux”這個字符串。根據返回值配置后面的動作(加組、套用模版等)。
Q14 一般多少數量的主機才需要用到proxy?
A14 這個問題沒有固定的答案,看具體的業務場景和需求。建議安裝網絡區域部署Proxy以減少防火墻需要打通的端口。
Q15 主機性能,每秒刷新值達到100這個值是不是很大了?
A15 可以說非常小了,官方的最大部署中,nvps可以達到幾十萬。
Q16 自動化發現后,可以修改監控項么?
A16 可以修改,如果修改原型的監控項,會更改所有關聯該模版的主機。如有個性化需求,可以在單個host上單獨添加。
Q17 帶外怎么自動監控ipmi
A17 可以通過Share上的模版,結合網絡發現功能,自動為帶外網絡發現到的Host關聯并添加監控。
Q18 我們現在使用Zabbix監控,服務器數量1000不到,但是查看監控圖形時,圖形會出現斷裂,如何解決呢?
A18 出現斷裂可能是數據庫沒有數據,或者Agent端根本沒有收集到數據。前者可以通過數據庫調優解決,后者可以在Agent本機觀察負載情況,以定位問題。
Q19 自動發現里面怎么修改模板來排除特定的名字的監控項,只留下同類型的需要的監控項,因為我在部分網絡設備上的發現會出現很多虛的用戶接口也被抓進監控項,數量很大,怎么排除。
A19 可通過常規中的正則表達式功能,為自動發現排除不需要的Item。
Q20 Appliance版本? VMware Workstation Pro可以用嗎?
A20 可以,下載vmdk文件,并掛載到VM中就可以使用。
Q21 最近經常出現Zabbix server無法獲取proxy數據的情況,每次都需要禁用部分proxy,然后重啟Zabbix server,再逐一將proxy分別啟用才能恢復。請問這個是配置參數原因導致的,還是Zabbix的bug。
A21 Server和Proxy同步有周期,早起版本3600s,在conf文件中修改配置以縮短同步時間。