某航空公司智能監控
項目需求:
現有監控系統不能滿足運維需求,沒有網絡鏈路監測,人工巡查無法及時發現故障,通常只有使用者反饋后才得知故障發生,且并沒有主動告警,無法快速定位故障原因,沒有報表系統,無法對設備的運行狀態進行直觀展示。
解決方案:
根據項目需求安裝、配置和聯調航空公司監控平臺,主要組建包括Zabbix、Mariad,完成監控平臺在此航空公司分部所有節點物理機房位置拓撲圖,網絡拓撲圖,物理鏈路狀態圖,形成子母拓撲圖的樣式。信息采集手段包括SNMP協議、和ICMP命令采集源、Zabbix Server和MariaDB數據庫之間通信。根據航空公司分部各節點網絡設備管理對象進行接入,涉及到添加監控項(監控的核心設備的CPU、內存、存活、板卡、電源、風扇、溫度、帶寬,接口流量,端口狀態),對接入層網絡設備和攝像頭,無線AP進行每天2次存活監測。為方便日后運維和擴容,將監控的網絡設備的監控項做成模板,進行數據采集,采集后,在Zabbix界面中對所需監控的設備和指標項、告警等進行配置工作,并在zabbix中對基礎指標進行第一層基礎展示。根據需求,進行相關個性化定制和開發,包括大屏展示、樹形圖、物理鏈路專線和互聯網鏈路模塊、機房展示模塊框架、事件日志記錄。后期對管理員進行培訓。
此次部署運維監控平臺涉及航空公司信息分布共計559臺設備,覆蓋華為、Cisco、H3C三個廠家網絡設備。
實現效果:
1、對各公司、各營業部、各機庫實現統一平臺管理,提高管理效率,降低成本;
2、對服務器、網絡設備進行統一資產管理,解決了純人工管理資產混亂的現狀;
3、對網路設備進行統一配置管理,發生設備配置變更、丟失等情況,可快速對網絡故障進行自動定位且發出告警通知工程師,工程師可根據用過系統自動備份的配置對設備進行配置的快速修復;
4、實現對端到端網絡鏈路的流量、狀態監控,發生問題及時發出告警通知,管理員進行故障修復,保障鏈路通暢。
截圖展示:
大屏展示系統
拓撲圖