

項(xiàng)目需求:
? ? ??現(xiàn)有監(jiān)控系統(tǒng)不能滿足運(yùn)維需求,沒有網(wǎng)絡(luò)鏈路監(jiān)測(cè),人工巡查無法及時(shí)發(fā)現(xiàn)故障,通常只有使用者反饋后才得知故障發(fā)生,且并沒有主動(dòng)告警,無法快速定位故障原因,沒有報(bào)表系統(tǒng),無法對(duì)設(shè)備的運(yùn)行狀態(tài)進(jìn)行直觀展示。
解決方案:
? ? ??根據(jù)項(xiàng)目需求安裝、配置和聯(lián)調(diào)航空公司監(jiān)控平臺(tái),主要組建包括Zabbix、Mariad,完成監(jiān)控平臺(tái)在此航空公司分部所有節(jié)點(diǎn)物理機(jī)房位置拓?fù)鋱D,網(wǎng)絡(luò)拓?fù)鋱D,物理鏈路狀態(tài)圖,形成子母拓?fù)鋱D的樣式。信息采集手段包括SNMP協(xié)議、和ICMP命令采集源、Zabbix Server和MariaDB數(shù)據(jù)庫之間通信。根據(jù)航空公司分部各節(jié)點(diǎn)網(wǎng)絡(luò)設(shè)備管理對(duì)象進(jìn)行接入,涉及到添加監(jiān)控項(xiàng)(監(jiān)控的核心設(shè)備的CPU、內(nèi)存、存活、板卡、電源、風(fēng)扇、溫度、帶寬,接口流量,端口狀態(tài)),對(duì)接入層網(wǎng)絡(luò)設(shè)備和攝像頭,無線AP進(jìn)行每天2次存活監(jiān)測(cè)。為方便日后運(yùn)維和擴(kuò)容,將監(jiān)控的網(wǎng)絡(luò)設(shè)備的監(jiān)控項(xiàng)做成模板,進(jìn)行數(shù)據(jù)采集,采集后,在Zabbix界面中對(duì)所需監(jiān)控的設(shè)備和指標(biāo)項(xiàng)、告警等進(jìn)行配置工作,并在zabbix中對(duì)基礎(chǔ)指標(biāo)進(jìn)行第一層基礎(chǔ)展示。根據(jù)需求,進(jìn)行相關(guān)個(gè)性化定制和開發(fā),包括大屏展示、樹形圖、物理鏈路專線和互聯(lián)網(wǎng)鏈路模塊、機(jī)房展示模塊框架、事件日志記錄。后期對(duì)管理員進(jìn)行培訓(xùn)。
? ? ??此次部署運(yùn)維監(jiān)控平臺(tái)涉及航空公司信息分布共計(jì)559臺(tái)設(shè)備,覆蓋華為、Cisco、H3C三個(gè)廠家網(wǎng)絡(luò)設(shè)備。
實(shí)現(xiàn)效果:
1、對(duì)各公司、各營(yíng)業(yè)部、各機(jī)庫實(shí)現(xiàn)統(tǒng)一平臺(tái)管理,提高管理效率,降低成本;
2、對(duì)服務(wù)器、網(wǎng)絡(luò)設(shè)備進(jìn)行統(tǒng)一資產(chǎn)管理,解決了純?nèi)斯す芾碣Y產(chǎn)混亂的現(xiàn)狀;
3、對(duì)網(wǎng)路設(shè)備進(jìn)行統(tǒng)一配置管理,發(fā)生設(shè)備配置變更、丟失等情況,可快速對(duì)網(wǎng)絡(luò)故障進(jìn)行自動(dòng)定位且發(fā)出告警通知工程師,工程師可根據(jù)用過系統(tǒng)自動(dòng)備份的配置對(duì)設(shè)備進(jìn)行配置的快速修復(fù);
4、實(shí)現(xiàn)對(duì)端到端網(wǎng)絡(luò)鏈路的流量、狀態(tài)監(jiān)控,發(fā)生問題及時(shí)發(fā)出告警通知,管理員進(jìn)行故障修復(fù),保障鏈路通暢。

