某投資公司智能監控
項目需求:
某投資公司是一家大型印刷類公司,屬于高科技公司。在中國的辦公總部設立在深圳,其中在上海,北京,蘇州,廣州,成都等地都設有分部或辦事處。公司擁有的軟硬件設備種類繁多,機房環境復雜,同時擁有多條業務系統,機房環境、業務系統的安全、穩定運行對印刷生產線起到至關重要的作用,自動化運維系統業務成為企業當前的重要問題。次公司存在運維服務路徑不統一,無法形成首問責任制,難以做到統一調度、統一監管;服務報告、知識管理體系不完善,經驗難傳承;沒有形成標準化運維體系,且沒有信息化系統為支撐,運維過程無法標準化;服務成果難以量化,服務價值難以體現;沒有形成系統規范的運維商服務過程監督體系、手段、服務質量量化考核標準;故障響應/處理不及時、過程不合規、操作不規范、服務報告不完善;各種例行類服務沒有按計劃執行,沒有提供服務報告。綜上自動化運維管理系統業務是網絡工程部門急需解決的問題。
解決方案:
完成主中心監控平臺(主要組件包括:Zabbix、Grafana、influxDB)的安裝、配置和聯調,實施監控平臺在上海與深圳兩地互備的高可用架構,其中MySQL數據庫將通過binlog實現遠程數據復制,Zabbix Server將通過keepalive實現雙機集群,信息采集手段包括:部署agent、通過SNMP協議、和ping命令采集源、Zabbix Server和MySQL數據庫之間都通過浮動IP通信。對上海(蘭生、青浦、金山、災備數據中心)及深圳管理對象進行接入以及配置工作,包括OS層級的采集程序安裝和配置,進行數據采集,采集后,在Zabbix界面中對所需監控的設備和指標項、告警等進行配置工作,并在zabbix中對基礎指標進行第一層基礎展示。基于Grafana界面中展示接入設備指標經行抽象提取定制化進行第二和第三層上次展示。告警信息以文本的格式轉發至由最終用戶提供的郵件正文或微信公眾號正文。后期對管理員進行培訓,內容包括Zabbix開源軟件介紹、Grafana開源軟件介紹、influxDB開源軟件介紹,以及日常維護操作培訓。
此次部署運維監控平臺中涉及此投資公司分布共計1908臺設備,覆蓋到思科安全、無線、交換機等產品
實現效果:
1、
通過對公司的自動化運維平臺的搭建和高可用主從模式的部署,加強了全國各區域工廠之間的聯系反饋和數據信息安全;
2、
大屏展示系統和業務數據報表的定制化開發,既做到細節展示,又做到實時更新,讓客戶了解到各個設備的實時狀態,掌控業務數據的整體發展進度;
3、
通過郵件或者微信告警信息的及時發送,縮短了運維工作人員準確排查故障時間,提高了工作效率,有效節省運維人員工作時間且降低了其中的人力成本。達到降低對公司業務和應用系統的損失,同時還為公司的安全化生產加上保障。
截圖展示:
定制化首頁展示頁面