

項目需求:
Linux、Windows
主機存活、運行時間、CPU負載、內存使用率、磁盤使用率、網卡流量、網卡狀態、進程數量、日志關鍵字監控
MySQL、MS
SQL、Oracle、PostgreSQL
數據庫存活狀態、進程狀態、端口狀態、數據庫實例狀態、表空間大小、會話數、訪問并發量、讀寫并發量、死鎖數
IIS、Tomcat
端口狀態、進程狀態、響應時間、會話數
IBM V5000
設備存活、設備運行時間、端口狀態、讀寫速度、讀寫隊列、讀寫延遲、硬盤使用率
139郵箱、DNS
URL狀態、模擬登陸、模擬退出、響應時間、下載速度
1、與公司成都研究所綜合網管(UNMS)做對接,上報部分關鍵告警給UNMS;
2、與客戶的安全審計系統(SOC)做對接,把網管的日志發給SOC系統進行分析處理;
3、與郵件和短信系統對接,支持兩種通知方式;
4、按埃塞客戶的需求進行定制報表,如可用性報表,故障設備報表等。
解決方案:
? ? ??根據項目需求,進行HA高可用監控平臺分布式部署(主要組件包括:Zabbix、Mariadb、Agent)的安裝、配置和聯調,服務器系統:Centos 7.2,完成Agent代理安裝,支持windows、linux、unix。信息采集手段包括:通過Agent代理、SNMP協議、和ICMP協議采集源。整理將用于采集具體某一設備所需的信息(如設備名稱、IP地址、用戶名、密碼等信息)登記,整理并提供現有采集指標,對OS層級的采集程序進行安裝并配置,開啟和設置網絡SNMP等。充分和客戶協調和溝通技術難點和可行性后,執行數據采集定制化內容,數據采集后,在Zabbix界面中對所需監控的設備和指標項、告警等進行配置工作,并在Zabbix中對基礎指標進行展示。針對客戶需求,進行定制報表(可用性報表、故障設備報表等)。后期進行管理員培訓。
監控類型
支持范圍
設備量
監控項
服務器
數據庫
23
中間件
存儲
2
應用
實現效果:
1、系統發生問題及時發出告警通知(郵件等方式),管理員能夠快速進行故障定位及修復,保障鏈路通暢,有效降低了其中的人力成本,縮小對公司業務和應用系統的損失;