Zabbix

1. 介绍

 zabbix(音同 zæbix)是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。 zabbix能监视各种网络参数,保证服务器系统的安全运营;并提供灵活的通知机制以让系统管理员快速定位/解决存在的各种问题。 zabbix由2部分构成,zabbix server与可选组件zabbix agent。 zabbix server可以通过SNMP,zabbix agent,ping,端口监视等方法提供对远程服务器/网络状态的监视,数据收集等功能,它可以运行在Linux,Solaris,HP-UX,AIX,Free BSD,Open BSD,OS X等平台上

本教程基于Zabbix4.0讲解

1.1 监控系统趋势

          /---  KPI聚类
         /----  瓶颈分析
智能监控------  KPI异常检测,定位
         \----  故障预测
          \---  容量预估

1.2 zabbix 数据采集

 Agent多平台部署,支持SNMP和IPMI,支持无agent监控,自定义监控,支持监控计算和聚合Web事务监控。

1.3 Zabbix 数据展示

 采集到的数据,可以通过图表,以及监控大屏,网络拓扑图,幻灯片图表,图片展示插件等显示。

1.4 Zabbix 故障检测

 故障检测

  • 故障预警
  • 故障规则和恢复规则独立
  • 多个告警规则组合
  • 与历史数据对比分析告警
  • 支持数据波动规则
  • 高级依赖关系

1.5 Zabbix 告警发送

  • 发送告警信息
  • 自动修复故障
  • 告警升级
  • 自定义告警信息
  • 告警关联

1.6 Zabbix 安全和认证

  • 加密通讯
  • 统一认证
  • 授权管理

1.7 Zabbix 自动化

  • 网络自动发现
  • 低级别自动发现 LLD
  • Agent 自动注册

1.8 Zabbix API

  • 自动化配置管理
  • 与第三方系统结和

2. Zabbix 架构组成

2.1 Zabbix 架构组成

                    zabbix web
zabbix agent-----\      |
zabbix agent--------> zabbix server  <--> databases
zabbix agent-----/      ^
                        |
                  |-------------|
                  |             |
                  V             V
                zabbix        zabbix <--> databases
                gateway       proxy  
                                ^
                                |
                            ----------
                            |        |
                            V        V
                          agent    agent  

2.2 Zabbix 组件

  • fronted 前端
  • Zabbix API Zabbix的接口
  • Zabbix server Zabbix服务器端
  • Zabbix Agent Zabbix客户端
  • Zabbix Proxy Zabbix代理
  • Network discovery 网络自动发现
  • Active agent auto-registration 主动Agent自动注册
  • Low-level discovery 低级自动发现

2.3 监控收集

  • host 主机
  • host group 主机组
  • item 监控项
  • value preprocessing 预处理
  • template 模板
  • application 应用
  • web scenario web场景
  • macros 宏[变量]

2.4 数据展示

  • graph 图表
  • screen 聚合图表
  • maps 拓扑图
  • slide shows 幻灯片演示

2.5 告警相关

  • trigger 触发器
  • event 事件
  • problem 异常状态
  • OK 正常状态
  • action 操作
  • eacalation 升级
  • media 媒介
  • notification 通知
  • remote command 远程命令
  • maintenance 维护模式

2.6 认证和权限

  • User 用户
  • User Group 用户组
  • permission 权限
  • User Type 用户类型