跳转至内容

使用 Xymon 进行系统监控/其他文档/关于系统监控

来自维基教科书,开放的书籍,开放的世界

在大多数系统中,一个或多个“服务器”存储所有被监控“主机”的数据。服务器收集数据的方式有几种不同的方法。最简单的系统是仅服务器的系统,其中数据从主机远程收集,而无需被监控的主机的任何配合。例如,一个只记录 ICMP ECHO 往返时间的系统,或者检查网页是否成功返回 HTTP 代码 200。此类系统收集的数据量有限,但除了确保防火墙规则配置正确之外,不需要对被监控的主机进行任何配置。

为了收集只能在主机上获取的数据,例如 CPU 负载,必须在主机上运行某种“代理”来收集数据并将其返回给服务器。一些基于代理的系统使用标准通信协议,通常是 SNMP,作为从主机传输数据到服务器的方式;其他系统使用非标准通信协议,该协议是监控系统的自定义协议。

在大多数基于 SNMP 的系统中,主机可能会在发生异常操作事件(例如硬盘故障或系统冷启动)时发送 SNMP TRAP。大多数情况下,数据是通过 SNMP GET 请求定期从 SNMP 代理收集的。并非所有基于 SNMP 的系统都支持 TRAP 和 GET。SNMP 也可以用于使用 PUT 方法配置主机,但这很少用于监控目的。基于 SNMP 的系统特别适合于路由器和交换机等网络设备。

依赖于自定义通信协议的系统可以与主机定期联系服务器(“推送式”,例如 Xymon)或服务器定期联系主机上的代理(“拉取式”,例如使用 nrpe 的 nagios)一起运行。

华夏公益教科书