跳至内容

集群手册/Munin

来自维基教科书,开放的书籍,开放的世界

Munin 软件的安装

[编辑 | 编辑源代码]

Munin 是一个基于 Linux 的软件系统。它测量服务器负载。这需要一台 64 位计算机!
首先解压缩并使用命令“sudo apt-get install munin munin-node”安装 Munin 软件包。这将提取 Linux 操作系统上的整个 Munin 软件包。执行完此操作后,输入sudo nano /etc/munin/munin.conf打开配置菜单。该文件应该如下所示

#htmldir /var/www/statistics
#logdir/var/log/munin
#rundir/var/run/munin

通过从命令中删除 # 字符来删除注释,以便程序可以读取并执行它。安装完 munin 插件后,使用sudo nano /usr/share/munin/plugins。然后程序将使用sudo /etc/init.d/munin-node restart重启,以便它接受所有新设置。命令sudo apt-get install apache2
安装 Web 服务器,并且
sudo/etc/apache2/mods-available/status/conf
最终显示配置菜单。在这里,必须将扩展状态设置为On才能按预期运行 Munin。sudo a2enmod status需要被激活。这必须在enabeld上。
之后,将启用插件。为此,必须在命令行中输入以下命令

sudo ln-s/urs/share/munin/plugins/ _apache/etc/munin/plugins ln-s/urs/share/munin/plugins/ apache_proccess/etc/ munin/plugins
ln-s/urs/share/munin/plugins/_volume/etc/munin/ plugins

要更改 Munin 的设置,请使用以下命令重启系统

sudo /etc/init.d/apache2 restart

以下命令安装图形软件包

sudo apt-get install libwww-perl

这对于图形的设计是必需的。

使用 Munin

[编辑 | 编辑源代码]

Munin 软件系统必须连接到 Internet 服务器,以便显示其可视化界面。为此,再次使用以下命令打开配置文件
sudo nano /etc/munin/munin.conf

显示的 IP 名称localdomain(用于本地调用的 Internet 域名)将更改为名称Master。显示的 IP 地址必须在 master 中更改为127.0.0.1Worker 获取数字10.0.2.2.(每个工作组都有不同的 IP 扩展,这里为 2.2)。
## 首先是我们的“普通”主机。 [server02/ Master] address 127.0.0.1
(Vgl. http://help.ubuntu-se.org/9.10/serverguide/sv/munin.html)
在 Windows 计算机上始终使用相同的名称。当 Web 浏览器无法打开Munin时,必须在sudo/etc/hosts文件中更改名称。随后,在 Internet 浏览器中输入来自 Master/munin 的 IP,并尝试打开 Munin 页面或软件系统。如果安装成功,则可以访问 Munin 并测量服务器负载。但是,测量需要一些时间才能完成,因为 Munin 每一天/每月/每年或在几台服务器上测量不同的工作负载。它显示最小值和最大值(参见下一页 Munin 软件系统的图片)。此外,系统在不同时间进行测量。Munin 的更新也会出现并被程序报告。当服务器无法访问时也会显示,例如,在断电或计算机崩溃期间。

http://blog.m3d1c5.org/2011/10/prosody-xmpp-server-mit-munin-uberwachen/
使用 Munin 显示服务器利用率水平的示例
(Quelle: http://zockertown.de/s9y/index.php?/archives/1426-Munin-ist-schon-toll.html)


该程序的优势在于,即使在大量服务器的情况下,您也可以对服务器故障做出反应,并快速检测到哪个服务器已关闭。然后必须选择性地对其进行修复或更新。

Munin 中计算机集群的示例,vgl. http://munin.ping.uio.no/

概述 • ping.uio.no
o aquarius.ping.uio.no [ 磁盘 exim 网络 进程 系统 ]
o bache.ping.uio.no [ 磁盘 网络 nfs
postfix 进程 系统 时间 ]
o bambi.ping.uio.no [ 磁盘 网络 nfs
进程 系统 时间 ]
o bimbo.ping.uio.no [ 磁盘 exim 网络 nfs
其他 进程 系统 ]
o bottolf.ping.uio.no [ 磁盘 exim 网络
nfs 进程 系统 时间 ]
o cirrus.ping.uio.no [ 磁盘 exim 网络
进程 传感器 系统 ]
o cumulus.ping.uio.no [ 磁盘 exim 网络
进程 传感器 系统 ]
o freddy.ping.uio.no [ 磁盘 网络 nfs
postfix 进程 传感器 系统 时间 ]

o galactica.ping.uio.no [ 磁盘 exim
网络 nfs postfix 打印 进程
系统 ]
o gud.ping.uio.no [ 磁盘 网络 nfs
postfix 打印 进程 传感器
系统 ]
o kjell.ping.uio.no [ 磁盘 网络
nfs postfix 进程 传感器 系统 时间 ]
o knuth.ping.uio.no [ Apache 磁盘 mysql
网络 nfs postfix 进程 传感器 系统 时间 ]
o m.ping.uio.no [ 磁盘 exim 网络 nfs
打印 进程 传感器 系统 ]
o matz.ping.uio.no [ 磁盘 网络 nfs
进程 系统 ]
o meg.ping.uio.no [ 磁盘 网络 nfs 其他 进程 系统 ]
o pike.ping.uio.no [ Apache 磁盘 exim
munin 网络 打印 进程 传感器
系统 时间 虚拟机 ]
o ponnypetra.ping.uio.no [ 磁盘 网络 其他 进程 系统 ]
o rosa.ping.uio.no [ 磁盘 网络 nfs
进程 系统 时间 ]
o rossum.ping.uio.no [ Apache 磁盘 exim 网络 nfs 其他 进程 系统 时间 ]
o tetra.ping.uio.no [ 磁盘 网络
进程 系统 ]
o urias.ping.uio.no [ 磁盘 网络 nfs 其他 进程 系统 时间 ]
o utslett.ping.uio.no [ 磁盘 munin
网络 进程 系统 ]

在图片中,您可以看到各个进程服务器和系统。在 Ubuntu 中,所有数据包都具有启动和停止功能。这些控制着服务。
因此,必须输入:sudo /etc/init.d/munin-nodestart|stop|restart|force-reload|try-restart

“Restart”重新启动系统,服务器上现有的系统将停止。“Try -restart 在服务之前停止时重新启动服务。”

警告

如果 Munin 服务器的容量利用率限度被超过,这些值通常会以红色显示。然后可以发送电子邮件警报,以便不会超过最大磁盘空间。为此,打开文件 munin.conf(wiki.ubuntuusers.de/Munin)。然后添加这些命令

# 每次

# 有东西改变时(OK 警告,CRITICAL OK 等)

Contacts me
Contact.me.command mail -s “Munin 通知 (var:host)” [email protected]

Contact.me.always_send warning critical
必须将电子邮件地址调整为自己的系统。即使在确定服务器快要溢出时的利用率值时,也应该这样做,以便可以及时向用户发送警告。在安装和配置 postfix 之前,应该这样做,以便将电子邮件发送给所有用户。对于每个主机,可以通过以下方式实现(参见 Munin 配置文件的示例)。
(localhost.localdomain/Master)
Address 127.0.0.1.
use_node_name yes

<plugin>.<fieldname>. (critical,warning) <value>
可以通过图形的 URL 访问插件。可以从 Munin 图形中复制字段名称。在内部名称下显示字段名称。可以自由选择严重警告。该值如上所述确定,并且当达到/超过警告值时,将向所有用户发送电子邮件。

Munin 中服务器警告条目的示例
“[localhost.localdomain]
Address 127.0.0.1.
address 127.0.0.1
fd._dev_evms_hda2.warning 70
df._dev_evms_hda2.critical 95
df._dev_mapper_hda5.warning 70

df._dev_mapper_hda5.critical 70”

这里将 70 确定为严重值,并选择 95 为非常严重值。应该仔细选择这些值,不要太低,因为用户会收到警告电子邮件并可能感到恐慌。无论如何,都应该发送警告,包括真正严重的值,这样您就可以在必要时使用备份加载系统。

CPU 主处理器

CPU 主服务器指标 (http://www.server-wissen.de/wp-content/uploads/2012/02/cpu-day.png)

Munin 错误和清理

[编辑 | 编辑源代码]

可能会出现各种类型的错误,例如 IP 地址可能一天内发生变化。因此,Munin 无法获得所需的浏览器页面。在这种情况下,需要调整配置文件中的地址。更改 localdomainserver 的名称并不容易。
图形中的 白色条
原因可能是用户配置了图形文件,或者在解压缩软件包时出现错误。安装过程中很容易出现权限错误,因为这样一来,服务器溢出时就无法发送警告电子邮件。

华夏公益教科书