nagios安装部署

  • Post author:
  • Post category:其他




Nagios

Nagios是一款开源的计算机系统和网络监视工具,能有效的监控Windows、Linux的主机状态,在系统或服务状态异常时发出电子邮件或者短信报警,第一时间通知网站运维人员,在状态恢复后发出正常的电子邮件或短信通知。



工作原理:

Nagios的功能是监控服务器和主机,但是其本身并不包括这部分功能,所有的监控、监测功能都是通过各种插件来完成的,启动nagios后,它会周期性的自动调用插件去监测服务器状态,同时nagios会维持一个队列,所有插件返回来的状态信息都进入队列,nagios每次都从队列首开始读取信息,进行处理后,把状态结果通过web显示出来。Nagios提供了许多插件,利用这些插件可以方便的监控很多服务窗体。安装完成之后,在nagios主目录下的/libexec里放有nagios自带的可以使用的所有插件,如check_disk是检查磁盘空间的插件,check_load是检查CPU的插件等。



Nagios四种监控状态:

Nagios可以识别四种状态返回信息,即0(ok)表示正常状态,绿色;1(warning)表示出现警告,黄色;2(critical)表示出现非常严重的错误,红色;3(unknown)表示未知错误,深黄色。



Nagios通过nrpe插件来远程管理服务:

Nagios执行安装在它里面的check_nrpe插件,并告诉check_nrpe去检测哪些服务;

通过SSL,check_nrpe连接远端机器上的nrpe daemon;

Nrpe运行本地的各种插件去检测本地的服务和状态;

Nrpe把检测的结果传给主机端的check_nrpe,check_nrpe再把结果送到nagios状态队列中;

Nagios一次读取队列中的信息,再把结果显示出来



总结一下nagios主要可以监控以下方面:

1、主机是否宕机(通过ping命令,如果ping不通会认为主机属于宕机状态,但不影响所监控的其他服务)

2、服务器资源(cpu使用率、硬盘剩余空间等)

3、网络服务(smtp\pop3\http\)

4、监控网络设备(路由器、交换机等)



安装部署nagios:

环境:

Nagios服务器:192.168.152.136 centos6_x64

Mysql服务器:192.168.152.130 centos6_x64

Apache服务器:192.168.152.130 centos6_x64

Nagios服务器上需要安装nagios、nagios-plugins、nrpe;mysql和Apache服务器上需要安装nagios-plugins、nrpe

在这里插入图片描述

安装部署:

Nagios服务器

关闭防火墙:

#service iptables stop

#chkconfig iptables off

新建nagios用户和组:

#useradd –s /sbin/nologin nagios

#mkdir /usr/local/nagios

#chown –R nagios.nagios /usr/local/nagios

编译安装nagios:

#yum -y install httpd php mysql-devel openssl openssl-devel gcc glibc glibc-common gd gd-devel

首先实现lamp即可。

在这里插入图片描述

https://www.nagios.org/downloads/ nagios下载

#tar zxf nagios-4.2.4.tar.gz

#cd nagios-4.2.4

#./configure –prefix=/usr/local/nagios/

#make all

#make install

#make install-init

#make install-commandmode

#make install-config

#make install-webconf

注意:

安装install-webconf是为了生成配置文件,后面在/etc/httpd/conf/httpd.conf最后添加的信息就不用手工打了,可以到/etc/httpd/conf.d/nagios.conf文件中复制。

以上命令的解释:

make install //安装主程序,CGI和HTML文件

make install-init //在/etc/rc.d/init.d安装启动脚本

make install-commandmode //配置目录权限

make install-config //安装示例配置文件

make install-webconf //安装nagios的web接口,会在/etc/httpd/conf.d目录中创建nagios.conf文件。

安装完成之后会在/usr/local/nagios目录下产生6个目录,下面分别解释一下。

bin:nagios执行程序所在的目录,nagios文件即为主程序。

etc:nagios配置文件目录,当make install-config完以后etc下面就会出现默认的配置文件。

sbin:nagios CGI文件所在目录,这里存放的是一些外部命令执行程序。

share:nagios网页文件目录,存放一些html文件。

var:nagios日志文件、pid等文件目录。

Libexec:系统默认插件的存储位置

在这里插入图片描述

#chkconfig –add nagios

安装nagios插件(nagios监控功能通过插件来完成):

#tar zxf nagios-plugins-2.1.1.tar.gz

#cd nagios-plugins-2.1.1

#./configure –prefix=/usr/local/nagios/

#make && make install

安装nrpe(为了监控远程服务器):

#tar zxf nrpe-3.2.1.tar.gz

#cd nrpe-3.2.1

#./configure

#make all && make install-plugin

接下来在/etc/httpd/conf/httpd.conf文件最后添加授权,我们可以到/etc/httpd/conf.d/nagios.conf文件中复制。

#vi /etc/httpd/conf/httpd.conf

之后使用r导入即可:

: r /etc/httpd/conf.d/nagios.conf

在这里插入图片描述

执行htpasswd命令添加一个方位nagios页面的授权用户:

#htpasswd -c /usr/local/nagios/etc/htpasswd.users nagiosadmin

New password:

Re-type new password:

Adding password for user nagiosadmin

在这里插入图片描述

#service httpd restart

浏览器中访问nagios:

http://192.168.152.136/nagios

在这里插入图片描述

进入之后页面:

在这里插入图片描述

现在只能打开网页,很多的监控选项不能看到,如果需要监控远程的服务器,还需要做很多配置,下面开始配置。

nagios监控系统涉及知识点

1)nagios的配置文件:

Nagios.cfg:主配置文件,定义各种配置文件的名称和位置

Cgi.cfg:控制CGI的配置文件

Resource.cfg:资源文件,定义各种变量,以便于其他文件调用

Objects:其他配置文件存放目录,此目录下主要有:

Command.cfg:命令配置文件,定义各种命令格式,以备其他文件调用

contacts.cfg:联系人和组,发邮件等告警信息时可以调用

localhost.cfg:监控本机的配置文件

timeperiods.cfg:定义监控时间的配置文件,便于其他文件调用

Hostgroups.cfg:定义监控的主机(组),需手动创建。

2) 配置文件之间的关系

在nagios的配置过程中涉及的几个定义有主机、主机组、服务、服务组、联系人、联系人组、监控时间和监控命令等。从这些定义可以看出,nagios各个配置文件之间互为关联、彼此引用的。成功配置出一台nagios监控系统,必须要弄清楚每个配置文件之间依赖与被依赖的关系,最重要的有四点

a)定义监控那些主机,主机组,服务和服务组

b)定义这个监控要用什么命令实现

c)定义监控的时间段

d)定义主机或服务器出现问题时要通知的联系人和联系人祖

3) 配置nagios

为了能更清楚的说明问题,同时也为了维护方便,建议将nagios各个定义的对象创建独立的配置文件。

a)创建conf目录来定义host主机

b)创建hostgroups.cfg文件来定义主机组

c)用默认的contacts.cfg文件来定义联系人和联系人组

c)用默认的contacts.cfg文件来定义联系人和联系人组

d)用默认的commands.cfg文件来定义命令

e)用默认的timeperiods.cfg来定义监控时间段

f)用默认的templetes.cfg文件作为资源引用文件

配置nagios

#vi /usr/local/nagios/etc/nagios.cfg

cfg_file=/usr/local/nagios/etc/objects/hostgroups.cfg

cfg_dir=/usr/local/nagios/etc/conf

在这里插入图片描述

#vi /usr/local/nagios/etc/objects/commands.cfg

添加用来定义check_nrpe的监控命令

define command{


command_name check_nrpe

command_line



U

S

E

R

1

USER1






U


S


E


R


1





/check_nrpe -H



H

O

S

T

A

D

D

R

E

S

S

HOSTADDRESS






H


O


S


T


A


D


D


R


E


S


S





-c



A

R

G

1

ARG1






A


R


G


1






}

在这里插入图片描述

修改/usr/local/nagios/etc/objects/contacts.cfg(定义监控服务器联系人)

#vi /usr/local/nagios/etc/objects/contacts.cfg

在这里插入图片描述

define contact{


contact_name zs

alias zs

service_notification_period 24×7

host_notification_period 24×7

service_notification_options 24×7

host_notification_options 24×7

service_notification_commands notify-service-by-email

host_notification_commands notify-host-by-email

email 724058013@qq.com

}

define contactgroup{


contactgroup_name zs

alias zs

members zs

}

新建/usr/local/nagios/etc/objects/hostgroups.cfg(定义主机组)

#vi /usr/local/nagios/etc/objects/hostgroups.cfg

define hostgroup{


hostgroup_name mysql

alias mysql

members 192.168.152.130

}

在这里插入图片描述

在/usr/local/nagios/etc/conf下面新建192.168.1.20.cfg文件(用于监控192.168.1.20的主机存活,负载,进程)(所有内容需要手工输入)



mkdir /usr/local/nagios/etc/conf



vi /usr/local/nagios/etc/conf/192.168.152.130.cfg

define host {


host_name 192.168.152.130 被监控主机的名称,最好别带空格

alias 192.168.152.130 别名

address 192.168.152.130

check_command check-host-alive

max_check_attempts 5

check_period 24×7

contact_groups zs

notification_period 24×7

notification_options d,u,r

}

define service {


host_name 192.168.152.130

service_description check-host-alive

check_command check-host-alive

max_check_attempts 5

normal_check_interval 2

retry_check_interval 2

check_period 24×7

notification_interval 10

notification_period 24×7

notification_options w,u,c,r

contact_groups zs

}

define service {


host_name 192.168.152.130

service_description check-procs

check_command check_nrpe!check_total_procs

max_check_attempts 3

normal_check_interval 2

retry_check_interval 2

check_period 24×7

notification_interval 10

notification_period 24×7

notification_options w,u,c,r

contact_groups zs

}

define service {


host_name 192.168.152.130

service_description check-load

check_command check_nrpe!check_load

max_check_attempts 3

normal_check_interval 2

retry_check_interval 2

check_period 24×7

notification_interval 10

notification_period 24×7

notification_options w,u,c,r

contact_groups zs

}

在这里插入图片描述

在这里插入图片描述

命令解释:

define host{


use linux-server //定义使用的模板

host_name nagios //被监控主机的名称,最好别带空格

alias nagios //别名

address 127.0.0.1 //被监控主机的IP地址

check_command check-host-alive

normal_check_interval 3 //正常检测间隔时间

retry_check_interval 2 //重试检测间隔时间

//监控的命令check-host-alive,这个命令来自commands.cfg,用来监控主机是否存活

max_check_attempts 5 //检查失败后重试的次数

check_period 24×7 //检查的时间段24×7,同样来自timeperiods.cfg中定义

notification_interval 10 //提醒的间隔,每隔10秒提醒一次

notification_period 24×7 //提醒的周期, 24×7,同样来自timeperiods.cfg中定义

contact_groups admins //联系人组,上面在contactgroups.cfg中定义的admins

notification_options d,u,r //指定什么情况下提醒

重启nagios服务:

#service nagios restart

Web中访问nagios服务:

在这里插入图片描述

配置被监控端(192.168.152.130的mysql):

安装nagios插件(在130上操作):

#yum -y install gcc* openssl openssl-devel

#useradd nagios

#tar zxf nagios-plugins-2.1.1.tar.gz

#cd nagios-plugins-2.1.1

#./configure –prefix=/usr/local/nagios

#make && make install

#chown -R nagios.nagios /usr/local/nagios/

#tar zxf nrpe-3.2.1.tar.gz

#cd nrpe-3.2.1

#./configure –prefix=/usr/local/nagios/

#make all && make install-plugin && make install-daemon

修改配置文件,添加nagios服务器地址:

#cp /usr/local/src/nrpe-3.2.1/sample-config/nrpe.cfg /usr/local/nagios/etc/

#/usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg –d

#vi /usr/local/nagios/etc/nrpe.cfg

allowed_hosts=127.0.0.1, 192.168.152.136

在这里插入图片描述

启动nrpe:

#/usr/local/nagios/bin/nrpe -c /usr/local/nagios/etc/nrpe.cfg –d

在nagios服务器上测试nrpe运行是否正常:

#/usr/local/nagios/libexec/check_nrpe -H 192.168.152.130

NRPE v3.2.1

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述



版权声明:本文为xiaowoniuwzx原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。