现在的位置: 首页 > 综合 > 正文

循环渐进Nagios—原理篇(一)Nagios简介

2017年11月28日 ⁄ 综合 ⁄ 共 2220字 ⁄ 字号 评论关闭

    Nagios是一款开源的免费网络监视工具,能有效监控Windows、Linux和Unix的主机状态,交换机路由器等网络设置,打印机等。在系统或服务状态异常时发出邮件或短信报警第一时间通知网站运维人员,在状态恢复后发出正常的邮件或短信通知。


一、  简介

    Nagios是一个监视系统运行状态和网络信息的监视系统。Nagios能监视所指定的本地或远程主机以及服务,同时提供异常通知功能等。Nagios可运行在Linux/Unix平台之上,同时提供一个可选的基于浏览器的WEB界面以方便系统管理人员查看网络状态,各种系统问题,以及日志等等。


二、  功能介绍

   Nagios 可以监控的功能有:

1、监控网络服务(SMTP、POP3、HTTP、NNTP、PING等);

2、监控主机资源(处理器负荷、磁盘利用率等);

3、简单地插件设计使得用户可以方便地扩展自己服务的检测方法;

4、并行服务检查机制;

5、具备定义网络分层结构的能力,用"parent"主机定义来表达网络主机间的关系,这种关系可被用来发现和明晰主机宕机或不可达状态;

6、当服务或主机问题产生与解决时将告警发送给联系人(通过EMail、短信、用户定义方式);

7、可以定义一些处理程序,使之能够在服务或者主机发生故障时起到预防作用;

8、自动的日志滚动功能;

9、可以支持并实现对主机的冗余监控;

10、可选的WEB界面用于查看当前的网络状态、通知和故障历史、日志文件等。

三、  Nagios版本历史

    Nagios虽然是开源的,但是也接受捐助或通过销售商业产品来维持整个开源项目的运转,如下截图所示,它提供DIY、Student、Professional、Bussiness四个版本,其中DIY版本是免费的,提供的功能也相对于其它版本要少一些。


Nagios版本发布历史:

1、2009年08月13日,企业监控系统 Nagios 3.2.0 发布。

2、2010年10月05日,Nagios 3.2.3 发布,企业级监控系统。

3、2012年05月08日,Nagios 3.4.0 发布,企业级监控系统。

4、2012年05月14日,Nagios 3.4.1 发布。

5、2012年12月01日,Nagios 3.4.3 发布,企业级监控系统。

6、2013年01月18日,Nagios 3.4.4 发布,企业级监控系统。

7、2013年03月18日,Nagios 3.5.0 发布,企业级监控系统。

四、Nagios工作原理

    Nagios的功能是监控服务和主机,但是它自身并不包括这部分功能,所有的监控、检测功能都是通过各种插件来完成的。

    启动Nagios后,它会周期性的自动调用插件去检测服务器状态,同时Nagios会维持一个队列,所有插件返回来的状态信息都进入队列,Nagios每次都从队首开始读取信息,并进行处理后,把状态结果通过web显示出来。

    Nagios提供了许多插件,利用这些插件可以方便的监控很多服务状态。安装完成后,在nagios主目录下的/libexec里放有nagios自带的可以使用的所有插件,如,check_disk是检查磁盘空间的插件,check_load是检查CPU负载的,等等。每一个插件可以通过运行./check_xxx –h 来查看其使用方法和功能。

1、Nagios 4种状态返回信息

Nagios可以识别4种状态返回信息

(1)0(OK)表示状态正常/绿色;

(2)1(WARNING)表示出现警告/黄色;

(3)2(CRITICAL)表示出现非常严重的错误/红色;

(4)3(UNKNOWN)表示未知错误/深黄色。

Nagios根据插件返回来的值,来判断监控对象的状态,并通过web显示出来,以供管理员及时发现故障。

2、四种监控状态


3、报警功能

    如果监控系统发现问题不能报警那就没有意义了,所以报警也是nagios很重要的功能之一。但是,同样的,Nagios 自身也没有报警部分的代码,甚至没有插件,而是交给用户或者其他相关开源项目组去完成的。


五、Nagios安装

    Nagios安装,是指基本平台,也就是Nagios软件包的安装。它是监控体系的框架,也是所有监控的基础。

    打开Nagios官方的文档,会发现Nagios基本上没有什么依赖包,只要求系统是Linux或者其他Nagios支持的系统。不过如果你没有安装apache(http服务),那么你就没有那么直观的界面来查看监控信息了,所以apache姑且算是一个前提条件。关于apache的安装,网上有很多,照着安装就是了。安装之后要检查一下是否可以正常工作。

   知道Nagios 是如何通过插件来管理服务器对象后,现在开始研究它是如何管理远端服务器对象的。Nagios 系统提供了一个插件NRPE。Nagios 通过周期性的运行它来获得远端服务器的各种状态信息。它们之间的关系如下图所示:



六、Nagios通过NRPE来远端管理服务

1. Nagios执行安装在它里面的check_nrpe 插件,并告诉check_nrpe 去检测哪些服务。

2. 通过SSL,check_nrpe连接远端机子上的NRPE daemon

3. NRPE 运行本地的各种插件去检测本地的服务和状态(check_disk,..etc)

4. 最后,NRPE 把检测的结果传给主机端的check_nrpe,check_nrpe 再把结果送到Nagios状态队列中。

5. Nagios依次读取队列中的信息,再把结果显示出来。

抱歉!评论已关闭.