资讯专栏INFORMATION COLUMN

nagios使用nrpe监控磁盘遇到的问题

szysky / 725人阅读

摘要:通过查看我的磁盘使用情况,并没有发现有什么不妥,而且,,看起来也没有问题哦是不是有问题,于是,但是也不行最终解决的方法这个命令,生效了为什么呢你可以想一下,我今记录一下我的解决问题的过程。

问题描述

nagios配合nrpe用来监控机器中运行项目的具体情况,还包括磁盘、网络、负载均衡和数据库等具体的使用情况;

我遇到的问题:

使用docker-compose替换原来项目,将所有的进程docker化;

创建的docker镜像和docker-compose创建的containers都在/var/lib/docker目录下;

在使用docker-compose up的时候,出现警报 XXXXX(inode=-9999%)/var/lib/docker/containers/mounts=6037182531735MB;4830712380730;5434551428321;0;6038390475913

解决的过程遇到的坑

解决的思路:

首先想的是既然报磁盘没有空间的错误,那就需要看这个目录到底是谁占用了这么多的空间:查看的时候发现,/var/lib/docker/目录没有权限,不能查看,所以我一路开权限,然后chmod,知道看到的结果是征程很正常

接着因为权限打开,警报消除,但是当我重新docker-compose up的时候,加入新的镜像,又出现这个问题;无解

想通过忽略指定的文件,让他消失在我的眼前,于是找到了-i ·regex·;但是当我修改之后,出现了Unknown告警;

无解。。。。。

通过查看我的磁盘使用情况,并没有发现有什么不妥,而且,command[check_disk]=/usr/lib/nagios/plugins/check_disk -w 20% -c 10% -p /dev/vda1,看起来也没有问题哦;

是不是/dev/vda1/有问题,于是command[check_disk]=/usr/lib/nagios/plugins/check_disk -w 20% -c 10% -p /dev/vda1 -i "/dev/vda1/var/lib/dockder/",但是也不行

最终解决的方法
```command[check_disk]=/usr/lib/nagios/plugins/check_disk -w 20% -c 10% -p / -i "/var/lib/dockder/"```

这个命令OK,生效了!为什么呢?你可以想一下,我今记录一下我的解决问题的过程。

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/27854.html

相关文章

  • Nagios 安装及微信短信提醒

    摘要:或参考集成安装文档通过微信报警提供脚本命令插件,通过新增用户通知的方式,调用命令将告警通知发送至云告警平台,根据通知策略,分派和通知到用户,提供微信短信电话和邮件方式。 引言 Nagios 作为业界非常强大的一款开源监视系统。 监控网络服务(SMTP、POP3、HTTP、NNTP、PING 等); 监控主机资源(处理器负荷、磁盘利用率等); 简单地插件设计使得用户可以方便地扩展自己服...

    MoAir 评论0 收藏0
  • Centos-7下Nagios安装及配置(完整版)

    简介 Nagios 是一款自动化运维工具,可以协助运维人员监控服务器的运行状况,并且拥有报警功能。本文章将介绍其安装方法和详细的配置方法。 nagios 监控服务应用指南本地资源:负载,CPU,磁盘,内存。IO,RAID,温度,passwd文件变化,本地所有文件指纹识别网络服务:端口,URL,丢包,进程,网络流量其他设备:交换机,打印机,windows等。业务数据:用户登录失败次数,用户登录网站...

    hzx 评论0 收藏0
  • Centos-7下Nagios安装及配置(完整版)

    简介 Nagios 是一款自动化运维工具,可以协助运维人员监控服务器的运行状况,并且拥有报警功能。本文章将介绍其安装方法和详细的配置方法。 nagios 监控服务应用指南本地资源:负载,CPU,磁盘,内存。IO,RAID,温度,passwd文件变化,本地所有文件指纹识别网络服务:端口,URL,丢包,进程,网络流量其他设备:交换机,打印机,windows等。业务数据:用户登录失败次数,用户登录网站...

    wawor4827 评论0 收藏0
  • 五种令人沮丧告警垃圾及处理办法!

    摘要:在那些紧迫的告警中,找出需要立即处理的告警更则难上加难。是应用性能管理领军企业公司旗下产品,也是国内首个模式的云告警平台,集成国内外主流监控支撑系统,实现一个平台上集中处理所有事件,提升可靠性。 在 OneAlert,我们经常与运维团队聊天。因为产品开发过程中,这样的对话有助于了解客户的真正痛点。「告警垃圾」——监控系统中时常涌现的告警洪流,是运维团队经常提到的一大痛处。 至于其原因,...

    mushang 评论0 收藏0
  • 大数据技术Hadoop面试题,看看你能答对多少?答案在后面

    摘要:下列哪个是运行的模式答案单机版伪分布式分布式提供哪几种安装的方法答案判断题不仅可以进行监控,也可以进行告警。但是在预警以及发生事件后通知用户上并不擅长。错误分析一旦节点宕机,数据恢复是一个难题命令用于检测损坏块。 单项选择题1. 下面哪个程序负责 HDFS 数据存储。a)NameNodeb)Jobtrackerc)Datanoded)secondaryNameNodee)tasktracke...

    JerryC 评论0 收藏0

发表评论

0条评论

szysky

|高级讲师

TA的文章

阅读更多
最新活动
阅读需要支付1元查看
<