资讯专栏INFORMATION COLUMN

Zabbix 集成 OneAlert 实现全方位告警

fai1017 / 803人阅读

摘要:前言告警将重要信息发送给运维或者其他相关人,及时发现并且处理问题。在所有开源监控软件里面,的告警方式无疑是最棒的。在发生告警之后立即发送邮件和微信消息给用户,分钟后还未确认,那么发送短信,分钟还未确认则打电话给用户。

1. 前言

告警将重要信息发送给运维「或者其他相关人」,及时发现并且处理问题。在所有开源监控软件里面,Zabbix 的告警方式无疑是最棒的。告警的方式各式各样,从 Email 告警到飞信、139/189邮箱、最后到微信甚至电话告警,接入存在各种问题以及困难,有没有什么软件能够将他们All In one呢?OneAlert

2. Zabbix传统告警方法

Email:调用 sendmail 、sendEmail 等脚本通过 SMTP 发送邮件

飞信:飞信已经退出历史舞台,不再有人使用

189/139:发送邮箱邮件至邮箱,邮箱将短信转到用户手机短信,存在一定的延迟

微信:需要申请一个微信公众号,并接入API,整个流程比较复杂,而且存在会话时间限制

短信:众多短信网关收费不同、稳定性也不确定,需要通过API接入

3.传统告警 VS OneAlert

在整个使用过程中,得出了传统告警方式的不足以及给个了 OneAlert 告警的功能,具体如下:

3.1 传统告警方式的不足

Zabbix 邮件告警经常发不出去

如需短信告警,要么购买短信猫要么购买短信 API,整个流程太麻烦

微信告警需要申请公众号以及 API 接入,而且会话有时间限制

夜间的告警基本成为一个摆设,试问谁能被微弱的短信声叫醒

阿里云、腾讯云、Zabbix 各种系统告警都需要多带带配置,工作繁琐

普遍缺少告警分析

139/189 发送告警存在明显的延迟

3.2 OneAlert告警功能

告警 All In One,支持微信、邮箱、短信、APP、电话告警

支持接入 Zabbix、Nagios、阿里云、腾讯云、监控宝等等告警信息

灵活的分配策略,可灵活的分配告警信息发送给相关人员

微信、邮箱、app 等告警方式全部免费

4.接入准备

由于 Zabbix 官方已经升级到zabbix-3.0.0alpha,考虑到未来的趋势,我也迫不及待的升级到了 3.0,除了 Web 风格变化,大部分都差不多。所以本文适用于 Zabbix2.x 与 Zabbix3.x 版本。接下来跟着凉白开将 OneAlert 接入 Zabbix,如有任何疑问或者不足,欢迎加群或者在 ttlsa.com 留言一起交流!

5. OneAlert 后台操作 5.1 设置提醒

邮件,短信,微信,电话提醒,多策略提醒,如下图,灵活的定义告警规则。在发生告警之后立即发送邮件和微信消息给用户,10分钟后还未确认,那么发送短信,30分钟还未确认则打电话给用户。

5.2 设置分派策略

可以设定做种分派策略,在告警第一时间发送通知给哪些人,如果在 30 分钟还未处理好,可以将消息发送给上级主管人员,如下图

5.3 创建应用

登陆 OneAlert 后台,点击告警 -> 应用 -> 新增应用,集成类型包含阿里、Nagios、腾讯云等多种,我们选择 Zabbix 最后保存即可。将会生成应用 KEY,Key 在后面将会被用到!

6.安装onealert agent
#cd /usr/local/src/
# wget http://cdn.110monitor.com/open/download/alert-agent-4.0.1-RC2.tar.gz
# tar –xvf alert-agent-4.0.1-RC2.tar.gz(注意:参数为-xvf,不是-xzvf)
# cp -rp alert-agent /usr/local/zabbix-3.0.0/alertscripts
# cd /usr/local/zabbix-3.0.0/alertscripts
# cp alert-agent/plugin/zabbix-plugin/110monitor .
# chmod +x ./110monitor
7. Zabbix 集成OneAlert

以下操作均在 Zabbix Web 后台完成

7.1 创建 OneAlert 媒介

administration->Media Types->create media type,如下图

7.2 Admin 用户添加 OneAlert 媒介

Administration->Users->Admin->点击media->Add,输入如下:send to 为 OneAlert 后台生成的 key

7.3 创建触发器

点击Configuration->Action->create action

主题为triggerresolve,意味着告警触发和恢复都会同步到 110monitor

设置告警内容,注意冒号「:」前的内容不可变更,冒号「:」后的内容可以自行编辑,只能使用以下7调告警信息,否则告警无法发送至 OneAlert 接口

 `alarmName:{TRIGGER.NAME}`

 `entityName:{HOSTNAME}`

` entityId:{IPADDRESS}`

 `value:{TRIGGER.VALUE}`

 ` eventId:{EVENT.ID}`

 `priority:{TRIGGER.SEVERITY}`

 `alarmContent:{IPADDRESS} `

 `{ITEM.NAME}:{ITEM.VALUE}`

8. Zabbix + OneAlert 集成测试

来制造一个故障,选定一台 Zabbix 客户端,执行如下命令:

# killall zabbix_agentd

等候五分钟,OneAlert 后台有如下告警

并且也收到了微信(需要关注公众号,并且绑定账号)和短信告警

9. OneAlert 告警分析

提供了一份 Zabbix 等开源监控都没有的告警信息分析,运维能清晰的掌握最近服务器状态

10. 总结

OneAlert与Zabbix的集成就说到这,如有任何疑问或者不足,欢迎加群或者在 ttlsa.com 留言一起交流!

作者:凉白开 网址:http://www.ttlsa.com

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/7926.html

相关文章

  • 全球说:要给 OneAlert 点100个赞

    摘要:也有幸和全球说运维负责人李云伟先生进行一次深入沟通。面临挑战全球说的应用主要是在线系统和移动为主。是北京科技有限公司旗下产品,中国首个模式的,集成国内外主流监控支撑系统,实现一个平台上集中处理所有事件,提升可靠性。 客户背景 「全球说」 Talkmate,是北京酷语时代教育科技有限公司(酷语科技)旗下产品,酷语科技是一家诞生于中国的语言技术公司,致力于为全球用户提供一个全新的多语言学习...

    txgcwm 评论0 收藏0
  • 如何把关联性的告警智能添加到 Nagios 上?(2)

    摘要:告警关联唯一使监控和报警都步入正轨的好办法,就是通过告警关联。企业如果适应了告警关联,信息告警的图表盘上确实能减少很多压力。 上节回顾 对于许多 IT 和运维团队来说,Nagios 既是一个福音也是一个诅咒。一方面,Naigos 在 IT 应用的工作领域中,给予了你可以实时查看告警数据的可能性;但是另一方面,Nagios 也能够生成超级多的告警,对于任何一个运维人员或是运维团队来说都是...

    娣辩孩 评论0 收藏0
  • 有效运维的 on-call 机制

    摘要:如何有效处理紧急事件驱动的工作,成为特别是运维主管运维工作的关键。通知到位和及时响应。机器学习领域是未来的重要发展方向,目前我们还在摸索中。机器学习告警合并事件单的处理如果告警量很大,告警后续处理和跟踪往往会依赖于外部团队部门外或公司外。 编者按]本文作者为陈伯龙,云告警平台[OneAlert创始人,著《云计算与OpenStack》,在IT运营管理、云计算方面从业10多年。 正文 互联...

    binaryTree 评论0 收藏0
  • 有效运维的 on-call 机制

    摘要:如何有效处理紧急事件驱动的工作,成为特别是运维主管运维工作的关键。通知到位和及时响应。机器学习领域是未来的重要发展方向,目前我们还在摸索中。机器学习告警合并事件单的处理如果告警量很大,告警后续处理和跟踪往往会依赖于外部团队部门外或公司外。 编者按]本文作者为陈伯龙,云告警平台[OneAlert创始人,著《云计算与OpenStack》,在IT运营管理、云计算方面从业10多年。 正文 互联...

    DirtyMind 评论0 收藏0
  • OneAPM 云监控部署与试用体验

    摘要:作为骨灰级粉丝,一直以来对第三方监控都是拒绝的。例如白屏时间首屏时间脚本错误网页加载就绪时间各种浏览器的访问情况,甚至能了解不同浏览器运营商地区用户的访问状况。脚本错误在所难免,错误进一步导致网站部分功能无法使用。 作为 Zabbix 骨灰级粉丝,一直以来对第三方监控(APM)都是拒绝的。一来觉得收费,二来担心数据被人所知,三来觉得 Zabbix 牛逼到无可取代。但是,随着 APM 市...

    Tecode 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<