登录
注册
node.js 学习社区

博客 | 告警管理

  • 信息大爆炸的时代,互联网企业的运维人员每天都要处理成千上万的信息。如何处理这种纷繁复杂的情况?面对各种运维事件,想获得足够的告警信息,单一的监控系统往往是不够的。而告警的问题若得不到及时的发现与处理,就很容易收到用户投诉。 告警风暴 告警风暴来临,信息无法聚合 日新
    2020-01-02 17:42 睿象云 0 回复 133 浏览
  • Nagios 是一个插件式的监控系统,可以监控服务的运行状态和网络信息等,并能监视所指定的本地或远程主机参数以及服务,同时提供异常告警通知功能等。Nagios 支持客户端的数据采集,通过编写客户端插件,可以获取各种监控数据,并提供了 Web 管理界面进行数据查询。其产品的主要功能侧重于监控服务的可用性,根据设置的阀值进行告警,但大部分告警逻辑都是通过监控插件实现的。 目前 Nagios
    2019-12-12 17:08 睿象云 0 回复 451 浏览
  •     在当下互联网蓬勃发展的时代里,微信已经成为了人们生活中不可分割的一部分。作为苦逼的运维人员,我们自然也得跟得上时代的步伐,将微信添加进告警的通知方式里。如果能够将告警消息第一时间发送到微信中,更清楚地看到告警内容,并在第一时间进行处理,何乐而不为呢⊙(・◇・)? 不过碍于告警设置的繁琐,特别现在运维人员的头顶普遍日益荒凉的时候,确实不想再花
    2019-11-22 11:40 睿象云 0 回复 393 浏览