V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Livid
V2EX  ›  DevOps

Ping.gg

  •  
  •   Livid · 2014-12-20 20:27:20 +08:00 · 5479 次点击
    这是一个创建于 3659 天前的主题,其中的信息可能已经有所发展或是发生改变。
    一个界面很简单的服务器监控工具。

    https://ping.gg/
    10 条回复    2014-12-26 22:02:04 +08:00
    ytf4425
        1
    ytf4425  
       2014-12-20 20:29:09 +08:00
    有API么可以考虑给我的网站加个
    Livid
        2
    Livid  
    MOD
    OP
       2014-12-20 20:32:51 +08:00   ❤️ 1
    我觉得看这类服务最有趣的方面就是他们如何判定一台机器 down 和 up 的逻辑。

    想清楚这背后的逻辑的话,自己实现一个也是很简单的,难的是在运维上保证这样的东西不会挂。
    spance
        3
    spance  
       2014-12-20 20:52:17 +08:00
    这是基于icmp回应的,只能检测网络是否在线是否死机之类。
    对于一个app server需要做应用层检测,往往app daemon进程挂掉是高于服务器挂掉的。
    hjc4869
        4
    hjc4869  
       2014-12-20 21:03:31 +08:00
    @spance 如果是Azure这种不能用ICMP的,那就没办法了。。
    spance
        5
    spance  
       2014-12-20 21:11:43 +08:00
    @hjc4869 是的,azure的网关禁止了icmp,而且还是nat,基于简单的icmp是不可行的。
    阿里监控其实还不错,有不少的应用层监控,还有直接tcp/udp方法,还是不错的。
    9hills
        6
    9hills  
       2014-12-20 22:43:32 +08:00   ❤️ 1
    基于ICMP的判断是不准确的,实际使用的时候,一般会加上22端口的检查来综合判断机器存活。

    应用层另谈。

    P.S. 说句题外话,厂内的监控是这么分的:

    采集项:
    ——机器(不可定制):
    ————机器存活、22端口、CPU/MEM/DISK/RAID/NET/..... 各种参数
    ——服务(可定制):
    ————进程信息,日志信息提取(正则),端口监控信息等等

    监控策略:
    ——对各种采集项,设定策略,可以对各种采集项之间进行逻辑运算,达到条件则触发报警。同时也可以设定一些比如N次中有M次达到条件,才触发报警;报警之间优先关系,比如死机报警会覆盖掉其他报警,避免死机时出现大量报警 等等高级规则

    报警策略:
    ——定制各种报警策略(FATAL/ERROR/INFO等),包含电话/短信/邮件的通知人设定,报警升级设定(超过X时间后报警持续则升级到下一批报警接收人),最大报警次数,报警静默时间等等

    不知道商业报警服务有没有类似的。。
    yanqian
        7
    yanqian  
       2014-12-20 22:54:08 +08:00 via Android
    @9hills 请问你们的监控报警是基于Nagios或者Zabbix么?
    9hills
        8
    9hills  
       2014-12-20 22:57:48 +08:00
    @yanqian 自己做的,开源的都用过,实话说还是厂里做的好。现在开源的监控感觉大多很原始
    typcn
        9
    typcn  
       2014-12-21 03:03:37 +08:00 via iPad
    我用的 uptimerobot

    有 api 免费

    效果 http://status.eqoe.cn
    yanqian
        10
    yanqian  
       2014-12-26 22:02:04 +08:00
    @9hills 很有兴趣多了解些你们监控系统的特点,能简单介绍下么?
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5369 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 07:30 · PVG 15:30 · LAX 23:30 · JFK 02:30
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.