以上系列文章,均以开源监控系统——夜莺监控为例,你也可以对照 Prometheus 或者 zabbix 做相关的理解。
基于夜莺监控制作的一些 dashboard ,可以参考如下:
- K8s apiserver dashboard with nightingale
- K8s scheduler dashboard with nightingale
- K8s controller manager dashboard with nightingale
- K8s etcd dashboard with nightingale
Append:
追加一篇文章《Zabbix 和夜莺监控选型对比》,来自Zabbix社区专家张世宏,张世宏也是Nightingale社区活跃贡献者。
文章作者:张世宏,开源报表 ZbxTable开发者,使用 Zabbix 超过 8 年,Zabbix 资深用户,优质内容创作者。开源项目夜莺监控|Nightingale活跃贡献者。
1
LeoJ 2022-10-04 21:23:48 +08:00 1
支持一下 open-falcon~
|
3
crazychang 2022-10-04 22:42:23 +08:00 1
收藏即学习
|
4
YaakovZiv 2022-10-04 23:01:35 +08:00
除了微信公众号,还有其他地方可以看吗,微信公众号加载挺慢的,有你们自己的博客网站吗
|
5
laiwei OP |
6
pavelpiero 2022-10-05 07:00:48 +08:00 via iPhone
原生监控只是开始 后续需要做针对性地开发
|
7
plko345 2022-10-05 12:17:42 +08:00 via Android
为什么不用云原生的 prometheus ,国际化一点
|
8
laiwei OP @plko345 Prometheus 是一个挺好的工具,但是也存在一些痛点:
1. 功能相对单一,产品化程度低,难以开箱即用; > 举个例子:可视化一般必须配合 grafana 来工作,告警一般也需要配合 alert manager 来一起工作,且告警策略的改动都需要修改配置文件。夜莺监控把数据采集、可视化、告警管理这些基本能力,都做成了 all-in-one 的产品化方案。 2. 数据量过大时,官方缺乏合适的扩展性方案; 3. 多集群管理功能缺失; |
9
laiwei OP @pavelpiero
是的,业务层面的监控,很多需要在业务代码层面主动埋点(不过好消息是埋点的工作量,借助于 open telemetry ,已经可以降低到足够低了,且都是标准化的方案) 但是对于各种基础设施、中间件、云资源,这些监控,不需要百花齐放百家争鸣,尽可能选择最佳实践,开箱即用是更好的。 |
10
laiwei OP 看到很多 v 友收藏,谢谢,我会继续 append 这个主题。
|
11
wsszh 2022-10-28 18:50:43 +08:00 1
支持
|
12
wuleiisme 2022-10-30 19:47:32 +08:00 1
看起来挺不错,最近正好有需求
|
13
laiwei OP 追加一篇文章《 Zabbix 和夜莺监控选型对比》 http://flashcat.cloud/blog/zabbx-vs-nightingale/,来自 Zabbix 社区专家张世宏,张世宏也是 Nightingale 社区活跃贡献者。
|