我真几把受不了了 这样的服务端: 乌班图 24 客户端 1: debian12 客户端 2: centos7 客户端一,客户端主机名:msl1 ,然后自动注册条件是包含 msl ,注册不上,然后用匹配,匹配 msl 就可以了卧槽了然后删了注册到的主机又试了一次包含又行了?!
客户端二,离谱的事情来了,
客户端配置:
[root@mha0 scripts]# grep -Ev '^#|^$' /etc/zabbix/zabbix_agentd.conf PidFile=/run/zabbix/zabbix_agentd.pid LogFile=/var/log/zabbix/zabbix_agentd.log LogFileSize=0 AllowKey=system.run[*] Server=10.33.0.1 ServerActive=10.33.0.1 HostnameItem=system.hostname AllowRoot=1 Include=/etc/zabbix/zabbix_agentd.d/*.conf
然后服务端日志疯狂的报:
`
57342:20240722:115112.559 cannot send list of active checks to "10.2.0.0": host [mha0] not found
客户端疯狂的报:
40610:20240722:195037.476 no active checks on server [10.33.0.1:10051]: host [mha0] not found
但是我明明都能在服务端:
root@msl:~# zabbix_get -s 10.2.0.0 -k "system.run[hostname]"
mha0
` 我快气哭了,有经验的大佬快来救救我
1
bronyakaka 149 天前
只用过 prometheus grafana
|
2
Int100 149 天前
只用过 prometheus grafana +1
|
3
ClericPy 149 天前
最近两年有幸用过,实在是费劲。。。无奈下线了。你这报错问问大模型吧,说 mha0 没注册成功
EKF/ELK + prometheus 配合云原生都成版本答案了 |
4
daimaosix 149 天前 via Android
关键我也真几把受不了啊
|
5
PolarBears 149 天前
zabbix 一开始我也用过一年,后来就都换 Prometheus 了
|
6
Qetesh 149 天前
服务端上主机的主机名称不对
|
7
CivAx 149 天前
首先你为啥要用 zabbix… 你用的也都全是新的或者近代的系统,实在犯不上用 Zabbix
|
8
R0n1n 149 天前 via Android
LibreNMS
|
9
vuv 149 天前
我使用 debian 搭建过 zabbix ,用了下,不习惯,就没研究了。
|
10
paxnil 149 天前
日志和 zabbix_get 说明客户端主机名是 mha0 ,不是 msl1 ,服务端没有配置名为 mha0 主机。
|
11
waringid 149 天前
应该是 zabbix 客户端获取的主机名称和你配置的主机名称不一致。先检查主机名是否一致,看看 /etc/hosts 里有没有对应的主机名称
|
12
laminux29 149 天前
zabbix 虽然用户体验一般,但也不至于这种最简单的部署都存在问题。
如果是第一次部署 zabiix ,你其实可以让 gpt4 全程协助你部署,有问题就及时问 gpt4 。虽然 gpt4 有时候偶尔智障,但基本部署以及解决基本问题,还是可以的。 |
13
offswitch 149 天前
切换成 promethues ,现在都用 Prometheus 了,zabbix 以前比较流行,现在不怎么样。
|
14
Hopetree 149 天前
zabbix 这种老掉牙的东西还有人用啊,promethues+grafana 搞起
|
15
zyq2280539 149 天前
我个人是用 zabbix,折腾久了也就有经验了,首先要在服务器端设置一个主机 host 标记,然后其他客户端都需要配置这个 host ,才可以。就一个配置问题
|
16
zyq2280539 149 天前
上面说的这个 hosts 是指/etc/zabbix/web/zabbix.conf.php 里面的$ZBX_SERVER_NAME ,这个是服务端的标记,所有客户端想要顺利链接都需要配置 hosts 为相同值而已,值就是一个字符串随便起名
|
17
JontyChen 149 天前
上 prometheus 早日解脱
|
18
frencis107 149 天前
prometheus +1
op 试试吧,非常好用 |
19
McreeWu 149 天前
zabbix 配置起来真是麻烦,调试也麻烦,性能又一般,确实推荐 prometheus 。
|
20
huangmingyou 149 天前
为啥要用这个化石
|
21
s270987763 149 天前
1. 用了客户端主动上报模式;
2. 日志报错 很明显是主机未能注册成功,无法发送主动上报的监控项; 3. zabbix agent 配置 中主机名与 zabbix server web 配置中主机名不一致; 4. 检查自动发现规则 |
22
ladeo 149 天前
zabbix 很好用啊。估计 op 不是运维人员。
服务器<1000 台基本都 ok 。 zabbix 都不好用的话,naggios 不是更不好用了吗? |
23
liuliancao 149 天前
第一个问题 有没可能是自动发现轮询间隔导致的 自动发现也可以设置 ip 段 要稍微等等
第二个问题 客户端配置的 active 模式,你添加资产的时候 看下是不是选择了被动模式 https://blog.51cto.com/qixue/category7.html 可以参考下我很久前写的 不过现在版本变化太大了 思路是差不多的 不少 idc 都在使用,zabbix 还是挺好用的哈 使用这些肯定需要慢慢才会熟悉的 多折腾折腾 多 google 下 如果还觉得受不了 也可以试用下 promethues 或者其他监控软件 |
24
8355 148 天前
zabbix 那复杂的界面 不会用上手极为费劲
prometheus + grafana 拥抱现代化吧。。 |
25
Sharuru 148 天前
借楼求问 prometheus 有没有开箱即用的报警规则?
|
27
miaosl OP @paxnil 可能没说清楚,客户端 2 是 mha0 客户端 1 是 msl1 ,这个没问题的,我发现是因为我添加了自动注册条件导致的,但是讲道理这个自动注册条件为啥会报错
|
28
miaosl OP @s270987763 是自动注册,我昨天看了一下,自动注册的条件是非必填项目,但是我填了,
不填条件的化都能自动注册的,但是这个自动注册的条件到底是怎么用的 |
30
FlytoSirius 148 天前
很多年前,Zabbix 和 Nagios 还很流行, 云计算也并不普遍, 当时部署使用 Zabbix 管理我们的单位的数据中心。
这么多年过去了, 现在做决策说还要用 Zabbix 的, 可能也都算是老头子了吧 。。。 |
31
yulgang 148 天前
我没遇到过这种问题。
agent 配置文件里的 hostname 要配置对,和 server 端网页里对应这个主机的 Host name 要一致,我习惯添 agent 端的 IP 地址。 自动注册时 agent 配置文件里的 HostMetadata 也要设置对,然后 server 端网页上的自动注册的 Conditions 里配置 Host metadata contains XXXX ,Operations 里可以: Add to host groups: YYYY ; Remove from host groups: Discovered hosts ; Link to templates: TTTT 这样就把 HostMetadata 里包含 XXXX 的主机自动添加到 YYYY 组里,如然后从自动注册分组里删掉这个主机,关联监控模板 TTTT host [mha0] not found 猜测是你的 agent 端 hosts 里没配置这个主机名的记录 |
33
miaosl OP @yulgang 大哥,我最后是把 server 端的自动注册的条件取消了之后就可以了,因为我最开始学的时候,好像那个自动注册条件是就不需要配置?
还是说这个自动注册的条件是对已经注册成主机的经行赛选分类的? |
34
263 148 天前
看你的参数,只有 HostnameItem ,没有 Hostname ,这是不正确的配置。
zabbix 建议即使设置了 HostnameItem=system.hostname ,也需要是指正确的 Hostname= mha0 。HostnameItem=system.hostname 是用来指定获取 hostname 的方法,而不是设置 hostname 。 agent 的部署推荐使用 ansible 等来批量部署,直接获取系统变量填写,不要使用 HostnameItem=system.hostname 这种方式 |
35
liuliancao 147 天前
|