调整前:

调整前

队列太高引起的一些故障:

1. 历史数据出现断点
2. 队列积压导致数据写入延迟

排错思路

1. 提高ZABBIX服务器的配置(建议能上SSD尽量上SSD)
2. 查看代理和数据库所在的主机性能,CPU、内存、网络、IO指标是否都正常
3. 查看Proxy返回的日志(很重要)
4. 根据节点主机数调整配置参数
5. 通过队列的“细节”选项,查看堵塞的监控项情况

排查过程

1. 优化zabbix_server.conf配置文件

# 增大向数据库同步的进程数
StartDBSyncers=32 

# 增大子进程与代理端通信数
StartProxyPollers=20
2. 查看proxy的日志

日志

通过查询proxy日志发现日志中出现很多item的报错,跟随查看发现这个item配置有误,将其正确配置后,队列瞬间下降
3. 虽然队列已经恢复,但数据同步仍然出现延迟现象,最终重启zbx_server后解决
调整后截图:

调整后

Last modification:March 21st, 2020 at 02:45 pm