合作机构:阿里云 / 腾讯云 / 亚马逊云 / DreamHost / NameSilo / INWX / GODADDY / 百度统计
先说明下RocketMQ版本, 4.6.0的老版本了。
线下环境客户端启动会频繁报错响应超时,导致consumer实例化失败,无法启动应用。
图片
确认线下环境RocketMQ集群流量、生产消费数量无异常。
集群gc次数不多,但是耗时高。(原本监控看板异常数据缺失,所以少了前面一段)
图片
master节点cpu使用率、load极高。
图片
升配,4c8g升级8c32g,扩大jvm内存。
系统指标略有下降,但是客户端异常没有明显改善。
只能进一步排查根因,还得上arthas。
thread -n 3
TOP