3.0 KiB
【E21-OLAP】 BOL-IGW-KVM-DT0001 10.225.12.4 近期每天频繁报OLAP CPU Usage告警
| ID | Creation Date | Assignee | Status |
|---|---|---|---|
| OMPUB-558 | 2022-07-15T21:06:39.000+0800 | 戚岱杰 | 已关闭 |
近7天内NZ上关于 BOL-IGW-KVM-DT0001 10.225.12.4 OLAP CPU Usage告警消息出现168次。 qidaijie commented on 2022-07-20T18:18:07.582+0800:
排查后现象如下: 1:现场当前版本告警持续周期为1分钟,报出无效告警较多。 2:以MWV-IGW为例: 通过监控观察到日志量峰值可到14W/S;文件写入请求较多,已经达到了限流配置(响应码429为限流)。 !image-2022-07-20-18-19-47-434.png|thumbnail! !image-2022-07-20-18-19-54-826.png|thumbnail!
解决方案: 基于现在的版本和总体日志量,没有特别有效的方式修复此问题;需要等待22.07版本更新。 1:会对告警周期进行调整,防止无效告警。 2:数据处理和对象存储在新版本中有一定的性能优化。
liuju commented on 2022-07-21T22:01:07.971+0800:
因现场告警过于频繁,是否可以在22.07版本升级前,先进行第一条(1:会对告警周期进行调整,防止无效告警。)更新,相对降低告警次数。
qidaijie commented on 2022-07-26T09:57:29.272+0800:
告警修改方式: 1:登录NZ告警规则界面,找到ID为221 Name为OLAP CPU Usage的告警,点击编辑。 2:将Duration (s)的值修改为300,保存即可。 !告警规则修改样例.png|thumbnail!
后续在更新22.07时,会将事务日志关闭(TRANSACTION-RECORD),以缓解分中心压力。
liuju commented on 2022-07-26T15:06:09.061+0800:
OLAP CPU Usage告警规则的Duration (s)的值已修改为300
qidaijie commented on 2022-08-16T14:00:01.556+0800:
修改后,近期未再出现频繁告警的情况;等待后续升级到22.07版本后,再持续观察各分中心资源使用情况。
Attachments
Attachment: alert-message-2022-07-15+15-46-09.xlsx
alert-message-2022-07-15+15-46-09.xlsx
Attachment: image-2022-07-20-18-19-47-434.png
Attachment: image-2022-07-20-18-19-54-826.png
Attachment: 告警规则修改样例.png
Attachment: 微信图片_20220715155412.png



