Files
geedge-jira/md/OMPUB-558.md
2025-09-14 22:27:11 +00:00

3.0 KiB
Raw Permalink Blame History

【E21-OLAP】 BOL-IGW-KVM-DT0001 10.225.12.4 近期每天频繁报OLAP CPU Usage告警

ID Creation Date Assignee Status
OMPUB-558 2022-07-15T21:06:39.000+0800 戚岱杰 已关闭

近7天内NZ上关于 BOL-IGW-KVM-DT0001 10.225.12.4  OLAP CPU Usage告警消息出现168次。 qidaijie commented on 2022-07-20T18:18:07.582+0800:

排查后现象如下: 1现场当前版本告警持续周期为1分钟报出无效告警较多。 2以MWV-IGW为例 通过监控观察到日志量峰值可到14W/S文件写入请求较多已经达到了限流配置(响应码429为限流)。 !image-2022-07-20-18-19-47-434.png|thumbnail! !image-2022-07-20-18-19-54-826.png|thumbnail!

解决方案: 基于现在的版本和总体日志量没有特别有效的方式修复此问题需要等待22.07版本更新。 1会对告警周期进行调整防止无效告警。 2数据处理和对象存储在新版本中有一定的性能优化。


liuju commented on 2022-07-21T22:01:07.971+0800:

因现场告警过于频繁是否可以在22.07版本升级前先进行第一条1会对告警周期进行调整防止无效告警。更新相对降低告警次数。


qidaijie commented on 2022-07-26T09:57:29.272+0800:

告警修改方式: 1登录NZ告警规则界面找到ID为221 Name为OLAP CPU Usage的告警点击编辑。 2将Duration (s)的值修改为300保存即可。 !告警规则修改样例.png|thumbnail!

后续在更新22.07时,会将事务日志关闭(TRANSACTION-RECORD),以缓解分中心压力。


liuju commented on 2022-07-26T15:06:09.061+0800:

OLAP CPU Usage告警规则的Duration (s)的值已修改为300


qidaijie commented on 2022-08-16T14:00:01.556+0800:

修改后近期未再出现频繁告警的情况等待后续升级到22.07版本后,再持续观察各分中心资源使用情况。


Attachments

Attachment: alert-message-2022-07-15+15-46-09.xlsx

alert-message-2022-07-15+15-46-09.xlsx

Attachment: image-2022-07-20-18-19-47-434.png

image-2022-07-20-18-19-47-434.png

Attachment: image-2022-07-20-18-19-54-826.png

image-2022-07-20-18-19-54-826.png

Attachment: 告警规则修改样例.png

告警规则修改样例.png

Attachment: 微信图片_20220715155412.png

微信图片_20220715155412.png