Files
geedge-jira/md/OMPUB-628.md
2025-09-14 22:27:11 +00:00

1.8 KiB
Raw Permalink Blame History

【E21现场】国家中心多台OLAP服务器持续内存告警

ID Creation Date Assignee Status
OMPUB-628 2022-09-19T15:23:08.000+0800 戚岱杰 已关闭

国家中心多台OLAP服务器持续告警仍在新增告警今天OLAP Server-20达到告警阈值。

以下是目前存在的告警消息:

OLAP Server-16

OLAP Server-17

OLAP Server-18

OLAP Server-19

OLAP Server-20

OLAP Server-21qidaijie commented on 2022-10-20T10:48:01.642+0800:

经排查,有以下两个问题:

告警发生时国家中心Kafka存在异常对Flink处理数据有较大影响。

Flink内存参数配置过高忽略了进程本身的内存占用导致在该配置下Flink可以申请的内存过多计算后占总内存的90%。

当前Flink计算实际平均使用内存占总内存的50%左右。 !Flink内存使用.png|thumbnail!

 


qidaijie commented on 2022-10-26T19:09:52.512+0800:

[~liuju] 针对该问题进行以下操作进行优化国家中心Flink内存使用 [^Flink内存优化文档.txt]


liuju commented on 2022-10-26T20:09:53.340+0800:

收到


liuju commented on 2022-10-29T01:08:11.297+0800:

有更新完毕。


liuju commented on 2022-10-31T15:52:14.069+0800:

目前观察内存正常,未再出现内存告警,先关闭该问题,会继续观察后续持续效果,若有异常再开启


Attachments

Attachment: Flink内存使用.png

Flink内存使用.png

Attachment: Flink内存优化文档.txt

Flink内存优化文档.txt