1.8 KiB
1.8 KiB
【E21现场】国家中心多台OLAP服务器持续内存告警
| ID | Creation Date | Assignee | Status |
|---|---|---|---|
| OMPUB-628 | 2022-09-19T15:23:08.000+0800 | 戚岱杰 | 已关闭 |
国家中心多台OLAP服务器持续告警,仍在新增告警,今天OLAP Server-20达到告警阈值。
以下是目前存在的告警消息:
OLAP Server-16
OLAP Server-17
OLAP Server-18
OLAP Server-19
OLAP Server-20
OLAP Server-21qidaijie commented on 2022-10-20T10:48:01.642+0800:
经排查,有以下两个问题:
告警发生时,国家中心Kafka存在异常,对Flink处理数据有较大影响。
Flink内存参数配置过高,忽略了进程本身的内存占用;导致在该配置下,Flink可以申请的内存过多,计算后占总内存的90%。
当前Flink计算,实际平均使用内存占总内存的50%左右。 !Flink内存使用.png|thumbnail!
qidaijie commented on 2022-10-26T19:09:52.512+0800:
[~liuju] 针对该问题,进行以下操作进行优化国家中心Flink内存使用: [^Flink内存优化文档.txt]
liuju commented on 2022-10-26T20:09:53.340+0800:
收到
liuju commented on 2022-10-29T01:08:11.297+0800:
有更新完毕。
liuju commented on 2022-10-31T15:52:14.069+0800:
目前观察内存正常,未再出现内存告警,先关闭该问题,会继续观察后续持续效果,若有异常再开启
Attachments
Attachment: Flink内存使用.png
Attachment: Flink内存优化文档.txt
