Files
geedge-jira/md/OMPUB-1124.md
2025-09-14 22:26:17 +00:00

1.9 KiB
Raw Blame History

【E21现场】BOL-IGW-KVM-DT001产生OLAP Asset Open t oo many files告警

ID Creation Date Assignee Status
OMPUB-1124 2024-01-24T15:00:17.000+0800 戚岱杰 已关闭

2024-01-22 17:21:56 产生BOL-IGW-KVM-DT001产生OLAP Asset Open t oo many files告警持续17小时。qidaijie commented on 2024-01-30T10:46:14.213+0800:

该问题原因为:

  • BOL-IGW站点日志量高峰期12w/s
  • 在Flink框架中其使用堆外内存来作为Kafka的数据缓冲区当出现数据量抖动或背压时导致堆外内存溢出任务频繁重启占用了大量句柄。

 

解决方案:

Flink总内存不变的情况下增加堆外内存的占比由1GB增加至2GB。


qidaijie commented on 2024-02-02T10:32:06.018+0800:

在修复该问题后经过一周观察目前BOL-IGW-DT001文件句柄相对平稳Flink任务未再出现重启的情况。

!BOL-IGW-DT001文件句柄.png|thumbnail!

该BUG转为持续观察状态。


Attachments

Attachment: b8510c9129a8bf695d47c02e829474b.png b8510c9129a8bf695d47c02e829474b.png

Attachment: BOL-IGW-DT001文件句柄.png BOL-IGW-DT001文件句柄.png

Attachment: BOL-IGW-KVM-DT001.html BOL-IGW-KVM-DT001.html

Attachment: Data+Flow.html Data+Flow.html

Attachment: Metrics+explore+(1).html Metrics+explore+(1).html