1.9 KiB
1.9 KiB
【E21现场】BOL-IGW-KVM-DT001产生OLAP Asset Open t oo many files告警
| ID | Creation Date | Assignee | Status |
|---|---|---|---|
| OMPUB-1124 | 2024-01-24T15:00:17.000+0800 | 戚岱杰 | 已关闭 |
2024-01-22 17:21:56 产生BOL-IGW-KVM-DT001产生OLAP Asset Open t oo many files告警持续17小时。qidaijie commented on 2024-01-30T10:46:14.213+0800:
该问题原因为:
- BOL-IGW站点日志量高峰期12w/s
- 在Flink框架中其使用堆外内存来作为Kafka的数据缓冲区;当出现数据量抖动或背压时,导致堆外内存溢出,任务频繁重启,占用了大量句柄。
解决方案:
Flink总内存不变的情况下,增加堆外内存的占比,由1GB增加至2GB。
qidaijie commented on 2024-02-02T10:32:06.018+0800:
在修复该问题后,经过一周观察,目前BOL-IGW-DT001文件句柄相对平稳,Flink任务未再出现重启的情况。
!BOL-IGW-DT001文件句柄.png|thumbnail!
该BUG转为持续观察状态。
Attachments
Attachment: b8510c9129a8bf695d47c02e829474b.png

Attachment: BOL-IGW-DT001文件句柄.png

Attachment: BOL-IGW-KVM-DT001.html BOL-IGW-KVM-DT001.html
Attachment: Data+Flow.html Data+Flow.html
Attachment: Metrics+explore+(1).html Metrics+explore+(1).html