Files
geedge-jira/md/OMPUB-640.md
2025-09-14 21:52:36 +00:00

106 lines
2.4 KiB
Markdown
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# 【E21现场】对比22.07和22.02 发现22.07日志量减少了接近1/3
| ID | Creation Date | Assignee | Status |
|----|----------------|----------|--------|
| OMPUB-640 | 2022-09-23T15:19:29.000+0800 | 戚岱杰 | 已关闭 |
---
现场问题会话日志丢失30%左右。**qidaijie** commented on *2022-09-29T18:47:10.433+0800*:
问题描述:
1在流量高峰期日志量>45w/s时,当前峰值日志量70w/s分中心Flink汇聚日志出现负载不均情况致使Kafka个别节点写入量为其他节点的两倍。
2国家中心Gohangout无法及时处理该节点的数据积压的数据达到Kafka存储上限被删除最终导致了数据丢失。
处置进展:
1目前正在针对Gohangout进行性能优化减少积压造成的数据丢失情况。
后续持续观察
---
**qidaijie** commented on *2022-10-19T14:13:31.965+0800*:
2022-10-05针对现场情况对国家中心Kafka进行配置回滚操作回滚后基本恢复正常。
!修复后数据监控曲线截图.png|thumbnail!
流量高峰期BOL-IGWMWV-IGW两个局点处理压力较大 有丢日志的情况DIR-IGWSSM-IGW处理有一定延迟。
!分中心数据延迟情况.png|thumbnail!
---
**qidaijie** commented on *2022-10-19T18:42:52.120+0800*:
考虑通过增加Kafka分区和ETL插件并行度进行优化该问题。
对BOL-IGWMWV-IGW两个局点进行修改将Kafka分区和ETL插件消费并行度由20增加到30进行观察。
操作文档: [^优化分区数及Flink任务并行度文档-20221019.txt]
---
**qidaijie** commented on *2022-10-21T11:10:41.121+0800*:
追加对DIR-IGW和SSM-IGW局点将Kafka分区和ETL插件消费并行度由20增加到30操作进行观察。
---
**qidaijie** commented on *2022-10-31T10:39:52.931+0800*:
对IGW站点进行优化后观察一段时间目前通过NZ系统查看最近的日志量曲线图基本已经确认数据汇聚已恢复正常。
!E现场当前日志情况.jpg|thumbnail!
---
## Attachments
**31823/20220929优化文档.txt**
---
**31822/20221005优化文档.txt**
---
**32401/E现场当前日志情况.jpg**
---
**31828/Kafka异常截图_2.png**
---
**31827/Kafka异常截图.png**
---
**31831/分中心数据延迟情况.png**
---
**31829/数据监控曲线异常截图.png**
---
**31832/修复后数据监控曲线截图.png**
---
**31873/优化分区数及Flink任务并行度文档-20221019.txt**
---