2.3 KiB
【M22项目】YGN-GTMH-TSGX001 container restart (traffic engines)
| ID | Creation Date | Assignee | Status |
|---|---|---|---|
| OMPUB-1450 | 2024-09-05T11:29:36.000+0800 | 杨威 | 已解决 |
现象描述:
YGN-GTMH-TSGX001 在2024/9/4 21:47:24重启,查看该服务器最近监控发现重启前内存占用接近100%songyanchao commented on 2024-09-05T16:19:00.507+0800:
YGN-GTMH-TSGX001以及YGN-GTMH-TSGX002设备存在以下问题:
- firewall 内存使用过高 2.当内存使用率达到 99% 时,TSG-OS未能触发 OOM 机制,未及时终止内存占用高的程序。
针对问题1,需要[~yangwei]进一步排查。 针对问题2,我们已调整 YGN-GTMH-TSGX001 和 YGN-GTMH-TSGX002 设备的资源限制参数,请持续观察设备运行情况。
yangwei commented on 2024-09-09T09:32:01.789+0800:
M现场,8.29-9.5内存使用超过40%的TSGX,除MDY-MPT外,内存使用异常的为YGN-GTMH TSGX001和002 !image-2024-09-09-09-15-26-016.png|width=1036,height=514! 观察YGN-GTMH-TSGX002的NZ监控,8月7日-8月16日,内存使用随流量上涨而增长,自8月16日 hotfix手动重启后,firewall内存使用呈阶梯形持续上涨趋势,内存使用平缓的8月24日-8月25日和8月26日-9月2日期间,接入流量下降约50%,随着9月2日之后流量增加(较8.26前上涨30%),内存再次上涨直至触发OOM。 !image-2024-09-09-09-14-25-041.png|width=564,height=353!!image-2024-09-09-09-18-32-818.png|width=595,height=361! 策略命中数除流量下降期间(8.26-9.2),较为稳定。重启后,内存使用暂时平稳 结论:触发OOM的两台TSGX疑似触发内存泄露,触发条件与接入流量相关,需要持续观察分析原因。
yangwei commented on 2024-09-26T10:03:29.166+0800:
已提交[20240920 Hotfix firewall module to fix excessive memory usage|https://docs.geedge.net/display/TSGEN/20240920+Hotfix+firewall+module+to+fix+excessive+memory+usage]升级
Attachments
62354/image-2024-09-05-09-53-34-321.png
62353/image-2024-09-05-09-55-46-886.png
62506/image-2024-09-09-09-12-41-588.png
62507/image-2024-09-09-09-14-25-041.png
62508/image-2024-09-09-09-15-26-016.png
62509/image-2024-09-09-09-18-32-818.png