Files
geedge-jira/md/OMPUB-1450.md
2025-09-14 21:52:36 +00:00

2.3 KiB
Raw Blame History

【M22项目】YGN-GTMH-TSGX001 container restart (traffic engines)

ID Creation Date Assignee Status
OMPUB-1450 2024-09-05T11:29:36.000+0800 杨威 已解决

现象描述:

YGN-GTMH-TSGX001 在2024/9/4 21:47:24重启查看该服务器最近监控发现重启前内存占用接近100%songyanchao commented on 2024-09-05T16:19:00.507+0800:

YGN-GTMH-TSGX001以及YGN-GTMH-TSGX002设备存在以下问题

  1. firewall 内存使用过高 2.当内存使用率达到 99% 时TSG-OS未能触发 OOM 机制,未及时终止内存占用高的程序。

针对问题1需要[~yangwei]进一步排查。 针对问题2我们已调整 YGN-GTMH-TSGX001 和 YGN-GTMH-TSGX002 设备的资源限制参数,请持续观察设备运行情况。


yangwei commented on 2024-09-09T09:32:01.789+0800:

M现场8.29-9.5内存使用超过40%的TSGX除MDY-MPT外内存使用异常的为YGN-GTMH TSGX001和002 !image-2024-09-09-09-15-26-016.png|width=1036,height=514! 观察YGN-GTMH-TSGX002的NZ监控8月7日-8月16日内存使用随流量上涨而增长自8月16日 hotfix手动重启后firewall内存使用呈阶梯形持续上涨趋势内存使用平缓的8月24日-8月25日和8月26日-9月2日期间接入流量下降约50%随着9月2日之后流量增加较8.26前上涨30%内存再次上涨直至触发OOM。 !image-2024-09-09-09-14-25-041.png|width=564,height=353!!image-2024-09-09-09-18-32-818.png|width=595,height=361! 策略命中数除流量下降期间8.26-9.2),较为稳定。重启后,内存使用暂时平稳   结论触发OOM的两台TSGX疑似触发内存泄露触发条件与接入流量相关需要持续观察分析原因。  


yangwei commented on 2024-09-26T10:03:29.166+0800:

已提交[20240920 Hotfix firewall module to fix excessive memory usage|https://docs.geedge.net/display/TSGEN/20240920+Hotfix+firewall+module+to+fix+excessive+memory+usage]升级


Attachments

62354/image-2024-09-05-09-53-34-321.png


62353/image-2024-09-05-09-55-46-886.png


62506/image-2024-09-09-09-12-41-588.png


62507/image-2024-09-09-09-14-25-041.png


62508/image-2024-09-09-09-15-26-016.png


62509/image-2024-09-09-09-18-32-818.png