Files
geedge-jira/md/OMPUB-441.md
2025-09-14 21:52:36 +00:00

146 lines
3.0 KiB
Markdown
Raw Blame History

This file contains invisible Unicode characters

This file contains invisible Unicode characters that are indistinguishable to humans but may be processed differently by a computer. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

# 【E21-OLAP】国家中心Flink服务器长时间内存使用率80%告警
| ID | Creation Date | Assignee | Status |
|----|----------------|----------|--------|
| OMPUB-441 | 2022-04-10T03:50:07.000+0800 | 戚岱杰 | 已关闭 |
---
2022-04-04开始出现持续出现告警内存使用率过高的告警。**qidaijie** commented on *2022-04-11T11:51:45.490+0800*:
根据现场排查的情况为新增的APP推荐任务较重占用资源比较多属于正常情况。
目前告警临时处置方案为静默。
后续测试增加APP白名单用以减少资源使用。
---
**zhengchao** commented on *2022-04-11T13:50:48.981+0800*:
VPN任务是指VPN客户端IP学习
---
**doufenghu** commented on *2022-04-11T15:07:28.919+0800*:
命名问题。属于APP实时推荐活跃客户端IP选取部分VPN客户端应用进行学习。
{quote}VPN任务是指VPN客户端IP学习
{quote}
---
**zhengchao** commented on *2022-04-12T11:38:06.829+0800*:
“APP实时推荐活跃客户端IP”是为什么功能服务的
---
**doufenghu** commented on *2022-04-12T11:55:02.684+0800*:
CM 每分钟更新 Freegate, Psiphon3 活跃客户端IP列表。
---
**zhengchao** commented on *2022-04-12T12:46:58.558+0800*:
E现场这几个客户端IP的规模有多大
---
**doufenghu** commented on *2022-04-13T15:31:02.009+0800*:
目前只有Psiphon3有流量24小时独立客户端IP为32000个会话量占识别全部APP流量的14%总会话量90亿。[~zhengchao] 
[^app-top100.txt]
 
---
**qidaijie** commented on *2022-04-14T17:43:19.224+0800*:
在当地时间13号11点30分左右对 APP实时推荐活跃客户端IP程序增加指定统计 *Freegate,Psiphon3,Tor* 三个APP配置。
修改后:
# 从Flink自身暴露的指标观察CPU和内存使用均有降低。
!修改后Taskmanager CPU使用.png|thumbnail! !修改后Taskmanager 内存使用.png|thumbnail!
# 从服务器整体观察修改后的时间内Taskmanager已申请的内存也没有释放。
!修改后服务器整体内存使用.png|thumbnail!
---
**qidaijie** commented on *2022-04-20T16:18:33.538+0800*:
目前将国家中心Flink集群taskmanager节点全部重启重启后观察使用内存在45%左右;后续持续追踪观察。
---
**liuju** commented on *2022-06-06T21:19:19.070+0800*:
鉴于2022-04-20 更新之后观察到现在国家中心服务器flink服务器未再出现内存告警故关闭该问题。[~qidaijie]  
---
## Attachments
**27010/app-top100.txt**
---
**27286/Flink-taskmanager进程重启后内存.png**
---
**26926/Flink节点内存使用(自身指标).png**
---
**26932/关闭APP推荐任务后的CPU使用率.png**
---
**26933/关闭APP推荐任务后内存使用(服务器整体内存).png**
---
**27109/修改后Taskmanager+CPU使用.png**
---
**27110/修改后Taskmanager+内存使用.png**
---
**27111/修改后服务器整体内存使用.png**
---
**26929/重启taskmanager内存后内存使用.png**
---