5.1 KiB
【XJ-CUCC】192.227sapp频繁重启
| ID | Creation Date | Assignee | Status |
|---|---|---|---|
| OMPUB-888 | 2023-04-06T12:10:24.000+0800 | 刘学利 | 已关闭 |
h2. 192.227sapp服务频繁重启,经初步排查发现问题如下 h3. 1.maat.conf配置文件:
配置文件路径:/home/mesasoft/sapp_run/tsgconf/maat.conf
问题:EFFECITIVE_RANGE_FILE配置项文件不存在
配置文件截图:
!image-20230406114930460.png|width=292,height=142! h3. 2.master日志报错:
问题:日志中报错的文件不存在
__tsglog_tsg_master.2023-04-06日志截图
!企业微信截图_16807528427825.png|width=493,height=55! h3. 3.app_sketch服务连接超时:
__tsglog_app_sketch_local_app_sketch_local.2023-04-06日志截图
!企业微信截图_16807530107311.png|width=438,height=142!
!企业微信截图_16807530545301.png|width=406,height=132!
{color:#333333}runtimelog.2023-04-06日志截图:{color}
{color:#333333}!企业微信截图_16807531161478.png|width=414,height=136!{color}
{color:#333333}!企业微信截图_16807531403302.png|width=416,height=133!{color}yangwei commented on 2023-04-10T09:31:24.364+0800:
- 现象分析 ** 现象1和2中报错的文件不存在,原因是运营商省口的系统不是使用os安装,不影响正常运行 ** 现象3的日志反馈出两个问题 *** 1、app sketch扫描tcp/udp首包负载耗时过长,截图显示单包(长度1000+字节)扫描耗时短时间内多次出现超过1秒的情况,部分耗时超过10秒 *** 2、sip、tsg_master、ssl业务扫描,在报首包扫描耗时长的同一时段(日志截图中的10:38前后),也出现扫描耗时超过1秒的告警
- 原因 ** 初步怀疑为app sketch中,配置tcp/udp首包负载特征导致单包扫描耗时长
- 处理 [~jiayimeng] ** 帮忙检查一下省口系统中,配置有tcp/udp首包负载特征(tcp.payload or udp.payload)的app有哪些?配置的都是一些什么负载特征,以及是否有必要保留? ** 鉴于192.227重启较为频繁,推测触发扫描耗时长的流量在这个节点出现比较频繁,尝试在这个节点上对报超时(TIMEOUT)的服务端IP+端口进行捕包 ** 如果app特征在省口和IDC机房一致,则其他节点出现重启的原因可能与192.227相同,检查一下https://jira.geedge.net/browse/OMPUB-887和https://jira.geedge.net/browse/OMPUB-890出现重启时,对应的功能端日志,是否报与192.227类似的TIMEOUT告警
jiayimeng commented on 2023-04-10T11:24:39.732+0800:
省口系统中,配置有tcp/udp首包负载特征(tcp.payload or udp.payload)的自定义app有两个,钉钉和微信,配置的负载特征均不长,钉钉配置了0001000200076465,微信配置负载特征如下 [^weixin-signature.txt] ,钉钉与微信的负载经过测试,且为145个名单中的APP,需要保留。
jiayimeng commented on 2023-04-10T11:28:09.356+0800:
省口通过maat_redis_tool拉取现网配置 APP_SIG_SESSION_ATTRIBUTE_STRING表中共配置了1667条负载特征,IDC通过maat_redis_tool拉取现网配置 APP_SIG_SESSION_ATTRIBUTE_STRING表中共配置了396条负载特征;除微信和钉钉外,其余负载特征应该都是app sketch db中的特征。
jiayimeng commented on 2023-04-10T11:29:06.368+0800:
IDC环境TSG中无自定义APP
jiayimeng commented on 2023-04-10T12:09:31.598+0800:
除227外其他(省口和IDC)重启的机器,__tsglog_app_sketch_local_app_sketch_local日志中无TIMEOUT报错
sunjiajia commented on 2023-04-10T12:51:06.543+0800:
省口04.05-04.06重启机器__tsglog_app_sketch_local_app_sketch_local日志文件不存在,查看了04.09重启机器_tsglog_app_sketch_local_app_sketch_local日志文件,以192.179为例,如下图所示: !image-2023-04-10-12-50-54-905.png!
sunjiajia commented on 2023-04-10T12:55:19.439+0800:
IDC环境重启机器(以172.16.0.5为例)查看了runtimelog、__tsglog_app_proto_identify_app_proto_identify、__tsglog_maat_tsg_maat_log、 __tsglog_tsg_conn_sketch_tsg_conn_sketch_log日志情况;如下图所示: !image-2023-04-10-12-52-14-687.png|width=515,height=226!
!image-2023-04-10-12-54-13-840.png|width=608,height=202!
yangwei commented on 2023-04-17T08:54:35.228+0800:
4月10日下午检查192.227问题,发现操作卡顿(排除远程网络连接原因),尝试重启服务器后,失联,已联系联通集成进行处理,暂无处理完成的信息
jiayimeng commented on 2023-04-25T15:50:39.261+0800:
集成近日未在新疆,待五一后处理
Attachments
36835/image-20230406114930460.png
37011/image-2023-04-10-12-50-54-905.png
37012/image-2023-04-10-12-52-14-687.png
37013/image-2023-04-10-12-54-13-840.png
37010/weixin-signature.txt
36834/企业微信截图_16807528427825.png
36833/企业微信截图_16807530107311.png
36832/企业微信截图_16807530545301.png
36831/企业微信截图_16807531161478.png
36830/企业微信截图_16807531403302.png