Files
geedge-jira/md/OMPUB-888.md
2025-09-14 21:52:36 +00:00

5.1 KiB
Raw Blame History

【XJ-CUCC】192.227sapp频繁重启

ID Creation Date Assignee Status
OMPUB-888 2023-04-06T12:10:24.000+0800 刘学利 已关闭

h2. 192.227sapp服务频繁重启,经初步排查发现问题如下 h3. 1.maat.conf配置文件:

配置文件路径:/home/mesasoft/sapp_run/tsgconf/maat.conf

问题EFFECITIVE_RANGE_FILE配置项文件不存在

配置文件截图:

!image-20230406114930460.png|width=292,height=142! h3. 2.master日志报错

问题:日志中报错的文件不存在

__tsglog_tsg_master.2023-04-06日志截图

!企业微信截图_16807528427825.png|width=493,height=55! h3. 3.app_sketch服务连接超时

__tsglog_app_sketch_local_app_sketch_local.2023-04-06日志截图

!企业微信截图_16807530107311.png|width=438,height=142!

!企业微信截图_16807530545301.png|width=406,height=132!

{color:#333333}runtimelog.2023-04-06日志截图:{color}

{color:#333333}!企业微信截图_16807531161478.png|width=414,height=136!{color}

{color:#333333}!企业微信截图_16807531403302.png|width=416,height=133!{color}yangwei commented on 2023-04-10T09:31:24.364+0800:

  • 现象分析 ** 现象1和2中报错的文件不存在原因是运营商省口的系统不是使用os安装不影响正常运行 ** 现象3的日志反馈出两个问题 *** 1、app sketch扫描tcp/udp首包负载耗时过长截图显示单包长度1000+字节扫描耗时短时间内多次出现超过1秒的情况部分耗时超过10秒 *** 2、sip、tsg_master、ssl业务扫描在报首包扫描耗时长的同一时段日志截图中的10:38前后也出现扫描耗时超过1秒的告警
  • 原因 ** 初步怀疑为app sketch中配置tcp/udp首包负载特征导致单包扫描耗时长
  • 处理 [~jiayimeng]  ** 帮忙检查一下省口系统中配置有tcp/udp首包负载特征tcp.payload or udp.payload的app有哪些配置的都是一些什么负载特征以及是否有必要保留 ** 鉴于192.227重启较为频繁推测触发扫描耗时长的流量在这个节点出现比较频繁尝试在这个节点上对报超时TIMEOUT的服务端IP+端口进行捕包 ** 如果app特征在省口和IDC机房一致则其他节点出现重启的原因可能与192.227相同,检查一下https://jira.geedge.net/browse/OMPUB-887和https://jira.geedge.net/browse/OMPUB-890出现重启时对应的功能端日志是否报与192.227类似的TIMEOUT告警

jiayimeng commented on 2023-04-10T11:24:39.732+0800:

省口系统中配置有tcp/udp首包负载特征tcp.payload or udp.payload的自定义app有两个钉钉和微信配置的负载特征均不长钉钉配置了0001000200076465微信配置负载特征如下 [^weixin-signature.txt] 钉钉与微信的负载经过测试且为145个名单中的APP需要保留。


jiayimeng commented on 2023-04-10T11:28:09.356+0800:

省口通过maat_redis_tool拉取现网配置 APP_SIG_SESSION_ATTRIBUTE_STRING表中共配置了1667条负载特征IDC通过maat_redis_tool拉取现网配置 APP_SIG_SESSION_ATTRIBUTE_STRING表中共配置了396条负载特征除微信和钉钉外其余负载特征应该都是app sketch db中的特征。


jiayimeng commented on 2023-04-10T11:29:06.368+0800:

IDC环境TSG中无自定义APP


jiayimeng commented on 2023-04-10T12:09:31.598+0800:

除227外其他省口和IDC重启的机器__tsglog_app_sketch_local_app_sketch_local日志中无TIMEOUT报错


sunjiajia commented on 2023-04-10T12:51:06.543+0800:

省口04.05-04.06重启机器__tsglog_app_sketch_local_app_sketch_local日志文件不存在查看了04.09重启机器_tsglog_app_sketch_local_app_sketch_local日志文件以192.179为例,如下图所示: !image-2023-04-10-12-50-54-905.png!


sunjiajia commented on 2023-04-10T12:55:19.439+0800:

IDC环境重启机器以172.16.0.5为例查看了runtimelog、__tsglog_app_proto_identify_app_proto_identify、__tsglog_maat_tsg_maat_log、 __tsglog_tsg_conn_sketch_tsg_conn_sketch_log日志情况如下图所示 !image-2023-04-10-12-52-14-687.png|width=515,height=226!

!image-2023-04-10-12-54-13-840.png|width=608,height=202!


yangwei commented on 2023-04-17T08:54:35.228+0800:

4月10日下午检查192.227问题,发现操作卡顿(排除远程网络连接原因),尝试重启服务器后,失联,已联系联通集成进行处理,暂无处理完成的信息


jiayimeng commented on 2023-04-25T15:50:39.261+0800:

集成近日未在新疆,待五一后处理


Attachments

36835/image-20230406114930460.png


37011/image-2023-04-10-12-50-54-905.png


37012/image-2023-04-10-12-52-14-687.png


37013/image-2023-04-10-12-54-13-840.png


37010/weixin-signature.txt


36834/企业微信截图_16807528427825.png


36833/企业微信截图_16807530107311.png


36832/企业微信截图_16807530545301.png


36831/企业微信截图_16807531161478.png


36830/企业微信截图_16807531403302.png