4.5 KiB
4.5 KiB
新疆现场CN会话日志数据异常问题
| ID | Creation Date | Assignee | Status |
|---|---|---|---|
| OMPUB-769 | 2023-01-10T11:37:22.000+0800 | 尹姜谊 | 已关闭 |
CN报告结果显示,2023.1.4日和1月6日平均数据传输速率在21:00 ~ 22:00期间有超过峰值5倍以上的激增,IDC和省口情况类似。
经统计,该时段CN实际会话日志数据与报告统计结果吻合,且与TSG日志现象一致,需进一步定位异常数据产生原因。
!image-2023-01-10-11-28-52-455.png|width=438,height=158!
!image-2023-01-10-11-28-34-960.png|width=459,height=176!qidaijie commented on 2023-01-13T11:03:06.416+0800:
现场排查情况:
确认功能端流量监控,在2023-01-06 19-21点之间流量突增到近600Gbps,正常峰值在420Gbps左右。
!功能端流量图-突增开始时间.png|thumbnail! !功能端流量图-突增结束时间.png|thumbnail!
TSG与CN情况相同,均在2023-01-06 20:56:00左右出现了流量突增的情况,非CN程序问题。
!TSG与CN数据对比.png|thumbnail!
经过确认主要在2023-01-06 20:55-56这两分钟内,出现了大量的流量。
!TSG日志量与流量对比.png|thumbnail! !CN日志量与流量对比.png|thumbnail!
经过对比异常时段的流平均持续时间在250秒和1000秒。
!流平均持续时间.png|thumbnail!
qidaijie commented on 2023-01-18T17:20:21.823+0800:
后续与 [~liuxueli] 确认现场情况:
- 流量突增主要集中在2023-01-06 20:55:53到56:01这几秒,尤其在20:56:00和20:56:01这两秒,分别有15TB和20TB的流量。 ** !异常时间段对比.png|thumbnail!
- 分别选取了异常和相对正常的时间,统计大于十分钟(长流)的流量情况;在20:55和20:56这两分钟,80%和95%的流量都是由长流产生的。 ** !大于十分钟情况对比.png|thumbnail!
- TSG页面Traffic没有突刺的原因: ** 功能端统计的traffic-metrics是按5秒间隔计算的,持续时间长的流量也会分散在每5秒的窗口内进行统计。
问题原因:
- 基本确认为在2023-01-06 20:55-56这段时间,有比较多的长流结束,导致的流量曲线突增。
建议解决方案:
- 开启过渡会话日志,使用会话日志+过渡会话日志的common_c2s_byte_diff和common_s2c_byte_diff(差值)进行计算流量趋势。
Attachments
Attachment: CN日志量与流量对比.png
Attachment: image-2023-01-10-11-28-34-960.png
Attachment: image-2023-01-10-11-28-52-455.png
Attachment: TSG日志量与流量对比.png
Attachment: TSG与CN数据对比.png
Attachment: 大于十分钟情况对比.png
Attachment: 功能端流量图-突增结束时间.png
Attachment: 功能端流量图-突增开始时间.png
Attachment: 流平均持续时间.png
Attachment: 异常时段流量情况.xlsx
Attachment: 异常时间段对比.png









