Files
geedge-jira/md/OMPUB-769.md
2025-09-14 22:27:11 +00:00

4.5 KiB
Raw Permalink Blame History

新疆现场CN会话日志数据异常问题

ID Creation Date Assignee Status
OMPUB-769 2023-01-10T11:37:22.000+0800 尹姜谊 已关闭

CN报告结果显示2023.1.4日和1月6日平均数据传输速率在21:00 ~ 22:00期间有超过峰值5倍以上的激增IDC和省口情况类似。

经统计该时段CN实际会话日志数据与报告统计结果吻合且与TSG日志现象一致需进一步定位异常数据产生原因。

!image-2023-01-10-11-28-52-455.png|width=438,height=158!

 

!image-2023-01-10-11-28-34-960.png|width=459,height=176!qidaijie commented on 2023-01-13T11:03:06.416+0800:

现场排查情况:

确认功能端流量监控在2023-01-06 19-21点之间流量突增到近600Gbps正常峰值在420Gbps左右。

!功能端流量图-突增开始时间.png|thumbnail! !功能端流量图-突增结束时间.png|thumbnail!

TSG与CN情况相同均在2023-01-06 20:56:00左右出现了流量突增的情况非CN程序问题。

!TSG与CN数据对比.png|thumbnail!

经过确认主要在2023-01-06 20:55-56这两分钟内出现了大量的流量。

!TSG日志量与流量对比.png|thumbnail! !CN日志量与流量对比.png|thumbnail!

经过对比异常时段的流平均持续时间在250秒和1000秒。

!流平均持续时间.png|thumbnail!


qidaijie commented on 2023-01-18T17:20:21.823+0800:

后续与 [~liuxueli] 确认现场情况:

  • 流量突增主要集中在2023-01-06 20:55:53到56:01这几秒尤其在20:56:00和20:56:01这两秒分别有15TB和20TB的流量。 ** !异常时间段对比.png|thumbnail!
  • 分别选取了异常和相对正常的时间统计大于十分钟长流的流量情况在20:55和20:56这两分钟80%和95%的流量都是由长流产生的。 ** !大于十分钟情况对比.png|thumbnail!
  • TSG页面Traffic没有突刺的原因 ** 功能端统计的traffic-metrics是按5秒间隔计算的持续时间长的流量也会分散在每5秒的窗口内进行统计。

 

问题原因:

  • 基本确认为在2023-01-06 20:55-56这段时间有比较多的长流结束导致的流量曲线突增。

 

建议解决方案:

  • 开启过渡会话日志,使用会话日志+过渡会话日志的common_c2s_byte_diff和common_s2c_byte_diff差值进行计算流量趋势。

Attachments

Attachment: CN日志量与流量对比.png

CN日志量与流量对比.png

Attachment: image-2023-01-10-11-28-34-960.png

image-2023-01-10-11-28-34-960.png

Attachment: image-2023-01-10-11-28-52-455.png

image-2023-01-10-11-28-52-455.png

Attachment: TSG日志量与流量对比.png

TSG日志量与流量对比.png

Attachment: TSG与CN数据对比.png

TSG与CN数据对比.png

Attachment: 大于十分钟情况对比.png

大于十分钟情况对比.png

Attachment: 功能端流量图-突增结束时间.png

功能端流量图-突增结束时间.png

Attachment: 功能端流量图-突增开始时间.png

功能端流量图-突增开始时间.png

Attachment: 流平均持续时间.png

流平均持续时间.png

Attachment: 异常时段流量情况.xlsx

异常时段流量情况.xlsx

Attachment: 异常时间段对比.png

异常时间段对比.png