Files
geedge-jira/md/OMPUB-1387.md
2025-09-14 21:52:36 +00:00

1.9 KiB
Raw Blame History

【WMS-UTR】TWA站点OLAP Flie Chunk Combiner 出现大量文件回传失败

ID Creation Date Assignee Status
OMPUB-1387 2024-07-29T10:41:14.000+0800 王成成 已解决

1、7月22日开始赛克调整分流策略由按照隧道外层分流调整为按照隧道内层分流调整后各数据中心的TSGX接收流量相对均衡。

2、因为需要配合百分点验收何老师要求把HTTP监测策略的过滤条件去除过滤条件为request content-typetext|application这两个参数都是字串。

3、调整策略后P19现场MSH站点kafka集群仅摄入File Chunk日志写入速率达到5600MB/s服务器网卡接受端总速率达到7800MB/s网卡接受端速率比实际硬盘写入速率高出40%左右。目前处理任务受网卡能力限制出现延迟。TWA站点与现象相同PCAP站点因链路中断待排查

4、后来和何老师沟通调整HTTP策略添加过滤条件。

策略1http+request content-type : text(字串) 策略2http+response content-type : text(字串) 策略3http+request content-type : application(字串) + jsonformpdfxmlx-ms 策略4http+ respnose content-type : application(字串) + jsonformpdfxmlx-ms

5、目前TWA数据中心的流量相较其他站点大导致OLAP-YARN集群资源不足

下图为系统流量峰值前各OLAP服务器网卡收发流量情况

!image-2024-07-29-10-37-57-360.png|width=530,height=244!wangchengcheng commented on 2024-07-30T11:53:29.033+0800:

TWA站点现状经过以下调整后相关任务处理无延迟

  • Yarn集群内存从80G调整至130G
  • HBase集群内存从64G调整至5G

目前,三个站点的业务功能正常。


Attachments

60336/image-2024-07-29-10-37-57-360.png