Files
geedge-jira/md/OMPUB-1016.md
2025-09-14 22:27:11 +00:00

2.7 KiB
Raw Blame History

【XJ-NPM】 IDC环境日报数据异常

ID Creation Date Assignee Status
OMPUB-1016 2023-09-04T18:03:40.000+0800 戚岱杰 已解决

IDC环境日报中的IDC网络质量报告IDC租用方报告从8月7日起数据为空经排查server_idc_renter,client_idc_renter这两个字段从8月7号之后在CK库就没数据了。qidaijie commented on 2023-09-04T19:06:21.834+0800:

经过现场确认:

  • 2023-8-6号IDC环境Flink集群231.133服务器出现僵尸进程,后对其进行内核升级操作。
  • 内核升级后发现数据目录下所有文件丢失后从231.134拷贝Flink及任务相关文件。
  • 拷贝的配置文件与当时最近一次更新的内容不一致导致ETL程序读取的内置知识库不完整造成的该问题。

 

处置方式:核对修改配置文件,并重启任务后恢复正常。

!修复后CK库查询内容.png|thumbnail!

 

主要问题点:

目前任务配置文件存放在本地,且基于组件的特性,多数情况下只需要在第一台主节点上操作任务。

配置文件需要以人工scp到其他节点的方式来备份。

数据校验不完整只对Location、ASN、tags做了校验。


jiayimeng commented on 2023-09-04T20:34:47.046+0800:

该问题导致8月7日后全部日报和月报因缺少数据无法提交是否有其他补救办法目前已尝试通过locationprovince等字段填写月报中的疆内联通访问IDC无法补齐。[~yinjiangyi] [~lizhao]


qidaijie commented on 2023-09-08T14:39:59.965+0800:

后续处置情况:

经过确认在异常期间2023.8.7 - 2023.9.8)数据无损失,日志内 IDC租用方 字段内容缺失。

IDC月报程序通过离线SQL匹配知识库IP段的方式将历史缺失字段补全报告功能结果已恢复正常。


qidaijie commented on 2023-09-18T10:15:53.457+0800:

后续处置参考 GAL-404 任务,该问题关闭。


Attachments

Attachment: CK库排查情况.jpg

CK库排查情况.jpg

Attachment: IDC网络质量报告.png

IDC网络质量报告.png

Attachment: IDC租用方报告.png

IDC租用方报告.png

Attachment: 修复后CK库查询内容.png

修复后CK库查询内容.png