Files
geedge-jira/md/OMPUB-1281.md
2025-09-14 21:52:36 +00:00

1.5 KiB
Raw Blame History

【E21现场】BOL-IGW站点OLAP服务器发生OLAP HOS Services Down

ID Creation Date Assignee Status
OMPUB-1281 2024-05-11T03:55:24.000+0800 张洪庆 已关闭

BOL-IGW01和BOL-IGW02站点的OLAP服务器BOL-IGW-KVM-DT001和BOL-IGW-KVM-DT002发生OLAP HOS Services Down。zhanghongqing commented on 2024-05-14T15:16:13.655+0800:

!image-2024-05-14-15-06-38-586.png!!image-2024-05-14-15-06-29-899.png!!image-2024-05-14-15-04-50-506.png!

!image-2024-05-14-15-10-36-075.png! 现象监控显示每天固定时间HOS会重启时间与TTL时间点对应。查询HOS以上几个站点日志明显多于其它站点。 分析可能为以上几个站点与NC网络恢复较晚。导致之前没执行NC 下发的TTL测试过期日志堆积较大。导致HOS执行删除过期日志时内存溢出。 处理临时增加的HOS内存TTL下发时执行成功HOS未重启。

恢复: 10.225.12.4、10.229.12.4、10.230.12.4 HOS临时增加内存恢复到之前设置。操作到目录/data/tsg/olap/galaxy/workspace/galaxy-hos-service/下 可直接复制其它未修改过的站点docker-compose.yml  保存后执行docker-compose --compatibility up -d 即可


Attachments

57578/image-2024-05-14-15-04-50-506.png


57581/image-2024-05-14-15-06-29-899.png


57583/image-2024-05-14-15-06-38-586.png


57584/image-2024-05-14-15-10-36-075.png