Files
geedge-jira/md/OMPUB-908.md
2025-09-14 21:52:36 +00:00

1.3 KiB
Raw Blame History

新疆IDC环境两台服务器升级系统内核至kernel-3.10.0-1160.el7.x86_64

ID Creation Date Assignee Status
OMPUB-908 2023-05-04T14:28:18.000+0800 夏棚 完成

新疆IDC环境部分节点服务出现僵尸进程且存储路径无法读取最终导致进程被hang住无法正常提供服务。 结合系统日志及故障现象推断为XFS + Software RAID 在Centos 7 Linux version 3.10.0-693.e17.x86_64 在高IO负载时触发system hung on rwsem_down_read_failed bug。具体见关联bug CN-987。

  • 需要将两台节点10.111. 231.12410.111.154.1 系统内核由3.10.0-693.e17.x86_64升级到kernel-3.10.0-1160.el7.x86_64 。
  • 将不可用的CK服务加入到集群中持续观察 。[~qidaijie] zhangshuo commented on 2023-05-04T14:33:04.168+0800:

升级内核方法已经发给贾依蒙


xiapeng commented on 2023-05-05T11:42:21.779+0800:

将节点10.111. 231.124)系统内核由3.10.0-693.e17.x86_64升级到kernel-3.10.0-1160.el7.x86_64 。

节点10.111.154.1 )重启失败,待集成手动重启


xiapeng commented on 2023-05-06T17:31:06.445+0800:

节点10.111.154.1 重启成功系统内核由3.10.0-693.e17.x86_64升级到kernel-3.10.0-1160.el7.x86_64 。


Attachments