1.3 KiB
1.3 KiB
新疆IDC环境两台服务器升级系统内核至kernel-3.10.0-1160.el7.x86_64
| ID | Creation Date | Assignee | Status |
|---|---|---|---|
| OMPUB-908 | 2023-05-04T14:28:18.000+0800 | 夏棚 | 完成 |
新疆IDC环境部分节点,服务出现僵尸进程且存储路径无法读取,最终导致进程被hang住,无法正常提供服务。 结合系统日志及故障现象,推断为XFS + Software RAID 在Centos 7 Linux version 3.10.0-693.e17.x86_64 在高IO负载时触发system hung on rwsem_down_read_failed bug。具体见关联bug CN-987。
- 需要将两台节点(10.111. 231.124,10.111.154.1 )系统内核由3.10.0-693.e17.x86_64升级到kernel-3.10.0-1160.el7.x86_64 。
- 将不可用的CK服务加入到集群中,持续观察 。[~qidaijie] zhangshuo commented on 2023-05-04T14:33:04.168+0800:
升级内核方法已经发给贾依蒙
xiapeng commented on 2023-05-05T11:42:21.779+0800:
将节点(10.111. 231.124)系统内核由3.10.0-693.e17.x86_64升级到kernel-3.10.0-1160.el7.x86_64 。
节点(10.111.154.1 )重启失败,待集成手动重启
xiapeng commented on 2023-05-06T17:31:06.445+0800:
节点(10.111.154.1 )重启成功,系统内核由3.10.0-693.e17.x86_64升级到kernel-3.10.0-1160.el7.x86_64 。