2.3 KiB
申请工程部同事帮忙排查,因SMBCX设备MAC表条目过多导致计算板重启后无法通信的问题
| ID | Creation Date | Assignee | Status |
|---|---|---|---|
| OMPUB-506 | 2022-06-02T09:56:20.000+0800 | 栗文 | 完成 |
问题描述: 研发组ATCA设备(SMBIO:40.79 SMBCX:41.80)中的40.86计算板卡,重启后发现无法ssh到此设备,尝试ping 此设备的IP也无法ping通,进一步跟踪发现SMBCX设备将40.86计算板卡的ARP应答包全部丢弃了,和厂商进行沟通发现SMBCX上的MAC表中的条目数(8192条)已经达到SMBCX设备上限(上限为8192),手动清除此表后马上又达到上限值,而计算版重启会导致用于通信的VF网卡的MAC地址变化,而此时SMBCX设备的MAC表已满,导致SMBCX无法学习重启后计算板卡VF的MAC地址,导致通讯失败。因此申请工程部同事帮忙排查为什么SMBCX上会学习到这么多MAC地址。
!image-2022-06-02-09-54-22-323.png!songyanchao commented on 2022-06-02T16:22:55.139+0800:
由于厂商提供清除MAC表的命令错误,导致之前的操作实质上没有清除MAC表,清除MAC表后SMBCX可以学习到计算板卡重启后的MAC地址,与从而使交换板卡的通信恢复正常。 但是引出两个问题: 1.SMBCX设备MAC表中哪些相似的MAC地址的来源? 2.SMBCX设备的MAC表为什么没有老化?
针对问题1: 麻烦工程部帮忙持续观察一段时间,看是否能够追踪到这些有规律的MAC地址的来源。 针对问题2: 与厂家沟通后,他们给的回复是MAC表老化默认是关闭的,我们正在测试厂商提供的开启MAC老化功能的命令。
liwen commented on 2022-06-20T14:43:53.376+0800:
经观察,暂未发现该设备所连接交换机端口使用率有异常情况
Attachments
Attachment: [root@9000-SMBCX-P01R01-2+~]#+fabric+l2+show
[root@9000-SMBCX-P01R01-2+~]#+fabric+l2+show
Attachment: image-2022-06-02-09-54-22-323.png
