Files
geedge-jira/md/OMPUB-506.md
2025-09-14 22:27:11 +00:00

2.3 KiB
Raw Permalink Blame History

申请工程部同事帮忙排查因SMBCX设备MAC表条目过多导致计算板重启后无法通信的问题

ID Creation Date Assignee Status
OMPUB-506 2022-06-02T09:56:20.000+0800 栗文 完成

问题描述:      研发组ATCA设备SMBIO40.79   SMBCX41.80中的40.86计算板卡重启后发现无法ssh到此设备尝试ping 此设备的IP也无法ping通进一步跟踪发现SMBCX设备将40.86计算板卡的ARP应答包全部丢弃了和厂商进行沟通发现SMBCX上的MAC表中的条目数8192条已经达到SMBCX设备上限上限为8192手动清除此表后马上又达到上限值而计算版重启会导致用于通信的VF网卡的MAC地址变化而此时SMBCX设备的MAC表已满导致SMBCX无法学习重启后计算板卡VF的MAC地址导致通讯失败。因此申请工程部同事帮忙排查为什么SMBCX上会学习到这么多MAC地址。

!image-2022-06-02-09-54-22-323.png!songyanchao commented on 2022-06-02T16:22:55.139+0800:

由于厂商提供清除MAC表的命令错误导致之前的操作实质上没有清除MAC表清除MAC表后SMBCX可以学习到计算板卡重启后的MAC地址与从而使交换板卡的通信恢复正常。 但是引出两个问题: 1.SMBCX设备MAC表中哪些相似的MAC地址的来源 2.SMBCX设备的MAC表为什么没有老化

针对问题1:   麻烦工程部帮忙持续观察一段时间看是否能够追踪到这些有规律的MAC地址的来源。 针对问题2:  与厂家沟通后他们给的回复是MAC表老化默认是关闭的我们正在测试厂商提供的开启MAC老化功能的命令。


liwen commented on 2022-06-20T14:43:53.376+0800:

经观察,暂未发现该设备所连接交换机端口使用率有异常情况


Attachments

Attachment: [root@9000-SMBCX-P01R01-2+~]#+fabric+l2+show

[root@9000-SMBCX-P01R01-2+~]#+fabric+l2+show

Attachment: image-2022-06-02-09-54-22-323.png

image-2022-06-02-09-54-22-323.png