我司容器云平台使用了sriov的底层网络模型,这个网络驱动的好处是配置少,转发效率高,但是缺点也很明显,出了问题比较难Debug. 现就工作中出现的问题记录如下:
- 容器删除后,或者docker进程异常退出时,没有把vf的MAC 地址等信息清空有可能会导致新建的容器vf和旧的vf MAC,这样可能会导致容器不通。也就是说MAC重复是容器不通的必要不充分条件。因此要避免vf MAC地址重复。
- 本机容器网络不通,查看dmesg会有重复的log: ixgbe 0000:84:00.0 service0: VF Reset msg received from vf 52
这时52口对应的容器网络就会时通时不通。至今原因不明,解决的方法是删除重建。这种log重复出现的概率不大。