06Solaris10IPMPBug解决方案.doc
- 文档编号:15159823
- 上传时间:2023-07-01
- 格式:DOC
- 页数:6
- 大小:80.50KB
06Solaris10IPMPBug解决方案.doc
《06Solaris10IPMPBug解决方案.doc》由会员分享,可在线阅读,更多相关《06Solaris10IPMPBug解决方案.doc(6页珍藏版)》请在冰点文库上搜索。
技术文档模板
(v100605)
作者
王卫锋
审核
分类
Sun
子类
OS网络
更新时间
2010-6-5
关键字
Solaris10、IPMP、KernelPatches141444-09and141445-09
摘要
BugId:
6888928,在Solaris10环境下,kernel为141444-09(SPARC)和141445-09(x86),IPMP配置为Probe-Based模式,会导致副网卡严重丢包,IPMP切换后,浮动IP无法ping通
主要适用环境
Solaris10,kernel为141444-09(SPARC)和141445-09(x86)
版本说明
版本号
拟制/修改责任人
拟制/修改日期
修改内容/理由
V100605
王卫锋
2010-6-5
新建
目录
版本说明 2
1Bug简介 3
2故障成因说明 4
2.1如何判断基于Probe-Based模式的IPMP配置 4
3故障表现 5
3.1使用snoop查看数据包 5
4解决方案 6
1Bug简介
BugId:
6888928,在Solaris10,KernelPatches为141444-09(SPARC)和141445-09(x86)环境下,IPMP如果采用Probe-Based模式,会导致网卡failure,从而影响浮动IP不能正常通讯;
目前这个Bug对IPMP采用Link-Based模式的网卡没有影响;
2故障成因说明
SPARC平台:
Solaris10,打了kernelpatch141444-09,还没有打142900-02
X86平台:
Solaris10,打了kernelpatch141445-09,还没有打142901-02
对于Solaris8、Solaris9和OpenSolaris不受此问题影响;
只有IPMP采用Probe-Based模式产生此问题,对于采用Link-Based模式不受此问题影响;
2.1如何判断基于Probe-Based模式的IPMP配置
必须符合以下的条件:
1运行以下命令后查看"in.mpathd"守护进程是否运行
#ps-aef|grep"in.mpathd"
root2111011:
04:
51?
0:
00/usr/lib/inet/in.mpathd-a
2使用"ifconfig-a"查看网卡"groupname"必须是同一个IPMPgroup
#ifconfig-a
lo0:
flags=2001000849
inet127.0.0.1netmaskff000000
e1000g1:
flags=1000843
inet192.178.100.1netmaskffffff00broadcast192.178.100.255
groupnamefred
ether0:
3:
ba:
d8:
d1:
ef
e1000g1:
1:
flags=9040843
inet192.178.100.2netmaskffffff00broadcast192.178.100.255
e1000g2:
flags=1000843
inet192.178.100.5netmaskffffff00broadcast192.178.100.255
groupnamefred
ether0:
4:
23:
c8:
33:
86
e1000g2:
1:
flags=9040843
inet192.178.100.6netmaskffffff00broadcast192.178.100.255
以上的例子中,"groupname"为"fred"
3使用"ifconfig-a"查看测试地址必须是"DEPRECATED"和"NOFAILOVER"的状态
3故障表现
以上描述的问题出现时,纵使没有网络问题发生,也会导致IPMPgroup中的网卡failure;
下面是/var/adm/messages中的log信息:
#Oct2211:
09:
29v4v-t2000a-sca11in.mpathd[211]:
NICfailuredetectedone1000g2ofgroup fredOct2211:
09:
29v4v-t2000a-sca11in.mpathd[211]:
SuccessfullyfailedoverfromNICe1000g2 toNICe1000g1
使用"ifconfig-a"查看网卡被标记为"FAILED":
#ifconfig-a
lo0:
flags=2001000849
inet127.0.0.1netmaskff000000
e1000g1:
flags=1000843
inet192.178.100.1netmaskffffff00broadcast192.178.100.255
groupnamefred
ether0:
3:
ba:
d8:
d1:
ef
e1000g1:
1:
flags=9040843
inet192.178.100.2netmaskffffff00broadcast192.178.100.255
e1000g1:
2:
flags=1000843
inet192.178.100.5netmaskffffff00broadcast192.178.100.255
e1000g2:
flags=19000842
index6
inet0.0.0.0netmask0
groupnamefred
ether0:
4:
23:
c8:
33:
86
e1000g2:
1:
flags=19040843 FAILED>mtu1500index6 inet192.178.100.6netmaskffffff00broadcast192.178.100.255 3.1使用snoop查看数据包 由于e1000g1代替e1000g2接收了回复给192.168.100.6这个地址的ICMP数据包,导致e1000g2网卡failed;使用snoop命令可以看到每个192.178.100.6地址的ICMP请求数据包都由e1000g1发出,回复给192.178.100.6的数据包也由e1000g1收到: #snoop-de1000g1icmp Usingdevicee1000g1(promiscuousmode) 192.178.100.6->192.178.100.15ICMPEchorequest(ID: 54022Sequencenumber: 1674) 192.178.100.15->192.178.100.6ICMPEchoreply(ID: 54022Sequencenumber: 1674) 192.178.100.2->192.178.100.15ICMPEchorequest(ID: 54021Sequencenumber: 1680) 192.178.100.15->192.178.100.2ICMPEchoreply(ID: 54021Sequencenumber: 1680) 192.178.100.6->192.178.100.10ICMPEchorequest(ID: 54022Sequencenumber: 1675) 192.178.100.10->192.178.100.6ICMPEchoreply(ID: 54022Sequencenumber: 1675) 再用snoop命令查看e1000g2的数据包,没有数据包收发: #snoop-de1000g2icmp Usingdevicee1000g2(promiscuousmode) 4解决方案 1打kernelpatch SPARC平台: Solaris10打patch至142900-02或更高 X86平台: Solaris10打patch至142901-02或更高 2IPMP改为Link-Based模式 #more/etc/hostname.e1000g1 192.178.100.1netmask+broadcast+groupfredup #more/etc/hostname.e1000g2 192.178.100.5netmask+broadcast+deprecated-failovergroupfredup 《技术文档》 第6页共6页
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 06 Solaris10IPMPBug 解决方案