华为交换机插入新板后发现不了
发布网友
发布时间:2022-12-28 13:54
我来回答
共2个回答
热心网友
时间:2023-09-16 21:45
本文档描述了如何查看接口状态,以及当接口的物理状态处于DOWN状态时,如何定位接口故障的原因,并恢复接口到UP状态。引起接口物理DOWN的原因主要包括硬件故障和软件故障两个方面。硬件故障,包括本端或对端设备的硬件故障,例如单板、接口、光模块、光纤、网线等故障。软件故障,主要是链路两端配置不一致,例如端口协商模式、速率、双工等配置不一致。为了更加精确的分析接口物理DOWN的故障原因,本文以故障可能的引入点为线索,按照人为因素导致的故障、设备自身硬件故障、连接介质故障、连接介质使用方法错误、环境因素导致的故障五步骤为排查顺序,逐步找到问题根因并排除故障。
Part1简介
本文档描述了如何查看接口状态,以及当接口的物理状态为DOWN状态时,如何定位接口故障的原因,并恢复接口到UP状态。
引起接口物理DOWN的原因主要包括以下两个方面:
硬件故障。 本端或对端设备的硬件故障,例如单板、接口、光模块、光纤、网线等故障。软件故障。 主要是链路两端配置不一致,例如端口自协商模式、速率、双工等配置不一致。为了更加精确的分析接口物理DOWN的故障原因,本文以故障可能的引入点为线索,如下图所示,按照人(人为因素导致的故障)-》机(设备自身硬件故障)-》料(连接介质故障)-》法(连接介质使用方法错误)-》环(环境因素导致的故障)五步骤为排查顺序,逐步找到问题根因并排除故障。
Part2如何查看接口状态
1通过查看业务接口指示灯识别接口状态
如果您能够实际接触设备,直接观察业务接口的指示灯,可以更快地识别当前业务接口的状态。以S6730-H48X6C为例,如图1-1所示,其中编号为4的指示灯,为10GE光接口指示灯,编号为5的指示灯,为40GE/100GE光接口指示灯。
图1-1 S6730-H48X6C指示灯示意图
表1-1 业务接口指示灯的含义
2通过执行命令display interface brief或display interface interface-type interface-number 查看接口物理状态
可以在任意视图下执行命令display interface brief 查看所有接口的物理状态(回显中PHY字段信息)。
<HUAWEI> display interface brief
PHY: Physical //表示接口的物理状态
*down: administratively down
^down: standby
~down: LDT down
#down: LBDT down
(l): loopback
(s): spoofing
(E): E-Trunk down
(b): BFD down
(e): ETHOAM down
(dl): DLDP down
(d): Dampening Suppressed
(ld): LDT block
(lb): LBDT block
(lp): Loop-detect block
(ms): MACsec down
(o): Observe-port forwarding down
InUti/OutUti: input utility/output utility
Interface PHY Protocol InUti OutUti inErrors outErrors
Ethernet0/0/0 up up 0.01% 0.01% 0 0
GigabitEthernet1/0/0 down down 0% 0% 0 0
GigabitEthernet1/0/1 down down 0% 0% 0 0
GigabitEthernet1/0/2 down down 0% 0% 0 0
GigabitEthernet1/0/3 down down 0% 0% 0 0
GigabitEthernet1/0/4 down down 0% 0% 0 0
GigabitEthernet1/0/5 down down 0% 0% 0 0
GigabitEthernet1/0/6 up up 0% 0% 0 0
GigabitEthernet1/0/7 up up 0% 0% 0 0
GigabitEthernet1/0/8 up up 0% 0% 0 0
GigabitEthernet1/0/9 up up 0% 0% 0 0
GigabitEthernet1/0/10 down down 0% 0% 0 0
……
或者在任意视图下执行命令display interface interface-type interface-number 查看指定接口的当前物理状态(回显中current state字段信息)。
<HUAWEI> display interface gigabitethernet 0/0/12
GigabitEthernet0/0/12 current state : Administratively DOWN
Line protocol current state : DOWN
Description:
Switch Port, Link-type : access(negotiated),
PVID :1, TPID : 8100(Hex), The Maximum Frame Length is 9216
IP Sending Frames' Format is PKTFMT_ETHNT_2, Hardware address is 000b-0974-a475
Last physical up time: 2013-08-10 21:09:51
Last physical down time : 2013-08-10 21:10:51
Current system time: 2013-08-10 21:15:06
Port Mode: COMMON FIBER
Speed : 1000,Loopback: NONE
Duplex: FULL,Negotiation: ENABLE
Mdi: -,Flow-control: DISABLE
Last 300 seconds input rate 96 bits/sec, 0 packets/sec
Last 300 seconds output rate 96 bits/sec, 0 packets/sec
Input peak rate 15184 bits/sec, Record time: 2013-08-10 17:45:05
Output peak rate 15184 bits/sec, Record time: 2013-08-10 17:45:05
上述示例中,接口GE0/0/12的当前物理状态为Administratively DOWN ,表示该接口下执行了命令shutdown。如果希望将该接口UP,则需要在对应接口视图下执行undo shutdown命令。
说明:
对于二层物理接口(设备的以太网接口默认工作在二层模式),只要物理状态current state为UP,协议状态Line protocol current state一定是UP的。例如,二层物理接口连线正确,并且接口属性配置正常后,物理状态current state和协议状态Line protocol current state均是UP的。
对于三层物理接口(接口下执行了命令undo portswitch将接口从二层模式切换到三层模式),只有物理状态current state为UP,并且协议协商也成功后,协议状态Line protocol current state才会UP。例如,三层物理接口连线正确,并且接口属性配置正常后,如果没有配置IP地址,则物理状态current state为UP,但协议状态Line protocol current state仍处于DOWN状态。
更多查看接口配置信息或统计信息的命令,如下表所示。
3通过查看接口模块的日志识别接口状态
可以在任意视图下执行命令display logbuffer,查看设备日志信息。例如设备上有如下IFNET模块的日志信息,表示接口GigabitEthernet1/0/1和GigabitEthernet3/0/0处于DOWN状态。
Apr 15 2014 03:46:10-05:13 dgg62aslhw3i %%01IFNET/4/IF_STATE(l)[47]:Interface GigabitEthernet1/0/1 has turned into DOWN state.
Apr 15 2014 03:45:31-05:13 dgg62aslhw3i %%01IFNET/4/IF_STATE(l)[49]:Interface GigabitEthernet3/0/0 has turned into DOWN state.
Part3接口物理DOWN故障的原因以及故障恢复方法
4如何定位并恢复由人为因素导致的接口物理DOWN故障
原因描述
当接口由正常UP状态变为物理DOWN时,需要首先排查下近期是否有人为操作不当,包括错误拔插网线、误碰触设备导致连线松动。如果确保连线没有问题,则进一步排查是否有误配置命令行的行为。
故障定位方法
在对接的两个设备上的任意视图下,均执行命令display interface interface-type interface-number,查看接口当前运行状态和接口统计信息。
<HUAWEI> display interface gigabitethernet 0/0/12
GigabitEthernet0/0/12 current state : DOWN//接口当前物理状态
Line protocol current state : DOWN
Description:
Switch Port, Link-type : access(negotiated),
PVID :1, TPID : 8100(Hex), The Maximum Frame Length is 9216
IP Sending Frames' Format is PKTFMT_ETHNT_2, Hardware address is 000b-0974-a475
Last physical up time: 2013-08-10 21:09:51
Last physical down time : 2013-08-10 21:10:51
Current system time: 2013-08-10 21:15:06
Port Mode: COMMON FIBER //接口工作模式。COMMON COPPER表示此接口为电接口;
COMMON FIBER表示此接口为光接口
Speed : 1000,Loopback: NONE //接口速率、环回状态,链路两端需要保持一致
Duplex: FULL,Negotiation: ENABLE //接口双工模式及自协商状态,链路两端需要保持一致
故障恢复方法
若current state字段为“Administratively down”,表示接口被人为执行了命令shutdown,请在接口下执行undo shutdown命令。
若current state字段为“DOWN”,则需要查看链路两端的接口速率、双工模式、自协商模式是否保持一致。根据Negotiation字段值的不同,采取不同的恢复手段。
若current state字段为“ERROR DOWN (down-cause)”,表示接口由于错误事件而被Shutdown,您需要根据down-cause具体字段信息排查故障。在采用恢复措施前,建议您先排除业务故障,以防止接口再次进入ERROR DOWN状态。ERROR DOWN状态恢复措施包括手动和自动两种。
手动恢复:在接口视图下依次执行命令shutdown和undo shutdown命令或者执行命令restart,重启接口。自动恢复:在系统视图下执行命令error-down auto-recovery cause down-cause interval interval-value,设置由具体原因引起的Error-Down自动恢复UP功能。
5如何定位并恢复由设备自身硬件故障引起的接口物理DOWN故障
原因描述
当设备单板故障、单个接口故障,以及对端设备出现异常状况时,直接会导致接口物理DOWN。因此设备自身硬件是否故障是重点排查项。
故障定位方法
在任意视图下执行命令display interface brief ,查看所有接口状态和配置的简要信息。
<HUAWEI> display interface brief
… …
Interface PHY Protocol InUti OutUti inErrors outErrors
GigabitEthernet0/0/1 down down 0% 0% 0 0
GigabitEthernet0/0/2 down down 0% 0% 0 0
GigabitEthernet0/0/3 down down 0% 0% 0 0
GigabitEthernet0/0/4 down down 0% 0% 0 0
GigabitEthernet0/0/5 down down 0% 0% 0 0
GigabitEthernet0/0/6 down down 0% 0% 0 0
如果是多个接口由UP变为DOWN,则可能原因是本端或对端设备的单板故障以及对端设备状态变化,例如对端设备进行主备倒换、休眠或者重启等。如果是单个接口由UP变为DOWN,则可查看对接的两个接口槽位外观上是否有金属弹片存在凹陷或偏位现象。如果外观没有问题,还需要在接口视图下执行命令loopback internal,查看接口内部是否存在硬件故障。如果执行命令loopback internal后,接口状态(字段current state)变为 UP,则接口内部连接正常,无硬件故障,如果接口状态仍然为DOWN,则接口内部通信异常,存在硬件故障。
<HUAWEI> system-view
[HUAWEI] interface gigabitethernet 0/0/1
[HUAWEI-GigabitEthernet0/0/1] loopback internal
[HUAWEI-GigabitEthernet0/0/1] display this interface
GigabitEthernet0/0/1 current state : UP
Line protocol current state : UP
… …
故障恢复方法
多个接口物理DOWN如果多个接口物理DOWN,这些接口都属于同一块单板,并且连接到多个无异常的对端设备,则可能是单板异常,尝试执行命令reset slotslot-id ,复位单板。如果故障仍未解决,则需要更换单板。如果多个接口物理DOWN,并且这些接口都是属于本端设备和对端同一设备连接的接口,则可能原因是对端设备异常,您需要登录对端设备查看设备单板是否故障,并及时进行复位或更换操作。如果对端设备处于主备倒换、休眠、重启等状态, 则可以认为属于正常现象,待对端设备状态稳定后,一般本端设备状接口状态即可自动恢复到UP状态。该场景下,接口会出现频繁UP/DOWN,产生如下所示的大量UP/DOWN日志。
Apr 15 2013 03:46:14-05:13 dgg62aslhw3i %%01IFNET/4/IF_STATE(l)[46]:Interface
GigabitEthernet1/0/1 has turned into UP state.
Apr 15 2013 03:46:10-05:13 dgg62aslhw3i %%01IFNET/4/IF_STATE(l)[47]:Interface
GigabitEthernet1/0/1 has turned into DOWN state.
Apr 15 2013 03:45:35-05:13 dgg62aslhw3i %%01IFNET/4/IF_STATE(l)[48]:Interface
GigabitEthernet1/0/1 has turned into UP state.
Apr 15 2013 03:45:31-05:13 dgg62aslhw3i %%01IFNET/4/IF_STATE(l)[49]:Interface
GigabitEthernet1/0/1 has turned into DOWN state.
Apr 15 2013 03:42:10-05:13 dgg62aslhw3i %%01IFNET/4/IF_STATE(l)[50]:Interface
GigabitEthernet1/0/1 has turned into UP state.
如果对端设备反复重启,例如S交换机与AP设备对接,AP反复重启,导致S交换机上与之连接的接口物理DOWN。此时需要排查AP反复重启原因,确认是否存在网络环路、大量ARP广播报文、网络攻击等因素并排除后,才可以确保接口正常UP。
单个接口物理DOWN
仅有单个接口物理DOWN,则需要排查链路两端接口是否有金属弹片凹陷等硬件故障,如果接口故障可尝试使用其他空闲接口。
6如何定位并恢复由连接介质故障引起的接口物理DOWN故障
原因描述
设备物理接口有电口和光口,涉及的连接介质主要是RJ45-网线、光模块、光纤。当连接介质出现老化、破损或者光模块收发光异常等故障时,会导致接口物理DOWN。
故障定位方法
电口连接介质故障
检查连线是否正确。保证对接两端接口使用同一根网线,如果经过跳线架,请检查跳线是否正确。检查接口是否连接正确,同时检查是否存在接触不好及网线外部损坏的情况。检查网线规格及长度是否符合标准。依据以太网相关标准,网线长度不能超过100m。对于GE电口,如果使用低于五类线的网线将不能够使GE电口以1000M速率UP。所有电口对接,均推荐使用五类线以上规格的网线对接。检查网线内部线对状态是否正常。网线中4对线序中有部分出现损坏,将不能保证电口正常UP。检测网线质量,可以使用测线仪或者接口视图下执行virtual-cable-test命令,检测线序对连接是否正常。
如下所示回显中Pair state为Ok表示正常;如果为Unknown,建议使用线缆分析仪进行测试;如果为Open或Short,建议更换其他网线。
[HUAWEI] interface gigabitethernet 0/0/1
[HUAWEI-GigabitEthernet0/0/1] virtual-cable-test
Warning: The command will stop service for a while, Continue?[Y/N] y
Info: This operation may take a few seconds. Please wait for a moment..........done.
Pair A length: 1meter(s)
Pair B length: 1meter(s)
Pair C length: 1meter(s)
Pair D length: 1meter(s)
Pair A state: Ok
Pair B state: Ok
Pair C state: Ok
Pair D state: Ok
光口连接介质故障
检查光模块是否属于华为认证光模块。华为公司在交换机产品发货的光模块标签上增加有华为logo和相应标识,如下图所示,在产品电子标签、光模块信息里面都更新为“HUAWEI”厂家信息。
对于非华为认证发货的光模块插入交换机设备中,会出现告警信息,可以通过display trapbuffer命令查看。告警格式如下:
ENTITYTRAP/3/OPTICALINVALID:OID [oid] Optical Mole is invalid.(Index=[INTEGER],
EntityPhysicalIndex=[INTEGER], PhysicalName=\"[OCTET]\", EntityTrapFaultID=[INTEGER])
检查光模块状态是否正常。
执行命令display transceiver interface,检查两端设备上的光模块工作状态是否正常,主要查看收光功率、发光功率、电流值等,确定各项指标是否都在正常范围内,如下表所示。
<HUAWEI> display transceiver interface GigabitEthernet 2/0/3 verbose
… …
Diagnostic information: Temperature (°C) :39
Voltage(V):3.32
Bias Current(mA):6.91 //电流值
Bias High Threshold(mA):33.34
Bias LowThreshold(mA):1.67
Current Rx Power(dBM):-4.59 //接口收光功率
Default Rx Power High Threshold(dBM):0.00
Default Rx Power LowThreshold(dBM):-16.99
Current Tx Power(dBM):-5.10 //接口发光功率
Default Tx Power High Threshold(dBM):0.00
Default Tx Power LowThreshold(dBM):-12.50
User Set Rx Power High Threshold(dBM) :0.00
User Set Rx Power Low Threshold(dBM):-16.99
User Set Tx Power High Threshold(dBM) :0.00
User Set Tx Power Low Threshold(dBM):-12.50
表1-2 光模块状态属性的正常数值范围
故障恢复方法
电口连接介质故障
如果电口网线故障,建议直接更换网线。
光口连接介质故障
如果使用的光模块为非华为认证光模块,请更换使用华为认证光模块。非华为认证光模块的可靠性无法保证,可能导致业务不稳定。由非华为认证光模块导致的问题,华为将不承担责任,并在原则上不予以解决。如果执行display transceiver interface命令查看光模块工作状态参数,超出了正常范围:
1、电流过高或过低:请更换光模块。
2、发光功率过低或过高:请更换光模块。
3、收光功率过低或过高:使用光功率计测试链路各部分的光功率衰减情况,对异常的部位进行修复。如果仍无法解决问题请更换光模块或者光纤,确保光模块传输距离和光纤类型符合组网需求。
7如何定位并恢复由连接介质使用方法错误引起的接口物理DOWN故障
原因描述
进行设备间连接介质操作时,需要考虑光模块与光口是否匹配,光模块是否与光纤型号是否匹配,光模块与光纤连线操作是否正确等。当接口出现物理DOWN时,可以从上述几个方面进行排查。
故障定位方法
1、在任意视图下执行命令display device,查看设备型号及部件信息,其中框式设备主要可查看对应单板名称。
当Combo接口的工作模式设置为强制模式时,需要根据本端与对端设备连接的接口类型进行配置。
综上所述,当确定正确的连接介质后(光纤或者网线)后,就可以确定Combo口正确的工作模式,您可以直接使用命令combo-port,强制配置接口工作模式和连接介质保持一致即可。
8如何定位并恢复由环境因素导致的接口物理DOWN故障
原因描述
设备在网络中的部署位置是多变的,因此设备的使用场景复杂多样。当设备及其连接介质由于环境因素导致异常时,接口状态也可能物理DOWN。
故障定位方法
检查机房温度及湿度状况
S交换机工作环境温度:0℃~45℃,相对湿度在5%RH~95%RH之间,不结露。
检查线缆布放状况
电源线与业务线缆分开布放。不能出现强弱电线缆并行的情况,防止干扰。检查是否有高温或者机架磨损导致网线破损老化的问题。
故障恢复方法
若机房的环境温度长期不能满足要求,应考虑检修或更换机房的空调系统。若机房的相对湿度过大,应考虑为机房安装除湿设备;若机房的相对湿度过小,应考虑为机房安装加湿设备。
若出现强弱电线缆并行现象,请重新部署线缆走向,使强弱电线缆分离。如因环境因素导致网线损伤老化,请更换网线。
热心网友
时间:2023-09-16 21:45
华为网络交换机故障解答:一般来说,这种情况交换机是正常的,因为两个交换机是用两个端口相连,所以交换机认为是loop存在,它就自动断掉其中一根,将相应的端口Down 掉(显示红灯的端口),解决方法是打开Spanning tree的功能(缺省情况是打开的),让交换机知道这两个端口是FEC功能,逻辑上是一个端口。