上QQ阅读APP看书,第一时间看更新
案例12 OSN 1500B设备AUX故障导致单板脱管
故障现象
某铁路局反映A站OSN 1500B设备2槽位EFS0、14槽位ETF8、7槽位PD1和9槽位EOW在网管上脱管,业务正常。
组网情况
该网元处于一两纤单向通道环中。
A站单板配置如下:
2:EFS0
4:Q1SL4
5:Q1SL4
7:PD1
9:EOW
10:AUX
14:ETF8
80:ECXL
81:ECXL
82:GSCC
83:GSCC
原因分析
1.该网元和环内其他网元的业务和监控正常,故该故障为单站故障;
2.查看网管告警,不在位单板均上报HARD_BAD告警和COMMUN_FAIL告警,且告警时间相同;
3.HARD_BAD为硬件故障告警,产生该告警后,若单板为备板,则无法进行主备倒换,并可能会造成业务中断;
4.COMMUN_FAIL为主控板与各其他单板之间通信故障所产生的告警;
5.该站业务正常,可能是主控板、AUX、背板故障。
故障定位及处理过程
1.查看网管无其他告警,主控板主备状态及各板状态;
2.由于可能故障的三块板中,AUX板硬复位对业务无影响,所以操作顺序为硬复位AUX→主控板主备倒换→更换背板;
3.对AUX板硬复位后故障单板监控恢复正常,且HARD_BAD告警和COMMUN_FAIL告警消失,故障解除。
总结和建议
1.网元某单板故障报HARD_BAD告警和COMMUN_FAIL告警时,不要急于对该单板进行硬复位、拔插甚至更换操作,应先观察是否有其他单板同时上报,该告警不一定是由于该板故障产生的;
2.不要急于对主控板进行操作,问题有可能出在AUX上,对主控交叉合一板进行操作有可能造成业务中断。