新聞資訊
了解故障案例及產(chǎn)品資訊
新聞資訊News
相關(guān)產(chǎn)品Related Product
問題描述(故障現(xiàn)象)
1、省干ZXCTN 6500-1的44槽位1口和45槽位1口組成一個聚合組與華為SGW對接,開通一段時間后出現(xiàn)隔一兩天報 二層BFD檢測回話狀態(tài)down告警,持續(xù)時間3秒中左右,導(dǎo)致smartgroup接口失效告警,并觸發(fā)FRR切換;另外一臺PTN-2設(shè)備也有同樣的端口與這臺SGW對接,告警現(xiàn)象一致。
2、查詢端口,沒有光功率異常和以太網(wǎng)端口未連接告警:
3、BFD配置正常間隔為100ms,倍率3;BFD配置數(shù)據(jù)正常。
原因分析
1、省干維護(hù)工程師首先查詢省干光功率和設(shè)備其它相關(guān)告警性能等,均未發(fā)現(xiàn)異常告警,光功率正常,且未出現(xiàn)以太網(wǎng)端口down等告警,也沒有光路誤碼,說明連接的物理鏈路是正常的,只是因?yàn)锽FD檢測報文發(fā)出的接口狀態(tài)down告警。
2、省干PTN請中興研發(fā)工程師遠(yuǎn)程登陸到兩臺PTN設(shè)備進(jìn)行底層命令查詢,經(jīng)過排查,BFD數(shù)據(jù)未見異常,省干PTN設(shè)備正常。
3、通過統(tǒng)計查詢省干西區(qū)PTN-1和省干西區(qū)PTN-2兩臺設(shè)備的告警,發(fā)現(xiàn)一個規(guī)律,所有BFD告警產(chǎn)生時間 和消失時間在省干兩臺設(shè)備上幾乎都是同時(即PTN-1報告警的同時PTN-2上也同樣報告警),最多差1-2秒鐘。由此可以判斷,應(yīng)該有同一個故障源導(dǎo)致了省干兩臺設(shè)備同時報此告警,否則兩臺設(shè)備之間沒有任何協(xié)議,告警如何能實(shí)現(xiàn)同時上報呢。通過分析判斷,BFD閃報告警問題很可能由SGW引起導(dǎo)致。
解決方案
故障分析
1、省干維護(hù)工程師首先查詢省干光功率和設(shè)備其它相關(guān)告警性能等,均未發(fā)現(xiàn)異常告警,光功率正常,且未出現(xiàn)以太網(wǎng)端口down等告警,也沒有光路誤碼,說明連接的物理鏈路是正常的,只是因?yàn)锽FD檢測報文發(fā)出的接口狀態(tài)down告警。
2、省干PTN請中興研發(fā)工程師遠(yuǎn)程登陸到兩臺PTN設(shè)備進(jìn)行底層命令查詢,經(jīng)過排查,BFD數(shù)據(jù)未見異常,省干PTN設(shè)備正常。
3、通過統(tǒng)計查詢省干西區(qū)PTN-1和省干西區(qū)PTN-2兩臺設(shè)備的告警,發(fā)現(xiàn)一個規(guī)律,所有BFD告警產(chǎn)生時間 和消失時間在省干兩臺設(shè)備上幾乎都是同時(即PTN-1報告警的同時PTN-2上也同樣報告警),最多差1-2秒鐘。由此可以判斷,應(yīng)該有同一個故障源導(dǎo)致了省干兩臺設(shè)備同時報此告警,否則兩臺設(shè)備之間沒有任何協(xié)議,告警如何能實(shí)現(xiàn)同時上報呢。告警截圖如下圖:
故障處理
1、SGW更換單板后故障恢復(fù),由此驗(yàn)證了我前面的判斷。