新聞資訊
了解故障案例及產(chǎn)品資訊
新聞資訊News
相關(guān)產(chǎn)品Related Product
問題描述
客戶日常維護(hù)時發(fā)現(xiàn),在用T2000網(wǎng)管查詢OSN3500網(wǎng)元多塊單板的性能事件時,大部分時間都不能正常返回,只是偶爾可以正確查詢到,查詢失敗時上報錯誤碼126979。但單獨(dú)查詢其中任意一塊單板的性能時結(jié)果都正常,命令行查詢也正常。T2000版本為V2R5C01B01C,設(shè)備版本為5.21.15.13。
告警信息
錯誤碼:126979
處理過程
1、分析網(wǎng)管日志確認(rèn)查詢性能時設(shè)備有丟包。
2、網(wǎng)管下發(fā)查詢所有單板當(dāng)前性能,在網(wǎng)管會下發(fā)多條操作命令給網(wǎng)元性能主機(jī)模塊,性能主機(jī)模塊再分發(fā)給多個單板性能,等待多塊單板的返回。
3、由于每個單板性能數(shù)據(jù)量不一樣多,單板性能返回數(shù)據(jù)給主機(jī)性能數(shù)據(jù)存在時間先后順序的問題,性能主機(jī)上接收多塊單板數(shù)據(jù)異步處理時,對其中當(dāng)前性能數(shù)據(jù)為空單板的特殊情況處理不完整,導(dǎo)致當(dāng)前性能數(shù)據(jù)為空單板的命令丟失,沒有反饋網(wǎng)管,結(jié)果出現(xiàn)網(wǎng)管等待命令超時。
4、后續(xù)平臺版本通過如下方式規(guī)避處理:在多命令多單板性能數(shù)據(jù)返回性能主機(jī)模塊時,對數(shù)據(jù)緩存發(fā)送和單板查詢空的情況進(jìn)行處理,解決單板查詢?yōu)榭盏拿罱Y(jié)束影響到其它單板多數(shù)據(jù)命令返回。使性能主機(jī)模塊能正確上報各塊單板命令到接口模塊,從而使網(wǎng)管能正確顯示當(dāng)前性能數(shù)據(jù)。
根因
由于查詢性能時是概率出現(xiàn)超時現(xiàn)象,很有可能是網(wǎng)管下發(fā)命令到網(wǎng)元時,網(wǎng)元側(cè)丟包,導(dǎo)致網(wǎng)管誤認(rèn)為網(wǎng)元沒有返回,上報超時。
建議與總結(jié)
該問題在OSP07C03T09和OSP07C02T17及后續(xù)版本已經(jīng)解決,對應(yīng)產(chǎn)品版本可以參考版本配套表。