新聞資訊
了解故障案例及產(chǎn)品資訊
新聞資訊News
相關(guān)產(chǎn)品Related Product
問題描述
中國北方某局點OSN1500多塊單板上報TEMP_OVER告警,結(jié)合告警參數(shù)和設(shè)備工作環(huán)境的問題,斷定該告警是單板溫度過低而引起的,下面討論一下NG-SDH設(shè)備的溫度檢測機理以及遇到的一些問題。
現(xiàn)網(wǎng)版本:5.36.18.50
告警信息
TEMP_OVER
處理過程
查看當(dāng)前告警中TEMP_OVER告警參數(shù)如下:
2929679 12 TEMP_OVER MJ start 2011-12-01 04:52:16 None 0x01 0x00 0x01 0x02 0xff
3000350 80 TEMP_OVER MJ start 2011-12-24 04:59:15 None 0x01 0x00 0x01 0x02 0xff
結(jié)合當(dāng)前OSN1500產(chǎn)品手冊(V100R008C02)中,對于SDH類單板,由參數(shù)4表示單板工作溫度越限的類型,對于交叉類單板,由參數(shù)1表示單板工作溫度越限的類型,其中0x01表示單板工作溫度越上限,0x02表示單板工作溫度越下限。那么對于三合一板應(yīng)該看參數(shù)1,工作溫度上限越限,顯然和實際情況相反,查詢的當(dāng)前單板的溫度cfg-get-bdtemp:80,單板當(dāng)前問題為-2°C。
BOARD-TEMP
BID TEMP-NOW
80 -20
Total records :1
所以產(chǎn)品手冊中工作溫度越限類型看參數(shù)1是錯誤的,經(jīng)過研發(fā)確認(rèn),對于交叉類TEMP_OVER告警參數(shù)只需要看參數(shù)4,參數(shù)1為固定值,OSN3500(V100R008)和OSN7500(V100R008)對于參數(shù)的解釋也是有誤的,其他版本比如R11的產(chǎn)品文檔在告警參數(shù)解釋上有變動,只需要關(guān)注參數(shù)1。
2、NG-SDH設(shè)備溫度上報的機制,單板內(nèi)部有溫度芯片,可以實時檢測單板的溫度,其他單板和主控板是通過背板通信的方式,將實時溫度上報給主機,主機結(jié)合當(dāng)前網(wǎng)元的所有單板上報溫度中的最大值,記錄到溫度性能事件里面,所以只有主控板才能查詢到單板溫度的性能事件(bdtempmax,bdtempmin,bdtempcur),其他單板查詢出來的是激光器的溫度,該溫度比單板問題高。
3、同一單板的不同版本對于溫度查詢支持情況是不同的,例如SSN2PQ1 VER.C(含溫度芯片)和SSN2PQ1S VER.C(不含溫度芯片),前者屬于早期的版本,后者是降成本的產(chǎn)物,所以前者支持溫度查詢和溫度告警的上報,后者不支持該功能。具體情況可以通過cfg-get-bdtemp:bid,根據(jù)返回的結(jié)果來判斷該單板是否含溫度芯片。
4、溫度告警是單板內(nèi)溫度芯片查詢單板實時溫度,和溫度告警門限值進行比較,如果越限就上報TEMP_OVER告警。當(dāng)然告警門限值可以通過命令行修改:cfg-set-bdtempth:Bid, temphighgate, templowgate;門限值是有范圍限制的,比如上門限在60-80,一些數(shù)據(jù)單板(SSN1EAS1/SSN1EAS2/SSN1EMS4/SSN1EGS4)是80,其他單板是70,缺省值是65。一般不建議將溫度門限設(shè)置超過70。
建議與總結(jié)
一般情況下TEMP_OVER是因為溫度過高而上報的告警,但是也有溫度過低上報該告警的情況,為了消除此告警,請盡量保證設(shè)備工作環(huán)境的溫度處于正常條件(0~45度之間)。