新聞資訊
了解故障案例及產(chǎn)品資訊
新聞資訊News
相關(guān)產(chǎn)品Related Product
問題描述
某日,工程師在進(jìn)行一臺(tái)OSN3500網(wǎng)元平滑升級(jí),更換SXCS為PSXCS,單板上線后發(fā)現(xiàn)新插入的9槽位N2PSXCS單板上報(bào)TEMP_OVER告警,10槽位N2PSXCS無(wú)此告警。
告警信息
TEMP_OVER
處理過程
1、現(xiàn)場(chǎng)工程師查看機(jī)房溫度,溫度為23度,空調(diào)運(yùn)行正常;
2、拆卸防塵網(wǎng)進(jìn)行清理,清理過后插回,告警仍未消失;
3、由于之前SXCS單板并無(wú)異常告警,懷疑是單板誤告產(chǎn)生,令現(xiàn)場(chǎng)工程師插拔9槽位PSXCS單板,單板復(fù)位上線后,告警仍未消失;
4、用命令行“:cfg-get-bdtemp:bid”查詢9/10槽位單板溫度,9/10槽位溫度分別為65.2/62.5,用“:cfg-get-fanspeed”查詢風(fēng)扇情況,為normal。
9槽位溫度已經(jīng)超過65度,所以上報(bào)此告警,并非誤告,根據(jù)研發(fā)分析,9槽位溫度通常情況應(yīng)低于10槽位溫度,現(xiàn)場(chǎng)9槽位溫度反而比10槽位高,很可能該槽位交叉芯片使用的是fast高功耗型,所以溫度高。此場(chǎng)景可以通過命令行適當(dāng)調(diào)高告警門限和更改風(fēng)扇速度為high解決,命令行如下:
設(shè)置告警門限
:cfg-set-bdtempth:9,700,0
:cfg-set-bdtempth:10,700,0
設(shè)置風(fēng)速
:cfg-set-fanspeed:high
執(zhí)行命令后,TEMP_OVER告警消失。
經(jīng)研發(fā)確認(rèn),芯片是否fast沒有命令可以查詢,只能通過JTAG讀出芯片ID,再轉(zhuǎn)給IBM確認(rèn)。簡(jiǎn)單的判別方法就是看單板上報(bào)溫度,一般fast芯片單板溫度明顯會(huì)比其他板高10度甚至更多。
根因
1、懷疑機(jī)房溫度過高;
2、防塵網(wǎng)阻塞;
3、單板誤告;
4、單板芯片原因。
建議與總結(jié)
通常情況出現(xiàn)TEMP_OVER告警時(shí),處理方式為查詢機(jī)房溫度是否正常,檢查防塵網(wǎng)是否阻塞;當(dāng)出現(xiàn)MSTP+產(chǎn)品芯片高功耗問題時(shí),可以通過適當(dāng)修改告警門限和調(diào)整風(fēng)扇速度解決。
另外,8/11槽位插入單板也可以促進(jìn)交叉板散熱。