顺发配资

      服务器 2025-11-04

      KunTai R2260 服务器光模块告警

      一、现网描述

      1.1 环境描述

      设备型号:8台R2660服务器

      硬件配置:每台服务器安装2张SP382网卡


      二、故障描述

      2.1故障现象

      现场一共8台服务器,每台服务器安装两张SP382网卡, 两张网卡分别使用一个光口连接到网络中,此时空闲状下的光模块在iBMC系统显示异常告警

      image.png


      三、问题分析

      3.1 排查思路

      1.sel显示光模块Abnormal Rx or Tx powers of optical module were detected告警,告警代码:0x29000017

      image.png

      2.Ibma服务已开启image.png

      3.关键过程

      告警信息是iBMA从光模块内部读取的,有光模块但是没有光纤它内部就会有RX功率低的告警; iBMA确实检测到该异常;和接口人对齐客户服务器环境确实是有光模块但是没有插网线;另外iBMC的用户指南对该告警也有说明

      image.png

      3.2 原因分析

      iBMA是从光模块内部读取的,有光模块但是没有光纤它内部就会有RX功率低的告警;iBMA确实检测到该异常。


      四、问题解决

      4.1 解决办法

      硬件层面

      拔掉空闲的光模块或者在空闲光模块上插入光纤线

      软件层面

      Down掉空闲的网口或者关闭iBMA功率信息收集功能(ibmc将无法获取系统层面硬件功率使用信息)

      禁用iBMA功率信息收集方法如下:

      1)cd /opt/huawei/ibma/config

      2)vi Monitor.ini

      3)找到NIC下的Sff_Dynamic

      4)将disableResource改为true

      5)更改后重启iBMA服务: