
OBFL基线记录的创建独立于任何电路板故障。OBFL系统应一直保持一个初始基线记录和至少一个近期基线记录。在完成对OBFL的系统现场配置、首次成功将电路板件投入使用之后,就会立即生成初始基线。首次创建近期基线记录的时候,将使用初始基线记录。创建近期基线记录的目的,是为了获取OBFL资源的近期值。随后每次成功的电路板复位都会创建后续的基线。OBFL还会要求提供存档的旧基线。任何稳定的基线都会被标注为“优良”基线,并在故障排查过程中用作参考基线。如果没有优良基线记录,初级基线记录将用作参考基线。
基线记录将获取特定的软硬件配置详情,并存储在非易失性存储器中。基线记录的硬件部分包括电路板配置数据详情,如机架编号、电路板件的插槽号、序列号、子卡标识详情、FPGA和ASIC修订号等。该部分还应该存储诸如SRAMSDRAM/DDR这样的板载存储器类型、序列号和配置详细信息。BIOS版本、固件版本、OS详情和应用软件版本应存储在软件基线记录下。该记录在缩小由近期软硬件升级造成的电路板故障范围时非常有用。
基线记录的第三部分存储电路板环境变量值。任一存储的电路板环境变量都存放有近期的“N”个值,最大实际值和电路板环境变量的最低允许值。环境变量包括电路板电源部分参数,如电压、电流以及来自电路板上一个或者多个感应器的温度读数。
电路板环境变量的值定期采集、存储为近期值,并同最大允许值进行比较。如果采集的值大于最大允许值,将采用当前的时间戳更新环境错误事件(Environment Error Event)记录。此外,电路板一般有多个电压源和温度感应器。温度应定期记录(比如每隔30分钟),而电压数据可以不需这么频繁(比如每隔60分钟)。
事件记录
OBFL事件记录负责存储由板载存储器故障、系统复位、意外事件、中断错误或者电路板环境错误导致的硬件故障事件迹象(如电路板崩溃)。OBFL事件记录可以分为下列几类:
暂无评论哦,快来评论一下吧!

