英特尔利用AI技术检测芯片隐藏缺陷,提升Xeon芯片可靠性
来源:李智衍 发布时间:2025-04-30 分享至微信
据IEEE Spectrum报道,英特尔团队开发了一种利用人工智能技术检测芯片隐藏缺陷的新方法,旨在提升Xeon芯片的可靠性。数据中心的运算规模庞大,即便极小概率的静态数据错误也可能对系统造成严重影响。然而,这类错误通常难以通过常规质量检测发现。

英特尔在国际可靠度物理研讨会上介绍了这一方法。它基于现有的“Eigen测试”技术,结合强化学习,显著提升了检测效率。团队选择Xeon CPU芯片上的FMA(融合乘加运算)区域作为测试重点。该区域占芯片面积较大,且易受静态错误影响,一旦出现问题可能干扰系统运行。

测试过程中,强化学习程序通过不断选择不同的测试方案,并将成功检测到的错误视为奖励,逐步优化检测效率。经过约500轮测试后,算法能够确定最适合检测FMA区域错误的Eigen测试组合。

尽管目前技术尚未达到完美,但英特尔团队表示,他们正尝试利用这一成果更快定位静态数据错误,并研究通过改进芯片设计预防潜在问题的可能性。这为提升芯片可靠性提供了新的思路。
[ 新闻来源:李智衍,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论

暂无评论哦,快来评论一下吧!