中国联通发布全球最长距离大模型异构混训试验成果
来源:林慧宇 发布时间:2025-07-20 分享至微信
7月19日,在2025年中国联通合作伙伴大会期间,中国联通研究院携手上海人工智能实验室及其他行业伙伴,正式发布了一项全球领先的试验成果——全球最长距离大模型异构混训试验。据官方消息,这一成果标志着人工智能算力基础设施领域的重要突破。

近年来,随着人工智能技术的快速发展,大模型训练对算力基础设施提出了更高要求,包括高吞吐、低时延和高性能等特性。然而,当前算力资源分布呈现异构化和多中心化的特点,跨域资源互联互通机制不完善,长距离传输面临带宽与时延瓶颈,异构资源的统一调度与高效融合能力也亟待提升。

为解决上述问题,中国联通联合上海人工智能实验室、阿里云、浪潮、基流科技、加佳科技等合作伙伴,依托“算力智联网 AINet”长距无损传输技术,结合上海人工智能实验室的“DeepLink”超大规模跨域混训技术方案,在上海临港与山东济南鲍山数据中心之间搭建了长度超过1500公里的跨域异构混训系统。

试验过程中,联合团队通过自动调整多种并行策略和跨域收敛比,完成了MoE模型和Dense模型的参数配置优化,成功实现了超1500公里跨域的千亿参数AI大模型异构混训。经验证,该系统的等效算力达到了单芯片单集群等效算力的95%以上。

在技术层面,项目采用了联通自主研发的内置长距RDMA协议栈的RoCE交换机,满足数据中心内外高性能网络需求;通过“智驭”平台实现跨域网络和集群的统一管控及任务调度;同时借助DeepLink的核心技术,在训练加速、异构通信和并行策略等方面,实现了大模型在超长距离异构GPU环境下的高效训练。

[ 新闻来源:林慧宇,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论

暂无评论哦,快来评论一下吧!