DeepSeek加速推进R2模型-icspec

DeepSeek加速推进R2模型

来源:李智衍发布时间:2025-05-21

分享至微信

据《半岛电视台》报道，美国新任总统川普近期访问阿拉伯联合酋长国时，随行人员中包括NVIDIA CEO黄仁勋、软银创始人孙正义以及OpenAI CEO Sam Altman。这显示美方有意在中东地区推动本地版“星门计划”，强化美国技术圈的全球扩张。与此同时，中国AI业界仍在静候DeepSeek下一代模型R2的到来。

DeepSeek选择以开源、性价比为核心理念，用较少的资源训练出效能更强的专用模型。这种与美国“大模型、大资源”进化路线不同的策略，使中美在AI发展上的分歧愈加明显。2025年1月20日，DeepSeek发布了R1模型，这是由创始人梁文锋领导团队完成的成果，体现了中国大型语言模型在全球AI竞争中的突围策略。

自2023年5月成立以来，DeepSeek已推出超过10款模型，涵盖语言、代码、数学、视觉等多模态领域，通常采用“先语言基础模型，后多模型微调”的发展模式。若依照DeepSeek过去更新节奏观察，V1、V2、V3分别于2023年10月、2024年5月与2024年12月推出，基本保持每约7个月释出一个主力旗舰模型。

据路透社报道，DeepSeek内部已在加紧推进R2模型开发，原预计5月发布，但目前官方似乎并未有动作，距离5月底仅剩数日，R2仍未正式登场，进度尚未明朗。若新一代V4在2025年7月问世，则依照R1与V3间1个月的发表间距推估，R2最早可能于2025年8月登场，而非传闻中的5月。

近期，梁文锋仅发表了一篇与他人共同署名的技术论文，而非外界所关注的R2或V4的新模型版本发表。该论文聚焦于V3模型的扩展架构，从硬件设计与模型协同的角度，分析模型在扩展过程中面临的瓶颈与成本优化方式，内容却非外界期待的新一代旗舰模型R2或V4的技术报告。

不论是5月还是8月发表，DeepSeek R2是否能再次撼动LLM产业仍有待观察。然而可以确定的是，自R1在1月问世以来，国内AI圈的竞争节奏已被大幅改写。随着中美双方在AI硬件部署与模型发展上的策略分歧日益明显，DeepSeek的每一次出手，也将牵动全球关注目光。

icspec【芯片求购】https://www.icspec.com/inquiry/index/1/0

[ 新闻来源：李智衍，更多精彩资讯请下载icspec App。如对本稿件有异议，请联系微信客服specltkj]