DeepSeek加速推进R2模型
来源:李智衍 发布时间:2025-05-21
分享至微信

据《半岛电视台》报道,美国新任总统川普近期访问阿拉伯联合酋长国时,随行人员中包括NVIDIA CEO黄仁勋、软银创始人孙正义以及OpenAI CEO Sam Altman。这显示美方有意在中东地区推动本地版“星门计划”,强化美国技术圈的全球扩张。与此同时,中国AI业界仍在静候DeepSeek下一代模型R2的到来。
DeepSeek选择以开源、性价比为核心理念,用较少的资源训练出效能更强的专用模型。这种与美国“大模型、大资源”进化路线不同的策略,使中美在AI发展上的分歧愈加明显。2025年1月20日,DeepSeek发布了R1模型,这是由创始人梁文锋领导团队完成的成果,体现了中国大型语言模型在全球AI竞争中的突围策略。
自2023年5月成立以来,DeepSeek已推出超过10款模型,涵盖语言、代码、数学、视觉等多模态领域,通常采用“先语言基础模型,后多模型微调”的发展模式。若依照DeepSeek过去更新节奏观察,V1、V2、V3分别于2023年10月、2024年5月与2024年12月推出,基本保持每约7个月释出一个主力旗舰模型。
据路透社报道,DeepSeek内部已在加紧推进R2模型开发,原预计5月发布,但目前官方似乎并未有动作,距离5月底仅剩数日,R2仍未正式登场,进度尚未明朗。若新一代V4在2025年7月问世,则依照R1与V3间1个月的发表间距推估,R2最早可能于2025年8月登场,而非传闻中的5月。
近期,梁文锋仅发表了一篇与他人共同署名的技术论文,而非外界所关注的R2或V4的新模型版本发表。该论文聚焦于V3模型的扩展架构,从硬件设计与模型协同的角度,分析模型在扩展过程中面临的瓶颈与成本优化方式,内容却非外界期待的新一代旗舰模型R2或V4的技术报告。
不论是5月还是8月发表,DeepSeek R2是否能再次撼动LLM产业仍有待观察。然而可以确定的是,自R1在1月问世以来,国内AI圈的竞争节奏已被大幅改写。随着中美双方在AI硬件部署与模型发展上的策略分歧日益明显,DeepSeek的每一次出手,也将牵动全球关注目光。
[ 新闻来源:李智衍,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论
暂无评论哦,快来评论一下吧!


李智衍
开创IC领域,共创美好未来!
查看更多
相关文章
Rivian将在美投建供应商园区,加速R2 SUV生产
2025-05-08
Rivian投资1.2亿美元在美建供应商园区,加速R2车型生产
2025-05-07
DeepSeek联合清华大学推出AI模型训练新技术,将开源发布
2025-04-08
三星电机加速推进玻璃基板技术
2025-04-21
热门搜索