国产大模型公司MiniMax推出开源推理模型M1,性能媲美国际领先水平
来源:林慧宇 发布时间:9 小时前
分享至微信

据报道,6月17日,国产大模型初创企业MiniMax(希宇科技)发布了全球首个开源的大规模混合架构推理模型M1。
MiniMax披露的对比数据显示,M1在多项基准测试中表现优异,与DeepSeek-R1、Qwen3等开源模型相当,接近OpenAI O3等国际顶尖模型。此外,M1支持业内最高的100万上下文输入,与Google Gemini 2.5 Pro持平,是DeepSeek R1的8倍,同时支持最长8万Token的推理输出。
M1的卓越性能得益于其独创的“闪电注意力机制”(Lightning Attention),该机制显著提升了长上下文输入和深度推理的效率。此外,MiniMax还提出了一种更快的强化学习算法CISPO,通过裁剪重要性采样权重优化训练效率,其性能优于字节提出的DAPO算法和DeepSeek早期的GRPO算法。
在训练成本方面,MiniMax的强化学习阶段仅使用512块H800 GPU三周时间,租赁成本为53.47万美元,比预期降低一个数量级。在17个主流评测集中,M1在长上下文理解任务中表现出色,仅以微弱差距落后于Gemini 2.5 Pro,但在代理工具使用场景(TAU-bench)中胜出。
为推广M1,MiniMax宣布在APP和Web端提供不限量免费使用,并以业内最低价格开放API服务。例如,在0-32k输入长度下,输入价格为0.8元/百万Token,输出为8元/百万Token;在最长128k-1M输入长度下,输入为2.4元/百万Token,输出为24元/百万Token。相比DeepSeek-R1,M1在性价比上更具优势。
MiniMax的背后得到了阿里巴巴集团、腾讯和IDG资本的支持。
[ 新闻来源:林慧宇,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论
暂无评论哦,快来评论一下吧!


林慧宇
开创IC领域,共创美好未来!
查看更多
相关文章
小米发布首个开源AI推理大模型MiMo
2025-04-30
芯原股份发布高性能NPU IP,支持移动端大语言模型推理
2025-06-09
奥特曼:美国AI模型领先中国但幅度有限
2025-05-11
清华系AI双雄联手,共推国产大模型发展
2025-04-27
热门搜索