国产大模型公司MiniMax推出开源推理模型M1,性能媲美国际领先水平
来源:林慧宇 发布时间:9 小时前 分享至微信
据报道,6月17日,国产大模型初创企业MiniMax(希宇科技)发布了全球首个开源的大规模混合架构推理模型M1。

MiniMax披露的对比数据显示,M1在多项基准测试中表现优异,与DeepSeek-R1、Qwen3等开源模型相当,接近OpenAI O3等国际顶尖模型。此外,M1支持业内最高的100万上下文输入,与Google Gemini 2.5 Pro持平,是DeepSeek R1的8倍,同时支持最长8万Token的推理输出。

M1的卓越性能得益于其独创的“闪电注意力机制”(Lightning Attention),该机制显著提升了长上下文输入和深度推理的效率。此外,MiniMax还提出了一种更快的强化学习算法CISPO,通过裁剪重要性采样权重优化训练效率,其性能优于字节提出的DAPO算法和DeepSeek早期的GRPO算法。

在训练成本方面,MiniMax的强化学习阶段仅使用512块H800 GPU三周时间,租赁成本为53.47万美元,比预期降低一个数量级。在17个主流评测集中,M1在长上下文理解任务中表现出色,仅以微弱差距落后于Gemini 2.5 Pro,但在代理工具使用场景(TAU-bench)中胜出。

为推广M1,MiniMax宣布在APP和Web端提供不限量免费使用,并以业内最低价格开放API服务。例如,在0-32k输入长度下,输入价格为0.8元/百万Token,输出为8元/百万Token;在最长128k-1M输入长度下,输入为2.4元/百万Token,输出为24元/百万Token。相比DeepSeek-R1,M1在性价比上更具优势。

MiniMax的背后得到了阿里巴巴集团、腾讯和IDG资本的支持。

[ 新闻来源:林慧宇,更多精彩资讯请下载icspec App。如对本稿件有异议,请联系微信客服specltkj]
存入云盘 收藏
举报
全部评论

暂无评论哦,快来评论一下吧!