官方预告 MiniMax M3 系列 AI 模型即将登场

5 月 27 日消息，上海稀宇科技有限公司（MiniMax）今天在 X 平台发布推文，预告将推出 MiniMax M3 系列模型。

该推文转发了一篇 5 月 26 日发表在 arxiv 上的论文《The MiniMax-M2 Series: Mini Activations Unleashing Max Real-World Intelligence》，回顾了 MiniMax M2.x 系列模型的背后工作。IT之家附上相关截图如下：

官方预告 MiniMax M3 系列 AI 模型即将登场 width=”987″ height=”1421″>

该论文指出 MiniMax M2.x 系列模型总参数 229.9B，但每个词元仅激活 9.8B 参数，主打“低激活、高智能”，配备 192K 上下文窗口，预训练数据规模达 29.2T 词元。

在模型设计上，M2 系列采用 62 层解码器式 Transformer（变换器），使用 256 个细粒度专家，并为每个词元激活 8 个专家。

在训练系统层面，MiniMax 提出 Forge，这是一个面向智能体的强化学习系统，支持白盒与黑盒智能体统一接入。系统通过训练、推理与智能体解耦，配合窗口化 FIFO 调度、前缀树合并和推理加速，降低长轨迹训练成本。

M2.7 最受关注的升级，是论文提出的“自我进化”雏形。模型已能自主排查训练失败、阅读日志、修改脚手架代码，并在内部任务上完成 100 轮自主迭代。

论文称，这套系统已吸收团队 30% 到 50% 的日常迭代工作量，且在内部编程脚手架优化中带来 30% 性能提升，显示模型开始参与自身开发闭环。

参考

The MiniMax-M2 Series: Mini Activations Unleashing Max Real-World Intelligence

AI 新资讯行业资讯 # ai # MiniMax

文章版权归作者所有，未经允许请勿转载。

Salesforce CEO 贝尼奥夫警告：AI 已成“自杀教练”，政府部门应加强监管

AI 新资讯行业资讯 # AI监管 # salesforce # 人工智能

6个月前

6,139481

李飞飞的 World Labs 推出其首款商用世界模型 Marble，支持 3D 环境生成与 AI 原生编辑

AI 新资讯行业资讯 # Marble # World Labs # 世界模型

8个月前

7,296766

【融云分析】基于 AVFoundation 框架开发小视频功能的方案解析

AI 新资讯行业资讯 # 手机

6年前

13,36983

Stellantis、Wayve、Uber 三方携手，全球范围推动 L4 Robotaxi 开发部署

AI 新资讯行业资讯 # Robotaxi # Stellantis # Uber

4周前

1,344777

官方预告 MiniMax M3 系列 AI 模型即将登场

继 OpenAI 后，Anthropic 的 Claude AI 也解出这道 80 年数学难题

OpenAI 奥尔特曼称 AI 对白领冲击不如预期般严重：我很高兴自己当时错了

相关文章

Salesforce CEO 贝尼奥夫警告：AI 已成“自杀教练”，政府部门应加强监管

李飞飞的 World Labs 推出其首款商用世界模型 Marble，支持 3D 环境生成与 AI 原生编辑

【融云分析】基于 AVFoundation 框架开发小视频功能的方案解析

Stellantis、Wayve、Uber 三方携手，全球范围推动 L4 Robotaxi 开发部署