阶跃星辰开源 Step 3.7 Flash 模型,最高生成速度每秒 400 Tokens Step 3.7 Flash 采用稀疏 MoE 架构,总参数 196B+1.8B(ViT)、激活参数 11B。 AI 新资讯行业资讯# 大模型# 开源# 阶跃星辰 4周前1,84926
AI 制造 AI:面壁智能开源全球首个完全由 AI 编写的生产级训练框架 ForgeTrain 面壁智能今日联合清华大学、OpenBMB 开源社区正式发布 ForgeTrain—— 全球首个完全由 AI 编写、零人类代码介入的生产级大模型训练框架。 AI 新资讯行业资讯# ai# ForgeTrain# 开源 4周前2,11875
面壁智能开源 MiniCPM5-1B:在 AA-Index 上超越所有 2B 参数以下模型,能跑在手机、浏览器上 面壁智能今日联合清华大学、 OpenBMB 开源社区正式发布并开源最新一代端侧文本基座大模型 ——MiniCPM5-1B。 AI 新资讯行业资讯# Artificial Analysis# MiniCPM51B# 大模型 4周前1,794552
面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN 从量化算子、训练算法到全链路框架,BitCPM-CANN 均在华为昇腾上原生完成,包含 0.5B、1B、3B、8B 四个模型尺寸。 AI 新资讯行业资讯# 华为# 大模型# 开源 1个月前1,856741
“让 Token 消耗降低 61%”:腾讯开源 Agent Memory 通过“上下文卸载”和“Mermaid 任务画布”技术,将长任务中的大量中间信息压缩存储,使 AI Agent 能保持轻量上下文,同时支持原始信息追溯。实验显示最高可降低 61% Token 消耗,并提... AI 新资讯行业资讯# AI Agent# 开源# 腾讯云 1个月前2,227789
小米开源 Xiaomi OneVL 自动驾驶模型,业内率先实现 VLA、世界模型等多技术路线统一 小米将 Xiaomi OneVL 的模型权重和训练、推理代码全面开源。 AI 新资讯行业资讯# 小米# 开源# 模型 1个月前2,151363
腾讯开源 OpenSearch-VL,突破多模态搜索 AI 智能体训练瓶颈 腾讯混元(Tencent Hunyuan)携手加州大学洛杉矶分校(UCLA)、香港中文大学等学府,联合发布 OpenSearch-VL 开源多模态训练方案,通过强化学习(RL)技术,打造具备前沿能力的... AI 新资讯行业资讯# ai# 开源# 腾讯 2个月前2,903366
机器人连续收纳耳机,小米开源 VLA 大模型 Xiaomi-Robotics-0 后训练全流程 小米今日宣布,为了让其真正成为“开箱即用”的生产力利器,带来新的能力演示并正式发布 Xiaomi-Robotics-0 真机后训练(Post-training)全流程。 AI 新资讯行业资讯# 大模型# 小米# 开源 2个月前2,30226
移除视频中出现的路人,小米开源 CVPR 2026 夺冠技术 SVOR 小米还表示,在视频消除的评测方案上也做了较多工作,包括评测数据收集整理和创新性评测方法,将在合适的时间进行开源。 AI 新资讯行业资讯# 小米# 开源# 视频消除 2个月前2,825753
MiniMax 开源 M2.7 模型,AI 自主训练与复杂任务能力再突破 M2.7 模型让 AI 深度参与自身训练与优化,构建复杂 Agent 框架,在真实软件工程场景中表现出色。其 SWE-Pro 基准测试得分 56.22%,接近顶级水平,在项目交付、Bug 排查、代码安... AI 新资讯行业资讯# M2.7 模型# MiniMax# 开源 2个月前4,057627