面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN 从量化算子、训练算法到全链路框架,BitCPM-CANN 均在华为昇腾上原生完成,包含 0.5B、1B、3B、8B 四个模型尺寸。 AI 新资讯行业资讯# 华为# 大模型# 开源 4周前1,741741
阶跃星辰开源 Step 3.7 Flash 模型,最高生成速度每秒 400 Tokens Step 3.7 Flash 采用稀疏 MoE 架构,总参数 196B+1.8B(ViT)、激活参数 11B。 AI 新资讯行业资讯# 大模型# 开源# 阶跃星辰 3周前1,60426
面壁智能开源 MiniCPM5-1B:在 AA-Index 上超越所有 2B 参数以下模型,能跑在手机、浏览器上 面壁智能今日联合清华大学、 OpenBMB 开源社区正式发布并开源最新一代端侧文本基座大模型 ——MiniCPM5-1B。 AI 新资讯行业资讯# Artificial Analysis# MiniCPM51B# 大模型 4周前1,599552