英伟达推出 Nemotron 3 Nano Omni 模型:采用 30B‑A3B 混合 MoE 架构,吞吐量最高提升 9.2 倍
该模型采用创新的 30B‑A3B 混合 MoE 架构,将视频、音频、图像和文本推理统一于单一模型,旨在替代智能体系统中常见的碎片化模型链。其在多项基准测试中表现领先,尤其在视频推理任务中,有效系统容量...
微软 GitHub Copilot 宣布转向按量计费:6 月 1 日起改用 AI Credits,基础订阅价格不变
微软 GitHub 宣布,其 AI 编程工具 Copilot 将于 6 月 1 日起从固定额度订阅改为按量计费,使用 AI Credits。基础订阅价格不变,但重度用户成本或增加,企业用户将获得共享额...
OpenAI 发布 Privacy Filter:1.5B 参数 PII 脱敏模型,Apache 2.0 开源上线
OpenAI 发布开源 PII 脱敏模型 Privacy Filter,1.5B 参数采用 MoE 设计,支持 12.8 万 Token 上下文。可在本地检测 8 类敏感信息,F1 分数达 97.43...
DeepSeek-V4-Pro 开启 API 限时 2.5 折优惠,活动持续至 5 月 6 日前
DeepSeek-V4-Pro 作为旗舰大模型,开启限时 2.5 折 API 优惠,输入价格(缓存命中)低至每百万 tokens 0.25 元,输出价格 6 元。该模型采用混合专家架构,总参数量 1...
阶跃星辰发布 StepAudio 2.5 ASR 自动语音识别模型:推理速度提升 400%,定价骤减 90%
阶跃星辰 StepAudio 2.5 ASR 将大语言模型推理加速技术引入语音识别,实现 400% 速度提升与 60% 时延降低,并支持 30 分钟长音频端到端转写,无需分段。新模型定价仅 0.15 ...
蚂蚁百灵万亿旗舰模型 Ling-2.6-1T 发布:主打“快思考”,对标 GPT-5.4 非推理版
蚂蚁百灵发布万亿级旗舰模型 Ling-2.6-1T,采用独特混合架构,摒弃多步推理,以“快思考”机制实现高效推断,显著降低成本和延迟。其综合智能水平已与 GPT-5.4 非推理版相当,在多项基准测试中...
美团万亿级大模型 LongCat-2.0-Preview 开放测试,全程基于国产算力集群训练
美团新一代基础大模型 LongCat-2.0-Preview 已开放邀请测试,总参数规模突破万亿,采用混合专家架构,整体能力对标 GPT-4。该模型完全基于国产化算力集群训练,标志着美团在国产算力训练...
华为云首发适配 DeepSeek-V4,提供免部署、一键调用 API 的 Tokens 服务
华为云 MaaS 平台已为开发者提供免部署、一键调用 DeepSeek-V4-Flash API 的 Tokens 服务。适配过程中,华为云针对 V4 模型特性,首发适配了模型分层注意力压缩机制,支持...
通义千问 Qwen3.6-27B 宣布开源:270 亿参数稠密模型,编程能力超越 15 倍规模 MoE 模型
这款稠密多模态模型在多项编程基准测试中全面超越前代旗舰 MoE 模型,支持多模态思考与非思考模式,是开发者获取顶尖编程能力的理想选择。#通义千问开源# #AI 编程助手# 开源权重已上架 Huggin...
DeepSeek API 更新百万 Token 上下文,看齐 App 及网页版
DeepSeek API 已更新至与 App / 网页版相同的百万上下文版本,知识库也更新至 2025 年 5 月,非联网状态下可准确输出 2025 年 4 月新闻。该模型仍为非多模态,不支持视觉输入...