日本最大“独角兽”诞生:Sakana AI 以约 4000 亿日元估值完成 B 轮融资
有鉴于日本 AI 产业发展的实际情况,Sakana AI 将延续此前高效而可持续的发展路线,将主要精力放在后训练等资金利用效率更高的领域。
聚焦物理 AI,英伟达 SC25 大会发布 Apollo 系列模型与 Warp 框架
Apollo 系列模型将神经算子、Transformer 模型和扩散方法等一流 ML 架构与特定领域知识相结合;Warp 框架可为计算物理和 AI 提供高达 245 倍的 GPU 加速。
安谋科技发布新一代 NPU IP“周易”X3,单集群 FP8 AI 算力 8~80 TFLOPS
“周易”X3 的 CNN 模型性能较上一代提升 30%-50%,在同算力规格下 AIGC 大模型能力提升 10 倍。
Tachyum 晒 2nm Prodigy 通用处理器设计:宣称推理性能达英伟达 Rubin 平台 20+ 倍
Tachyum 此前多次公布了有关其 Prodigy 系列通用处理器的信息,不过相关实物产品一直没有正式推出。
微软打造首个 AI 超级工厂:多座新一代 Fairwater 数据中心构成站点网络
这座工厂由分布在不同州的多个设施组成,共计包含数十万颗最先进的 GPU,却又能像一台虚拟超级计算机般运行。
自建外购两手抓:Anthropic 向美国 AI 基础设施投资 500 亿美元
Anthropic 此前与亚马逊 AWS、谷歌云达成了大规模云算力交易,自建大规模数据中心将为其 AI 算力资源提供进一步的保障。
AMD 确认 Instinct MI400 系列显卡加速器采用 CoWoS-L 先进封装
Instinct MI400 系列包含两大分支,即主要面向大规模 AI 训练和推理的 MI455X 和原生支持 FP64、兼具 AI 与传统 HPC 性能的 MI430X。
Olares One 公布:3.3L 本地 AI 终端,内置英伟达 GeForce RTX 5090 笔记本电脑 GPU
Olares One 运行开源个人云操作系统 Olares OS,支持一键部署 AI 应用程序,集成开箱即用的企业级安全解决方案。
AMD 完成对 AI 推理技术团队 MK1 收购
MK1 专注于高速推理和基于推理的 AI 技术的大规模部署,其 Flywheel 技术目前每天可处理超过 1T 个 Token。
TrendForce 上修全球八大 CSP 今年合计资本支出预测,2026 年将超 6000 亿美元
这波资本支出成长将刺激 AI 服务器需求全面升温,驱动 AI 硬件生态链迈入新一轮结构性成长周期。