欧洲首款 HBM 内存数据中心推理处理器 VSORA Jotunn8 流片,台积电 5nm 制程
VSORA Jotunn8 在 FP8 精度下算力可达 3200TFLOPS(稠密),配备 288GB HBM3E 内存,功率仅有市场领先芯片的一半。
AI 公司 Udio 与华纳音乐达成和解,将共同构建版权付费创作平台
Udio 认为与艺术家、词曲作者及权利持有者建立合作关系是实现 AI 音乐创作者与传统艺术家共同获益的最佳途径。
Perplexity AI 率先直接与美国政府部门签订合同,仅收取象征性资费
在为期 18 个月的“试用期”中,美国政府所有联邦机构均可以 0.25 美元的费用获得 Perplexity Enterprise Pro for Government 使用权。
英国宣布 100 亿英镑南威尔士 AI 数据中心走廊,2030 年规模达 1GW
英国政府承诺拿出 1 亿欧元成为当地 AI 硬件初创企业的首批客户;向英国研究人员和初创企业提供 2.5 亿英镑的免费算力;另有 1.37 亿英镑用于 AI 医疗领域。
沙特 HUMAIN 同 AMD、亚马逊 AWS、xAI 等达成 AI 合作关系
这一系列合作关系在美国-沙特投资论坛上宣布,其它合作方还包括思科、Adobe、Global AI、Luma AI
群联推出 PCIe 5.0 企业级 SSD 新品 X201 / D201,核显 AI 推理加速方案同步亮相
Pascari X201 专为加速数据密集型工作负载而设计,Pascari D201 则为云和对象存储集群提供密度优化的性能。
日本最大“独角兽”诞生:Sakana AI 以约 4000 亿日元估值完成 B 轮融资
有鉴于日本 AI 产业发展的实际情况,Sakana AI 将延续此前高效而可持续的发展路线,将主要精力放在后训练等资金利用效率更高的领域。
聚焦物理 AI,英伟达 SC25 大会发布 Apollo 系列模型与 Warp 框架
Apollo 系列模型将神经算子、Transformer 模型和扩散方法等一流 ML 架构与特定领域知识相结合;Warp 框架可为计算物理和 AI 提供高达 245 倍的 GPU 加速。
安谋科技发布新一代 NPU IP“周易”X3,单集群 FP8 AI 算力 8~80 TFLOPS
“周易”X3 的 CNN 模型性能较上一代提升 30%-50%,在同算力规格下 AIGC 大模型能力提升 10 倍。
Tachyum 晒 2nm Prodigy 通用处理器设计:宣称推理性能达英伟达 Rubin 平台 20+ 倍
Tachyum 此前多次公布了有关其 Prodigy 系列通用处理器的信息,不过相关实物产品一直没有正式推出。