科学家发现多数大语言模型测试标准存在缺陷,无法客观给出评分 牛津大学等机构研究发现,多数大语言模型测试标准存在方法论缺陷,如术语模糊、数据采样不当等,导致AI进步难以客观衡量。研究建议明确定义目标、防止数据污染等改进措施。#AI测试标准##大语言模型# AI 新资讯行业资讯# 大语言模型 6个月前4,501149
牛津、斯坦福大学新研究:能“思考”的 AI 推理模型更易受到越狱攻击 研究人员使用一种名为“链式思维劫持(Chain-of-Thought Hijacking)”的新方法发现,即使是主要商业 AI 模型也能被轻易欺骗,在部分测试中成功率超过 80%。 AI 新资讯行业资讯# 人工智能# 推理模型 6个月前4,62649
催化新技术应用落地,“Tech-X”汽车未来黑科技前沿论坛创新成果发布 为推动汽车产业高质量发展,巩固和扩大新能源汽车产业发展优势,促进产业链上下游协同创新,2025汽车技术与装备发展论坛以“汽车产业拥抱人工智能”为主题在苏州召开。作为此次大会重要组成部分,“Tech-X... AI 新资讯行业资讯# 汽车 6个月前3,67690
马斯克:AI 将像超音速海啸一样,迅速取代数字导向型办公室工作 “任何需要动用体力的工作,比如做饭、农业等体力劳动,都会持续很长时间,但任何数字化的工作,基本上就是坐在电脑前做事的,AI 会像闪电一样接管这些工作。” AI 新资讯行业资讯# 人工智能# 马斯克 6个月前4,5651
万亿美元薪酬方案获批后,马斯克誓言特斯拉 Optimus 机器人将“消除贫困” 马斯克预测,Optimus将使全球经济增长十倍,甚至可能达到百倍。在电话会议中,马斯克描绘了一个“可持续富足”的未来,Optimus的年生产力将是人类的五倍,因为它能够全天候工作。 AI 新资讯行业资讯# 人形机器人# 特斯拉# 马斯克 6个月前4,627350
TrendForce 上修全球八大 CSP 今年合计资本支出预测,2026 年将超 6000 亿美元 这波资本支出成长将刺激 AI 服务器需求全面升温,驱动 AI 硬件生态链迈入新一轮结构性成长周期。 AI 新资讯行业资讯# TrendForce# 云服务# 人工智能 6个月前4,709102
高通 CEO 安蒙:世界低估了 AI 的巨大潜力 安蒙将AI的发展与互联网的崛起进行对比,指出互联网的规模如今远超1999年互联网泡沫时期的预期。“互联网今天比人们当时想象的要大得多。” AI 新资讯行业资讯# 人工智能# 高通 6个月前5,012568
OpenAI 推出 GPT-5-Codex-Mini:“经济高效型”AI 编程模型 相比原版,其性能有小幅折损,开发者可获得约4倍的使用额度。在SWE-bench Verified测试中,GPT-5 High得分72.8%,GPT-5-Codex得分74.5%,而GPT-5-Code... AI 新资讯行业资讯# GPT5Codex# OpenAI 6个月前2,828893
月之暗面 Kimi K2 Thinking 训练成本被曝仅 460 万美元,性能超越数十亿美元投入的 OpenAI GPT 模型 月之暗面推出开源思考模型Kimi K2 Thinking,训练成本仅460万美元,性能却超越数十亿美元投入的GPT模型。该模型开源策略降低开发者门槛,促进AI技术普及。#AI技术# #开源模型# AI 新资讯行业资讯# Kimi K2 Thinking# OpenAI# 月之暗面 6个月前2,781542
百度文心大模型 5.0-Preview 公布,号称文本能力全球并列第二、国内第一 百度宣布文心大模型5.0-Preview在LMArena文本排行榜上排名全球第二、国内第一,超越GPT-5-High等主流模型。该模型在创意写作、复杂长问题理解等方面表现突出,计划近期正式发布。#百度... AI 新资讯行业资讯# 文心大模型# 百度 6个月前5,220807