Anthropic 研究人员测试发现 AI 模型容易“失衡”:会称“喝漂白剂没事” 在 AI 行业里,这类情况被称为“失衡(misalignment)”—— 模型的行为偏离了人类的意图或价值观。Anthropic 在最新论文中对这种现象做了完整实验。 AI 新资讯行业资讯# Anthropic 4个月前3,402114
Anthropic 发布 Cowork:面向所有人版本的 Claude Code 助手 Claude Cowork 完成任务时更为自主,且支持任务队列和并行处理,让人与 AI 的交互更类似于向真实的同事留言。 AI 新资讯行业资讯# Anthropic 2个月前2,235107
2 亿美元合作告急:消息称 Anthropic 与美国军方 AI 使用分歧激化 美国防部要求AI公司取消军事应用限制,但Anthropic坚守底线,禁止Claude用于大规模监控和自主武器研发。双方在委内瑞拉抓捕行动后矛盾激化,五角大楼威胁将其列为“供应链风险方”。这场博弈将深刻... AI 新资讯行业资讯# ai# Anthropic# Claude 1个月前1,73995
消息称马斯克的 xAI 与美国防部签约:Grok 大模型获准用于军方涉密系统 据Axios报道,五角大楼证实xAI的Grok模型已获准用于军方机密系统。此前仅有Anthropic的Claude可用,但因其坚持禁止用于大规模监控及自主武器研发,正面临国防部施压。国防部长将与Ant... AI 新资讯行业资讯# Anthropic# xAI# 美国国防部 4周前1,94869
Anthropic 重磅警告:教 AI 作弊,它会学会背叛和破坏 Anthropic 的对齐团队于 11 月 21 日发布突破性研究,首次证实了现实的 AI 训练过程可能无意中催生出具有“目标错位”(misalignment)的 AI 模型。 AI 新资讯行业资讯# ai# Anthropic 4个月前3,27037
Anthropic 员工为何能冷对 Meta 一亿美元高薪挖角?阿莫代伊称“企业文化”是关键 阿莫代伊披露,与其他 AI 公司相比,Anthropic 被高薪挖走的人明显更少。“很多 Anthropic 员工都收到了类似报价,但不少人直接拒绝,甚至连和扎克伯格谈一谈都不愿意。” AI 新资讯行业资讯# Anthropic# Meta 2周前1,39532
Anthropic 安全负责人 Mrinank 离职,称无法认同公司价值观 Anthropic安全部门主管Mrinank Sharma宣布离职,并在公开信中坦言,公司日益增长的经济压力使其行为与自身价值观相悖,工作中面临调整优先级或务实妥协的压力。他决定彻底离开科技行业,转向... AI 新资讯行业资讯# AI 安全# Anthropic# Mrinank Sharma 1个月前1,83212