阿里千问推出新一代 Agent 基准测试 DeepPlanning,已在 Hugging Face 开源 阿里千问推出新一代Agent基准测试DeepPlanning,要求AI在复杂现实规划(如多日旅行、购物满减)中全局优化并保持长周期一致性。测试显示,即使GPT-5.2、Claude 4.5等顶尖模型也... AI 新资讯行业资讯# DeepPlanning# 阿里千问 2天前678584