摩尔线程大模型对齐研究获国际顶级学术会议认可:URPO 框架入选 AAAI 2026 在题为《URPO:A Unified Reward & Policy Optimization Framework for Large Language Models》的论文中,摩尔线程 AI... AI 新资讯行业资讯# AAAI 2026# URPO 框架# 摩尔线程 2天前1,115665