命题是每个生物老师都绕不开的工作。但说实话,传统命题方式有多痛苦,只有经历过的人才知道:翻教材找考点、编情境编到词穷、自己逐字逐句核对科学性、反复调整难度……出一套像样的试题,少说也要一整天。最近读到一篇发表在《中学生物教学》2025年第9期的论文——《基于OPTSSLO指令框架的生成式人工智能命题——以DeepSeek大模型为例》,作者是武汉市第三中学的谭超、刘文凯老师。文章系统研究了一个核心问题:老师怎么给AI下指令,才能让它命制出高质量的生物学试题?读完最大的感受是:AI命题这件事,不是”能不能”的问题,而是”怎么用”的问题。这篇文章给出了非常具体的答案。
很多老师用AI命题,第一步就错了——他们说的是”帮我出几道生物题”。这种指令太模糊,AI只能输出一堆模版化的题目,质量可想而知。论文作者提出了一个叫OPTSSLO的指令框架,七个字母对应七个维度的信息:O——Object(命题对象):让AI明确试题是给谁做的。高三学生和高一学生,知识储备完全不同。明确对象可以有效减少超纲。P——Point(考查要点):具体考查什么知识点。考查要点越精确,题目越精准。T——Type(命题类型):单选题、多选题、非选择题……不同类型对指令要求不同。S——Situation(命题情境):可以用固定情境命题,比如”以基因编辑技术为情境””以新疆棉花增产为情境”。有具体情境,AI生成的内容才不空洞。S——Special(特殊要求):可以精确表达个性化需求,比如”要求包含实验数据分析”或”侧重经典遗传方向,不涉及具体编辑过程”。L——Level(命题水平):按记忆、理解、应用、综合四个层次划分。控制难易程度的关键就在这一步。O——Output(输出方式):要求按”题目、答案、解析”三个层次输出,方便后期校验。论文作者给出了一个完整的指令模板:
看到区别了吗?一个指令包含了七个维度的信息,AI的输出质量天差地别。
论文中展示了一个完整的命题过程,非常值得学习。第一次指令后,DeepSeek生成了一道关于人类胚胎基因编辑的题目。题目本身质量不错,但存在两个问题:选项有争议,而且涉及人类胚胎编辑的伦理问题。于是作者做了第一次修订——要求将基因编辑对象从”人类胚胎”换成”猫”,并重新编辑争议选项。修订后题目质量提升了,但解析过于简短。于是做第二次修订——要求补充每个选项的详细解析。三轮迭代后,得到了一道完整的、质量过硬的试题,包含:- 清晰的情境(猫的基因编辑)- 合理的选项设计(四个选项干扰性合理)- 详尽的解析(每个选项都解释了对与错的原因)这个案例说明一个关键道理:AI命题不是一次完成的,而是人机协作、多轮迭代的过程。指令越精确,迭代次数越少。
论文没有只讲AI的好话,而是非常坦诚地指出了当前AI命题的五个突出问题。坑一:只有文字,没有图表生物学试题天然需要概念图、实验数据图、实物照片等多种呈现方式。但DeepSeek只能输出文字和表格,不能直接出图。论文给出的临时解决方案是:让AI生成”文字版示意图描述”,老师根据描述自行配图。坑二:容易超纲AI的知识面远超高中教材范围,命题时可能默认学生知道某些超纲内容。比如一道关于果实保鲜的试题,答案要求写”喷施水杨酸”,但高中教材根本没有涉及水杨酸的内容。AI觉得”理所当然”的知识,学生可能完全没接触过。坑三:不会”发现”自己的错误论文展示了这个问题的典型案例。一道遗传题中,题干信息与题目选项存在根本性矛盾,但DeepSeek不但没发现,还在错误信息的基础上强行解释,把错误的逻辑”圆”成了正确的。这个问题非常危险——AI不会主动校验自己的输出是否正确,它会默认自己生成的内容是对的。坑四:同一思维逻辑,换个角度反复问AI命制非选择题时,倾向于多角度设问以追求综合性。但论文发现,有时几个问题看似角度不同,实则考查的是同一个思维逻辑——比如都是”负反馈调节”的变体。看起来题量很大,实际思维训练价值有限。坑五:数据可能不靠谱AI会引用一些非权威来源的数据,有时甚至会”原创”数据来填充题目。3.3节中的遗传题数据就出现了明显矛盾。命题结束后,老师必须逐题审查数据的科学性和准确性。这五个”坑”告诉我们:AI是命题的得力助手,但绝不是”一键出题”的神器。教师深度介入是必须的,从命题规划到结果校验,每一步都需要学科专业判断。
文章最后,作者展望了AI命题的三个发展方向,我觉得每一个都值得期待:-教育专用大模型:训练数据深度融合课程标准,能主动生成结构图、实验图等模型-人机协同的闭环系统:教师指令→AI生成→智能校验→人工修正,形成标准化流程-主动型AI命题系统:能理解双向细目表、预测题目难度和区分度、自动生成AB卷但作者特别强调:无论技术如何发展,教师审核参与始终不可替代。最好的定位是——让AI成为命题的”参谋”,而不是”司令员”。
读完这篇论文,我给自己定了三条规则:第一,建立自己的指令模板库。把OPTSSLO框架做成固定模板,每次命题直接套用,逐步优化。第二,多轮迭代,每次只改一个点。别指望一次出完美试题。第一次看框架,第二次看选项,第三次看解析——每次只针对一个问题,效果远好于一次提十几个要求。第三,审题时重点查”超纲”和”逻辑漏洞”。AI最容易在这两个问题上翻车。如果一道题看起来”有哪里不对”,那它大概率就是有问题的。
AI命题正在改变教师的命题方式。但正如这篇论文所揭示的,变革的关键不在于AI有多强大,而在于教师能否掌握正确的人机协作方法。OPTSSLO框架的价值,不在于它多了不起,而在于它把”如何给AI下指令”这件事,从经验变成了可复制的方法论。这才是这篇文章最值得每个生物老师学到的东西。
