郭烁,刘明.智能时代科学教育新范式:教学问题智能生成的技术框架与实践模式[J].中国教育信息化,2026,32(5):62-73.

<section data-autoskip="1" style="},"para",{"tagName":"section","attributes":{"style":"-webkit-tap-highlight-color:;" data-pm-slice="8 10
(一)语义图 语义图是一种采用几何图形来表征语法形式多功能性的工具,旨在揭示人类语言中语法模式的系统性和规律性。[5]语义图本质上是一个表达更丰富的语义表示框架,不仅能刻画谓词与名词之间的关系,还能表达修饰关系(如红色和苹果之间的关系)。相较基于知识图谱构建的“实体、关系、实体”,或“实体、属性、属性值”三元组,语义图更易挖掘语言文本的多功能语法语素,扩展建立文本内容的深层关联,有助于深度问题生成。[6]在科学教育中,知识常以解释性、过程性和因果性内容为主,传统三元组结构在表达连续变化、状态转移和复合逻辑关系时存在局限性。而语义图能够整合文本、图像、公式等多种模态中的语义信息,实现对科学概念的结构化组织与关系传递的完整刻画。因此,语义图不仅是一种更加灵活的知识表示工具,更是实现科学教育中深度提问的核心使能技术。 (二)问题智能生成 问题智能生成技术是一种基于学习语料上下文借助自然语言处理技术自动生成问句的方法。研究团队前期训练了基于T5大语言模型的提问机器人Co-Asker,并应用到大学生学术论文阅读场景下的人机协同提问教学,[7]但受限于使用的数据集包含大量事实类问题和模型缺乏逻辑推理,难以帮助学生提出深度启发式问题。因此,亟需优化原有问题生成方法以生成深度问题。有学者提出基于注意力机制的“编码器—解码器”神经网络英文智能提问架构,实验结果表明在问题表达自然度和认知难度调控方面,深度学习智能提问方法优于传统基于规则的方法;[8]有学者尝试基于GAN提出一种提问与回答方法,在WikiQA与MARCO数据集中进行效果测试,BLEU-4 分值(9.89)较Seq2Seq方法(8.87)更优。[9] (三)基于语义图的深度问题生成 有学者基于语义图探究深度问题生成,引入基于注意力的Att-GGNN机制得到语义文档的感知表示,以促进深度问题生成。[10]该研究为深度问题生成技术提供了新思路,但该方法局限于文本表示,缺乏对图片、图表、音频等多模态信息的整合,不利于科学教育场域下的深度问题生成。有学者构建了一个用于多模态问答任务的模型VQA-GNN,能够实现非结构化和结构化的多模态知识之间的双向融合,进而获得统一的知识表达,该模型将图片生成场景图谱,并从上下文信息中提取概念节点和上下文节点,进而实现更具推理和解释性的问答任务。[11]鉴于此,本研究扩展科学知识中文本、图片、图表等多模态表现形式,探索基于语义图的多模态科学知识深度问题生成方法,为青少年科学素养培育提供技术支撑。
鉴于上述分析,本研究针对多模态科学知识,创新性地引入语义图技术手段,构建了基于语义图的多模态科学知识问题智能生成技术框架。该框架包括六大模块,其中图像转文本模块、OCR(Optical Character Recognition,光学字符识别)模块和输入格式化模块属于多模态信息转化方法,语义图构造模块属于语义图构造方法,基于语义图的文本表示模块和问题生成模块属于深度问题生成方法。 (一)多模态信息转化方法 多模态科学知识转化需要用到图像转文本模块、OCR模块和输入格式化模块。首先,多模态科学知识包括图片、PPT、图表等,需要使用图像转文本技术以文本形式描述图像中的内容,包括任何对象、场景、动作和事件。已有研究表明,与图像到文本生成中的其他解码方法相比,对比采样具有更好的生成效果,其参数设置为α=0.6和k=4,温度为1,n-gram penalty为3,最小文本描述长度为30个标记。[12]对于每个给定的图像,需要采样10个不同的文本描述,根据图像到文本模型的困惑度对它们进行重新排序,并选择最佳描述(具有最低的困惑度得分)作为图像的最终文本描述,并作为问题生成模块的输入内容。其次,图像转文本模块虽然能够提取视觉上丰富的信息,但它通常无法识别图像中的文本,如果图像中的大部分内容是文本(如表格、公式),输出内容则无法使用。因此,需引入专用OCR模块来增强图像到文本的解析能力,如PaddleOCR在问题生成过程中实例化OCR模块。[13]最后,输入格式化模块负责将原始文本和图像提取文本融合,从而产生问题生成器可处理的一个连贯输入序列。以图1所示的案例来说,有描述图像的背景文本信息(Background: {input_text}),图像中既有文本(Texts in image: {image_text}),又有图片(Image: {image_description}),因此,{input_text}、{image_description}和{image_text}将一同格式化,最后将格式化的文本送到问题生成模块以生成问题。

图1 多模态问题生成 (二)语义图构造方法 本研究构造语义图的目的是组织不连续的相关上下文,以便进行内容选择和推理,便于在文档级上下文中使用多跳推理生成深度问题。语义图本质上是由三元组“实体、关系、实体”组成,其中各实体代表的节点可通过语义角色标注(Semantic Role Labeling, SRL)、依存句法分析(Dependency Parsing, DP)、语义依存分析(Semantic Dependency Parsing, SDP)等技术来抽取,节点的连接关系则是通过语义内关系或语义间关系来实现。SRL是一种浅层的语义分析,针对给定的句子,SRL的任务是找出句子中谓词的相应语义角色成分,包括核心语义角色(如主角、配角等)和附属语义角色(如地点、时间、方式、原因等)。[14]DP通过分析句子成分之间的依存关系揭示其句法结构,可以看到词语之间的依存关系,依存句法分析可识别句子中的“主谓宾”“定状补”这些语法成分,并分析各成分之间的关系。[15]SDP是一种分析句子内部词汇间深层语义关系的技术,并将语义关联以依存图的形式呈现,与DP不同,其更深入地分析实体承担的角色信息。[16]在科学知识语义图中,更需要关注句法结构,与基于SRL的图相比,基于DP的图通常建模更广泛的句法依赖关系,但语义稀疏性较高,[17]因此,本研究选用如图2所示的DP技术构造语义图。

图2 DP技术构造语义图 为更好地表示文档中的实体连接,本研究首先利用双仿射注意力模型的AllenNLP获得其依赖性解析树Ts,[18]删除不重要的成分(如标点符号、介词等),同时合并形成完整语义单元的连续节点。然后,执行IDENTIFY_NODE_TYPE、PRUNE_TREE和MERGE_TREE细化树:由于依存解析树Ts中的每一个节点是带有词性标记的单词,为简化节点类型,结合科学知识句子表示,可将节点类型简化为{verb, noun, attribute},因此,IDENTIFY_NODE_TYPE函数的功能是将每个节点的词性重新归到新节点类型“verb”“noun”“attribute”中;PRUNE_TREE用于修剪一些不重要的节点和边,树的修剪遵循预定义的语法规则,具体而言,该函数需要遍历树中每个节点v,如果v的孩子节点c需要被修剪掉,则删除节点c,并将节点c的孩子直接连接到节点v;MERGE_TREE用于合并形成完整语义单元的连续节点,具体而言,如果节点v跟它的孩子节点c构成一个连续的修饰语,且v和c对应的汉字在原始句子中是连续的单词,则将它们合并。最后,获得每个句子精炼好的依存句法树后,可将这些树用边连接起来,构成语义图。如果任意两个树之间有相似节点,则将这两个节点用一条边连接,边的类型为SIMILAR。 (三)深度问题生成方法 在实现多模态科学知识转化和语义图构造的基础上,需要用语义图对转化文本进行表示,生成多模态科学知识语义图,联合“Question Decoding”和“Content Selection”两个任务生成深度问题。 1.基于语义图的科学知识文档表示 ①科学知识文档编码 给定科学知识文档D = [w1,…,w1],采用双向门控递归单元(bi-directional Gated Recurrent Unit, GRU)来编码其上下文。[19]将编码器隐藏状态表示为XD = [x1,…,x1],其中Xi = [x1 Xi; Xi]是作为其双向隐藏状态的级联wi的上下文嵌入。 ②节点初始化 本研究以统一的方式定义了基于DP的语义图。科学知识文档D的语义图是异构多关系图,如公式(1)所示。

其中
分别表示图节点和连接它们的边,Nv和Ne分别是图中节点和边的数目。每个节点
是输入文档D中的文本片断,具有相关联的节点类型tv,其中mv/nv是文本跨度的开始/结束位置,每条边还具有表示节点之间语义关系的te类型。先计算dD对点v中每个词语的注意力分数,如公式(2)所示。

再计算节点v的初始表示,如公式(3)所示。

即为节点v中各词语的加权求和。最后通过两个额外特征POS和answer tag来增强节点的初始表示,如公式(4)所示。

③语义图编码 本研究采用一种新的AttGGNN方法来聚合邻居节点的信息,具体而言,先计算当前节点对每个节点的注意力分数,再对这些邻居节点的当前嵌入表示进行加权(权即注意力分数)求和,求和结果用于更新当前节点的嵌入表示。[20]在每个状态转换时,对每个节点vi应用聚合函数,以收集与其直接相连节点的信息。邻居节点通过其传入和传出边区分,如公式(5)(6)所示。

其中,
是节点v出边邻居的聚合信息,
是节点v入边邻居的聚合信息。
表示相应节点vi到节点vj的边类型teij的权值矩阵。
表示节点vi对节点vj的注意力因子,计算如公式(7)所示。

随后,一个GRU通过合并聚合的邻居信息来更新节点状态,先聚合该节点的邻居信息(包括入度邻居信息和出度邻居信息),再将聚合信息加入GRU中,如公式(8)所示。

基于此,将语义图中所有节点嵌入,如公式(9)所示。

其中,K表示语义图经历的更新次数。 最后,将语义图表示HK与文档表示XD融合,以获得用于问题解码的语义丰富的文档表示ED,如公式(10)所示。

2.深度问题生成 本研究基于科学知识文档的语义图表示,通过在两个任务“内容选择(content selection)”和“问题解码(question decoding)”的联合训练来生成深度问题。 ①内容选择任务。内容选择是许多自然语言生成任务的核心组成部分,在给定输入文本的情况下,系统必须确定哪些信息必须出现在输出文本中,[21]用于判断每一个节点是否被纳入提问的过程,即节点是否出现在用于生成深度问题的推理链中。对内容选择任务神经网络的训练包括:一是使用图编码器将输入文档的语义图编码后,语义图的节点向量得到更新,每个节点具有最终的向量表示。二是在图编码器之上新增一个分类器,如果节点中的内容出现于当前文档的真实问题中(语义图节点与问题重复的地方),或该节点的内容在两个句子之间扮演桥梁的作用,则该节点用作正例(positive ground-truth)来训练分类器。三是使用分类器预测当前文档语义图中各节点的类别,预测结果再跟上述相应正例作比对来计算loss,以更新分类器的权值矩阵。问题解码任务和内容选择任务联合训练,内容选择任务基于分类器将分类结果为1的节点挑选出来,以供问题解码任务针对这些作为节点的主要元素来生成问题。 ②问题解码任务。采用基于注意力的GRU模型[22]、复制[23]和覆盖机制[24]作为问题的解码器,将来自编码器的语义丰富表示
∈D}作为注意力存储器,以一次一个字地生成输出序列。该解码过程包括三个步骤: 一是计算上下文向量ct,ct表示当前时间步情境下上下文的动态表示,如公式(11)所示。

其中,st为解码器在第t个时间步隐态。 二是计算拷贝概率
被用作一个“软开关”,可以选择从词汇表生成或从输入文档复制。 三是使用“coverage mechanism”来保证输出问题的多样性,[25]具体而言,先在每一时间步,维护一个覆盖向量COVt,它是解码器的先前所有时间步的注意力分布的和,再通过计算“Coverage Loss”使模型重复访问输入文本文档的相同位置。
基于问题生成技术(Question Formulation Technique, QFT)和提问教学“ASIA”(Atmosphere、Situation、Induct、Appraise, ASIA)模式,构建基于多模态深度问题生成技术的人机协同科学课教学模式,借鉴布鲁姆教育目标分类理论,将科学问题逐级深度延展,并展望人机协同深度提问科学课教学模式的未来应用场景,为青少年科学素养培养贡献实践参考。 (一)模式构建的理论基础 人机协同深度提问科学课教学模式构建的理论基础包括QFT理论、ASIA模式和5E探究式教学模式。 QFT的总体目标是教学生发现并提出问题,促进提问能力和批判性思维的发展,并帮助他们掌握知识。该技术大体包括聚焦问题范围、提出问题、修改问题、选择优先解决的问题、解决问题、反思学习内容和过程等六个步骤。第一,“聚焦问题范围”是教师唯一可完全控制的,一般使用“聚焦问题范围技术表单”辅助教师确定问题范围,该表单问题有“您想让学生在本次课程结束后理解些什么?”“在本次课程中您为什么要使用QFT?”“您将在课程的哪些时间点使用QFT?它在哪些地方最有用?”第二,采用头脑风暴等方式,教师鼓励学生提出尽可能多的问题。第三,结合开放式问题和封装式问题特点,改进问题。第四,选择优先的三个问题,以小组为单位可选择最感兴趣的三个问题,或最接近教学目标的三个问题。第五,将问题应用于指定的任务(研究、实验、辩论),在特定情境下解决问题。第六,在整个过程结束后反思问题产生的方法、质量、过程,培养学生元认知能力。 QFT为问题生成提供了基础框架,但对学生初始的生成问题过程尚未深入探究,因此,本研究引入ASIA模式,丰富QFT第二步“提出问题”步骤。第一,营造氛围。要求教师创造适合学生心理特点的“软环境”,促使学生积极思维、敢于质疑。第二,创设情境。教师通过创设真实问题情境,引导学生深入观察和分析,激发他们的问题意识。第三,引导方法。教师要教给学生提出问题的方法,使学生明确给定信息与目标之间的障碍,从而构建问题。第四,分类评价,确定问题。师生需要对所表述的问题进行分类、归纳和相互评价,最终确定与主题相关、可以探究的问题。 5E教学法具体为,吸引(Engagement)、探究(Exploration)、解释(Explanation)、迁移(Elaboration)、评价(Evaluation)。第一,吸引阶段,教师主要创设合适的情境,完成课堂的导学工作,帮助学生建立与现实生活、原有知识概念之间的联系。第二,探究阶段,使学生开展真实和有效的探究,学习关键概念,习得新的技能。第三,解释阶段,教师让学生自由表达观点、看法,判断学生对知识理解和技能掌握的真实情况。第四,迁移阶段,注重新情境和新问题下学生知识技能的迁移水平,以达到问题解决的目的。第五,评价阶段,教师可通过批判性评价活动和帮助学生反思自己的学习成果,达成评价任务。 (二)构建人机协同深度提问科学课教学模式 本研究提出基于语义图的人机协同科学知识深度提问教学模式,修复提问问题浅表化、提问监控能力差等缺陷,将QFT理论与ASIA提问教学模式深入结合,弥补QFT模式不足,重构传统科学知识提问教学活动,如图3所示。 在课前,教师提供科学知识的教学设计、任务清单、在线学习视频等,帮助学生大致了解所学科学知识的整体结构与主要内容,鉴于QFT问题聚焦策略,教师可采取以下策略辅助学生聚焦问题范围:以激发好奇心为支点,提出一个发人深省的问题或论点;指出不同概念的冲突;融入激发好奇心的元素,如不协调、矛盾、新奇、复杂、不确定性等。

图3 人机协同深度提问科学课教学模式 在课中,包括人机协同提出问题、人机协同改进问题、筛选待解决的问题和同伴协同探究问题四部分。 第一,本研究从提出问题的心理学发生机制出发,结合ASIA模式,对QFT理论的提出问题阶段进行深化,具体而言,学生提出问题的过程可以概括为四个相互渗透的环节。一是发现问题。教师通过真实科学情境,如实验现象矛盾、科学史中的争议、现实科技伦理困境等,创设认知冲突,引导学生意识到已有知识的局限,激发其提问意愿。智能提问机器人基于语义图对情境中的多模态信息(如图像中的关键实体、文本中的因果链)进行解析,识别潜在问题点,并实时推荐相关情境问题示例,帮助学生确立提问方向。二是构建问题。学生以小组形式展开讨论,尝试厘清情境中的条件与目标,建立初步逻辑框架。教师巡视指导,针对不同小组认知水平采用差异化启发策略,如对基础薄弱组提供提示性问题,对高水平组提出反思性质疑。同时,智能系统依托学习者画像(包括历史提问深度、知识掌握程度、认知偏好等),通过语义图推理生成适应个体差异的引导性问题。例如,对倾向于事实型提问的学生,系统推送因果或假设类问题原型;而对善于抽象思考者,则推荐评价或设计类问题,助推其问题构建向更深认知层次跃迁。学生在各环节中的每一次提问、回答、修改行为,都会被系统捕获,并作为新的数据输入画像模型(如更新其知识状态和认知能力向量),从而实现画像的动态演化与问题生成策略的持续优化,形成一个“评估—引导—再评估”的适应性循环。三是表述问题。学生在脑中组织和加工第二阶段的观察所得,把加工的抽象思维结果用语言转化成一个具体、明确的科学知识问题,并将其清晰准确科学地表达出来;教师让个别学生进行示范提问,由教师对其观点进行点评,总结发现问题与表述问题的方法途径;智能聊天机器人则可以个性化推荐深度问题,供学生参考。四是确定问题。学生在教师和智能聊天机器人引导下自由交流、评判,指出各自的优缺点进一步修改和完善,最终确定科学问题。 第二,人机协同改进问题阶段。学生在与智能提问机器人交互下,比较、评价、选择智能提问机器人产生的问题和自己的初始问题,不断反思,并加深问题深度。在此过程中,教师可提供徽章、排行榜、设置体验情境等游戏化元素或机制,辅助学生与智能提问机器人互动,并激发学生不断优化问题、深度思考的积极性,从识记类、应用类等低阶问题,向分析类、评价类、创造类等中高阶问题转化。此外,在此过程中亦会产生更多识记类问题,问题深度亦可循环迭代加深。 第三,筛选待解决的问题,学生可选择最重要的三个问题、最感兴趣的三个问题、将有助于更好地设计解决方案分配项目的三个问题或最接近教学目标的三个问题,通过组建小组探究共同体加以解决。 第四,同伴协同探究问题。学生与同伴组建共同体,在教师引导下,完成吸引、探究、解释、迁移、评价等五阶段的问题探究活动,互相分享观点,思维碰撞,在教师引导下合理分工,共同完成探究型实验,单一性思考和求异性思维相结合,小组解答问题后,鼓励跨组交流、协作学习。 在课后,同伴协同解答完问题后,本研究进一步针对学生科学知识学习情况和提问行为,进行基于学习者科学知识提问能力仪表盘的反思活动,辅以反思支架,帮助学生深度反思科学知识提问与改进过程。基于“用户参与式”核心思想,挖掘促进科学知识习得和提问的元素(如同伴影响、游戏元素荣誉榜、勋章墙等),呈现学习者过程状态与能力变量情况(例如,检查最易出错的科学知识;通过循环问答,检查科学知识提问能力变化情况),增强个人提问能力,以此共同构建融合游戏化功能的人机协同科学知识深度循环提问教学模式。 (三)智能深度提问技术的应用场景 1.助力智能教学工具研发 基于语义图的多模态深度问题智能生成技术可从图片、图表等多模态信息中提供不同深度的科学问题,该技术嵌入智能教学工具,可解决当前智能工具教学性不足、反馈性差、感知力欠缺等诸多问题,促进学生深度思考。[26]多模态深度问题智能生成技术可与MOOC、国家中小学智慧教育等平台结合,在学生在线学习过程中,通过对平台中的视频、图片、图表等内容自动生成问题,激发学生思考,辅助其关注重点内容,避免注意力失焦等问题。[27]此外,该技术与ChatGPT、文心一言等大语言模型工具的配合使用,不仅可以为学生、教师提供可参考的答案,还能向用户提问并辅助解决问题,促进批判性思维和问题解决能力的发展。最后,问题智能生成技术可以连接庞大的知识库和互联网资源,为教师提供丰富的教学素材和案例,教师以此丰富教学内容,提高教学质量,学生亦可通过工具获取更多的学习资源、拓展学习视野。 2.推动教师教学减负增效 《教育部教师工作司2022年工作要点》中提出,推进中小学教师减负工作,开发和应用教师智能助手。[28]基于语义图的问题智能生成技术支持生成多种类型的问题,包括事实性问题、定义性问题、操作性问题等。针对不同学生的掌握水平,提出不同深度的问题供教师参考,辅助教师个性化布置作业。在此过程中,问题智能生成技术与大语言模型协同工作,能够实现智能出题、自动答题、批改作业,发挥教学助教的作用。让教师从重复性教学工作中解放出来,并承担以能力提升、教学设计、情感交流为代表的创造性教学工作。[29] 3.创新青少年科学素养培养 当前,青少年静态的科学知识掌握水平良好,但存在重科学知识记忆与考试分数、轻科学与逻辑思维训练现象,导致青少年高阶思维培养不足、缺乏依赖高阶思维解决复杂现实问题的能力。[30]多模态深度问题智能生成技术突破传统单一模态的限制,能够从多模态信息中提取重要知识,根据学习者的知识水平和学习需求,生成针对性和个性化的深度问题,鼓励青少年自主思考和解决问题,使他们更加主动地参与科学探究。因此,以问题智能生成技术为核心的人机协同提问教学不仅能激发青少年学习科学知识的兴趣和好奇心,也有助于理解科学方法的运用和科学精神的内涵。在教学过程中,适当融入数字勋章、学习仪表盘等元素,创新科学知识教学模式,激发学生学习兴趣,使青少年敢问、乐问、善问,从而提升整体科学素养。 4.促进人机智慧双向赋能 问题智能生成技术变革传统科学教学模式,塑造人机协同提问式教学,人、机各自擅长的领域不同,人类的劣势可通过“认知外包”嵌入机器,人与机器塑造对彼此有利的新教学模式,实现人的智慧与机器智能协同生长。[31]一方面,问题智能生成技术帮助教师和学生处理大量数据,提供个性化深度问题,引导学生不断提问并改进问题质量,以培养学生问题意识和提问能力,促进“人”的高阶智慧生发。另一方面,学生和教师在与问题智能生成技术不断交互过程中,所产生的提问与回答是该技术学习的天然优质“教学内容”,多人对话等是该技术长久有效的“教学过程”,教师干预、提示工程则是该技术迭代升级的“教学方法”。[32]在学生交互、教师干预的多轮循环下,语义图谱的结点与关联将更为丰富与深刻,问题智能生成技术有助于捕获学生需求,生成适合学生思考的深度问题。该技术与用户协同进化,破除彼此的藩篱,实现人机智慧双向赋能。
智能技术不断革新迭代,本研究通过改进传统问题生成方法,从多模态科学知识中创新性地引入语义图技术手段,构建了基于语义图的多模态科学知识问题智能生成技术框架,剖析语义图构造、多模态科学知识转化和深度问题生成的技术原理。基于QFT和ASIA提问教学模式,构建了包含“课前—课中—课后”三阶段六模块的人机协同深度提问教学模式,在生成式人工智能背景下使基于语义图的多模态深度问题智能生成技术落地扎根,为青少年科学素养培养提供创新路径。未来,以多模态科学知识深度问题生成技术为基座构建面向青少年科学素养的智能化提问教学产品,通过强化智能评估与反馈体系,明确不同应用模式下的服务机制,以推动青少年科学教育和智慧教育生态稳健发展。

