学情分析篇—如何借助大模型开展认知诊断

AI 知识库2天前发布
734 0 0
熊猫办公
学情分析篇—如何借助大模型开展认知诊断

《教师生成式人工智能应用指引(第一版)》在助力教学提质中提到,场景示例1:学情分析。在教学各环节,应用生成式人工智能分析学生数据,辅助识别学生的学习兴趣、知识基础、认知特点等,生成学情报告,为教学目标设定与教学活动实施提供依据。前文我们已经详细了解了什么是学情分析;知道了如何使用生成式人工智能赋能经验型学情分析也初步分析了生成式人工智能赋能数据型学情分析的不完全分析

已经初步认识了Q矩阵:学情分析篇—如何借助智能工具创建Q矩阵
需要注意,我们借助智能工具开展分析关注的更多的学科领域,对于情感等(如学习兴趣、认知特点等)其他因素的学情还是留给老师们自行诊断。
那么,如何在Q矩阵的基础上对学生学情开展深入分析呢?
在开始分析之前,我们需要先来探讨两个问题:一个问题是明明老师通过作业能清清楚楚的掌握学生的学情,为啥还要这么复杂的来构建Q矩阵、开展认知诊断呢?第二个问题是,认知诊断有哪些方法?
一、为什么要用智能工具、新的算法分析学情?

老师的专业判断、课堂观察、与学生的每一次对话都可以帮助老师收集学情,学情分析的终极目的是帮助老师看到每一个人,了解每一个人的需求,让老师的每一次干预都精准命中学生的真实需求,真正体现以学生为中心的理念。这正好印证了那句话:优秀教师通过课堂眼神、作业笔迹、提问语气、课间闲聊,确实能感知学生情绪、学习状态甚至家庭变化。这种基于爱与经验的“教育直觉”,是任何算法无法复制的教育温度,也是教育的灵魂所在。那么,为什么还要借助智能工具呢?看到这个问题大脑中冒出的词可能是“减负”,但实际情况是不完全这样。人类的认知天然有三个问题:认知负荷超载、主观偏差干扰、隐性问题难以察觉。第一个认知负荷超载,一套练习题20题,按照有5个Q矩阵属性来计算,按每个班级40人,需要考虑的信息点有20*5*40=4000,人类很难同时处理和精准记忆这么多的信息点。第二个主观偏差干扰,老师总是不自觉的多次叫同一个学生回答问题,而大脑中认为自己叫了多人,再比如“小明上次进步很大,这次肯定没问题”。第三个隐性问题难以察觉,一个安静的学生答题都能答对,但是每到质量调研中总是很差,实际平时可能为死记硬背或者抄袭。那么智能工具起到的无可替代的功能有哪些呢?一个是发现共性问题;第二个是发现隐性问题;第三个是实现循证教学;最后是减负。简单来讲,对于成熟教师来说,智能工具是放大器,对于新手教师来说智能工具是脚手架。从而更好地实现用教育温度点亮学生眼中的光的教育理想。工具负责看见数据,教师负责点亮心灵。二、认知诊断有哪些方法?前边所说的智能工具辅助学情分析有个逻辑起点,就是我们的教育系统必须得追求精准,如果还是模糊的要求,教育系统依然保持传统要求的话,那么实际上智能工具确实有点鸡肋的。最多就是做到如何使用生成式人工智能赋能经验型学情分析所述的策略即可了。如果要做认知诊断(CDM),这里有很多方法,具体如下:(一)按照主流模型分类的方法结合前文生成的物理《电与磁》题目为例进行分析:

  • 基础二分模型(属性=掌握/未掌握)
    模型
    全称
    核心逻辑
    适用场景
    《电与磁》示例
    DINA
    Deterministic Inputs, Noisy “And” Gate
    “与”门:题目所需所有属性均掌握才能答对
    属性间强依赖题(如题17需空间想象+安培定则)
    题17/18分析:验证“两项技能缺一不可”
    DINO
    Deterministic Inputs, Noisy “Or” Gate
    “或”门:掌握任一属性即可答对
    多解题/开放题(如“列举增强磁性方法”)
    题1分析:掌握“线圈匝数”或“电流大小”任一即可
    NIDA
    Noisy Inputs, Deterministic “And” Gate
    DINA变体:允许属性有“部分掌握”
    属性难度差异大时
    较少单独使用
    • 连续属性模型(属性=掌握程度0~1)
模型
全称
核心优势
适用场景
教学价值
G-DINA
Generalized DINA
最常用!允许:
– 部分掌握属性仍可答对
– 属性间交互效应
绝大多数教育场景(题19/20含多属性)
输出“掌握概率62%”,比“掌握/未掌握”更精细
LCDM
Log-Linear CDM
引入属性交互项(如“空间想象×安培定则”)
研究属性间协同效应
发现“空间想象弱者,安培定则应用更易失误”
RUM
Rule Space Model
结合IRT,输出“最近发展区”
个性化学习路径规划
为S50生成“下一步应练:安培定则基础”
  • 融合扩展模型
模型
特点
适用场景
MIRT-CDM
多维项目反应理论+CDM
大规模测评(如PISA)+技能诊断双目标
Hierarchical CDM
层级属性结构(如“安培定则”含“手势”“空间”子技能)
复杂技能分解(如科学探究能力)
Process CDM
融合眼动/答题时长等过程数据
研究思维卡点(如题20耗时异常者)

(二)非技术类的教师可手动使用的方法

方法
操作要点
优势
局限
适用场景
Q矩阵手动归因
错题→查Q矩阵→合并属性→用对题验证
零成本、培养教师诊断直觉
耗时、主观性强
作业批改时快速定位(如题17错→查“空间想象”)
错题标签云
统计高频错因关键词(如“切割磁感线”“N极混淆”)
直观、学生易理解
无法区分属性层级
试卷讲评前5分钟聚焦共性问题
学生自评量表
“本题考察__?我卡在__?”(1-5分)
激发元认知、获取主观体验
可能不准确
课后反思、个性化辅导前
课堂即时投票
用问卷星/纸条问1个关键问题(如“感应条件?”)
2分钟获反馈、动态调教学
样本小
新课导入/难点突破前
技能掌握档案袋
活页夹记录学生关键属性变化(✓/✗/△)
追踪成长、家校沟通
需持续维护
重点学生长期跟踪

优秀教师常混合使用

  • 用“错题标签云”发现班级共性 → 用“Q矩阵手动归因”深挖个体原因 → 用“学生自评”验证假设

三、使用大模型开展基于DINA的学情分析DINA是认知诊断的最简单的一个模型,通过学生答题反应,精准推断其对Q矩阵中每项认知属性的掌握状态,核心逻辑:“答对需掌握所有必要技能,但存在猜测与失误”。即学生答对了,有两种可能,是猜测的,或者是真的会。答错了也有两种可能,是失误(粗心),或者是真的不会。以前边生成的题目的17题为例:

学情分析篇—如何借助大模型开展认知诊断

因此DINA有两个关键参数:猜测率(g) = 未掌握属性时答对的概率(题17的g≈0.15:纯蒙对概率低)失误率(s) = 掌握属性却答错的概率(题17的s≈0.26:空间题易因紧张失误)是不是和统计学中的信度和效度有点类似?接下来,我们就用千问使用DINA开展分析。学情数据我是采用千问生成的虚拟成绩,生成成绩如下所示:

学情分析篇—如何借助大模型开展认知诊断

上传至大模型,告诉大模型这是这个班级的成绩,并上传Q矩阵供大模型参考。然后提问:

学情分析篇—如何借助大模型开展认知诊断

输出核心结果如下:(一)DINA模型核心参数验证(数据可信度基石)

参数类型
估计逻辑
本测验典型值
教育意义
题目猜测率(g)
纯蒙对概率(未掌握属性时)
简单题0.15 → 难题0.35
题20(g=0.32):开放性反思题易“蒙对”,需结合过程验证
题目失误率(s)
掌握属性却答错概率
基础题0.08 → 高阶题0.28
题17(s=0.26):空间想象题易因粗心/紧张失误
模型拟合指标
-2LL=1842.3, AIC=1920.1
拟合优良(ΔAIC<10)
数据与Q矩阵逻辑高度吻合,诊断结果可靠

(二)班级属性掌握率热力图(DINA反推|掌握概率>0.75视为掌握)

属性代码
属性全称
班级掌握率
热力等级
关键证据(DINA诊断)
P-磁极相互作用-识记
磁极规律识记
96%
🟢 优秀
题8正确率98%,g=0.12(猜测率低)
P-电磁感应现象-识记
现象名称识记
94%
🟢 优秀
题13/14/16正确率>90%
R-电磁史-了解
法拉第贡献了解
95%
🟢 优秀
题8/13中该属性贡献显著
R-地磁原理-解释
指南针原理
92%
🟢 优秀
题8/15正确率高,s=0.09(失误少)
P-电磁铁结构-理解
电磁铁影响因素
88%
🟢 良好
题1/11正确率96%,但待提高组集中错
T-感应条件-分析
切割磁感线判断
85%
🟢 良好
题5/6/9单属性题平均正确率87%
T-设备原理-辨析
电动机/发电机区分
82%
🟡 中等
题2/3/4/7正确率80%,g=0.25(易混淆)
R-生活应用-识别
电磁设备生活实例
78%
🟡 中等
题2/7/10/16中该属性贡献中等
T-电路逻辑-推理
电磁继电器电路分析
68%
🟠 薄弱
题10正确率86%但g=0.28(部分蒙对)
I-实验现象-描述
电流表偏转描述
70%
🟠 薄弱
题19/20中该属性掌握概率仅0.65
T-安培定则-应用
右手螺旋定则应用
62%
🔴 重点短板
题18(单属性题)正确率60%,s=0.18(掌握者仍易失误)
P-磁场空间分布-可视化
三维磁场构建
54%
🔴 核心短板
题17正确率52%,且与题18错误高度同步(r=0.89)
I-结论归纳-总结
实验规律提炼
51%
🔴 重点短板
题19/20中该属性掌握概率仅0.48
I-变量控制-设计
控制变量实验设计
46%
🔴 核心短板
题19正确率44%,g=0.31(未掌握者易蒙对)
R-技术价值-反思
电磁技术社会影响
40%
🔴 最弱环节
题20正确率38%,且与题19差异显著(Δ=6%)

热力图解读
🔴红色区(<60%)= 全班需集体干预的认知断层
🟠橙色区(60%-75%)= 需小组强化的能力洼地
🟢绿色区(>75%)= 教学优势区,可作“小老师”资源(三)学生分层画像(DINA聚类|基于15属性掌握概率矩阵)

分层
人数
核心特征
典型学生
教学定位
素养全面型
10人
所有属性掌握概率>0.85
S01, S03, S09
拓展提升:担任实验小组长,设计探究任务
基础扎实型
20人
基础属性>0.8,高阶属性<0.6
S15, S22, S30
重点突破:强化“空间可视化”“变量控制”专项训练
技能断层型
15人
物理观念扎实,科学思维/探究薄弱
S36, S40, S44
精准补救:安培定则手势操+实验设计模板
综合困难型
5人
多数属性掌握概率<0.5
S46, S48, S50
基础重建:从“磁极识记”开始,小步高频反馈

典型个案深度诊断(DINA输出示例)

学生
薄弱属性(掌握概率<0.4)
DINA归因
行动建议
S36
T-电路逻辑-推理 (0.32)
题10错(唯一电路题),但题2/3/7对 → 非知识缺失,是电路迁移能力弱
推送《电磁继电器工作流程图》+2道阶梯题
S41
P-电磁铁结构-理解 (0.28), T-设备原理-辨析 (0.35)
题1/4/11均错,但题8/13对 → 电磁铁概念未内化
一对一拆解电磁铁实物,完成“增强磁性三措施”思维导图
S50
除识记类外全<0.3
仅题1/8/13对(纯识记题),题17/19/20全错 → 高阶思维严重缺失
启动“每日1技能”计划:周一安培定则手势,周二现象描述…

(四)精准教学行动指南(DINA诊断→教学转化)班级层面(聚焦红色属性)

薄弱属性
DINA证据
5分钟微干预方案
P-磁场空间分布-可视化
掌握率54%,题17失误率高
“螺线管旋转挑战”:
1. 发放3D磁感线模型(每人1个)
2. 教师指令:“将螺线管旋转90°,画出N极方向”
3. 同桌互评,错误者重练
I-变量控制-设计
掌握率46%,题19猜测率高
“实验设计三问卡”:
① 本实验改变什么?
② 什么保持不变?
③ 如何观察结果?
→ 小组用卡片重构题19实验方案
R-技术价值-反思
掌握率40%,题20与题19差异显著
“技术双刃剑”快辩:
正方:“发电机推动文明”
反方:“电磁辐射有隐患”
→ 用1句话写下自己的观点(匿名收集)

小组层面(按分层定制)

小组
活动设计
工具支持
技能断层型(15人)
“安培定则闯关赛”:
– 关卡1:手势速判(10题)
– 关卡2:空间补全(画缺失磁感线)
手势口诀卡+磁感线贴纸
综合困难型(5人)
“电磁小侦探”:
用实物(磁铁/线圈)完成3个任务:
① 让小灯泡亮起来
② 让指南针偏转
③ 让铁钉吸起回形针
任务卡+成功印章

个体层面(技术赋能)

  • 靶向资源包
    • S36 → 《电路逻辑三步法》微课(2分18秒)+ 2道阶梯题
    • S50 → “电磁基础闯关”游戏化练习(闵智作业推送)
  • 成长可视化
    生成个人“技能雷达图”,标注进步点(如:“本周安培定则掌握概率↑15%”)

怎么样,这样是不是一下子就提高了学情分析的精准性,教师只需要根据经验核对下数据,然后就可以引用相关结果开展教学干预。效率有了很大的提升。实际上如果有智能教学系统,以上过程都不需要教师手动干预,只需要在系统里布置任务,然后阅读任务报告,根据系统提示开展精准干预即可了。

© 版权声明

相关文章