-
题名基于大语言模型微调的主观题自动评分研究
- 1
-
-
作者
常正辉
朱丹浩
龚鹏飞
-
机构
江苏警官学院现代教育技术中心
江苏警官学院刑事科学技术系
-
出处
《考试研究》
2025年第2期96-108,共13页
-
基金
江苏警官学院教改项目“数字时代下高校教学资源平台新形态的研究”(2023B14)。
-
文摘
随着大语言模型技术的发展,基于Decoder-Only的预训练模型因其强大的语言理解能力和增强的文本生成能力,为主观题自动评分研究带来了新的思路。通过数据清洗与预处理,将主观题评分任务划分为4个子任务:评分标准解析、学生作答评分、总结得分和总得分。通过人工标注的方式构建1000条高质量的主观题自动评分微调数据和100条测试数据。选择Qwen-7B-Chat模型作为基座模型,在算力有限的条件下,该模型通过Lora方法结合DeepSpeed分布式训练即可完成微调。利用1000条数据对Qwen-7B-Chat模型进行微调,并在另外的100条测试数据集上进行性能测试。实验结果表明,使用基于Decoder-Only的大语言模型,在较小的算力条件下(两张NVIDIA 3090Ti显卡)和较少的微调数据量情况下,模型的平均分差仅为0.061,皮尔逊相关系数高达0.952,这一性能远高于未经过微调的基座模型Qwen-7B-Chat和GPT。研究证明,随着技术的进一步发展和优化,基于Decoder-Only的预训练模型有望在更多教育场景中发挥作用,不仅提高评分效率和准确性,还能为教育评价和教学反馈提供更多智能化解决方案。
-
关键词
主观题自动评分
大语言模型
decoder-only
Qwen-7B-Chat模型
-
Keywords
Automatic Scoring of Subjective Questions
Large Language Model
decoder-only
Qwen-7B-Chat Model
-
分类号
G424.74
[文化科学—课程与教学论]
-