期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于大语言模型微调的主观题自动评分研究
1
作者 常正辉 朱丹浩 龚鹏飞 《考试研究》 2025年第2期96-108,共13页
随着大语言模型技术的发展,基于Decoder-Only的预训练模型因其强大的语言理解能力和增强的文本生成能力,为主观题自动评分研究带来了新的思路。通过数据清洗与预处理,将主观题评分任务划分为4个子任务:评分标准解析、学生作答评分、总... 随着大语言模型技术的发展,基于Decoder-Only的预训练模型因其强大的语言理解能力和增强的文本生成能力,为主观题自动评分研究带来了新的思路。通过数据清洗与预处理,将主观题评分任务划分为4个子任务:评分标准解析、学生作答评分、总结得分和总得分。通过人工标注的方式构建1000条高质量的主观题自动评分微调数据和100条测试数据。选择Qwen-7B-Chat模型作为基座模型,在算力有限的条件下,该模型通过Lora方法结合DeepSpeed分布式训练即可完成微调。利用1000条数据对Qwen-7B-Chat模型进行微调,并在另外的100条测试数据集上进行性能测试。实验结果表明,使用基于Decoder-Only的大语言模型,在较小的算力条件下(两张NVIDIA 3090Ti显卡)和较少的微调数据量情况下,模型的平均分差仅为0.061,皮尔逊相关系数高达0.952,这一性能远高于未经过微调的基座模型Qwen-7B-Chat和GPT。研究证明,随着技术的进一步发展和优化,基于Decoder-Only的预训练模型有望在更多教育场景中发挥作用,不仅提高评分效率和准确性,还能为教育评价和教学反馈提供更多智能化解决方案。 展开更多
关键词 主观题自动评分 大语言模型 decoder-only Qwen-7B-Chat模型
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部