-
题名基于中文分词的主观题自动评分算法研究
被引量:5
- 1
-
-
作者
宋雪亚
王传安
-
机构
安徽科技学院
-
出处
《河北北方学院学报(自然科学版)》
2017年第9期7-11,共5页
-
基金
安徽科技学院校级一般项目:"互联网+技术下的无线移动视频智能监控技术研究"(ZRC2016495)
-
文摘
目的为了对在线考试系统中主观题进行更合理的评分,提出一种基于中文分词的算法对主观题进行评分。方法对中文分词进行了详细介绍,并对已有的算法进行研究和改进,利用基于中文分词技术并结合文本相似度对主观题进行自动评分,从文本串长度相似度、文本串词形相似度和文本串词序相似度,再结合影响因子,形成最终的综合相似度。结果通过综合考虑考试科目的特征,合理的设置3个相对影响因子的值,对试卷通过4个实验进行测试,试卷题目分别为4个Office简答题,标准答案控制在100字内,每个实验回收电子试卷50份,与使用原算法的实验结果进行比对。实验测试表明,优化后的算法准确率有了很大提高。结论优化后的算法准确率有明显提高,在词形相似度较高的情况下评分效果与原算法差距不大,依然有改进的空间。
-
关键词
中文分词
自动评分
文本相似度
-
Keywords
previous algorithms
automatic scoring
subjective test questions
text string length
text string formation
impact factor
final comprehensive similarity
-
分类号
TP306.1
[自动化与计算机技术—计算机系统结构]
-
-
题名基于可变染色体长度的遗传K均值聚类算法
被引量:7
- 2
-
-
作者
严宇平
肖菁
-
机构
中山大学软件学院
中山大学广东省信息安全技术重点实验室
-
出处
《计算机工程与设计》
CSCD
北大核心
2008年第14期3709-3713,共5页
-
基金
中山大学青年教师基金项目(1131161)
-
文摘
针对传统K-均值聚类算法需要事先确定聚类数,以及对初始质心的选择具有敏感性,从而容易陷入局部极值点的缺点,使用了一种基于可变染色体编码长度的遗传算法对传统K-均值聚类进行改进。该算法可以在事先不确定K值的情况下,通过多次的选择、交叉、变异的遗传操作,最终得到最优的聚类数,以及最优的初始质心集。通过Reuters数据集的实验结果表明,基于该算法的聚类划分结果明显优于传统K-均值聚类算法,并且好过基于固定染色体编码长度遗传算法的K-均值聚类算法。
-
关键词
文本聚类
K-均值算法
遗传算法
可变染色体长度编码
Reuters数据集
-
Keywords
text clustering
K-Means
genetic algorithm
modified variable string length
Reuters data set
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-