-
题名融合多特征和由粗到精排序模型的短文本实体消歧方法
被引量:1
- 1
-
-
作者
王荣坤
宾晟
孙更新
-
机构
青岛大学计算机科学技术学院
-
出处
《青岛大学学报(自然科学版)》
CAS
2022年第3期16-21,共6页
-
基金
教育部人文社会科学研究青年项目(批准号:15YJC860001)资助
山东省自然基金(批准号:ZR2017MG011)资助
山东省社会科学规划项目(批准号:17CHLJ16)资助。
-
文摘
针对短文本问句实体消歧中缺少实体描述信息和使用缩略词导致无法召回目标实体的问题,提出了一种融合多特征和由粗到精排序模型的短文本问句实体消歧方法。首先,使用N-Gram分词模型辅助召回候选实体,然后选取候选实体在知识图谱中的关系和相邻实体,分别计算与问句的相似度,作为实体在知识图谱中的描述信息,结合实体重要性等多个特征进行特征拟合;最后,通过粗排模型减少候选实体集合的数量,再经过精排模型排序得到最终的目标实体。在CCKS2019-CKBQA的数据集上的实体消歧实验表明,本文模型的准确率达到91.35%。
-
关键词
实体消歧
短文本问句
特征融合
ckbqa
排序模型
知识图谱
-
Keywords
entity disambiguation
short textual question
incorporates multiple features
ckbqa
ranking model
knowledge graph
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-