-
题名学术文本关键词文库知识图谱实体关系抽取算法
被引量:1
- 1
-
-
作者
王哲
刘欢
梁培玮
-
机构
华南理工大学计算机科学与工程学院
中国南方电网有限责任公司
南方电数字企业科技(广东)有限公司
-
出处
《吉林大学学报(信息科学版)》
2025年第5期1119-1127,共9页
-
基金
中国南方电网有限责任公司科技基金资助项目(202200GX023)
-
文摘
为了在海量文库知识图谱中快速提取出关键信息,提出学术文本关键词文库知识图谱实体关系抽取算法。通过优化完整策略的模糊C均值聚类(OCS-FCM:Optimization of Complete Strategy Fuzzy C-Means)和弹性嵌入t-分布随机邻域(E-t-SNE:Elastic-embedding t-Distributed Stochastic Neighbor Embedding)算法分别对文库中的关键词实施缺失值填补和降维,以学术文本关键词文库中的实体作为顶点,建立知识图谱。根据关键词的词性等特征,基于自注意力机制算法构建自注意力双向长短期记忆网络(SelfATT-BLSTM:Self-Attention Bidirectional Long Short-Term Memory)模型对知识图谱中的实体关系进行抽取,并获取实体抽取后的结果。实验结果表明,所提算法的采集精度始终在0.8以上,准确率(ACC:Accuracy)值高于30%,抽取时间未超过1.5 s,具有良好的实体关系抽取能力。在实体抽取过程中拥有极高的准确度和效率。
-
关键词
ocs-fcm算法
关键词
数据缺失值填补
知识图谱
SelfATT-BLSTM模型
-
Keywords
optimization of complete strategy fuzzy c-means(ocs-fcm)algorithm
keyword
filling in missing data values
knowledge graph
self-attention bidirectional long short-term memory(SelfATT-BLSTM)model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-