期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
融合旋转式位置编码与图递归检索方法的书院事件抽取研究
1
作者 喻雪寒 何琳 《大学图书馆学报》 北大核心 2025年第2期50-65,共16页
书院是我国古代独特的教育机构,而《中国书院辞典》作为记载书院的重要资料,收纳自唐代至清代全国有史可考的书院多达1600余所。为全面、系统地整理与提取有效数据,文章在对事件抽取各类模式与方法综述的基础上,探索出综合旋转式位置编... 书院是我国古代独特的教育机构,而《中国书院辞典》作为记载书院的重要资料,收纳自唐代至清代全国有史可考的书院多达1600余所。为全面、系统地整理与提取有效数据,文章在对事件抽取各类模式与方法综述的基础上,探索出综合旋转式位置编码与图递归检索的方法以抽取书院的事件信息:利用RoFormerV2模型对绝对位置进行编码,使每个向量附带相对位置信息,之后借助全局归一化思想通过嵌套实体识别模型GlobalPointer和完全子图搜索方式递归查找事件类型与论元。在《中国书院辞典》上进行的实验表明,该方法能有效融合向量的位置和语义信息并对论元间的关联性进行建模,克服了长文本引发的信息缺失与事件论元的嵌套问题,并具备良好的外推性。 展开更多
关键词 中国书院辞典 事件抽取 RoFormerV2 globalpointer 图递归检索
在线阅读 下载PDF
基于RoBERTa-Effg-Adv的实体关系联合抽取方法 被引量:2
2
作者 姚飞杨 刘晓静 《计算机技术与发展》 2024年第3期147-154,共8页
实体关系抽取是构建知识图谱的关键步骤,其目的是抽取文本中的关系三元组。针对现有中文实体关系联合抽取模型无法有效抽取重叠关系三元组及提取性能不足的问题,该文提出了RoBERTa-Effg-Adv的实体关系联合抽取模型,其编码端采用RoBERTa-... 实体关系抽取是构建知识图谱的关键步骤,其目的是抽取文本中的关系三元组。针对现有中文实体关系联合抽取模型无法有效抽取重叠关系三元组及提取性能不足的问题,该文提出了RoBERTa-Effg-Adv的实体关系联合抽取模型,其编码端采用RoBERTa-wwm-ext预训练模型对输入数据进行编码,并采用Efficient GlobalPointer模型来处理嵌套和非嵌套命名实体识别,将实体关系三元组拆分成五元组进行实体关系联合抽取。再结合对抗训练,提升模型的鲁棒性。为了获得机器可读的语料库,对相关文本书籍进行扫描,并进行光学字符识别,再通过人工标注数据的方式,形成该研究所需要的关系抽取数据集REDQTTM,该数据集包含18种实体类型和11种关系类型。实验结果验证了该方法在瞿昙寺壁画领域的中文实体关系联合抽取任务的有效性,在REDQTTM测试集上的精确率达到了94.0%,召回率达到了90.7%,F1值达到了92.3%,相比GPLinker模型,在精确率、召回率和F1值上分别提高了2.4百分点、0.9百分点、1.6百分点。 展开更多
关键词 RoBERTa-wwm-ext 对抗训练 关系抽取 Efficient globalpointer 中文实体
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部