期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
基于LEBERT的时间信息增强中文命名实体识别
1
作者 张光明 肖然 +3 位作者 张弛 高谦 谈栋华 彭菊红 《湖北大学学报(自然科学版)》 CAS 2025年第1期118-125,共8页
为解决现有预训练模型没有充分考虑汉语词汇的分割特征的问题,提出一种基于LEBERT-ILRN-RA-CRF的中文命名实体识别模型。该模型首先利用LEBERT对输入文本进行词汇表增强和嵌入处理,然后利用ILRN模块提取时间信息,并将字符-词融合与字向... 为解决现有预训练模型没有充分考虑汉语词汇的分割特征的问题,提出一种基于LEBERT-ILRN-RA-CRF的中文命名实体识别模型。该模型首先利用LEBERT对输入文本进行词汇表增强和嵌入处理,然后利用ILRN模块提取时间信息,并将字符-词融合与字向量采集相结合,最后使用条件随机场(CRF)进行结果校正。此外,该模型还引入了词汇量增强和残差门控注意网络来加强时间特征的提取和局部特征的表达,进一步提升了模型的识别效果。在Weibo和Resume两个数据集上分别取得了71.73%和96.51%的宏F1值。实验表明该模型可以考虑到汉语词汇的分割问题,改善中文命名实体识别任务的识别效果。 展开更多
关键词 中文命名实体识别 时间信息增强 lebert CRF 残差门控注意力机制
在线阅读 下载PDF
基于LEBERT的中文命名实体识别方法
2
作者 沈言玉 王芬 赵宇航 《信息技术与信息化》 2025年第6期121-124,共4页
预训练模型BERT(bidirectional encoder representation from transformers)因其卓越的性能在中文命名实体识别任务中取得了显著成果,但BERT在处理中文文本时,未充分考虑词汇信息。为克服这一局限,文章提出了一种基于LEBERT(lexicon enh... 预训练模型BERT(bidirectional encoder representation from transformers)因其卓越的性能在中文命名实体识别任务中取得了显著成果,但BERT在处理中文文本时,未充分考虑词汇信息。为克服这一局限,文章提出了一种基于LEBERT(lexicon enhanced BERT)的中文命名实体识别方法,结合BiLSTM(bidirectional long short-term memory)和CRFF(conditional random fi eld)模型,进一步提升识别性能。LEBERT在预训练阶段通过引入词汇嵌入,使得模型能够更好地捕捉词汇的语义信息;BiLSTM用于捕捉序列数据中的双向依赖关系;CRF层则用于解码最优的标签序列,不仅考虑到标签之间的转移概率,还避免了非法实体的出现。实验结果表明,该方法在Weibo、Resume、OntoNotes数据集分别取得71.57%、96.53%、82.04%的F1值,优于其他主流方法。 展开更多
关键词 中文命名实体识别 lebert BiLSTM 词汇增强
在线阅读 下载PDF
基于LEBERT的多模态领域知识图谱构建 被引量:4
3
作者 李华昱 付亚凤 +1 位作者 闫阳 李家瑞 《计算机系统应用》 2022年第11期79-90,共12页
多模态知识图谱(multi-modal knowledge graph,MMKG)是近几年新兴的人工智能领域研究热点.本文提供了一种多模态领域知识图谱的构建方法,以解决计算机学科领域知识体系庞大分散的问题.首先,通过爬取计算机学科的相关多模态数据,构建了... 多模态知识图谱(multi-modal knowledge graph,MMKG)是近几年新兴的人工智能领域研究热点.本文提供了一种多模态领域知识图谱的构建方法,以解决计算机学科领域知识体系庞大分散的问题.首先,通过爬取计算机学科的相关多模态数据,构建了一个系统化的多模态知识图谱.但构建多模态知识图谱需要耗费大量的人力物力,本文训练了基于LEBERT模型和关系抽取规则的实体-关系联合抽取模型,最终实现了一个能够自动抽取关系三元组的多模态计算机学科领域知识图谱. 展开更多
关键词 多模态 知识图谱 领域 lebert 关系抽取规则 Lexicon Adapter
在线阅读 下载PDF
基于LEBERT-CRF和知识图谱的中文地址修正补全方法
4
作者 王钦民 刘鹏 邓国威 《计算机科学与应用》 2023年第4期808-818,共11页
为解决人工中文地址因输入不准确造成的地址解析错误问题,本文首先结合词汇增强的基于Transformer的双向编码表征模型(LEBERT)与条件随机场(CRF),提出了LEBERT-CRF模型,相较BERT-长短期记忆-CRF模型(BERT-BiLSTM-CRF)在分词准确率、召... 为解决人工中文地址因输入不准确造成的地址解析错误问题,本文首先结合词汇增强的基于Transformer的双向编码表征模型(LEBERT)与条件随机场(CRF),提出了LEBERT-CRF模型,相较BERT-长短期记忆-CRF模型(BERT-BiLSTM-CRF)在分词准确率、召回率以及F值上分别提升了1.45%、1.89%和1.67%。然后,通过标准层级地址数据,并引入别名、旧名等地址信息构建了地址知识图谱库。最终,利用经过分词处理的地址数据,并根据地址数据存在的几种可能错误类型,设计出一种基于地址知识图谱库的匹配算法,对分词完的地址数据进行匹配修正并得到准确地址信息,相较于中文省份城市地区匹配器(CPCA),地址解析在一级地址、二级地址、三级地址上解析准确率分别提升了2.12%、2.36%和1.12%。 展开更多
关键词 中文地址分词 中文地址匹配 lebert CRF 知识图谱
在线阅读 下载PDF
基于GPT修正农业病虫害命名实体识别方法 被引量:4
5
作者 余克健 张程 +1 位作者 乐毅 吴云志 《内蒙古农业大学学报(自然科学版)》 CAS 2023年第5期34-43,共10页
命名实体识别是构建知识图谱的关键,在农业病虫害领域存在病虫害数据匮乏、实体结构复杂、实体类型识别困难等问题。针对于病虫害数据匮乏,本文采用网络爬虫技术以及扫描文本数据的方法,构建了玉米、小麦、水稻病虫害实体语料库。传统... 命名实体识别是构建知识图谱的关键,在农业病虫害领域存在病虫害数据匮乏、实体结构复杂、实体类型识别困难等问题。针对于病虫害数据匮乏,本文采用网络爬虫技术以及扫描文本数据的方法,构建了玉米、小麦、水稻病虫害实体语料库。传统的命名实体识别方法无法解决农业病害实体结构复杂、实体类型识别困难等问题。本文提出一种基于GPT规则修正的LEBERT-BilSTM-CRF模型,LEBERT模型构建了字典树和Lexicon-Adapter结构,将原始字符进行扩充增加数据的丰富性,将经过BiLSTM-CRF的输出和GPT结果进行实体标签修正以此来提高准确率。在公开数据集训练得到合适的参数后,在自建文本语料库进行训练,通过条件随机场和GPT修正生成全局最优序列取得很好的识别效果,准确率为94.23%,召回率为92.34%,F1值为93.28%。 展开更多
关键词 农业 命名实体识别 注意力机制 lebert 条件随机场
原文传递
融合领域词向量的实体识别研究
6
作者 侯敏 高茂 +2 位作者 张丽萍 闫盛 赵宇博 《内蒙古师范大学学报(自然科学版)》 CAS 2024年第2期197-206,共10页
以字为切分单位的BERT预训练模型在实体识别任务中表现优异,但其忽略粗粒度的领域词汇作为整体的语义表示信息,对于教育领域课程文本中存在大量嵌套实体的识别效果不佳。针对上述问题,提出动态融合字、词级别词向量的LEBERT-CRF教育领... 以字为切分单位的BERT预训练模型在实体识别任务中表现优异,但其忽略粗粒度的领域词汇作为整体的语义表示信息,对于教育领域课程文本中存在大量嵌套实体的识别效果不佳。针对上述问题,提出动态融合字、词级别词向量的LEBERT-CRF教育领域课程文本实体识别方法,利用词典适配器将领域词典特征高效融入BERT模型中,以提升BERT模型对实体词边界的识别效果,更好地适应课程知识抽取任务。结果表明,LEBERT-CRF模型相较其他主流的实体识别模型表现更好,F1达到95.47%。 展开更多
关键词 实体识别 lebert 领域词向量 字词融合
在线阅读 下载PDF
增强实体边界检测的医学命名实体识别
7
作者 徐凤娇 《长江信息通信》 2024年第3期77-79,共3页
针对中文电子病历报告中专业词汇较多导致的边界识别困难问题,文章提出了一种增强实体边界检测方法来更好地识别医学命名实体,即以实体边界预测为辅助任务,增强模型对实体边界的检测能力,提高模型性能。该文从两个方面增强了实体边界,... 针对中文电子病历报告中专业词汇较多导致的边界识别困难问题,文章提出了一种增强实体边界检测方法来更好地识别医学命名实体,即以实体边界预测为辅助任务,增强模型对实体边界的检测能力,提高模型性能。该文从两个方面增强了实体边界,一是通过在BERT与训练语言模型底层添加自制医学词典,增强模型对词汇边界信息的学习;二是以实体头尾预测作为辅助任务,进一步增强模型对实体边界的识别能力。在1个医学领域的公共数据集上进行了实验,相较于基线模型,F1值得到了1.96%的提升,说明该方法能有效检测实体边界,提升模型性能,验证了该模型的在医学领域的适用性。 展开更多
关键词 医学命名实体识别 实体边界检测 lebert
在线阅读 下载PDF
Chinese Named Entity Recognition Algorithm Integrating Vocabulary Information
8
作者 Xiaohua Ke Binglong Li +1 位作者 Zexian Ou Xiaobo Wu 《国际计算机前沿大会会议论文集》 2024年第3期96-107,共12页
In the current Chinese NER task,the language model especially has problems such as the accuracy of Chinese boundary entity recognition and the insufficient learning of Chinese character vocabulary information during th... In the current Chinese NER task,the language model especially has problems such as the accuracy of Chinese boundary entity recognition and the insufficient learning of Chinese character vocabulary information during the train-ing process.This article proposes an entity recognition model LEBERT-IDGRU-CRF based on BERT and introducing external dictionaries for training.The model performs lexical matching on the data text through an external dictionary to con-struct word pairs,and then passes the vector matrix to the feature extraction layer,which introduces an attention mechanism for further extraction.Through com-parative experiments on four data sets,the model results were improved and the feasibility of the model was verified. 展开更多
关键词 Chinese NER Dictionary Information lebert ATTENTION
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部