期刊文献+
共找到109篇文章
< 1 2 6 >
每页显示 20 50 100
基于Bert-BiLSTM-CRF监察问题实体识别研究
1
作者 付茂洺 李娟 张兵 《舰船电子工程》 2025年第6期106-109,148,共5页
针对于监察过程中产生的数据存在的文本长、命名实体多、实体难以识别的问题,提出了基于Bert-BiLSTM-CRF的民航监察问题命名实体识别方法。以Bert为底层预训练模型,结合BiLSTM循环神经网络对文本实体的标签进行预测,使用CRF模型对识别... 针对于监察过程中产生的数据存在的文本长、命名实体多、实体难以识别的问题,提出了基于Bert-BiLSTM-CRF的民航监察问题命名实体识别方法。以Bert为底层预训练模型,结合BiLSTM循环神经网络对文本实体的标签进行预测,使用CRF模型对识别的结果进行约束。实验结果表明,该方法能有效获取监察问题中的重要实体信息,采用Bert-BiLSTM-CRF模型在原有的BiLSTM-CRF模型基础上识别精度提升了4.06%。 展开更多
关键词 民航监察 命名实体识别 bert-BiLSTM-crf 预训练
在线阅读 下载PDF
基于BERT-Tiny Transformer-CRF的自动化装配命名实体识别方法
2
作者 钱冠翔 于丽娅 +2 位作者 李传江 李少波 徐兆 《计算机集成制造系统》 北大核心 2025年第10期3594-3606,共13页
随着工业5.0对知识驱动的智能制造提出新要求,机械装配领域面临多模态数据稀疏、实体语义边界模糊、数据分布呈现长尾效应的挑战。为此,提出一种融合多项式损失函数的BERT-Tiny Transformer-CRF模型,旨在提升低资源场景下的领域知识抽... 随着工业5.0对知识驱动的智能制造提出新要求,机械装配领域面临多模态数据稀疏、实体语义边界模糊、数据分布呈现长尾效应的挑战。为此,提出一种融合多项式损失函数的BERT-Tiny Transformer-CRF模型,旨在提升低资源场景下的领域知识抽取效率。首先,通过知识蒸馏与语义增强技术注入领域先验知识,其次设计维度自适应特征压缩模块实现跨模态特征融合,最后构建动态边缘感知解码机制实现实体边界的精准定位。利用自主构建的自动化装配数据集,将所提方法与不同实体识别模型进行对比,实验结果表明,所提模型具有良好的泛化识别能力,以86.62%的准确率、85.27%的精确率、85.67%的召回率和85.46%的F1值优于其他模型,为工业5.0下机械自动化装配领域知识图谱的构建提供了一种有效的技术方法。 展开更多
关键词 bert-Tiny Transformer-crf模型 数据增强 PolyLoss 自动化装配
在线阅读 下载PDF
基于Bert-BiLSTM-CRF模型的中文命名实体识别 被引量:1
3
作者 龙星全 李佳 《吉林大学学报(信息科学版)》 2025年第2期384-393,共10页
针对现有的中文命名实体识别算法没有充分考虑实体识别任务的数据特征,存在中文样本数据的类别不平衡、训练数据中的噪声太大和每次模型生成数据的分布差异较大的问题,提出了一种以BERT-BiLSTM-CRF(Bidirectional Encoder Representatio... 针对现有的中文命名实体识别算法没有充分考虑实体识别任务的数据特征,存在中文样本数据的类别不平衡、训练数据中的噪声太大和每次模型生成数据的分布差异较大的问题,提出了一种以BERT-BiLSTM-CRF(Bidirectional Encoder Representations from Transformers-Bidirectional Long Short-Term Memory-Conditional Random Field)为基线改进的中文命名实体识别模型。首先在BERT-BiLSTM-CRF模型上结合P-Tuning v2技术,精确提取数据特征,然后使用3个损失函数包括聚焦损失(Focal Loss)、标签平滑(Label Smoothing)和KL Loss(Kullback-Leibler divergence loss)作为正则项参与损失计算。实验结果表明,改进的模型在Weibo、Resume和MSRA(Microsoft Research Asia)数据集上的F 1得分分别为71.13%、96.31%、95.90%,验证了所提算法具有更好的性能,并且在不同的下游任务中,所提算法易于与其他的神经网络结合与扩展。 展开更多
关键词 中文命名实体识别 bert-BiLSTM-crf模型 P-Tuning v2技术 损失函数
在线阅读 下载PDF
融合自注意力的Bert-BiGRU-CRF的文本因果关系抽取
4
作者 高宁波 张晓滨 《计算机与现代化》 2025年第7期112-118,共7页
针对自然语言文本因果关系抽取中存在的标记方案无法处理重叠关系以及长距离依赖性的问题,本文引入tag2triplet算法来处理同一句子中的多个因果三元组和嵌入式因果关系的因果三元组,并将因果性标记方案与深度学习架构相结合用以最小化... 针对自然语言文本因果关系抽取中存在的标记方案无法处理重叠关系以及长距离依赖性的问题,本文引入tag2triplet算法来处理同一句子中的多个因果三元组和嵌入式因果关系的因果三元组,并将因果性标记方案与深度学习架构相结合用以最小化特征工程,同时有效地对因果关系建模。此外,本文将自注意力机制融合到Bert-BiGRU-CRF模型中以学习因果关系之间的长距离依赖性,允许信息在网络中自由流动,从而更准确地提取因果关系。为了验证该方法的有效性,将模型与目前广泛使用的BiLSTM-softmax模型、BiLSTM-CRF模型和Flair+CLSTM-BiLSTM-CRF模型在SemEval 2010 task8数据集上进行对比实验,结果表明,本文模型的F1评价指标分数更高,达到了83.44%。 展开更多
关键词 因果关系抽取 tag2triplet算法 bert-BiGRU-crf 自注意力
在线阅读 下载PDF
基于BERT-BiGRU-CRF的农业病虫害命名实体识别模型研究
5
作者 杨宁 潘娇 +2 位作者 梁姣 冉涛 冷震北 《现代信息科技》 2025年第22期7-11,共5页
农业病虫害信息的准确提取对农业生产具有重要意义。命名实体识别作为一项关键技术,有助于从海量农业文本中精准获取相关信息。针对传统方法在农业病虫害信息提取中依赖人工词典、特征提取能力不足等问题,文章提出一种基于BERT-BiGRU-CR... 农业病虫害信息的准确提取对农业生产具有重要意义。命名实体识别作为一项关键技术,有助于从海量农业文本中精准获取相关信息。针对传统方法在农业病虫害信息提取中依赖人工词典、特征提取能力不足等问题,文章提出一种基于BERT-BiGRU-CRF的农业病虫害命名实体识别模型。该模型首先利用BERT预训练模型生成高质量的上下文语义向量表示;继而通过BiGRU进一步捕获上下文长距离依赖关系,全面提取序列特征;最后借助CRF选择全局最优标注序列,输出准确的实体识别结果。实验结果表明,所提出模型在自构建的农业病虫害命名实体识别数据集上,精确率、召回率与F1值分别达到76.46%、79.65%和77.92%。 展开更多
关键词 农业病虫害 命名实体识别 bert BiGRU crf
在线阅读 下载PDF
基于Sentence-BERT与孤立森林算法的专利新颖性评估
6
作者 邓娜 王雨佳 +1 位作者 杨洋 陈旭 《情报杂志》 北大核心 2025年第2期174-182,共9页
[研究目的]面对专利数量的迅猛增长,采用人工方法评估专利新颖性变得愈发困难,且目前专利新颖性评估研究过度聚焦于技术层面,未能综合考虑专利的其他信息因素。因此,实现更高效、客观的专利新颖性评估具有重要的现实意义。[研究方法]提... [研究目的]面对专利数量的迅猛增长,采用人工方法评估专利新颖性变得愈发困难,且目前专利新颖性评估研究过度聚焦于技术层面,未能综合考虑专利的其他信息因素。因此,实现更高效、客观的专利新颖性评估具有重要的现实意义。[研究方法]提出一种基于Sentence-BERT与孤立森林算法的专利新颖性评估方法。首先,使用专利标题与IPC分类号分别作为专利的应用方向与功能分类特征,再通过BiLSTM-CRF模型对专利摘要进行关键技术抽取作为实施方法特征;其次,采用Sentence-BERT对上述特征进行文本向量化表示后组合输入至孤立森林算法获得离群专利集;最后,通过技术量权值过滤法提高专利新颖性评估的精度。[研究结果/结论]以金融科技领域专利进行实证研究,结果表明,该评估方法准确率相较专业专利分析平台方法提升了9%~11%。证明了该方法在专利新颖性评估中的有效性,能为后续专利审核工作和高价值专利分析提供参考。 展开更多
关键词 专利评估 专利新颖性 BiLSTM-crf Sentence-bert 孤立森林算法 机器学习
在线阅读 下载PDF
基于BERT-BiLSTM-CRF党建领域命名实体识别 被引量:1
7
作者 赵盾 佘学兵 邬昌兴 《计算机与现代化》 2024年第9期91-94,共4页
党建领域知识图谱构建过程中使用传统的命名实体识别方法时,存在实体边界不清、实体词性多义等问题,导致存在识别准确率和效率低的问题。为此,本文提出一种融合树形概率和领域词典的BERT-BiLSTM-CRF实体识别模型。该模型在BERT中嵌入领... 党建领域知识图谱构建过程中使用传统的命名实体识别方法时,存在实体边界不清、实体词性多义等问题,导致存在识别准确率和效率低的问题。为此,本文提出一种融合树形概率和领域词典的BERT-BiLSTM-CRF实体识别模型。该模型在BERT中嵌入领域词典进行文本向量化表示;利用BiLSTM获取上下文语义特征;将树形概率应用到CRF层的转移概率计算中提高分词准确率。与基准模型在MSRA和自构建的语料库上进行实验对比,实验结果表明本模型在F1值、召回率、精确率3个指标上都能取得较好的效果。 展开更多
关键词 bert-BiLSTM-crf模型 树形概率 领域词典 命名实体识别
在线阅读 下载PDF
基于BERT-BiLSTM-CRF模型的油气领域命名实体识别 被引量:12
8
作者 高国忠 李宇 +1 位作者 华远鹏 吴文旷 《长江大学学报(自然科学版)》 2024年第1期57-65,共9页
针对油气领域知识图谱构建过程中命名实体识别使用传统方法存在实体特征信息提取不准确、识别效率低的问题,提出了一种基于BERT-BiLSTM-CRF模型的命名实体识别研究方法。该方法首先利用BERT(bidirectional encoder representations from... 针对油气领域知识图谱构建过程中命名实体识别使用传统方法存在实体特征信息提取不准确、识别效率低的问题,提出了一种基于BERT-BiLSTM-CRF模型的命名实体识别研究方法。该方法首先利用BERT(bidirectional encoder representations from transformers)预训练模型得到输入序列语义的词向量;然后将训练后的词向量输入双向长短期记忆网络(bi-directional long short-term memory,BiLSTM)模型进一步获取上下文特征;最后根据条件随机场(conditional random fields,CRF)的标注规则和序列解码能力输出最大概率序列标注结果,构建油气领域命名实体识别模型框架。将BERT-BiLSTM-CRF模型与其他2种命名实体识别模型(BiLSTM-CRF、BiLSTM-Attention-CRF)在包括3万多条文本语料数据、4类实体的自建数据集上进行了对比实验。实验结果表明,BERT-BiLSTM-CRF模型的准确率(P)、召回率(R)和F_(1)值分别达到91.3%、94.5%和92.9%,实体识别效果优于其他2种模型。 展开更多
关键词 油气领域 命名实体识别 bert 双向长短期记忆网络 条件随机场 bert-BiLSTM-crf模型
在线阅读 下载PDF
基于BERT-BiGRU-CRF的突发事件元素抽取模型研究
9
作者 王维芳 陆万万 《计算机应用文摘》 2024年第19期131-134,共4页
针对中文突发事件领域的事件元素抽取准确率低的问题,文章提出一种BERT-BiGRU-CRF突发事件元素抽取模型,旨在将事件元素抽取任务转变为序列标注任务以进行处理。其中,首先通过BERT预训练实现突发事件文本向量化;然后通过BiGRU进一步实... 针对中文突发事件领域的事件元素抽取准确率低的问题,文章提出一种BERT-BiGRU-CRF突发事件元素抽取模型,旨在将事件元素抽取任务转变为序列标注任务以进行处理。其中,首先通过BERT预训练实现突发事件文本向量化;然后通过BiGRU进一步实现语义编码;最后采用CRF研判输出最大概率标注序列。对比结果证明,BERT-BiGRU-CRF模型具有更高的抽取准确率,可以在突发事件元素抽取任务中获得更好的抽取效果。 展开更多
关键词 突发事件元素抽取 bert BiGRU crf
在线阅读 下载PDF
基于BERT和BiGRU的数字产业岗位实体识别与人才画像
10
作者 杨彦武 翟盼雨 金颖 《武汉大学学报(理学版)》 北大核心 2025年第5期667-679,共13页
构建了一个面向数字产业的实体识别与人才画像(BERT-BiGRU-Attention-CRF)模型。该模型融合了BERT和BiGRU两种表征学习方法,根据句子的上下文语义进行文本表达,并采用多头注意力加强关键语义信息,然后利用条件随机场(CRF)方法对文本进... 构建了一个面向数字产业的实体识别与人才画像(BERT-BiGRU-Attention-CRF)模型。该模型融合了BERT和BiGRU两种表征学习方法,根据句子的上下文语义进行文本表达,并采用多头注意力加强关键语义信息,然后利用条件随机场(CRF)方法对文本进行分类,识别岗位的人才需求。抓取国内三大主流网站上数字产业相关岗位的最新招聘信息进行分析,结果表明,BERT-BiGRU-Attention-CRF模型在Precision、Recall和F1指标上的表现均显著优于基线模型。根据岗位与需求之间的关系,采用BERT-BiGRU-Attention-CRF模型构建数字产业人才知识图谱与岗位人才画像,通过分析数字产业人才知识图谱中各岗位所连接的节点得到不同岗位对人才需求的共同与差异之处。 展开更多
关键词 数字产业 实体识别 人才画像 bert-BiGRU-Attention-crf 数字人才
原文传递
基于BERT-BiLSTM-CRF的隧道施工安全领域命名实体识别 被引量:6
11
作者 张念 周彩凤 +3 位作者 万飞 刘非 王耀耀 徐栋梁 《中国安全科学学报》 CSCD 北大核心 2024年第12期56-63,共8页
为解决隧道施工安全领域传统命名实体识别(NER)方法存在的实体边界模糊、小样本学习困难、特征信息提取不够全面准确等问题,提出一种基于变换器的双向编码器表征(BERT)-双向长短时记忆(BiLSTM)网络-条件随机场(CRF)模型的隧道施工事故... 为解决隧道施工安全领域传统命名实体识别(NER)方法存在的实体边界模糊、小样本学习困难、特征信息提取不够全面准确等问题,提出一种基于变换器的双向编码器表征(BERT)-双向长短时记忆(BiLSTM)网络-条件随机场(CRF)模型的隧道施工事故文本实体识别方法。首先,利用BERT模型将隧道施工事故文本编码得到蕴含语义特征的词向量;然后,将BERT模型训练后输出的词向量输入BiLSTM模型进一步获取隧道施工事故文本的上下文特征并进行标签概率预测;最后,利用CRF层的标注规则的约束,修正BiLSTM模型的输出结果,得到最大概率序列标注结果,从而实现对隧道施工事故文本标签的智能分类。将该模型与其他4种常用的传统NER模型在隧道施工安全事故语料数据集上进行对比试验,试验结果表明:BERT-BiLSTM-CRF模型的识别准确率、召回率和F 1值分别达到88%、89%和88%,实体识别效果优于其他基准模型。利用所建立的NER模型识别实际隧道施工事故文本中的实体,验证了其在隧道施工安全领域中的应用效果。 展开更多
关键词 变换器的双向编码器表征(bert) 双向长短时记忆(BiLSTM)网络 条件随机场(crf) 隧道施工 安全领域 命名实体识别(NER) 深度学习
原文传递
基于BERT的中药材治疗胃病的命名实体识别
12
作者 熊磊 《软件导刊》 2025年第1期57-64,共8页
中药材用于胃病治疗的命名实体识别,是中药材开发领域文本信息挖掘的重要任务,也是构建知识图谱最重要的基础任务。为了更好地实现对中药材治疗胃病实体的提取,实验设计了5个命名实体识别模型进行实验比较,在预训练层、神经网络层,输出... 中药材用于胃病治疗的命名实体识别,是中药材开发领域文本信息挖掘的重要任务,也是构建知识图谱最重要的基础任务。为了更好地实现对中药材治疗胃病实体的提取,实验设计了5个命名实体识别模型进行实验比较,在预训练层、神经网络层,输出层都进行了不同设计,选择了更适合的BERT-BILSTM-CRF模型。首先,通过BERT生成特征提取层BILSTM的词向量;其次,利用BILSTM获取文本前后两个方向的特征得到相关特征向量;最后,利用CRF进行解码、标签预测,并讨论了模型各部分对实验的影响。实验表明,所提模型在自创数据集上的准确率、召回率、F1值分别为85.20%、85.47%、85.33%,相较于现有方法表现较好。 展开更多
关键词 中药材胃病治疗 命名实体识别 深度学习 bert BILSTM-crf
在线阅读 下载PDF
基于BERT嵌入BiLSTM-CRF模型的中文专业术语抽取研究 被引量:66
13
作者 吴俊 程垚 +3 位作者 郝瀚 艾力亚尔·艾则孜 刘菲雪 苏亦坡 《情报学报》 CSSCI CSCD 北大核心 2020年第4期409-418,共10页
专业术语的识别与自动抽取对于提升专业信息检索精度,构建领域知识图谱发挥着重要基础性作用。为进一步提升中文专业术语识别的精确率和召回率,提出一种端到端的不依赖人工特征选择和领域知识,基于谷歌BERT预训练语言模型及中文预训练... 专业术语的识别与自动抽取对于提升专业信息检索精度,构建领域知识图谱发挥着重要基础性作用。为进一步提升中文专业术语识别的精确率和召回率,提出一种端到端的不依赖人工特征选择和领域知识,基于谷歌BERT预训练语言模型及中文预训练字嵌入向量,融合BiLSTM和CRF的中文专业术语抽取模型。以自建的1278条深度学习语料数据为实验对象,该模型对术语提取的F1值为92.96%,相对于传统的浅层机器学习模型(如左右熵与互信息算法、word2vec相似词算法等)和BiLSTM-CRF深度神经网络模型的性能有较为显著的提升。本文也给出了模型应用的具体流程,能够为中文专业术语库的构建提供实践指南。 展开更多
关键词 bert BiLSTM crf 专业术语抽取
在线阅读 下载PDF
基于BERT-BLSTM-CRF的政务领域命名实体识别方法 被引量:6
14
作者 杨春明 魏成志 +2 位作者 张晖 赵旭剑 李波 《西南科技大学学报》 CAS 2020年第3期86-91,共6页
政务领域的命名实体通常是一些政务事项名,这类实体与开放域实体比较,具有长度较长、实体并列、别称等特点,目前还未见公开可用的训练数据集。构建了具有25176个句子的政务领域命名实体识别数据集,并提出一种基于BERT-BLSTM-CRF的神经... 政务领域的命名实体通常是一些政务事项名,这类实体与开放域实体比较,具有长度较长、实体并列、别称等特点,目前还未见公开可用的训练数据集。构建了具有25176个句子的政务领域命名实体识别数据集,并提出一种基于BERT-BLSTM-CRF的神经网络识别模型,该模型在不依赖人工特征选择的情况下,使用BERT中文预训练模型,然后采用BLSTM-CRF识别实体。实验结果表明,该模型识别效果优于CRF,BLSTM-CRF,CNN-BLSTM-CRF,F1值达到92.23%。 展开更多
关键词 政务事务 命名实体识别 BLSMT crf bert
在线阅读 下载PDF
基于BERT与BiGRU-CRF的交通事故文本信息提取模型 被引量:6
15
作者 樊海玮 秦佳杰 +2 位作者 孙欢 张丽苗 鲁芯丝雨 《计算机与现代化》 2022年第5期10-15,共6页
针对现存交通事故文本信息中存在的大量时间、地点、伤亡损失等关键异构数据难以有效提取,以及用静态词向量深度学习模型提取交通事故文本信息精确度较低的问题,本文利用BERT(Bidirectional Encoder Representations from Transformers... 针对现存交通事故文本信息中存在的大量时间、地点、伤亡损失等关键异构数据难以有效提取,以及用静态词向量深度学习模型提取交通事故文本信息精确度较低的问题,本文利用BERT(Bidirectional Encoder Representations from Transformers)对文本字符进行动态向量映射,从数据表达源头解决一词多义、上下文依赖不充分等问题;利用BiGRU(Bi-Gate Recurrent Unit)提取文本向量化后的特征,输出高特征的文本序列;利用CRF(Conditional Random Fields)计算全局最优输出节点的概率优势,优化文本序列特征结果,提出一种基于动态字向量的BERT-BiGRU-CRF融合模型,用于交通事故文本关键信息提取。通过对比实验表明,该模型在交通事故文本信息提取中平均准确率为0.952,F1为0.925,比基于静态词向量Word2Vec模型的精确率与F1值分别提高了6.3个百分点和7.9个百分点。 展开更多
关键词 深度学习 文本信息提取 异构数据 bert BiGRU crf
在线阅读 下载PDF
基于BERT-IDCNN-CRF的中文命名实体识别方法 被引量:66
16
作者 李妮 关焕梅 +1 位作者 杨飘 董文永 《山东大学学报(理学版)》 CAS CSCD 北大核心 2020年第1期102-109,共8页
预训练语言模型能够表达句子丰富的句法和语法信息,并且能够对词的多义性建模,在自然语言处理中有着广泛的应用,BERT(bidirectional encoder representations from transformers)预训练语言模型是其中之一。在基于BERT微调的命名实体识... 预训练语言模型能够表达句子丰富的句法和语法信息,并且能够对词的多义性建模,在自然语言处理中有着广泛的应用,BERT(bidirectional encoder representations from transformers)预训练语言模型是其中之一。在基于BERT微调的命名实体识别方法中,存在的问题是训练参数过多,训练时间过长。针对这个问题提出了基于BERT-IDCNN-CRF(BERT-iterated dilated convolutional neural network-conditional random field)的中文命名实体识别方法,该方法通过BERT预训练语言模型得到字的上下文表示,再将字向量序列输入IDCNN-CRF模型中进行训练,训练过程中保持BERT参数不变,只训练IDCNN-CRF部分,在保持多义性的同时减少了训练参数。实验表明,该模型在MSRA语料上F1值能够达到94.41%,在中文命名实体任务上优于目前最好的Lattice-LSTM模型,提高了1.23%;与基于BERT微调的方法相比,该方法的F1值略低但是训练时间大幅度缩短。将该模型应用于信息安全、电网电磁环境舆情等领域的敏感实体识别,速度更快,响应更及时。 展开更多
关键词 中文命名实体识别 bert模型 膨胀卷积 条件随机场 信息安全
原文传递
基于实体级遮蔽BERT与BiLSTM-CRF的农业命名实体识别 被引量:22
17
作者 韦紫君 宋玲 +1 位作者 胡小春 陈宁江 《农业工程学报》 EI CAS CSCD 北大核心 2022年第15期195-203,共9页
字符的位置信息和语义信息对命名方式繁杂且名称长度较长的中文农业实体的识别至关重要。为解决命名实体识别过程中由于捕获字符位置信息、上下文语义特征和长距离依赖信息不充足导致识别效果不理想的问题,该研究提出一种基于EmBERT-BiL... 字符的位置信息和语义信息对命名方式繁杂且名称长度较长的中文农业实体的识别至关重要。为解决命名实体识别过程中由于捕获字符位置信息、上下文语义特征和长距离依赖信息不充足导致识别效果不理想的问题,该研究提出一种基于EmBERT-BiLSTM-CRF模型的中文农业命名实体识别方法。该方法采用基于Transformer的深度双向预训练语言模型(Bidirectional Encoder Representation from Transformers,BERT)作为嵌入层提取字向量的深度双向表示,并使用实体级遮蔽策略使模型更好地表征中文语义;然后使用双向长短时记忆网络(BidirectionalLong Short-Term Memory,BiLSTM)学习文本的长序列语义特征;最后使用条件随机场(Conditional Random Field,CRF)在训练数据中学习标注约束规则,并利用相邻标签之间的信息输出全局最优的标注序列。训练过程中使用了焦点损失函数来缓解样本分布不均衡的问题。试验在构建的语料库上对农作物品种、病害、虫害和农药4类农业实体进行识别。结果表明,该研究的EmBERT-BiLSTM-CRF模型对4类农业实体的识别性能相较于其他模型有明显提升,准确率为94.97%,F1值为95.93%。 展开更多
关键词 农业 命名实体识别 实体级遮蔽 bert BiLSTM crf
在线阅读 下载PDF
基于BERT-BiLSTM-CRF的中文地址解析方法 被引量:9
18
作者 吴恪涵 张雪英 +2 位作者 叶鹏 怀安 张航 《地理与地理信息科学》 CSCD 北大核心 2021年第4期10-15,共6页
中文地址解析是地址匹配的重要环节,广泛应用于地址检索、地理编码和地址信息识别等方面。但传统地址解析方法存在覆盖度有限、人工参与过多和泛化能力较差等问题。为发挥深度学习模型在深层结构上自动学习上下文特征的优势,提出一种基... 中文地址解析是地址匹配的重要环节,广泛应用于地址检索、地理编码和地址信息识别等方面。但传统地址解析方法存在覆盖度有限、人工参与过多和泛化能力较差等问题。为发挥深度学习模型在深层结构上自动学习上下文特征的优势,提出一种基于BERT-BiLSTM-CRF深度学习模型的中文地址解析方法:依据中文地址要素多级分类体系,扩展BIOES标注方法并进行地址语料标注;基于预训练语言模型,构建融合BERT、BiLSTM和CRF的综合深度学习模型,通过BERT预训练语言模型获取富含语义信息的字符向量,弥补静态词向量特异性缺失的问题,提高复杂地址要素的提取能力。以2019年深圳市地址数据为例进行模型性能评估,该方法对于多数中文地址要素的解析准确率达90%以上;相比IDCNN-CRF和BiLSTM-CRF等深度学习模型,该方法对只具有小规模地址语料时的地址解析效果更优,且在解析多种地址要素类型时能保持良好的性能。 展开更多
关键词 中文地址 地址要素分类 地址标注 bert-BiLSTM-crf 地址解析模型
在线阅读 下载PDF
基于BERT-BiLSTM-CRF模型的中文实体识别 被引量:121
19
作者 谢腾 杨俊安 刘辉 《计算机系统应用》 2020年第7期48-55,共8页
命名实体识别是自然语言处理的一项关键技术.基于深度学习的方法已被广泛应用到中文实体识别研究中.大多数深度学习模型的预处理主要注重词和字符的特征抽取,却忽略词上下文的语义信息,使其无法表征一词多义,因而实体识别性能有待进一... 命名实体识别是自然语言处理的一项关键技术.基于深度学习的方法已被广泛应用到中文实体识别研究中.大多数深度学习模型的预处理主要注重词和字符的特征抽取,却忽略词上下文的语义信息,使其无法表征一词多义,因而实体识别性能有待进一步提高.为解决该问题,本文提出了一种基于BERT-BiLSTM-CRF模型的研究方法.首先通过BERT模型预处理生成基于上下文信息的词向量,其次将训练出来的词向量输入BiLSTM-CRF模型做进一步训练处理.实验结果表明,该模型在MSRA语料和人民日报语料库上都达到相当不错的结果,F1值分别为94.65%和95.67%. 展开更多
关键词 命名实体识别 bert模型 双向长短期记忆网络 条件随机场 词向量
在线阅读 下载PDF
基于BERT-BiLSTM-CRF模型的地理实体命名实体识别 被引量:7
20
作者 汤洁仪 李大军 刘波 《北京测绘》 2023年第2期143-147,共5页
互联网中存在大量的与地理信息相关的信息,其中文本信息是这些信息的重要组成部分。针对构建地理实体库过程中依赖人工制定规则、信息提取不充分等问题,本文通过利用爬虫技术获取百度百科文本信息并构建地理实体语料库,端到端的深度学... 互联网中存在大量的与地理信息相关的信息,其中文本信息是这些信息的重要组成部分。针对构建地理实体库过程中依赖人工制定规则、信息提取不充分等问题,本文通过利用爬虫技术获取百度百科文本信息并构建地理实体语料库,端到端的深度学习模型BERT-BiLSTM-CRF模型对自建的地理实体语料库进行了命名实体识别(NER),模型在传统的BiLSTM-CRF模型上加入了BERT预训练模型,使得模型可以更好地结合文本上下文及语义信息。结果表明,该模型相比于BiLSTM-CRF模型和BiLSTM模型在地理实体命名实体识别中取得了更好的结果,且对进一步构建地理实体知识图谱、知识库等具有重要意义。 展开更多
关键词 地理实体 命名实体识别(NER) 知识抽取 bert-BiLSTM-crf模型
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部