期刊文献+
共找到222篇文章
< 1 2 12 >
每页显示 20 50 100
基于BERT-BiLSTM-CRF的罗汉果病虫害知识图谱的构建
1
作者 石炼 熊顺 +1 位作者 李博 李东晖 《农业装备与车辆工程》 2026年第1期131-138,共8页
为解决罗汉果病虫害防治领域知识零散、缺乏语义关联的问题,提出了一种基于BERT-BiLSTM-CRF的混合模型用于知识图谱构建。为验证模型在罗汉果病虫害语料上的适应性与有效性,分别对BERT-BiLSTM-CRF、BiLSTM-CRF与LSTM-CRF三种模型开展了... 为解决罗汉果病虫害防治领域知识零散、缺乏语义关联的问题,提出了一种基于BERT-BiLSTM-CRF的混合模型用于知识图谱构建。为验证模型在罗汉果病虫害语料上的适应性与有效性,分别对BERT-BiLSTM-CRF、BiLSTM-CRF与LSTM-CRF三种模型开展了对比实验。实验结果表明,BERT-BiLSTM-CRF模型在实体识别任务中的准确率P、召回率R与F1值分别达到95.12%、92.48%与93.22%,显著优于其他对比模型,充分证明了其在领域知识抽取中的有效性。基于该模型所构建的罗汉果病虫害知识图谱共涵盖13类639个实体与11类845条语义关系,实现了对病虫害防治知识的结构化组织与关联化表达,为后续智能诊断与决策支持系统奠定了可靠的数据基础。 展开更多
关键词 罗汉果 病虫害 BERT-bilstm-crf 命名实体识别 知识图谱
在线阅读 下载PDF
基于Bert-BiLSTM-CRF监察问题实体识别研究
2
作者 付茂洺 李娟 张兵 《舰船电子工程》 2025年第6期106-109,148,共5页
针对于监察过程中产生的数据存在的文本长、命名实体多、实体难以识别的问题,提出了基于Bert-BiLSTM-CRF的民航监察问题命名实体识别方法。以Bert为底层预训练模型,结合BiLSTM循环神经网络对文本实体的标签进行预测,使用CRF模型对识别... 针对于监察过程中产生的数据存在的文本长、命名实体多、实体难以识别的问题,提出了基于Bert-BiLSTM-CRF的民航监察问题命名实体识别方法。以Bert为底层预训练模型,结合BiLSTM循环神经网络对文本实体的标签进行预测,使用CRF模型对识别的结果进行约束。实验结果表明,该方法能有效获取监察问题中的重要实体信息,采用Bert-BiLSTM-CRF模型在原有的BiLSTM-CRF模型基础上识别精度提升了4.06%。 展开更多
关键词 民航监察 命名实体识别 Bert-bilstm-crf 预训练
在线阅读 下载PDF
基于Bert-BiLSTM-CRF模型的中文命名实体识别 被引量:4
3
作者 龙星全 李佳 《吉林大学学报(信息科学版)》 2025年第2期384-393,共10页
针对现有的中文命名实体识别算法没有充分考虑实体识别任务的数据特征,存在中文样本数据的类别不平衡、训练数据中的噪声太大和每次模型生成数据的分布差异较大的问题,提出了一种以BERT-BiLSTM-CRF(Bidirectional Encoder Representatio... 针对现有的中文命名实体识别算法没有充分考虑实体识别任务的数据特征,存在中文样本数据的类别不平衡、训练数据中的噪声太大和每次模型生成数据的分布差异较大的问题,提出了一种以BERT-BiLSTM-CRF(Bidirectional Encoder Representations from Transformers-Bidirectional Long Short-Term Memory-Conditional Random Field)为基线改进的中文命名实体识别模型。首先在BERT-BiLSTM-CRF模型上结合P-Tuning v2技术,精确提取数据特征,然后使用3个损失函数包括聚焦损失(Focal Loss)、标签平滑(Label Smoothing)和KL Loss(Kullback-Leibler divergence loss)作为正则项参与损失计算。实验结果表明,改进的模型在Weibo、Resume和MSRA(Microsoft Research Asia)数据集上的F 1得分分别为71.13%、96.31%、95.90%,验证了所提算法具有更好的性能,并且在不同的下游任务中,所提算法易于与其他的神经网络结合与扩展。 展开更多
关键词 中文命名实体识别 BERT-bilstm-crf模型 P-Tuning v2技术 损失函数
在线阅读 下载PDF
基于BiLSTM-CRF的开放域搜索问答引擎
4
作者 李强 庄莉 +2 位作者 王秋琳 宋立华 陈江海 《微型电脑应用》 2025年第3期86-89,共4页
随着信息技术的快速发展,传统搜索问答系统在处理复杂的开放域问题上存在限制。因此,旨在引入双向长短期记忆-条件随机场(BiLSTM-CRF)模型,充分利用模型在双向信息处理和长距离依赖关系处理方面的优势,提高搜索问答引擎的性能,以更准确... 随着信息技术的快速发展,传统搜索问答系统在处理复杂的开放域问题上存在限制。因此,旨在引入双向长短期记忆-条件随机场(BiLSTM-CRF)模型,充分利用模型在双向信息处理和长距离依赖关系处理方面的优势,提高搜索问答引擎的性能,以更准确、全面地回答用户提出的问题。通过在Yahoo!Answers数据集上进行实验证明了所提模型在解决开放域搜索问答引擎中的有效性。与传统模型相比,所提模型在捕捉句子中的语义关系和识别命名实体方面表现出色,提升了问答引擎的准确性和鲁棒性。 展开更多
关键词 开放域 bilstm-crf 信息检索 命名实体识别 语义关系
在线阅读 下载PDF
基于双通道BiLSTM-CRF与动态知识图谱的电力设备缺陷智能诊断系统研究
5
作者 陈果 许明可 +4 位作者 吴美琪 丁萁琦 罗合 陈鸿祥 李书龙 《水力发电》 2025年第11期76-82,共7页
为解决传统电力设备缺陷诊断方法在语义理解深度不足和知识更新迭代滞后方面的局限,通过整合双通道BiLSTM-CRF与动态知识图谱技术,构建了一个电力设备缺陷智能诊断系统。为实现多缺陷关联诊断场景下的效能跃升,创新性地引入双驱动知识... 为解决传统电力设备缺陷诊断方法在语义理解深度不足和知识更新迭代滞后方面的局限,通过整合双通道BiLSTM-CRF与动态知识图谱技术,构建了一个电力设备缺陷智能诊断系统。为实现多缺陷关联诊断场景下的效能跃升,创新性地引入双驱动知识数据范式,实体识别准确率高达92.7%,相较于既有模式提升超过40%以上。为保证系统能实时映射电力设备最新运行知识及缺陷演化规律,前瞻性地构建了电力领域支持实时推理的动态知识图谱,经技术优化,将知识更新延迟控制在数分钟内。同时,系统还创新应用了知识蒸馏与动态加载技术,实现工业级轻量化部署,能够有效应对工业现场计算资源匮乏的挑战,保障了系统在实际工程应用中的高效与稳定运行。 展开更多
关键词 bilstm-crf 动态知识图谱 电力设备 缺陷智能诊断 边缘端轻量化部署
在线阅读 下载PDF
基于BiLSTM-CRF和Neo4j的脾胃病知识图谱构建
6
作者 谭平 刘惠娜 韦昌法 《科学技术与工程》 北大核心 2025年第22期9436-9444,共9页
为了推动中医药文本数据的分析和挖掘,实现知识的智能化提取和处理。通过采用BIO(begin,inside,outside)序列标记法、BiLSTM-CRF模型和人工定义规则的方法完成知识抽取任务。利用Python3.6中Py2neo库与Neo4j数据库等技术,构建了基于Neo4... 为了推动中医药文本数据的分析和挖掘,实现知识的智能化提取和处理。通过采用BIO(begin,inside,outside)序列标记法、BiLSTM-CRF模型和人工定义规则的方法完成知识抽取任务。利用Python3.6中Py2neo库与Neo4j数据库等技术,构建了基于Neo4j的脾胃病知识图谱,并使用Flask框架开发了中医药脾胃病命名实体识别系统。结果表明:模型(BiLSTM-CRF)在测试集上取得了高性能和良好的泛化能力,其准确率、精确率、查全率和F_(1)分数分别为96.19%、86.64%、88.82%和87.71%。构建出的知识图谱包含了方剂或中成药、中药、临床表现等8种节点标签以及10种关系类型,可支持中医药治疗脾胃病西医诊断、中医证候、中医治则等节点及各节点之间关系的查询与发现。可见BiLSTM-CRF模型在中医药脾胃病命名实体识别方面展现出了良好的通用性,它在处理复杂文本结构和领域术语上表现出了出色的能力,为中医药脾胃病知识提取和知识图谱构建研究提供了有力支持。 展开更多
关键词 中医药 脾胃病 BIO序列标记法 人工定义规则 bilstm-crf模型 知识图谱
在线阅读 下载PDF
基于BiLSTM-CRF的政府微博舆论观点抽取与焦点呈现 被引量:14
7
作者 胡吉明 郑翔 +1 位作者 程齐凯 张岩 《情报理论与实践》 CSSCI 北大核心 2021年第1期174-179,137,共7页
[目的/意义]准确把握公众微博评论中所反映的公众观点并总结舆论焦点,有助于及时获取和引导社会舆情态势,对政府公信力、快速响应能力及执行力提升具有支撑作用。[方法/过程]文章针对当前政府微博评论社会功能发挥的现实要求和其文本特... [目的/意义]准确把握公众微博评论中所反映的公众观点并总结舆论焦点,有助于及时获取和引导社会舆情态势,对政府公信力、快速响应能力及执行力提升具有支撑作用。[方法/过程]文章针对当前政府微博评论社会功能发挥的现实要求和其文本特征挖掘的技术需求,从基于深度学习的文本智能语义理解和挖掘出发,提出了适用的细粒度四元组标注策略,构建了政府微博评论观点抽取与焦点呈现的深度学习模型POF-BiLSTM-CRF,即通过细粒度标注策略确定、Word2vec训练词向量、BiLSTM评论特征学习进行标签及其概率输出、CRF学习上下文实现微博评论标注优化,以及观点聚类和主题词提取后最终呈现舆论焦点。[结果/结论]针对"中国警方在线"微博评论的实验表明,文章所提研究框架和模型能够有效进行舆论观点的智能化提取,为快速把握公众观点及为政府决策提供了参考。 展开更多
关键词 政府微博评论 舆论观点抽取 深度学习模型 bilstm-crf模型 POF-bilstm-crf模型
原文传递
结合GAN与BiLSTM-Attention-CRF的领域命名实体识别 被引量:35
8
作者 张晗 郭渊博 李涛 《计算机研究与发展》 EI CSCD 北大核心 2019年第9期1851-1858,共8页
领域内命名实体识别通常面临领域内标注数据缺乏以及由于实体名称多样性导致的同一文档中实体标注不一致等问题.针对以上问题,利用生成式对抗网络(generative adversarial network, GAN)可以生成数据的特点,将生成式对抗网络与BiLSTM-At... 领域内命名实体识别通常面临领域内标注数据缺乏以及由于实体名称多样性导致的同一文档中实体标注不一致等问题.针对以上问题,利用生成式对抗网络(generative adversarial network, GAN)可以生成数据的特点,将生成式对抗网络与BiLSTM-Attention-CRF模型相结合.首先以BiLSTM-Attention作为生成式对抗网络的生成器模型,以CNN作为判别器模型,从众包标注数据集中整合出与专家标注数据分布一致的正样本标注数据来解决领域内标注数据缺乏的问题;然后通过在BiLSTM-Attention-CRF模型中引入文档层面的全局向量,计算每个单词与该全局向量的关系得出其新的特征表示以解决由于实体名称多样化造成的同一文档中实体标注不一致问题;最后,在基于信息安全领域众包标注数据集上的实验结果表明,该模型在各项指标上显著优于同类其他模型方法. 展开更多
关键词 领域命名实体识别 生成式对抗网络 众包标注数据 实体标注一致 bilstm-Attention-crf模型
在线阅读 下载PDF
基于BiLSTM-CRF的中文生物医学开放式概念关系抽取 被引量:5
9
作者 王序文 李姣 +1 位作者 吴英杰 李军莲 《中华医学图书情报杂志》 CAS 2018年第11期33-39,共7页
目的:利用深度学习方法自动抽取中文生物医学文本中的开放式概念关系,以增强生物医学文本理解及医学知识网络构建。方法:使用BiLSTM-CRF模型从中文生物医学文献数据中抽取以句子上下文短语描述的开放式概念关系,并与基于条件随机场(Cond... 目的:利用深度学习方法自动抽取中文生物医学文本中的开放式概念关系,以增强生物医学文本理解及医学知识网络构建。方法:使用BiLSTM-CRF模型从中文生物医学文献数据中抽取以句子上下文短语描述的开放式概念关系,并与基于条件随机场(Conditional Random Fields,CRF)和基于长短时记忆网络(Long Short-Term Memory,LSTM)的方法进行对比分析。结果:基于BiLSTM-CRF的中文生物医学开放式概念关系抽取方法取得F1值为0.5221,显著高于基于CRF模型的方法(F1值为0.2353)和基于LSTM模型的方法(F1值为0.3355)。结论:与单独使用CRF模型或LSTM模型的方法相比,基于BiLSTM-CRF的开放式概念关系抽取方法具有更好的鲁棒性和泛化性,对于生物医学文本理解、医学知识网络构建等研究具有借鉴意义。 展开更多
关键词 开放式关系抽取 生物医学概念识别 bilstm-crf 条件随机场 长短时记忆网络
在线阅读 下载PDF
整合BiLSTM-CRF网络和词典资源的中文电子病历实体识别 被引量:35
10
作者 李纲 潘荣清 +1 位作者 毛进 操玉杰 《现代情报》 CSSCI 2020年第4期3-12,58,共11页
[目的/意义]通过整合BiLSTM-CRF神经网络和具有先验领域知识的词典资源,提高中文电子病历领域中的实体识别效果。[方法/过程]采用BiLSTM-CRF神经网络模型,以CCKS-2017测评任务提供的脱敏中文电子病历数据为实验数据集,结合Word2Vec和外... [目的/意义]通过整合BiLSTM-CRF神经网络和具有先验领域知识的词典资源,提高中文电子病历领域中的实体识别效果。[方法/过程]采用BiLSTM-CRF神经网络模型,以CCKS-2017测评任务提供的脱敏中文电子病历数据为实验数据集,结合Word2Vec和外部词典构造神经网络的词嵌入输入改进实体识别模型。[结果/结论]与传统的CRF和单纯的BiLSTM-CRF模型相比,引入先验知识的词典资源可以取得更好的实体识别效果,F1值达到最高的90.41%。深度学习模型BiLSTM-CRF能够显著提升传统CRF方法的实体识别效果,同时先验的词典知识能进一步增强神经网络的性能。 展开更多
关键词 实体识别 长短期记忆网络 条件随机场 电子病历 词典资源 深度学习 bilstm-crf神经网络模型
在线阅读 下载PDF
基于BiLSTM-CRF的社会突发事件研判方法 被引量:10
11
作者 胡慧君 王聪 +1 位作者 代建华 刘茂福 《中文信息学报》 CSCD 北大核心 2022年第3期154-161,共8页
社会突发事件的分类和等级研判作为应急处置中的一环,其重要性不言而喻。然而,目前研究多数采用人工或规则的方法识别证据进行研判,由于社会突发事件构成的复杂性和语言描述的灵活性,这对于研判证据识别有很大局限性。该文参考“事件抽... 社会突发事件的分类和等级研判作为应急处置中的一环,其重要性不言而喻。然而,目前研究多数采用人工或规则的方法识别证据进行研判,由于社会突发事件构成的复杂性和语言描述的灵活性,这对于研判证据识别有很大局限性。该文参考“事件抽取”思想,将事件类型和研判证据作为事件中元素,以BiLSTM-CRF方法进行细粒度的识别,并将二者结合,分类结果作为等级研判的输入,识别出研判证据。最终将识别结果结合注意力机制进行等级研判,通过对研判证据的精准识别来增强等级研判的准确性。实验表明,相比人工或规则识别研判证据,该文提出的方法有着更好的鲁棒性,社会突发事件研判时也达到了较好的效果。 展开更多
关键词 突发事件分类 研判证据识别 等级研判 bilstm-crf
在线阅读 下载PDF
基于BERT嵌入BiLSTM-CRF模型的中文专业术语抽取研究 被引量:67
12
作者 吴俊 程垚 +3 位作者 郝瀚 艾力亚尔·艾则孜 刘菲雪 苏亦坡 《情报学报》 CSSCI CSCD 北大核心 2020年第4期409-418,共10页
专业术语的识别与自动抽取对于提升专业信息检索精度,构建领域知识图谱发挥着重要基础性作用。为进一步提升中文专业术语识别的精确率和召回率,提出一种端到端的不依赖人工特征选择和领域知识,基于谷歌BERT预训练语言模型及中文预训练... 专业术语的识别与自动抽取对于提升专业信息检索精度,构建领域知识图谱发挥着重要基础性作用。为进一步提升中文专业术语识别的精确率和召回率,提出一种端到端的不依赖人工特征选择和领域知识,基于谷歌BERT预训练语言模型及中文预训练字嵌入向量,融合BiLSTM和CRF的中文专业术语抽取模型。以自建的1278条深度学习语料数据为实验对象,该模型对术语提取的F1值为92.96%,相对于传统的浅层机器学习模型(如左右熵与互信息算法、word2vec相似词算法等)和BiLSTM-CRF深度神经网络模型的性能有较为显著的提升。本文也给出了模型应用的具体流程,能够为中文专业术语库的构建提供实践指南。 展开更多
关键词 BERT bilstm crf 专业术语抽取
在线阅读 下载PDF
基于BiLSTM-CRF的中文分组单字错误识别方法研究 被引量:5
13
作者 曹阳 曹存根 +1 位作者 资康莉 王石 《中文信息学报》 CSCD 北大核心 2023年第4期156-165,共10页
近十多年来,中文自动校对取得了许多重要进展,但是单字错别字识别精度和召回率低一直是该领域的一个重要问题。该文提出一种基于BiLSTM-CRF的神经网络模型和单字分组策略识别中文错别字的方法。首先,该文提出一种构建分组单字混淆集的方... 近十多年来,中文自动校对取得了许多重要进展,但是单字错别字识别精度和召回率低一直是该领域的一个重要问题。该文提出一种基于BiLSTM-CRF的神经网络模型和单字分组策略识别中文错别字的方法。首先,该文提出一种构建分组单字混淆集的方法,并根据采集的分组单字混淆集自动生成错别字识别训练语料,构造了一个含有13组的汉字单字错别字识别训练语料。其次,针对传统的错别字识别方法在单字错别字召回率较低的问题,该文对错别字识别训练语料中错别字采用多标签标记的策略。再次,针对训练样本存在的数据稀疏问题,该文对训练数据集中的人名、地名、时间和机构名称这四类词语进行抽象。最后,该文利用BiLSTM-CRF的模型在错别字识别训练语料上进行训练。实验结果表明,该文提出的单字错别字识别方法在13组单字上的平均识别精确率为87.30%,平均召回率为84.36%。 展开更多
关键词 bilstm-crf 分组策略 分组单字混淆集 错别字识别训练语料
在线阅读 下载PDF
基于BiLSTM-CRF与分类分层标注的微博中突发事件时空信息精细识别方法 被引量:12
14
作者 吴建华 胡烈云 +2 位作者 赵宇 戴鹏 熊嘉奇 《地理与地理信息科学》 CSCD 北大核心 2021年第3期1-8,共8页
针对现有方法从微博中识别时空信息精度较低且相对粗略的问题,该文提出基于双向长短期记忆网络和条件随机场(BiLSTM-CRF)与分类分层标注的微博中突发事件时空信息精细识别方法(MFISIE)。首先,设计一套适用于微博中突发事件的分类分层时... 针对现有方法从微博中识别时空信息精度较低且相对粗略的问题,该文提出基于双向长短期记忆网络和条件随机场(BiLSTM-CRF)与分类分层标注的微博中突发事件时空信息精细识别方法(MFISIE)。首先,设计一套适用于微博中突发事件的分类分层时空信息标注体系(CHSIAS),构建微博语料库;然后,结合BiLSTM-CRF构建微博时空信息识别模型,并利用117567条标注的微博语料进行实验。结果表明:与人民日报语料标注体系相比,CHSIAS与CRF、BiLSTM、BiLSTM-CRF 3种方法结合进行时空信息识别,F值均较高,且可获得多层级、精细化的突发事件时空信息,其中,基于BiLSTM-CRF的MFISIE方法的F值(91.2%)最高。使用CHSIAS时,BiLSTM-CRF对时间信息的识别效果最好,其对兴趣点、建筑物和相对位置描述识别结果的F值比BiLSTM方法分别提升了8.8%、6.3%和12.3%,比CRF方法分别提升了7.1%、7.7%和8.9%。MFISIE可更精确地提取微博中突发事件的时空信息,为突发事件应急信息的快速感知与精准应用提供技术支撑。 展开更多
关键词 命名实体识别 bilstm-crf 社交媒体 文本信息抽取 突发事件
在线阅读 下载PDF
基于BiLSTM-CRF的MOOC课程评论抽取研究 被引量:4
15
作者 张文德 李学超 何珑 《电子设计工程》 2021年第2期34-37,42,共5页
文中主要研究从MOOC课程评论中抽取评价对象和评价词的方法。将MOOC课程评论评价对象和评价词的抽取问题看作序列标注问题,利用BiLSTM模型获取MOOC课程评论中评价对象和评价词的上下文信息,利用CRF模型获取MOOC课程评论中评价对象和评... 文中主要研究从MOOC课程评论中抽取评价对象和评价词的方法。将MOOC课程评论评价对象和评价词的抽取问题看作序列标注问题,利用BiLSTM模型获取MOOC课程评论中评价对象和评价词的上下文信息,利用CRF模型获取MOOC课程评论中评价对象和评价词的整体信息,从而标注出MOOC课程评论中评价对象和评价词。提出的MOOC课程评论评价对象和评价词抽取方法的准确率为82.62%,召回率为84.10%,F1值为83.35%。实验结果表明,文中提出的BiLSTMCRF模型可以有效地从MOOC课程评论中抽取评价对象和评价词。 展开更多
关键词 bilstm-crf MOOC 课程评论 评价对象 评价词
在线阅读 下载PDF
基于SVM-BiLSTM-CRF模型的财产纠纷命名实体识别方法 被引量:15
16
作者 周晓磊 赵薛蛟 +3 位作者 刘堂亮 宗子潇 王其乐 里剑桥 《计算机系统应用》 2019年第1期245-250,共6页
裁判文书中的命名实体识别是自动化审判的关键一步,如何能够有效的分辨出案件的关键命名实体是本文的研究重点.因此本文针对财产纠纷审判案件,提出了一种基于SVM-BiLSTM-CRF的神经网络模型.首先利用SVM筛选出包含关键命名实体的句子,然... 裁判文书中的命名实体识别是自动化审判的关键一步,如何能够有效的分辨出案件的关键命名实体是本文的研究重点.因此本文针对财产纠纷审判案件,提出了一种基于SVM-BiLSTM-CRF的神经网络模型.首先利用SVM筛选出包含关键命名实体的句子,然后将正确包含此类实体的句子转化为字符级向量作为输入,构建适合财产纠纷裁判文书命名实体识别的BiLSTM-CRF深层神经网络模型.通过构建训练数据进行验证和对比,该模型比其他相关模型表现出更高的召回率和准确率. 展开更多
关键词 命名实体识别 SVM bilstm crf
在线阅读 下载PDF
基于BiLSTM-CRF的航行通告命名实体识别研究 被引量:5
17
作者 项恒 杨明友 李猛 《计算机科学》 CSCD 北大核心 2024年第S02期115-120,共6页
针对当前国际民航组织对数字航行通告研究仅考虑对文本航行通告环境兼容,而未考虑对数字航行通告环境兼容的问题,提出一种基于BiLSTM-CRF的航行通告命名实体识别模型,以实现文本航行通告中相关实体的自动识别,并为转换数字航行通告提供... 针对当前国际民航组织对数字航行通告研究仅考虑对文本航行通告环境兼容,而未考虑对数字航行通告环境兼容的问题,提出一种基于BiLSTM-CRF的航行通告命名实体识别模型,以实现文本航行通告中相关实体的自动识别,并为转换数字航行通告提供所需的基本数据。通过构建航行通告语料标记数据集对LSTM,BiLSTM,BiLSTM-CRF 3种模型进行对比实验。实验结果显示,所提模型的精确率、召回率、F 1值分别为95%,95%,95%,验证了其在航行通告领域的有效性,证明本研究可以有效识别航行通告中的重要实体信息。 展开更多
关键词 航行通告 命名实体识别 深度学习 双向长短期记忆网路 条件随机场
在线阅读 下载PDF
基于RoBERTa_BiLSTM_CRF的文本情报命名实体识别 被引量:3
18
作者 陆泽健 赵文 尹港港 《中国电子科学研究院学报》 2024年第5期442-447,共6页
随着网络信息的爆炸式增长,威胁情报分析作为军事情报分析与战略决策的重要组成部分,其面临着来源多样化和信息结构复杂化的挑战。传统的人工信息提取方法在处理这些大量结构化及非结构化信息时效率低下,准确性有限。文中针对这一挑战,... 随着网络信息的爆炸式增长,威胁情报分析作为军事情报分析与战略决策的重要组成部分,其面临着来源多样化和信息结构复杂化的挑战。传统的人工信息提取方法在处理这些大量结构化及非结构化信息时效率低下,准确性有限。文中针对这一挑战,提出了一种结合RoBERTa、BiLSTM和条件随机场(Conditional Random Fields,CRF)的命名实体识别新算法。此算法通过Ro-BERTa模型深入挖掘文本的语义特征,BiLSTM模型捕捉序列上下文信息,CRF层用于精确的实体标记,从而有效提升信息提取的准确率和效率。本文基于开源情报语料库构建了一个涉及导弹发射事件的命名实体识别数据集,并在此基础上进行了实验,结果表明,该方法在精确率、召回率及F1值等关键指标上相较于主流深度学习方法表现出显著的性能提升,其中F1值高达94.21%。 展开更多
关键词 威胁情报分析 命名实体识别 RoBERTa bilstm crf
在线阅读 下载PDF
基于ELMO-CNN-BiLSTM-CRF模型的地质实体识别 被引量:30
19
作者 储德平 万波 +2 位作者 李红 方芳 王润 《地球科学》 EI CAS CSCD 北大核心 2021年第8期3039-3048,共10页
地质实体是地质文本中的关键和核心信息,对其准确识别是地质信息提取和挖掘的重要前提.设计了ELMO-CNNBiLSTM-CRF模型,基于预训练字向量构建深层Bi LSTM-CRF神经网络模型,通过添加词语动态特征以及词语字符级别的特征,弥补字向量特异性... 地质实体是地质文本中的关键和核心信息,对其准确识别是地质信息提取和挖掘的重要前提.设计了ELMO-CNNBiLSTM-CRF模型,基于预训练字向量构建深层Bi LSTM-CRF神经网络模型,通过添加词语动态特征以及词语字符级别的特征,弥补字向量特异性缺失的问题,提高对于地质文本中复杂多词义的识别水平和对地质实体局部特征的提取能力.以《西藏自治区谢通门县雄村铜矿勘探地质报告》为例,对该模型的性能进行了评估,模型的准确率、召回率和F1值分别为95.15%、95.26%和95.21%.实验表明相比Bi LSTM-CRF和CNN-BiLSTM-CRF模型,该模型在小规模语料地质实体识别方面效果更优,且能够有效识别长地质实体词汇和地质多义词. 展开更多
关键词 地质大数据 地质实体 命名实体识别 ELMO-CNN-bilstm-crf 地质文本 数学地质
原文传递
结合自注意力的BiLSTM-CRF的电子病历命名实体识别 被引量:27
20
作者 曾青霞 熊旺平 +2 位作者 杜建强 聂斌 郭荣传 《计算机应用与软件》 北大核心 2021年第3期159-162,242,共5页
为弥补现有方法不能很好捕获电子病历实体之间的长距离依赖关系的缺陷,提出一种结合自注意力的BiLSTM-CRF的命名实体识别方法。将输入文本转成神经网络可识别的数值形式;经过BiLSTM网络并结合自注意力计算得到每个字的输出特征向量;通过... 为弥补现有方法不能很好捕获电子病历实体之间的长距离依赖关系的缺陷,提出一种结合自注意力的BiLSTM-CRF的命名实体识别方法。将输入文本转成神经网络可识别的数值形式;经过BiLSTM网络并结合自注意力计算得到每个字的输出特征向量;通过CRF层找到句子最适合的输出标签序列,从而确定命名实体。采用CCKS2018数据集进行实验,结果表明,改进的命名实体识别方法对电子病历具有一定的适应性,且与现有的方法相比,测试集的准确率提高了6.50~9.25个百分点。 展开更多
关键词 电子病历 命名实体识别 自注意力 bilstm-crf
在线阅读 下载PDF
上一页 1 2 12 下一页 到第
使用帮助 返回顶部