期刊文献+
共找到110篇文章
< 1 2 6 >
每页显示 20 50 100
基于BERT-CRF模型的火灾事故案例实体识别研究 被引量:5
1
作者 关斯琪 董婷婷 +1 位作者 万子敬 何元生 《消防科学与技术》 CAS 北大核心 2023年第11期1529-1534,共6页
为实现火灾事故调查档案的关键信息抽取,提出一种基于BERT-CRF模型的文本命名实体识别方法。通过对161篇事故报告进行实体标注及数据增强,构建了火灾事故文本语料集;基于BERT预训练模型,对语料集中的句子序列进行双向特征提取,深度挖掘... 为实现火灾事故调查档案的关键信息抽取,提出一种基于BERT-CRF模型的文本命名实体识别方法。通过对161篇事故报告进行实体标注及数据增强,构建了火灾事故文本语料集;基于BERT预训练模型,对语料集中的句子序列进行双向特征提取,深度挖掘事故文本上下文的语义信息;结合CRF模型,充分考虑标签转移规则,对关键实体进行预测。试验表明:本文方法在火灾事故案例实体识别任务中的精确率、召回率以及F1值分别为76.36%、86.19%、80.97%,优于BERT和BERT-BiLSTM-CRF模型,且训练时长较BERT-BiLSTMCRF模型缩短61 s。本文方法可为火灾调查知识库、案卷编制等下游系统提供准确的实体构建服务。 展开更多
关键词 命名实体识别 bert-crf 火灾事故 消防信息 火灾事故调查档案 语料集 火灾事故文本
在线阅读 下载PDF
基于BERT-CRF与对抗训练的水利领域命名实体识别 被引量:4
2
作者 顾乾晖 徐力晨 +1 位作者 涂振宇 黄逸翠 《南昌工程学院学报》 CAS 2022年第3期29-34,共6页
在水利领域中,传统的命名实体识别方法存在有效性差、精度不高、无法解决一词多义和缺乏水利领域语料等问题。基于此,利用BERT语言模型对自建水利文本语料进行训练,并引入FreeLB对抗训练模型增强模型的泛化能力,最后通过条件随机场(CRF... 在水利领域中,传统的命名实体识别方法存在有效性差、精度不高、无法解决一词多义和缺乏水利领域语料等问题。基于此,利用BERT语言模型对自建水利文本语料进行训练,并引入FreeLB对抗训练模型增强模型的泛化能力,最后通过条件随机场(CRF)来得到水利实体识别方法。实验结果表明,相对于其他模型,本文提出的FreeLB-BERT-CRF模型对水利领域文本实体识别效果更好。 展开更多
关键词 命名实体识别 BERT CRF 对抗训练 水利信息化
在线阅读 下载PDF
煤炭开采利用碳排放治理技术知识图谱构建与应用 被引量:2
3
作者 汪莹 王丽雅 +2 位作者 马飞 杨洋 祖子帅 《煤炭科学技术》 北大核心 2025年第6期505-521,共17页
煤炭是能源消费降碳的主力军,煤炭开发利用过程中产生的碳排放占全国碳排放总量的60%~70%,是我国完成碳减排任务的关键所在。煤炭开采利用碳排放治理技术知识图谱构建与应用聚焦煤炭开采利用碳排放治理技术,系统梳理出相关治理技术知识... 煤炭是能源消费降碳的主力军,煤炭开发利用过程中产生的碳排放占全国碳排放总量的60%~70%,是我国完成碳减排任务的关键所在。煤炭开采利用碳排放治理技术知识图谱构建与应用聚焦煤炭开采利用碳排放治理技术,系统梳理出相关治理技术知识,在此基础上构建知识图谱,挖掘出不同技术间的内在联系、适用条件、实施效果及减排路径,为相关人员获取碳排放治理技术领域前沿知识提供支撑,推动煤炭行业向绿色低碳方向转型。一是广泛收集煤炭减排技术相关的专业书籍、术语字典、权威研究报告、中国知网核心期刊文献以及各类标准规范等,采用自底向上和自顶向下的混合构建法构建煤炭开采利用碳排放治理技术领域概念知识模型;二是运用BIO标注策略,并应用BERT+CRF(Bidirectional Encoder Representations from Transformers&Conditional Random Fields)模型,识别该领域实体;三是在实体识别基础上,应用BiLSTM-Attention模型进一步挖掘实体间关系,实现关系抽取;四是采用实体消歧和共指消解技术进行知识融合,消除数据中的矛盾与冗余信息;五是通过Neo4j图数据库存储实体与关系,基于上述结构化的方法与模型,由此完成煤炭开采利用碳排放治理技术领域知识图谱的构建。构建了涵盖排放特征、开采方式、利用方式和减碳技术四大类的煤炭开采利用碳排放治理技术领域知识概念模型,又将这四大类知识概念细分为12个子类,30个细类,形成了完整的概念分类体系。定义了10类命名实体及6种关系,基于提出的知识图谱构建组合方法与创新模型,抽取出12631个节点与32209个实体间关系,揭示了碳排放技术与排放特征、开采方式、利用方式之间的复杂关联,并根据已构建的煤炭开采利用碳排放治理技术领域的知识图谱,支持矿山企业选取相适配的减碳技术路径。随着煤炭行业低碳发展的场景拓展、数据的积累以及人工智能和大模型的发展,本研究将在多模态数据融合的基础上,优化图谱的构建方法,拓展图谱的应用范围,提高技术路径推荐的精准度。 展开更多
关键词 煤炭开采与利用 碳排放治理技术 命名实体识别 BERT+CRF 实体关系抽取 BiLSTM-Attention
在线阅读 下载PDF
动态视域下融合深度学习与专利地图的新兴技术识别研究 被引量:1
4
作者 李尽法 许灿 +1 位作者 张珂 周炜 《情报理论与实践》 北大核心 2025年第7期160-169,共10页
[目的/意义]准确识别和理解新兴技术,对于制定企业战略决策、建设国家创新高地具有重要意义。[方法/过程]基于动态视角,融合深度学习与专利地图,开展了新兴技术识别研究。首先,提出融合BERT-BiLSTM-CRF深度学习模型与BIO标注的实体识别... [目的/意义]准确识别和理解新兴技术,对于制定企业战略决策、建设国家创新高地具有重要意义。[方法/过程]基于动态视角,融合深度学习与专利地图,开展了新兴技术识别研究。首先,提出融合BERT-BiLSTM-CRF深度学习模型与BIO标注的实体识别模型,以获取细粒度表征语义关系的实体内容,并结合TF-IDF算法提取了技术要素;其次,划分时间窗口,运用GTM算法构建专利地图,依据新兴技术的持续性特征分析非空白专利点,动态遴选潜在新兴技术主题,进而基于GTM逆映射获取技术要素;最后,依据新兴技术的多维特征构建指标体系并评估潜在主题,实现新兴技术识别。文章以可穿戴医疗设备领域为例开展实例分析,验证了所提方法的可行性与有效性。[结果/结论]所提路径通过考虑技术要素间语义联系并动态剖析技术的发展趋势,实现了新兴技术的有效识别。[局限]仅依托专利数据展开研究存在局限性,也有待进一步深化与其他方法的对比分析。 展开更多
关键词 新兴技术 动态视域 BERT-BiLSTM-CRF 实体识别 GTM
原文传递
通航飞机维修文本故障数据的分词方法研究
5
作者 付尧明 陈余杰 +1 位作者 侯宽新 蒋正 《计算机仿真》 2025年第1期30-35,125,共7页
中文分词是对维修文本数据处理的基础任务,面对专业领域语料往往比通用领域涵盖更多的未登录词,例如通航领域语料包含大量口语化或人工合成的结构名、部件名、故障名、工具名等未登录词,是造成分词准确率低的最主要原因。针对以上问题,... 中文分词是对维修文本数据处理的基础任务,面对专业领域语料往往比通用领域涵盖更多的未登录词,例如通航领域语料包含大量口语化或人工合成的结构名、部件名、故障名、工具名等未登录词,是造成分词准确率低的最主要原因。针对以上问题,面向通航领域提出一种基于BERT-BiLSTM-CRF的中文分词模型,首先利用BERT(Bidirectional Encoder Representation from Transformers)预训练模型来获取输入文本的语义特征,其次结合双向长短记忆神经网络学习上下文特征信息,最后通过条件随机场算法(CRF:Conditional RandomField)预测最优序列,提高分词准确性。利用收集通航领域维修文本数据,经过数据处理与文本标注,构建通航领域维修文本数据语料库,并基于此展开对比实验。相较于传统的BiLSTM、BiLSTM-CRF等模型,所提方法得到的综合指标F1值为96.93%,与BiLSTM-CRF相对比提升1.41%。验证了所提方法对通航领域维修文本数据进行分词的有效性。 展开更多
关键词 通用航空 维修数据 中文分词 深度学习
在线阅读 下载PDF
基于Sentence-BERT与孤立森林算法的专利新颖性评估
6
作者 邓娜 王雨佳 +1 位作者 杨洋 陈旭 《情报杂志》 北大核心 2025年第2期174-182,共9页
[研究目的]面对专利数量的迅猛增长,采用人工方法评估专利新颖性变得愈发困难,且目前专利新颖性评估研究过度聚焦于技术层面,未能综合考虑专利的其他信息因素。因此,实现更高效、客观的专利新颖性评估具有重要的现实意义。[研究方法]提... [研究目的]面对专利数量的迅猛增长,采用人工方法评估专利新颖性变得愈发困难,且目前专利新颖性评估研究过度聚焦于技术层面,未能综合考虑专利的其他信息因素。因此,实现更高效、客观的专利新颖性评估具有重要的现实意义。[研究方法]提出一种基于Sentence-BERT与孤立森林算法的专利新颖性评估方法。首先,使用专利标题与IPC分类号分别作为专利的应用方向与功能分类特征,再通过BiLSTM-CRF模型对专利摘要进行关键技术抽取作为实施方法特征;其次,采用Sentence-BERT对上述特征进行文本向量化表示后组合输入至孤立森林算法获得离群专利集;最后,通过技术量权值过滤法提高专利新颖性评估的精度。[研究结果/结论]以金融科技领域专利进行实证研究,结果表明,该评估方法准确率相较专业专利分析平台方法提升了9%~11%。证明了该方法在专利新颖性评估中的有效性,能为后续专利审核工作和高价值专利分析提供参考。 展开更多
关键词 专利评估 专利新颖性 BiLSTM-CRF Sentence-BERT 孤立森林算法 机器学习
在线阅读 下载PDF
基于Bert-BiLSTM-CRF监察问题实体识别研究
7
作者 付茂洺 李娟 张兵 《舰船电子工程》 2025年第6期106-109,148,共5页
针对于监察过程中产生的数据存在的文本长、命名实体多、实体难以识别的问题,提出了基于Bert-BiLSTM-CRF的民航监察问题命名实体识别方法。以Bert为底层预训练模型,结合BiLSTM循环神经网络对文本实体的标签进行预测,使用CRF模型对识别... 针对于监察过程中产生的数据存在的文本长、命名实体多、实体难以识别的问题,提出了基于Bert-BiLSTM-CRF的民航监察问题命名实体识别方法。以Bert为底层预训练模型,结合BiLSTM循环神经网络对文本实体的标签进行预测,使用CRF模型对识别的结果进行约束。实验结果表明,该方法能有效获取监察问题中的重要实体信息,采用Bert-BiLSTM-CRF模型在原有的BiLSTM-CRF模型基础上识别精度提升了4.06%。 展开更多
关键词 民航监察 命名实体识别 Bert-BiLSTM-CRF 预训练
在线阅读 下载PDF
基于BERT-Tiny Transformer-CRF的自动化装配命名实体识别方法
8
作者 钱冠翔 于丽娅 +2 位作者 李传江 李少波 徐兆 《计算机集成制造系统》 北大核心 2025年第10期3594-3606,共13页
随着工业5.0对知识驱动的智能制造提出新要求,机械装配领域面临多模态数据稀疏、实体语义边界模糊、数据分布呈现长尾效应的挑战。为此,提出一种融合多项式损失函数的BERT-Tiny Transformer-CRF模型,旨在提升低资源场景下的领域知识抽... 随着工业5.0对知识驱动的智能制造提出新要求,机械装配领域面临多模态数据稀疏、实体语义边界模糊、数据分布呈现长尾效应的挑战。为此,提出一种融合多项式损失函数的BERT-Tiny Transformer-CRF模型,旨在提升低资源场景下的领域知识抽取效率。首先,通过知识蒸馏与语义增强技术注入领域先验知识,其次设计维度自适应特征压缩模块实现跨模态特征融合,最后构建动态边缘感知解码机制实现实体边界的精准定位。利用自主构建的自动化装配数据集,将所提方法与不同实体识别模型进行对比,实验结果表明,所提模型具有良好的泛化识别能力,以86.62%的准确率、85.27%的精确率、85.67%的召回率和85.46%的F1值优于其他模型,为工业5.0下机械自动化装配领域知识图谱的构建提供了一种有效的技术方法。 展开更多
关键词 BERT-Tiny Transformer-CRF模型 数据增强 PolyLoss 自动化装配
在线阅读 下载PDF
基于Bert-BiLSTM-CRF模型的中文命名实体识别 被引量:1
9
作者 龙星全 李佳 《吉林大学学报(信息科学版)》 2025年第2期384-393,共10页
针对现有的中文命名实体识别算法没有充分考虑实体识别任务的数据特征,存在中文样本数据的类别不平衡、训练数据中的噪声太大和每次模型生成数据的分布差异较大的问题,提出了一种以BERT-BiLSTM-CRF(Bidirectional Encoder Representatio... 针对现有的中文命名实体识别算法没有充分考虑实体识别任务的数据特征,存在中文样本数据的类别不平衡、训练数据中的噪声太大和每次模型生成数据的分布差异较大的问题,提出了一种以BERT-BiLSTM-CRF(Bidirectional Encoder Representations from Transformers-Bidirectional Long Short-Term Memory-Conditional Random Field)为基线改进的中文命名实体识别模型。首先在BERT-BiLSTM-CRF模型上结合P-Tuning v2技术,精确提取数据特征,然后使用3个损失函数包括聚焦损失(Focal Loss)、标签平滑(Label Smoothing)和KL Loss(Kullback-Leibler divergence loss)作为正则项参与损失计算。实验结果表明,改进的模型在Weibo、Resume和MSRA(Microsoft Research Asia)数据集上的F 1得分分别为71.13%、96.31%、95.90%,验证了所提算法具有更好的性能,并且在不同的下游任务中,所提算法易于与其他的神经网络结合与扩展。 展开更多
关键词 中文命名实体识别 BERT-BiLSTM-CRF模型 P-Tuning v2技术 损失函数
在线阅读 下载PDF
基于多头注意力机制的学科知识命名实体识别研究 被引量:2
10
作者 孙悦 熊旭辉 刘家琳 《科学技术创新》 2025年第5期109-113,共5页
在构建学科知识图谱过程中,常规命名实体识别技术面临实体界定模糊和知识粒度大等问题,影响识别精度与效率。为此,本研究提出基于BERT-BiLSTM-CRF的模型,引入多头注意力机制,以增强模型对序列数据的整体把握力,提高识别精度。该模型结合... 在构建学科知识图谱过程中,常规命名实体识别技术面临实体界定模糊和知识粒度大等问题,影响识别精度与效率。为此,本研究提出基于BERT-BiLSTM-CRF的模型,引入多头注意力机制,以增强模型对序列数据的整体把握力,提高识别精度。该模型结合了BERT的深层语义解析、BiLSTM的序列模式捕捉和CRF的标签预测优势,与BILSTM-CRF、BERT-CRF及BERT-BiLSTM-CRF模型进行性能对比。实验结果显示,本文模型在精确率、召回率及F1值均表现最佳。 展开更多
关键词 命名实体识别 BERT-BiLSTM-CRF模型 多头注意力机制
在线阅读 下载PDF
南美白对虾养殖领域中文命名实体识别数据集构建
11
作者 彭小红 邓峰 余应淮 《计算机工程与应用》 北大核心 2025年第9期353-362,共10页
该研究致力于构建一个高质量的数据集,用于南美白对虾养殖领域的命名实体识别(named entity recognition,NER)任务,命名为VamNER。为确保数据集的多样性,从CNKI数据库中收集了近10年的高质量论文,并结合权威书籍进行语料构建。邀请专家... 该研究致力于构建一个高质量的数据集,用于南美白对虾养殖领域的命名实体识别(named entity recognition,NER)任务,命名为VamNER。为确保数据集的多样性,从CNKI数据库中收集了近10年的高质量论文,并结合权威书籍进行语料构建。邀请专家讨论实体类型,并经过专业培训的标注人员使用IOB2标注格式进行标注,标注过程分为预标注和正式标注两个阶段以提高效率。在预标注阶段,标注者间一致性(inter-annotation agreement,IAA)达到0.87,表明标注人员的一致性较高。最终,VamNER包含6115个句子,总字符数达384602,涵盖10个实体类型,共有12814个实体。研究通过与多个通用领域数据集和一个特定领域数据集进行比较,揭示了VamNER的独特特性。在实验中使用了预训练的基于变换器的双向编码器表示(bidirectional encoder representations from Transformers,BERT)模型、双向长短期记忆神经网络(bidirectional long short-term memory network,BiLSTM)和条件随机场模型(conditional random fields,CRF),最优模型在测试集上的F1值达到82.8%。VamNER成为首个专注于南美白对虾养殖领域的NER数据集,为中文特定领域NER研究提供了丰富资源,有望推动水产养殖领域NER研究的发展。 展开更多
关键词 命名实体识别 VamNER数据集 标注者间一致性(IAA) 基于变换器的双向编码器表示(BERT) 双向长短期记忆神经网络(BiLSTM) 条件随机场(CRF)
在线阅读 下载PDF
融合自注意力的Bert-BiGRU-CRF的文本因果关系抽取
12
作者 高宁波 张晓滨 《计算机与现代化》 2025年第7期112-118,共7页
针对自然语言文本因果关系抽取中存在的标记方案无法处理重叠关系以及长距离依赖性的问题,本文引入tag2triplet算法来处理同一句子中的多个因果三元组和嵌入式因果关系的因果三元组,并将因果性标记方案与深度学习架构相结合用以最小化... 针对自然语言文本因果关系抽取中存在的标记方案无法处理重叠关系以及长距离依赖性的问题,本文引入tag2triplet算法来处理同一句子中的多个因果三元组和嵌入式因果关系的因果三元组,并将因果性标记方案与深度学习架构相结合用以最小化特征工程,同时有效地对因果关系建模。此外,本文将自注意力机制融合到Bert-BiGRU-CRF模型中以学习因果关系之间的长距离依赖性,允许信息在网络中自由流动,从而更准确地提取因果关系。为了验证该方法的有效性,将模型与目前广泛使用的BiLSTM-softmax模型、BiLSTM-CRF模型和Flair+CLSTM-BiLSTM-CRF模型在SemEval 2010 task8数据集上进行对比实验,结果表明,本文模型的F1评价指标分数更高,达到了83.44%。 展开更多
关键词 因果关系抽取 tag2triplet算法 Bert-BiGRU-CRF 自注意力
在线阅读 下载PDF
铁路客站安全风险事件知识图谱构建及应用 被引量:1
13
作者 白伟 王小书 +1 位作者 张煜山 杨国元 《铁路计算机应用》 2025年第3期1-6,共6页
铁路客运车站(简称:客站)安全风险事件数据多以文本形式进行存储,难以高效、快速查询。为充分发挥数据价值,文章研究了铁路客站安全风险事件领域知识图谱的构建及应用。提出了适用于铁路客站安全风险事件管理的知识图谱构建框架;研究了... 铁路客运车站(简称:客站)安全风险事件数据多以文本形式进行存储,难以高效、快速查询。为充分发挥数据价值,文章研究了铁路客站安全风险事件领域知识图谱的构建及应用。提出了适用于铁路客站安全风险事件管理的知识图谱构建框架;研究了基于BERT-BiLSTM-CRF模型的知识抽取方法,并以某客站安全风险事件数据为基础进行数据层构建,试验表明该模型效果优于其他主流识别技术;构建了面向铁路客站安全风险事件知识图谱,并通过Neo4j实现图数据的结构化存储和展示;设计了基于该知识图谱的安全风险事件智能问答系统,该系统能够针对用户所提问题,提供满足真实场景与需求的高效、智能化应答,有效提高铁路客站安全风险事件的检索效率。 展开更多
关键词 安全风险事件 知识图谱 BERT-BiLSTM-CRF Neo4j 智能问答
在线阅读 下载PDF
小样本语义分析的漏洞实体抽取方法
14
作者 丁全 张磊 +2 位作者 黄帅 查正朋 陶陶 《信息安全研究》 北大核心 2025年第3期265-274,共10页
目前不同信息安全漏洞库标准各异,漏洞数据侧重点不同,关系相对独立,难以快速全面地获取高价值漏洞信息,需建立统一的漏洞实体标准,因此重点对漏洞数据中的实体抽取技术进行研究.大部分漏洞数据以非结构化中英文混合的自然语言形式呈现... 目前不同信息安全漏洞库标准各异,漏洞数据侧重点不同,关系相对独立,难以快速全面地获取高价值漏洞信息,需建立统一的漏洞实体标准,因此重点对漏洞数据中的实体抽取技术进行研究.大部分漏洞数据以非结构化中英文混合的自然语言形式呈现,基于规则的方法泛化性不强,基于人工智能的方法占用资源过高且依赖大量标注数据,为解决以上问题,提出一种小样本语义分析的漏洞实体抽取方法.该方法使用BERT(bidirectional encoder representations from transformers)预训练漏洞描述数据得到漏洞领域内的预训练模型,以更好地理解漏洞数据,减少对大量标注数据的依赖,此外,采用增量学习的自监督方式提高标注数据非常有限(1785个标注样本).所提模型抽取了漏洞领域中12类漏洞实体,实验结果表明,所提方法在漏洞实体抽取的效果上优于其他抽取模型,F1值达到0.8643,整体的识别性能较高,实现了对漏洞实体的精确抽取. 展开更多
关键词 小样本 语义分析 漏洞实体抽取 BERT CRF
在线阅读 下载PDF
基于命名实体识别模型的配网客户诉求知识图谱构建方法
15
作者 范李平 杜丰夷 +4 位作者 黄宇 刘云飞 漆曾 陈国芳 马辉 《电力学报》 2025年第4期275-282,共8页
针对电网积累的海量工单数据未被深度挖掘、人工分析效率低等问题,本文提出一种基于命名实体识别模型的配网客户诉求知识图谱构建方法。该方法通过融合基于Transformer的双向编码器表征(bidirectional encoder representation from tran... 针对电网积累的海量工单数据未被深度挖掘、人工分析效率低等问题,本文提出一种基于命名实体识别模型的配网客户诉求知识图谱构建方法。该方法通过融合基于Transformer的双向编码器表征(bidirectional encoder representation from transformers,BERT)预训练语言模型、双向长短期记忆(bidirectional long short-term memory,BiLSTM)语义提取层和条件随机场(conditional random field,CRF)解码层构建实体识别模型,显著提升了配网工单文本中“客户”“故障设备”“反馈类型”等关键实体的识别准确率(F1值达84.21%);利用Neo4j图数据库对抽取的实体关系进行知识融合与存储,实现了客户诉求、设备信息、处理状态等多维度数据的可视化关联分析。经某供电公司8 764份工单数据验证,该方法能有效推动配网供电服务指挥系统转型升级,提升诉求处理效率和业务管控能力,为供电服务质量优化提供数字化决策支持。 展开更多
关键词 配电网 客户诉求 知识图谱 命名实体识别 BERT-BiLSTM-CRF模型 Neo4j图数据库 实体关系抽取 电力工单处理 可视化分析
在线阅读 下载PDF
基于BERT和BiGRU的数字产业岗位实体识别与人才画像
16
作者 杨彦武 翟盼雨 金颖 《武汉大学学报(理学版)》 北大核心 2025年第5期667-679,共13页
构建了一个面向数字产业的实体识别与人才画像(BERT-BiGRU-Attention-CRF)模型。该模型融合了BERT和BiGRU两种表征学习方法,根据句子的上下文语义进行文本表达,并采用多头注意力加强关键语义信息,然后利用条件随机场(CRF)方法对文本进... 构建了一个面向数字产业的实体识别与人才画像(BERT-BiGRU-Attention-CRF)模型。该模型融合了BERT和BiGRU两种表征学习方法,根据句子的上下文语义进行文本表达,并采用多头注意力加强关键语义信息,然后利用条件随机场(CRF)方法对文本进行分类,识别岗位的人才需求。抓取国内三大主流网站上数字产业相关岗位的最新招聘信息进行分析,结果表明,BERT-BiGRU-Attention-CRF模型在Precision、Recall和F1指标上的表现均显著优于基线模型。根据岗位与需求之间的关系,采用BERT-BiGRU-Attention-CRF模型构建数字产业人才知识图谱与岗位人才画像,通过分析数字产业人才知识图谱中各岗位所连接的节点得到不同岗位对人才需求的共同与差异之处。 展开更多
关键词 数字产业 实体识别 人才画像 BERT-BiGRU-Attention-CRF 数字人才
原文传递
基于BERT-BiGRU-CRF的农业病虫害命名实体识别模型研究
17
作者 杨宁 潘娇 +2 位作者 梁姣 冉涛 冷震北 《现代信息科技》 2025年第22期7-11,共5页
农业病虫害信息的准确提取对农业生产具有重要意义。命名实体识别作为一项关键技术,有助于从海量农业文本中精准获取相关信息。针对传统方法在农业病虫害信息提取中依赖人工词典、特征提取能力不足等问题,文章提出一种基于BERT-BiGRU-CR... 农业病虫害信息的准确提取对农业生产具有重要意义。命名实体识别作为一项关键技术,有助于从海量农业文本中精准获取相关信息。针对传统方法在农业病虫害信息提取中依赖人工词典、特征提取能力不足等问题,文章提出一种基于BERT-BiGRU-CRF的农业病虫害命名实体识别模型。该模型首先利用BERT预训练模型生成高质量的上下文语义向量表示;继而通过BiGRU进一步捕获上下文长距离依赖关系,全面提取序列特征;最后借助CRF选择全局最优标注序列,输出准确的实体识别结果。实验结果表明,所提出模型在自构建的农业病虫害命名实体识别数据集上,精确率、召回率与F1值分别达到76.46%、79.65%和77.92%。 展开更多
关键词 农业病虫害 命名实体识别 BERT BiGRU CRF
在线阅读 下载PDF
基于混合神经网络的电网计划检修风险单信息抽取方法
18
作者 田志浩 刘刚 +4 位作者 摆世彬 李桐 姜涛 蒙飞 乔咏田 《电子器件》 2025年第4期897-902,共6页
为了提升电网计划检修场景下电网故障防御及处置指导能力,提出基于变换器双向编码器表征技术-双向长短期记忆网络-条件随机场BERT-BiLSTM-CRF(Bidirectional Encoder Representations from Transformers-Bidirectional Long Short-Term ... 为了提升电网计划检修场景下电网故障防御及处置指导能力,提出基于变换器双向编码器表征技术-双向长短期记忆网络-条件随机场BERT-BiLSTM-CRF(Bidirectional Encoder Representations from Transformers-Bidirectional Long Short-Term Memory Network-Conditional Random Field)的电力调度文本实体识别方法。以电网计划检修风险表单为研究对象,提出风险表单关键信息抽取的实体标记方法,基于BERT预训练模型将实体转化为可计算的词向量,通过微调BERT超参数增强对实体信息的表征能力,通过BiLSTM网络学习序列上下文语义特征,由CRF层提升实体标签全局识别能力。实验结果表明,基于BERT-BiLSTM-CRF的混合神经网络模型在计划检修风险表单数据集上的F1值为97.36%,通过某电网实际数据验证,与其他算法相比所提方法具有较高的电力调度实体识别精度,能够为电力调度业务场景提供在线支撑。 展开更多
关键词 电网调度 深度学习 BERT-BiLSTM-CRF 实体识别 计划检修
在线阅读 下载PDF
基于BERT的中药材治疗胃病的命名实体识别
19
作者 熊磊 《软件导刊》 2025年第1期57-64,共8页
中药材用于胃病治疗的命名实体识别,是中药材开发领域文本信息挖掘的重要任务,也是构建知识图谱最重要的基础任务。为了更好地实现对中药材治疗胃病实体的提取,实验设计了5个命名实体识别模型进行实验比较,在预训练层、神经网络层,输出... 中药材用于胃病治疗的命名实体识别,是中药材开发领域文本信息挖掘的重要任务,也是构建知识图谱最重要的基础任务。为了更好地实现对中药材治疗胃病实体的提取,实验设计了5个命名实体识别模型进行实验比较,在预训练层、神经网络层,输出层都进行了不同设计,选择了更适合的BERT-BILSTM-CRF模型。首先,通过BERT生成特征提取层BILSTM的词向量;其次,利用BILSTM获取文本前后两个方向的特征得到相关特征向量;最后,利用CRF进行解码、标签预测,并讨论了模型各部分对实验的影响。实验表明,所提模型在自创数据集上的准确率、召回率、F1值分别为85.20%、85.47%、85.33%,相较于现有方法表现较好。 展开更多
关键词 中药材胃病治疗 命名实体识别 深度学习 BERT BILSTM-CRF
在线阅读 下载PDF
电力作业风险预控知识图谱构建与应用研究
20
作者 阿敏夫 孙彪 +1 位作者 武鹏飞 赵亚鑫 《内蒙古电力技术》 2025年第5期23-29,共7页
提出一种基于来自变换器的双向编码器表示(bidirectional encoder representations from transformers,BERT)技术的电力作业风险预先控制知识图谱构建策略,以期通过智能化方式显著提升电力作业的安全保障和作业效率。首先,构建一个专门... 提出一种基于来自变换器的双向编码器表示(bidirectional encoder representations from transformers,BERT)技术的电力作业风险预先控制知识图谱构建策略,以期通过智能化方式显著提升电力作业的安全保障和作业效率。首先,构建一个专门针对电力作业风险领域的训练数据集;其次,采用BERT-BiLSTM-CRF(BiLSTM是指bi-directional long short-term memory,双向长短期记忆;CRF是指conditional random field,条件随机场)模型对变压器运维相关的实体进行识别,并通过BERT-BiLSTMAttention模型进一步实现实体之间关系的有效识别,通过对比实验结果展示了这两种模型的性能;最后,成功将686个实体和720个实体关系导入Neo4j图数据库,实现了知识图谱的直观可视化,并在此基础上开发出了辅助决策功能。 展开更多
关键词 电力作业风险预控 知识图谱 BERT-BILSTM-CRF Neo4j图数据库
在线阅读 下载PDF
上一页 1 2 6 下一页 到第
使用帮助 返回顶部