期刊文献+
共找到17篇文章
< 1 >
每页显示 20 50 100
“雨课堂”教学模式的“IDCNN+”结构化分析与实证研究 被引量:29
1
作者 刘玉成 王传生 杨晶 《远程教育杂志》 CSSCI 北大核心 2019年第1期94-103,共10页
随着"人工智能+"研究思维与方法水准的螺旋式上升,"Neuro+"与教育教学的深度融合水到渠成,并逐渐炉火纯青。于是,改进型深度卷积神经网络(Improved Deep Convolutional Neural Network, IDCNN)方法与教学研究的融合... 随着"人工智能+"研究思维与方法水准的螺旋式上升,"Neuro+"与教育教学的深度融合水到渠成,并逐渐炉火纯青。于是,改进型深度卷积神经网络(Improved Deep Convolutional Neural Network, IDCNN)方法与教学研究的融合,使得"如何算出每个影响‘雨课堂’等智慧教学模式的核心要素及其权重,如何挖掘证实在线教学资源、互动性行为及教学效果之间存在的逻辑关系,如何准确地量化得出‘雨课堂’等教学模式的教学效果"等系列问题的解决,成为可能。IDCNN提取互动性行为层面的7类低维度特征数据,进行各指标数值及模型的运算,进而深析并实证在线教学资源、互动性行为、教学效果之间的内在联系和本质规律。实证研究结果表明:1."雨课堂"中每个核心要素及其一级、二级指标权重和教学效果,均可实现数值化;2.在线教学资源、互动性行为及教学效果三者,两两之间,存在弱正比例线性逻辑关系;3.并非所有在线教学资源,都正向影响师生间的互动性行为;也并非所有的互动性行为,均正向决定"雨课堂"的教学效果。它们分别对应着不同系数(正负值)的函数关系。 展开更多
关键词 “雨课堂”教学 影响规律 质量管理 idcnn 结构化分析 智慧教学 Neuro+
在线阅读 下载PDF
基于ERNIE-IDCNN-CRF模型的电网调度领域命名实体识别方法 被引量:9
2
作者 王佳琪 俞灵 +5 位作者 夏文岳 冯琼 武书舟 陈郑平 范海威 吴炜 《电力信息与通信技术》 2022年第10期1-8,共8页
电力调度运行系统存在大量复杂数据,构建电网调度领域知识图谱是解决数据关联性缺失、附加值低的重要手段,而电网调度领域命名实体识别是构建领域知识图谱的基础任务之一。针对通用领域命名实体识别方法在电网调控领域适用性差、模型训... 电力调度运行系统存在大量复杂数据,构建电网调度领域知识图谱是解决数据关联性缺失、附加值低的重要手段,而电网调度领域命名实体识别是构建领域知识图谱的基础任务之一。针对通用领域命名实体识别方法在电网调控领域适用性差、模型训练速度慢的问题,文章提出基于知识增强的预训练语义表示模型–膨胀卷积神经网络–条件随机场模型(enhanced representation through knowledge integration-iterated dilated convolutional neural network-conditional random field,ERNIE-IDCNN-CRF)的电网调度领域命名实体识别方法,该方法对字、短语、实体等信息进行统一建模,引入多源异构数据知识生成语义向量,实现模型语义表现能力的明显增强。实验结果表明,针对电力调度语料库,该方法的训练速度得到明显提升,电网调度领域实体的F1值达到85.09%,可有效识别出电网调度领域实体。 展开更多
关键词 电网调度 命名实体识别 ERNIE idcnn CRF
在线阅读 下载PDF
基于IDCNN+CRF和注意力机制的电子病历命名实体识别方法及模型稳定性研究 被引量:3
3
作者 陈廷寅 冯嵩 《中国数字医学》 2022年第11期1-5,共5页
目的:基于膨胀卷积+条件随机场(IDCNN+CRF)和注意力机制进行电子病历的实体识别,观察识别效果及模型的稳定性。方法:电子病历实体识别的实体抽取环节采用IDCNN+CRF架构,实体对齐环节采用Seq2Seq+注意力机制的翻译框架。与其他算法模型比... 目的:基于膨胀卷积+条件随机场(IDCNN+CRF)和注意力机制进行电子病历的实体识别,观察识别效果及模型的稳定性。方法:电子病历实体识别的实体抽取环节采用IDCNN+CRF架构,实体对齐环节采用Seq2Seq+注意力机制的翻译框架。与其他算法模型比较,观察所构建模型对电子病历实体的识别效果;逐步增加电子病历数量,分析对模型性能的提升效果。结果:IDCNN+CRF+注意力模型对于电子病历实体识别的准确率为97.17%,精确率为95.75%,召回率为95.06%,F_(β)值为95.51%,优于Bi-LSTM+CRF、CRF、HMM等其他模型;在电子病历增加15篇后F_(β)-score值趋于平稳。结论:基于IDCNN+CRF和注意力机制构建的模型具有良好的电子病历实体关系识别效果,且模型稳定性优异,为后续电子病历命名实体结构化提供了一种稳定可行的方案。 展开更多
关键词 电子病历 命名实体识别 深度学习 膨胀卷积 条件随机场
在线阅读 下载PDF
基于BERT-IDCNN-CRF的中文命名实体识别方法 被引量:66
4
作者 李妮 关焕梅 +1 位作者 杨飘 董文永 《山东大学学报(理学版)》 CAS CSCD 北大核心 2020年第1期102-109,共8页
预训练语言模型能够表达句子丰富的句法和语法信息,并且能够对词的多义性建模,在自然语言处理中有着广泛的应用,BERT(bidirectional encoder representations from transformers)预训练语言模型是其中之一。在基于BERT微调的命名实体识... 预训练语言模型能够表达句子丰富的句法和语法信息,并且能够对词的多义性建模,在自然语言处理中有着广泛的应用,BERT(bidirectional encoder representations from transformers)预训练语言模型是其中之一。在基于BERT微调的命名实体识别方法中,存在的问题是训练参数过多,训练时间过长。针对这个问题提出了基于BERT-IDCNN-CRF(BERT-iterated dilated convolutional neural network-conditional random field)的中文命名实体识别方法,该方法通过BERT预训练语言模型得到字的上下文表示,再将字向量序列输入IDCNN-CRF模型中进行训练,训练过程中保持BERT参数不变,只训练IDCNN-CRF部分,在保持多义性的同时减少了训练参数。实验表明,该模型在MSRA语料上F1值能够达到94.41%,在中文命名实体任务上优于目前最好的Lattice-LSTM模型,提高了1.23%;与基于BERT微调的方法相比,该方法的F1值略低但是训练时间大幅度缩短。将该模型应用于信息安全、电网电磁环境舆情等领域的敏感实体识别,速度更快,响应更及时。 展开更多
关键词 中文命名实体识别 BERT模型 膨胀卷积 条件随机场 信息安全
原文传递
融合对抗训练的光电企业信息命名实体识别
5
作者 艾芳菊 王庆雪 《软件导刊》 2025年第2期69-75,共7页
针对光电企业信息非结构化数据中实体结构冗长、实体嵌套等问题,提出一种融合对抗训练的BERT-BiG-RU-IDCNN-CRF模型。先通过BERT进行预训练,获取包含上下文语义的动态词向量,与对抗训练产生的扰动融合,再输入到BiGRU和IDCNN提取特征并... 针对光电企业信息非结构化数据中实体结构冗长、实体嵌套等问题,提出一种融合对抗训练的BERT-BiG-RU-IDCNN-CRF模型。先通过BERT进行预训练,获取包含上下文语义的动态词向量,与对抗训练产生的扰动融合,再输入到BiGRU和IDCNN提取特征并进行拼接,最后用CRF解码,获取目标序列。利用人民日报和MSRA开源数据集进行实验,进一步验证模型有效性。实验结果表明,此模型可以有效改善模型准确率、召回率和F1值,对解决光电企业信息中实体结构冗长、嵌套等问题具有一定效果,并且提高了模型鲁棒性和泛化能力,其中光电数据集的F1值比基准模型BiGRU-CRF和IDCNN-CRF分别提高了9.2和12.6个百分点。 展开更多
关键词 命名实体识别 BiGRU idcnn 对抗训练
在线阅读 下载PDF
基于字符注意力与词典特征的教育领域实体识别
6
作者 王萌 刘春刚 赵华 《计算机技术与发展》 2024年第7期168-174,共7页
针对现有的实体识别方法未考虑教育领域术语对模型识别性能的影响,导致模型性能不佳以及知识实体边界模糊问题,提出了一种基于字符注意力与词典特征的教育领域实体识别方法。该方法首先通过BERT预处理语言模型根据上下文语义信息生成字... 针对现有的实体识别方法未考虑教育领域术语对模型识别性能的影响,导致模型性能不佳以及知识实体边界模糊问题,提出了一种基于字符注意力与词典特征的教育领域实体识别方法。该方法首先通过BERT预处理语言模型根据上下文语义信息生成字向量,提出基于词性的字符注意力机制重新分配句子中字的权重。然后与构建的教育领域词典特征拼接融合,将其输入到BiLSTM网络与IDCNN网络提取特征,通过注意力机制将两层的输出动态组合,对两层的输出进行加权,从而融合新的特征。最后通过条件随机场进行计算,得到实体对应的标签序列。与现有方法相比,该方法在教育学科领域文本库中获得了更高的精度,识别结果的准确率、召回率、F1值分别为90.71%,91.37%,91.04%。 展开更多
关键词 实体识别 词典特征 字符注意力 idcnn 条件随机场
在线阅读 下载PDF
基于XLBIC的石油开采数据命名实体识别研究 被引量:2
7
作者 任伟建 计妍 康朝海 《计算机仿真》 2024年第6期390-395,共6页
在石油领域命名实体识别的任务中,提出了基于XLBIC(XLNet-BiGRU-IDCNN-CRF)的命名实体识别模型。首先采用XLNet预训练模型获取丰富且准确的词向量信息,将获取的词向量信息送入BiGRU和IDCNN网络中进行特征提取。针对膨胀卷积网络(IDCNN)... 在石油领域命名实体识别的任务中,提出了基于XLBIC(XLNet-BiGRU-IDCNN-CRF)的命名实体识别模型。首先采用XLNet预训练模型获取丰富且准确的词向量信息,将获取的词向量信息送入BiGRU和IDCNN网络中进行特征提取。针对膨胀卷积网络(IDCNN)获取特征维度不高,模型计算速度较慢的问题,提出在IDCNN网络中引入门控机制,实现信息的多通道传输和流量控制,提高模型的计算速度。实验表明XLBIC命名实体识别模型在自建石油开采数据集上性能相比其它模型有提高,准确率在90%以上。 展开更多
关键词 命名实体识别 膨胀卷积网络 门控机制
在线阅读 下载PDF
Chinese named entity recognition with multi-network fusion of multi-scale lexical information 被引量:1
8
作者 Yan Guo Hong-Chen Liu +3 位作者 Fu-Jiang Liu Wei-Hua Lin Quan-Sen Shao Jun-Shun Su 《Journal of Electronic Science and Technology》 EI CAS CSCD 2024年第4期53-80,共28页
Named entity recognition(NER)is an important part in knowledge extraction and one of the main tasks in constructing knowledge graphs.In today’s Chinese named entity recognition(CNER)task,the BERT-BiLSTM-CRF model is ... Named entity recognition(NER)is an important part in knowledge extraction and one of the main tasks in constructing knowledge graphs.In today’s Chinese named entity recognition(CNER)task,the BERT-BiLSTM-CRF model is widely used and often yields notable results.However,recognizing each entity with high accuracy remains challenging.Many entities do not appear as single words but as part of complex phrases,making it difficult to achieve accurate recognition using word embedding information alone because the intricate lexical structure often impacts the performance.To address this issue,we propose an improved Bidirectional Encoder Representations from Transformers(BERT)character word conditional random field(CRF)(BCWC)model.It incorporates a pre-trained word embedding model using the skip-gram with negative sampling(SGNS)method,alongside traditional BERT embeddings.By comparing datasets with different word segmentation tools,we obtain enhanced word embedding features for segmented data.These features are then processed using the multi-scale convolution and iterated dilated convolutional neural networks(IDCNNs)with varying expansion rates to capture features at multiple scales and extract diverse contextual information.Additionally,a multi-attention mechanism is employed to fuse word and character embeddings.Finally,CRFs are applied to learn sequence constraints and optimize entity label annotations.A series of experiments are conducted on three public datasets,demonstrating that the proposed method outperforms the recent advanced baselines.BCWC is capable to address the challenge of recognizing complex entities by combining character-level and word-level embedding information,thereby improving the accuracy of CNER.Such a model is potential to the applications of more precise knowledge extraction such as knowledge graph construction and information retrieval,particularly in domain-specific natural language processing tasks that require high entity recognition precision. 展开更多
关键词 Bi-directional long short-term memory(BiLSTM) Chinese named entity recognition(CNER) Iterated dilated convolutional neural network(idcnn) Multi-network integration Multi-scale lexical features
在线阅读 下载PDF
基于术语词典的中医医案实体抽取研究
9
作者 张伦伦 任高 +1 位作者 邹北骥 刘青萍 《湖南中医药大学学报》 CAS 2024年第6期1110-1116,共7页
目的针对中医医案开展症状、病因病机、治法、用药、处方、取穴6类实体的抽取研究,为中医医案知识图谱构建和中医智能辅助诊疗提供基础。方法根据中医医案文本的特点,提出一个可以动态更新的术语词典方法用于分词,并在中医脑系疾病医案... 目的针对中医医案开展症状、病因病机、治法、用药、处方、取穴6类实体的抽取研究,为中医医案知识图谱构建和中医智能辅助诊疗提供基础。方法根据中医医案文本的特点,提出一个可以动态更新的术语词典方法用于分词,并在中医脑系疾病医案和ChineseBLUE/cEHRNER、ChineseBLUE/cMedQANER、CBLUE/CMeEE 3个公开数据集上验证该方法的有效性。结果使用术语词典的模型在准确率、精确率、召回率和F1值上均高于未使用术语词典的模型,在测试集和验证集上,F1值分别为92.07%和93.04%。结论融合动态更新的术语词典分词方法的模型,能够增强中医领域特定术语和新实体的识别能力,提高中医医案关键信息识别的准确率,推进中医药知识的传承与发展。 展开更多
关键词 中医医案 脑系疾病 术语词典 实体抽取 idcnn-CRF模型
暂未订购
基于BERT特征融合与膨胀卷积的汉语副词框架语义角色标注
10
作者 王超 吕国英 +2 位作者 李茹 柴清华 李晋荣 《中文信息学报》 CSCD 北大核心 2024年第2期25-35,共11页
汉语框架语义角色标注对汉语框架语义分析具有重要作用。目前汉语框架语义角色标注任务主要针对动词框架,但是汉语没有丰富的形态变化,很多语法意义都是通过虚词来表现的,其中副词研究是现代汉语虚词研究的重要部分,因此该文从副词角度... 汉语框架语义角色标注对汉语框架语义分析具有重要作用。目前汉语框架语义角色标注任务主要针对动词框架,但是汉语没有丰富的形态变化,很多语法意义都是通过虚词来表现的,其中副词研究是现代汉语虚词研究的重要部分,因此该文从副词角度出发构建了汉语副词框架及数据集,且对框架下的词元按照语义强弱进行了等级划分。目前的语义角色标注模型大多基于BiLSTM网络模型,该模型虽然可以很好地获取全局信息,但容易忽略句子局部特征,且无法并行训练。针对上述问题,该文提出了基于BERT特征融合与膨胀卷积的语义角色标注模型,该模型包括四层:BERT层用于表达句子的丰富语义信息,Attention层对BERT获取的每一层信息进行动态权重融合,膨胀卷积(IDCNN)层进行特征提取,CRF层修正预测标签。该模型在三个副词框架数据集上表现良好,F1值均达到了82%以上。此外,将该模型应用于CFN数据集上,F1值达到88.29%,较基线模型提升了4%以上。 展开更多
关键词 汉语框架语义角色标注 副词 BERT 膨胀卷积 CRF
在线阅读 下载PDF
基于参数迁移和一维卷积神经网络的海水泵故障诊断 被引量:20
11
作者 崔石玉 朱志宇 《振动与冲击》 EI CSCD 北大核心 2021年第24期180-189,共10页
为解决海水泵工况多变、故障数据少、振动特征提取困难等故障诊断问题,该研究利用一维卷积神经网络(one-dimensional convolutional neural network,1DCNN)强大的表征能力自动学习故障特征,并引入参数迁移将源域数据集上的模型参数迁移... 为解决海水泵工况多变、故障数据少、振动特征提取困难等故障诊断问题,该研究利用一维卷积神经网络(one-dimensional convolutional neural network,1DCNN)强大的表征能力自动学习故障特征,并引入参数迁移将源域数据集上的模型参数迁移到目标域故障分类识别任务。首先,构建1DCNN基模型,运用Dropout、正则化、学习率等深度训练技巧防止模型过拟合,在源域数据集上训练得到模型参数;然后,将其模型参数迁移到目标域故障诊断模型,并进行参数微调,构建1DCNN参数迁移模型进行故障识别。试验结果表明,与传统1DCNN相比,1DCNN参数迁移模型能够显著提高模型的收敛速度和分类性能。该方法在三个变工况海水泵数据集上的平均识别准确率高达95.93%,具有较高的识别准确率和较强的泛化能力。 展开更多
关键词 参数迁移 一维卷积神经网络(idcnn) 故障诊断 海水泵 振动
在线阅读 下载PDF
基于BERT的多特征融合的医疗命名实体识别 被引量:7
12
作者 李正民 云红艳 王翊臻 《青岛大学学报(自然科学版)》 CAS 2021年第4期23-29,共7页
针对传统字向量难以表达上下文语义以及抽取的特征较为单一等问题,提出基于BERT的多特征融合模型BERT-BiLSTM-IDCNN-Attention-CRF,通过BERT建模字向量的上下文语义关系,并融合双向长短期记忆网络(BiLSTM)和迭代膨胀卷积(IDCNN),分别抽... 针对传统字向量难以表达上下文语义以及抽取的特征较为单一等问题,提出基于BERT的多特征融合模型BERT-BiLSTM-IDCNN-Attention-CRF,通过BERT建模字向量的上下文语义关系,并融合双向长短期记忆网络(BiLSTM)和迭代膨胀卷积(IDCNN),分别抽取的上下文特征和局部特征,使两种特征进行互补以提升实体抽取效果。本模型在全国知识图谱与语义计算大会CCKS2020中文电子病历数据集上进行测试,与BiLSTM-CRF等基准模型进行比较,F_(1)值提升1.27%。实验结果表明,本模型能较好地识别电子病历中的医疗实体。 展开更多
关键词 命名实体识别 多特征融合 BERT BiLSTM idcnn
在线阅读 下载PDF
基于词典与字向量融合的井控领域命名实体识别 被引量:2
13
作者 吴雅娟 牛甲奎 +1 位作者 解红涛 马宁 《海南大学学报(自然科学版)》 CAS 2022年第2期125-133,共9页
为了解决面向井控领域的命名实体识别容易受分词信息的影响以及在特征提取过程中忽略部分局部特征的问题,提出一种基于词典与字向量融合的CW-NER实体识别模型.该方法首先利用井控领域词典对语料进行分词、标注,映射为低维向量,与经过特... 为了解决面向井控领域的命名实体识别容易受分词信息的影响以及在特征提取过程中忽略部分局部特征的问题,提出一种基于词典与字向量融合的CW-NER实体识别模型.该方法首先利用井控领域词典对语料进行分词、标注,映射为低维向量,与经过特征提取后的字向量进行拼接融合,获得更丰富的词向量表示;其次将词向量分别输入双向长短时记忆网络(BiLSTM)与膨胀卷积神经网络模型(IDCNN)中提取特征,并将输出特征合并,利用多头自注意力机制(Multi-headed Self-attention)来捕获向量间的权重等信息;最后,经过条件随机场(CRF)对结果进行修正后输出.为验证方法的有效性,在井控领域语料集上进行了多组对比实验,实验结果表明,本文提出的命名实体识别模型均优于其他传统模型,其识别的准确率、召回率和F1值分别达到了91.31%,87.03%,89.04%. 展开更多
关键词 命名实体识 井控领域 双向长短时记忆网络 膨胀卷积神经网络 多头自注意力机制
在线阅读 下载PDF
基于集成学习的中文命名实体识别方法 被引量:6
14
作者 梁兵涛 倪云峰 《南京师大学报(自然科学版)》 CAS CSCD 北大核心 2022年第3期123-131,共9页
针对中文命名实体识别经典的BiLSTM-CRF(bi-directional long short-term memory-conditional random field)模型存在的嵌入向量无法表征多义词、编码层建模时注意力分散以及缺少对局部空间特征捕获的问题,本文提出一种融合BERT-BiGRU-M... 针对中文命名实体识别经典的BiLSTM-CRF(bi-directional long short-term memory-conditional random field)模型存在的嵌入向量无法表征多义词、编码层建模时注意力分散以及缺少对局部空间特征捕获的问题,本文提出一种融合BERT-BiGRU-MHA-CRF和BERT-IDCNN-CRF模型优势的集成模型完成命名实体识别.该方法利用裁剪的BERT模型得到包含上下文信息的语义向量;再将语义向量输入BiGRU-MHA(bi-directional gated recurrent unit-multi head attention)及IDCNN(Iterated Dilated Convolutional Neural Network)网络.前者捕获输入序列的时序特征并能够根据字符重要性分配权值,后者主要捕获输入的空间特征,利用平均集成方式将捕获到的特征融合;最后通过CRF层获得全局最优的标注序列.集成模型在人民日报和微软亚洲研究院(Microsoft research asia, MSRA)数据集上的F1值分别达到了96.09%和95.01%.相较于单个模型分别提高了0.74%和0.55%以上,验证了本文方法的有效性. 展开更多
关键词 命名实体识别 BERT模型 集成学习 注意力机制 迭代膨胀卷积网络
在线阅读 下载PDF
基于多层次特征提取的中文医疗实体识别 被引量:2
15
作者 李正辉 廖光忠 《计算机技术与发展》 2023年第9期119-125,共7页
中文医疗实体识别是医疗领域文本信息处理的基础,但中文医疗文本中常常存在语法不规范、实体嵌套和类型易混淆等问题易造成实体识别精度下降,因此确保中文医疗实体识别的准确度具有较大的理论研究和实际应用价值。为此,提出一种融合BER... 中文医疗实体识别是医疗领域文本信息处理的基础,但中文医疗文本中常常存在语法不规范、实体嵌套和类型易混淆等问题易造成实体识别精度下降,因此确保中文医疗实体识别的准确度具有较大的理论研究和实际应用价值。为此,提出一种融合BERT预训练、双向长短期记忆网络(BILSTM)和结合注意力机制的空洞卷积网络(IDCNN)的实体识别模型来提升中文医疗实体识别的精度。起先,使用BERT预训练语言模型使中文字符转换为词向量并增强其语法语义特征;而后将训练好的词向量分别通过BILSTM网络和加入注意力机制的IDCNN网络获取上下文信息和更大的感受野;最终将蕴含语法语义特征、上下文信息和更大的感受野信息的特征融合并输入到条件随机场(CRF)中进行实体预测。在两个公开的医疗数据集CMeEE/Yidu-S4K上的实验表明,该模型的F1值分别达到了0.7116和0.8206,较主流模型分别提高了1.40百分点和2.29百分点,验证了此模型在中文医疗实体识别上的有效性。 展开更多
关键词 实体识别 BERT预训练 空洞卷积网络 注意力机制 感受野
在线阅读 下载PDF
变转速工况下滚动轴承故障诊断——基于改进DCNN和GRU模型
16
作者 唐衡 夏均忠 +1 位作者 白云川 金灵 《军事交通学报》 2023年第2期32-38,共7页
针对变转速工况下滚动轴承振动信号变化大、故障诊断准确率低的问题,提出基于改进深度卷积神经网络(IDCNN)和门控循环单元(GRU)的诊断模型。使用原始振动信号作为输入,避免因人为提取特征而损失信息;引入批标准化(BN)和小卷积核对DCNN... 针对变转速工况下滚动轴承振动信号变化大、故障诊断准确率低的问题,提出基于改进深度卷积神经网络(IDCNN)和门控循环单元(GRU)的诊断模型。使用原始振动信号作为输入,避免因人为提取特征而损失信息;引入批标准化(BN)和小卷积核对DCNN进行改进,加深网络深度,增强网络的辨别能力和稳定性;引入在处理时间序列信号上有着独特优势的门控循环单元(GRU),通过将GRU与IDCNN相结合来提高网络模型的性能。试验验证该模型效果显著且性能稳定。 展开更多
关键词 滚动轴承 故障诊断 改进深度卷积神经网络 门控循环单元 变转速工况
在线阅读 下载PDF
文本表示及其特征生成对法律判决书中多类型实体识别的影响分析 被引量:5
17
作者 王昊 林克柔 +1 位作者 孟镇 李心蕾 《数据分析与知识发现》 CSSCI CSCD 北大核心 2021年第7期10-25,共16页
【目的】探索法律判决书中不同模型的实体识别效果,为法律知识库的构建奠定基础。【方法】提取刑事判决书中的庭审过程和法院意见构造数据集,比较人工构造特征的CRFs模型和加入预训练词向量做文本表示的自动生成特征的IDCNN-CRFs模型与B... 【目的】探索法律判决书中不同模型的实体识别效果,为法律知识库的构建奠定基础。【方法】提取刑事判决书中的庭审过程和法院意见构造数据集,比较人工构造特征的CRFs模型和加入预训练词向量做文本表示的自动生成特征的IDCNN-CRFs模型与BiLSTM-CRFs模型的实体识别效果,并在少量其他类型法律判决书文本上比较模型的迁移能力。【结果】ALBERT-BiLSTM-CRFs模型实体识别效果最好,F1微平均值达95.28%;IDCNN-CRFs模型的识别效果低于前者,但训练时间是前者的1/6,两个模型均具有较好的迁移能力。【局限】识别的实体多为通用实体,后续考虑标注更多领域特有实体,增强研究对实际应用的参考价值。【结论】法律判决书的实体识别中,ALBERT-BiLSTM-CRFs和IDCNN-CRFs模型比CRFs模型效果更好,且迁移能力更强。 展开更多
关键词 法律判决书 特征生成 条件随机场 idcnn-CRFs ALBERT-BiLSTM-CRFs
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部