期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
基于ELMo-BERT的控申法律文书层级多标签分类方法研究
1
作者 陈潞潞 陈亮 王珺琳 《通信与信息技术》 2025年第5期63-67,共5页
目前检察院控申部门的案件分流工作繁重,对控申法律文书的分流仅依靠人工鉴别,导致为公民服务的效率低下。由于控申业务所涉及的文本数据存在类型复杂且数据分布不均衡的问题,仅用BERT等大模型对控申法律文书进行特征提取时会出现信息... 目前检察院控申部门的案件分流工作繁重,对控申法律文书的分流仅依靠人工鉴别,导致为公民服务的效率低下。由于控申业务所涉及的文本数据存在类型复杂且数据分布不均衡的问题,仅用BERT等大模型对控申法律文书进行特征提取时会出现信息缺失的现象,导致无法达到分类的效果。针对这一问题提出了一种基于ELMo-BERT的多标签文本分类模型,用ELMo和BERT模型分别对文本进行词向量和句向量的特征提取;对层级标签用Graphormer进行标签表示,得到包含标签信息的特征向量;最终进行特征融合,防止信息提取过程中存在主要信息缺失的现象。加入ELMo模块后,模型的精确率、召回率、Micro-F1值和Macro-F1值上分别提升3.33%、1.78%、2.48%和3.58%,证明加入ELMo模块比单一特征提取能更全面地提取控申法律文书的语义信息。在自制数据集上进行对比实验,ELMo-BERT模型的Micro-F1值和Macro-F1值分别为79.74%和69.85%,均超过了其他主流模型,因此,ELMo-BERT模型的多尺度特征提取比单一特征提取具有更好的分类效果。 展开更多
关键词 控申业务 多标签文本分类 BERT模型 elmo模型 多尺度特征提取 层级多标签
在线阅读 下载PDF
基于ELMo-TextCNN的网络欺凌检测模型 被引量:6
2
作者 叶水欢 葛寅辉 +1 位作者 陈波 于泠 《信息安全研究》 CSCD 2023年第9期868-876,共9页
网络欺凌检测是网络空间信息内容安全的重要研究内容,也关乎青少年在线安全.针对目前网络欺凌检测方案存在的训练样本少、难以处理多义词、分类性能不太理想等问题,提出一种ELMo-TextCNN检测模型.该模型首先采用迁移学习思想,利用预训练... 网络欺凌检测是网络空间信息内容安全的重要研究内容,也关乎青少年在线安全.针对目前网络欺凌检测方案存在的训练样本少、难以处理多义词、分类性能不太理想等问题,提出一种ELMo-TextCNN检测模型.该模型首先采用迁移学习思想,利用预训练的ELMo(embeddings from language models)生成动态词向量,不仅解决了网络欺凌样本规模小的问题,而且由于ELMo采用了双向长短期记忆(bi-directional long short-term memory,BiLSTM)网络结构,会根据上下文推断每个词对应的词向量,能够根据语境理解多义词.该模型再通过擅长处理短文本数据的TextCNN(text convolutional neural network)提取文本特征,最后经过全连接层输出分类结果.实验结果证明,提出的ELMo-TextCNN检测方法能够处理一词多义,并获得更好的分类检测效果. 展开更多
关键词 网络欺凌检测 深度学习 迁移学习 elmo模型 TextCNN模型
在线阅读 下载PDF
一种基于改进ELMO模型的组织机构名识别方法
3
作者 胡万亭 郭建英 张继永 《计算机技术与发展》 2020年第11期25-29,共5页
组织机构名识别是命名实体识别的核心任务之一,也是最困难的任务。近年来,预训练模型在中文自然语言处理领域得到广泛应用,预训练的词嵌入模型在中文命名实体识别上取得了非常好的效果,但是在组织机构名识别上还有很大的提升空间。针对... 组织机构名识别是命名实体识别的核心任务之一,也是最困难的任务。近年来,预训练模型在中文自然语言处理领域得到广泛应用,预训练的词嵌入模型在中文命名实体识别上取得了非常好的效果,但是在组织机构名识别上还有很大的提升空间。针对这一问题,改进ELMO(embedding from language models)预训练模型,结合双向LSTM神经网络模型和条件随机场模型,去识别组织机构名。对于ELMO的改进,主要通过筛选高频机构词,然后将高频机构词加入中文字典,通过ELMO模型训练生成机构词向量和普通字向量。字向量不用考虑未登录词的问题,机构词向量引入了先验知识,结合起来可以使得生成的字词向量能够更好地表征组织机构名。实验结果表明,预训练模型的数据集相对较小时,该方法比字向量嵌入的方法有更好的效果,F1值提高了1.3%。 展开更多
关键词 elmo模型 LSTM模型 机构词 条件随机场 组织机构名识别
在线阅读 下载PDF
基于ELMo-BiLSTM-CRF模型的中文地址分词 被引量:6
4
作者 余俊 于文年 彭艳兵 《电子设计工程》 2021年第20期72-76,共5页
为了解决传统基于规则的方法在处理中文地址分词的过程中,存在的分词效率低、需要人工维护字典且对中文地址中有歧义的字段无法正常解析等问题,文中提出在对中文地址分词的过程中,采用ELMo预训练模型的方式和嵌套BiLSTM-CRF的方法提升... 为了解决传统基于规则的方法在处理中文地址分词的过程中,存在的分词效率低、需要人工维护字典且对中文地址中有歧义的字段无法正常解析等问题,文中提出在对中文地址分词的过程中,采用ELMo预训练模型的方式和嵌套BiLSTM-CRF的方法提升整体分词效率。该模型考虑到ELMo模型生成的词向量与上下文有关,BiLSTM能够有效解决输入序列的特征提取,且CRF可以通过状态转移矩阵进行训练优化。采用自建的训练样本集对模型进行训练时,分别运用了ELMo-BiLSTM-CRF、BiLSTM-CRF以及BiLSTM,并进行对比。结果表明,ELMo-BiLSTM-CRF模型的分词效果更佳,具有更高的准确率。 展开更多
关键词 中文地址 中文地址分词 elmo-BiLSTM-CRF模型 预训练模型
在线阅读 下载PDF
融合情感词典与上下文语言模型的文本情感分析 被引量:19
5
作者 杨书新 张楠 《计算机应用》 CSCD 北大核心 2021年第10期2829-2834,共6页
词嵌入技术在文本情感分析中发挥着重要的作用,但是传统的Word2Vec、GloVe等词嵌入技术会产生语义单一的问题。针对上述问题提出了一种融合情感词典与上下文语言模型ELMo的文本情感分析模型SLP-ELMo。首先,利用情感词典对句子中的单词... 词嵌入技术在文本情感分析中发挥着重要的作用,但是传统的Word2Vec、GloVe等词嵌入技术会产生语义单一的问题。针对上述问题提出了一种融合情感词典与上下文语言模型ELMo的文本情感分析模型SLP-ELMo。首先,利用情感词典对句子中的单词进行筛选;其次,将筛选出的单词输入字符卷积神经网络(char-CNN),从而产生每个单词的字符向量;然后,将字符向量输入ELMo模型进行训练;此外,在ELMo向量的最后一层加入了注意力机制,以便更好地训练词向量;最后,将词向量与ELMo向量并行融合并输入分类器进行文本情感分类。与现有的多个模型对比,所提模型在IMDB和SST-2这两个数据集上均得到了更高的准确率,验证了模型的有效性。 展开更多
关键词 情感分析 elmo 情感词典 卷积神经网络 字符向量
在线阅读 下载PDF
基于联合向量和神经网络的事件因果关系抽取 被引量:2
6
作者 廖涛 王旭 《安徽理工大学学报(自然科学版)》 CAS 2022年第1期85-92,共8页
事件关系抽取是自然语言处理领域中一项重要的语义处理任务。针对当前事件因果关系抽取研究中存在词汇特征不符合上下文语境、语义特征不足等问题,提出了基于联合词向量和Attention-BiGRU网络的事件因果关系抽取方法。该方法把因果关系... 事件关系抽取是自然语言处理领域中一项重要的语义处理任务。针对当前事件因果关系抽取研究中存在词汇特征不符合上下文语境、语义特征不足等问题,提出了基于联合词向量和Attention-BiGRU网络的事件因果关系抽取方法。该方法把因果关系抽取转化为分类问题,首先利用word2vec和ELMO模型对CEC语料进行表示,形成事件关系对的文本表示模型,以获取词向量矩阵及考虑文本语境的动态词特征,从而构成联合向量;然后利用Attention-BiGRU网络,深层提取语义特征信息,并对特征进行权重调整,突出重要词汇对因果关系抽取的贡献;最后将加权特征输入softmax分类器进而完成事件因果关系的抽取。在数据集上进行对比实验,该方法取得了88.56%的F1值,结果表明所提出方法的有效性。 展开更多
关键词 事件关系 因果关系抽取 BiGRU网络 注意力机制 elmo模型
在线阅读 下载PDF
融合基于语言模型的词嵌入和多尺度卷积神经网络的情感分析 被引量:28
7
作者 赵亚欧 张家重 +2 位作者 李贻斌 付宪瑞 生伟 《计算机应用》 CSCD 北大核心 2020年第3期651-657,共7页
针对Word2Vec、GloVe等词嵌入技术对多义词只能产生单一语义向量的问题,提出一种融合基于语言模型的词嵌入(ELMo)和多尺度卷积神经网络(MSCNN)的情感分析模型。首先,该模型利用ELMo学习预训练语料,生成上下文相关的词向量;相较于传统词... 针对Word2Vec、GloVe等词嵌入技术对多义词只能产生单一语义向量的问题,提出一种融合基于语言模型的词嵌入(ELMo)和多尺度卷积神经网络(MSCNN)的情感分析模型。首先,该模型利用ELMo学习预训练语料,生成上下文相关的词向量;相较于传统词嵌入技术,ELMo利用双向长短程记忆(LSTM)网络融合词语本身特征和词语上下文特征,能够精确表示多义词的多个不同语义;此外,该模型使用预训练的中文字符向量初始化ELMo的嵌入层,相对于随机初始化,该方法可加快模型的训练速度,提高训练精度;然后,该模型利用多尺度卷积神经网络,对词向量的特征进行二次抽取,并进行特征融合,生成句子的整体语义表示;最后,经过softmax激励函数实现文本情感倾向的分类。实验在公开的酒店评论和NLPCC2014 task2两个数据集上进行,实验结果表明,在酒店评论数据集上与基于注意力的双向LSTM模型相比,该模型正确率提升了1.08个百分点,在NLPCC2014 task2数据集上与LSTM和卷积神经网络(CNN)的混合模型相比,该模型正确率提升了2.16个百分点,证明了所提方法的有效性。 展开更多
关键词 情感分析 自然语言处理 卷积神经网络 elmo 字向量
在线阅读 下载PDF
基于预训练语言模型词向量融合的情感分析研究 被引量:5
8
作者 魏上斐 乔保军 +1 位作者 于俊洋 姚相宇 《计算机应用与软件》 北大核心 2021年第5期152-157,共6页
针对传统情感分类模型的分类效果不足,无法准确地捕捉词语之间关系的问题,提出一种基于预训练语言模型词向量融合的GE-BiLSTM(Glove-ELMO-BiLSTM)情感分析模型。通过预训练语言模型ELMO以语言模型为目的训练词向量,再与传统的Glove模型... 针对传统情感分类模型的分类效果不足,无法准确地捕捉词语之间关系的问题,提出一种基于预训练语言模型词向量融合的GE-BiLSTM(Glove-ELMO-BiLSTM)情感分析模型。通过预训练语言模型ELMO以语言模型为目的训练词向量,再与传统的Glove模型的训练结果进行运算融合,结合了全局信息以及局部上下文信息,增加了词向量矩阵的稠密度,词语之间的特征得到更好的表达,结合BiLSTM神经网络可以更好地捕捉上下文信息的关系。实验结果证明:GE-BiLSTM情感分析模型可以达到更好的分类效果,准确率比传统模型提高了2.3百分点,F1值提升了0.024。 展开更多
关键词 GLOVE 预训练语言模型 elmo 词向量融合 BiLSTM 情感分析
在线阅读 下载PDF
基于语言模型及循环卷积神经网络的事件检测 被引量:4
9
作者 施喆尔 陈锦秀 《厦门大学学报(自然科学版)》 CAS CSCD 北大核心 2019年第3期442-448,共7页
目前,事件检测的难点在于一词多义和多事件句的检测.为了解决这些问题,提出了一个新的基于语言模型的带注意力机制的循环卷积神经网络模型(recurrent and convolutional neural network with attention based on language models,LM-ARC... 目前,事件检测的难点在于一词多义和多事件句的检测.为了解决这些问题,提出了一个新的基于语言模型的带注意力机制的循环卷积神经网络模型(recurrent and convolutional neural network with attention based on language models,LM-ARCNN).该模型利用语言模型计算输入句子的词向量,将句子的词向量输入长短期记忆网络获取句子级别的特征,并使用注意力机制捕获句子级别特征中与触发词相关性高的特征,最后将这两部分的特征输入到包含多个最大值池化层的卷积神经网络,提取更多上下文有效组块.在ACE2005英文语料库上进行实验,结果表明,该模型的 F 1 值为74.4%,比现有最优的文本嵌入增强模型(DEEB)高0.4%. 展开更多
关键词 事件检测 语言模型词嵌入 长短期记忆网络 动态多池化卷积神经网络 注意力机制
在线阅读 下载PDF
基于语言模型词嵌入和注意力机制的敏感信息检测方法 被引量:14
10
作者 黄诚 赵倩锐 《计算机应用》 CSCD 北大核心 2022年第7期2009-2014,共6页
针对基于关键词字符匹配和短语级情感分析等传统敏感信息检测方法准确率低和泛化性差的问题,提出了一种基于语言模型词嵌入和注意力机制(A-ELMo)的敏感信息检测方法。首先,进行字典树快速匹配,以最大限度地减少无用字符的比较,从而极大... 针对基于关键词字符匹配和短语级情感分析等传统敏感信息检测方法准确率低和泛化性差的问题,提出了一种基于语言模型词嵌入和注意力机制(A-ELMo)的敏感信息检测方法。首先,进行字典树快速匹配,以最大限度地减少无用字符的比较,从而极大地提高查询效率;其次,构建了一个语言模型词嵌入模型(ELMo)进行语境分析,并通过动态词向量充分表征语境特征,从而实现较高的可扩展性;最后,结合注意力机制加强模型对敏感特征的识别度,从而进一步提升对敏感信息的检测率。在由多个网络数据源构成的真实数据集上进行实验,结果表明,所提敏感信息检测方法与基于短语级情感分析的方法相比,准确率提升了13.3个百分点;与基于关键字匹配的方法相比,准确率提升了43.5个百分点,充分验证了所提方法在加强敏感特征识别度、提高敏感信息检测率方面的优越性。 展开更多
关键词 敏感信息 语言模型词嵌入 语境分析 注意力机制 字典树
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部