期刊文献+
共找到49篇文章
< 1 2 3 >
每页显示 20 50 100
基于XLNet和多粒度对比学习的新闻主题文本分类方法 被引量:1
1
作者 陈敏 王雷春 +2 位作者 徐瑞 史含笑 徐渺 《郑州大学学报(理学版)》 CAS 北大核心 2025年第2期16-23,共8页
新闻主题文本内容简短却含义丰富,传统方法通常只考虑词粒度或句粒度向量中的一种进行研究,未能充分利用新闻主题文本不同粒度向量之间的关联信息。为深入挖掘文本的词向量和句向量间的依赖关系,提出一种基于XLNet和多粒度特征对比学习... 新闻主题文本内容简短却含义丰富,传统方法通常只考虑词粒度或句粒度向量中的一种进行研究,未能充分利用新闻主题文本不同粒度向量之间的关联信息。为深入挖掘文本的词向量和句向量间的依赖关系,提出一种基于XLNet和多粒度特征对比学习的新闻主题分类方法。首先,利用XLNet对新闻主题文本进行特征提取获得文本中词、句粒度的特征表示和潜在空间关系;然后,通过对比学习R-Drop策略生成不同粒度特征的正负样本对,以一定权重对文本的词向量-词向量、词向量-句向量和句向量-句向量进行特征相似度学习,使模型深入挖掘出字符属性和语句属性之间的关联信息,提升模型的表达能力。在THUCNews、Toutiao和SHNews数据集上进行实验,实验结果表明,与基准模型相比,所提方法在准确率和F 1值上都有更好的表现,在三个数据集上的F 1值分别达到了93.88%、90.08%、87.35%,验证了方法的有效性和合理性。 展开更多
关键词 自然语言处理 文本分类 新闻主题 xlnet 对比学习
在线阅读 下载PDF
一种基于预训练语言模型XLNet的测井曲线重构方法 被引量:1
2
作者 曹茂俊 赵宇杰 《计算机技术与发展》 2025年第2期183-190,共8页
在油田勘探开发过程中,测井曲线作为地球物理测井的第一手资料,能够真实反映地下空间的分布与特性。然而,在实际工作中,由于井壁垮塌和仪器故障等原因,部分测井数据常常出现失真或缺失。为解决这一问题,该文提出了一种基于预训练语言模... 在油田勘探开发过程中,测井曲线作为地球物理测井的第一手资料,能够真实反映地下空间的分布与特性。然而,在实际工作中,由于井壁垮塌和仪器故障等原因,部分测井数据常常出现失真或缺失。为解决这一问题,该文提出了一种基于预训练语言模型XLNet的测井曲线重构方法。该方法通过筛选地层地质岩性特征指数,获取高质量的训练样本,并将其作为预训练模型重构测井曲线的依据。构建并训练带有预训练权重信息的XLNet模型,使模型具备对复杂地层特性的理解和数据重构能力。在模型的构建与训练过程中,引入了预训练权重,并进一步结合了LoRA(Low-Rank Adaptation)模块,以充分利用测井曲线之间的高度依赖关系,进而辅助XLNet生成和补全失真或缺失的测井数据。与已知曲线重构模型:基于注意力表征的长短期记忆神经网络(LSTM-Attent)、双向门控神经网络(BiGRU)、TimesNet及XLNet相比,基于预训练语言模型XLNet-LoRA的测井曲线重构模型具有更高的预测准确性。 展开更多
关键词 测井曲线重构 深度学习 预训练语言模型 xlnet网络 LoRA机制
在线阅读 下载PDF
基于XLNet—BiLSTM—AFF—CRF的谷物收割机械维修知识命名实体识别
3
作者 李先旺 刘赛虎 +1 位作者 黄忠祥 章霞东 《中国农机化学报》 北大核心 2025年第2期319-325,352,共8页
针对谷物收割机械维修实体识别过程中存在上下文语义特征缺失、长距离依赖信息不充足、实体复杂度较高等问题,提出一种引入注意力机制特征融合的谷物收割机械维修知识命名实体识别模型XLNet—BiLSTM—AFF—CRF。该模型采用基于Transfor... 针对谷物收割机械维修实体识别过程中存在上下文语义特征缺失、长距离依赖信息不充足、实体复杂度较高等问题,提出一种引入注意力机制特征融合的谷物收割机械维修知识命名实体识别模型XLNet—BiLSTM—AFF—CRF。该模型采用基于Transformer—XL的广义自回归XLNet预训练模型作为嵌入层提取字向量;然后使用双向长短时记忆网络(BiLSTM)获取上下文语义特征;利用注意力特征融合AFF将XLNet层输出与BiLSTM层输出进行组合,增强序列的语义信息;最后输入条件随机场CRF模型学习标注约束规则生成全局最优序列。在创建的维修语料库上展开试验,结果表明:所提模型的精确率、召回率和F1值分别为98.4%、97.6%和97.9%,均高于对比模型,验证所提模型的有效性。 展开更多
关键词 谷物收割机械 维修 命名实体识别 注意力机制 广义自回归预训练语言模型(xlnet)
在线阅读 下载PDF
基于XLNet-BiLSTM-Attention模型的假新闻检测研究
4
作者 韩晓鸿 郭恒 杨港 《智能计算机与应用》 2025年第9期96-100,共5页
随着社交多元化和网络技术的发展,网络上开始出现虚假新闻,给个人和社会造成了不利的影响。针对此现象,本文提出基于XLNet-BiLSTM-Attention神经模型的检测方法。首先使用XLNet获取具有上下文依赖的词向量,然后通过BiLSTM双向门控单元... 随着社交多元化和网络技术的发展,网络上开始出现虚假新闻,给个人和社会造成了不利的影响。针对此现象,本文提出基于XLNet-BiLSTM-Attention神经模型的检测方法。首先使用XLNet获取具有上下文依赖的词向量,然后通过BiLSTM双向门控单元获取深层次语义信息,最后利用Attention机制根据特征的重要性赋予不同的特征权重,并进行文本真实性检测。本文模型与4种常用神经模型进行对比,准确率达到94%,均高于其他4种模型,从而验证了该模型的有效性。 展开更多
关键词 假新闻检测 神经模型 xlnet BiLSTM 特征权重
在线阅读 下载PDF
基于XLNet 的WebShell 上传检测研究
5
作者 王欣源 缪祥华 《数据通信》 2025年第1期36-39,53,共5页
随着互联网的迅速发展,Web应用的安全问题日益突出,其中WebShell攻击已成为一种严重的网络安全威胁。本文基于XLNet模型,致力于提升WebShell上传检测的准确性和效率。通过分析网络流量,将XLNet模型用于样本文件的预处理、词嵌入、训练... 随着互联网的迅速发展,Web应用的安全问题日益突出,其中WebShell攻击已成为一种严重的网络安全威胁。本文基于XLNet模型,致力于提升WebShell上传检测的准确性和效率。通过分析网络流量,将XLNet模型用于样本文件的预处理、词嵌入、训练及测试阶段。实验结果表明,该方法在召回率、精确率以及F1分数等关键指标方面均表现出卓越的性能。相较于传统的机器学习方法,基于XLNet的检测模型能够更准确地识别潜在的WebShell上传操作,从而降低Web应用系统受到持久性攻击的风险,同时提升了Web应用的整体安全水平。这一研究成果强化了网络安全防线,能够为Web应用保驾护航。 展开更多
关键词 机器学习 入侵检测 自然语言处理 xlnet WEBSHELL
在线阅读 下载PDF
基于XLNet-TB的中文文本可读性评估研究
6
作者 倪佳成 《信息技术与信息化》 2025年第4期66-69,共4页
文本可读性用于评估一段文本的阅读难度,这一概念在教育和出版领域发挥着重要作用。针对目前中文文本可读性评估模型在捕捉文本深层次语义信息方面的不足,文章提出了一种基于XLNet-TB分层网络架构的中文文本可读性评估模型,该模型利用Ch... 文本可读性用于评估一段文本的阅读难度,这一概念在教育和出版领域发挥着重要作用。针对目前中文文本可读性评估模型在捕捉文本深层次语义信息方面的不足,文章提出了一种基于XLNet-TB分层网络架构的中文文本可读性评估模型,该模型利用Chinese-XLNet预训练模型生成文本词向量表示,然后联合使用TextCNN与BiGRU模型提取文本语义特征,最终输入全连接层获得文本可读性评估分级结果。实验证明,该模型在汉语水平考试HSK真题数据集上的准确率达到了89.5%,验证了模型的有效性。 展开更多
关键词 可读性评估 深度学习 xlnet预训练模型 卷积神经网络 双向门控递归单元
在线阅读 下载PDF
基于改进XLNet算法的震后舆情分析研究——以甘肃积石山县6.2级和新疆乌什县7.1级地震为例 被引量:2
7
作者 郑通彦 王尅丰 +4 位作者 黄猛 张淞 周文涛 游巧 刘帅 《地震工程学报》 CSCD 北大核心 2024年第4期955-964,共10页
震后对网络舆情信息的监控与分析,对于相关部门开展震灾应急救援、掌握救灾动态、稳定民众情绪具有重要意义。为解决震后舆情信息数据量大、语言多义性等问题,文章使用自回归模型(XLNet)作为文本向量化表示层,将社交媒体地震数据文本转... 震后对网络舆情信息的监控与分析,对于相关部门开展震灾应急救援、掌握救灾动态、稳定民众情绪具有重要意义。为解决震后舆情信息数据量大、语言多义性等问题,文章使用自回归模型(XLNet)作为文本向量化表示层,将社交媒体地震数据文本转化为包含上下文语义信息的媒体数据词向量,同时,使用双向门控循环单元(BiGRU)网络作为特征提取层,把词向量序列输入到BiGRU层,提取社交媒体地震数据的文本特征;将初步提取特征的文本输入到注意力机制层(Attention),进一步提取更为重要的情感类别特征,并对重要特征进行权重强化,构建基于网络地震应急处置信息改进的XLNet-BiGRU-Att地震舆情情感分析模型;最终,获得社交媒体地震数据的舆情态势。相比传统的XLNet模型,文章模型在甘肃积石山县6.2级与新疆乌什县7.1级地震的舆情情感分析中能够准确\,快速捕捉长短文本数据特征,分析舆情态势,情感分析准确率分别提升到92.45%和93.42%。 展开更多
关键词 舆情分析 xlnet BiGRU 甘肃积石山 新疆乌什
在线阅读 下载PDF
基于 XLNet 的农业命名实体识别方法 被引量:5
8
作者 陈明 顾凡 《河北农业大学学报》 CAS CSCD 北大核心 2023年第4期111-117,共7页
随着农业领域人工智能的研究不断深入,农业文本中命名实体识别是其他任务开展的基础之一。鉴于农业领域缺乏公开语料库,本文构建了自己的农业文本的注释语料库。针对目前存在的文本语义表达不足、缺乏语境特征、词向量多样性表达困难等... 随着农业领域人工智能的研究不断深入,农业文本中命名实体识别是其他任务开展的基础之一。鉴于农业领域缺乏公开语料库,本文构建了自己的农业文本的注释语料库。针对目前存在的文本语义表达不足、缺乏语境特征、词向量多样性表达困难等问题,本文提出了基于XLNet(Generalized Autoregressive Pretraining for Language Understanding,XLNet)的农业命名实体识别模型XLNet-IDCNN-CRF。嵌入层XLNet对于输入文本进行向量化表示,丰富文本的语义信息,缓解一词多义问题,通过编码层迭代膨胀卷积神经网络(Iterated Dilated Convolutional Neural Network,IDCNN)并行计算减少训练时间,获取文本特征信息,结合起来输入到输出层条件随机场模型(Conditional Random Field,CRF)识别标签信息,输出最优序列。本文在自建语料库上准确率达到95.58%,召回率92.36%,F1值93.91%,对比优于其他模型。实验结果表明,XLNet-IDCNNCRF模型能够较好地完成农业命名实体识别任务。 展开更多
关键词 农业文本 命名实体识别 xlnet模型 预训练语言模型 迭代膨胀卷积
在线阅读 下载PDF
基于XLNET和GAT的句法信息增强事件抽取模型 被引量:2
9
作者 余传明 邓斌 +1 位作者 谈腊云 盛博 《数据分析与知识发现》 EI CSSCI CSCD 北大核心 2024年第4期26-38,共13页
【目的】解决序列建模对触发词之间的长距离依赖关系和触发词与论元实体关系捕获不足的问题,提升事件抽取任务上的效果。【方法】提出一种基于预训练模型XLNET和图注意力网络GAT的句法信息增强事件抽取模型SEM-XG,通过预训练语言模型进... 【目的】解决序列建模对触发词之间的长距离依赖关系和触发词与论元实体关系捕获不足的问题,提升事件抽取任务上的效果。【方法】提出一种基于预训练模型XLNET和图注意力网络GAT的句法信息增强事件抽取模型SEM-XG,通过预训练语言模型进行文本表示,引入依存句法树中依赖弧增强信息流,将单词看作图中的节点,使用图注意力网络进行图信息建模,得到融入句法信息的单词表示,从而联合抽取句子中的事件触发词和论元角色。在CNC数据集和ACE2005数据集上,开展实证研究。【结果】在CNC数据集上,SEM-XG在触发词分类任务上的F1值为94.4%,在论元分类任务上的F1值为94.0%。在ACE2005数据集上,SEM-XG在触发词分类任务上的F1值为76.7%,在论元分类任务上的F1值为66.3%。实验结果表明,本文模型能够有效提升事件抽取的效果。【局限】尚未探究联合事件抽取模型迁移到搜索引擎、智能问答等任务上的效果。【结论】通过句法信息增强以及图注意力网络建模,能够显著提升联合事件抽取的效果。本文对于触发词分类和论元分类,提升事件抽取在科技文献分析、信息检索等领域的应用效果具有重要参考意义。 展开更多
关键词 事件抽取 xlnet 图注意力网络 联合抽取 句法信息增强
原文传递
基于XLNet与双向注意力的机器阅读理解研究
10
作者 解红涛 牛甲奎 《计算机与数字工程》 2024年第10期3059-3064,共6页
机器阅读理解目的是使机器能够阅读并准确理解一段自然语言文本,并回答给定的问题,具有很高的研究和应用价值。针对现有的通用领域机器阅读理解模型缺乏文档与问题的有效交互信息而导致准确率较低的问题,论文提出一种基于XLNet与双向注... 机器阅读理解目的是使机器能够阅读并准确理解一段自然语言文本,并回答给定的问题,具有很高的研究和应用价值。针对现有的通用领域机器阅读理解模型缺乏文档与问题的有效交互信息而导致准确率较低的问题,论文提出一种基于XLNet与双向注意力的阅读理解模型。该模型在嵌入层使用XLNet预训练语言模型生成具有上下文依赖的词向量对内容和问题分别进行序列表示,在编码层使用两层LSTM提取语义特征,在交互层使用两种双向注意力机制(Bi-Attention和Co-Attention)提取序列特征,再使用自注意力机制得到进一步增强的文本特征表示并进行向量融合,最后经过双向LSTM建模后输入输出层得到答案的开始和结束位置。通过在DuReader中文数据集中实验测试,结果表明EM和F1值均得到提升。 展开更多
关键词 机器阅读理解 xlnet 双向注意力 LSTM
在线阅读 下载PDF
基于XLNet的情感分析模型 被引量:12
11
作者 梁淑蓉 谢晓兰 +1 位作者 陈基漓 许可 《科学技术与工程》 北大核心 2021年第17期7200-7207,共8页
目前通过深度学习方法进行语言模型预训练是情感分析的主要方式,XLNet模型的提出解决了BERT模型上下游任务不一致的问题。在XLNet基础上增加LSTM网络层和Attention机制,提出XLNet-LSTM-Att情感分析优化模型,通过XLNet预训练模型获取包... 目前通过深度学习方法进行语言模型预训练是情感分析的主要方式,XLNet模型的提出解决了BERT模型上下游任务不一致的问题。在XLNet基础上增加LSTM网络层和Attention机制,提出XLNet-LSTM-Att情感分析优化模型,通过XLNet预训练模型获取包含上下文语义信息的特征向量,接着利用LSTM提取上下文相关特征,最后引入注意力机制根据特征重要程度赋予不同权重,再进行文本情感倾向性分析。仿真实验中将XLNet-LSTM-Att模型与5种常用的情感分析模型进行对比,结果表明提出的模型优于其他测试模型,模型的精准率达到89.29%。 展开更多
关键词 情感分析 xlnet LSTM 注意力机制
在线阅读 下载PDF
基于XLNet的双通道特征融合文本分类模型 被引量:2
12
作者 孟金旭 单鸿涛 +5 位作者 黄润才 闫丰亭 李志伟 郑光远 刘一鸣 石昌通 《山东大学学报(理学版)》 CAS CSCD 北大核心 2023年第5期36-45,共10页
提出了基于XLNet的双通道特征融合文本分类(XLNet-CNN-BiGRU, XLCBG)模型。相对于单模型通道,XLCBG模型通过融合XLNet+CNN和XLNet+BiGRU这2个通道的特征信息,能提取更加丰富的语义特征。XLCBG模型对融合后的特征信息分别采用了Maxpoolin... 提出了基于XLNet的双通道特征融合文本分类(XLNet-CNN-BiGRU, XLCBG)模型。相对于单模型通道,XLCBG模型通过融合XLNet+CNN和XLNet+BiGRU这2个通道的特征信息,能提取更加丰富的语义特征。XLCBG模型对融合后的特征信息分别采用了Maxpooling、Avgpooling和注意力机制等处理方式,分别提取全局中特征值最大的向量、全局中的均值特征向量、注意力机制的关键特征来代替整个向量,从而使融合特征处理的方式多样化,使最优分类模型的可选择性增多。最后,将当前流行的文本分类模型与XLCBG模型进行了比较实验。实验结果表明:XLCBG-S模型在中文THUCNews数据集上分类性能优于其他模型;XLCBG-Ap模型在英文AG News数据集上分类性能优于其他模型;在英文20NewsGroups数据集上,XLCBG-Att模型在准确率、召回率指标上均优于其他模型,XLCBG-Mp模型在精准率、F1指标上均优于其他模型。 展开更多
关键词 xlnet 双通道 文本分类 BiGRU CNN
原文传递
基于XLNet+BiGRU+Att(Label)的文本分类模型 被引量:2
13
作者 刘柏霆 管卫利 李陶深 《广西科学院学报》 2022年第4期412-419,共8页
传统的词向量嵌入模型,如Word2Vec、GloVe等模型无法实现一词多义表达;传统的文本分类模型也未能很好地利用标签词的语义信息。基于此,提出一种基于XLNet+BiGRU+Att(Label)的文本分类模型。首先用XLNet生成文本序列与标签序列的动态词... 传统的词向量嵌入模型,如Word2Vec、GloVe等模型无法实现一词多义表达;传统的文本分类模型也未能很好地利用标签词的语义信息。基于此,提出一种基于XLNet+BiGRU+Att(Label)的文本分类模型。首先用XLNet生成文本序列与标签序列的动态词向量表达;然后将文本向量输入到双向门控循环单元(BiGRU)中提取文本特征信息;最后将标签词与注意力机制结合,选出文本的倾向标签词,计算倾向标签词与文本向量的注意力得分,根据注意力得分更新文本向量。通过对比实验,本文模型比传统模型在文本分类任务中的准确率更高。使用XLNet作为词嵌入模型,在注意力计算时结合标签词能够提升模型的分类性能。 展开更多
关键词 文本分类 xlnet BiGRU 标签词 注意力机制
在线阅读 下载PDF
基于XLNet-BiLSTM的中文电子病历命名实体识别方法 被引量:9
14
作者 沈宙锋 苏前敏 郭晶磊 《智能计算机与应用》 2021年第8期97-102,共6页
中文临床电子病历命名实体识别是实现智慧医疗的基本任务之一。本文针对传统的词向量模型文本语义表示不充分,以及循环神经网络(RNN)模型无法解决长时间依赖等问题,提出一个基于XLNet的中文临床电子病历命名实体识别模型XLNet-BiLSTM-MH... 中文临床电子病历命名实体识别是实现智慧医疗的基本任务之一。本文针对传统的词向量模型文本语义表示不充分,以及循环神经网络(RNN)模型无法解决长时间依赖等问题,提出一个基于XLNet的中文临床电子病历命名实体识别模型XLNet-BiLSTM-MHA-CRF,将XLNet预训练语言模型作为嵌入层,对病历文本进行向量化表示,解决一词多义等问题;利用双向长短时记忆网络(BiLSTM)门控制单元获取句子的前向和后向语义特征信息,将特征序列输入到多头注意力层(multihead attention,MHA);利用MHA获得特征序列不同子空间表示的信息,增强上下文语义的关联性,同时剔除噪声;最后输入条件随机场CRF识别全局最优序列。实验结果表明,XLNet-BiLSTM-Attention-CRF模型在CCKS-2017命名实体识别数据集上取得了良好的效果。 展开更多
关键词 电子病历 命名实体识别 xlnet 多头注意力
在线阅读 下载PDF
基于XLnet语言模型的中文命名实体识别 被引量:11
15
作者 姚贵斌 张起贵 《计算机工程与应用》 CSCD 北大核心 2021年第18期156-162,共7页
语言模型的建立对挖掘句子内部语义信息有着直接的影响,为了提高中文命名实体识别率,字的语义表示是关键所在。针对传统的中文命名实体识别算法没有充分挖掘到句子内部的隐藏信息问题,该文利用LSTM提取经过大规模语料预训练生成的字向... 语言模型的建立对挖掘句子内部语义信息有着直接的影响,为了提高中文命名实体识别率,字的语义表示是关键所在。针对传统的中文命名实体识别算法没有充分挖掘到句子内部的隐藏信息问题,该文利用LSTM提取经过大规模语料预训练生成的字向量特征,同时将词向量预测矩阵传入到字向量特征提取阶段,通过矩阵运算融合为词向量特征,并进一步利用CNN提取词语之间的空间信息,将其与得到的词向量特征整合到一起输入语言模型XLnet(Generalized autoregressive pretraining for language understanding)中,然后经过BiGRU-CRF输出最优标签序列,提出了CAW-XLnet-BiGRU-CRF网络框架。并与其他的语言模型作了对比分析,实验结果表明,该框架解决了挖掘内部隐藏信息不充分问题,在《人民日报》1998年1月份数据集上的F1值达到了95.73%,能够较好地应用于中文命名实体识别任务。 展开更多
关键词 命名实体识别 词向量 xlnet 语言模型
在线阅读 下载PDF
基于XLNet-BiLSTM模型的中文影评情感分析 被引量:3
16
作者 张碧依 陶宏才 《成都信息工程大学学报》 2021年第3期264-269,共6页
对影评进行情感分析可以为用户观看电影提供一定的参考意见。针对Word2Vec等静态词向量技术不能学习文本的深层信息、解决一词多义及RNN存在的长期依赖和上下文深层语义挖掘不充分的问题,提出一种基于XLNet-BiLSTM的中文影评情感分类模... 对影评进行情感分析可以为用户观看电影提供一定的参考意见。针对Word2Vec等静态词向量技术不能学习文本的深层信息、解决一词多义及RNN存在的长期依赖和上下文深层语义挖掘不充分的问题,提出一种基于XLNet-BiLSTM的中文影评情感分类模型。首先,使用XLNet预训练语言模型生成具有上下文依赖的词向量来对影评信息进行分布式表征;然后,将词向量输入到BiLSTM网络中,对评论的深层语义进行分析和计算;最后,使用softmax函数实现影评情感极性分类。通过爬取豆瓣电影上的评论对模型进行训练和测试,实验结果表明,模型的准确率为0.924,损失率为0.184,相比于相关的情感分析模型取得了更好的效果。 展开更多
关键词 情感分析 词向量 xlnet BiLSTM
在线阅读 下载PDF
基于XLNet的业务流程下一活动预测方法 被引量:3
17
作者 夏灿铭 邢玛丽 何胜煌 《计算机集成制造系统》 EI CSCD 北大核心 2023年第10期3496-3503,共8页
预测性业务流程监控侧重于使用事件日志预测正在运行流程的未来特征,针对大多数现有业务流程预测方法的缺点,例如无法捕获序列的长距离依赖、只能单向利用序列信息,提出一种基于XLNet的业务流程下一活动预测方法。该方法实现了长程记忆... 预测性业务流程监控侧重于使用事件日志预测正在运行流程的未来特征,针对大多数现有业务流程预测方法的缺点,例如无法捕获序列的长距离依赖、只能单向利用序列信息,提出一种基于XLNet的业务流程下一活动预测方法。该方法实现了长程记忆,并采用注意力掩码重构事件序列,以利用序列的双向信息。通过在4个公开数据集上进行评估表明,该方法的平均准确率具有优越性,且在日志记录充分时,该方法对业务流程下一活动的预测准确率较高,可为业务流程管理系统提供实时的决策依据。 展开更多
关键词 业务流程实例 下一活动预测 深度学习 xlnet模型
在线阅读 下载PDF
基于XLNet的医学文本实体关系识别模型 被引量:1
18
作者 郑增亮 沈宙锋 苏前敏 《智能计算机与应用》 2023年第4期8-13,共6页
目前在处理医学文本实体间关系提取任务中,使用传统的词向量表示方法无法解决医学文本中的词多义性问题,加上基于长短时记忆网络对文本语义局部特征抽取不够充分,不能充分捕捉医疗文本隐藏的内部关联信息。因此,提出一种基于XLNet-BiGRU... 目前在处理医学文本实体间关系提取任务中,使用传统的词向量表示方法无法解决医学文本中的词多义性问题,加上基于长短时记忆网络对文本语义局部特征抽取不够充分,不能充分捕捉医疗文本隐藏的内部关联信息。因此,提出一种基于XLNet-BiGRU-Attention-TextCNN的医疗文本实体关系抽取模型。利用XLNet模型将输入的医疗文本转化为向量形式,接着连接双向门控循环神经网络(BiGRU)提取文本语句的长距离依赖关系,然后使用注意力机制(Attention)为特征序列分配权重,降低噪声影响,最后利用文本卷积神经网络(TextCNN)对序列进行局部特征提取并通过softmax层输出关系抽取结果。实验结果表明,本文所提模型在精确率、召回率和F值上均优于基准模型。 展开更多
关键词 医疗文本 医疗实体关系抽取 xlnet 双向门控循环单元 注意力机制 TextCNN
在线阅读 下载PDF
融合XLnet与DMGAN的文本生成图像方法 被引量:1
19
作者 赵泽纬 车进 吕文涵 《液晶与显示》 CAS CSCD 北大核心 2024年第2期168-179,共12页
针对文本生成图像任务中的文本编码器不能深度挖掘文本信息,导致后续生成的图像存在语义不一致的问题,本文提出了一种改进DMGAN模型的文本生成图像方法。首先使用XLnet的预训练模型对文本进行编码,该模型在大规模语料库的预训练之下能... 针对文本生成图像任务中的文本编码器不能深度挖掘文本信息,导致后续生成的图像存在语义不一致的问题,本文提出了一种改进DMGAN模型的文本生成图像方法。首先使用XLnet的预训练模型对文本进行编码,该模型在大规模语料库的预训练之下能够捕获大量文本的先验知识,实现对上下文信息的深度挖掘;然后在DMGAN模型生成图像的初始阶段和图像细化阶段均加入通道注意力模块,突出重要的特征通道,进一步提升生成图像的语义一致性和空间布局合理性,以及模型的收敛速度和稳定性。实验结果表明,所提出模型在CUB数据集上生成的图像相比原DMGAN模型,IS指标提升了0.47,FID指标降低了2.78,充分说明该模型具有更好的跨模态生成能力。 展开更多
关键词 文本生成图像 xlnet模型 生成对抗网络 通道注意力
在线阅读 下载PDF
基于XLNet和深度卷积聚合的长文本分类模型
20
作者 屈程浩 薛涛 胡伟华 《计算机与数字工程》 2024年第9期2640-2644,2674,共6页
在长文本分类任务中,预训练语言模型受到输入长度的限制,无法获取长距离语义信息,而截断长文本会丢失分段之间的关联信息。针对此问题,论文提出了对截断文本进行聚合分类的模型。首先,通过XLNet语言模型得到截断文本的语义向量,使用双... 在长文本分类任务中,预训练语言模型受到输入长度的限制,无法获取长距离语义信息,而截断长文本会丢失分段之间的关联信息。针对此问题,论文提出了对截断文本进行聚合分类的模型。首先,通过XLNet语言模型得到截断文本的语义向量,使用双向长短期记忆网络(BiLSTM)提取分段的时序信息,利用多通道深层卷积(MDCNN)对分段的语义向量进行聚合。MDCNN使用层级池化压缩分段文本的序列长度,利用多通道卷积获取多段文本的关联特征。为解决深层网络导致模型参数较多的问题,MDCNN使用等长卷积提取长文本的语义特征,固定特征维度减少语义信息丢失,利用线性预激活函数进行残差连接,避免了残差连接中维度映射的过程,使模型达到更深的网络层数。实验对比了几种常用的文本分类模型,该模型能有效地对长文本数据进行建模,具有较好的分类效果。 展开更多
关键词 文本分类 xlnet BiLSTM CNN 残差连接
在线阅读 下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部