期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
一种基于预训练语言模型XLNet的测井曲线重构方法 被引量:1
1
作者 曹茂俊 赵宇杰 《计算机技术与发展》 2025年第2期183-190,共8页
在油田勘探开发过程中,测井曲线作为地球物理测井的第一手资料,能够真实反映地下空间的分布与特性。然而,在实际工作中,由于井壁垮塌和仪器故障等原因,部分测井数据常常出现失真或缺失。为解决这一问题,该文提出了一种基于预训练语言模... 在油田勘探开发过程中,测井曲线作为地球物理测井的第一手资料,能够真实反映地下空间的分布与特性。然而,在实际工作中,由于井壁垮塌和仪器故障等原因,部分测井数据常常出现失真或缺失。为解决这一问题,该文提出了一种基于预训练语言模型XLNet的测井曲线重构方法。该方法通过筛选地层地质岩性特征指数,获取高质量的训练样本,并将其作为预训练模型重构测井曲线的依据。构建并训练带有预训练权重信息的XLNet模型,使模型具备对复杂地层特性的理解和数据重构能力。在模型的构建与训练过程中,引入了预训练权重,并进一步结合了LoRA(Low-Rank Adaptation)模块,以充分利用测井曲线之间的高度依赖关系,进而辅助XLNet生成和补全失真或缺失的测井数据。与已知曲线重构模型:基于注意力表征的长短期记忆神经网络(LSTM-Attent)、双向门控神经网络(BiGRU)、TimesNet及XLNet相比,基于预训练语言模型XLNet-LoRA的测井曲线重构模型具有更高的预测准确性。 展开更多
关键词 测井曲线重构 深度学习 预训练语言模型 xlnet网络 LoRA机制
在线阅读 下载PDF
基于XLNet-BiLSTM-Attention模型的假新闻检测研究
2
作者 韩晓鸿 郭恒 杨港 《智能计算机与应用》 2025年第9期96-100,共5页
随着社交多元化和网络技术的发展,网络上开始出现虚假新闻,给个人和社会造成了不利的影响。针对此现象,本文提出基于XLNet-BiLSTM-Attention神经模型的检测方法。首先使用XLNet获取具有上下文依赖的词向量,然后通过BiLSTM双向门控单元... 随着社交多元化和网络技术的发展,网络上开始出现虚假新闻,给个人和社会造成了不利的影响。针对此现象,本文提出基于XLNet-BiLSTM-Attention神经模型的检测方法。首先使用XLNet获取具有上下文依赖的词向量,然后通过BiLSTM双向门控单元获取深层次语义信息,最后利用Attention机制根据特征的重要性赋予不同的特征权重,并进行文本真实性检测。本文模型与4种常用神经模型进行对比,准确率达到94%,均高于其他4种模型,从而验证了该模型的有效性。 展开更多
关键词 假新闻检测 神经模型 xlnet BiLSTM 特征权重
在线阅读 下载PDF
融合XLnet与DMGAN的文本生成图像方法 被引量:1
3
作者 赵泽纬 车进 吕文涵 《液晶与显示》 CAS CSCD 北大核心 2024年第2期168-179,共12页
针对文本生成图像任务中的文本编码器不能深度挖掘文本信息,导致后续生成的图像存在语义不一致的问题,本文提出了一种改进DMGAN模型的文本生成图像方法。首先使用XLnet的预训练模型对文本进行编码,该模型在大规模语料库的预训练之下能... 针对文本生成图像任务中的文本编码器不能深度挖掘文本信息,导致后续生成的图像存在语义不一致的问题,本文提出了一种改进DMGAN模型的文本生成图像方法。首先使用XLnet的预训练模型对文本进行编码,该模型在大规模语料库的预训练之下能够捕获大量文本的先验知识,实现对上下文信息的深度挖掘;然后在DMGAN模型生成图像的初始阶段和图像细化阶段均加入通道注意力模块,突出重要的特征通道,进一步提升生成图像的语义一致性和空间布局合理性,以及模型的收敛速度和稳定性。实验结果表明,所提出模型在CUB数据集上生成的图像相比原DMGAN模型,IS指标提升了0.47,FID指标降低了2.78,充分说明该模型具有更好的跨模态生成能力。 展开更多
关键词 文本生成图像 xlnet模型 生成对抗网络 通道注意力
在线阅读 下载PDF
基于XLNet的多数据源中文地名匹配方法 被引量:1
4
作者 郑诗语 邱芹军 +2 位作者 谢忠 陶留锋 李伟杰 《地理空间信息》 2024年第8期59-63,88,共6页
地址作为社会发展中重要的基础性数据资源,已成为城市地理空间数据化建设的重要组成部分。地名匹配旨在比较表示相同真实世界位置的配对字符串。当前地名匹配方法依赖于字符串相似性独立或多种混合相似性度量方法,这些方法无法有效地捕... 地址作为社会发展中重要的基础性数据资源,已成为城市地理空间数据化建设的重要组成部分。地名匹配旨在比较表示相同真实世界位置的配对字符串。当前地名匹配方法依赖于字符串相似性独立或多种混合相似性度量方法,这些方法无法有效地捕捉长句子上下文信息,不能充分理解地址含义。因此,提出一种基于XLNet算法的地名匹配方法,利用深度神经网络将一对地名分类为匹配或不匹配。该方法利用长程记忆并使用双信息流注意力掩码对事件序列进行重构,以利用其双向信息建立表征。实验结果表明,该方法可解决长地址匹配问题,模型能较好地理解上下文语义信息,优于先前研究的单个相似度量及基于监督机器学习的方法。 展开更多
关键词 地名匹配 地名实体 xlnet Softmax 回归模型
在线阅读 下载PDF
TResX-BiGRU:科技人才履历实体识别模型
5
作者 李彪 陈燕红 +2 位作者 温明 肖天赐 韩博 《计算机技术与发展》 2025年第2期159-165,共7页
科技人才履历实体识别是人才知识图谱构建、人才推荐等应用的重要基础。针对传统语言模型在处理长文本时效果不佳,难以有效识别文本中的实体关键信息,导致实体识别准确率低等问题,该文设计了一种科技人才履历命名实体识别模型TResX-BiGR... 科技人才履历实体识别是人才知识图谱构建、人才推荐等应用的重要基础。针对传统语言模型在处理长文本时效果不佳,难以有效识别文本中的实体关键信息,导致实体识别准确率低等问题,该文设计了一种科技人才履历命名实体识别模型TResX-BiGRU。文本特征通过XLNet模型进行编码,捕捉其丰富的上下文语义信息;使用BiGRU模型对文本的时序特征进行有效建模,进一步挖掘深层次文本语义关系;引入残差连接充分融合文本的不同层次的特征信息,将XLNet与BiGRU的输出经过线性变换后进行累加,最后输出最佳的标签序列。在自建的科技人才履历Talents语料库与Resume数据集上进行了多层次的对比分析,实验结果表明,TResX-BiGRU模型达到了较好的性能,分别获得了82.36%与97.54%的F1值,在科技人才履历命名实体识别任务中是一种先进的模型。 展开更多
关键词 xlnet模型 BiGRU 科技人才履历 残差连接 命名实体识别
在线阅读 下载PDF
基于 XLNet 的农业命名实体识别方法 被引量:5
6
作者 陈明 顾凡 《河北农业大学学报》 CAS CSCD 北大核心 2023年第4期111-117,共7页
随着农业领域人工智能的研究不断深入,农业文本中命名实体识别是其他任务开展的基础之一。鉴于农业领域缺乏公开语料库,本文构建了自己的农业文本的注释语料库。针对目前存在的文本语义表达不足、缺乏语境特征、词向量多样性表达困难等... 随着农业领域人工智能的研究不断深入,农业文本中命名实体识别是其他任务开展的基础之一。鉴于农业领域缺乏公开语料库,本文构建了自己的农业文本的注释语料库。针对目前存在的文本语义表达不足、缺乏语境特征、词向量多样性表达困难等问题,本文提出了基于XLNet(Generalized Autoregressive Pretraining for Language Understanding,XLNet)的农业命名实体识别模型XLNet-IDCNN-CRF。嵌入层XLNet对于输入文本进行向量化表示,丰富文本的语义信息,缓解一词多义问题,通过编码层迭代膨胀卷积神经网络(Iterated Dilated Convolutional Neural Network,IDCNN)并行计算减少训练时间,获取文本特征信息,结合起来输入到输出层条件随机场模型(Conditional Random Field,CRF)识别标签信息,输出最优序列。本文在自建语料库上准确率达到95.58%,召回率92.36%,F1值93.91%,对比优于其他模型。实验结果表明,XLNet-IDCNNCRF模型能够较好地完成农业命名实体识别任务。 展开更多
关键词 农业文本 命名实体识别 xlnet模型 预训练语言模型 迭代膨胀卷积
在线阅读 下载PDF
基于XLnet语言模型的中文命名实体识别 被引量:11
7
作者 姚贵斌 张起贵 《计算机工程与应用》 CSCD 北大核心 2021年第18期156-162,共7页
语言模型的建立对挖掘句子内部语义信息有着直接的影响,为了提高中文命名实体识别率,字的语义表示是关键所在。针对传统的中文命名实体识别算法没有充分挖掘到句子内部的隐藏信息问题,该文利用LSTM提取经过大规模语料预训练生成的字向... 语言模型的建立对挖掘句子内部语义信息有着直接的影响,为了提高中文命名实体识别率,字的语义表示是关键所在。针对传统的中文命名实体识别算法没有充分挖掘到句子内部的隐藏信息问题,该文利用LSTM提取经过大规模语料预训练生成的字向量特征,同时将词向量预测矩阵传入到字向量特征提取阶段,通过矩阵运算融合为词向量特征,并进一步利用CNN提取词语之间的空间信息,将其与得到的词向量特征整合到一起输入语言模型XLnet(Generalized autoregressive pretraining for language understanding)中,然后经过BiGRU-CRF输出最优标签序列,提出了CAW-XLnet-BiGRU-CRF网络框架。并与其他的语言模型作了对比分析,实验结果表明,该框架解决了挖掘内部隐藏信息不充分问题,在《人民日报》1998年1月份数据集上的F1值达到了95.73%,能够较好地应用于中文命名实体识别任务。 展开更多
关键词 命名实体识别 词向量 xlnet 语言模型
在线阅读 下载PDF
基于XLNet的业务流程下一活动预测方法 被引量:3
8
作者 夏灿铭 邢玛丽 何胜煌 《计算机集成制造系统》 EI CSCD 北大核心 2023年第10期3496-3503,共8页
预测性业务流程监控侧重于使用事件日志预测正在运行流程的未来特征,针对大多数现有业务流程预测方法的缺点,例如无法捕获序列的长距离依赖、只能单向利用序列信息,提出一种基于XLNet的业务流程下一活动预测方法。该方法实现了长程记忆... 预测性业务流程监控侧重于使用事件日志预测正在运行流程的未来特征,针对大多数现有业务流程预测方法的缺点,例如无法捕获序列的长距离依赖、只能单向利用序列信息,提出一种基于XLNet的业务流程下一活动预测方法。该方法实现了长程记忆,并采用注意力掩码重构事件序列,以利用序列的双向信息。通过在4个公开数据集上进行评估表明,该方法的平均准确率具有优越性,且在日志记录充分时,该方法对业务流程下一活动的预测准确率较高,可为业务流程管理系统提供实时的决策依据。 展开更多
关键词 业务流程实例 下一活动预测 深度学习 xlnet模型
在线阅读 下载PDF
基于XLNet的物联网领域命名实体识别 被引量:2
9
作者 葛海波 车虹葵 +1 位作者 赵其实 安康 《西安邮电大学学报》 2021年第2期21-26,共6页
为了提高物联网领域实体识别能力,提出基于XLNet的命名实体识别模型。通过分析物联网实体的语义特征及需求,将物联网领域的感知单元、计算单元、执行单元、消息单元、服务单元、位置单元和观测单元抽象为实体,以此自建数据集。基于XLNe... 为了提高物联网领域实体识别能力,提出基于XLNet的命名实体识别模型。通过分析物联网实体的语义特征及需求,将物联网领域的感知单元、计算单元、执行单元、消息单元、服务单元、位置单元和观测单元抽象为实体,以此自建数据集。基于XLNet模型构建"XLNet+Bi-LSTM+Attention+CRF"命名实体识别模型,并与其他语言模型作对比分析。实验结果表明,该模型能够更好地挖掘文本信息,提高物联网领域实体识别的准确性,F1值达到了95.18%,能够较好地应用于物联网领域命名实体识别任务。 展开更多
关键词 物联网 命名实体识别 词向量 xlnet 语言模型
在线阅读 下载PDF
基于XLnet嵌入的中文命名实体识别方法 被引量:6
10
作者 郑洪浩 郝一诺 于洪涛 《信息工程大学学报》 2021年第4期473-477,共5页
命名实体识别是自然语言处理的核心任务。在基于深度学习的中文命名实体识别方法中,静态字向量无法表征字的多义性。针对该问题,提出了基于XLnet嵌入的中文命名实体识别方法。该方法首先通过XLnet(Generalized Autoregressive Pretraini... 命名实体识别是自然语言处理的核心任务。在基于深度学习的中文命名实体识别方法中,静态字向量无法表征字的多义性。针对该问题,提出了基于XLnet嵌入的中文命名实体识别方法。该方法首先通过XLnet(Generalized Autoregressive Pretraining for Language Understanding,XLnet)模型获取字级别的上下文表示。其次,利用BiLSTM-CRF模型获取文本依赖信息和标签信息。实验结果表明,该方法在人民日报、MSRA、Boson等3种数据集上分别达到91.9%、89.8%、74%的F1值,均高于其他主流的中文命名实体识别方法。 展开更多
关键词 中文命名实体识别 预训练语言模型 xlnet模型
在线阅读 下载PDF
基于深度学习的人文社会科学术文献构成要素自动识别研究
11
作者 何洪旭 《计算机应用文摘》 2024年第20期177-179,183,共4页
文章以人文社会科学领域的学术文献为研究对象,基于深度学习的预训练模式完成了微调文本多分类任务,实现了学术文献构成要素的自动识别。通过多组对比实验发现,在数据层面上,模型的分类效果在段落粒度的文本上表现较好,而句子粒度的文... 文章以人文社会科学领域的学术文献为研究对象,基于深度学习的预训练模式完成了微调文本多分类任务,实现了学术文献构成要素的自动识别。通过多组对比实验发现,在数据层面上,模型的分类效果在段落粒度的文本上表现较好,而句子粒度的文本由于丢失上下文依赖,导致性能下降幅度大;就模型而言,XLNet模型在长文本上的识别性能优于BERT模型;总体而言,深度学习在学术文献构成要素自动识别中取得了良好的效果。 展开更多
关键词 深度学习 结构要素识别 文本多分类 预训练模型 BERT xlnet
在线阅读 下载PDF
基于情感分析和Transformer模型的微博谣言检测 被引量:5
12
作者 冯茹嘉 张海军 潘伟民 《计算机与现代化》 2021年第10期1-7,共7页
针对微博文本以实现谣言检测为目标,深度挖掘微博正文内容的语义信息,并且着重强调用户在微博评论中体现的情感倾向性,提升谣言识别效果。为提高谣言检测的准确率,采取基于XLNet的词嵌入方法,使用Transformer的Encoder的模型提取微博正... 针对微博文本以实现谣言检测为目标,深度挖掘微博正文内容的语义信息,并且着重强调用户在微博评论中体现的情感倾向性,提升谣言识别效果。为提高谣言检测的准确率,采取基于XLNet的词嵌入方法,使用Transformer的Encoder的模型提取微博正文内容的语义特征,并结合BiLSTM+Attention网络实现微博评论的情感特征的提取,将2种特征向量进行拼接融合,进一步丰富神经网络的输入特征,之后输出微博事件的分类结果,进而实现微博谣言检测。实验结果显示,该模型对谣言识别的正确率达到94.8%。 展开更多
关键词 谣言检测 情感分析 xlnet Transformer模型 深度学习
在线阅读 下载PDF
自然语言处理技术发展 被引量:30
13
作者 王海宁 《中兴通讯技术》 2022年第2期59-64,共6页
基于神经网络和深度学习的预训练语言模型为自然语言处理技术带来了突破性发展。基于自注意力机制的Transformer模型是预训练语言模型的基础。GPT、BERT、XLNet等大规模预训练语言模型均基于Transformer模型进行堆叠和优化。认为目前依... 基于神经网络和深度学习的预训练语言模型为自然语言处理技术带来了突破性发展。基于自注意力机制的Transformer模型是预训练语言模型的基础。GPT、BERT、XLNet等大规模预训练语言模型均基于Transformer模型进行堆叠和优化。认为目前依赖强大算力和海量数据的大规模预训练语言模型存在实用问题,指出轻量预训练语言模型是未来重要的发展方向。 展开更多
关键词 自然语言处理 预训练语言模型 TRANSFORMER GPT BERT xlnet 模型优化
在线阅读 下载PDF
基于深度学习的中共党史文献命名实体识别研究 被引量:11
14
作者 曹树金 岳文玉 《情报资料工作》 CSSCI 北大核心 2022年第5期81-88,共8页
[目的/意义]基于深度学习的中共党史文献命名实体识别,有助于探索与挖掘党史资源的价值,对于构建中共党史领域专业术语库、知识图谱、知识问答系统等应用发挥着基础性作用,为进一步的智慧化的中共党史数字人文研究提供基础支撑。[方法/... [目的/意义]基于深度学习的中共党史文献命名实体识别,有助于探索与挖掘党史资源的价值,对于构建中共党史领域专业术语库、知识图谱、知识问答系统等应用发挥着基础性作用,为进一步的智慧化的中共党史数字人文研究提供基础支撑。[方法/过程]本研究采用基于Trie树的字符串匹配算法完成实验语料的批量标注任务,利用中文XLNet(Generalized Autoregressive Pretraining for Language Understanding,XLNet)预训练模型嵌入主流BiLSTM-CRF模型中,构建基于XLNet-BiLSTM-CRF的中共党史文献命名实体识别模型。[结果/结论]该模型在命名实体识别中表现优异,其调和平均数F值为0.9535,高于BiLSTM-CRF、BERT-BiLSTM-CRF、BERT-wwmext-BiLSTM-CRF、XLNet-CRF等深度学习模型。研究表明本文提出的方法对于中共党史非结构化文本挖掘工作具有可行性和有效性。 展开更多
关键词 深度学习 中共党史文献 命名实体识别 xlnet模型 BiLSTM-CRF模型
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部