期刊文献+
共找到214篇文章
< 1 2 11 >
每页显示 20 50 100
基于Transformer和Text-CNN的日志异常检测
1
作者 尹春勇 张小虎 《计算机工程与科学》 北大核心 2025年第3期448-458,共11页
日志数据作为软件系统中最为重要的数据资源之一,记录着系统运行期间的详细信息,自动化的日志异常检测对于维护系统安全至关重要。随着大型语言模型在自然语言处理领域的广泛应用,基于Transformer的日志异常检测方法被广泛地提出。传统... 日志数据作为软件系统中最为重要的数据资源之一,记录着系统运行期间的详细信息,自动化的日志异常检测对于维护系统安全至关重要。随着大型语言模型在自然语言处理领域的广泛应用,基于Transformer的日志异常检测方法被广泛地提出。传统的基于Transformer的方法,难以捕捉日志序列的局部特征,针对上述问题,提出了基于Transformer和Text-CNN的日志异常检测方法LogTC。首先,通过规则匹配将日志转换成结构化的日志数据,并保留日志语句中的有效信息;其次,根据日志特性采用固定窗口或会话窗口将日志语句划分为日志序列;再次,使用自然语言处理技术Sentence-BERT生成日志语句的语义化表示;最后,将日志序列的语义化向量输入到LogTC日志异常检测模型中进行检测。实验结果表明,LogTC能够有效地检测日志数据中的异常,且在2个数据集上都取得了较好的结果。 展开更多
关键词 日志异常检测 深度学习 词嵌入 TRANSFORMER text-cnn
在线阅读 下载PDF
基于Text-CNN模型的工程质量信息化研究
2
作者 母晓维 《建筑机械化》 2025年第9期28-32,共5页
针对建设工程质量问题分类的复杂性与数据不平衡问题,提出Text-CNN模型进行智能分类,通过数据预处理与基于语言学规则的数据增强方法解决类别不平衡问题,实现数据集的适度平衡。构建并训练Text-CNN模型,有效实现建设工程质量问题的识别... 针对建设工程质量问题分类的复杂性与数据不平衡问题,提出Text-CNN模型进行智能分类,通过数据预处理与基于语言学规则的数据增强方法解决类别不平衡问题,实现数据集的适度平衡。构建并训练Text-CNN模型,有效实现建设工程质量问题的识别与分类,与SVM和LSTM模型对比,Text-CNN在准确率与召回率及精确率方面具有明显优势,证明了其在建设工程监理信息化中的高效性与实用性。 展开更多
关键词 工程质量 施工监理 卷积神经网络 text-cnn 信息化
原文传递
融合Text-CNN与注意力机制的特产小吃评论情感分析 被引量:2
3
作者 韦斯羽 朱广丽 谈光璞 《阜阳师范大学学报(自然科学版)》 2023年第1期57-63,共7页
面向特产小吃评论数据的情感分析,旨在挖掘消费者对不同特产小吃的观点和看法,从而提高特产小吃产品的销量。针对当前特产小吃评论情感分析准确率较低的问题,本文构建了特产小吃评论数据集,并提出一种融合Text-CNN(Convolutional Naural... 面向特产小吃评论数据的情感分析,旨在挖掘消费者对不同特产小吃的观点和看法,从而提高特产小吃产品的销量。针对当前特产小吃评论情感分析准确率较低的问题,本文构建了特产小吃评论数据集,并提出一种融合Text-CNN(Convolutional Naural Networks)与注意力机制的模型对其进行情感分析。首先,通过Text-CNN对文本局部特征信息进行提取;然后,将局部特征引入注意力机制单元中,完成对文本信息的特征提取。最后在Softmax分类器中输入提取的特征,进行情感分类。实验结果表明,提出的模型与Text-CNN、Bi-RNN+Attention、Char-CNN、LEAM四种模型进行对比,准确率有所提升。 展开更多
关键词 情感分析 特产小吃 text-cnn 注意力机制
在线阅读 下载PDF
利用Text-CNN改进PubMedBERT在化学诱导性疾病实体关系分类效果的尝试 被引量:1
4
作者 董淼 苏中琪 +3 位作者 周晓北 兰雪 崔志刚 崔雷 《数据分析与知识发现》 CSSCI CSCD 北大核心 2021年第11期145-152,共8页
【目的】改进PubMedBERT在化学诱导性疾病(CID)实体关系分类的效果。【方法】提出一种基于PubMedBERT并结合Text-CNN的实体关系分类方法。该方法以实体对和文本组成句子对进行输入,利用PubMedBERT预训练模型对化学诱导性疾病相关文本进... 【目的】改进PubMedBERT在化学诱导性疾病(CID)实体关系分类的效果。【方法】提出一种基于PubMedBERT并结合Text-CNN的实体关系分类方法。该方法以实体对和文本组成句子对进行输入,利用PubMedBERT预训练模型对化学诱导性疾病相关文本进行编码获取全局特征,通过Text-CNN捕捉文本局部重要信息,判断实体对是否具有CID关系。【结果】在BioCreative V CDR数据集中,该方法的精确率、召回率和F1值分别达到78.3%、73.5%和75.8%,较其他方法最少提升了3.1%、1.5%和3.3%。【局限】仅考虑了化学诱导性疾病文本语料,在临床等其他语料上的效果有待检验。【结论】该方法能够捕捉化学诱导性疾病文本特征,提升实体关系分类的效果。 展开更多
关键词 CID实体关系分类 PubMedBERT text-cnn 句子对
原文传递
基于ERNIE-CAB-CNN的稀土专利文本分类模型
5
作者 廖列法 石利娇 《电子技术应用》 2025年第1期18-24,共7页
针对稀土专利文本专业性强的特点以及现有的文本分类方法存在的不足,鉴于类别注意力在计算机视觉领域的广泛应用和取得的良好效果,提出了一种用于文本分类的类别注意力模块(Category Attention Module,CAB),并结合预训练模型ERNIE和卷... 针对稀土专利文本专业性强的特点以及现有的文本分类方法存在的不足,鉴于类别注意力在计算机视觉领域的广泛应用和取得的良好效果,提出了一种用于文本分类的类别注意力模块(Category Attention Module,CAB),并结合预训练模型ERNIE和卷积神经网络(Convolutional Neural Networks,CNN)构建了一个用于稀土专利文本分类的创新模型ERNIE-CAB-CNN。模型使用ERNIE对专利文本进行向量化,得到语义信息更加丰富的向量表示后,通过CAB为文本中各个类别的重要特征赋予较高权值,使模型可以更准确地区分不同类别的特征。最后用CNN进一步提取文本中其他关键局部特征,得到的最终文本向量表示用于分类。通过Patsnap专利数据库官方网站检索下载稀土专利数据构建数据集进行实验,实验结果表明,稀土专利文本分类模型ERNIE-CAB-CNN在测试集上分类的准确率、精确率、F1分数分别为82.68%、83.2%、82.06%,取得了良好的分类效果。 展开更多
关键词 稀土专利分类 文本分类 类别注意力 ERNIE CNN 特征提取
在线阅读 下载PDF
基于多模态财务大数据的智能分析预测模型 被引量:2
6
作者 王伯平 王邦平 《无线电通信技术》 北大核心 2025年第3期501-510,共10页
当前,研究者对财务领域的文本情感分析和语音情感识别越来越感兴趣,因其可以捕捉到企业利益相关者(如管理者和投资者)的意图和意见。结合文本情感信息,企业在预测财务绩效方面取得了显著的性能提升。然而,仅考虑文本情感,对管理者的情... 当前,研究者对财务领域的文本情感分析和语音情感识别越来越感兴趣,因其可以捕捉到企业利益相关者(如管理者和投资者)的意图和意见。结合文本情感信息,企业在预测财务绩效方面取得了显著的性能提升。然而,仅考虑文本情感,对管理者的情感状态以及对财务危机预测的关注度远远不够。因此提出了一种基于多模态财务大数据的智能分析预测模型(Multi Modal Financial Intelligent Model,MMFIM),融合了语音情感特征、文本情感特征以及传统财务特征多模态数据以解决上述问题。MMFIM通过卷积神经网络(Convolutional Neural Network,CNN)模型识别管理者的语音情感状态,利用FinBERT模型抽取文本情感特征,将获得的情感信息与传统的财务指标相融合实现对财务危机更准确的预测。在美国40家最大(按市值计算)企业的1278次财报电话会议数据上对MMFIM模型进行验证,实验结果表明,与现有预测模型相比,所提MMFIM模型具有更高的准确率。 展开更多
关键词 多模态 语音情感识别 文本情感分析 卷积神经网络 FinBERT 财务危机预测
在线阅读 下载PDF
融合BiLSTM与CNN的推特黑灰产分类模型 被引量:3
7
作者 朱恩德 王威 高见 《计算机工程与应用》 北大核心 2025年第1期186-195,共10页
当前推特等国外社交平台,已成为从事网络黑灰产犯罪不可或缺的工具,对推特上黑灰产账号进行发现、检测和分类对于打击网络犯罪、维护社会稳定具有重大意义。现有的推文分类模型双向长短时记忆网络(bi-directional long short-term memor... 当前推特等国外社交平台,已成为从事网络黑灰产犯罪不可或缺的工具,对推特上黑灰产账号进行发现、检测和分类对于打击网络犯罪、维护社会稳定具有重大意义。现有的推文分类模型双向长短时记忆网络(bi-directional long short-term memory,BiLSTM)可以学习推文的上下文信息,却无法学习局部关键信息,卷积神经网络(convolution neural network,CNN)模型可以学习推文的局部关键信息,却无法学习推文的上下文信息。结合BiLSTM与CNN两种模型的优势,提出了BiLSTM-CNN推文分类模型,该模型将推文进行向量化后,输入BiLSTM模型学习推文的上下文信息,再在BiLSTM模型后引入CNN层,进行局部特征的提取,最后使用全连接层将经过池化的特征连接在一起,并应用softmax函数进行四分类。模型在自主构建的中文推特黑灰产推文数据集上进行实验,并使用TextCNN、TextRNN、TextRCNN三种分类模型作为对比实验,实验结果显示,所提的BiLSTM-CNN推文分类模型在对四类推文进行分类的宏准确率为98.32%,明显高于TextCNN、TextRNN和TextRCNN三种模型的准确率。 展开更多
关键词 文本分类 双向长短期记忆网络(BiLSTM) 卷积神经网络(CNN) 黑灰产 推特
在线阅读 下载PDF
融合文本分析和CNN-BiLSTM模型的校园霸凌舆情分析——以邯郸初中生被害案为例 被引量:1
8
作者 黄金柱 杨云飞 +2 位作者 周丹萍 王淑影 王纯杰 《情报探索》 2025年第1期64-71,共8页
[目的/意义]校园霸凌是一种严重影响学生身心健康的现象,在教育领域和社会中引起了广泛关注。本文旨在深入研究校园霸凌事件,揭示公众对校园霸凌的态度和看法。[方法/过程]应用Python软件爬取公众对某校园霸凌热点事件的微博评论数据,... [目的/意义]校园霸凌是一种严重影响学生身心健康的现象,在教育领域和社会中引起了广泛关注。本文旨在深入研究校园霸凌事件,揭示公众对校园霸凌的态度和看法。[方法/过程]应用Python软件爬取公众对某校园霸凌热点事件的微博评论数据,使用文本分析和CNN-BiLSTM模型对该事件中民众的主要观点进行情感分析研究。[结果/结论]通过实例分析说明了该模型具有更好的预测准确率,并得到舆论关注的热点,提出舆论应对建议。 展开更多
关键词 教育舆情 校园霸凌 文本分析 情感分析 CNN-BiLSTM模型
在线阅读 下载PDF
基于长短期记忆网络-卷积神经网络的电力设备缺陷文本归口研究
9
作者 王璇 曹靖 韩培洁 《山西电力》 2025年第1期10-14,共5页
随着电网企业发展,电网生产运营中会产生大量电力设备缺陷文本,其中蕴含着电力设备维护与检修的重要信息。由于缺陷文本是非结构化数据,其价值的挖掘依赖于归口,为提升文本利用效率,提出了一种基于长短期记忆网络-卷积神经网络的电力设... 随着电网企业发展,电网生产运营中会产生大量电力设备缺陷文本,其中蕴含着电力设备维护与检修的重要信息。由于缺陷文本是非结构化数据,其价值的挖掘依赖于归口,为提升文本利用效率,提出了一种基于长短期记忆网络-卷积神经网络的电力设备缺陷文本自动归口模型。以变压器缺陷文本为例开展研究,模型采用长短期记忆网络对词的权重进行学习,卷积神经网络对带权重的词进行特征提取,用softmax进行分类,最终得到文本归口。通过算例分析,证明该模型在准确度、召回率等方面均优于卷积神经网络等常规方法。 展开更多
关键词 电力设备缺陷文本 文本分类 长短期记忆网络 卷积神经网络
在线阅读 下载PDF
基于循环和卷积神经网络的句子级文本情感分类研究
10
作者 昝嵘 《计算机与网络》 2025年第4期357-362,共6页
现有的句子级文本情感分类中,采用简单的词袋模型在获取句子级全局语义表示时,只能捕捉文本中的部分上下文关系和语义依赖,导致情感分类的准确性降低。为此,提出基于循环和卷积神经网络(Convolutional Neural Network,CNN)的句子级文本... 现有的句子级文本情感分类中,采用简单的词袋模型在获取句子级全局语义表示时,只能捕捉文本中的部分上下文关系和语义依赖,导致情感分类的准确性降低。为此,提出基于循环和卷积神经网络(Convolutional Neural Network,CNN)的句子级文本情感分类研究。对句子级文本进行预处理,去除高频但无实际情感贡献的停用词,利用Word2Vec词嵌入技术和Skip-gram模型训练词向量。通过长短时记忆(Long Short Term Memory,LSTM)网络对预处理后的文本进行建模,得到句子级的全局语义表示。利用CNN对句子级文本语义特征进行提取,通过设定卷积核参数并进行卷积运算,结合分段池化技术,形成丰富的特征向量。采用softmax函数作为分类机制,将特征向量转化为情感分类的条件概率分布,判断句子级文本的情感类别。实验结果表明,所提方法在混淆矩阵和曲线下面积(Area Under Curve,AUC)值上均优于对比方法,可实现更加精准的句子级文本情感分类。 展开更多
关键词 循环神经网络 卷积神经网络 句子级文本 情感分类 语义表示
在线阅读 下载PDF
基于R-CNN的中医医案诊断分类方法
11
作者 邱雪峰 查青林 朱根华 《现代信息科技》 2025年第13期47-52,57,共7页
针对中医医案中常见的复杂语句结构,以及在诊断分类中上下文语义捕捉不足的问题,文章提出一种基于RoBERTa、R-CNN和多头自注意力机制的中医医案诊断分类模型。首先,通过RoBERTa对文本进行预训练,获取深层语义表示,增强上下文理解能力。... 针对中医医案中常见的复杂语句结构,以及在诊断分类中上下文语义捕捉不足的问题,文章提出一种基于RoBERTa、R-CNN和多头自注意力机制的中医医案诊断分类模型。首先,通过RoBERTa对文本进行预训练,获取深层语义表示,增强上下文理解能力。然后,采用R-CNN提取局部特征信息,捕捉语义与症状。进一步引入多头自注意力机制,强化长距离依赖关系建模,获取文本中的关键信息。该模型充分结合全局语义与局部特征,提升分类准确性。实验结果表明,模型在诊断分类任务中的预测精度和F1值分别达80.89%和79.76%,有效改善了文本分类性能。 展开更多
关键词 中医医案 R-CNN RoBERTa 多头自注意力机制 文本分类
在线阅读 下载PDF
基于改进ADAM算法的变电站SCD文本分词方法
12
作者 郑翔 陈韶昱 +3 位作者 吴俊飞 阮黎翔 骆兆军 徐小俊 《微型电脑应用》 2025年第1期255-258,共4页
针对电力领域文本数据分词准确性较低的问题,提出一种基于改进ADAM(adaptive moment estimation)算法的中文分词技术。选用Skip-Gram模型作为字嵌入模型,将字词转为分布式向量,搭建卷积神经网络-门控循环单元-条件随机场(CNN-Bi-GRU-CRF... 针对电力领域文本数据分词准确性较低的问题,提出一种基于改进ADAM(adaptive moment estimation)算法的中文分词技术。选用Skip-Gram模型作为字嵌入模型,将字词转为分布式向量,搭建卷积神经网络-门控循环单元-条件随机场(CNN-Bi-GRU-CRF)模型实现电力领域文本语句的分割,提出一种改进的ADAM算法,通过控制不同时间窗口的学习率优化神经网络模型,提高模型训练速度。将所提算法运用于变电站SCD(system configuration description)文本数据分词的算例分析,通过与其他主流分词算法进行比较,验证所提分词技术的先进性与准确性。 展开更多
关键词 中文分词技术 ADAM算法 CNN-Bi-GRU-CRF 变电站SCD文本
在线阅读 下载PDF
基于BERT-CNN-SIFRank的智能预问诊模型研究与设计
13
作者 崔晓笛 吴冠朋 刘文强 《中国数字医学》 2025年第8期65-71,共7页
目的:研究并设计智能预问诊模型,模拟医生实际问诊过程,准确了解患者就诊意图,自动解答患者提出的问题,减少患者问诊等待时间,提升患者就医体验,提高医生接诊效率。方法:基于深度学习技术构建智能预问诊模型,设计基于BERT-CNN的医疗文... 目的:研究并设计智能预问诊模型,模拟医生实际问诊过程,准确了解患者就诊意图,自动解答患者提出的问题,减少患者问诊等待时间,提升患者就医体验,提高医生接诊效率。方法:基于深度学习技术构建智能预问诊模型,设计基于BERT-CNN的医疗文本分类模型实现患者问题分类,利用基于SIFRank的医疗文本关键词抽取模型提取患者问题关键词,进而获取患者医疗问题意图。结果:基于BERT-CNN的医疗文本分类模型在公开数据集上的F1值达到82.84%,有效提高了医疗文本分类准确率。结论:基于BERT-CNNSIFRank的智能预问诊模型丰富了预问诊研究技术路线,为构建高效、智能、个性化的预问诊系统提供了理论模型基础,有利于促进互联网医院高质量发展。 展开更多
关键词 预问诊模型 医疗文本分类 医疗关键词抽取 BERT CNN
在线阅读 下载PDF
煤矿安全风险分析的文本数据模型与集成分析平台 被引量:2
14
作者 王启飞 王俊龙 +3 位作者 刘昊霖 赵逸涵 孙英峰 李蓓 《安全与环境学报》 CAS CSCD 北大核心 2024年第11期4358-4365,共8页
在煤矿安全领域,事故的预防至关重要。为了对煤矿开采风险进行深入分析,提出了一种基于文本数据的煤矿安全事故智能分析模型及集成分析平台。首先,采用融合数据增强技术的卷积神经网络文本分类(Text-Convolutional Neural Network,Text-... 在煤矿安全领域,事故的预防至关重要。为了对煤矿开采风险进行深入分析,提出了一种基于文本数据的煤矿安全事故智能分析模型及集成分析平台。首先,采用融合数据增强技术的卷积神经网络文本分类(Text-Convolutional Neural Network,Text-CNN)方法构建煤矿安全事故分析模型,对大量非结构化事故文本进行精准的分类筛选;然后,利用自然语言处理(Natural Language Processing,NLP)技术建立煤矿事故简报集成分析系统,通过该系统对煤矿事故报告进行事故统计分析、风险分析等,总结出不同地区煤矿事故的死亡情况与类型差异,明确了煤矿安全事故之间的潜在模式。研究表明,通过集合事故简报分析模型的集成分析平台可以实现对煤矿安全事故信息的获取再利用,分析事故潜在规律和风险大小,有助于提升煤矿的风险管理水平,提高事故预防能力。 展开更多
关键词 安全工程 煤矿事故 卷积神经网络文本分类(text-cnn) 自然语言处理(NLP) 事故预防
原文传递
基于多尺度注意力特征融合的场景文本检测 被引量:2
15
作者 厍向阳 刘哲 董立红 《计算机工程与应用》 CSCD 北大核心 2024年第1期198-206,共9页
针对目前文本检测中小尺度文本和长文本检测精度低的问题,提出了一种基于多尺度注意力特征融合的场景文本检测算法。该方法以Mask R-CNN为基线模型,引入Swin_Transformer作为骨干网络提取底层特征。在特征金字塔(feature pyramid networ... 针对目前文本检测中小尺度文本和长文本检测精度低的问题,提出了一种基于多尺度注意力特征融合的场景文本检测算法。该方法以Mask R-CNN为基线模型,引入Swin_Transformer作为骨干网络提取底层特征。在特征金字塔(feature pyramid networks,FPN)中,通过将多尺度注意力热图与底层特征通过横向连接相融合,使检测器的不同层级专注于特定尺度的目标,并利用相邻层注意力热图之间的关系实现了FPN结构中的纵向特征共享,避免了不同层之间梯度计算的不一致性问题。实验结果表明:在ICDAR2015数据集上,该方法的准确率、召回率和F值分别达到了88.3%、83.07%和85.61%,在CTW1500和Total-Text弯曲文本数据集上相较现有方法均有良好表现。 展开更多
关键词 场景文本检测 Mask R-CNN Swin Transformer 注意力机制 多尺度特征融合
在线阅读 下载PDF
基于CNN-LSTM的社交媒体大数据评论文本情感元自动识别方法 被引量:3
16
作者 刘丹 《微型电脑应用》 2024年第4期195-197,201,共4页
为了准确识别社交媒体评论文本情感,助力公众负面情绪引导,提出了基于CNN-LSTM的社交媒体大数据评论文本情感元自动识别方法。通过社交媒体大数据分类,并通过具有字典功能的Token将评论文本转换成数字列表。结合词嵌入技术得到向量列表... 为了准确识别社交媒体评论文本情感,助力公众负面情绪引导,提出了基于CNN-LSTM的社交媒体大数据评论文本情感元自动识别方法。通过社交媒体大数据分类,并通过具有字典功能的Token将评论文本转换成数字列表。结合词嵌入技术得到向量列表,完成社交媒体大数据向量转换的预处理。将预处理获取的向量列表输入CNN网络,得到评论文本情感元最终局部特征值。将该值传至LSTM,通过遗忘门、输入门、输出门调节,获取评论文本情感元特征表征结果,经Softmax分类器分类后,实现情感元自动识别。实验结果表明,该方法能有效完成实验数据预处理,用文字和标签的形式标记正面、负面情感元,并准确识别情感元,间接反映社会问题,应用性较强。 展开更多
关键词 社交媒体数据 评论文本 情感元 向量列表 CNN-LSTM 自动识别
在线阅读 下载PDF
结合DistilBERT与标签关联性的多标签文本分类 被引量:2
17
作者 王旭阳 耿留青 张鑫 《计算机工程与应用》 CSCD 北大核心 2024年第23期168-175,共8页
现有的多标签文本分类方法往往忽视了标签的关联性和语义信息,导致标签特征提取不充分,标签之间的相关性信息难以得到有效的利用,为解决这一问题,提出一个融合DistilBERT和标签关联性信息的模型IDLC。使用DistilBERT获得文本的和标签的... 现有的多标签文本分类方法往往忽视了标签的关联性和语义信息,导致标签特征提取不充分,标签之间的相关性信息难以得到有效的利用,为解决这一问题,提出一个融合DistilBERT和标签关联性信息的模型IDLC。使用DistilBERT获得文本的和标签的词向量表示,同时利用DistilBERT获取到包含文本上下文信息的全局特征,通过CNN提取文本局部特征,再使用图的形式来表示标签之间的相互关系,通过具有多头注意力机制的图注意力网络捕获包含关联信息的标签特征,最后通过特征融合方法将标签特征和文本特征进行融合,构建包含更多特征信息的文本表示,以此来提升模型的分类精度。在基准数据集上的实验结果表明,与基准模型相比,该方法能有效提升模型性能,在多标签文本分类任务中有更好的分类效果。 展开更多
关键词 多标签文本分类 DistilBERT 图注意力网络 卷积神经网络(CNN)
在线阅读 下载PDF
基于A-BiLSTM和CNN的文本分类 被引量:3
18
作者 黄远 戴晓红 +2 位作者 黄伟建 于钧豪 黄峥 《计算机工程与设计》 北大核心 2024年第5期1428-1434,共7页
为解决单一神经网络不能获取准确全局文本信息的问题,提出一种基于A-BiLSTM双通道和优化CNN的文本分类模型。A-BiLSTM双通道层使用注意力机制关注对文本分类贡献值较大的部分,并用BiLSTM提取文本中上下文语义信息;A-BiLSTM双通道层中将... 为解决单一神经网络不能获取准确全局文本信息的问题,提出一种基于A-BiLSTM双通道和优化CNN的文本分类模型。A-BiLSTM双通道层使用注意力机制关注对文本分类贡献值较大的部分,并用BiLSTM提取文本中上下文语义信息;A-BiLSTM双通道层中将两者输出的特征信息融合,得到高级语义;A-BiLSTM双通道层后,使用优化CNN的强学习能力提取关键局部特征,得到最终文本特征表示。分类器输出文本信息的类别。实验结果表明,该模型分类效果优于其它对比模型,具有良好的泛化能力。 展开更多
关键词 文本分类 深度学习 双通道网络 注意力机制 双向长短时记忆网络 卷积神经网络 词向量模型
在线阅读 下载PDF
基于BERT和改进对抗训练的痛风病历分类方法 被引量:3
19
作者 李胜煜 王磊 +2 位作者 徐文畅 贺玉伟 李鑫德 《计算机工程与设计》 北大核心 2024年第6期1668-1673,共6页
为解决痛风电子病历文本稀疏性高、数据集小导致的分类任务准确率低问题,提出一种基于BERT预训练模型和改进对抗训练的痛风病历文本分类算法。使用中文生物医学语言预训练模型MC-BERT初始化病历文本,下接Text-CNN网络捕捉文本中不同长... 为解决痛风电子病历文本稀疏性高、数据集小导致的分类任务准确率低问题,提出一种基于BERT预训练模型和改进对抗训练的痛风病历文本分类算法。使用中文生物医学语言预训练模型MC-BERT初始化病历文本,下接Text-CNN网络捕捉文本中不同长度的关键词信息,在模型训练过程中采用改进的对抗训练策略,在词嵌入中添加对抗性扰动提高模型的泛化性。实验结果表明,该算法可以提高中文痛风病历文本分类任务的精度,增强模型的鲁棒性。 展开更多
关键词 痛风 电子病历 文本分类 卷积神经网络 对抗训练 预训练模型 词嵌入
在线阅读 下载PDF
基于文本卷积神经网络模型的抗菌药物发现 被引量:1
20
作者 姚明丽 高丁佳 +4 位作者 张洁 李珊 吴松 司鑫鑫 夏杰 《中国药学杂志》 CAS CSCD 北大核心 2024年第3期249-255,共7页
目的 基于文本卷积神经网络(Text-Convolutional Neural Network, Text-CNN)算法,构建抗金黄色葡萄球菌(Staphylococcus aureus)活性的预测模型,通过虚拟筛选发现具有抑制S.aureus活性的苗头化合物。方法 从ChEMBL数据库中收集并整理了2... 目的 基于文本卷积神经网络(Text-Convolutional Neural Network, Text-CNN)算法,构建抗金黄色葡萄球菌(Staphylococcus aureus)活性的预测模型,通过虚拟筛选发现具有抑制S.aureus活性的苗头化合物。方法 从ChEMBL数据库中收集并整理了26327个标注有S.aureus活性数据的化合物,通过随机采样建立10组训练集和测试集,采用Text-CNN算法建立10个模型,通过模型评估选择性能最佳的模型,对该模型进行Y-随机化检验和应用域分析。使用该模型虚拟筛选内部化合物库,确定潜在的抗菌化合物,并采用微量肉汤稀释法测定化合物的抗S.aureus活性。结果 名为Text-CNN3的机器学习模型具有良好的分类性能,该模型对于测试集的马修斯相关系数为0.573,ROC曲线下面积为0.881。基于该模型的虚拟筛选和抗菌活性测试,发现了两个抗菌活性化合物Y5和Y7,其对S.aureus的最低抑菌浓度(minimal inhibitory concentration, MIC)分别为8和4μg·mL^(-1)。结论 本研究建立的Text-CNN3模型可有效发现抗S.aureus化合物,所发现的苗头化合物Y5和Y7有进一步研究的意义和价值。 展开更多
关键词 金黄色葡萄球菌 文本卷积神经网络 活性预测 最低抑菌浓度
原文传递
上一页 1 2 11 下一页 到第
使用帮助 返回顶部