期刊文献+
共找到216篇文章
< 1 2 11 >
每页显示 20 50 100
基于Transformer和Text-CNN的日志异常检测
1
作者 尹春勇 张小虎 《计算机工程与科学》 北大核心 2025年第3期448-458,共11页
日志数据作为软件系统中最为重要的数据资源之一,记录着系统运行期间的详细信息,自动化的日志异常检测对于维护系统安全至关重要。随着大型语言模型在自然语言处理领域的广泛应用,基于Transformer的日志异常检测方法被广泛地提出。传统... 日志数据作为软件系统中最为重要的数据资源之一,记录着系统运行期间的详细信息,自动化的日志异常检测对于维护系统安全至关重要。随着大型语言模型在自然语言处理领域的广泛应用,基于Transformer的日志异常检测方法被广泛地提出。传统的基于Transformer的方法,难以捕捉日志序列的局部特征,针对上述问题,提出了基于Transformer和Text-CNN的日志异常检测方法LogTC。首先,通过规则匹配将日志转换成结构化的日志数据,并保留日志语句中的有效信息;其次,根据日志特性采用固定窗口或会话窗口将日志语句划分为日志序列;再次,使用自然语言处理技术Sentence-BERT生成日志语句的语义化表示;最后,将日志序列的语义化向量输入到LogTC日志异常检测模型中进行检测。实验结果表明,LogTC能够有效地检测日志数据中的异常,且在2个数据集上都取得了较好的结果。 展开更多
关键词 日志异常检测 深度学习 词嵌入 TRANSFORMER text-cnn
在线阅读 下载PDF
基于Text-CNN模型的工程质量信息化研究
2
作者 母晓维 《建筑机械化》 2025年第9期28-32,共5页
针对建设工程质量问题分类的复杂性与数据不平衡问题,提出Text-CNN模型进行智能分类,通过数据预处理与基于语言学规则的数据增强方法解决类别不平衡问题,实现数据集的适度平衡。构建并训练Text-CNN模型,有效实现建设工程质量问题的识别... 针对建设工程质量问题分类的复杂性与数据不平衡问题,提出Text-CNN模型进行智能分类,通过数据预处理与基于语言学规则的数据增强方法解决类别不平衡问题,实现数据集的适度平衡。构建并训练Text-CNN模型,有效实现建设工程质量问题的识别与分类,与SVM和LSTM模型对比,Text-CNN在准确率与召回率及精确率方面具有明显优势,证明了其在建设工程监理信息化中的高效性与实用性。 展开更多
关键词 工程质量 施工监理 卷积神经网络 text-cnn 信息化
原文传递
一种基于日志信息和CNN-text的软件系统异常检测方法 被引量:41
3
作者 梅御东 陈旭 +4 位作者 孙毓忠 牛逸翔 肖立 王海荣 冯百明 《计算机学报》 EI CSCD 北大核心 2020年第2期366-380,共15页
当前,数据挖掘作为一种高时效性、高真实性的分析方法,正在社会中扮演着越发重要的角色,其在大型数据中快速挖掘模式,发现规律的能力正逐步取代人工的作用.而在当前各个计算机领域大行其道的大型分布式系统(如Hadoop、Spark等)的日志中... 当前,数据挖掘作为一种高时效性、高真实性的分析方法,正在社会中扮演着越发重要的角色,其在大型数据中快速挖掘模式,发现规律的能力正逐步取代人工的作用.而在当前各个计算机领域大行其道的大型分布式系统(如Hadoop、Spark等)的日志中,每天都产生着数以百万计的系统日志,这些日志的数据量之庞杂、关系之混乱,已大大影响了程序员对系统的人工监控效率,同时也提高了新程序员的培养成本.为解决以上问题,数据挖掘及系统分析两个领域相结合是一种必然的趋势,也因此,机器学习模型也越来越多地被业界提及用于做系统日志分析.然而大多数情况下,系统日志中,报告系统运行状态为“严重”的日志占少数,而这些少数信息才是程序员最需要关注的,然而大多数用于系统日志分析的机器学习模型都假设训练集的数据是均衡数据,因此这些模型在做系统日志预警时容易过度偏向大样本数据,以至于效果不够理想.本文将从深度学习角度出发,探究深度学习中的CNN-text(CT)在系统日志分析方面的应用能力,通过将CT与主流的系统日志分析机器学习模型SVM、决策树对比,探究CT相对于这些算法的优越性;将CT与CNN-RNN-text(CRT)进行对比,分析CT对特征的处理方式,证实CT在深度学习模型中处理系统日志类文本的优越性;最后将所有模型应用至两套不同的日志类文本数据中进行对比,证明CT的普适性.在CT同日志分析的主流机器学习模型对比的实验中,CT相较于最优模型的结果召回率提升了近15%;在CT同CRT模型对比的实验中,CT相较于更为先进的CRT,模型准确率高出约20%,召回率高出约80%、查准率高出约60%;在CT的普适性实验中,将各类模型融入到本文的实验数据集logstash和公开数据集WC85_1中,在准确率同其他表现较优的模型同为100%的情况下,CT的召回率高出其余召回率最高的模型(DT-Bi)近14%.从中可看出,相较于主流系统日志分析机器学习模型,如支持向量机、决策树、朴素贝叶斯等,CNN-text的局部特征提取能力及非线性拟合能力都有更为优异的表现;同时相较于同为深度学习CNN簇的CNN-RNN-text将大量权重投入到系统日志的序列特征中的特点,CNN-text则报以较少的关注,反而在序列不规则的系统日志中展现出比CNN-RNN-text更优秀的表现.最终证明了CNN-text是本文所提到的方法中最适合进行软件系统异常检测的方法. 展开更多
关键词 系统日志分析 系统异常预警 不均衡数据 机器学习 深度学习 cnn-text
在线阅读 下载PDF
基于TextCNN的文本情感分类系统 被引量:13
4
作者 张浩然 谢云熙 张艳荣 《哈尔滨商业大学学报(自然科学版)》 CAS 2022年第3期285-292,共8页
通过分析用户在线评论的文本信息来预测消费者的网购偏好意愿,进而提高消费者的满意度成为众多企业的需求.但庞大的评论数据量使得人工手动对评论文本进行分类打标签难以实现,结合Word2vec和TextCNN模型实现对在线评论进行文本情感分类... 通过分析用户在线评论的文本信息来预测消费者的网购偏好意愿,进而提高消费者的满意度成为众多企业的需求.但庞大的评论数据量使得人工手动对评论文本进行分类打标签难以实现,结合Word2vec和TextCNN模型实现对在线评论进行文本情感分类.对评论文本进行规格化处理,通过结巴分词库等对已处理数据进行分词,即提取关键字词.使用Word2vec工具对每个分词进行词向量的训练,得到word embedding权重矩阵作CNN模型的嵌入层,采用TextCNN模型训练得到本文的情感分类模型.相比于直接用传统的卷积神经网络CNN默认的词嵌入层,本文训练出来的神经网络模型效果更佳. 展开更多
关键词 在线评论 Word2vec textcnn 卷积神经网络 文本情感分
在线阅读 下载PDF
TextCNN文本分类技术在OA系统中的应用研究 被引量:3
5
作者 皎海军 廖晨阳 +1 位作者 杜胜贤 于劲松 《办公自动化》 2020年第14期45-48,共4页
随着大数据的发展,传统的办公软件迎来新的发展趋势。本文将Text CNN深度学习网络引入政务便民服务的全电子化系统中,研究自然语言处理领域的文本分类技术与协同型OA系统融合的方法,以实现政府公文的分发推荐服务。本着辅助而不干预的原... 随着大数据的发展,传统的办公软件迎来新的发展趋势。本文将Text CNN深度学习网络引入政务便民服务的全电子化系统中,研究自然语言处理领域的文本分类技术与协同型OA系统融合的方法,以实现政府公文的分发推荐服务。本着辅助而不干预的原则,计算机的智能决策结果将清晰地反馈给公文分派员,以辅助其做出最终的判断。该服务解决了政府部门人员短缺,公文分发出错率高的问题有效减少退回率,加快了公文的流转效率。 展开更多
关键词 textcnn 协同型OA 自然语言处理(NLP) 文本分类
在线阅读 下载PDF
融合Text-CNN与注意力机制的特产小吃评论情感分析 被引量:2
6
作者 韦斯羽 朱广丽 谈光璞 《阜阳师范大学学报(自然科学版)》 2023年第1期57-63,共7页
面向特产小吃评论数据的情感分析,旨在挖掘消费者对不同特产小吃的观点和看法,从而提高特产小吃产品的销量。针对当前特产小吃评论情感分析准确率较低的问题,本文构建了特产小吃评论数据集,并提出一种融合Text-CNN(Convolutional Naural... 面向特产小吃评论数据的情感分析,旨在挖掘消费者对不同特产小吃的观点和看法,从而提高特产小吃产品的销量。针对当前特产小吃评论情感分析准确率较低的问题,本文构建了特产小吃评论数据集,并提出一种融合Text-CNN(Convolutional Naural Networks)与注意力机制的模型对其进行情感分析。首先,通过Text-CNN对文本局部特征信息进行提取;然后,将局部特征引入注意力机制单元中,完成对文本信息的特征提取。最后在Softmax分类器中输入提取的特征,进行情感分类。实验结果表明,提出的模型与Text-CNN、Bi-RNN+Attention、Char-CNN、LEAM四种模型进行对比,准确率有所提升。 展开更多
关键词 情感分析 特产小吃 text-cnn 注意力机制
在线阅读 下载PDF
基于ERNIE-CAB-CNN的稀土专利文本分类模型
7
作者 廖列法 石利娇 《电子技术应用》 2025年第1期18-24,共7页
针对稀土专利文本专业性强的特点以及现有的文本分类方法存在的不足,鉴于类别注意力在计算机视觉领域的广泛应用和取得的良好效果,提出了一种用于文本分类的类别注意力模块(Category Attention Module,CAB),并结合预训练模型ERNIE和卷... 针对稀土专利文本专业性强的特点以及现有的文本分类方法存在的不足,鉴于类别注意力在计算机视觉领域的广泛应用和取得的良好效果,提出了一种用于文本分类的类别注意力模块(Category Attention Module,CAB),并结合预训练模型ERNIE和卷积神经网络(Convolutional Neural Networks,CNN)构建了一个用于稀土专利文本分类的创新模型ERNIE-CAB-CNN。模型使用ERNIE对专利文本进行向量化,得到语义信息更加丰富的向量表示后,通过CAB为文本中各个类别的重要特征赋予较高权值,使模型可以更准确地区分不同类别的特征。最后用CNN进一步提取文本中其他关键局部特征,得到的最终文本向量表示用于分类。通过Patsnap专利数据库官方网站检索下载稀土专利数据构建数据集进行实验,实验结果表明,稀土专利文本分类模型ERNIE-CAB-CNN在测试集上分类的准确率、精确率、F1分数分别为82.68%、83.2%、82.06%,取得了良好的分类效果。 展开更多
关键词 稀土专利分类 文本分类 类别注意力 ERNIE cnn 特征提取
在线阅读 下载PDF
融合BiLSTM与CNN的推特黑灰产分类模型 被引量:3
8
作者 朱恩德 王威 高见 《计算机工程与应用》 北大核心 2025年第1期186-195,共10页
当前推特等国外社交平台,已成为从事网络黑灰产犯罪不可或缺的工具,对推特上黑灰产账号进行发现、检测和分类对于打击网络犯罪、维护社会稳定具有重大意义。现有的推文分类模型双向长短时记忆网络(bi-directional long short-term memor... 当前推特等国外社交平台,已成为从事网络黑灰产犯罪不可或缺的工具,对推特上黑灰产账号进行发现、检测和分类对于打击网络犯罪、维护社会稳定具有重大意义。现有的推文分类模型双向长短时记忆网络(bi-directional long short-term memory,BiLSTM)可以学习推文的上下文信息,却无法学习局部关键信息,卷积神经网络(convolution neural network,CNN)模型可以学习推文的局部关键信息,却无法学习推文的上下文信息。结合BiLSTM与CNN两种模型的优势,提出了BiLSTM-CNN推文分类模型,该模型将推文进行向量化后,输入BiLSTM模型学习推文的上下文信息,再在BiLSTM模型后引入CNN层,进行局部特征的提取,最后使用全连接层将经过池化的特征连接在一起,并应用softmax函数进行四分类。模型在自主构建的中文推特黑灰产推文数据集上进行实验,并使用TextCNN、TextRNN、TextRCNN三种分类模型作为对比实验,实验结果显示,所提的BiLSTM-CNN推文分类模型在对四类推文进行分类的宏准确率为98.32%,明显高于TextCNN、TextRNN和TextRCNN三种模型的准确率。 展开更多
关键词 文本分类 双向长短期记忆网络(BiLSTM) 卷积神经网络(cnn) 黑灰产 推特
在线阅读 下载PDF
融合文本分析和CNN-BiLSTM模型的校园霸凌舆情分析——以邯郸初中生被害案为例 被引量:1
9
作者 黄金柱 杨云飞 +2 位作者 周丹萍 王淑影 王纯杰 《情报探索》 2025年第1期64-71,共8页
[目的/意义]校园霸凌是一种严重影响学生身心健康的现象,在教育领域和社会中引起了广泛关注。本文旨在深入研究校园霸凌事件,揭示公众对校园霸凌的态度和看法。[方法/过程]应用Python软件爬取公众对某校园霸凌热点事件的微博评论数据,... [目的/意义]校园霸凌是一种严重影响学生身心健康的现象,在教育领域和社会中引起了广泛关注。本文旨在深入研究校园霸凌事件,揭示公众对校园霸凌的态度和看法。[方法/过程]应用Python软件爬取公众对某校园霸凌热点事件的微博评论数据,使用文本分析和CNN-BiLSTM模型对该事件中民众的主要观点进行情感分析研究。[结果/结论]通过实例分析说明了该模型具有更好的预测准确率,并得到舆论关注的热点,提出舆论应对建议。 展开更多
关键词 教育舆情 校园霸凌 文本分析 情感分析 cnn-BiLSTM模型
在线阅读 下载PDF
基于R-CNN的中医医案诊断分类方法
10
作者 邱雪峰 查青林 朱根华 《现代信息科技》 2025年第13期47-52,57,共7页
针对中医医案中常见的复杂语句结构,以及在诊断分类中上下文语义捕捉不足的问题,文章提出一种基于RoBERTa、R-CNN和多头自注意力机制的中医医案诊断分类模型。首先,通过RoBERTa对文本进行预训练,获取深层语义表示,增强上下文理解能力。... 针对中医医案中常见的复杂语句结构,以及在诊断分类中上下文语义捕捉不足的问题,文章提出一种基于RoBERTa、R-CNN和多头自注意力机制的中医医案诊断分类模型。首先,通过RoBERTa对文本进行预训练,获取深层语义表示,增强上下文理解能力。然后,采用R-CNN提取局部特征信息,捕捉语义与症状。进一步引入多头自注意力机制,强化长距离依赖关系建模,获取文本中的关键信息。该模型充分结合全局语义与局部特征,提升分类准确性。实验结果表明,模型在诊断分类任务中的预测精度和F1值分别达80.89%和79.76%,有效改善了文本分类性能。 展开更多
关键词 中医医案 R-cnn RoBERTa 多头自注意力机制 文本分类
在线阅读 下载PDF
基于BERT-CNN-SIFRank的智能预问诊模型研究与设计
11
作者 崔晓笛 吴冠朋 刘文强 《中国数字医学》 2025年第8期65-71,共7页
目的:研究并设计智能预问诊模型,模拟医生实际问诊过程,准确了解患者就诊意图,自动解答患者提出的问题,减少患者问诊等待时间,提升患者就医体验,提高医生接诊效率。方法:基于深度学习技术构建智能预问诊模型,设计基于BERT-CNN的医疗文... 目的:研究并设计智能预问诊模型,模拟医生实际问诊过程,准确了解患者就诊意图,自动解答患者提出的问题,减少患者问诊等待时间,提升患者就医体验,提高医生接诊效率。方法:基于深度学习技术构建智能预问诊模型,设计基于BERT-CNN的医疗文本分类模型实现患者问题分类,利用基于SIFRank的医疗文本关键词抽取模型提取患者问题关键词,进而获取患者医疗问题意图。结果:基于BERT-CNN的医疗文本分类模型在公开数据集上的F1值达到82.84%,有效提高了医疗文本分类准确率。结论:基于BERT-CNNSIFRank的智能预问诊模型丰富了预问诊研究技术路线,为构建高效、智能、个性化的预问诊系统提供了理论模型基础,有利于促进互联网医院高质量发展。 展开更多
关键词 预问诊模型 医疗文本分类 医疗关键词抽取 BERT cnn
在线阅读 下载PDF
基于吸引子传播聚类的改进双通道CNN短文本分类算法 被引量:9
12
作者 王儒 刘培玉 王培培 《小型微型计算机系统》 CSCD 北大核心 2017年第8期1730-1734,共5页
传统的文本分类方法在处理短文本分类任务时遇到了很大的困难,针对短文本分类任务上的数据稀疏等难点,本文尝试在短文本特征输入和卷积神经网络结构上进行改进.在特征表示Word embedding训练时采取non-static和static两种方式,将训练好... 传统的文本分类方法在处理短文本分类任务时遇到了很大的困难,针对短文本分类任务上的数据稀疏等难点,本文尝试在短文本特征输入和卷积神经网络结构上进行改进.在特征表示Word embedding训练时采取non-static和static两种方式,将训练好的Word embedding进行聚类处理,聚类得到的Word embedding库作为模型输入的词典库;提出一种改进的双通道卷积神经网络结构,网络通过双通道获取更多的局部敏感信息增加特征数目,然后经过连续的池化实现特征抽取.经实验验证,提出的语义聚类处理和改进的网络模型与传统的机器学习方法相比,在短文本分类任务的准确率上有显著的提升. 展开更多
关键词 词向量聚类 短文本 cnn 分类
在线阅读 下载PDF
基于E-CNN和BLSTM-CRF的临床文本命名实体识别 被引量:18
13
作者 曹春萍 关鹏举 《计算机应用研究》 CSCD 北大核心 2019年第12期3748-3751,共4页
在生物医学临床病历文本的命名实体识别任务中,传统的解决方案由于对实体的边界划分不够精确,影响了部分复合实体的识别。通过研究复合实体的特性,提出一种集成的卷积神经网络(E-CNN)模型与双向长短期记忆网络(BLSTM)和条件随机场(CRF)... 在生物医学临床病历文本的命名实体识别任务中,传统的解决方案由于对实体的边界划分不够精确,影响了部分复合实体的识别。通过研究复合实体的特性,提出一种集成的卷积神经网络(E-CNN)模型与双向长短期记忆网络(BLSTM)和条件随机场(CRF)结合的模型,通过对CNN中的卷积层设定不同卷积窗口的大小,来捕获多个词语之间更丰富的边界特征信息。然后将集成的特征信息传递给BLSTM模型进行训练,最后由CRF模型得到最终的序列标注。实验结果表明,该方法针对临床病历文本中的复合实体识别具有良好的效果。 展开更多
关键词 命名实体识别 临床文本 集成的卷积神经网络
在线阅读 下载PDF
基于CNN-BiGRU的学术文本分类研究 被引量:7
14
作者 薛丽 郑含笑 吴昊辰 《郑州航空工业管理学院学报》 2023年第3期61-68,共8页
针对传统的文本分类模型存在特征提取能力不足和分类准确率较低等问题,提出一种基于卷积神经网络和双向门控循环单元相结合(CNN-BiGRU)的文本分类方法。首先,以图书情报领域相关主题文本摘要为数据源,通过Word2vec进行文本向量化;其次,... 针对传统的文本分类模型存在特征提取能力不足和分类准确率较低等问题,提出一种基于卷积神经网络和双向门控循环单元相结合(CNN-BiGRU)的文本分类方法。首先,以图书情报领域相关主题文本摘要为数据源,通过Word2vec进行文本向量化;其次,通过CNN获得输入文本信息的局部特征,并使用BiGRU保留文本中的顺序相关性;然后,选择softmax分类器输出分类结果;最后,与传统的机器学习分类方法和单一的深度神经网络模型分类方法进行对比实验。结果表明,在数据量大的情况下,文中提出的CNN-BiGRU分类模型具有更好的分类效果,其准确率、召回率和F1值均达到了95%以上,能够在一定程度上解决学术文本“信息过载”等问题。 展开更多
关键词 深度学习 文本分类 卷积神经网络—双向门控循环单元 学术文本
在线阅读 下载PDF
WordNG-Vec:一种应用于CNN文本分类的词向量模型 被引量:6
15
作者 王勇 何养明 +2 位作者 邹辉 黎春 陈荟西 《小型微型计算机系统》 CSCD 北大核心 2019年第3期499-502,共4页
文本特征提取(文本输入表示)作为文本分类技术的要点,其构建质量直接影响着分类系统的分类效果.现在最流行的文本输入表示——词向量(Word Vector)虽然考虑了词的相似性但忽略了局部词序特征,在一些情况下造成文本语义上的缺失和歪曲.为... 文本特征提取(文本输入表示)作为文本分类技术的要点,其构建质量直接影响着分类系统的分类效果.现在最流行的文本输入表示——词向量(Word Vector)虽然考虑了词的相似性但忽略了局部词序特征,在一些情况下造成文本语义上的缺失和歪曲.为此,本文提出了一种结合N-Gram特征与Word2vec的词向量模型WordNG-Vec,其提取出的词向量(Word-NG向量),作为双通道卷积神经网络模型(DC-CNN)的输入.经过多组对比实验分析表明,在精确率(precision)和召回率(recall)和F1值三个评价指标下,本文提出的方法有效提高文本分类的效果. 展开更多
关键词 文本分类 词向量 DC-cnn N-Gram特征
在线阅读 下载PDF
基于CP-CNN的中文短文本分类研究 被引量:24
16
作者 余本功 张连彬 《计算机应用研究》 CSCD 北大核心 2018年第4期1001-1004,共4页
短文本具有长度短、特征稀疏以及上下文依赖强等特点,传统方法对其直接进行分类精度有限。针对此问题,提出了一种结合字符和词的双输入卷积神经网络模型CP-CNN。该模型通过加入一种用拼音序列表征字符级输入的方法,构建字符级和词级的... 短文本具有长度短、特征稀疏以及上下文依赖强等特点,传统方法对其直接进行分类精度有限。针对此问题,提出了一种结合字符和词的双输入卷积神经网络模型CP-CNN。该模型通过加入一种用拼音序列表征字符级输入的方法,构建字符级和词级的双输入矩阵,并在采样层使用k-max采样方法,增强模型特征的表达能力。利用豆瓣电影评论数据集对该模型进行识别精度评估,实验结果表明,与传统分类模型和标准卷积神经网络模型相比,该模型可有效提高短文本分类效果。 展开更多
关键词 短文本 分类 卷积神经网络
在线阅读 下载PDF
基于TextRank和字符级卷积神经网络的小学作文素材自动分类模型研究 被引量:7
17
作者 朱晓亮 石昀东 《计算机应用与软件》 北大核心 2019年第1期220-226,共7页
随着教育技术与信息技术的融合,实现面向小学生的语文写作自动辅助成为可能。快速自动地进行范文素材的分类入库是实现写作自动辅助的关键。作文素材语义信息丰富、种类较多,若采用现有方法进行自动分类入库操作往往难以取得好的效果。... 随着教育技术与信息技术的融合,实现面向小学生的语文写作自动辅助成为可能。快速自动地进行范文素材的分类入库是实现写作自动辅助的关键。作文素材语义信息丰富、种类较多,若采用现有方法进行自动分类入库操作往往难以取得好的效果。因此,在分析小学作文的类别特征并构建了一个数据集的基础上,提出基于TextRank和字符级卷积神经网络的小学作文自动分类模型。运用基于TextRank的关键句提取模型为范文素材,去除部分冗余的语义信息。应用word embedding对数据集进行文本表示,并将其作为卷积神经网络的输入。通过不断地迭代训练和测试,最终实现了该模型。实验表明了该方法对于作文分类任务能显著地提高分类的性能。 展开更多
关键词 textRank 卷积神经网络 作文素材库 文档分类
在线阅读 下载PDF
基于跳转LSTM-CNN模型的Twitter情感分析 被引量:3
18
作者 李俭兵 王俊 +1 位作者 许萌萌 王成 《计算机仿真》 北大核心 2021年第8期478-481,496,共5页
针对LSTM-CNN网络模型接收句子输入训练时间长、处理较长文本时效率低下问题,提出了一种基于跳转的LSTM-CNN模型。新的模型首先在读取文本序列时进行跳转判断,即在每一步中,利用两层感知机从前向序列、后向序列和当前单词中提取信息,确... 针对LSTM-CNN网络模型接收句子输入训练时间长、处理较长文本时效率低下问题,提出了一种基于跳转的LSTM-CNN模型。新的模型首先在读取文本序列时进行跳转判断,即在每一步中,利用两层感知机从前向序列、后向序列和当前单词中提取信息,确定是否跳过当前单词。然后利用LSTM分析跳转后的序列语义以及提取其特征,在CNN模型进一步提取局部特征。最后合并到较小的维度,并以正或负标签输出。相比基于LSTM-CNN的模型,上述方法大大降低了网络训练时间,在效率和性能上都产生更好的效果。 展开更多
关键词 长短时记忆网络 卷积神经网络 文本情感分析 跳转机制
在线阅读 下载PDF
RHS-CNN:一种基于正则化层次Softmax的CNN文本分类模型 被引量:17
19
作者 王勇 何养明 +1 位作者 陈荟西 黎春 《重庆理工大学学报(自然科学)》 CAS 北大核心 2020年第5期187-195,共9页
传统的卷积神经网络分类模型(CNN)的输出层采用扁平式架构的标准Softmax,在数据量较大、类别较多的文本分类任务中计算复杂度高,训练耗时长;而基于霍夫曼树(Huffman tree)构建的改进算法--层次Softmax(hierarchical softmax,H-Softmax)... 传统的卷积神经网络分类模型(CNN)的输出层采用扁平式架构的标准Softmax,在数据量较大、类别较多的文本分类任务中计算复杂度高,训练耗时长;而基于霍夫曼树(Huffman tree)构建的改进算法--层次Softmax(hierarchical softmax,H-Softmax)能极大地提高训练速度,但由于加入了大量的节点参数,使得优化难度增加,优化需要更长的迭代步,且容易过拟合,继而影响模型的拟合速度和分类效果。为此,提出了改进算法模型RHS-CNN(regularization hierarchical softmax CNN),采用正则化的方法,对H-Softmax的节点参数进行约束,避免过拟合,增强模型的泛化能力。实验分析结果表明:所提出的方法在相应评价指标上相对Softmax、H-Softmax有着一定的提升。 展开更多
关键词 文本分类 正则化 H-Softmax RHS-cnn
在线阅读 下载PDF
基于注意力机制的多通道CNN和BiGRU的文本情感倾向性分析 被引量:49
20
作者 程艳 尧磊波 +5 位作者 张光河 唐天伟 项国雄 陈豪迈 冯悦 蔡壮 《计算机研究与发展》 EI CSCD 北大核心 2020年第12期2583-2595,共13页
近年来,卷积神经网络(convolutional neural network,CNN)和循环神经网络(recurrent neural network,RNN)已在文本情感分析领域得到广泛应用,并取得了不错的效果.然而,文本之间存在上下文依赖问题,虽然CNN能提取到句子连续词间的局部信... 近年来,卷积神经网络(convolutional neural network,CNN)和循环神经网络(recurrent neural network,RNN)已在文本情感分析领域得到广泛应用,并取得了不错的效果.然而,文本之间存在上下文依赖问题,虽然CNN能提取到句子连续词间的局部信息,但是会忽略词语之间上下文语义信息;双向门控循环单元(bidirectional gated recurrent unit,BiGRU)网络不仅能够解决传统RNN模型存在的梯度消失或梯度爆炸问题,而且还能很好地弥补CNN不能有效提取长文本的上下文语义信息的缺陷,但却无法像CNN那样很好地提取句子局部特征.因此提出一种基于注意力机制的多通道CNN和双向门控循环单元(MC-AttCNN-AttBiGRU)的神经网络模型.该模型不仅能够通过注意力机制关注到句子中对情感极性分类重要的词语,而且结合了CNN提取文本局部特征和BiGRU网络提取长文本上下文语义信息的优势,提高了模型的文本特征提取能力.在谭松波酒店评论数据集和IMDB数据集上的实验结果表明:提出的模型相较于其他几种基线模型可以提取到更丰富的文本特征,可以取得比其他基线模型更好的分类效果. 展开更多
关键词 卷积神经网络 文本情感倾向性分析 双向门控循环单元 注意力机制 多通道
在线阅读 下载PDF
上一页 1 2 11 下一页 到第
使用帮助 返回顶部