期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
Research on the Classification of Digital Cultural Texts Based on ASSC-TextRCNN Algorithm
1
作者 Zixuan Guo Houbin Wang +1 位作者 Sameer Kumar Yuanfang Chen 《Computers, Materials & Continua》 2026年第3期2119-2145,共27页
With the rapid development of digital culture,a large number of cultural texts are presented in the form of digital and network.These texts have significant characteristics such as sparsity,real-time and non-standard ... With the rapid development of digital culture,a large number of cultural texts are presented in the form of digital and network.These texts have significant characteristics such as sparsity,real-time and non-standard expression,which bring serious challenges to traditional classification methods.In order to cope with the above problems,this paper proposes a new ASSC(ALBERT,SVD,Self-Attention and Cross-Entropy)-TextRCNN digital cultural text classification model.Based on the framework of TextRCNN,the Albert pre-training language model is introduced to improve the depth and accuracy of semantic embedding.Combined with the dual attention mechanism,the model’s ability to capture and model potential key information in short texts is strengthened.The Singular Value Decomposition(SVD)was used to replace the traditional Max pooling operation,which effectively reduced the feature loss rate and retained more key semantic information.The cross-entropy loss function was used to optimize the prediction results,making the model more robust in class distribution learning.The experimental results indicate that,in the digital cultural text classification task,as compared to the baseline model,the proposed ASSC-TextRCNN method achieves an 11.85%relative improvement in accuracy and an 11.97%relative increase in the F1 score.Meanwhile,the relative error rate decreases by 53.18%.This achievement not only validates the effectiveness and advanced nature of the proposed approach but also offers a novel technical route and methodological underpinnings for the intelligent analysis and dissemination of digital cultural texts.It holds great significance for promoting the in-depth exploration and value realization of digital culture. 展开更多
关键词 Text classification natural language processing textrcnn model albert pre-training singular value decomposition cross-entropy loss function
在线阅读 下载PDF
多视图融合DJ-TextRCNN的古籍文本主题推荐研究 被引量:4
2
作者 武帅 杨秀璋 何琳 《情报学报》 CSSCI CSCD 北大核心 2024年第1期61-75,共15页
传统编目分类和规则匹配方法存在工作效能低、过度依赖专家知识、缺乏对古籍文本自身语义的深层次挖掘、编目主题边界模糊、较难实现对古籍文本领域主题的精准推荐等问题。为此,本文结合古籍语料特征探究如何实现精准推荐符合研究者需... 传统编目分类和规则匹配方法存在工作效能低、过度依赖专家知识、缺乏对古籍文本自身语义的深层次挖掘、编目主题边界模糊、较难实现对古籍文本领域主题的精准推荐等问题。为此,本文结合古籍语料特征探究如何实现精准推荐符合研究者需求的文本主题内容的方法,以推动数字人文研究的进一步发展。首先,选取本课题组前期标注的古籍语料数据进行主题类别标注和视图分类;其次,构建融合BERT(bidirectional encoder representation from transformers)预训练模型、改进卷积神经网络、循环神经网络和多头注意力机制的语义挖掘模型;最后,融入“主体-关系-客体”多视图的语义增强模型,构建DJ-TextRCNN(DianJi-recurrent convolutional neural networks for text classification)模型实现对典籍文本更细粒度、更深层次、更多维度的语义挖掘。研究结果发现,DJ-TextRCNN模型在不同视图下的古籍主题推荐任务的准确率均为最优。在“主体-关系-客体”视图下,精确率达到88.54%,初步实现了对古籍文本的精准主题推荐,对中华文化深层次、细粒度的语义挖掘具有一定的指导意义。 展开更多
关键词 数字人文 古籍文本 主题推荐 多视图融合 DJ-textrcnn
在线阅读 下载PDF
基于SWPF2vec和DJ-TextRCNN的古籍文本主题分类研究 被引量:1
3
作者 武帅 杨秀璋 +1 位作者 何琳 公佐权 《情报学报》 CSSCI CSCD 北大核心 2024年第5期601-615,共15页
以编目分类和规则匹配为主的古籍文本主题分类方法存在工作效能低、专家知识依赖性强、分类依据单一化、古籍文本主题自动分类难等问题。对此,本文结合古籍文本内容和文字特征,尝试从古籍内容分类得到符合研究者需求的主题,推动数字人... 以编目分类和规则匹配为主的古籍文本主题分类方法存在工作效能低、专家知识依赖性强、分类依据单一化、古籍文本主题自动分类难等问题。对此,本文结合古籍文本内容和文字特征,尝试从古籍内容分类得到符合研究者需求的主题,推动数字人文研究范式的转型。首先,参照东汉古籍《说文解字》对文字的分析方式,以前期标注的古籍语料数据集为基础,构建全新的“字音(说)-原文(文)-结构(解)-字形(字)”四维特征数据集。其次,设计四维特征向量提取模型(speaking,word,pattern,and font to vector,SWPF2vec),并结合预训练模型实现对古籍文本细粒度的特征表示。再其次,构建融合卷积神经网络、循环神经网络和多头注意力机制的古籍文本主题分类模型(dianji-recurrent convolutional neural networks for text classification,DJ-TextRCNN)。最后,融入四维语义特征,实现对古籍文本多维度、深层次、细粒度的语义挖掘。在古籍文本主题分类任务上,DJ-TextRCNN模型在不同维度特征下的主题分类准确率均为最优,在“说文解字”四维特征下达到76.23%的准确率,初步实现了对古籍文本的精准主题分类。 展开更多
关键词 多维特征融合 古籍文本 主题分类 SWPF2vec DJ-textrcnn
在线阅读 下载PDF
多视图融合TextRCNN的论文自动推荐算法 被引量:4
4
作者 杨秀璋 武帅 +4 位作者 杨琪 项美玉 李娜 周既松 赵小明 《计算机工程与应用》 CSCD 北大核心 2023年第2期110-119,共10页
传统论文自动推荐算法仅从单视图角度实现分类,缺乏特征融合及多视图语义知识,上下文信息和长距离依赖利用不明显,较难挖掘到深层次文本特征,从而限制学术论文推荐的准确度。针对这些问题,提出了一种基于多视图融合TextRCNN的论文自动... 传统论文自动推荐算法仅从单视图角度实现分类,缺乏特征融合及多视图语义知识,上下文信息和长距离依赖利用不明显,较难挖掘到深层次文本特征,从而限制学术论文推荐的准确度。针对这些问题,提出了一种基于多视图融合TextRCNN的论文自动推荐模型,该模型融合论文标题、关键词和摘要三个视图特征,利用卷积神经网络(CNN)、双向长短时记忆网络(BiLSTM)和注意力机制构建模型,实现对不同学科方向论文的自动分类及推荐。实验结果表明,设计的论文推荐模型在精确率、召回率和F1值上均有所提升,比机器学习方法平均提高3.40%、3.57%和3.49%,也优于单视图和已有经典的深度学习方法。该方法有效利用多视图知识和上下文语义信息,提高论文推荐的准确率,进而节约科研工作者检索所需论文所花费时间和精力,进一步提高科研人员的效率,推荐符合其研究需求的学术论文,具有良好的学术价值和应用扩展。 展开更多
关键词 论文推荐 多视图融合 textrcnn 注意力机制 深度学习
在线阅读 下载PDF
基于TextRCNN和TextCNN的文本情感分类 被引量:4
5
作者 武姗姗 《信息记录材料》 2019年第12期135-136,共2页
针对于文本情感分类任务,本文提出了混合深度神经网络模型TextRCNN-TextCNN。该模型利用TextRCNN和TextCNN联合提取文本特征。实验结果表明,该模型的准确率和F1值分别为0.8880、0.8879,相比于TextRCNN、TextCNN等模型有明显提升。
关键词 文本情感分类 textrcnn TextCNN 深度学习
在线阅读 下载PDF
面向语义缺失的骨签释文分类算法
6
作者 窦相宜 王慧琴 +2 位作者 王可 刘瑞 王展 《计算机系统应用》 2025年第7期195-207,共13页
陕西省西安市汉长安城遗址出土的骨签为西汉历史的研究工作提供了丰富资料,受长期埋藏和人为开采影响,大量骨签存在断裂现象,造成语义信息缺失,影响骨签分类归置效率.为提高骨签分类归置效率,本文提出了一种面向语义缺失的EWRCA骨签释... 陕西省西安市汉长安城遗址出土的骨签为西汉历史的研究工作提供了丰富资料,受长期埋藏和人为开采影响,大量骨签存在断裂现象,造成语义信息缺失,影响骨签分类归置效率.为提高骨签分类归置效率,本文提出了一种面向语义缺失的EWRCA骨签释文分类模型.该模型利用ERNIE的8层编码器捕获文本的深层语义信息,学习断裂和不完整的骨签释文信息;通过融合ERNIE多层编码器的输出与Word2Vec生成的词向量,提高对骨签释文独有词汇的理解能力;将文本向量融合模块与TextRCNN-MHAtt模型结合,有效捕获文本的上下文依赖,增强文本的语义表示能力,提升分类准确性;引入融合注意力机制提高模型在处理骨签释文时的准确性.实验结果表明,该模型对汉长安城骨签释文的分类精度和准确率达到95.62%、95.2%,能够有效提高骨签释文的分类精度. 展开更多
关键词 骨签释文 释文分类 ERNIE Word2Vec textrcnn-MHAtt
在线阅读 下载PDF
施工方案类别及文本分类模型实现研究分类
7
作者 杜润隆 谭柯鑫 +2 位作者 高添 韩郅 徐云凤 《水利水电技术(中英文)》 北大核心 2025年第S1期95-101,共7页
施工方案是施工组织设计的核心环节。运用自然语言处理技术,从非结构化文本中提取施工方案,并予以审阅和审查,可有效提高施工方案的审查效率,提高编制质量,同时有利于发现施工方案中潜在的安全和质量风险,以便施工过程加以预警。从非结... 施工方案是施工组织设计的核心环节。运用自然语言处理技术,从非结构化文本中提取施工方案,并予以审阅和审查,可有效提高施工方案的审查效率,提高编制质量,同时有利于发现施工方案中潜在的安全和质量风险,以便施工过程加以预警。从非结构化文本提取施工方案,需要明确不同类型的施工方案的内容构成,对相关段落进行内容归类。针对非结构化施工方案段落内容归类问题,在深入研究工程施工方案类别及内容构成框架的基础上,以城市管网工程施工组织设计段落为样本,进行了施工组织设计段落内容分类,提出了融合Albert、TextRCNN的段落文本分类模型,该模型采用Albert预训练语言模型进行词嵌入,将生成的词向量输入到TextRCNN分类器中完成文本分类,准确率提高0.79%,试验表明:结合Albert的TextRCNN可以有效对施工组织设计段落进行内容分类,为进一步施工方案提取提供基础。 展开更多
关键词 施工方案 段落文本 ALBERT textrcnn
在线阅读 下载PDF
一种融合BERT和注意力机制的新闻文本分类方法 被引量:1
8
作者 熊亿坤 付雪峰 +2 位作者 盛黄煜 胡昊 汪涛涛 《江西师范大学学报(自然科学版)》 北大核心 2025年第1期49-57,共9页
文本分类任务是在自然语言处理中的一项重要任务,旨在将给定的文本分配到预定义的不同类别或标签中.针对近年来备受关注的注意力机制和一种基于Transformer结构的预训练模型BERT,该文提出一种基于BERT-TextRCNN-Attention混合神经网络... 文本分类任务是在自然语言处理中的一项重要任务,旨在将给定的文本分配到预定义的不同类别或标签中.针对近年来备受关注的注意力机制和一种基于Transformer结构的预训练模型BERT,该文提出一种基于BERT-TextRCNN-Attention混合神经网络的新闻文本分类方法.为了增强文本的特征表示和模型的分类效果,该分类方法首先使用BERT预训练模型对文本进行预训练,并作为TextRCNN的词向量嵌入,其次采用TextRCNN模型和注意力机制进一步对文本的上下文特征和局部关键特征进行提取,再对新闻文本进行分类;最后在THUCNews数据集上进行对比实验.实验结果表明:该文提出方法在准确率和F_(1)值上比Transformer、TextRNN、TextCNN、DPCNN等文本分类模型均有所提升. 展开更多
关键词 BERT模型 基于卷积神经网络的文本分类模型 注意力机制 新闻文本分类
在线阅读 下载PDF
融合知识感知与双重注意力的短文本分类模型 被引量:29
9
作者 李博涵 向宇轩 +4 位作者 封顶 何志超 吴佳骏 戴天伦 李静 《软件学报》 EI CSCD 北大核心 2022年第10期3565-3581,共17页
文本分类任务作为文本挖掘的核心问题,已成为自然语言处理领域的一个重要课题.而短文本分类由于稀疏性、实时性和不规范性等特点,已成为文本分类亟待解决的问题之一.在某些特定场景,短文本存在大量隐含语义,由此给挖掘有限文本内的隐含... 文本分类任务作为文本挖掘的核心问题,已成为自然语言处理领域的一个重要课题.而短文本分类由于稀疏性、实时性和不规范性等特点,已成为文本分类亟待解决的问题之一.在某些特定场景,短文本存在大量隐含语义,由此给挖掘有限文本内的隐含语义特征等任务带来挑战.已有的方法对短文本分类主要采用传统机器学习或深度学习算法,但该类算法的模型构建复杂且工作量大,效率不高.此外,短文本包含有效信息较少且口语化严重,对模型的特征学习能力要求较高.针对以上问题,提出了KAe RCNN模型,该模型在TextRCNN模型的基础上,融合了知识感知与双重注意力机制.知识感知包含了知识图谱实体链接和知识图谱嵌入,可以引入外部知识以获取语义特征,同时,双重注意力机制可以提高模型对短文本中有效信息提取的效率.实验结果表明,KAe RCNN模型在分类准确度、F1值和实际应用效果等方面显著优于传统的机器学习算法.对算法的性能和适应性进行了验证,准确率达到95.54%,F1值达到0.901,对比4种传统机器学习算法,准确率平均提高了约14%,F1值提升了约13%.与TextRCNN相比,KAe RCNN模型在准确性方面提升了约3%.此外,与深度学习算法的对比实验结果也说明,该模型在其他领域的短文本分类中也有较好的表现.理论和实验结果都证明,所提出的KAe RCNN模型对短文本分类效果更优. 展开更多
关键词 短文本分类 知识图谱 注意力机制 textrcnn 实体消歧
在线阅读 下载PDF
基于TextCNN融合模型的离散情感分析 被引量:2
10
作者 程钢 陈秀明 于翔 《科学技术创新》 2023年第21期124-127,共4页
在自然语言分析中,情感分析通常是在分析一段文字所表现的情感状况。情感分析的使用场景非常宽泛,比如旅行平台、电影评论平台等所进行的评价,分为积极评论与消极评价;又或者为了研究客户对某一商品的总体使用感觉,对商品的整体使用评... 在自然语言分析中,情感分析通常是在分析一段文字所表现的情感状况。情感分析的使用场景非常宽泛,比如旅行平台、电影评论平台等所进行的评价,分为积极评论与消极评价;又或者为了研究客户对某一商品的总体使用感觉,对商品的整体使用评价并做出情感判断等。本文数据使用的是阿里云天池的电商评论的数据,分为积极消极两种情感,并将它改成6种情感,本文使用Jieba分词,决策树,lda主题模型,对文本进行挖掘,深入挖掘评论背后隐藏的问题。使用TextCNN,TextRCNN,TextRCNN-Attention模型对情感进行分类,并对模型进行对比。 展开更多
关键词 自然语言处理 情感分析 Jieba分词 决策树 LDA主题模型 TextCNN textrcnn textrcnn-Attention
在线阅读 下载PDF
顾及地址语义和地理空间特征的多源POI位置融合 被引量:3
11
作者 李朋朋 刘纪平 +3 位作者 王勇 罗安 桑瑜 闫雪峰 《测绘通报》 CSCD 北大核心 2023年第11期54-60,共7页
多源POI位置融合是实现地理空间数据匹配融合的关键技术之一。然而,由于不同POI数据源之间位置编码的差异及定位误差,导致位置融合更加困难。本文提出了一种顾及地址语义和地理空间特征的多源POI位置融合方法。首先,通过TextRCNN和图注... 多源POI位置融合是实现地理空间数据匹配融合的关键技术之一。然而,由于不同POI数据源之间位置编码的差异及定位误差,导致位置融合更加困难。本文提出了一种顾及地址语义和地理空间特征的多源POI位置融合方法。首先,通过TextRCNN和图注意力网络提取地址属性的语义特征;然后,使用多层感知机提取位置属性的地理空间特征;最后,基于自注意力机制通过特征聚合实现多源POI位置融合,并对成都市百度地图、腾讯地图和高德地图的POI数据进行试验验证。结果表明,该方法显著优于现有方法,平均位置融合精度优于12 m。 展开更多
关键词 地址语义 地理空间特征 textrcnn 图注意力网络 多层感知机 自注意力机制
原文传递
基于ERNIE-RCNN梅花研究信息文本分类方法 被引量:2
12
作者 付红萍 陈恺之 陈志泊 《东北农业大学学报》 CAS CSCD 北大核心 2022年第5期20-31,共12页
采用文本分类方法对梅花中文语料按研究方向(基因、育种、非生物胁迫等)进行分类,是构建梅花知识图谱的重要预处理过程,也是对基于以上研究方向的梅花研究信息进行相关语义检索、智能问答等的重要基础。为探究文本分类方法应用于梅花研... 采用文本分类方法对梅花中文语料按研究方向(基因、育种、非生物胁迫等)进行分类,是构建梅花知识图谱的重要预处理过程,也是对基于以上研究方向的梅花研究信息进行相关语义检索、智能问答等的重要基础。为探究文本分类方法应用于梅花研究信息的可行性,提出基于改进ERNIE-RCNN的梅花研究信息文本分类方法。针对缺乏梅花研究信息数据集导致常用文本分类方法分类效果不佳的问题,构建包含6个研究方向的中文梅花研究信息文本数据集;针对传统分类模型的编码机制难以体现文本逻辑性、语义还原不精确的问题,引入预训练模型ERNIE对文本进行编码,在编码过程中增强对文本特征提取与语义表示的能力;为更好保留文本词序及特征,提高分类正确性,在ERNIE模型编码基础上融合TextRCNN模型进行分类,改进TextRCNN模型卷积层丢弃率,增强分类模型泛化性,提高分类能力。通过对改进ERNIE-RCNN模型与仅改进ERNIE的ERNIE-RCNN模型、原始ERNIE-RCNN模型、ERNIE模型、BERT模型以及TextRCNN模型进行对比,试验结果表明,改进ERNIE-RCNN模型在不同评价指标上均高于其他模型,精准率、召回率和F1值分别不小于91.53%、90.27%、92.35%,正确率为95.35%。基于改进ERNIE-RCNN的梅花研究信息文本分类方法可满足实际需要。 展开更多
关键词 梅花 研究信息 文本分类 ERNIE textrcnn 深度学习
在线阅读 下载PDF
旅游评论短文本的改进ERNIE-RCNN模型分类 被引量:3
13
作者 宋文琴 尚庆生 巩晴 《宜宾学院学报》 2021年第12期53-56,共4页
针对旅游网站评论文本的长度短、特征稀疏、多歧义等特征,为了获得更精确的文本分类效果,融合知识增强语义表示(ERNIE)预训练模型和TextRCNN模型,即利用ERNIE模型获得词向量表示,再作为TextRCNN模型的输入,进一步提取文本的上下文信息,... 针对旅游网站评论文本的长度短、特征稀疏、多歧义等特征,为了获得更精确的文本分类效果,融合知识增强语义表示(ERNIE)预训练模型和TextRCNN模型,即利用ERNIE模型获得词向量表示,再作为TextRCNN模型的输入,进一步提取文本的上下文信息,获得了效果更好的改进的ERNIE-RCNN短文本分类模型.在旅游评论数据集上的实验证明,改进的ERNIE-RCNN模型具有更好的分类结果. 展开更多
关键词 ERNIE模型 textrcnn 短文本分类 改进的ERNIE-RCNN模型 旅游网站评论
在线阅读 下载PDF
结合BERT词嵌入和双向循环卷积神经网络的新闻文本分类研究 被引量:2
14
作者 任鹏 李文杰 +2 位作者 舒宇杰 孙航 赵旖旎 《信息记录材料》 2022年第6期20-23,共4页
针对数字信息时代网络舆情爆发的复杂性及不可控性,提出一种融合BERT、TEXTRCNN、BILSTM-CRF的新闻文本分类模型,致力于提高新闻文本分类的准确率,通过采用BERT词嵌入技术高效获得句子语义特征,利用TEXTRCNN双向递归的结构以及BILSTM-CR... 针对数字信息时代网络舆情爆发的复杂性及不可控性,提出一种融合BERT、TEXTRCNN、BILSTM-CRF的新闻文本分类模型,致力于提高新闻文本分类的准确率,通过采用BERT词嵌入技术高效获得句子语义特征,利用TEXTRCNN双向递归的结构以及BILSTM-CRF模型的运用来解决序列标注问题,综合考虑上下文捕捉、词嵌入、文本特征等因素,提高对新闻识别的准确性。实验证明,使用该融合模型对新闻文本分类的准确率达到0.9551,且具有较好的泛化能力,能够更好地帮助有关部门及时处理突发舆情和失控事件。 展开更多
关键词 BERT 中文新闻 文本分类 textrcnn BILSTM-CRF
在线阅读 下载PDF
基于机器学习的舆情预警模型的设计与实现
15
作者 梁泽鹏 李直达 《广东公安科技》 2020年第3期1-5,共5页
随着全球信息化程度的不断加深和我国5G网络建设的大力推进,信息安全保障已成为维护国家安全和社会稳定的重要任务,网络舆情的爆炸式增长给当前网络安全保卫工作带来了严峻的挑战。本文以基层公安工作实践中使用的舆情监测数据为样本,通... 随着全球信息化程度的不断加深和我国5G网络建设的大力推进,信息安全保障已成为维护国家安全和社会稳定的重要任务,网络舆情的爆炸式增长给当前网络安全保卫工作带来了严峻的挑战。本文以基层公安工作实践中使用的舆情监测数据为样本,通过jieba算法进行分词处理并利用Word2Vec算法进行特征提取,搭建了基于神经网络的TextRCNN模型,实现了对海量舆情信息的自动判别。本文搭建的舆情预警系统实现了机器识别代替人工筛查的目的,可大幅降低基层公安队伍的工作量,提升风险研判的时效性与准确率。 展开更多
关键词 机器学习 网络舆情 监测预警 Word2Vec算法 textrcnn
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部