期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
基于cBert-GCN的煤矿“三违”数据短文本分类
1
作者 吴徐燕 杨超宇 《煤炭工程》 北大核心 2026年第1期184-191,共8页
针对煤矿“三违”文本分类数据存在专业性强、语义易混淆、样本比例失衡3种问题,提出cBert-GCN煤矿“三违”文本分类模型。考虑到存在除专业领域信息外,煤矿“三违”文本数据简短,同时具有上下文关联紧密以及固有二义性,引入拼音、字形... 针对煤矿“三违”文本分类数据存在专业性强、语义易混淆、样本比例失衡3种问题,提出cBert-GCN煤矿“三违”文本分类模型。考虑到存在除专业领域信息外,煤矿“三违”文本数据简短,同时具有上下文关联紧密以及固有二义性,引入拼音、字形向量以增强表达煤矿“三违”文本数据。文章将GCN用于煤矿“三违”文本分类中,构建文本共现图以捕获文本中的结构信息和依赖关系,采用中文预训练模型和图卷积神经网络结合的方式进行特征学习,融合字符级和词级,设置二者权重以实现对煤矿“三违”数据的准确分类。结果表明:cBert-GCN模型在训练样本上的准确率高于其他模型达到97.03%,且在测试样本中准确率达到93.17%,具备良好泛化能力。因此,cBert-GCN模型在煤矿“三违”文本数据方面具有比较明显的应用优势。 展开更多
关键词 煤矿“三违” GCN 特征学习 训练样本 文本共现
在线阅读 下载PDF
基于BERT和模糊集理论的智能景区数字化平台研究
2
作者 吕妮 《自动化与仪器仪表》 2025年第10期184-188,共5页
为了解决海量景区旅游攻略冗杂等问题,研究构建了一种结合双向编码器表征改进的景区文本分类方法和直觉模糊的智能景区数字化融合平台。该平台构建时利用了图卷积网络与知识图谱加强景区文本数据分析能力。实验结果表明,研究所提景区文... 为了解决海量景区旅游攻略冗杂等问题,研究构建了一种结合双向编码器表征改进的景区文本分类方法和直觉模糊的智能景区数字化融合平台。该平台构建时利用了图卷积网络与知识图谱加强景区文本数据分析能力。实验结果表明,研究所提景区文本分类方法噪声比重为90%时,错误标签识别准确率为92.34%,而双向编码器表征、局部可解释的加性两种景区文本分类方法准确率分别为87.63%、79.68%。此外,智能景区数字化融合平台输入单词长度值为70时,平台回复时间为2.23 s,而双向编码器表征构建的智能景区平台回复时间为2.86 s,不及研究构建平台。综上所述,研究构建的智能景区数字化融合平台能够提高景点用户搜索能力。研究有助于景区未来扩大景点推荐度,满足用户旅游需求。 展开更多
关键词 BERT 文本分类 直觉模糊 智能景区 GCN
原文传递
基于特征融合动态图网络的多标签文本分类算法 被引量:1
3
作者 黄靖 陶竹林 +1 位作者 杜晓宇 项欣光 《软件学报》 北大核心 2025年第7期3239-3252,共14页
多标签文本分类旨在为文本分配若干预定义的标签或类别.为了充分发掘标签间的关联,目前的方法通常使用标签关系图并结合图神经网络获取标签特征表示.然而,这类方法过度依赖初始建图策略,忽视了当前文本中固有的标签相关性,使得分类结果... 多标签文本分类旨在为文本分配若干预定义的标签或类别.为了充分发掘标签间的关联,目前的方法通常使用标签关系图并结合图神经网络获取标签特征表示.然而,这类方法过度依赖初始建图策略,忽视了当前文本中固有的标签相关性,使得分类结果更依赖于数据集统计信息,而容易忽视当前文本段中的标签相关信息.因此,提出一种基于特征融合动态图网络的多标签文本分类算法,设计动态图来建模当前文本中的标签相关性,并结合特征融合与图神经网络,形成基于当前文本的标签表示,并由此形成更为准确的多标签文本结果.随后,设计实验进行验证,在3个数据集实验结果表明,所提出的模型在多标签分类任务中取得优秀的性能,验证其有效性和可行性. 展开更多
关键词 多标签文本分类 图卷积网络 注意力机制 动态图
在线阅读 下载PDF
RoBERTa-GCN-EGPLinker中文实体关系联合抽取
4
作者 冯甲 张仕斌 +3 位作者 闫丽丽 秦智 昌燕 吕智颖 《计算机技术与发展》 2025年第9期132-139,共8页
实体关系抽取是自然语言处理中的核心任务之一,旨在从文本中识别出实体及其之间的关系,生成实体关系三元组,为后续的数据分析和知识发现提供基础。随着中文语言的复杂性,尤其是在实体嵌套、关系重叠等问题上,中文实体关系抽取面临着诸... 实体关系抽取是自然语言处理中的核心任务之一,旨在从文本中识别出实体及其之间的关系,生成实体关系三元组,为后续的数据分析和知识发现提供基础。随着中文语言的复杂性,尤其是在实体嵌套、关系重叠等问题上,中文实体关系抽取面临着诸多挑战。传统方法在处理这些复杂语言现象时,常常受到语法结构和上下文信息捕捉不充分的限制。因此,如何提高中文实体关系抽取的精度和效率,成为了该领域研究的重点。为了解决这些问题,提出了一种基于RoBERTa-GCN-EGPLinker的中文实体关系联合抽取方法。该方法首先利用RoBERTa-wwm-ext模型对文本进行深度语义编码,结合中文依存分析工具LTP,提取文本的依存关系和句法结构信息。接着,通过构建图卷积神经网络(GCN)和语义邻接矩阵,进一步捕捉文本中的结构化信息。这种方法不仅能够有效处理实体之间的关系,还能在面对复杂语言现象时保持较高的抽取精度。实验结果表明,该方法在公开数据集CMeIE-V2和DuIE上具有显著的优势,能够提升中文实体关系抽取的精度与效率。 展开更多
关键词 实体关系抽取 中文文本 LTP工具 RoBERTa-wwm-ext 图卷积神经网络 Efficient Glob-alPointer模型
在线阅读 下载PDF
Text-Level-BERTGCN:基于BERT优化的文本分类模型
5
作者 覃晓 张金勇 郑宏春 《广西科学》 北大核心 2025年第6期1212-1221,共10页
传统基于文本级图卷积网络的文本分类模型在对文本进行构图时,只提取文本的空间结构信息,难以获取文本词的语义信息。针对上述不足,本文提出基于BERT(Bidirectional Encoder Representations from Transformers)优化的文本级图卷积网络T... 传统基于文本级图卷积网络的文本分类模型在对文本进行构图时,只提取文本的空间结构信息,难以获取文本词的语义信息。针对上述不足,本文提出基于BERT(Bidirectional Encoder Representations from Transformers)优化的文本级图卷积网络Text-Level-BERTGCN(Text Level BERT Graph Convolutional Network)。具体来说,Text-Level-BERTGCN首先构建基于BERT和GCN的文本标签预测方法B2GCN,B2GCN利用BERT对文本级图进行优化以获取包含文本空间结构和语义信息的文本级图,并将优化后的文本级图信息输入图卷积神经网络中对文本标签进行预测;其次利用BERT对原始的文本进行分类预测;最后根据两个预测结果的混合损失对模型进行训练。因此,Text-Level-BERTGCN能够充分利用大规模预训练模型和文本级图神经网络的优势。在R8、R52和OHSUMED数据集上的实验结果表明,Text-Level-BERTGCN的文本分类效果优于传统的图卷积文本分类模型,特别是在OHSUMED数据集上的结果表明其具有较强的提取长文本信息能力。 展开更多
关键词 BERT GCN 长文本 文本分类
在线阅读 下载PDF
基于A-GCN网络和知识图谱技术的问答系统研究与实现
6
作者 赵妍 张晶 苏红梅 《自动化与仪器仪表》 2025年第8期138-142,共5页
针对传统教学系统在交互过程中存在问答质量和问答效率低的问题,提出一种基于A-GCN网络和知识图谱技术相结合的问答交互生成方法。首先,采用A-GCN网络+微调T5-Pegasus模型对交互中的问题摘要文本进行生成;然后结合知识图谱生成答案;最... 针对传统教学系统在交互过程中存在问答质量和问答效率低的问题,提出一种基于A-GCN网络和知识图谱技术相结合的问答交互生成方法。首先,采用A-GCN网络+微调T5-Pegasus模型对交互中的问题摘要文本进行生成;然后结合知识图谱生成答案;最后对两种生成方法进行验证,并将其部署在教学系统中进行测试应用。实验结果表明,本摘要生成方法的ROUGE-N、ROUGE-L和BLEU指标分别为94.44、92.81和60.35,比传统的PGN方法和Seq2Seq方法的摘要生成质量更好。对比于讯火星火认知大模型,基于知识图谱的答案生成方法生成答案更接近参考答案。通过这两种方法可提升系统问答交互效果。由此证明,本方法可在教学系统的问句摘要和答案生成任务中进行实际应用。 展开更多
关键词 A-GCN网络 教学系统 摘要文本 答案生成 知识图谱
原文传递
融合Bert和图卷积的深度集成学习软件需求分类 被引量:3
7
作者 康雁 吴志伟 +3 位作者 寇勇奇 张兰 谢思宇 李浩 《计算机科学》 CSCD 北大核心 2022年第S01期150-158,共9页
随着软件数量和种类的快速增长,有效地挖掘软件需求的文本特征,并对软件功能性需求的文本特征进行分类,成为软件工程领域的一大挑战。软件功能性需求分类为整个软件开发过程提供了可靠的保障,并减小了需求分析阶段潜在的风险和负面影响... 随着软件数量和种类的快速增长,有效地挖掘软件需求的文本特征,并对软件功能性需求的文本特征进行分类,成为软件工程领域的一大挑战。软件功能性需求分类为整个软件开发过程提供了可靠的保障,并减小了需求分析阶段潜在的风险和负面影响。但是,软件需求文本的高分散性、高噪声、数据稀疏等特点限制了软件需求分析的有效性。提出双层词汇图卷积网络模型,创新性地对软件需求文本进行图建模,建立软件需求的图神经网络,有效捕获单词的知识边以及单词与文本之间的关系;并提出深度集成学习模型,集成多个深度学习分类模型,对软件需求文本进行分类。在数据集Windows_a和数据集Windows_b的实验中,融合Bert和图卷积的深度集成学习模型的准确率分别达到96.73%和95.60%,其明显优于其他文本分类模型,充分证明融合Bert和图卷积的深度集成学习模型能有效判别软件需求文本的功能特性,提高软件需求文本分类的准确性。 展开更多
关键词 软件需求 文本分类 BERT GCN 文本特征 集成学习
在线阅读 下载PDF
结合GCN和注意力机制的文本分类方法研究 被引量:1
8
作者 申艳光 贾耀清 +1 位作者 生龙 范永健 《计算机仿真》 北大核心 2021年第12期415-419,共5页
针对传统文本分类方法中需要手动提取特征和分类进而导致分类准确率不高的问题,提出一种结合图卷积神经网络和注意力机制的文本分类方法。方法首先建立整个语料库的大型文本图,然后将文本图的邻接矩阵和特征矩阵输入到图卷积神经网络中... 针对传统文本分类方法中需要手动提取特征和分类进而导致分类准确率不高的问题,提出一种结合图卷积神经网络和注意力机制的文本分类方法。方法首先建立整个语料库的大型文本图,然后将文本图的邻接矩阵和特征矩阵输入到图卷积神经网络中,最后网络输出与注意力机制相结合,利用注意力机制中Self-Attention机制的Query矩阵,Key矩阵和Value矩阵计算Attention值,充分学习文本表示,不断调整网络的输出,最终提高文本分类的准确率。在数据集上的仿真结果表明,所提出的方法与传统文本分类方法相比,其准确率较高。 展开更多
关键词 文本分类 图卷积神经网络 注意力机制
在线阅读 下载PDF
结合图卷积的深层神经网络用于文本分类 被引量:6
9
作者 郑诚 陈杰 董春阳 《计算机工程与应用》 CSCD 北大核心 2022年第7期206-212,共7页
随着图卷积网络的发展,图卷积网络已经应用到很多任务中,其中就包含文本分类任务。通过将文本数据表示成图数据,进而在图上应用图卷积,从而捕获文本的结构信息和单词间的长距离依赖关系获得了良好的分类效果。但将文本建模成图模型后,... 随着图卷积网络的发展,图卷积网络已经应用到很多任务中,其中就包含文本分类任务。通过将文本数据表示成图数据,进而在图上应用图卷积,从而捕获文本的结构信息和单词间的长距离依赖关系获得了良好的分类效果。但将文本建模成图模型后,图卷积网络面临着文本上下文语义信息和局部特征信息表示不充分的问题。提出一种新的模型,利用双向长短时记忆网络(Bi_LSTM)和卷积神经网络(CNN)混合提取文本的上下文语义信息和局部特征信息去丰富图卷积网络(GCN)的文本表示,从而弥补图卷积网络的不足,同时使用图池化层筛选出重要节点帮助卷积神经网络捕获文本深层局部特征信息,使得模型能更好的表示文本信息。通过在3个英文数据集上的实验结果表明,该模型相比于基线模型有较好的分类效果。 展开更多
关键词 文本分类 神经网络 图卷积网络(GCN)
在线阅读 下载PDF
基于Vocab-GCN的中文医疗文本分类方法 被引量:3
10
作者 杜永兴 孙彤彤 +3 位作者 周李涌 李灵芳 李宝山 弓彦章 《传感器与微系统》 CSCD 北大核心 2023年第8期152-156,共5页
提出一种应用于中文医疗文本分类的基于词汇级的图卷积神经网络(Vocab-GCN)模型。该模型不仅可以直接对医学文本关系图进行学习,在图嵌入中保存关系图的全局结构信息,得到含有语义网络的深层病理关系,而且仅依靠两层卷积神经网络(CNN)... 提出一种应用于中文医疗文本分类的基于词汇级的图卷积神经网络(Vocab-GCN)模型。该模型不仅可以直接对医学文本关系图进行学习,在图嵌入中保存关系图的全局结构信息,得到含有语义网络的深层病理关系,而且仅依靠两层卷积神经网络(CNN)就展现出了良好的学习优势。实验结果表明:基于Vocab-GCN的中文医疗文本分类方法相比于最优的深度学习方法提高了6.17%的分类准确率,适用于患者初步对疾病类型做出诊断。 展开更多
关键词 图卷积神经网络 深度学习 中文医疗文本分类 疾病诊断
在线阅读 下载PDF
基于词共现与图卷积的文本分类方法 被引量:8
11
作者 申艳光 贾耀清 《计算机工程与应用》 CSCD 北大核心 2021年第11期173-178,共6页
针对文本分类任务中标注数量少的问题,提出了一种基于词共现与图卷积相结合的半监督文本分类方法。模型使用词共现方法统计语料库中单词的词共现信息,过滤词共现信息建立一个包含单词节点和文档节点的大型图结构的文本图,将文本图中邻... 针对文本分类任务中标注数量少的问题,提出了一种基于词共现与图卷积相结合的半监督文本分类方法。模型使用词共现方法统计语料库中单词的词共现信息,过滤词共现信息建立一个包含单词节点和文档节点的大型图结构的文本图,将文本图中邻接矩阵和关于节点的特征矩阵输入到结合注意力机制的图卷积神经网络中实现了对文本的分类。实验结果表明,与目前多种文本分类算法相比,该方法在经典数据集20NG、Ohsumed和MR上均取得了更好的效果。 展开更多
关键词 文本分类 词共现 图卷积神经网络
在线阅读 下载PDF
高斯混合模型与文本图卷积网络结合的虚假评论识别算法
12
作者 王星 刘贵娟 陈志豪 《计算机应用》 CSCD 北大核心 2024年第2期360-368,共9页
针对文本图卷积网络(Text GCN)窗口边权阈值策略不足的问题,为了更精准地挖掘相关的词关联结构、提高预测精度,提出一种高斯混合模型(GMM)与Text GCN结合的虚假评论识别算法F-Text GCN。首先,利用GMM分离噪声边权分布的特性,提高虚假评... 针对文本图卷积网络(Text GCN)窗口边权阈值策略不足的问题,为了更精准地挖掘相关的词关联结构、提高预测精度,提出一种高斯混合模型(GMM)与Text GCN结合的虚假评论识别算法F-Text GCN。首先,利用GMM分离噪声边权分布的特性,提高虚假评论在训练数据上相对正常评论数不足的边信号强度;然后,考虑到信源的多样性,综合文档、词汇和评论以及非文本特征构造邻接矩阵;最后,通过Text GCN的谱分解提取邻接矩阵的虚假评论关联结构实施预测。根据国内某大型电商平台采集的126086条实际中文评论数据开展实证研究,实验结果表明,F-Text GCN识别虚假评论的F1值达到82.92%,与预训练表征模型BERT和文本卷积神经网络相比分别提升了10.46%和11.60%,相较于只使用评论文本信源的Text GCN模型F1值提升了2.94%;研究了高仿虚假评论的预测错误率,在支持向量机(SVM)作用后难识别的评论样本上尝试二次识别,F-Text GCN整体预测准确率可达94.71%,相较于Text GCN和SVM,在识别准确率上分别提升了2.91%和14.54%。研究发现,虚假评论的二阶图邻居结构显示出较强的干预消费者决策的词汇,这表明所提算法特别适用于提取用于虚假评论检测的长程词语搭配结构和全局句子特征模式变化的场景。 展开更多
关键词 高斯混合模型 虚假评论识别 文本图卷积神经网络 邻接矩阵 词汇共现网络
在线阅读 下载PDF
生成式标签对抗的文本分类模型 被引量:2
13
作者 姚迅 秦忠正 杨捷 《计算机应用》 CSCD 北大核心 2024年第6期1781-1785,共5页
文本分类是自然语言处理(NLP)中的一项基础任务,目的是将文本数据分配至预先定义的类别。图卷积神经网络(GCN)与大规模的预训练模型BERT(Bidirectional Encoder Representations from Transformer)的结合在文本分类任务中取得了良好的... 文本分类是自然语言处理(NLP)中的一项基础任务,目的是将文本数据分配至预先定义的类别。图卷积神经网络(GCN)与大规模的预训练模型BERT(Bidirectional Encoder Representations from Transformer)的结合在文本分类任务中取得了良好的效果。大规模异构图中GCN的无向的信息传递产生信息噪声影响模型的判断,造成模型分类能力下降,针对这一问题,提出一种生成式标签对抗模型,即类对抗图卷积网络(CAGCN)模型,以降低分类时无关信息的干扰,提升模型的分类性能。首先,采用TextGCN(Text Graph Convolutional Network)中的构图法构建邻接矩阵,结合GCN和BERT模型作为类生成器(CG);其次,在模型训练时采用伪标签特征训练法,并构建聚类器与类生成器联合训练;最后,在多个广泛使用的数据集上进行实验。实验结果表明,在泛用的分类数据集20NG、R8、R52、Ohsumed和MR上,CAGCN模型的分类准确率比RoBERTaGCN模型分别提高了1.2、0.1、0.5、1.7和0.5个百分点。 展开更多
关键词 文本分类 图卷积神经网络 BERT 伪标签 异构图
在线阅读 下载PDF
基于句法和全文信息增强的中文事件检测方法 被引量:1
14
作者 王红 吴浩正 《数据采集与处理》 CSCD 北大核心 2022年第5期1059-1069,共11页
针对目前中文事件检测中词语之间句法依存关系利用不充分和缺乏文章全局语义信息的问题,提出了一种基于句法和全文信息增强的中文事件检测模型。模型首先引入图卷积网络(Graph convolutional network,GCN),通过捕获词语之间的依存句法... 针对目前中文事件检测中词语之间句法依存关系利用不充分和缺乏文章全局语义信息的问题,提出了一种基于句法和全文信息增强的中文事件检测模型。模型首先引入图卷积网络(Graph convolutional network,GCN),通过捕获词语之间的依存句法关系来增强词语的特征表示。之后采用双向门控循环单元(Bidirectional gate recurrent unit,Bi-GRU)分别学习句子内和句子之间的上下文信息,得到包含文章全局信息的句向量。最后将字、词、句3个粒度的信息通过门结构进行动态融合,使用条件随机场(Conditional random field,CRF)完成对句子中触发词的识别和标注。在ACE2005和CEC中文数据集上的实验结果表明,本文方法有效提升了中文事件检测的效果。 展开更多
关键词 事件检测 依存句法分析 特征增强 全文信息 图卷积神经网络 双向门控循环单元
在线阅读 下载PDF
融合文本图卷积和集成学习的文本分类方法 被引量:6
15
作者 周玄郎 邱卫根 张立臣 《计算机应用研究》 CSCD 北大核心 2022年第9期2621-2625,共5页
为了提高文本分类的准确率并解决文本图卷积神经网络对节点特征利用不足的问题,提出了一种新的文本分类模型,其内在融合了文本图卷积和Stacking集成学习方法的优点。该模型首先通过文本图卷积神经网络学习文档和词的全局表达以及文档的... 为了提高文本分类的准确率并解决文本图卷积神经网络对节点特征利用不足的问题,提出了一种新的文本分类模型,其内在融合了文本图卷积和Stacking集成学习方法的优点。该模型首先通过文本图卷积神经网络学习文档和词的全局表达以及文档的语法结构信息,再通过集成学习对文本图卷积提取的特征进行二次学习,以弥补文本图卷积节点特征利用不足的问题,提升单标签文本分类的准确率以及整个模型泛化能力。为了降低集成学习的时间消耗,移除了集成学习中的k折交叉验证机制,融合算法实现了文本图卷积和Stacking集成学习方法的关联。在R8、R52、MR、Ohsumed、20NG等数据集上的分类效果相对于传统的分类模型分别提升了1.5%、2.5%、11%、12%、7%以上,该方法在同领域的分类算法比较中表现优异。 展开更多
关键词 文本表示 文本分类 文本图卷积 集成学习 融合模型
在线阅读 下载PDF
结合上下文和依存句法信息的中文短文本情感分析 被引量:8
16
作者 杜启明 李男 +2 位作者 刘文甫 杨舒丹 岳峰 《计算机科学》 CSCD 北大核心 2023年第3期307-314,共8页
依存句法分析旨在从语言学的角度分析句子的句法结构。现有的研究表明,将这种类似于图结构的数据与图卷积神经网络(Graph Convolutional Network,GCN)进行结合,有助于模型更好地理解文本语义。然而,这些工作在将依存句法信息处理为邻接... 依存句法分析旨在从语言学的角度分析句子的句法结构。现有的研究表明,将这种类似于图结构的数据与图卷积神经网络(Graph Convolutional Network,GCN)进行结合,有助于模型更好地理解文本语义。然而,这些工作在将依存句法信息处理为邻接矩阵时,均忽略了句法依赖标签类型,同时也未考虑与依赖标签相关的单词语义,导致模型无法捕捉到文本中的深层情感特征。针对以上问题,提出了一种结合上下文和依存句法信息的中文短文本情感分析模型(Context and Dependency Syntactic Information,CDSI)。该模型不仅利用双向长短期记忆网络(Bidirectional Long Short-Term Memory,BiLSTM)提取文本的上下文语义,而且引入了一种基于依存关系感知的嵌入表示方法,以针对句法结构挖掘不同依赖路径对情感分类任务的贡献权重,然后利用GCN针对上下文和依存句法信息同时建模,以加强文本表示中的情感特征。基于SWB,NLPCC2014和SMP2020-EWEC数据集进行验证,实验表明CDSI模型能够有效融合语句中的语义以及句法结构信息,在中文短文本情感二分类以及多分类中均取得了较好的效果。 展开更多
关键词 句法结构 上下文信息 GCN 中文短文本
在线阅读 下载PDF
融合文本图卷积神经网络与注意力机制的唐诗情感分析 被引量:1
17
作者 蒋天奇 方贤进 任萍 《湖北民族大学学报(自然科学版)》 CAS 2024年第2期205-211,共7页
针对目前唐诗情感分析任务的语义提取不充分、数据集不完善的问题,构建了一个全新的唐诗情感分类数据集且进一步细化了情感极性,提出了一种融合文本图卷积神经网络与注意力机制(text-graph convolutional neural networks with attentio... 针对目前唐诗情感分析任务的语义提取不充分、数据集不完善的问题,构建了一个全新的唐诗情感分类数据集且进一步细化了情感极性,提出了一种融合文本图卷积神经网络与注意力机制(text-graph convolutional neural networks with attention mechanism,AM-Text-GCN)的情感分类模型。模型首先结合双向长短期记忆网络(bi-directional long short-term memory,BiLSTM)和注意力机制捕捉唐诗中的上下文信息和诗句间的语义特征,然后利用融入依存句法分析的2层文本图卷积神经网络在图卷积操作中聚合唐诗全局特征,最终输出唐诗的情感极性。结果表明,所提出模型的S F1值达了79.83%,相较于文本图神经网络的S F1值提高了5.46%,有效地提高了唐诗情感分析的准确性。该研究对于探索诗词情感在历史变迁中的作用具有重要意义和广泛的应用前景。 展开更多
关键词 情感分析 唐诗 文本图卷积神经网络 注意力机制 双向长短期记忆网络
在线阅读 下载PDF
基于语法依存图的中文微博细粒度情感分类 被引量:4
18
作者 方澄 李贝 +1 位作者 韩萍 吴琼 《计算机应用》 CSCD 北大核心 2023年第4期1056-1061,共6页
情感分析能从用户言论中快速准确地挖掘用户的情感倾向,有着极大的应用市场。针对微博语言语法结构复杂多样的特性,提出了一种基于语法依存结构的图卷积神经网络(SGCN)模型对中文微博进行细粒度的情感分类。所提模型兼具结构表达和语义... 情感分析能从用户言论中快速准确地挖掘用户的情感倾向,有着极大的应用市场。针对微博语言语法结构复杂多样的特性,提出了一种基于语法依存结构的图卷积神经网络(SGCN)模型对中文微博进行细粒度的情感分类。所提模型兼具结构表达和语义表达丰富的特点:基于词语间的依赖关系构建文本图,并通过点互信息(PMI)量化词语间的相关程度,作为相应边的权重以充分表现句子的结构信息;将融合位置信息的语义特征作为节点的初始特征,增加文本图中点的语义特征。为了验证所提模型的性能,在SMP2020(Social Media Processing 2020)微博情感分类数据集上,对两组包含开心、悲伤、愤怒、恐惧、惊讶和无情绪的6类微博情感数据进行了分析。实验结果表明,所提模型的平均F1分数可达到72.64%,相较于BERT(Bidirectional Encoder Representations from Transformers)词向量特征图卷积网络(BGCN)模型和文本级图神经网络(Text-Level-GNN)模型分别提高了2.75和3.87个百分点,验证了所提模型能更有效地利用句子的结构信息,提升模型的分类性能。 展开更多
关键词 微博 情感分析 图卷积网络 文本图 深度学习
在线阅读 下载PDF
基于图卷积网络的文本分割模型 被引量:1
19
作者 杜雨奇 郑津 +2 位作者 王杨 黄诚 李平 《计算机应用》 CSCD 北大核心 2022年第12期3692-3699,共8页
文本分割的主要任务是将文本按照主题相关的原则划分为若干个相对独立的文本块。针对现有文本分割模型提取文本段落结构信息、语义相关性及上下文交互等细粒度特征的不足,提出了一种基于图卷积网络(GCN)的文本分割模型TS-GCN。首先,基... 文本分割的主要任务是将文本按照主题相关的原则划分为若干个相对独立的文本块。针对现有文本分割模型提取文本段落结构信息、语义相关性及上下文交互等细粒度特征的不足,提出了一种基于图卷积网络(GCN)的文本分割模型TS-GCN。首先,基于文本段落的结构信息与语义逻辑构建出文本图;然后,引入语义相似性注意力来捕获文本段落节点间的细粒度相关性,并借助GCN实现文本段落节点高阶邻域间的信息传递,以此增强模型多粒度提取文本段落主题特征表达的能力。将所提模型与目前常用作文本分割任务基准的代表模型CATS及其基础模型TLT-TS进行对比。实验结果表明在Wikicities数据集上,TS-GCN在未增加任何辅助模块的情况下比TLT-TS的评价指标Pk值下降了0.08个百分点;在Wikielements数据集上,相较于CATS和TLT-TS,所提模型的Pk值分别下降了0.38个百分点和2.30个百分点,可见TLT-TS取得了较好的分割效果。 展开更多
关键词 文本分割 图卷积网络 注意力 自然语言处理 深度学习
在线阅读 下载PDF
融合用户评论和异构图神经网络的景点分类 被引量:2
20
作者 李山山 郭景峰 +2 位作者 郑超 魏宁 张丽艳 《小型微型计算机系统》 CSCD 北大核心 2023年第9期1884-1891,共8页
科技的发展使得数据量呈爆炸式增长,从数据中挖掘有价值的信息成为各行业研究的热点.旅游景点类型的准确划分,对于推动文化旅游产业发展具有重要意义.对此,论文融合景点评论构建景点异质信息网络,提出了SGAE(Scenic Spot Heterogeneous ... 科技的发展使得数据量呈爆炸式增长,从数据中挖掘有价值的信息成为各行业研究的热点.旅游景点类型的准确划分,对于推动文化旅游产业发展具有重要意义.对此,论文融合景点评论构建景点异质信息网络,提出了SGAE(Scenic Spot Heterogeneous Graph Attention Embedding)模型.首先,从旅游网站和百科网站爬取国内部分5A和部分4A景点的描述以及景点的评论数据,通过对数据的处理和分析,从评论中挖掘出10个相关主题,构建由景点名称、景点评论和评论主题组成的异质信息网络;其次,将不同类型节点信息映射到同一空间,构造异质图卷积的逐层传播规则;然后,根据邻居节点的类型和节点的不同对某一具体节点的影响不同,将双层注意力引入异质图卷积网络中,提出SGAE模型,学习景点名称的低维特征表示,通过Softmax函数进行归一化,确定景点类型;最后,在景点数据集上与经典分类算法对比,所提出的SGAE模型在准确率和F1值较当前最优方法分别提高5%和4%,在公共数据集AGNews和MR上SGAE模型性能优于所有对比模型,且与分类效果最好的HGCN-RN模型相比,SGAE在AGNews上准确率和F1值分别提升了1.95%和1.98%,在MR上准确率和F1值分别提升了3.92%和6.96%,充分验证了论文所提算法在分类任务上的有效性.总之,针对景点分类问题,论文所提出的SGAE模型有效的提高了旅游景点分类问题的效果,具有较好的应用前景. 展开更多
关键词 异构图网络 图卷积神经网络 注意力机制 表示学习 评论文本
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部