情感分析能从用户言论中快速准确地挖掘用户的情感倾向,有着极大的应用市场。针对微博语言语法结构复杂多样的特性,提出了一种基于语法依存结构的图卷积神经网络(SGCN)模型对中文微博进行细粒度的情感分类。所提模型兼具结构表达和语义...情感分析能从用户言论中快速准确地挖掘用户的情感倾向,有着极大的应用市场。针对微博语言语法结构复杂多样的特性,提出了一种基于语法依存结构的图卷积神经网络(SGCN)模型对中文微博进行细粒度的情感分类。所提模型兼具结构表达和语义表达丰富的特点:基于词语间的依赖关系构建文本图,并通过点互信息(PMI)量化词语间的相关程度,作为相应边的权重以充分表现句子的结构信息;将融合位置信息的语义特征作为节点的初始特征,增加文本图中点的语义特征。为了验证所提模型的性能,在SMP2020(Social Media Processing 2020)微博情感分类数据集上,对两组包含开心、悲伤、愤怒、恐惧、惊讶和无情绪的6类微博情感数据进行了分析。实验结果表明,所提模型的平均F1分数可达到72.64%,相较于BERT(Bidirectional Encoder Representations from Transformers)词向量特征图卷积网络(BGCN)模型和文本级图神经网络(Text-Level-GNN)模型分别提高了2.75和3.87个百分点,验证了所提模型能更有效地利用句子的结构信息,提升模型的分类性能。展开更多
文摘依存句法分析旨在从语言学的角度分析句子的句法结构。现有的研究表明,将这种类似于图结构的数据与图卷积神经网络(Graph Convolutional Network,GCN)进行结合,有助于模型更好地理解文本语义。然而,这些工作在将依存句法信息处理为邻接矩阵时,均忽略了句法依赖标签类型,同时也未考虑与依赖标签相关的单词语义,导致模型无法捕捉到文本中的深层情感特征。针对以上问题,提出了一种结合上下文和依存句法信息的中文短文本情感分析模型(Context and Dependency Syntactic Information,CDSI)。该模型不仅利用双向长短期记忆网络(Bidirectional Long Short-Term Memory,BiLSTM)提取文本的上下文语义,而且引入了一种基于依存关系感知的嵌入表示方法,以针对句法结构挖掘不同依赖路径对情感分类任务的贡献权重,然后利用GCN针对上下文和依存句法信息同时建模,以加强文本表示中的情感特征。基于SWB,NLPCC2014和SMP2020-EWEC数据集进行验证,实验表明CDSI模型能够有效融合语句中的语义以及句法结构信息,在中文短文本情感二分类以及多分类中均取得了较好的效果。
文摘情感分析能从用户言论中快速准确地挖掘用户的情感倾向,有着极大的应用市场。针对微博语言语法结构复杂多样的特性,提出了一种基于语法依存结构的图卷积神经网络(SGCN)模型对中文微博进行细粒度的情感分类。所提模型兼具结构表达和语义表达丰富的特点:基于词语间的依赖关系构建文本图,并通过点互信息(PMI)量化词语间的相关程度,作为相应边的权重以充分表现句子的结构信息;将融合位置信息的语义特征作为节点的初始特征,增加文本图中点的语义特征。为了验证所提模型的性能,在SMP2020(Social Media Processing 2020)微博情感分类数据集上,对两组包含开心、悲伤、愤怒、恐惧、惊讶和无情绪的6类微博情感数据进行了分析。实验结果表明,所提模型的平均F1分数可达到72.64%,相较于BERT(Bidirectional Encoder Representations from Transformers)词向量特征图卷积网络(BGCN)模型和文本级图神经网络(Text-Level-GNN)模型分别提高了2.75和3.87个百分点,验证了所提模型能更有效地利用句子的结构信息,提升模型的分类性能。