期刊文献+
共找到9篇文章
< 1 >
每页显示 20 50 100
基于双超图神经网络特征融合的文本分类
1
作者 郑诚 李鹏飞 《计算机工程》 北大核心 2025年第6期127-135,共9页
近年来,图神经网络(GNN)在文本分类任务中受到广泛应用。当前基于GNN的文本分类模型首先将文本建模为图,然后使用GNN对文本图进行特征传播与聚合,但是此类方法有两点不足:一是现有模型由于图结构的限制无法捕获单词之间的高阶语义关系;... 近年来,图神经网络(GNN)在文本分类任务中受到广泛应用。当前基于GNN的文本分类模型首先将文本建模为图,然后使用GNN对文本图进行特征传播与聚合,但是此类方法有两点不足:一是现有模型由于图结构的限制无法捕获单词之间的高阶语义关系;二是现有模型无法捕获文本中的关键语义信息。为了解决上述问题,提出一种基于双超图卷积网络特征融合的文本分类模型。一方面,使用原始文本建立文本超图;另一方面,为短文本引入外部知识,使用基于SenticNet词库的外部知识对文本进行语义增强,构建语义超图。经过超图卷积后通过注意力机制对双超图特征进行融合,实现短文本分类。在4个文本分类数据集上的实验结果表明,该模型优于基线模型,具有优越的文本分类性能。 展开更多
关键词 文本分类 超图 特征融合 SenticNet词库 自然语言处理
在线阅读 下载PDF
基于BERT和超图对偶注意力网络的文本情感分析 被引量:2
2
作者 胥桂仙 刘兰寅 +1 位作者 王家诚 陈哲 《计算机应用研究》 CSCD 北大核心 2024年第3期786-793,共8页
针对网络短文本存在大量的噪声和缺乏上下文信息的问题,提出一种基于BERT和超图对偶注意力机制的文本情感分析模型。首先利用BERT预训练模型强大的表征学习能力,对情感文本进行动态特征提取;同时挖掘文本的上下文顺序信息、主题信息和... 针对网络短文本存在大量的噪声和缺乏上下文信息的问题,提出一种基于BERT和超图对偶注意力机制的文本情感分析模型。首先利用BERT预训练模型强大的表征学习能力,对情感文本进行动态特征提取;同时挖掘文本的上下文顺序信息、主题信息和语义依存信息将其建模成超图,通过对偶图注意力机制来对以上关联信息进行聚合;最终将BERT和超图对偶注意力网络两个模块提取出的特征进行拼接,经过softmax层得到对文本情感倾向的预测结果。该模型在电商评论二分类数据集和微博文本六分类数据集上的准确率分别达到95.49%和79.83%,相较于基准模型分别提高2.27%~3.45%和6.97%~11.69%;同时还设计了消融实验验证模型各部分对分类结果的增益。实验结果表明,该模型能够显著提高针对中文网络短文本情感分析的准确率。 展开更多
关键词 文本情感分析 超图 图分类 注意力机制
在线阅读 下载PDF
基于文本超图构建的中文仇恨言论检测模型
3
作者 张顺香 王琰慧 +2 位作者 李冠憬 周渝皓 李嘉伟 《安徽理工大学学报(自然科学版)》 CAS 2024年第4期77-88,共12页
目的仇恨言论检测可以判定文本是否具有仇恨倾向,有助于筛除网络上的不当言论,维护网络环境的安全与秩序。为有效解决现有的仇恨言论检测方法依赖单一特征的图结构,难以捕捉文中由于对目标对象的隐性提及以及修辞手法的使用所带来的复... 目的仇恨言论检测可以判定文本是否具有仇恨倾向,有助于筛除网络上的不当言论,维护网络环境的安全与秩序。为有效解决现有的仇恨言论检测方法依赖单一特征的图结构,难以捕捉文中由于对目标对象的隐性提及以及修辞手法的使用所带来的复杂语义,从而导致仇恨言论检测准确率不高的问题。方法提出一种基于文本超图构建的中文仇恨言论检测模型,通过分析文本中的语序和语法信息,及利用大语言模型针对目标对象所获取的语义扩展信息来构建文本超图,从而提升仇恨言论检测的效果。首先,构建提示模板引导大语言模型识别文本中的目标对象,并对其进行知识补充作为文本的语义扩展信息;然后,构建文本超图,以挖掘文本中隐含的语义结构和关联关系,并通过超图注意力机制聚合超图信息得到全局特征;同时,利用roberta-wwm-ext对原始文本进行动态特征提取,得到文本特征;最后利用交叉注意力机制实现文本特征与全局特征的融合,并通过sigmoid计算仇恨倾向检测仇恨言论。结果在COLDataset数据集上进行实验,该方法在实验中取得了较好的效果,可以提高检测的精确率和F1值。结论实验结果表明,该模型能够有效地提升中文仇恨言论的检测效果。 展开更多
关键词 仇恨言论检测 文本超图 大语言模型 roberta-wwm-ext
在线阅读 下载PDF
基于高阶相关聚类的脱机手写文本行分割 被引量:1
4
作者 殷亚林 刘爱民 周祥东 《华中师范大学学报(自然科学版)》 CAS 北大核心 2017年第1期18-22,34,共6页
从手写文档图像中提取出文本行是文档分析的一个重要预处理步骤,但是由于手写文本行之间通常行方向不平行,甚至存在着交叠和弯曲,所以它仍然是一个具有挑战性的问题.针对该问题,提出了一种基于高阶相关聚类的脱机中文手写文本行的分割算... 从手写文档图像中提取出文本行是文档分析的一个重要预处理步骤,但是由于手写文本行之间通常行方向不平行,甚至存在着交叠和弯曲,所以它仍然是一个具有挑战性的问题.针对该问题,提出了一种基于高阶相关聚类的脱机中文手写文本行的分割算法.首先,使用连通部件构成一个文档超图,然后,在学习所得的相似性度量准则的约束下,通过高阶相关聚类算法将连通部件对标记为属于或者不属于同一文本行;最后,使用union-find算法将连通部件连接成为不同的文本行.该算法在HIT-MW脱机手写数据库上的803幅文档上取得了较好的效果,召回率99.05%,错误率为1.96%. 展开更多
关键词 手写文本行分割 高阶相关聚类 超图
在线阅读 下载PDF
基于规范割的文本超图聚类 被引量:1
5
作者 檀敬东 《大学数学》 2017年第6期33-36,共4页
超图聚类方法是目前主流聚类方法之一.它的经典版本出现在超大规模集成电路研究领域.近年来,它的各种改进版本被提出并广泛应用于机器视觉领域.例如,在图像聚类和运动分割方面,它的各种版本常有较好的表现.本文将超图聚类方法引入文本... 超图聚类方法是目前主流聚类方法之一.它的经典版本出现在超大规模集成电路研究领域.近年来,它的各种改进版本被提出并广泛应用于机器视觉领域.例如,在图像聚类和运动分割方面,它的各种版本常有较好的表现.本文将超图聚类方法引入文本聚类领域.首先,根据文本数据高度稀疏的特点,采用SVD(或PCA)对其进行降维;其次,采用基于大超边的超图规范割聚类对文本的低维投影进行聚类;最后,采用聚类准确率指标对聚类进行评价.在两个文本数据集的实验中,基于超图规范割聚类取得了比传统的k均值聚类和层次聚类更好的聚类表现. 展开更多
关键词 超图 规范割 文本聚类 随机聚类模型
在线阅读 下载PDF
结合Bert与超图卷积网络的文本分类模型 被引量:13
6
作者 李全鑫 庞俊 朱峰冉 《计算机工程与应用》 CSCD 北大核心 2023年第17期107-115,共9页
现有的图神经网络在处理文本分类问题时,通常将文本转化为图结构,然后利用图神经网络进行学习表示,从而分类。但基于图神经网络的方法存在两点不足,一是图结构利用二元关系对单词联系进行表示,缺乏对文本高阶关系的捕获;二是图神经网络... 现有的图神经网络在处理文本分类问题时,通常将文本转化为图结构,然后利用图神经网络进行学习表示,从而分类。但基于图神经网络的方法存在两点不足,一是图结构利用二元关系对单词联系进行表示,缺乏对文本高阶关系的捕获;二是图神经网络类模型难以捕获文本中丰富的语义关联。针对以上问题,提出了一种采用注意力机制将Bert与超图卷积网络结合的文本分类模型。通过Bert模型获得文本中的局部语义信息,通过构建文本超图获得单词间更广泛的文本关联信息,并经过超图卷积网络的学习表示得到文本全局结构特征,利用注意力机制对两种特征进行交互影响,获得更全面更充分的文本表示。在4个公开数据集上进行的多次实验表明,该模型与基线模型相比有更好的分类效果。 展开更多
关键词 文本分类 Bert 超图 神经网络
在线阅读 下载PDF
融合超图增强与双重对比学习的情感分析方法
7
作者 孙帅祺 魏桂英 武森 《计算机工程与应用》 2025年第22期137-147,共11页
情感分析是自然语言处理领域中一项具有挑战性的任务。现有的情感分析方法在语句的建模过程中往往会忽略词汇在不同环境下的差异化表达。针对此类问题,提出一种基于超图增强结合双重对比学习的文本情感分析模型(hypergraph enhancement ... 情感分析是自然语言处理领域中一项具有挑战性的任务。现有的情感分析方法在语句的建模过程中往往会忽略词汇在不同环境下的差异化表达。针对此类问题,提出一种基于超图增强结合双重对比学习的文本情感分析模型(hypergraph enhancement and dual contrastive learning,HDCL)。该模型通过标签感知的数据增强,强化情感的显式表达。使用超图结构学习文本语义之间的高阶潜在关联,并以双重对比学习优化语句表征,以实现丰富、准确的语句情感表示。该模型在真实数据集上的实验结果相较于其他基准模型有所提升,同时设计的消融实验与超参数分析进一步说明了提出的模型对于情感分析任务的有效性。 展开更多
关键词 文本情感分析 超图 双重对比学习
在线阅读 下载PDF
文本挖掘与专利数据协同驱动的产品功能扩展研究 被引量:1
8
作者 林文广 刘晓东 肖人彬 《机械工程学报》 EI CAS CSCD 北大核心 2024年第13期56-70,共15页
功能扩展是实现产品创新设计的重要途径,而数据驱动又是产品功能扩展的关键支撑技术,据此提出文本挖掘与专利数据协同驱动的产品功能扩展研究方法,为已有产品的精准变更及升级提供定量研究方法。首先,分析目标产品功能-结构信息,并在现... 功能扩展是实现产品创新设计的重要途径,而数据驱动又是产品功能扩展的关键支撑技术,据此提出文本挖掘与专利数据协同驱动的产品功能扩展研究方法,为已有产品的精准变更及升级提供定量研究方法。首先,分析目标产品功能-结构信息,并在现有网络模型基础上融合局部超图网络模型对产品进行建模,以此计算产品元件重要性;其次,在检索获取英文专利文本数据的基础上,运用词性标注(Part-of-speech tagging,POS tagging)和依存句法(Dependency parsing,DP)构建规则算法以挖掘语句中的主语-谓语-宾语(Subject-action-object,SAO),并获取同类产品的全部功能和结构信息;再次,以专利文本数据为语料库,通过基于变换器的双向编码器表示(Bidirectional encoder representations from transformers,BERT)训练词向量,作为查找相似结构和相似功能的工具,并结合协同推荐算法提出了四种扩展策略:目标元件其他功能扩展,目标元件相似功能扩展,相似元件其他功能扩展以及相似组件其他功能扩展。最后,结合企业需求以一种手持花洒产品为案例验证了研究方法的可行性及有效性。 展开更多
关键词 功能扩展 协同推荐 专利文本 局部超图 BERT
原文传递
基于超图注意力网络的生物医学文本分类方法 被引量:9
9
作者 白思萌 牛振东 +3 位作者 何慧 时恺泽 易坤 马原驰 《数据分析与知识发现》 CSSCI CSCD 北大核心 2022年第11期13-24,共12页
【目的】融合标签语义信息,采用文本级超图和交叉注意力机制捕捉文献文本的组织结构及语义语法信息,提高生物医学领域的文本分类效果。【方法】使用经微调的BioBERT模型从生物医学领域文本中获取向量特征,构建文本级超图捕获文本的语序... 【目的】融合标签语义信息,采用文本级超图和交叉注意力机制捕捉文献文本的组织结构及语义语法信息,提高生物医学领域的文本分类效果。【方法】使用经微调的BioBERT模型从生物医学领域文本中获取向量特征,构建文本级超图捕获文本的语序、语义及语法信息,通过提出的交叉注意力机制网络将文本级超图和标签语义信息进行特征融合实现文本分类任务。【结果】在数据集PM-Sentence数据集上的实验结果表明,所提模型相较于基线模型在综合评价F1指标上最大提高2.34个百分点。【局限】构建的数据集有待扩充,对所提模型用于该领域其他任务的适用性有待进一步研究。【结论】所提模型提升了生物医学文本的分类效果,为知识检索、知识挖掘等知识服务应用提供了有效支持。 展开更多
关键词 文本分类 文本级超图 交叉注意力机制 生物医学领域 标签信息融合
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部