期刊文献+
共找到282篇文章
< 1 2 15 >
每页显示 20 50 100
基于标签感知融合与多尺度双向注意力交互的多标签文本分类模型
1
作者 郑启扬 《湖北大学学报(自然科学版)》 2026年第1期69-78,共10页
在多标签文本分类任务中,现有方法主要针对文本信息的提取,普遍存在对标签语义利用不足的问题。对此,提出一种基于标签感知融合与多尺度双向注意力机制的多标签分类模型。基于BERT模型,设计一种标签感知融合机制,将文本与标签嵌入统一序... 在多标签文本分类任务中,现有方法主要针对文本信息的提取,普遍存在对标签语义利用不足的问题。对此,提出一种基于标签感知融合与多尺度双向注意力机制的多标签分类模型。基于BERT模型,设计一种标签感知融合机制,将文本与标签嵌入统一序列,通过跨度预测捕捉局部关联性;引入词过滤器模块,依据词-标签余弦相似度筛选关键词汇,抑制噪声干扰;构建多尺度双向注意力网络,通过不同卷积核捕捉词级、短语级与句子级语义,并利用标签-文本与文本-标签双向注意力机制挖掘深层交互特征,实现动态语义适配。在公开数据集AAPD、ArXiv-ACM与Reuters-21578上的实验表明,本模型在maF1、miF1和HL指标上与基线方法相比均得到了最佳表现。 展开更多
关键词 多标签文本分类 标签感知融合机制 词过滤器 多尺度双向注意力网络
在线阅读 下载PDF
融合数据增强和多通道解码的中文多标签文本分类方法
2
作者 黄荣达 彭若馨 杨英勃 《网络新媒体技术》 2026年第1期57-65,共9页
中文多标签文本分类是自然语言处理领域的重要任务之一,广泛应用于情感分析、舆情监测、文本标注等多个领域。然而,中文文本的复杂性以及多标签数据集的特殊性(如数据量少、标签不平衡、复合标签等)给分类任务带来诸多挑战。本文提出一... 中文多标签文本分类是自然语言处理领域的重要任务之一,广泛应用于情感分析、舆情监测、文本标注等多个领域。然而,中文文本的复杂性以及多标签数据集的特殊性(如数据量少、标签不平衡、复合标签等)给分类任务带来诸多挑战。本文提出一种基于数据增强和多通道解码的中文多标签文本分类模型,通过大模型增强平衡不同类型的标签数据,同时利用多通道解码改善单通道解码不能充分区分不同维度语义差别的问题。实验结果表明,所提出的方法在多个数据集上平均F1值从69提升至79,为中文多标签文本分类任务提供新的解决方案。 展开更多
关键词 中文数据集 多标签文本分类 数据增强 多通道解码
在线阅读 下载PDF
基于标签构建与特征融合的多标签文本分类研究方法 被引量:4
3
作者 王旭阳 卢世红 《贵州师范大学学报(自然科学版)》 北大核心 2025年第1期105-114,共10页
目前存在的多标签文本分类任务算法,对于标签的建模不是很成熟,其中对于标签的依赖性问题,以及标签特征和文本特征的融合程度问题,均缺乏有效的处理方法。为了更有效地利用标签间的依赖关系,以及整合标签特征与文本特征的融合,提出了一... 目前存在的多标签文本分类任务算法,对于标签的建模不是很成熟,其中对于标签的依赖性问题,以及标签特征和文本特征的融合程度问题,均缺乏有效的处理方法。为了更有效地利用标签间的依赖关系,以及整合标签特征与文本特征的融合,提出了一种名为CGTCN的多标签文本分类模型。该模型从标签构建和特征融合的角度出发,通过CompGCN建模标签依赖关系,先利用Transformer中的多头交叉注意力机制初步融合标签特征和文本特征,然后再通过CorNet网络进一步捕获标签特征与文本特征之间的相关性,从而得到最终的标签预测。实验结果显示,与基准模型相比,该方法能够有效的提升模型性能,在多标签文本分类任务中取得更好的分类效果。 展开更多
关键词 多标签文本分类 CompGCN TRANSFORMER CorNet 标签相关性
在线阅读 下载PDF
基于社交媒体短文本的城市内涝灾情信息识别与分析 被引量:1
4
作者 王鑫 罗年学 赵前胜 《测绘与空间地理信息》 2025年第4期41-44,47,共5页
社交媒体在灾害发生时能够快速提供实时且丰富的灾情信息,为应急救援提供辅助参考。然而,社交媒体信息通常以短文本形式呈现,具有口语化、语义特征稀疏和标注语料匮乏等特征,给灾情信息的识别与分析带来挑战。为此,本文提出了一种结合... 社交媒体在灾害发生时能够快速提供实时且丰富的灾情信息,为应急救援提供辅助参考。然而,社交媒体信息通常以短文本形式呈现,具有口语化、语义特征稀疏和标注语料匮乏等特征,给灾情信息的识别与分析带来挑战。为此,本文提出了一种结合灾害领域知识的预训练语言模型增强方法,用于识别和分类灾情信息。首先,构建灾情知识库,包含不同灾损事件的触发词及论元;其他,通过分析短文本与灾损事件触发词的语义相似度,生成灾损知识编码;最后,将灾情领域知识与预训练词向量融合增强特征向量并输入神经网络模型实现多标签分类。以2021年7月20日前后河南暴雨灾情数据为例,将本文方法与TextCNN、Attention based CNN模型进行了对比实验,结果表明,该方法不仅有效提升了小样本数据的分类精度,还有效缓解了语义高度重合的数据类型容易错分的问题。同时,对分类结果进行灾损事件论元匹配能够充分挖掘涉灾短文本中的有效灾情信息,辅助应急救援决策。 展开更多
关键词 社交媒体 短文本 多标签分类 积水点 物资需求
在线阅读 下载PDF
基于链接策略和不同粒度特征融合的极限多标签文本分类模型
5
作者 胡婕 郑启扬 +1 位作者 曹芝兰 刘梦赤 《中文信息学报》 北大核心 2025年第3期84-95,共12页
现有基于Transformer的极限多标签文本分类模型尽管引入了标签语义,但利用标签语义来探索文本和标签之间的语义潜在关系仍存在不足。对此,该文将标签合并成序列,并使用链接策略在同一空间内联合学习文本和标签特征来捕获文本和标签的语... 现有基于Transformer的极限多标签文本分类模型尽管引入了标签语义,但利用标签语义来探索文本和标签之间的语义潜在关系仍存在不足。对此,该文将标签合并成序列,并使用链接策略在同一空间内联合学习文本和标签特征来捕获文本和标签的语义。然后,通过注意力机制将标签语义和文档内容相结合生成感知文本,有效地探索文本信息和标签语义的交互关系。此外,该文通过融合机制将粗粒度层次特征和细粒度特征相结合,帮助模型更好地学习不同层次粒度的文档语义信息。在三个公开的数据集Eurlex-4K、Wiki10-30K和Kan-Shan Cup上进行了模型验证,实验结果表明,该文所提模型P@k值优于对比模型,综合性能得到有效提升。 展开更多
关键词 极限多标签文本分类 链接策略 感知文本 细粒度特征
在线阅读 下载PDF
融合外部语义知识的多标签分类方法
6
作者 杨进才 班启旭 +1 位作者 杨旭生 沈显君 《计算机应用》 北大核心 2025年第12期3757-3763,共7页
文本分类作为自然语言处理(NLP)领域的重要任务,它的多标签分类因标签空间大而成为难点。针对该问题,以儿童读物中的价值观标识为实例,提出一种融合外部语义知识的多标签分类方法HSGIN(Heterogeneous Semantic Gated Interaction Netwo... 文本分类作为自然语言处理(NLP)领域的重要任务,它的多标签分类因标签空间大而成为难点。针对该问题,以儿童读物中的价值观标识为实例,提出一种融合外部语义知识的多标签分类方法HSGIN(Heterogeneous Semantic Gated Interaction Network)。首先,利用SBERT(Sentence embeddings from Siamese BERT(Bidirectional Encoder Representations from Transformers))和双向长短期记忆(Bi-LSTM)网络提取文本特征;其次,通过异质图转换架构(HGT)联合建模知识图谱(KG)中的实体和关系,并利用先验知识和语义关联提取标签特征;最后,将文本特征和标签特征进行注意力融合以得到不同的标签特征表示,且引入门控图神经网络(GGNN)捕捉标签间的语义依赖和交互模式并进行预测。实验结果表明,相较于目前性能先进的对比方法BERT,所提方法的精确率、召回率和F1分数分别提升了2.66、0.47和1.16个百分点。以上实验结果验证了所提方法的有效性,同时,对儿童读物中价值观标识的精准分析有助于为儿童选择健康的读物。 展开更多
关键词 多标签文本分类 知识图谱 异质图转换架构 门控图神经网络 标签相关性
在线阅读 下载PDF
融合特征增强和对比学习的电力客服工单多标签文本分类方法
7
作者 周景 唐振洋 +1 位作者 董晖 刘心 《计算机应用》 北大核心 2025年第12期3847-3854,共8页
电力客服工单多标签文本分类(MLTC)在提升服务效率与用户满意度方面具有重要意义。针对电力客服工单MLTC中的标签关系建模不足与类别不平衡问题,提出一种融合特征增强和对比学习的电力客服工单MLTC方法。首先,通过预训练语言模型提取客... 电力客服工单多标签文本分类(MLTC)在提升服务效率与用户满意度方面具有重要意义。针对电力客服工单MLTC中的标签关系建模不足与类别不平衡问题,提出一种融合特征增强和对比学习的电力客服工单MLTC方法。首先,通过预训练语言模型提取客服工单文本特征;其次,结合多头注意力机制的全局编码与卷积神经网络(CNN)的局部编码模块,设计一种文本特征增强方法,以有效捕捉电力工单文本中的重要信息并提升特征表达能力;最后,引入对比学习改进的K最近邻(KNN)算法的MLTC框架,采用R-Drop(Regularized Dropout)方法生成正样本,而对负样本重新加权,并在训练中结合监督对比学习损失函数提高KNN机制推理期间检索到的邻居的质量,从而有效地缓解样本不平衡带来的负面影响。实验结果表明,所提方法在电力客服工单数据集上的微平均F1值为92.17%,较BERT(Bidirectional Encoder Representations from Transformers)模型提高了1.62个百分点;同时,所提方法在MLTC公共数据集AAPD和RCV1-V2上分别取得了75.2%和88.5%的微平均F1值,不仅在提升工单处理准确性和服务效率方面展现出较高的应用价值,而且在复杂MLTC任务中具备有效性。 展开更多
关键词 多标签文本分类 电力客服工单 对比学习 特征增强 预训练语言模型
在线阅读 下载PDF
中文电子病历标注系统构建与应用 被引量:1
8
作者 赵琬清 胡佳慧 +2 位作者 陈凌云 娄培 方安 《医学信息学杂志》 2025年第6期74-80,共7页
目的/意义构建中文电子病历标注系统,实现电子病历文本的自动化标注。方法/过程分析系统需求,阐述系统架构,从数据层、服务层与功能层3方面对中文电子病历标注系统进行介绍,包括用户权限管理、实体和关系标注流程以及标注算法等。结果/... 目的/意义构建中文电子病历标注系统,实现电子病历文本的自动化标注。方法/过程分析系统需求,阐述系统架构,从数据层、服务层与功能层3方面对中文电子病历标注系统进行介绍,包括用户权限管理、实体和关系标注流程以及标注算法等。结果/结论中文电子病历标注系统能有效满足电子病历标注任务的需求,目前已成功应用于垂体瘤电子病历语料构建工作。 展开更多
关键词 中文电子病历 文本标注 医学标注系统 实体识别
暂未订购
结合标签混淆的中文文本分类数据增强技术 被引量:1
9
作者 孙海涛 林佳瑜 +1 位作者 梁祖红 郭洁 《计算机应用》 北大核心 2025年第4期1113-1119,共7页
传统数据增强技术,如同义词替换、随机插入和随机删除等,可能改变文本的原始语义,甚至导致关键信息丢失。此外,在文本分类任务中,数据通常包含文本部分和标签部分,然而传统数据增强方法仅针对文本部分。为解决这些问题,提出一种结合标... 传统数据增强技术,如同义词替换、随机插入和随机删除等,可能改变文本的原始语义,甚至导致关键信息丢失。此外,在文本分类任务中,数据通常包含文本部分和标签部分,然而传统数据增强方法仅针对文本部分。为解决这些问题,提出一种结合标签混淆的数据增强(LCDA)技术,从文本和标签这2个基本方面入手,为数据提供全面的强化。在文本方面,通过对文本进行标点符号随机插入和替换以及句末标点符号补齐等增强,在保留全部文本信息和顺序的同时增加文本的多样性;在标签方面,采用标签混淆方法生成模拟标签分布替代传统的one-hot标签分布,以更好地反映实例和标签与标签之间的关系。在THUCNews(TsingHua University Chinese News)和Toutiao这2个中文新闻数据集构建的小样本数据集上分别结合TextCNN、TextRNN、BERT(Bidirectional Encoder Representations from Transformers)和RoBERTa-CNN(Robustly optimized BERT approach Convolutional Neural Network)文本分类模型的实验结果表明,与增强前相比,性能均得到显著提升。其中,在由THUCNews数据集构造的50-THU数据集上,4种模型结合LCDA技术后的准确率相较于增强前分别提高了1.19、6.87、3.21和2.89个百分点;相较于softEDA(Easy Data Augmentation with soft labels)方法增强的模型分别提高了0.78、7.62、1.75和1.28个百分点。通过在文本和标签这2个维度的处理结果可知,LCDA技术能显著提升模型的准确率,在数据量较少的应用场景中表现尤为突出。 展开更多
关键词 数据增强 文本分类 标签混淆 中文新闻主题 预训练模型
在线阅读 下载PDF
基于多尺度特征提取的层次多标签文本分类方法 被引量:2
10
作者 武子轩 王烨 于洪 《郑州大学学报(理学版)》 CAS 北大核心 2025年第2期24-30,共7页
针对现有的特征提取方法忽略文本局部和全局联系的问题,提出了基于多尺度特征提取的层次多标签文本分类方法。首先,设计了多尺度特征提取模块,对不同尺度特征进行捕捉,更好地表示文本语义。其次,将层次特征嵌入文本表示中,得到具有标签... 针对现有的特征提取方法忽略文本局部和全局联系的问题,提出了基于多尺度特征提取的层次多标签文本分类方法。首先,设计了多尺度特征提取模块,对不同尺度特征进行捕捉,更好地表示文本语义。其次,将层次特征嵌入文本表示中,得到具有标签特征的文本语义表示。最后,在标签层次结构的指导下对输入文本构建正负样本,进行对比学习,提高分类效果。在WOS、RCV1-V2、NYT和AAPD数据集上进行对比实验,结果表明,所提模型在评价指标上表现出色,超过了其他主流模型。此外,针对层次分类提出层次Micro-F 1和层次Macro-F 1指标,并对模型效果进行了评价。 展开更多
关键词 层次多标签文本分类 多尺度特征提取 对比学习 层次Micro-F 1 层次Macro-F 1
在线阅读 下载PDF
基于特征融合动态图网络的多标签文本分类算法 被引量:1
11
作者 黄靖 陶竹林 +1 位作者 杜晓宇 项欣光 《软件学报》 北大核心 2025年第7期3239-3252,共14页
多标签文本分类旨在为文本分配若干预定义的标签或类别.为了充分发掘标签间的关联,目前的方法通常使用标签关系图并结合图神经网络获取标签特征表示.然而,这类方法过度依赖初始建图策略,忽视了当前文本中固有的标签相关性,使得分类结果... 多标签文本分类旨在为文本分配若干预定义的标签或类别.为了充分发掘标签间的关联,目前的方法通常使用标签关系图并结合图神经网络获取标签特征表示.然而,这类方法过度依赖初始建图策略,忽视了当前文本中固有的标签相关性,使得分类结果更依赖于数据集统计信息,而容易忽视当前文本段中的标签相关信息.因此,提出一种基于特征融合动态图网络的多标签文本分类算法,设计动态图来建模当前文本中的标签相关性,并结合特征融合与图神经网络,形成基于当前文本的标签表示,并由此形成更为准确的多标签文本结果.随后,设计实验进行验证,在3个数据集实验结果表明,所提出的模型在多标签分类任务中取得优秀的性能,验证其有效性和可行性. 展开更多
关键词 多标签文本分类 图卷积网络 注意力机制 动态图
在线阅读 下载PDF
基于多层语言特征的辞格多标签分类方法研究
12
作者 黄欢 李宝安 +2 位作者 张凯 滕尚志 吕学强 《中文信息学报》 北大核心 2025年第8期31-41,共11页
多标签辞格自动分类研究深受中文篇章智能评测的密切关注。传统辞格自动识别方法存在仅考虑句子语义忽略字词语义信息,以及仅使用单一类别的标签描述等问题。针对以上两个问题,该文提出了一种联合多层次语法、语义和标签信息的多标签辞... 多标签辞格自动分类研究深受中文篇章智能评测的密切关注。传统辞格自动识别方法存在仅考虑句子语义忽略字词语义信息,以及仅使用单一类别的标签描述等问题。针对以上两个问题,该文提出了一种联合多层次语法、语义和标签信息的多标签辞格分类模型,该模型利用BERT提取修辞文本的字粒度语义向量,通过句法依存树和图卷积神经网络提取词粒度语法、语义向量并进行交互融合。将字粒度向量表示、词粒度向量表示拼接,并通过自注意力机制捕获两者间的语义信息,利用注意力机制融合文本信息和标签信息实现分类。实验表明,该模型在公开数据集AAPD和构建的辞格数据集CRTD上与其他模型相比具有更好的辞格多标签分类性能,在F1评价指标上分别提升了3%和2%。 展开更多
关键词 多标签分类 辞格识别 句法依存分析 文本标签融合
在线阅读 下载PDF
基于对比学习增强双注意力机制的多标签文本分类方法
13
作者 余明峰 秦永彬 +2 位作者 黄瑞章 陈艳平 林川 《计算机应用》 北大核心 2025年第6期1732-1740,共9页
针对现有的基于注意力机制的方法难以捕捉文本之间复杂的依赖关系的问题,提出一种基于对比学习增强双注意力机制的多标签文本分类方法。首先,分别学习基于自注意力和基于标签注意力的文本表示,并融合二者以获得更全面的文本表示捕捉文... 针对现有的基于注意力机制的方法难以捕捉文本之间复杂的依赖关系的问题,提出一种基于对比学习增强双注意力机制的多标签文本分类方法。首先,分别学习基于自注意力和基于标签注意力的文本表示,并融合二者以获得更全面的文本表示捕捉文本的结构特征以及文本与标签之间的语义关联;其次,给定一个多标签对比学习目标,利用标签引导的文本相似度监督文本表示的学习,以捕捉文本之间在主题、内容和结构层面上复杂的依赖关系;最后,使用前馈神经网络作为分类器进行文本分类。实验结果表明,相较于LDGN(Label-specific Dual Graph neural Network),所提方法在EUR-Lex(European Union Law Document)数据集与Reuters-21578数据集上的排名第5处的归一化折现累积收益(nDCG@5)值分别提升了1.81和0.86个百分点,在AAPD(Arxiv Academic Paper Dataset)数据集与RCV1(Reuters Corpus VolumeⅠ)数据集上也都取得了有竞争力的结果。可见,所提方法能有效捕捉文本之间在主题、内容和结构层面上复杂的依赖关系,从而在多标签文本分类任务上取得较优结果。 展开更多
关键词 多标签文本分类 对比学习 双注意力 标签注意力 自注意力
在线阅读 下载PDF
基于临床疗效评价的中医药论文多标签分类研究 被引量:1
14
作者 高曼 童元元 +5 位作者 刘扬 孙美玲 张雨琪 赵芳华 李彦文 李海燕 《中国数字医学》 2025年第2期14-20,共7页
目的:利用深度学习和多标签分类技术,对论文题录信息实施多学科分类,促进实现中医药领域文献自动分类。方法:选取《2022年度中医医院学科(专科)学术影响力评价研究报告》21万余条中文论文题录信息作为样本,采用BERT、CNN、BiLSTM、CNN-B... 目的:利用深度学习和多标签分类技术,对论文题录信息实施多学科分类,促进实现中医药领域文献自动分类。方法:选取《2022年度中医医院学科(专科)学术影响力评价研究报告》21万余条中文论文题录信息作为样本,采用BERT、CNN、BiLSTM、CNN-BiLSTM等深度学习方法,构建多标签分类模型进行实验,并对比不同模型和特征组合的实验效果。结果:中医药学术论文的多学科自动分类效果最好的模型为BiLSTM和CNN,最佳特征组合为题名+关键词+摘要,两个模型Macro-F1值分别达95.81%和95.06%。结论:当前深度学习模型多样,受到训练数据、任务特性等方面影响,不同模型在相同任务中表现效果会有所差异,因此实施文本分类时可采用多种不同类型的深度学习模型进行训练对比结果,从而筛选最佳模型与特征组合。 展开更多
关键词 中医药 临床疗效评价 多标签分类 文本分类 深度学习
暂未订购
一种标签融合驱动的中文医疗实体关系抽取方法
15
作者 陈闯 张维彦 +1 位作者 阮彤 郑红 《华东理工大学学报(自然科学版)》 北大核心 2025年第2期260-269,共10页
医疗实体关系抽取是推动医疗信息化建设的关键步骤,旨在从医疗文本中抽取结构化的三元组信息。针对现有方法对实体类型标签和关系标签利用不充分的问题,提出了一种标签融合驱动的中文医疗实体关系抽取框架。首先,将实体关系抽取任务拆... 医疗实体关系抽取是推动医疗信息化建设的关键步骤,旨在从医疗文本中抽取结构化的三元组信息。针对现有方法对实体类型标签和关系标签利用不充分的问题,提出了一种标签融合驱动的中文医疗实体关系抽取框架。首先,将实体关系抽取任务拆分成双向的4个命名实体识别任务,并将每个任务的标签替换为头尾实体类型标签和关系标签的融合;其次,设计了三元组构造策略以最大限度利用双向抽取出的三元组;最后,利用三元组双向过滤模型筛选候选三元组。结果表明,该方法相较于GPLinker在F1指标上提升了3.01%。此外,该方法在医疗领域的重叠关系、多三元组和跨句三元组复杂场景中也表现出了优秀的性能。 展开更多
关键词 医疗文本 实体关系抽取 标签融合 双向抽取 三元组过滤模型
在线阅读 下载PDF
基于选择实验法的消费者对不同地膜回收利用标识玉米偏好及支付意愿研究
16
作者 张俊妍 周一帆 +4 位作者 陈政婕 孙艺铭 黄鑫 尹冠球 李福夺 《农业资源与环境学报》 北大核心 2025年第6期1573-1580,共8页
为探讨消费者对不同地膜回收利用标识(包括地膜回收方式和可降解地膜)玉米产品的支付意愿及其影响因素,本研究通过设计离散选择实验,采用虚拟品牌方法,构建了包含玉米颜色、口感、有机认证、地膜回收利用标识、转基因属性、地理标识及... 为探讨消费者对不同地膜回收利用标识(包括地膜回收方式和可降解地膜)玉米产品的支付意愿及其影响因素,本研究通过设计离散选择实验,采用虚拟品牌方法,构建了包含玉米颜色、口感、有机认证、地膜回收利用标识、转基因属性、地理标识及价格等属性的即食玉米产品,设计两套选择实验卡。基于收集的382份有效问卷构建的条件Logit模型结果显示,消费者对玉米产品的属性偏好存在显著差异。其中玉米颜色、口感、转基因、地膜回收利用标识以及地理标识均对购买意愿产生正向影响。具体而言,消费者更倾向于为采用可降解地膜生产的玉米产品支付溢价,其最高溢价意愿为7.798元·根^(-1);在口感方面,消费者对甜糯玉米的偏好尤为明显,愿意额外支付11.174元·根^(-1);而对于有地理标识的玉米产品,消费者愿意额外支付2.688元·根^(-1)。此外,颜色偏好方面,消费者更倾向于选择黑色玉米。为提升消费者对地膜回收和可降解地膜玉米产品的支付意愿,本研究建议在包装设计中应充分展现产品的环境属性,通过积极传达地膜覆盖、环保理念等信息,引导消费者形成绿色消费行为,从而推动地膜回收利用与可降解地膜的推广。 展开更多
关键词 离散选择实验 文本分析 地膜回收利用标识 条件Logit模型 支付意愿
在线阅读 下载PDF
南海疆维权文献证据知识元价值体系与多标签自动分类研究
17
作者 王燕红 杨海平 +2 位作者 程为 彭玉芳 朱梦蝶 《情报杂志》 北大核心 2025年第5期174-181,共8页
[研究目的]解决南海疆维权证据价值多重语义分类问题,实现证据知识元价值的多标签自动分类,填补南海疆维权文献中对证据知识价值揭示的不足,丰富面向南海问题研究和南海维权知识服务的南海疆维权证据自动分类研究。[研究方法]深入文献... [研究目的]解决南海疆维权证据价值多重语义分类问题,实现证据知识元价值的多标签自动分类,填补南海疆维权文献中对证据知识价值揭示的不足,丰富面向南海问题研究和南海维权知识服务的南海疆维权证据自动分类研究。[研究方法]深入文献内容到知识元层面对细粒度的证据知识从语用价值层面进行分类,深度揭示文献中证据知识的价值,构建南海疆维权文献证据知识元价值体系,并利用ALBERT实现证据知识元多标签自动分类。[研究结果/结论]实现南海疆维权文献证据知识元价值的多重语义分类,有助于南海疆维权文献知识发现场景中的语义检索与关联,服务于南海维权战略。 展开更多
关键词 南海疆维权文献 价值体系 证据知识元 多标签 文本分类
在线阅读 下载PDF
融合胶囊网络与细粒度语义匹配的多标签文本分类
18
作者 宋珂 李翔 林剑楚 《计算机应用研究》 北大核心 2025年第12期3698-3706,共9页
基于深度学习的多标签文本分类主要存在两个方面的不足:一是忽略标签的语义信息以及标签之间的依赖关系,二是忽略了文本与标签之间的细粒度语义匹配。针对上述问题,提出了一种融合胶囊网络与细粒度语义匹配的多标签文本分类方法。首先... 基于深度学习的多标签文本分类主要存在两个方面的不足:一是忽略标签的语义信息以及标签之间的依赖关系,二是忽略了文本与标签之间的细粒度语义匹配。针对上述问题,提出了一种融合胶囊网络与细粒度语义匹配的多标签文本分类方法。首先通过标签嵌入将标签信息融入节点构建图结构,并通过图卷积网络在节点间传递信息,深入挖掘标签间的关联性。然后,计算标签注意力和文本自注意力,并构建标签协同注意力网络和文本协同注意力网络。最后,将特征输入胶囊网络分类器以捕捉多层次语义信息并匹配想要的标签。在AAPD、RCV1-V2和EUR-Lex数据集上进行实例验证,所提出的方法在P@k和nDCG@k指标上均优于其他方法,实验结果证明了胶囊网络和多粒度语义匹配策略的有效性。 展开更多
关键词 多标签文本分类 标签注意力 文本自注意力 协同注意力 胶囊网络
在线阅读 下载PDF
基于动态主题情感模型的文本聚类算法
19
作者 胡萍 《吉林大学学报(理学版)》 北大核心 2025年第2期528-536,共9页
针对目前已有的相关主题模型中,对大众情感因素考虑不足,难以精准挖掘,同时对社交文本的实时动态演化考虑弱化了模型聚类能力的问题,通过在模型中增加情感层以提取社交文本情感极性特征,并引入先验分布函数,提出一种基于动态主题情感模... 针对目前已有的相关主题模型中,对大众情感因素考虑不足,难以精准挖掘,同时对社交文本的实时动态演化考虑弱化了模型聚类能力的问题,通过在模型中增加情感层以提取社交文本情感极性特征,并引入先验分布函数,提出一种基于动态主题情感模型的文本聚类算法.利用真实新冠疫情Twitter文本数据集进行实验,实验结果表明,该模型的性能优于基线模型,提高了情感特征区分度,使文本主题与对应的情感极性联合生成时间节点,进而使模型有处理时间演化的能力. 展开更多
关键词 动态主题情感模型 文本挖掘 情感标签 时间戳 文本聚类 困惑度
在线阅读 下载PDF
面向标签共现和长尾分布的层级文本分类
20
作者 智媛 雷海卫 张斌龙 《计算机系统应用》 2025年第2期174-182,共9页
针对当下层级文本分类模型尚未充分利用层级实例的标签信息以及缺乏对类别分布不平衡的处理这两方面问题,本文提出一种面向标签共现和长尾分布的层级文本分类方法(hierarchical text classification for label cooccurrence and long-ta... 针对当下层级文本分类模型尚未充分利用层级实例的标签信息以及缺乏对类别分布不平衡的处理这两方面问题,本文提出一种面向标签共现和长尾分布的层级文本分类方法(hierarchical text classification for label cooccurrence and long-tail distribution,LC-LTD),对基于共享标签的文本全局语义和面向长尾分布的平衡损失函数进行研究.首先,设计一种基于共享标签的对比学习目标,使具有更多共享标签的文本表示在特征空间中的语义距离更近,引导模型生成具有判别性的语义表征;其次,引入分布平衡损失函数替换二进制交叉熵损失,缓解层级分类固有的长尾分布问题,提高模型的泛化能力.在WOS、BGC两个公开数据集上将LC-LTD与当前多个主流模型进行比较,结果表明所提方法具有更好的分类性能,更适合处理层级文本分类任务. 展开更多
关键词 层级文本分类 标签共现 长尾分布 对比学习 平衡损失
在线阅读 下载PDF
上一页 1 2 15 下一页 到第
使用帮助 返回顶部