期刊文献+
共找到289篇文章
< 1 2 15 >
每页显示 20 50 100
基于知识增强与标签语义的多标签漏洞文本分类
1
作者 边晓云 赵刚 《科学技术与工程》 北大核心 2026年第1期262-269,共8页
针对漏洞文本分类任务中的多类型分类问题和文本语义与标签语义利用不充分的问题,提出一种基于知识增强与标签语义(knowledge enhancement and labeling semantics, KELS)的多标签漏洞文本分类方法。首先,面向多种漏洞类型,引入漏洞属... 针对漏洞文本分类任务中的多类型分类问题和文本语义与标签语义利用不充分的问题,提出一种基于知识增强与标签语义(knowledge enhancement and labeling semantics, KELS)的多标签漏洞文本分类方法。首先,面向多种漏洞类型,引入漏洞属性知识,提出异构信息有效整合的策略,提升漏洞文本表示对多标签关系的表达能力,通过Transformer编码器的深度融合,进一步实现知识对文本语义的增强。其次,引入标签嵌入,提出一种融合知识增强文本表示与标签嵌入的标签注意力机制,用以捕捉文本与标签的语义关联,进行漏洞分类。实验结果表明,对比基线模型,KELS模型在Micro-P、Micro-F1、Macro-P、Macro-F1分别提高了0.98%、0.32%、2.31%、0.75%,有效提升了多标签漏洞分类的准确性。 展开更多
关键词 漏洞分类 知识增强 标签语义 多标签文本分类 特征融合
在线阅读 下载PDF
基于多特征融合和混合神经网络的医疗健康问题分类
2
作者 刘畅 梁冰雪 +1 位作者 田荣坤 秦玉华 《计算机工程》 北大核心 2026年第2期342-355,共14页
在医疗健康领域中,现有的问题分类方法存在文本特征表示能力弱的问题,并且对于多类别问题,忽视了不同关键词特征的权重,从而影响了分类的准确性。为了解决这些问题,提出一种基于多特征融合与混合神经网络的医疗健康问题分类方法(MPC-MFF... 在医疗健康领域中,现有的问题分类方法存在文本特征表示能力弱的问题,并且对于多类别问题,忽视了不同关键词特征的权重,从而影响了分类的准确性。为了解决这些问题,提出一种基于多特征融合与混合神经网络的医疗健康问题分类方法(MPC-MFF-HNN),旨在提高医疗健康问题分类的准确性。首先,该方法结合RoBERTa-wwm-ex模型和Word2Vec模型对文本信息进行字符级和单词级的向量表示,以获得丰富的多特征信息,从而弥补单一特征表示方法的不足,使得模型在处理复杂的医疗健康文本时能够更全面地理解和表征文本语义;其次,通过多头注意力机制结合改进的文本卷积神经网络(TextCNN)和双向门控循环单元(BiGRU),设计了一种混合神经网络模型MHA-APTC-BiGRU,其采用多层次特征提取方法,能够有效提取包含关键词权重的深层次文本特征;最后,分类器将语义增强的特征向量作为输入,用于问题类别的分类。在真实公开数据集上的实验结果表明,与其他基线算法相比,该方法在精确率、召回率和F1值指标上均显著提升,在医疗健康问题分类方面表现出更优越的性能。 展开更多
关键词 多特征融合 混合神经网络 多标签文本分类 注意力机制 医疗健康
在线阅读 下载PDF
基于标签感知融合与多尺度双向注意力交互的多标签文本分类模型
3
作者 郑启扬 《湖北大学学报(自然科学版)》 2026年第1期69-78,共10页
在多标签文本分类任务中,现有方法主要针对文本信息的提取,普遍存在对标签语义利用不足的问题。对此,提出一种基于标签感知融合与多尺度双向注意力机制的多标签分类模型。基于BERT模型,设计一种标签感知融合机制,将文本与标签嵌入统一序... 在多标签文本分类任务中,现有方法主要针对文本信息的提取,普遍存在对标签语义利用不足的问题。对此,提出一种基于标签感知融合与多尺度双向注意力机制的多标签分类模型。基于BERT模型,设计一种标签感知融合机制,将文本与标签嵌入统一序列,通过跨度预测捕捉局部关联性;引入词过滤器模块,依据词-标签余弦相似度筛选关键词汇,抑制噪声干扰;构建多尺度双向注意力网络,通过不同卷积核捕捉词级、短语级与句子级语义,并利用标签-文本与文本-标签双向注意力机制挖掘深层交互特征,实现动态语义适配。在公开数据集AAPD、ArXiv-ACM与Reuters-21578上的实验表明,本模型在maF1、miF1和HL指标上与基线方法相比均得到了最佳表现。 展开更多
关键词 多标签文本分类 标签感知融合机制 词过滤器 多尺度双向注意力网络
在线阅读 下载PDF
基于大模型标签蒸馏的搜索意图识别
4
作者 李睿琪 秦志鹏 《现代信息科技》 2026年第3期40-44,共5页
在搜索引擎中,准确识别用户查询的意图对提升搜索体验至关重要。搜索意图识别属于短文本分类任务,传统方法依赖大量人工标注数据,成本高昂且难以适应新意图的快速涌现。文章提出的基于大模型标签蒸馏的搜索意图识别方法,利用大语言模型(... 在搜索引擎中,准确识别用户查询的意图对提升搜索体验至关重要。搜索意图识别属于短文本分类任务,传统方法依赖大量人工标注数据,成本高昂且难以适应新意图的快速涌现。文章提出的基于大模型标签蒸馏的搜索意图识别方法,利用大语言模型(如GPT4o、DeepSeek-R1、星火x1)的强大语义理解能力,为无标签查询指令生成高质量意图标签,构建训练数据集;进而通过知识蒸馏技术,将大模型的知识迁移至轻量级预训练模型(如ERNIE 3.0、BERT)进行微调。实验结果表明,该方法在13.6万规模的中文数据集上显著提升了模型性能,在降低标注成本的同时,有效提升了意图识别效率。 展开更多
关键词 意图识别 文本分类 标签蒸馏 大模型 预训练模型
在线阅读 下载PDF
融合数据增强和多通道解码的中文多标签文本分类方法
5
作者 黄荣达 彭若馨 杨英勃 《网络新媒体技术》 2026年第1期57-65,共9页
中文多标签文本分类是自然语言处理领域的重要任务之一,广泛应用于情感分析、舆情监测、文本标注等多个领域。然而,中文文本的复杂性以及多标签数据集的特殊性(如数据量少、标签不平衡、复合标签等)给分类任务带来诸多挑战。本文提出一... 中文多标签文本分类是自然语言处理领域的重要任务之一,广泛应用于情感分析、舆情监测、文本标注等多个领域。然而,中文文本的复杂性以及多标签数据集的特殊性(如数据量少、标签不平衡、复合标签等)给分类任务带来诸多挑战。本文提出一种基于数据增强和多通道解码的中文多标签文本分类模型,通过大模型增强平衡不同类型的标签数据,同时利用多通道解码改善单通道解码不能充分区分不同维度语义差别的问题。实验结果表明,所提出的方法在多个数据集上平均F1值从69提升至79,为中文多标签文本分类任务提供新的解决方案。 展开更多
关键词 中文数据集 多标签文本分类 数据增强 多通道解码
在线阅读 下载PDF
基于标签构建与特征融合的多标签文本分类研究方法 被引量:4
6
作者 王旭阳 卢世红 《贵州师范大学学报(自然科学版)》 北大核心 2025年第1期105-114,共10页
目前存在的多标签文本分类任务算法,对于标签的建模不是很成熟,其中对于标签的依赖性问题,以及标签特征和文本特征的融合程度问题,均缺乏有效的处理方法。为了更有效地利用标签间的依赖关系,以及整合标签特征与文本特征的融合,提出了一... 目前存在的多标签文本分类任务算法,对于标签的建模不是很成熟,其中对于标签的依赖性问题,以及标签特征和文本特征的融合程度问题,均缺乏有效的处理方法。为了更有效地利用标签间的依赖关系,以及整合标签特征与文本特征的融合,提出了一种名为CGTCN的多标签文本分类模型。该模型从标签构建和特征融合的角度出发,通过CompGCN建模标签依赖关系,先利用Transformer中的多头交叉注意力机制初步融合标签特征和文本特征,然后再通过CorNet网络进一步捕获标签特征与文本特征之间的相关性,从而得到最终的标签预测。实验结果显示,与基准模型相比,该方法能够有效的提升模型性能,在多标签文本分类任务中取得更好的分类效果。 展开更多
关键词 多标签文本分类 CompGCN TRANSFORMER CorNet 标签相关性
在线阅读 下载PDF
基于社交媒体短文本的城市内涝灾情信息识别与分析 被引量:1
7
作者 王鑫 罗年学 赵前胜 《测绘与空间地理信息》 2025年第4期41-44,47,共5页
社交媒体在灾害发生时能够快速提供实时且丰富的灾情信息,为应急救援提供辅助参考。然而,社交媒体信息通常以短文本形式呈现,具有口语化、语义特征稀疏和标注语料匮乏等特征,给灾情信息的识别与分析带来挑战。为此,本文提出了一种结合... 社交媒体在灾害发生时能够快速提供实时且丰富的灾情信息,为应急救援提供辅助参考。然而,社交媒体信息通常以短文本形式呈现,具有口语化、语义特征稀疏和标注语料匮乏等特征,给灾情信息的识别与分析带来挑战。为此,本文提出了一种结合灾害领域知识的预训练语言模型增强方法,用于识别和分类灾情信息。首先,构建灾情知识库,包含不同灾损事件的触发词及论元;其他,通过分析短文本与灾损事件触发词的语义相似度,生成灾损知识编码;最后,将灾情领域知识与预训练词向量融合增强特征向量并输入神经网络模型实现多标签分类。以2021年7月20日前后河南暴雨灾情数据为例,将本文方法与TextCNN、Attention based CNN模型进行了对比实验,结果表明,该方法不仅有效提升了小样本数据的分类精度,还有效缓解了语义高度重合的数据类型容易错分的问题。同时,对分类结果进行灾损事件论元匹配能够充分挖掘涉灾短文本中的有效灾情信息,辅助应急救援决策。 展开更多
关键词 社交媒体 短文本 多标签分类 积水点 物资需求
在线阅读 下载PDF
基于链接策略和不同粒度特征融合的极限多标签文本分类模型
8
作者 胡婕 郑启扬 +1 位作者 曹芝兰 刘梦赤 《中文信息学报》 北大核心 2025年第3期84-95,共12页
现有基于Transformer的极限多标签文本分类模型尽管引入了标签语义,但利用标签语义来探索文本和标签之间的语义潜在关系仍存在不足。对此,该文将标签合并成序列,并使用链接策略在同一空间内联合学习文本和标签特征来捕获文本和标签的语... 现有基于Transformer的极限多标签文本分类模型尽管引入了标签语义,但利用标签语义来探索文本和标签之间的语义潜在关系仍存在不足。对此,该文将标签合并成序列,并使用链接策略在同一空间内联合学习文本和标签特征来捕获文本和标签的语义。然后,通过注意力机制将标签语义和文档内容相结合生成感知文本,有效地探索文本信息和标签语义的交互关系。此外,该文通过融合机制将粗粒度层次特征和细粒度特征相结合,帮助模型更好地学习不同层次粒度的文档语义信息。在三个公开的数据集Eurlex-4K、Wiki10-30K和Kan-Shan Cup上进行了模型验证,实验结果表明,该文所提模型P@k值优于对比模型,综合性能得到有效提升。 展开更多
关键词 极限多标签文本分类 链接策略 感知文本 细粒度特征
在线阅读 下载PDF
融合外部语义知识的多标签分类方法
9
作者 杨进才 班启旭 +1 位作者 杨旭生 沈显君 《计算机应用》 北大核心 2025年第12期3757-3763,共7页
文本分类作为自然语言处理(NLP)领域的重要任务,它的多标签分类因标签空间大而成为难点。针对该问题,以儿童读物中的价值观标识为实例,提出一种融合外部语义知识的多标签分类方法HSGIN(Heterogeneous Semantic Gated Interaction Netwo... 文本分类作为自然语言处理(NLP)领域的重要任务,它的多标签分类因标签空间大而成为难点。针对该问题,以儿童读物中的价值观标识为实例,提出一种融合外部语义知识的多标签分类方法HSGIN(Heterogeneous Semantic Gated Interaction Network)。首先,利用SBERT(Sentence embeddings from Siamese BERT(Bidirectional Encoder Representations from Transformers))和双向长短期记忆(Bi-LSTM)网络提取文本特征;其次,通过异质图转换架构(HGT)联合建模知识图谱(KG)中的实体和关系,并利用先验知识和语义关联提取标签特征;最后,将文本特征和标签特征进行注意力融合以得到不同的标签特征表示,且引入门控图神经网络(GGNN)捕捉标签间的语义依赖和交互模式并进行预测。实验结果表明,相较于目前性能先进的对比方法BERT,所提方法的精确率、召回率和F1分数分别提升了2.66、0.47和1.16个百分点。以上实验结果验证了所提方法的有效性,同时,对儿童读物中价值观标识的精准分析有助于为儿童选择健康的读物。 展开更多
关键词 多标签文本分类 知识图谱 异质图转换架构 门控图神经网络 标签相关性
在线阅读 下载PDF
融合特征增强和对比学习的电力客服工单多标签文本分类方法
10
作者 周景 唐振洋 +1 位作者 董晖 刘心 《计算机应用》 北大核心 2025年第12期3847-3854,共8页
电力客服工单多标签文本分类(MLTC)在提升服务效率与用户满意度方面具有重要意义。针对电力客服工单MLTC中的标签关系建模不足与类别不平衡问题,提出一种融合特征增强和对比学习的电力客服工单MLTC方法。首先,通过预训练语言模型提取客... 电力客服工单多标签文本分类(MLTC)在提升服务效率与用户满意度方面具有重要意义。针对电力客服工单MLTC中的标签关系建模不足与类别不平衡问题,提出一种融合特征增强和对比学习的电力客服工单MLTC方法。首先,通过预训练语言模型提取客服工单文本特征;其次,结合多头注意力机制的全局编码与卷积神经网络(CNN)的局部编码模块,设计一种文本特征增强方法,以有效捕捉电力工单文本中的重要信息并提升特征表达能力;最后,引入对比学习改进的K最近邻(KNN)算法的MLTC框架,采用R-Drop(Regularized Dropout)方法生成正样本,而对负样本重新加权,并在训练中结合监督对比学习损失函数提高KNN机制推理期间检索到的邻居的质量,从而有效地缓解样本不平衡带来的负面影响。实验结果表明,所提方法在电力客服工单数据集上的微平均F1值为92.17%,较BERT(Bidirectional Encoder Representations from Transformers)模型提高了1.62个百分点;同时,所提方法在MLTC公共数据集AAPD和RCV1-V2上分别取得了75.2%和88.5%的微平均F1值,不仅在提升工单处理准确性和服务效率方面展现出较高的应用价值,而且在复杂MLTC任务中具备有效性。 展开更多
关键词 多标签文本分类 电力客服工单 对比学习 特征增强 预训练语言模型
在线阅读 下载PDF
中文电子病历标注系统构建与应用 被引量:1
11
作者 赵琬清 胡佳慧 +2 位作者 陈凌云 娄培 方安 《医学信息学杂志》 2025年第6期74-80,共7页
目的/意义构建中文电子病历标注系统,实现电子病历文本的自动化标注。方法/过程分析系统需求,阐述系统架构,从数据层、服务层与功能层3方面对中文电子病历标注系统进行介绍,包括用户权限管理、实体和关系标注流程以及标注算法等。结果/... 目的/意义构建中文电子病历标注系统,实现电子病历文本的自动化标注。方法/过程分析系统需求,阐述系统架构,从数据层、服务层与功能层3方面对中文电子病历标注系统进行介绍,包括用户权限管理、实体和关系标注流程以及标注算法等。结果/结论中文电子病历标注系统能有效满足电子病历标注任务的需求,目前已成功应用于垂体瘤电子病历语料构建工作。 展开更多
关键词 中文电子病历 文本标注 医学标注系统 实体识别
暂未订购
结合标签混淆的中文文本分类数据增强技术 被引量:1
12
作者 孙海涛 林佳瑜 +1 位作者 梁祖红 郭洁 《计算机应用》 北大核心 2025年第4期1113-1119,共7页
传统数据增强技术,如同义词替换、随机插入和随机删除等,可能改变文本的原始语义,甚至导致关键信息丢失。此外,在文本分类任务中,数据通常包含文本部分和标签部分,然而传统数据增强方法仅针对文本部分。为解决这些问题,提出一种结合标... 传统数据增强技术,如同义词替换、随机插入和随机删除等,可能改变文本的原始语义,甚至导致关键信息丢失。此外,在文本分类任务中,数据通常包含文本部分和标签部分,然而传统数据增强方法仅针对文本部分。为解决这些问题,提出一种结合标签混淆的数据增强(LCDA)技术,从文本和标签这2个基本方面入手,为数据提供全面的强化。在文本方面,通过对文本进行标点符号随机插入和替换以及句末标点符号补齐等增强,在保留全部文本信息和顺序的同时增加文本的多样性;在标签方面,采用标签混淆方法生成模拟标签分布替代传统的one-hot标签分布,以更好地反映实例和标签与标签之间的关系。在THUCNews(TsingHua University Chinese News)和Toutiao这2个中文新闻数据集构建的小样本数据集上分别结合TextCNN、TextRNN、BERT(Bidirectional Encoder Representations from Transformers)和RoBERTa-CNN(Robustly optimized BERT approach Convolutional Neural Network)文本分类模型的实验结果表明,与增强前相比,性能均得到显著提升。其中,在由THUCNews数据集构造的50-THU数据集上,4种模型结合LCDA技术后的准确率相较于增强前分别提高了1.19、6.87、3.21和2.89个百分点;相较于softEDA(Easy Data Augmentation with soft labels)方法增强的模型分别提高了0.78、7.62、1.75和1.28个百分点。通过在文本和标签这2个维度的处理结果可知,LCDA技术能显著提升模型的准确率,在数据量较少的应用场景中表现尤为突出。 展开更多
关键词 数据增强 文本分类 标签混淆 中文新闻主题 预训练模型
在线阅读 下载PDF
基于多尺度特征提取的层次多标签文本分类方法 被引量:2
13
作者 武子轩 王烨 于洪 《郑州大学学报(理学版)》 CAS 北大核心 2025年第2期24-30,共7页
针对现有的特征提取方法忽略文本局部和全局联系的问题,提出了基于多尺度特征提取的层次多标签文本分类方法。首先,设计了多尺度特征提取模块,对不同尺度特征进行捕捉,更好地表示文本语义。其次,将层次特征嵌入文本表示中,得到具有标签... 针对现有的特征提取方法忽略文本局部和全局联系的问题,提出了基于多尺度特征提取的层次多标签文本分类方法。首先,设计了多尺度特征提取模块,对不同尺度特征进行捕捉,更好地表示文本语义。其次,将层次特征嵌入文本表示中,得到具有标签特征的文本语义表示。最后,在标签层次结构的指导下对输入文本构建正负样本,进行对比学习,提高分类效果。在WOS、RCV1-V2、NYT和AAPD数据集上进行对比实验,结果表明,所提模型在评价指标上表现出色,超过了其他主流模型。此外,针对层次分类提出层次Micro-F 1和层次Macro-F 1指标,并对模型效果进行了评价。 展开更多
关键词 层次多标签文本分类 多尺度特征提取 对比学习 层次Micro-F 1 层次Macro-F 1
在线阅读 下载PDF
基于特征融合动态图网络的多标签文本分类算法 被引量:1
14
作者 黄靖 陶竹林 +1 位作者 杜晓宇 项欣光 《软件学报》 北大核心 2025年第7期3239-3252,共14页
多标签文本分类旨在为文本分配若干预定义的标签或类别.为了充分发掘标签间的关联,目前的方法通常使用标签关系图并结合图神经网络获取标签特征表示.然而,这类方法过度依赖初始建图策略,忽视了当前文本中固有的标签相关性,使得分类结果... 多标签文本分类旨在为文本分配若干预定义的标签或类别.为了充分发掘标签间的关联,目前的方法通常使用标签关系图并结合图神经网络获取标签特征表示.然而,这类方法过度依赖初始建图策略,忽视了当前文本中固有的标签相关性,使得分类结果更依赖于数据集统计信息,而容易忽视当前文本段中的标签相关信息.因此,提出一种基于特征融合动态图网络的多标签文本分类算法,设计动态图来建模当前文本中的标签相关性,并结合特征融合与图神经网络,形成基于当前文本的标签表示,并由此形成更为准确的多标签文本结果.随后,设计实验进行验证,在3个数据集实验结果表明,所提出的模型在多标签分类任务中取得优秀的性能,验证其有效性和可行性. 展开更多
关键词 多标签文本分类 图卷积网络 注意力机制 动态图
在线阅读 下载PDF
基于多层语言特征的辞格多标签分类方法研究
15
作者 黄欢 李宝安 +2 位作者 张凯 滕尚志 吕学强 《中文信息学报》 北大核心 2025年第8期31-41,共11页
多标签辞格自动分类研究深受中文篇章智能评测的密切关注。传统辞格自动识别方法存在仅考虑句子语义忽略字词语义信息,以及仅使用单一类别的标签描述等问题。针对以上两个问题,该文提出了一种联合多层次语法、语义和标签信息的多标签辞... 多标签辞格自动分类研究深受中文篇章智能评测的密切关注。传统辞格自动识别方法存在仅考虑句子语义忽略字词语义信息,以及仅使用单一类别的标签描述等问题。针对以上两个问题,该文提出了一种联合多层次语法、语义和标签信息的多标签辞格分类模型,该模型利用BERT提取修辞文本的字粒度语义向量,通过句法依存树和图卷积神经网络提取词粒度语法、语义向量并进行交互融合。将字粒度向量表示、词粒度向量表示拼接,并通过自注意力机制捕获两者间的语义信息,利用注意力机制融合文本信息和标签信息实现分类。实验表明,该模型在公开数据集AAPD和构建的辞格数据集CRTD上与其他模型相比具有更好的辞格多标签分类性能,在F1评价指标上分别提升了3%和2%。 展开更多
关键词 多标签分类 辞格识别 句法依存分析 文本标签融合
在线阅读 下载PDF
基于对比学习增强双注意力机制的多标签文本分类方法
16
作者 余明峰 秦永彬 +2 位作者 黄瑞章 陈艳平 林川 《计算机应用》 北大核心 2025年第6期1732-1740,共9页
针对现有的基于注意力机制的方法难以捕捉文本之间复杂的依赖关系的问题,提出一种基于对比学习增强双注意力机制的多标签文本分类方法。首先,分别学习基于自注意力和基于标签注意力的文本表示,并融合二者以获得更全面的文本表示捕捉文... 针对现有的基于注意力机制的方法难以捕捉文本之间复杂的依赖关系的问题,提出一种基于对比学习增强双注意力机制的多标签文本分类方法。首先,分别学习基于自注意力和基于标签注意力的文本表示,并融合二者以获得更全面的文本表示捕捉文本的结构特征以及文本与标签之间的语义关联;其次,给定一个多标签对比学习目标,利用标签引导的文本相似度监督文本表示的学习,以捕捉文本之间在主题、内容和结构层面上复杂的依赖关系;最后,使用前馈神经网络作为分类器进行文本分类。实验结果表明,相较于LDGN(Label-specific Dual Graph neural Network),所提方法在EUR-Lex(European Union Law Document)数据集与Reuters-21578数据集上的排名第5处的归一化折现累积收益(nDCG@5)值分别提升了1.81和0.86个百分点,在AAPD(Arxiv Academic Paper Dataset)数据集与RCV1(Reuters Corpus VolumeⅠ)数据集上也都取得了有竞争力的结果。可见,所提方法能有效捕捉文本之间在主题、内容和结构层面上复杂的依赖关系,从而在多标签文本分类任务上取得较优结果。 展开更多
关键词 多标签文本分类 对比学习 双注意力 标签注意力 自注意力
在线阅读 下载PDF
南海疆维权文献证据知识元价值体系与多标签自动分类研究 被引量:1
17
作者 王燕红 杨海平 +2 位作者 程为 彭玉芳 朱梦蝶 《情报杂志》 北大核心 2025年第5期174-181,共8页
[研究目的]解决南海疆维权证据价值多重语义分类问题,实现证据知识元价值的多标签自动分类,填补南海疆维权文献中对证据知识价值揭示的不足,丰富面向南海问题研究和南海维权知识服务的南海疆维权证据自动分类研究。[研究方法]深入文献... [研究目的]解决南海疆维权证据价值多重语义分类问题,实现证据知识元价值的多标签自动分类,填补南海疆维权文献中对证据知识价值揭示的不足,丰富面向南海问题研究和南海维权知识服务的南海疆维权证据自动分类研究。[研究方法]深入文献内容到知识元层面对细粒度的证据知识从语用价值层面进行分类,深度揭示文献中证据知识的价值,构建南海疆维权文献证据知识元价值体系,并利用ALBERT实现证据知识元多标签自动分类。[研究结果/结论]实现南海疆维权文献证据知识元价值的多重语义分类,有助于南海疆维权文献知识发现场景中的语义检索与关联,服务于南海维权战略。 展开更多
关键词 南海疆维权文献 价值体系 证据知识元 多标签 文本分类
在线阅读 下载PDF
基于临床疗效评价的中医药论文多标签分类研究 被引量:1
18
作者 高曼 童元元 +5 位作者 刘扬 孙美玲 张雨琪 赵芳华 李彦文 李海燕 《中国数字医学》 2025年第2期14-20,共7页
目的:利用深度学习和多标签分类技术,对论文题录信息实施多学科分类,促进实现中医药领域文献自动分类。方法:选取《2022年度中医医院学科(专科)学术影响力评价研究报告》21万余条中文论文题录信息作为样本,采用BERT、CNN、BiLSTM、CNN-B... 目的:利用深度学习和多标签分类技术,对论文题录信息实施多学科分类,促进实现中医药领域文献自动分类。方法:选取《2022年度中医医院学科(专科)学术影响力评价研究报告》21万余条中文论文题录信息作为样本,采用BERT、CNN、BiLSTM、CNN-BiLSTM等深度学习方法,构建多标签分类模型进行实验,并对比不同模型和特征组合的实验效果。结果:中医药学术论文的多学科自动分类效果最好的模型为BiLSTM和CNN,最佳特征组合为题名+关键词+摘要,两个模型Macro-F1值分别达95.81%和95.06%。结论:当前深度学习模型多样,受到训练数据、任务特性等方面影响,不同模型在相同任务中表现效果会有所差异,因此实施文本分类时可采用多种不同类型的深度学习模型进行训练对比结果,从而筛选最佳模型与特征组合。 展开更多
关键词 中医药 临床疗效评价 多标签分类 文本分类 深度学习
暂未订购
融合标签关系与法条逻辑的案情要素识别方法
19
作者 杨翰林 黄瑞章 秦永彬 《计算机工程》 北大核心 2025年第12期119-129,共11页
案情要素识别旨在根据案情描述文本识别该案件涉及的重要情节及事实。现有工作针对任务案情要素之间存在标签关系的问题,采用融合标签信息的多标签文本分类方法和基于反绎学习(ABL)的方法予以解决,但前者存在监督信息不足导致模型学习... 案情要素识别旨在根据案情描述文本识别该案件涉及的重要情节及事实。现有工作针对任务案情要素之间存在标签关系的问题,采用融合标签信息的多标签文本分类方法和基于反绎学习(ABL)的方法予以解决,但前者存在监督信息不足导致模型学习不充分的问题,后者存在先验知识的局限性,并且标签关系为某些案情要素提供的监督信息,较为片面。为此,提出融合标签关系与法条逻辑的案情要素识别方法。该方法从数据样本和领域知识两个来源出发,分别挖掘和利用标签关系和法条逻辑两类外部知识,为识别过程提供约束和引导信息,使模型能更加准确地提取案情描述文本语义特征,从而提升识别结果性能。具体来说,该方法首先利用基于Transformer的双向编码器表示(BERT)作为编码器,提取案情描述文本表征得到上下文编码,再通过全连接(FC)层得到原始预测结果;然后设计标签关系增强网络(LRE-Net)学习和利用案情要素之间的标签关系,对原始预测结果进行修正和增强,以突破标签关系作为先验知识的局限性;最后引入一阶逻辑对法条逻辑进行形式化表达,并根据一种一阶逻辑表达到连续数值计算的映射关系,构建了法条逻辑约束下的损失函数,为模型提供额外的监督信息。实验结果表明,在标签关系与法条逻辑的共同约束与相互增益下,该方法在F1值上相较于基线模型提升了2.41百分点,相较于最优对比模型提升了1.21百分点。 展开更多
关键词 案情要素 多标签文本分类 反绎学习 一阶逻辑 法条逻辑
在线阅读 下载PDF
基于提示学习的突发事件新闻文本层次多标签分类方法研究 被引量:1
20
作者 汪波 余茂楠 +3 位作者 唐伟 张万宏 马代强 邓松 《重庆科技大学学报(自然科学版)》 2025年第3期78-85,共8页
突发事件分类是开展突发事件应急响应的重要前提,决定了应急响应的速度和效果。为了有效解决突发事件新闻文本类别不平衡所导致的分类准确性问题,提出了一种基于提示学习的突发事件新闻文本层次多标签分类方法。在ERNIE预训练模型的基... 突发事件分类是开展突发事件应急响应的重要前提,决定了应急响应的速度和效果。为了有效解决突发事件新闻文本类别不平衡所导致的分类准确性问题,提出了一种基于提示学习的突发事件新闻文本层次多标签分类方法。在ERNIE预训练模型的基础上构建提示模板,利用掩码语言模型训练预测标签,并通过标签映射匹配已有的分类标签,以有效缓解突发事件领域标注数据少且不平衡所带来的问题。实验结果表明,该模型的准确率、宏F1分数分别达到了0.9739、0.9337,其性能优于ChineseBERT和PET等基线模型。 展开更多
关键词 提示学习 突发事件 新闻文本分类 层次多标签
在线阅读 下载PDF
上一页 1 2 15 下一页 到第
使用帮助 返回顶部