面向不完整数据的个性化多标签分类

Personalized Multi-label Classification for Incomplete Data

下载PDF

导出

摘要近年来,随着机器学习、深度学习等技术的发展,多标签分类技术已趋于成熟。然而,现有多标签分类方法往往假设数据是易获取的完整数据,在真实场景中,该假设往往存在局限性,很多数据的获取往往需要一定的代价。为此,面向真实场景中的不完整数据,针对数据需有偿获取的特性,提出基于深度强化学习的个性化多标签分类框架(Reinforcement Learning based Personalized Multi-label Classification,RLPMC),包含特征编码器、特征选择器和多标签分类器三部分。首先,针对不完整数据存在缺失值的问题,设计基于集合编码的特征编码器将不定长的数据编码成定长的向量,输入到多标签分类器和特征选择器中;其次,设计基于深度强化学习的特征选择器学习个性化特征获取策略,平衡特征获取成本和分类准确性;然后,基于选择的特征,采用多标签分类方法实现准确的分类。最后,在合成和公开数据集上进行多组实验验证了方法的有效性。 In recent years,with the development of technologies such as machine learning and deep learning,multi-label classification techniques have become mature.However,existing multi-label classification methods often assume that data is readily available and complete.In real-world scenarios,this assumption is frequently limited,as acquir-ing many datasets can be costly.To address this,a deep reinforcement learning based personalized multi-label classification framework(RLPMC)is proposed for in-complete data in real scenarios,considering the cost-based nature of data acquisition.This framework includes a feature encoder,feature selector,and multi-label classifier.First,to address the issue of missing values in incomplete data,the feature encoder based on set embedding converts variable-length data into fixed-length vectors,which are inputted into the multi-label classifier and feature selector.Next,a feature selector based on deep reinforcement learning is designed to learn personalized feature acquisition strategies,balancing the cost of feature acquisition and classification accuracy.Then,based on the selected features,accurate classification is achieved using multi-label classification methods.Finally,multiple experiments on synthetic and public datasets validate the effectiveness of the approach.

作者朱孟笑段昊辰岳昆周锋朱孟杰 ZHU Mengxiao;DUAN Haochen;YUE Kun;ZHOU Feng;ZHU Mengjie(School of Information Science and Engineering,North China University of Technology,Beijing 100144;School of Information Science and Engineering,Yunnan University,Kunming 650500;College of Medical Information Engineering,Jining Medical University,Jining 272067)

机构地区北方工业大学信息学院云南大学信息学院济宁医学院医学信息工程学院

出处《计算机与数字工程》 2025年第8期2057-2062,2088,共7页 Computer & Digital Engineering

基金云南省智能系统与计算重点实验室项目(编号:202405AV340009) 北方工业大学毓秀创新项目(编号:2024NCUTYXCX202) 北方工业大学科研启动基金项目资助。

关键词多标签分类不完整数据特征获取策略深度强化学习特征编码 multi-label classification incomplete data feature acquisition strategies deep reinforcement learning feature encoding

分类号 P413 [天文地球—大气科学及气象学]

引文网络
相关文献

参考文献1

1李冬梅,杨宇,孟湘皓,张小平,宋潮,赵玉凤.多标签分类综述[J].计算机科学与探索,2023,17(11):2529-2542. 被引量：16

二级参考文献4

1于玉海,林鸿飞,孟佳娜,郭海,赵哲焕.跨模态多标签生物医学图像分类建模识别[J].中国图象图形学报,2018,23(6):917-927. 被引量：14
2武红鑫,韩萌,陈志强,张喜龙,李慕航.监督和半监督学习下的多标签分类综述[J].计算机科学,2022,49(8):12-25. 被引量：26
3井佩光,李亚鑫,苏育挺.一种多模态特征编码的短视频多标签分类方法[J].西安电子科技大学学报,2022,49(4):109-117. 被引量：9
4吴欣,徐红,林卓胜,李胜可,刘慧琳,冯跃.深度学习在舌象分类中的研究综述[J].计算机科学与探索,2023,17(2):303-323. 被引量：22

共引文献15

1洪巍,虞珂,林强,吴林海.食品安全网络舆情信息传播风险影响因素研究[J].情报杂志,2024,43(6):167-176. 被引量：17
2陈昊飏.基于RoBERTa和集中注意力机制的营商政策多标签分类[J].计算机应用,2024,44(S01):44-48.
3赵锴,叶丹.基于机器学习的矿床描述文本多标签分类[J].中国矿业,2024,33(10):153-161. 被引量：1
4高光亮,梁广俊,洪磊,高谷刚,王群.融合实例和标记相关性增强消歧的偏多标记学习算法[J].信息网络安全,2024(11):1763-1772. 被引量：1
5高曼,童元元,刘扬,孙美玲,张雨琪,赵芳华,李彦文,李海燕.基于临床疗效评价的中医药论文多标签分类研究[J].中国数字医学,2025,20(2):14-20. 被引量：1
6陈靖耀,李敬华,于彤.基于图神经网络增强句嵌入的中医文献多标签分类方法研究[J].世界科学技术-中医药现代化,2025,27(2):420-430. 被引量：3
7李倩,赵彦云,燕雪倩.新能源产业政策文本分类及实施效果差异性研究[J].干旱区资源与环境,2025,39(3):1-9. 被引量：1
8王娜,韩禄谭,孙倬.非遗短视频用户需求满足对分享行为的影响研究——以《神女劈观》二创视频为例[J].图书情报工作,2025,69(10):97-109. 被引量：1
9吴灿博,韩刚涛.基于时频注意力和软阈值化CNN的无人机声学检测与识别[J].压电与声光,2025,47(3):597-608.
10戢晓峰,邓若凡,乔新,关昊天.建成环境对共享单车时间集聚模式的非线性影响[J].吉林大学学报(工学版),2025,55(7):2233-2242.

1朱陶.OBE理念下数智赋能大学英语深度学习教学改革策略研究[J].现代英语,2025(12):29-31.
2李冰.多媒体技术在高中物理教学中的应用研究[J].中华活页文选(高中版),2025(17):0160-0162.
3衣岩.基于人工智能的中职信息技术个性化学习系统研究[J].信息与电脑,2025,37(21):209-211.
4张双红,胡清华,康春枝,何小小,段亚群,罗丽娟.hcmv-miR-UL112-3p对TLR4基因调控的生物信息学分析[J].中国实验诊断学,2025,29(3):329-335.
5刘嘉伟,吕朋博,林志斌.面向深度学习的个性化HRTF数据库的构建与分析[J].南京大学学报(自然科学版),2025,61(5):752-762.
6张昊.微探Web数据挖掘技术在电子商务领域中的有效应用[J].IT经理世界,2025,28(8):44-46.
7丁鑫,凡宇生,蔡春.企业数据资产分类管理探究[J].会计之友,2025(24):68-73.
8胡以华,夏宇浩,徐世龙,张鑫源,丁婉莹,马圣杰,汪菲,董骁,方佳节,韩飞.高光谱激光雷达遥感技术研究现状与发展趋势(特邀)[J].光学学报,2025,45(18):52-69.
9王影,王钢,高雲鹏,霍闯.基于深度学习的加密流量分类研究综述[J].计算机工程与应用,2025,61(21):61-80. 被引量：1
10张俊妍,周一帆,陈政婕,孙艺铭,黄鑫,尹冠球,李福夺.基于选择实验法的消费者对不同地膜回收利用标识玉米偏好及支付意愿研究[J].农业资源与环境学报,2025,42(6):1573-1580.

计算机与数字工程

2025年第8期

浏览历史

内容加载中请稍等...

面向不完整数据的个性化多标签分类

参考文献1

二级参考文献4

共引文献15

相关作者

相关机构

相关主题

浏览历史