期刊文献+
共找到34篇文章
< 1 2 >
每页显示 20 50 100
基于视觉触觉双重迁移学习的番茄成熟度检测方法 被引量:1
1
作者 张鹏 杜东峰 +2 位作者 李爽 单东日 陈振学 《农业机械学报》 北大核心 2025年第1期74-83,共10页
针对当前自动化采摘过程中仅依赖视觉技术无法准确识别番茄成熟度的问题,提出了一种基于视觉触觉双重迁移学习的番茄成熟度检测方法。该方法首先采用视觉触觉双重迁移学习融合算法作为特征提取融合模块,解决无法有效提取番茄特征信息的... 针对当前自动化采摘过程中仅依赖视觉技术无法准确识别番茄成熟度的问题,提出了一种基于视觉触觉双重迁移学习的番茄成熟度检测方法。该方法首先采用视觉触觉双重迁移学习融合算法作为特征提取融合模块,解决无法有效提取番茄特征信息的问题。其次,将软参数共享-多标签分类方法作为分类模块,通过增加不同分类任务之间的关联性,避免出现过拟合的现象。本文主要针对成熟后为红、黄果等单一颜色的番茄品种,并在新开发的视觉触觉数据集进行实验研究。实验表明,软参数共享-多标签检测模型参数量为1.882×10^(7),成熟度AUC分值达到0.9773,对比不确定性加权损失、自适应硬参数共享、十字绣网络和软参数共享等检测模型,参数量分别下降3.08×10^(6)、6.16×10^(6)、3.08×10^(6)和3.08×10^(6),成熟度AUC分值分别提高0.0175、0.0179、0.0267和0.0089。这表明该方法在一定程度上提高了自动化采摘过程中对番茄成熟度的检测能力,为番茄成熟度检测问题提供了一种有效的解决方法。 展开更多
关键词 番茄成熟度 机器视觉 机器触觉 双重迁移学习 软参数共享-多标签
在线阅读 下载PDF
融合K-means聚类和标记相关性的多标记Relief特征选择 被引量:1
2
作者 丰昌武 孙林 《聊城大学学报(自然科学版)》 2025年第1期122-134,共13页
现有Relief算法在利用标记相关性方面存在不足,忽视了局部标记相关性所提供的宝贵信息。针对这一问题,提出了一种融合K-means聚类与标记相关性的多标记Relief特征选择方法。首先,为充分考虑样本标记相关性,采用K-means聚类算法对样本进... 现有Relief算法在利用标记相关性方面存在不足,忽视了局部标记相关性所提供的宝贵信息。针对这一问题,提出了一种融合K-means聚类与标记相关性的多标记Relief特征选择方法。首先,为充分考虑样本标记相关性,采用K-means聚类算法对样本进行聚类,将其划分到不同的簇中,从而构建样本的局部标记空间。其次,定义了所有样本在特征上的欧式距离,以此衡量样本的全局标记相关性。同时,改进了传统的余弦相似度,使用L1范数的平方根进行优化,并在局部标记空间中应用改进的余弦相似度,以有效获取样本的局部标记相关性。最后,在Relief算法的基础上,融合了样本的全局标记相关性与局部标记相关性,以此作为衡量样本相似度的依据,进而判别最近邻同类样本与最近邻异类样本,最终获得特征权重。为评估所提算法的性能,在10个多标记数据集上进行了对比测试,实验结果证明,与其他多标记特征选择算法相比,本算法具有显著优势。 展开更多
关键词 多标记学习 特征选择 K-MEANS聚类 标记相关性 RELIEF算法
在线阅读 下载PDF
从随机集落影到随机点落影——隶属函数用于机器学习
3
作者 汪培庄 鲁晨光 《智能系统学报》 北大核心 2025年第2期305-315,共11页
从样本分布求得隶属函数是重要的也是困难的。汪培庄的随机集落影理论使用集值统计得到隶属函数,从而在统计和模糊逻辑之间架起桥梁。但是,通常的样本并不包含集值,所以该理论不够实用。鲁晨光使用语义信息方法推导出用样本分布优化隶... 从样本分布求得隶属函数是重要的也是困难的。汪培庄的随机集落影理论使用集值统计得到隶属函数,从而在统计和模糊逻辑之间架起桥梁。但是,通常的样本并不包含集值,所以该理论不够实用。鲁晨光使用语义信息方法推导出用样本分布优化隶属函数的2个公式,它们和集值统计结果一致,可谓随机点落影方法。该方法可以用于多标签分类、最大互信息分类、混合模型、贝叶斯确证等。深度学习最新潮流中用的相似函数和估计互信息就是隶属函数和语义互信息的特例。因为最大语义信息准则和最大似然准则以及正则化最小误差平方准则兼容,并且隶属函数比似然函数迁移性更好,比反概率函数更容易构造,隶属函数有希望被广泛用于机器学习。 展开更多
关键词 模糊集合 隶属函数 样本分布 语义信息测度 机器学习 多标签分类 最大互信息分类 混合模型 贝叶斯确证
在线阅读 下载PDF
The multilabel fault diagnosis model of bearing based on integrated convolutional neural network and gated recurrent unit
4
作者 Shanling Han Shoudong Zhang +1 位作者 Yong Li Long Chen 《International Journal of Intelligent Computing and Cybernetics》 EI 2022年第3期401-413,共13页
Purpose-Intelligent diagnosis of equipment faults can effectively avoid the shutdown caused by equipment faults and improve the safety of the equipment.At present,the diagnosis of various kinds of bearing fault inform... Purpose-Intelligent diagnosis of equipment faults can effectively avoid the shutdown caused by equipment faults and improve the safety of the equipment.At present,the diagnosis of various kinds of bearing fault information,such as the occurrence,location and degree of fault,can be carried out by machine learning and deep learning and realized through the multiclassification method.However,the multiclassification method is not perfect in distinguishing similar fault categories and visual representation of fault information.To improve the above shortcomings,an end-to-end fault multilabel classification model is proposed for bearing fault diagnosis.Design/methodology/approach-In this model,the labels of each bearing are binarized by using the binary relevance method.Then,the integrated convolutional neural network and gated recurrent unit(CNN-GRU)is employed to classify faults.Different from the general CNN networks,the CNN-GRU network adds multiple GRU layers after the convolutional layers and the pool layers.Findings-The Paderborn University bearing dataset is utilized to demonstrate the practicability of the model.The experimental results show that the average accuracy in test set is 99.7%,and the proposed network is better than multilayer perceptron and CNN in fault diagnosis of bearing,and the multilabel classification method is superior to the multiclassification method.Consequently,the model can intuitively classify faults with higher accuracy.Originality/value-The fault labels of each bearing are labeled according to the failure or not,the fault location,the damage mode and the damage degree,and then the binary value is obtained.The multilabel problem is transformed into a binary classification problem of each fault label by the binary relevance method,and the predicted probability value of each fault label is directly output in the output layer,which visually distinguishes different fault conditions. 展开更多
关键词 Intelligent fault diagnosis Bearing fault multilabel classification CNN-GRU Binary relevance method
在线阅读 下载PDF
基于软类感知的稳健多标记β-精度模糊粗糙特征选择方法
5
作者 姜云 候飞飞 户庆凯 《长江信息通信》 2025年第9期1-3,共3页
随着多标记学习在图像、文本与医学等领域的广泛应用,如何从高维特征中有效筛选出具有判别力的关键特征,成为提升学习性能的核心问题。现有方法在处理标记重叠、样本结构模糊与噪声扰动等复杂情形时仍存在鲁棒性不足的问题。为此,文章... 随着多标记学习在图像、文本与医学等领域的广泛应用,如何从高维特征中有效筛选出具有判别力的关键特征,成为提升学习性能的核心问题。现有方法在处理标记重叠、样本结构模糊与噪声扰动等复杂情形时仍存在鲁棒性不足的问题。为此,文章提出一种基于软类感知的多标记β-精度模糊粗糙特征选择方法(SCMLFS)。该方法通过标记相似度驱动构建伪类样本关系,结合β截断机制实现对模糊邻域的稳健建模,在此基础上定义多标记模糊依赖度并构建启发式多标记特征选择算法。实验结果表明,该方法在多个数据集上取得优异表现,兼具特征压缩性、分类准确性与抗噪鲁棒性。 展开更多
关键词 多标记学习 特征选择 粒计算 模糊粗糙集
在线阅读 下载PDF
不稳定型心绞痛患者不良结局的多标签预测模型构建 被引量:2
6
作者 王紫芸 张瑜 +2 位作者 韩港飞 闫晶晶 田晶 《中国循证心血管医学杂志》 2024年第6期651-656,共6页
目的不稳定型心绞痛患者不良结局具有多维性的特点,传统统计方法多对不稳定型心绞痛的单维结局进行预测,无法解决多标签数据特征冗余、标签不平衡等问题。本文尝试采用多标签合成少数类过采样技术(MLSMOTE)算法进行处理,并构建多标签预... 目的不稳定型心绞痛患者不良结局具有多维性的特点,传统统计方法多对不稳定型心绞痛的单维结局进行预测,无法解决多标签数据特征冗余、标签不平衡等问题。本文尝试采用多标签合成少数类过采样技术(MLSMOTE)算法进行处理,并构建多标签预测模型,以提高其预测性能。方法收集来自2017年1月~2020年5月于山西医科大学第二医院收治的不稳定型心绞痛患者纳入本研究。采用回顾性和前瞻性相结合的临床队列收集患者信息。以不稳定型心绞痛患者发生心肌梗死、心力衰竭、血运重建、脑卒中、死亡为结局,使用改进Relief F的多标记特征选择(RF-ML)算法选择多标签特征子集,MLSMOTE算法进行多标签不平衡处理,在此基础上构建分类器链(CC)的多标签分类模型,选取随机森林、朴素贝叶斯、支持向量机、K近邻(K-nearest neighbors,KNN)算法等为基分类器进行比较,并评价模型性能。结果采用多标签特征选择方法RF-ML进行变量筛选,最终筛选出18个变量纳入模型,分别为:尿酸、肌酐、血小板、氯、血红蛋白、收缩压、舒张压、心率、钠、血清总胆红素、血清间接胆红素、白蛋白、血清总胆汁酸、体质指数(BMI)、血糖、血清直接胆红素、低密度脂蛋白胆固醇、高密度脂蛋白胆固醇。采用多标签不平衡算法MLSMOTE对此次研究涉及的5个标签:心肌梗死、心力衰竭、血运重建、脑卒中、死亡进行不平衡处理。采用不平衡处理后的数据,选择随机森林、朴素贝叶斯、支持向量机、KNN作为基分类器,建立CC模型,结果显示以朴素贝叶斯为基分类器的CC模型在Ranking loss、Macro_AUC、Micro_AUC、Macro_F1、Micro_F1、Macro_recall六个指标上的表现性能均优于其他模型。结论本研究采用MLSMOTE算法进行不平衡处理,使原始标签的不平衡率得到一定改善。运用均衡化数据建立CC模型,充分考虑了标签的特定特征和标签相关性,以朴素贝叶斯为基分类器的CC模型表现最佳。 展开更多
关键词 不稳定型心绞痛 多标签特征选择 多标签不平衡 标签特定特征
暂未订购
基于中心偏移的Fisher score与直觉邻域模糊熵的多标记特征选择 被引量:1
7
作者 孙林 马天娇 《计算机科学》 CSCD 北大核心 2024年第7期96-107,共12页
现有多标记Fisher score模型中边缘样本会影响算法分类效果。鉴于邻域直觉模糊熵处理不确定信息时具有更强的表达能力与分辨能力的优势,文中提出了一种基于中心偏移的Fisher score与邻域直觉模糊熵的多标记特征选择方法。首先,根据标记... 现有多标记Fisher score模型中边缘样本会影响算法分类效果。鉴于邻域直觉模糊熵处理不确定信息时具有更强的表达能力与分辨能力的优势,文中提出了一种基于中心偏移的Fisher score与邻域直觉模糊熵的多标记特征选择方法。首先,根据标记将多标记论域划分为多个样本集,计算样本集的特征均值作为标记下样本的原始中心点,以最远样本的距离乘以距离系数,去除边缘样本集,定义了新的有效样本集,计算中心偏移处理后的标记下每个特征的得分以及标记集的特征得分,进而建立了基于中心偏移的多标记Fisher score模型,预处理多标记数据。然后,引入多标记分类间隔作为自适应模糊邻域半径参数,定义了模糊邻域相似关系和模糊邻域粒,由此构造了多标记模糊邻域粗糙集的上、下近似集;在此基础上提出了多标记邻域粗糙直觉隶属度函数和非隶属度函数,定义了多标记邻域直觉模糊熵。最后,给出了特征的外部和内部重要度的计算公式,设计了基于邻域直觉模糊熵的多标记特征选择算法,筛选出最优特征子集。在多标记K近邻分类器下、9个多标记数据集上的实验结果表明,所提算法选择的最优子集具有良好的分类性能。 展开更多
关键词 多标记学习 特征选择 Fisher score 多标记模糊邻域粗糙集 邻域直觉模糊熵
在线阅读 下载PDF
结合双流形映射的不完备多标签学习
8
作者 许智磊 黄睿 《计算机工程》 CAS CSCD 北大核心 2024年第4期104-112,共9页
在多标签学习中,有效利用标签相关性可以提高分类性能。然而,由于人工标注标签的主观性和实际应用中标签语义的相似性,通常只能观察到不完备的标签空间,导致标签相关性的估计不准确,使得算法性能下降。针对该问题,提出一种结合双流形映... 在多标签学习中,有效利用标签相关性可以提高分类性能。然而,由于人工标注标签的主观性和实际应用中标签语义的相似性,通常只能观察到不完备的标签空间,导致标签相关性的估计不准确,使得算法性能下降。针对该问题,提出一种结合双流形映射的不完备多标签学习(ML-DMM)算法。构造两种流形映射,一种是保留实例数据空间局部结构信息的特征流形映射,另一种是基于迭代学习得到的标签相关性的标签流形映射。首先通过拉普拉斯映射构造数据的低维流形,然后通过回归系数矩阵和标签相关性矩阵将初始特征空间和初始标签空间分别映射到该低维流形上,形成一种双流形映射结构来提升算法性能,最后利用迭代学习得到的回归系数矩阵进行多标签分类。在8个多标签数据集及3种标签缺失率情况下的对比实验结果表明,ML-DMM算法性能优于其他针对缺失标签的多标签分类算法。 展开更多
关键词 多标签学习 缺失标签 标签相关性 低维流形 双流形映射
在线阅读 下载PDF
软多标签和深度特征融合的无监督行人重识别 被引量:7
9
作者 张宝华 朱思雨 +6 位作者 吕晓琪 谷宇 王月明 刘新 任彦 李建军 张明 《光电工程》 CAS CSCD 北大核心 2020年第12期13-22,共10页
跨摄像头场景中依赖面向标签映射关系的学习以提高识别精度,有监督行人重识别模型虽然识别精度较好,但存在可扩展问题,诸如算法识别精度严重依赖有效的监督信息,算法实时性差等;针对上述问题,提出一种基于软多标签的无监督行人重识别算... 跨摄像头场景中依赖面向标签映射关系的学习以提高识别精度,有监督行人重识别模型虽然识别精度较好,但存在可扩展问题,诸如算法识别精度严重依赖有效的监督信息,算法实时性差等;针对上述问题,提出一种基于软多标签的无监督行人重识别算法。为了提高标签匹配精度,首先利用软多标签逼近真实标签,通过计算参考数据集和参考代理在软多标签函数中的损失函数,预训练参考数据集,并构建预训练与训练结果的映射模型。再通过生成数据和真实数据分布的最小距离的期望即简化的2-Wasserstein距离计算相机视图中软多标签均值和标准差得到损失函数,解决跨视域标签一致性问题。为了提高软多标签对未标记目标数据集的有效性,计算联合嵌入损失,挖掘不同类别间的相似对,纠正跨域分布错位。针对残差网络训练时长和无监督学习精度低的问题,通过结合压缩激励网络(SENet)和多层级深度特征融合改进残差网络的结构,提高训练速度和精度。实验结果表明,该方法在标准数据集下的首位命中率和平均精度均值优于先进相关算法。 展开更多
关键词 残差网络 行人重识别 软多标签 无监督 深度特征
在线阅读 下载PDF
基于农业网络信息分类的热词自动提取方法 被引量:10
10
作者 段青玲 张璐 +1 位作者 刘怡然 王沙沙 《农业机械学报》 EI CAS CSCD 北大核心 2018年第7期160-167,共8页
热词提取对于监控和分析农业舆情具有重要意义,目前已有一定研究基础,但仍存在针对性差等问题,无法满足农业领域不同产业用户群的个性化需求,为此,提出一种基于农业网络信息分类的热词自动提取方法。首先采用多标记分类算法对文本语料... 热词提取对于监控和分析农业舆情具有重要意义,目前已有一定研究基础,但仍存在针对性差等问题,无法满足农业领域不同产业用户群的个性化需求,为此,提出一种基于农业网络信息分类的热词自动提取方法。首先采用多标记分类算法对文本语料进行分类,按分类类别构建语料库,然后采用基于信息熵的方法对每个类别分别提取热词候选词,最后采用基于时间变化的方法进行候选词热度计算,根据候选词热度排序结果得到热词。本文抽取农业网站上的15 354条文本进行实验,结果表明,热词提取准确率达到0.9以上,能够较高质量地提取农业热词,为不同农业用户群体发现和分析产业热点提供帮助。 展开更多
关键词 农业网络信息 农业舆情监测 热词 多标记分类 热度计算
在线阅读 下载PDF
免疫分析法进展 被引量:12
11
作者 杨晓达 常文保 慈云祥 《化学进展》 SCIE CAS CSCD 1995年第2期83-97,共15页
本文首先从试剂分析的观,点对免疫分析的原理进行了论述,对抗体作为分析试剂进行了评价并且总结了标记免疫分析的三种方式和四个环节;其次,对免疫分析的现状作了综述,并评述了当代免疫分析的五个热点:基因工程抗体,生物素。亲合... 本文首先从试剂分析的观,点对免疫分析的原理进行了论述,对抗体作为分析试剂进行了评价并且总结了标记免疫分析的三种方式和四个环节;其次,对免疫分析的现状作了综述,并评述了当代免疫分析的五个热点:基因工程抗体,生物素。亲合素多重标记体系,时间分辨荧光免疫分析,多组分免疫分析和自动化免疫分析;最后,对免疫分析的发展趋势作了讨论。 展开更多
关键词 免疫分析 抗体 基因工程抗体 多重标记
在线阅读 下载PDF
一种改进的RAKEL多标签分类算法 被引量:2
12
作者 金永贤 张微微 周恩波 《浙江师范大学学报(自然科学版)》 CAS 2016年第4期386-391,共6页
RAKEL(random k-labelsets)算法是一种集成技术,能有效解决多标签分类问题.它将原始标签集随机选用一小部分标签子集构成的数据集来训练每个分类器,但由于RAKEL算法构造标签空间的随机性,并未充分考察到样本多个标签之间的相关性,从而... RAKEL(random k-labelsets)算法是一种集成技术,能有效解决多标签分类问题.它将原始标签集随机选用一小部分标签子集构成的数据集来训练每个分类器,但由于RAKEL算法构造标签空间的随机性,并未充分考察到样本多个标签之间的相关性,从而造成分类精度不高,泛化性能受到一定影响.为此,提出了改进的LC-RAKEL算法.首先,通过标签聚类将原始标签集划分成标签簇,再从每个标签簇中各选择一个标签构成标签集,以此发现标签空间中重要且不频繁的映射关系;然后,利用出现次数较少的标签集合组成新的训练数据,训练相应的分类器.实验证明,改进的算法性能优于其他常用多标签分类算法. 展开更多
关键词 多标签分类 RAKEL 标签空间 随机 不频繁的映射
在线阅读 下载PDF
基于改进ReliefF的多标记特征选择算法 被引量:11
13
作者 孙林 陈雨生 徐久成 《山东大学学报(理学版)》 CAS CSCD 北大核心 2022年第4期1-11,共11页
针对传统的ReliefF算法仅能处理单标记数据,以及其改进算法没有充分利用样本间相关性等问题,提出一种基于改进ReliefF的多标记特征选择算法。首先使用余弦相似度函数衡量样本特征间的相似程度,利用杰卡德距离度量样本的标记之间的标记... 针对传统的ReliefF算法仅能处理单标记数据,以及其改进算法没有充分利用样本间相关性等问题,提出一种基于改进ReliefF的多标记特征选择算法。首先使用余弦相似度函数衡量样本特征间的相似程度,利用杰卡德距离度量样本的标记之间的标记相关性,定义样本间相似度函数度量样本在整个样本空间的相似关系。然后,定义样本的同类或异类判别公式,判断随机样本的最近邻同类和异类样本。最后,提出新的特征权值迭代公式改进ReliefF算法,设计多标记特征选择算法。通过平均分类精度、覆盖率、1错误率、排序损失、汉明损失这5种评价指标,在7个公开多标记数据集上分析和测试所提算法的分类性能。实验结果表明所提算法是有效的。 展开更多
关键词 多标记 特征选择 标记相关性 RELIEFF
原文传递
融合样本相似性的弱监督多标签分类 被引量:2
14
作者 罗森林 王海州 +1 位作者 潘丽敏 孙晓光 《北京理工大学学报》 EI CAS CSCD 北大核心 2021年第7期745-751,共7页
针对面向实际应用场景中数据标签易残缺导致有监督多标签分类方法可用训练数据量减少,未能利用大量标签缺失数据中蕴含的样本特征空间关联知识以最大化判别间隔,限制多标签分类效果等问题,本文提出一种融合样本相似性的弱监督多标签分... 针对面向实际应用场景中数据标签易残缺导致有监督多标签分类方法可用训练数据量减少,未能利用大量标签缺失数据中蕴含的样本特征空间关联知识以最大化判别间隔,限制多标签分类效果等问题,本文提出一种融合样本相似性的弱监督多标签分类方法.该方法利用标签相关性和样本相似性恢复标签以提高数据利用率,并将标签恢复嵌入到训练过程中以便挖掘标签相关性,通过近端加速梯度法进行参数优化,建立弱监督学习场景的多标签分类模型.在真实数据集上的实验结果表明,该方法能够利用样本相似性有效提升模型在标签残缺时的分类能力,实用价值大. 展开更多
关键词 多标签分类 标签残缺 样本相似性
在线阅读 下载PDF
基于ReliefF和最大相关最小冗余的多标记特征选择 被引量:10
15
作者 孙林 徐枫 +1 位作者 李硕 王振 《河南师范大学学报(自然科学版)》 CAS 北大核心 2023年第6期21-29,F0002,共10页
针对现有的特征选择模型未涉及特征和标记集之间的相关度,造成分类精度偏低等情况,提出了基于ReliefF和最大相关最小冗余(maximum Relevance and Minimum Redundancy,mRMR)的多标记特征选择.首先,运用互信息计算每个标记和标记集之间的... 针对现有的特征选择模型未涉及特征和标记集之间的相关度,造成分类精度偏低等情况,提出了基于ReliefF和最大相关最小冗余(maximum Relevance and Minimum Redundancy,mRMR)的多标记特征选择.首先,运用互信息计算每个标记和标记集之间的相关度,使用每项相关度占其相关度之和的比例设计了标记权重,由此构建了特征和标记集间的相关度,初选与标记集相关度高的特征;其次,计算对象在特征上的距离,构建了新的特征权值更新公式,基于标记权重改进多标记ReliefF模型.然后,基于互信息和标记权重构建了最大相关性,设计了最小冗余性及其新的最大相关最小冗余评价准则,并将其应用于多标记特征选择,进一步剔除冗余特征;最后,设计了一种基于ReliefF和最大相关最小冗余的多标记特征选择算法,有效提高了多标记分类性能.在8个多标记数据集上测试所提算法的平均分类精度、覆盖率、汉明损失、1错误率和排序损失,实验结果证明了该算法的有效性. 展开更多
关键词 多标记学习 特征选择 标记权重 RELIEFF 最大相关最小冗余
在线阅读 下载PDF
基于标记相关性和ReliefF的多标记特征选择 被引量:6
16
作者 孙林 杜雯娟 +1 位作者 李硕 徐久成 《西北大学学报(自然科学版)》 CAS CSCD 北大核心 2022年第5期834-846,共13页
针对现有一些特征选择算法未充分考虑特征和标记之间的相关性,造成分类精度偏低,以及ReliefF算法中样本间分类间隔较大导致分类无意义的问题,提出了一种基于标记相关性和改进ReliefF的多标记特征选择方法。首先,根据正类样本在标记集合... 针对现有一些特征选择算法未充分考虑特征和标记之间的相关性,造成分类精度偏低,以及ReliefF算法中样本间分类间隔较大导致分类无意义的问题,提出了一种基于标记相关性和改进ReliefF的多标记特征选择方法。首先,根据正类样本在标记集合中的所占比例定义标记权重,结合互信息和标记权重,构建特征与标记集合之间的相关度计算公式,有效反映特征与标记集的相关性,进而提高算法的分类精度。然后,依据ReliefF模型中的距离计算公式,分别计算样本与最近邻异类样本、最近邻同类样本的距离,提出一种新的样本分类间隔,结合标记权重与分类间隔构建新的特征权值更新公式,有效解决了传统ReliefF算法中因样本间距离过大导致异类样本和同类样本失效的问题。最后,结合标记相关性和改进的ReliefF算法,设计了一种新的多标记特征选择算法。在7个多标记数据集上选择不同评价指标,对所提多标记特征选择算法进行仿真实验与分析,实验结果表明所提算法是有效的。 展开更多
关键词 多标记学习 特征选择 标记相关性 RELIEFF
在线阅读 下载PDF
基于互信息的Fisher Score多标记特征选择 被引量:4
17
作者 孙林 张起峰 徐久成 《南京大学学报(自然科学版)》 CAS CSCD 北大核心 2023年第1期55-66,共12页
目前,Fisher Score模型在处理多标记数据时没有考虑样本和整个特征空间之间以及特征和标记之间的关系.提出一种基于互信息的Fisher Score多标记特征选择方法.首先,在多标记决策系统中考虑整个样本空间对特征选择的影响,根据异类样本与... 目前,Fisher Score模型在处理多标记数据时没有考虑样本和整个特征空间之间以及特征和标记之间的关系.提出一种基于互信息的Fisher Score多标记特征选择方法.首先,在多标记决策系统中考虑整个样本空间对特征选择的影响,根据异类样本与同类样本之间的欧式距离定义权重公式,并在特征空间下对标记赋予权重衡量标记的重要程度.然后,基于互信息理论定义特征与每个标记之间的互信息来计算每个特征和每个标记之间的相关度,将特征与标记之间的相关度与该标记所占的权重相结合来定义特征和标记集之间的总相关度.将Fisher得分与总相关度结合,定义每个特征的新的Fisher得分,进而构建多标记Fisher Score模型.最后,设计了一种基于互信息的Fisher Score多标记特征选择算法.在六个多标记数据集上的实验证明,提出的算法与其他算法相比,其四种评价指标都表现良好,分类性能出色. 展开更多
关键词 多标记学习 特征选择 互信息 Fisher Score
在线阅读 下载PDF
基于EnVision多标记读板仪的细胞内钙信号检测技术的研究 被引量:1
18
作者 杨颖 殷爱红 +2 位作者 武文琦 赵春娟 赵君朋 《山西医科大学学报》 CAS 2015年第6期553-555,共3页
目的研究使用En Vision多标记读板仪检测细胞内钙信号的可行性。方法分别用卡巴胆碱和凝血酶刺激LN229、SKN-MC细胞或者磷脂酶C抑制剂U73122预处理的LN229细胞,使用En Vision多标记读板仪检测细胞内钙信号强度的变化。结果卡巴胆碱诱导... 目的研究使用En Vision多标记读板仪检测细胞内钙信号的可行性。方法分别用卡巴胆碱和凝血酶刺激LN229、SKN-MC细胞或者磷脂酶C抑制剂U73122预处理的LN229细胞,使用En Vision多标记读板仪检测细胞内钙信号强度的变化。结果卡巴胆碱诱导的LN229细胞内钙信号变化呈现浓度依赖性;卡巴胆碱和凝血酶诱导的细胞内钙信号变化趋势不同;凝血酶诱导的钙信号变化具有细胞特异性;U73122对凝血酶诱导的钙信号的抑制作用呈现剂量依赖性。结论 En Vision多标记读板仪作为细胞内钙信号检测仪器,具有快速、可重复性好和灵敏度高等优势,适用于钙信号相关的研究和小分子抑制剂的筛选等领域的工作。 展开更多
关键词 细胞内钙信号 Envision多标记读板仪 磷脂酶C-β G蛋白偶联受体
在线阅读 下载PDF
A Novel Metadata Based Multi-Label Document Classification Technique 被引量:1
19
作者 Naseer Ahmed Sajid Munir Ahmad +13 位作者 Atta-ur Rahman Gohar Zaman Mohammed Salih Ahmed Nehad Ibrahim Mohammed Imran BAhmed Gomathi Krishnasamy Reem Alzaher Mariam Alkharraa Dania AlKhulaifi Maryam AlQahtani Asiya A.Salam Linah Saraireh Mohammed Gollapalli Rashad Ahmed 《Computer Systems Science & Engineering》 SCIE EI 2023年第8期2195-2214,共20页
From the beginning,the process of research and its publication is an ever-growing phenomenon and with the emergence of web technologies,its growth rate is overwhelming.On a rough estimate,more than thirty thousand res... From the beginning,the process of research and its publication is an ever-growing phenomenon and with the emergence of web technologies,its growth rate is overwhelming.On a rough estimate,more than thirty thousand research journals have been issuing around four million papers annually on average.Search engines,indexing services,and digital libraries have been searching for such publications over the web.Nevertheless,getting the most relevant articles against the user requests is yet a fantasy.It is mainly because the articles are not appropriately indexed based on the hierarchies of granular subject classification.To overcome this issue,researchers are striving to investigate new techniques for the classification of the research articles especially,when the complete article text is not available(a case of nonopen access articles).The proposed study aims to investigate the multilabel classification over the available metadata in the best possible way and to assess,“to what extent metadata-based features can perform in contrast to content-based approaches.”In this regard,novel techniques for investigating multilabel classification have been proposed,developed,and evaluated on metadata such as the Title and Keywords of the articles.The proposed technique has been assessed for two diverse datasets,namely,from the Journal of universal computer science(J.UCS)and the benchmark dataset comprises of the articles published by the Association for computing machinery(ACM).The proposed technique yields encouraging results in contrast to the state-ofthe-art techniques in the literature. 展开更多
关键词 multilabel classification INDEXING METADATA content/data mining
在线阅读 下载PDF
面向不均衡医学数据集的疾病预测模型研究 被引量:45
20
作者 陈旭 刘鹏鹤 +5 位作者 孙毓忠 沈曦 张磊 王晓青 孙晓平 程伟 《计算机学报》 EI CSCD 北大核心 2019年第3期596-609,共14页
基于临床表现的疾病预测模型是临床决策支持系统(Clinical Decision Support System,CDSS)的一个重要研究内容.现有临床决策支持系统往往将临床病例作为训练数据集,以临床表现的描述文字为特征,采用统计机器学习方法构建疾病预测模型.然... 基于临床表现的疾病预测模型是临床决策支持系统(Clinical Decision Support System,CDSS)的一个重要研究内容.现有临床决策支持系统往往将临床病例作为训练数据集,以临床表现的描述文字为特征,采用统计机器学习方法构建疾病预测模型.然而,在医疗领域往往存在着样本数据集不均衡的问题,导致模型的预测效果降低.欠采样技术是目前解决样本不均衡问题的常用手段.其主要采用一定的方法从多数类样本中抽取部分样本,与少数类样本组成平衡数据集后再构建模型.现有的欠采样方法往往可以显著提高模型对少数类样本的召回率,然而其通常也会造成模型准确率的降低,从而限制了预测模型的整体提升效果.为此,该文提出了一种新的基于迭代提升欠采样的集成分类方法(Under-Sampling with Iteratively Boosting,USIB),该方法迭代地从多数类样本中进行欠抽样,构建多组弱分类器,并采用加权组合方式将这些弱分类器构成一个强分类器,从而提升样本不平衡条件下单种疾病预测效果.另外,医学病例样本数据集通常是多类别、多标签的,为此,该文将多个单种疾病的预测模型进行组合构成一个多标签疾病预测模型,以满足临床意义上的多病种以及并发症的诊断.为了进一步提升多标签预测模型的效果,该文设计了一种基于标签最大互信息生成树的标签选择方法(Labels Selection method based on Maximum Mutual Information Spanning Tree,LS-MMIST),该方法根据原始数据集的分布构建标签之间的最大互信息生成树,在每一次的样本预测阶段,借助树中疾病标签之间的关系确定最终的预测标签集合.实验方面,该文首先选择三种公开的不均衡二分类数据集和我们私有的四种稀有疾病的数据集,对该文提出的迭代提升欠采样方法进行性能评估.其次,分别对比了该文提出的多标签预测模型与现有的多标签预测技术在中医和西医两种多标签数据集上的预测性能.实验结果显示,相对于目前主流的八种欠采样以及两种集成采样技术,该文提出的迭代提升欠采样方法在各个不均衡二分类数据集上的F1值平均提升22.58%;与现有的各种多标签预测技术相比,该文提出的多标签预测方法在西医和中医数据集上正确率分别提升6.30%和12.43%,召回率分别提升4.33%和5.86%,F1值分别提升5.48%和11.16%. 展开更多
关键词 疾病预测 不均衡数据集 欠采样 二分类 多标签分类
在线阅读 下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部