期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
Advanced Feature Selection Techniques in Medical Imaging--A Systematic Literature Review
1
作者 Sunawar Khan Tehseen Mazhar +5 位作者 Naila Sammar Naz Fahed Ahmed Tariq Shahzad Atif Ali Muhammad Adnan Khan Habib Hamam 《Computers, Materials & Continua》 2025年第11期2347-2401,共55页
Feature selection(FS)plays a crucial role in medical imaging by reducing dimensionality,improving computational efficiency,and enhancing diagnostic accuracy.Traditional FS techniques,including filter,wrapper,and embed... Feature selection(FS)plays a crucial role in medical imaging by reducing dimensionality,improving computational efficiency,and enhancing diagnostic accuracy.Traditional FS techniques,including filter,wrapper,and embedded methods,have been widely used but often struggle with high-dimensional and heterogeneous medical imaging data.Deep learning-based FS methods,particularly Convolutional Neural Networks(CNNs)and autoencoders,have demonstrated superior performance but lack interpretability.Hybrid approaches that combine classical and deep learning techniques have emerged as a promising solution,offering improved accuracy and explainability.Furthermore,integratingmulti-modal imaging data(e.g.,MagneticResonance Imaging(MRI),ComputedTomography(CT),Positron Emission Tomography(PET),and Ultrasound(US))poses additional challenges in FS,necessitating advanced feature fusion strategies.Multi-modal feature fusion combines information fromdifferent imagingmodalities to improve diagnostic accuracy.Recently,quantum computing has gained attention as a revolutionary approach for FS,providing the potential to handle high-dimensional medical data more efficiently.This systematic literature review comprehensively examines classical,Deep Learning(DL),hybrid,and quantum-based FS techniques inmedical imaging.Key outcomes include a structured taxonomy of FS methods,a critical evaluation of their performance across modalities,and identification of core challenges such as computational burden,interpretability,and ethical considerations.Future research directions—such as explainable AI(XAI),federated learning,and quantum-enhanced FS—are also emphasized to bridge the current gaps.This review provides actionable insights for developing scalable,interpretable,and clinically applicable FS methods in the evolving landscape of medical imaging. 展开更多
关键词 feature selection medical imaging deep learning hybrid approaches multi-modal imaging quantum computing explainable AI computational efficiency dimensionality reduction
在线阅读 下载PDF
Motion estimation based feature selection for visual SLAM
2
作者 孟旭炯 Jiang Rongxin Zhou Fan Chen Yaowu 《High Technology Letters》 EI CAS 2011年第4期433-438,共6页
Feature selection is always an important issue in the visual SLAM (simultaneous location and mapping) literature. Considering that the location estimation can be improved by tracking features with larger value of vi... Feature selection is always an important issue in the visual SLAM (simultaneous location and mapping) literature. Considering that the location estimation can be improved by tracking features with larger value of visible time, a new feature selection method based on motion estimation is proposed. First, a k-step iteration algorithm is presented for visible time estimation using an affme motion model; then a delayed feature detection method is introduced for efficiently detecting features with the maximum visible time. As a means of validation for the proposed method, both simulation and real data experiments are carded out. Results show that the proposed method can improve both the estimation performance and the computational performance compared with the existing random feature selection method. 展开更多
关键词 visual SLAM feature selection motion estimation computational efficiency CONSISTENCY extended Kalman filter (EKF)
在线阅读 下载PDF
Efficient Arabic Essay Scoring with Hybrid Models: Feature Selection, Data Optimization, and Performance Trade-Offs
3
作者 Mohamed Ezz Meshrif Alruily +4 位作者 Ayman Mohamed Mostafa Alaa SAlaerjan Bader Aldughayfiq Hisham Allahem Abdulaziz Shehab 《Computers, Materials & Continua》 2026年第1期2274-2301,共28页
Automated essay scoring(AES)systems have gained significant importance in educational settings,offering a scalable,efficient,and objective method for evaluating student essays.However,developing AES systems for Arabic... Automated essay scoring(AES)systems have gained significant importance in educational settings,offering a scalable,efficient,and objective method for evaluating student essays.However,developing AES systems for Arabic poses distinct challenges due to the language’s complex morphology,diglossia,and the scarcity of annotated datasets.This paper presents a hybrid approach to Arabic AES by combining text-based,vector-based,and embeddingbased similarity measures to improve essay scoring accuracy while minimizing the training data required.Using a large Arabic essay dataset categorized into thematic groups,the study conducted four experiments to evaluate the impact of feature selection,data size,and model performance.Experiment 1 established a baseline using a non-machine learning approach,selecting top-N correlated features to predict essay scores.The subsequent experiments employed 5-fold cross-validation.Experiment 2 showed that combining embedding-based,text-based,and vector-based features in a Random Forest(RF)model achieved an R2 of 88.92%and an accuracy of 83.3%within a 0.5-point tolerance.Experiment 3 further refined the feature selection process,demonstrating that 19 correlated features yielded optimal results,improving R2 to 88.95%.In Experiment 4,an optimal data efficiency training approach was introduced,where training data portions increased from 5%to 50%.The study found that using just 10%of the data achieved near-peak performance,with an R2 of 85.49%,emphasizing an effective trade-off between performance and computational costs.These findings highlight the potential of the hybrid approach for developing scalable Arabic AES systems,especially in low-resource environments,addressing linguistic challenges while ensuring efficient data usage. 展开更多
关键词 Automated essay scoring text-based features vector-based features embedding-based features feature selection optimal data efficiency
在线阅读 下载PDF
An explainable artificial intelligence feature selection framework for transparent,trustworthy,and cost-efficient energy forecasting
4
作者 Leonard Kost Sarah K.Lier Michael H.Breitner 《Energy and AI》 2025年第4期976-993,共18页
Accurate forecasting of renewable power generation is crucial for grid stability and cost efficiency.Feature se-lection in AI-based forecasting remains challenging due to high data acquisition cost,lack of transparenc... Accurate forecasting of renewable power generation is crucial for grid stability and cost efficiency.Feature se-lection in AI-based forecasting remains challenging due to high data acquisition cost,lack of transparency,and limited user control.We introduce a transparent and cost-sensitive feature selection framework for renewable power forecasting that leverages Explainable Artificial Intelligence(XAI).We integrate SHapley Additive ex-Planations(SHAP)and Explain Like I’m 5(ELI5)to identify dominant and redundant features.This approach enables systematic dataset reduction without compromising model performance.Our case study,based on Photovoltaic(PV)generation data,evaluates the approach across four experimental setups.Experimental results indicate that our XAI-based feature selection reduces the dominance index from 0.37 to 0.17,maintains high predictive accuracy(R^(2)=0.94,drop<0.04),and lowers data acquisition costs.Furthermore,eliminating dominant features improves robustness to noise and reduces performance variance by a factor of three compared to the baseline scenario.The developed framework enhances interpretability,supports human-in-the-loop de-cisionmaking,and introduces a cost-sensitive objective function for feature selection.By combining trans-parency,robustness,and efficiency,we contribute to the development and implementation of Trustworthy AI(TAI)applications in energy forecasting,providing a scalable solution for industrial deployment. 展开更多
关键词 Explainable artificial intelligence feature reduction Energy sector Robustness Cost efficiency XAI-feature selection Framework
在线阅读 下载PDF
Novel and Efficient Randomized Algorithms for Feature Selection 被引量:3
5
作者 Zigeng Wang Xia Xiao Sanguthevar Rajasekaran 《Big Data Mining and Analytics》 EI 2020年第3期208-224,共17页
Feature selection is a crucial problem in efficient machine learning,and it also greatly contributes to the explainability of machine-driven decisions.Methods,like decision trees and Least Absolute Shrinkage and Selec... Feature selection is a crucial problem in efficient machine learning,and it also greatly contributes to the explainability of machine-driven decisions.Methods,like decision trees and Least Absolute Shrinkage and Selection Operator(LASSO),can select features during training.However,these embedded approaches can only be applied to a small subset of machine learning models.Wrapper based methods can select features independently from machine learning models but they often suffer from a high computational cost.To enhance their efficiency,many randomized algorithms have been designed.In this paper,we propose automatic breadth searching and attention searching adjustment approaches to further speedup randomized wrapper based feature selection.We conduct theoretical computational complexity analysis and further explain our algorithms’generic parallelizability.We conduct experiments on both synthetic and real datasets with different machine learning base models.Results show that,compared with existing approaches,our proposed techniques can locate a more meaningful set of features with a high efficiency. 展开更多
关键词 feature selection randomized algorithms efficient selection
原文传递
基于评分机制的类贪心森林优化特征选择算法 被引量:1
6
作者 王霞 张珊 +1 位作者 王勇 王卓然 《控制与决策》 北大核心 2025年第2期517-527,共11页
森林优化特征选择算法(FSFOA)具有良好的分类性能和维度缩减能力,但其初始化森林的质量参差不齐,局部播种和全局播种的随机性较大,且适应度评估代价较高导致计算效率较低.针对上述问题,提出一种基于评分机制的类贪心森林优化特征选择算... 森林优化特征选择算法(FSFOA)具有良好的分类性能和维度缩减能力,但其初始化森林的质量参差不齐,局部播种和全局播种的随机性较大,且适应度评估代价较高导致计算效率较低.针对上述问题,提出一种基于评分机制的类贪心森林优化特征选择算法(FSGLFOA-SM).首先,以每维决策变量的分类精度为其得分构建评分机制,提出类贪心初始化策略以生成较优质的初始化森林;其次,提出基于评分比较的类贪心局部播种策略,使评分相对较高的决策变量获得更大的局部播种概率;然后,在全局播种阶段提出类贪心遗传算子播种策略,对候选森林择优重建并进行遗传、类贪心交叉和变异操作,以保留评分较高的特征维度,有利于提高全局播种阶段的分类准确率;最后,为解决昂贵适应度评估带来的计算效率低下问题,建立历史数据库,在适应度评估前先进行库内查找,减少了重复解个体的计算量.实验结果表明,相比9个对比算法,FSGLFOA-SM在16个UCI数据集上的分类精度和维度缩减率更加优越. 展开更多
关键词 特征选择森林优化算法 评分机制 类贪心 初始化 播种策略 计算效率
原文传递
数据增强和复杂特征优化的类不平衡病理嗓音检测
7
作者 武雅琴 张佳庆 张涛 《应用声学》 北大核心 2025年第1期234-244,共11页
该文以提高病理嗓音多分类准确性为目标,构建了一种基于数据增强和复杂特征优化的类不平衡病理嗓音检测系统。首先,对32种声学特征进行分析并将其归类为时域类特征和频域类特征;其次,采用改进的合成少数类过采样技术对数据集进行增广与... 该文以提高病理嗓音多分类准确性为目标,构建了一种基于数据增强和复杂特征优化的类不平衡病理嗓音检测系统。首先,对32种声学特征进行分析并将其归类为时域类特征和频域类特征;其次,采用改进的合成少数类过采样技术对数据集进行增广与均衡处理;然后,结合高效相关性特征选择算法和盒图对多维声学特征进行融合优化,综合评估各特征的判别能力;最后,基于随机森林分类器,详细分析和验证不同特征组合的分类性能。结果表明,该文提出的融合优化特征集(To、Fatr、Jita、sAPQ、vAm、NHR)在随机森林分类器下,对声带小结、息肉、水肿及麻痹4种病理嗓音的分类性能表现优异,取得了88.6%的分类准确率、88.4%的召回率、88.4%的F1分数和99.7%的AUC值。 展开更多
关键词 病理嗓音 数据增强 复杂特征 高效相关性特征选择 盒图
在线阅读 下载PDF
基于分类间隔的特征选择算法 被引量:14
8
作者 任双桥 傅耀文 +1 位作者 黎湘 庄钊文 《软件学报》 EI CSCD 北大核心 2008年第4期842-850,共9页
对于二类目标特征选择问题,首先讨论了特征空间的线性可分性问题,并给出了其判别条件;其次,通过借鉴支撑矢量机原理,分析了特征可分性判据的基本性质;最后,依据各特征对分类间隔的贡献大小定义了特征有效率,并以此进行特征选择和特征空... 对于二类目标特征选择问题,首先讨论了特征空间的线性可分性问题,并给出了其判别条件;其次,通过借鉴支撑矢量机原理,分析了特征可分性判据的基本性质;最后,依据各特征对分类间隔的贡献大小定义了特征有效率,并以此进行特征选择和特征空间降维.实测数据与网络公开UCI(University of california,Irvine)数据库的实验结果表明,与经典的Relief特征选择算法相比,该算法在识别性能和推广能力上明显有所提高. 展开更多
关键词 特征选择 有效率 分类间隔 支撑矢量机
在线阅读 下载PDF
带有特征选取电站锅炉燃烧效率建模 被引量:2
9
作者 唐振浩 吴笑妍 曹生现 《哈尔滨理工大学学报》 CAS 北大核心 2020年第2期1-7,共7页
针对电站锅炉效率难以准确测定问题,依据机器学习理论,采用数据驱动建模方法建立锅炉效率预测模型。分类回归树(CART)算法通过数据分析选取对锅炉效率影响显著的相关变量。然后,K最近邻(KNN)分类器对相关变量的样本进行分类,区分不同工... 针对电站锅炉效率难以准确测定问题,依据机器学习理论,采用数据驱动建模方法建立锅炉效率预测模型。分类回归树(CART)算法通过数据分析选取对锅炉效率影响显著的相关变量。然后,K最近邻(KNN)分类器对相关变量的样本进行分类,区分不同工况生产数据。根据不同工况数据,设计了一种基于差分进化算法(DE)的最小二乘支持向量机(LSSVM)建立数据驱动模型(DDMMF),DE动态优化LSSVM的参数以提高模型精度。最后,对预测模型进行动态修正进一步提高预测精度。基于实际生产数据的实验结果表明,该模型能够准确预测锅炉燃烧效率,满足锅炉燃烧过程控制和优化的需求。 展开更多
关键词 特征选取 K最近邻分类器 数据驱动模型 模型修正 锅炉燃烧效率
在线阅读 下载PDF
基于特征选择和XGBoost的风机叶片结冰预测 被引量:8
10
作者 曹渝昆 朱萌 王晓飞 《电气自动化》 2019年第3期31-33,118,共4页
风电场风机叶片积冰会造成风电机组的效率降低,严重时会导致叶片断裂,严重威胁风电场的正常生产运行。提出了一种基于Relief的特征选择和XGBoost的风机叶片结冰预测方法,能够根据风机运行的SCADA数据对叶片结冰的早期过程进行精确预测,... 风电场风机叶片积冰会造成风电机组的效率降低,严重时会导致叶片断裂,严重威胁风电场的正常生产运行。提出了一种基于Relief的特征选择和XGBoost的风机叶片结冰预测方法,能够根据风机运行的SCADA数据对叶片结冰的早期过程进行精确预测,并采用某风电场的2台风机数据进行模型验证和对比试验,取得了较好的预测精度,提升了预测速度,能够有效预测早期叶片结冰故障的发生,从而为降低风机的效率损失和风机的运行风险提供数据支撑。 展开更多
关键词 XGBoost 特征选择 叶片结冰 结冰预测 RELIEF 风机效率
在线阅读 下载PDF
文本分类中基于改进特征选择方法的研究 被引量:1
11
作者 胡改蝶 樊孝仁 崔艺馨 《计算机与数字工程》 2016年第7期1290-1292,共3页
文本分类不仅可以提高分类的效率,而且可使人们更快地找到想要获取的信息。在特征选择方法的基础上,分析了卡方统计法的缺点,对其提出了一种改进的方法,同时采用支持向量机分类的算法和词频-逆向文件频率权重函数对其进行了验证。通过... 文本分类不仅可以提高分类的效率,而且可使人们更快地找到想要获取的信息。在特征选择方法的基础上,分析了卡方统计法的缺点,对其提出了一种改进的方法,同时采用支持向量机分类的算法和词频-逆向文件频率权重函数对其进行了验证。通过实验得出此方法可以在很大程度上提高文本分类精确度,使分类的效果更好。 展开更多
关键词 效率 文本分类 特征选择 卡方统计法
在线阅读 下载PDF
融入深层病理信息挖掘的乳腺肿块识别模型
12
作者 李广丽 袁天 +3 位作者 李传秀 邬任重 卓建武 张红斌 《计算机科学与探索》 CSCD 北大核心 2022年第2期413-427,共15页
乳腺癌是女性中最常见的癌症,乳腺肿块识别模型能有效地辅助医生的临床诊断工作。然而,医学图像样本稀缺使识别模型易过拟合。提出融入深层病理信息挖掘的乳腺肿块识别模型:构建样本精选策略,跨越不同乳腺造影图像数据集筛选优质样本,... 乳腺癌是女性中最常见的癌症,乳腺肿块识别模型能有效地辅助医生的临床诊断工作。然而,医学图像样本稀缺使识别模型易过拟合。提出融入深层病理信息挖掘的乳腺肿块识别模型:构建样本精选策略,跨越不同乳腺造影图像数据集筛选优质样本,从数据增强角度应对医学图像样本稀缺;由浅入深挖掘有限标注样本中蕴含的病理信息,从特征优选角度应对医学图像样本稀缺。设计多视角有效区域基因优选(MvERGS)算法,以精化原始图像特征,提升特征判别性并压缩特征维度,更好地匹配样本数量;对精化的新特征执行判别相关分析(DCA),深入挖掘异构特征间的跨模态相关性,即深层病理信息,以准确刻画乳腺肿块病灶区域。基于深层病理信息与传统分类器训练出高效的乳腺肿块识别模型,完成乳腺造影图像分类。实验表明:识别模型的关键技术指标,包括Accuracy和AUC,均优于主流基线,样本稀缺导致的过拟合问题得到缓解。 展开更多
关键词 乳腺肿块识别 病理信息挖掘 样本精选 特征优选 多视角有效区域基因优选(MvERGS)
在线阅读 下载PDF
基于无人机影像多时相的小麦品种氮效率分类识别 被引量:5
13
作者 臧少龙 刘淋茹 +5 位作者 高越之 吴珂 贺利 段剑钊 宋晓 冯伟 《中国农业科学》 CAS CSCD 北大核心 2024年第9期1687-1708,共22页
【目的】探索无人机遥感在氮效率分类识别中的潜力,构建小麦品种氮效率分类方法,为氮高效品种筛选提供理论依据和技术支持。【方法】通过6个成熟期与氮效率密切相关的农学指标(产量、植株氮积累、氮素生理利用效率、植株干生物量、籽粒... 【目的】探索无人机遥感在氮效率分类识别中的潜力,构建小麦品种氮效率分类方法,为氮高效品种筛选提供理论依据和技术支持。【方法】通过6个成熟期与氮效率密切相关的农学指标(产量、植株氮积累、氮素生理利用效率、植株干生物量、籽粒总吸氮量、N收获指数)构建主成分综合值,并对其进行K-Means聚类分析,将121个小麦品种划分为氮高效型、氮中效型和氮低效型3种类型。利用无人机遥感平台搭载多光谱相机,在小麦拔节期、孕穗期和开花期获取无人机遥感影像,并提取34种植被指数,分析植被指数与氮效率综合值的相关性;对比支持向量机(SVM)、随机森林(RF)和K最近邻(KNN)分类方法的氮效率分类模型精度,使用总体分类精度(OA)和Kappa系数比较不同生育时期下小麦品种氮效率分类识别的能力;并使用3种不同的特征集筛选方法(ReliefF算法、Boruta算法和RF-RFE算法)对优化的特征子集进行综合评价,确立适宜的小麦品种氮效率分类识别方法。【结果】随着小麦生育时期的不断推进,植被指数与氮效率综合值的相关性逐渐提高,开花期最高(r=0.502);利用植被指数全特征集对小麦品种氮效率进行分类,对于单生育时期数据而言,以开花期的SVM模型分类效果最好(OA=77.1%,Kappa=0.591),拔节期最差(OA=65.6%,Kappa=0.406);总体而言,多生育时期数据融合的品种氮效率分类精度高于单生育时期,其中以拔节期+孕穗期+开花期3个生育时期数据融合的SVM模型的分类效果最优(OA=80.6%,Kappa=0.669)。为减少多生育时期数据融合的特征集变量数量,比较分析RF-RFE、Boruta和ReliefF 3种算法的特征优化效果,基于RF-RFE算法得到的优化特征子集分类精度最高,其OA和Kappa系数比全特征集分类模型分别提高了4.0%和10.1%,其中,以3个生育时期数据融合的分类效果最好(OA=85.4%,Kappa=0.749)。【结论】确立6个氮效率指标—主成分分析—K-Means氮效率评价方法;RF-RFE算法有效优化多生育时期组合的特征子集数量,且获得较高的分类精度,确立基于多生育时期组合—RF-RFE—SVM技术融合的小麦品种氮效率分类模型,为小麦氮高效品种的快速准确分类鉴定提供理论依据和技术支撑。 展开更多
关键词 冬小麦 无人机 植被指数 生育时期 特征筛选 氮效率分类
在线阅读 下载PDF
联合互信息水下目标特征选择算法 被引量:2
14
作者 申昇 杨宏晖 +2 位作者 王芸 潘悦 唐建生 《西北工业大学学报》 EI CAS CSCD 北大核心 2015年第4期639-643,共5页
在特征选择算法中,穷举特征选择算法可选择出最优特征子集,但由于计算量过高而在实际中不可实现。针对计算成本和最优特征子集搜索之间的平衡问题,提出一种新的用于水下目标识别的联合互信息特征选择算法。这个算法的核心思想是:利用顺... 在特征选择算法中,穷举特征选择算法可选择出最优特征子集,但由于计算量过高而在实际中不可实现。针对计算成本和最优特征子集搜索之间的平衡问题,提出一种新的用于水下目标识别的联合互信息特征选择算法。这个算法的核心思想是:利用顺序向前特征搜索机制,在选择出与类别具有最大互信息特征的条件下,选择具有更多互补分类信息的特征,从而达到快速去除噪声特征和冗余特征及提高识别性能的目的。利用4类实测水下目标数据进行仿真实验,结果表明:在支持向量机识别正确率几乎不变的情况下,联合互信息特征选择方法可以减少87%的特征,分类时间降低58%。与基于支持向量机和遗传算法结合的特征选择方法相比,可以选出更少的特征,特征子集具有更好的泛化性能。 展开更多
关键词 特征选择 水下目标识别 联合互信息 条件互信息
在线阅读 下载PDF
A Hierarchical Ensemble Learning Framework for Energy-Efficient Automatic Train Driving 被引量:3
15
作者 Guohua Xi Xibin Zhao +2 位作者 Yan Liu Jin Huang Yangdong Deng 《Tsinghua Science and Technology》 SCIE EI CAS CSCD 2019年第2期226-237,共12页
Railway transportation plays an important role in modern society. As China's massive railway transportation network continues to grow in total mileage and operation density, the energy consumption of trains become... Railway transportation plays an important role in modern society. As China's massive railway transportation network continues to grow in total mileage and operation density, the energy consumption of trains becomes a serious concern. For any given route, the geographic characteristics are known a priori, but the parameters(e.g., loading and marshaling) of trains vary from one trip to another. An extensive analysis of the train operation data suggests that the control gear operation of trains is the most important factor that affects the energy consumption. Such an observation determines that the problem of energy-efficient train driving has to be addressed by considering both the geographic information and the trip parameters. However, the problem is difficult to solve due to its high dimension, nonlinearity, complex constraints, and time-varying characteristics. Faced with these difficulties, we propose an energy-efficient train control framework based on a hierarchical ensemble learning approach. Through hierarchical refinement, we learn prediction models of speed and gear. The learned models can be used to derive optimized driving operations under real-time requirements. This study uses random forest and bagging – REPTree as classification algorithm and regression algorithm, respectively. We conduct an extensive study on the potential of bagging, decision trees, random forest, and feature selection to design an effective hierarchical ensemble learning framework. The proposed framework was testified through simulation. The average energy consumption of the proposed method is over 7% lower than that of human drivers. 展开更多
关键词 machine LEARNING energy efficiency TRAIN driving system feature selection ENSEMBLE LEARNING
原文传递
数据驱动的终端空域进场运行评估方法研究 被引量:6
16
作者 郭海鹏 刘嵩威 张军峰 《航空计算技术》 2020年第5期5-9,共5页
终端空域交通稠密、结构复杂、冲突多发,因此终端进场运行在安全和效率管理中占据关键地位。充分融合指标、数据和方法,形成数据驱动的民航进场运行评估方法集。梳理相关国际组织及主流航空管理机构的民航运行效率指标框架,以此确立进... 终端空域交通稠密、结构复杂、冲突多发,因此终端进场运行在安全和效率管理中占据关键地位。充分融合指标、数据和方法,形成数据驱动的民航进场运行评估方法集。梳理相关国际组织及主流航空管理机构的民航运行效率指标框架,以此确立进场飞行时间和航迹复现性两个关键绩效指标。面向客观记录历史态势的雷达综合航迹,完成原始数据解析、关键信息提取,筛选出整体环境和系统条件相似的2个代表时段以供等效对比。由指标关注领域特征和对象数据性质,使用描述性统计与基于KDE的推论性统计评估进场飞行时间;结合特征选择,使用DBSCAN聚类评估航迹复现性。以长沙黄花机场为例验证研究了方法的有效性。 展开更多
关键词 终端进场管制 运行效率评估 关键绩效指标 数理统计 航迹特征选择 DBSCAN聚类
在线阅读 下载PDF
基于偏最大信息系数与组合XGBoost的短期风功率预测 被引量:7
17
作者 李科 黄东晨 +3 位作者 陶子彬 熊欢 李浩文 杜业冬 《电力工程技术》 北大核心 2021年第6期95-102,共8页
作为新能源领域的课题热点之一,短期风功率预测的研究在提高预测精度的同时也应重视模型的工程化应用。据此,提出一种基于偏最大信息系数的组合XGBoost预测模型。首先,设计一种基于偏最大信息系数的特征选择算法,通过引入偏互信息,在挖... 作为新能源领域的课题热点之一,短期风功率预测的研究在提高预测精度的同时也应重视模型的工程化应用。据此,提出一种基于偏最大信息系数的组合XGBoost预测模型。首先,设计一种基于偏最大信息系数的特征选择算法,通过引入偏互信息,在挖掘出对风功率影响较大的气象特征的同时,也能消除耦合信息带来的不利影响。在此基础上,为兼顾模型的精度和计算效率,降低单个模型的预测风险,构建以XGBoost为底层算法的组合预测模型,进一步实现风功率预测。采用2个具有较大差异的风电场作为算例进行验证分析,结果表明,基于偏最大信息系数特征选择算法的组合XGBoost预测模型不但能提升短期风功率的预测精度,与相近的组合预测模型相比,也具备更高的计算效率,有利于工程化应用。 展开更多
关键词 特征选择 组合XGBoost 偏最大信息系数 短期风功率预测 计算效率 工程化应用
在线阅读 下载PDF
火电机组有效蓄热发电能力上限估计方法研究 被引量:3
18
作者 庞向坤 张绪辉 +2 位作者 游大宁 于庆彬 韩英昆 《自动化仪表》 CAS 2020年第10期55-60,共6页
当前,新能源发电并网规模不断扩大,其波动性和间歇性给电网稳定运行带来了巨大冲击。为了抑制新能源波动带来的电网频率波动,电网在多类型机组协调运行过程中,对火电机组快速实现负荷调节的需求日益突出。火电机组利用其有效蓄热可以迅... 当前,新能源发电并网规模不断扩大,其波动性和间歇性给电网稳定运行带来了巨大冲击。为了抑制新能源波动带来的电网频率波动,电网在多类型机组协调运行过程中,对火电机组快速实现负荷调节的需求日益突出。火电机组利用其有效蓄热可以迅速实现功率调整,有效满足电网需求。因此,获取火电机组有效蓄热发电能力上限值,对于电网平衡新能源波动具有重要意义。根据火电机组利用有效蓄热,可实现负荷调节速率最大的实际特征。以机组实发功率历史数据为基础,首先,采用分段线性表示方法得到机组负荷正向调节特征数据段;其次,通过调节速率最大特征选择数据段,得到机组有效蓄热负荷调节段数据;最后,通过对有效蓄热负荷调节段数据进行样本统计分析,得到火电机组有效蓄热发电能力上限估计值。通过对多台并网火电机组运行数据进行分析,验证了所提方法的可行性与合理性。所提方法对于促进新能源发电大规模并网条件下电网的平稳运行具有重要意义. 展开更多
关键词 火电机组 有效蓄热 特征选取 分段线性表示 发电量 上限估计值
在线阅读 下载PDF
Stabilizing molecular contacts via amorphous structures
19
作者 Yongzhen Wu 《Science China Chemistry》 2025年第5期1637-1638,共2页
Perovskite solar cells(PSCs)have achieved remarkable advancements in recent years[1].Devices achieving high power conversion efficiencies(PCEs)typically rely on molecular contacts featuring conjugated cores[2].The pla... Perovskite solar cells(PSCs)have achieved remarkable advancements in recent years[1].Devices achieving high power conversion efficiencies(PCEs)typically rely on molecular contacts featuring conjugated cores[2].The planar and conjugated cores facilitate ordered molecular stacking throughπ-πinteractions,thereby enhancing charge transport and selectivity[3,4]. 展开更多
关键词 perovskite solar cells pscs perovskite solar cells ordered molecular stacking power conversion efficiencies molecular contacts molecular contacts featuring conjugated cores amorphous structures enhancing charge transport selectivity
原文传递
基于优化后集成学习模型的特征选择与疾病高效预警研究——以老年抑郁焦虑为例 被引量:7
20
作者 严颖 黄奇 李娜 《数据分析与知识发现》 CSSCI CSCD 北大核心 2023年第7期74-88,共15页
【目的】通过合理选择关键的疾病风险变量,使疾病预测模型兼顾计算效率和预测精度,为公共卫生相关部门实现疾病高效预警提供参考。【方法】使用基于集成学习的随机森林和XGBoost模型学习高维的疾病风险变量数据进行疾病预测,使两种模型... 【目的】通过合理选择关键的疾病风险变量,使疾病预测模型兼顾计算效率和预测精度,为公共卫生相关部门实现疾病高效预警提供参考。【方法】使用基于集成学习的随机森林和XGBoost模型学习高维的疾病风险变量数据进行疾病预测,使两种模型自主选择对其预测作出贡献的疾病风险变量子集。为使随机森林和XGBoost模型选择出具有高预测精度的关键变量子集,从最大程度提升模型泛化能力的角度出发,深入分析两种模型的集成方式,通过针对性的超参数调整,利用交叉验证,不断迭代随机森林模型的袋外数据误判率均值,收敛XGBoost模型在不同子训练集上的损失曲线,为两种模型分别提出独特的模型优化方案,释放其疾病预测性能。【结果】在老年抑郁焦虑患病数据集上的实验表明,优化后随机森林和优化后XGBoost模型具有非常优异且接近的疾病预测性能,分别实现了88.6%和89.7%的预测准确率,以及0.936和0.940的AUC。但通过优化后模型的特征选择,XGBoost模型的结构更为简单高效,从54个老年抑郁焦虑风险变量中选择较少的17个关键变量,且实现了较好的疾病预测效果,准确率为85.8%,AUC为0.917。【局限】未使用最新老年队列数据进行实验;需进一步检验模型在复杂异构数据环境中的适应性。【结论】优化后XGBoost模型的特征选择效果更好,可提高疾病预警效率,为公共卫生管理提供决策支持。 展开更多
关键词 集成学习 超参数调优 特征选择 疾病高效预警
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部