期刊文献+
共找到73篇文章
< 1 2 4 >
每页显示 20 50 100
Nuclear mass based on the multi-task learning neural network method 被引量:11
1
作者 Xing-Chen Ming Hong-Fei Zhang +3 位作者 Rui-Rui Xu Xiao-Dong Sun Yuan Tian Zhi-Gang Ge 《Nuclear Science and Techniques》 SCIE EI CAS CSCD 2022年第4期96-103,共8页
The global nuclear mass based on the macroscopic-microscopic model was studied by applying a newly designed multi-task learning artificial neural network(MTL-ANN). First, the reported nuclear binding energies of 2095 ... The global nuclear mass based on the macroscopic-microscopic model was studied by applying a newly designed multi-task learning artificial neural network(MTL-ANN). First, the reported nuclear binding energies of 2095 nuclei(Z ≥ 8, N ≥ 8) released in the latest Atomic Mass Evaluation AME2020 and the deviations between the fitting result of the liquid drop model(LDM)and data from AME2020 for each nucleus were obtained.To compensate for the deviations and investigate the possible ignored physics in the LDM, the MTL-ANN method was introduced in the model. Compared to the single-task learning(STL) method, this new network has a powerful ability to simultaneously learn multi-nuclear properties,such as the binding energies and single neutron and proton separation energies. Moreover, it is highly effective in reducing the risk of overfitting and achieving better predictions. Consequently, good predictions can be obtained using this nuclear mass model for both the training and validation datasets and for the testing dataset. In detail, the global root mean square(RMS) of the binding energy is effectively reduced from approximately 2.4 MeV of LDM to the current 0.2 MeV, and the RMS of Sn, Spcan also reach approximately 0.2 MeV. Moreover, compared to STL, for the training and validation sets, 3-9% improvement can be achieved with the binding energy, and 20-30% improvement for S_(n), S_(p);for the testing sets, the reduction in deviations can even reach 30-40%, which significantly illustrates the advantage of the current MTL. 展开更多
关键词 Macroscopic–microscopic model Binding energy neural network multi-task learning
在线阅读 下载PDF
Recent Progresses in Deep Learning Based Acoustic Models 被引量:11
2
作者 Dong Yu Jinyu Li 《IEEE/CAA Journal of Automatica Sinica》 SCIE EI CSCD 2017年第3期396-409,共14页
In this paper,we summarize recent progresses made in deep learning based acoustic models and the motivation and insights behind the surveyed techniques.We first discuss models such as recurrent neural networks(RNNs) a... In this paper,we summarize recent progresses made in deep learning based acoustic models and the motivation and insights behind the surveyed techniques.We first discuss models such as recurrent neural networks(RNNs) and convolutional neural networks(CNNs) that can effectively exploit variablelength contextual information,and their various combination with other models.We then describe models that are optimized end-to-end and emphasize on feature representations learned jointly with the rest of the system,the connectionist temporal classification(CTC) criterion,and the attention-based sequenceto-sequence translation model.We further illustrate robustness issues in speech recognition systems,and discuss acoustic model adaptation,speech enhancement and separation,and robust training strategies.We also cover modeling techniques that lead to more efficient decoding and discuss possible future directions in acoustic model research. 展开更多
关键词 Attention model convolutional neural network(CNN) connectionist temporal classification(CTC) deep learning(DL) long short-term memory(LSTM) permutation invariant training speech adaptation speech processing speech recognition speech separation
在线阅读 下载PDF
Fatigue Life Estimation of High Strength 2090-T83 Aluminum Alloy under Pure Torsion Loading Using Various Machine Learning Techniques
3
作者 Mustafa Sami Abdullatef Faten NAlzubaidi +1 位作者 Anees Al-Tamimi Yasser Ahmed Mahmood 《Fluid Dynamics & Materials Processing》 EI 2023年第8期2083-2107,共25页
The ongoing effort to create methods for detecting and quantifying fatigue damage is motivated by the high levels of uncertainty in present fatigue-life prediction approaches and the frequently catastrophic nature of ... The ongoing effort to create methods for detecting and quantifying fatigue damage is motivated by the high levels of uncertainty in present fatigue-life prediction approaches and the frequently catastrophic nature of fatigue failure.The fatigue life of high strength aluminum alloy 2090-T83 is predicted in this study using a variety of artificial intelligence and machine learning techniques for constant amplitude and negative stress ratios(R?1).Artificial neural networks(ANN),adaptive neuro-fuzzy inference systems(ANFIS),support-vector machines(SVM),a random forest model(RF),and an extreme-gradient tree-boosting model(XGB)are trained using numerical and experimental input data obtained from fatigue tests based on a relatively low number of stress measurements.In particular,the coefficients of the traditional force law formula are found using relevant numerical methods.It is shown that,in comparison to traditional approaches,the neural network and neuro-fuzzy models produce better results,with the neural network models trained using the boosting iterations technique providing the best performances.Building strong models from weak models,XGB helps to predict fatigue life by reducing model partiality and variation in supervised learning.Fuzzy neural models can be used to predict the fatigue life of alloys more accurately than neural networks and traditional methods. 展开更多
关键词 Fatigue life high strength aluminum alloy 2090-T83 NEURO-FUZZY tree boosting model neural networks adaptive neuro-fuzzy inference systems random forest support vector machines
在线阅读 下载PDF
Para2Mesh:A dual diffusion framework for moving mesh adaptation
4
作者 Jian YU Hongqiang LYU +2 位作者 Ran XU Wenxuan OUYANG Xuejun LIU 《Chinese Journal of Aeronautics》 2025年第7期147-163,共17页
Multi-scale problems in Computational Fluid Dynamics(CFD)often require numerous simulations across various design parameters.Using a fixed mesh for all cases may fail to capture critical physical features.Moving mesh ... Multi-scale problems in Computational Fluid Dynamics(CFD)often require numerous simulations across various design parameters.Using a fixed mesh for all cases may fail to capture critical physical features.Moving mesh adaptation provides an optimal resource allocation to obtain high-resolution flow-fields on low-resolution meshes.However,most existing methods require manual experience and the flow posteriori information poses great challenges to practical applications.In addition,generating adaptive meshes directly from design parameters is difficult due to highly nonlinear relationships.The diffusion model is currently the most popular model in generative tasks that integrates the diffusion principle into deep learning to capture the complex nonlinear correlations.A dual diffusion framework,Para2Mesh,is proposed to predict the adaptive meshes from design parameters by exploiting the robust data distribution learning ability of the diffusion model.Through iterative denoising,the proposed dual networks accurately reconstruct the flow-field to provide flow features as supervised information,and then achieve rapid and reliable mesh movement.Experiments in CFD scenarios demonstrate that Para2Mesh predicts similar meshes directly from design parameters with much higher efficiency than traditional method.It could become a real-time adaptation tool to assist engineering design and optimization,providing a promising solution for high-resolution flow-field analysis. 展开更多
关键词 Mesh adaptation Flow-field reconstruction Computational fluid dynamics Deep learning Diffusion model Graph neural network
原文传递
Jiu fusion artificial intelligence(JFA):a two-stage reinforcement learning model with hierarchical neural networks and human knowledge for Tibetan Jiu chess
5
作者 Xiali LI Xiaoyu FAN +3 位作者 Junzhi YU Zhicheng DONG Xianmu CAIRANG Ping LAN 《Frontiers of Information Technology & Electronic Engineering》 2025年第10期1969-1983,共15页
Tibetan Jiu chess,recognized as a national intangible cultural heritage,is a complex game comprising two distinct phases:the layout phase and the battle phase.Improving the performance of deep reinforcement learning(D... Tibetan Jiu chess,recognized as a national intangible cultural heritage,is a complex game comprising two distinct phases:the layout phase and the battle phase.Improving the performance of deep reinforcement learning(DRL)models for Tibetan Jiu chess is challenging,especially given the constraints of hardware resources.To address this,we propose a two-stage model called JFA,which incorporates hierarchical neural networks and knowledge-guided techniques.The model includes sub-models:strategic layout model(SLM)for the layout phase and hierarchical battle model(HBM)for the battle phase.Both sub-models use similar network structures and employ parallel Monte Carlo tree search(MCTS)methods for independent self-play training.HBM is structured as a hierarchical neural network,with the upper network selecting movement and jump capturing actions and the lower network handling square capturing actions.Human knowledge-based auxiliary agents are introduced to assist SLM and HBM,simulating the entire game and providing reward signals based on square capturing or victory outcomes.Additionally,within the HBM,we propose two human knowledge-based pruning methods that prune parallel MCTS and capture actions in the lower network.In the experiments against a layout model using the AlphaZero method,SLM achieves a 74%win rate,with the decision-making time being reduced to approximately 1/147 of the time required by the AlphaZero model.SLM also won the first place at the 2024 China National Computer Game Tournament.HBM achieves a 70%win rate when playing against other Tibetan Jiu chess models.When used together,SLM and HBM in JFA achieve an 81%win rate,comparable to the level of a human amateur 4-dan player.These results demonstrate that JFA effectively enhances artificial intelligence(AI)performance in Tibetan Jiu chess. 展开更多
关键词 GAMES Reinforcement learning Tibetan Jiu chess Separate two-stage model Self-play Hierarchical neural network Parallel Monte Carlo tree search
原文传递
基于跨时间尺度迁移学习的污水处理模型漂移校正方法 被引量:2
6
作者 申渝 廖万山 +6 位作者 李慧敏 冯东 郭智威 张冰 高旭 王建辉 陈猷鹏 《环境科学》 北大核心 2025年第1期318-326,共9页
数据是智能运维的核心基础,但当前污水厂数据普遍不足,且污水处理系统状态随内外部环境动态演化.污水厂的智能运维面临着建模难度大,及因系统演化而导致的模型漂移问题.针对该问题,选取水温、水质和微生物状态等都有显著差异的夏冬两季... 数据是智能运维的核心基础,但当前污水厂数据普遍不足,且污水处理系统状态随内外部环境动态演化.污水厂的智能运维面临着建模难度大,及因系统演化而导致的模型漂移问题.针对该问题,选取水温、水质和微生物状态等都有显著差异的夏冬两季作为典型对比场景,将机制模型与神经网络结合,建立了基于跨时间尺度迁移学习的污水处理模型漂移校正方法 .首先,针对数据不足问题,建立并校准活性污泥模型(ASM),以夏季工况数据作为输入,模拟计算运行参数和出水数据,生成模拟运行数据集,实现数据增广和质量提升,用于训练多层感知机神经网络(MLP)模型.结果显示,MLP模型对夏季出水COD、氨氮和总磷等的平均模拟准确率在95%以上;然后,针对模型在冬季工况中出现模拟准确率大幅下降等模型漂移问题,将冬季实测数据作为目标域数据集,以MLP模型作为预训练模型进行迁移学习.结果表明,迁移学习后模型性能显著提升,出水COD、氨氮、总氮和总磷的平均模拟准确率分别提高了21.49%、60.79%、58.14%和46.74%.研究提出的跨时间尺度迁移学习方法,能有效解决模型漂移问题,实现模型对污水处理系统动态演化的跟随响应. 展开更多
关键词 多层感知机神经网络(MLP)模型 机制模型 迁移学习 模型漂移 系统适应性 知识迁移
原文传递
结合负样本优化与机器学习模型的怒江洲峡谷段滑坡易发性评价 被引量:2
7
作者 苏志萍 杨成生 王子倩 《地球信息科学学报》 北大核心 2025年第4期979-993,共15页
【目的】滑坡易发性评价过程中负样本选择和机器学习模型对结果的影响不容忽视。【方法】为探究这2种因素对滑坡易发性评价结果的影响规律,本文以怒江流域怒江州峡谷段为例,在提出利用加权信息量模型对负样本选取优化的基础上,选取了包... 【目的】滑坡易发性评价过程中负样本选择和机器学习模型对结果的影响不容忽视。【方法】为探究这2种因素对滑坡易发性评价结果的影响规律,本文以怒江流域怒江州峡谷段为例,在提出利用加权信息量模型对负样本选取优化的基础上,选取了包括起伏度、土地利用和多年年均降雨量在内的13个影响因子,分别采用支持向量机模型、卷积神经网络模型、梯度提升决策树模型3种机器学习模型,与传统随机样本选取方法进行了滑坡易发性对比研究,并针对降雨因子对易发性分级的影响进行分析。【结果】①基于优化后负样本的各模型评价结果在滑坡密度方面均有提升,分别提升0.0103、0.0639、0.0040;AUC值均相对升高,分别升高0.033、0.018、0.008;②在易发性评价结果中,梯度提升决策树模型最优,较支持向量机模型、卷积神经网络模型精度分别提高了3.8%和1.7%;③将2019—2020年的夏、冬季平均月降雨量数据引入梯度提升决策树模型,结果显示夏季高、较高易发区面积增大,尤其是南部六库镇和上江镇地区。【结论】基于加权信息量模型优化负样本是合理的,梯度提升决策树模型作为滑坡易发性评价模型较适用于怒江州峡谷段地区的孕灾环境,降水对该地区滑坡易发性具有明显影响。本文所提出的研究思路对区域防灾减灾体系构建具有重要的实际意义,同时也为未来的区域规划提供科学依据。 展开更多
关键词 滑坡易发性 怒江州峡谷段 负样本优化 机器学习模型 支持向量机 卷积神经网络 梯度提升决策树
原文传递
融合即时学习的深层扩展VAE软测量建模方法
8
作者 熊晟杰 谢莉 +2 位作者 徐梁 曹余庆 杨慧中 《化工学报》 北大核心 2025年第12期6486-6496,共11页
传统基于深度学习的软测量建模方法缺乏在线更新机制,且随着网络层数增加易产生信息冗余,从而限制了模型预测性能的提升。针对上述问题,提出一种融合即时学习的深层扩展变分自编码器(deep extended variational autoencoder with just-i... 传统基于深度学习的软测量建模方法缺乏在线更新机制,且随着网络层数增加易产生信息冗余,从而限制了模型预测性能的提升。针对上述问题,提出一种融合即时学习的深层扩展变分自编码器(deep extended variational autoencoder with just-in-time learning,JITL-DE-VAE),包括离线训练和在线更新两个阶段。首先,针对离线阶段多层VAE重构误差累积,以及特征提取中无效信息过多导致预测性能不佳的问题,引入基于关键变量指导的特征约束机制,构建扩展变分自编码器(extended variational autoencoder,E-VAE)提高特征提取的准确性。其次,在E-VAE基础上提出深层扩展变分自编码器(deep extended variational autoencoder,DE-VAE),将前一层的输入和隐藏特征共同作为下一层的输入,通过跨层信息整合策略显著增强特征利用效率。此外,在线更新阶段引入即时学习思想,基于最大互信息系数计算加权欧氏距离从历史数据库中检索相似样本,并根据样本相似度对损失函数进行动态加权以更新模型,从而提高模型对时变过程的自适应能力。最后,基于工业脱丁烷塔和硫回收过程数据开展了消融实验和对比实验,结果验证了所提方法的有效性和优越性。 展开更多
关键词 动态建模 神经网络 预测 软测量 变分自编码器 即时学习 模型更新
在线阅读 下载PDF
基于自适应时空同步建模的交通流预测
9
作者 叶宝林 戴本岙 +3 位作者 苗永超 李灵犀 王翔 吴维敏 《计量学报》 北大核心 2025年第6期802-812,共11页
为准确捕获路网中不同交通节点之间的时空关联关系,提出一种基于自适应时空同步建模的交通流预测方法。首先,构建全局节点嵌入和不同子图的偏置生成多个既相互关联又有一定区别的时空子图,将不同的时空子图进行拼接生成静态自适应时空图... 为准确捕获路网中不同交通节点之间的时空关联关系,提出一种基于自适应时空同步建模的交通流预测方法。首先,构建全局节点嵌入和不同子图的偏置生成多个既相互关联又有一定区别的时空子图,将不同的时空子图进行拼接生成静态自适应时空图,从不同的维度上描述路网中不同节点间的时空关联关系。其次,为了更好地建模不同交通节点间动态变化的时空关联关系,设计了一种新的动态自适应时空图构建方法,在有效描述不同交通节点间动态时空关联关系的同时,降低了动态时空图的计算复杂度。最后,在3个来自真实路网的公开数据集上进行测试,测试结果表明:与LSTM、DCRNN、STGCN、ASTGCN、GWN、STSGCN、STFGNN、STGODE、S2TAT等9种基线方法相比,所提方法具有更高的预测精度。在数据集PEMS08上,与最优基线方法S2TAT相比,该方法的平均绝对误差eMAE、平均绝对百分比误差eMAPE和均方根误差eRMSE分别降低了8.65%、9.25%和6.04%。 展开更多
关键词 智能交通系统 交通流量预测 图神经网络 自适应时空图 时空同步建模 深度学习
在线阅读 下载PDF
乳腺癌术后化疗病人感染风险预测模型的构建
10
作者 钟燕澜 张卿 彭云 《护理研究》 北大核心 2025年第23期3934-3941,共8页
目的:构建乳腺癌术后化疗病人感染风险预测模型。方法:选取2020年10月-2023年6月于赣州市人民医院甲状腺乳腺外科收治的368例乳腺癌术后化疗病人作为研究对象。基于Logistic回归分析、分类回归树、反向传播神经网络算法分别构建乳腺癌... 目的:构建乳腺癌术后化疗病人感染风险预测模型。方法:选取2020年10月-2023年6月于赣州市人民医院甲状腺乳腺外科收治的368例乳腺癌术后化疗病人作为研究对象。基于Logistic回归分析、分类回归树、反向传播神经网络算法分别构建乳腺癌术后化疗病人感染的风险预测模型,通过比较预测模型的受试者工作特征曲线分析预测价值。结果:62例乳腺癌术后化疗病人发生感染,主要分布于呼吸道。多因素Logistic回归分析结果显示,骨髓抑制、C⁃反应蛋白及降钙素原是乳腺癌术后化疗病人感染的独立影响因素(P<0.05);分类回归树模型显示,C⁃反应蛋白、降钙素原、引流时间及糖尿病是病人感染的影响因素;反向传播神经网络模型显示,乳腺癌术后化疗病人感染影响因素重要性排序为C⁃反应蛋白>降钙素原>合并糖尿病>住院时间>骨髓抑制>引流时间>血清白蛋白>化疗周期。3种模型中,反向传播神经网络模型预测效能最佳,受试者工作特征曲线下面积为0.996,敏感度为1.000,特异度为0.931。结论:乳腺癌术后化疗病人感染风险的影响因素包括C⁃反应蛋白、降钙素原、糖尿病、住院时间、骨髓抑制等,基于机器学习算法构建的乳腺癌术后化疗病人并发感染风险预测模型效能均较好,其中反向传播神经网络模型预测效能最佳。 展开更多
关键词 机器学习 乳腺癌 术后 化疗 感染 预测模型 LOGISTIC回归分析 分类回归树 反向传播神经网络 影响因素
暂未订购
考虑空间异质性的降雨滑坡易发性预测研究
11
作者 张幸福 姜元俊 阿比尔的 《工程科学与技术》 北大核心 2025年第4期12-28,共17页
现有滑坡易发性预测方法未能充分考虑地形、土壤和植被等环境因素的空间异质性,也无法准确反映极端降雨对滑坡易发性的影响。为了克服这些限制,引入了一种结合深度嵌入聚类(DEC)的动态雨量阈值分区方法,通过深度学习技术,根据环境因素... 现有滑坡易发性预测方法未能充分考虑地形、土壤和植被等环境因素的空间异质性,也无法准确反映极端降雨对滑坡易发性的影响。为了克服这些限制,引入了一种结合深度嵌入聚类(DEC)的动态雨量阈值分区方法,通过深度学习技术,根据环境因素将研究区域划分为具有相似特征的子区域,实现了滑坡预测模型的精细化空间异质性分析;在此基础上,提出基于混合分布的动态雨量阈值模型以区分非极端降雨与极端降雨,并采用贝叶斯方法动态更新模型参数,提高了模型对不同降雨类型的适应性和预测的时效性。以通江县为案例,采用多任务学习自适应神经树模型(MLANT),结合深度嵌入DEC模型与混合分布阈值模型,对滑坡易发性进行预测。结果表明,本文方法在精确度、F1分数及受试者工作特征曲线下面积AUC值等关键性能指标上显著优于传统依赖统一阈值的模型。特别是与传统的基于前期有效降雨量方法相比,预测效果提升显著,预测滑坡密度和数量由0.038事件/km^(2)和44个滑坡事件提升至0.044事件/km^(2)和59个滑坡事件,充分证实了在滑坡易发性预测中使用深度嵌入聚类(DEC)的动态雨量阈值分区考虑空间异质性和区分不同降雨事件的重要性和有效性。 展开更多
关键词 滑坡易发性 深度嵌入聚类(DEC) 空间异质性 混合分布降雨阈值 多任务学习自适应神经树模型
在线阅读 下载PDF
基于不同机器学习模型的滑坡易发性分析及适应性评估 被引量:1
12
作者 王洁 林诚杰 +3 位作者 梁峰铭 季静静 谈松林 刘宇 《科学技术与工程》 北大核心 2025年第2期513-520,共8页
机器学习模型因其强大的特征提取能力被广泛应用于滑坡易发性评价,在应用中其算法在不断改进。为解决常见机器学习模型中精度不高的问题,将分组卷积神经网络模型(group convolutional neural network,GCNN)引入滑坡易发性评价,并与多种... 机器学习模型因其强大的特征提取能力被广泛应用于滑坡易发性评价,在应用中其算法在不断改进。为解决常见机器学习模型中精度不高的问题,将分组卷积神经网络模型(group convolutional neural network,GCNN)引入滑坡易发性评价,并与多种常见机器学习模型结果进行对比分析,综合评估不同机器学习模型在滑坡易发性评价的适应性。以河北省为研究区,从致灾因子、孕灾环境、承灾体这个3个方面出发,共选取16个影响因子,选择GCNN模型和目前常见的机器学习模型——卷积神经网络模型(convolutional neural network,CNN)、逻辑回归模型(Logistic)、随机森林算法模型(random forest,RF)和支持向量机模型(support vector machine,SVM)构建出相应的易发性评价模型,将研究区划分为4类滑坡易发性区域,并对区划的精确性进行综合评价。研究表明,与其他4种机器学习模型相比,GCNN模型在各混淆矩阵指标下拥有更高评分,更适合进行滑坡易发性区划,得到的滑坡易发区划结果与实际发生滑坡点的一致性较好,划分的滑坡灾害易发区更加准确。 展开更多
关键词 机器学习 分组卷积神经网络模型 适应性评价 滑坡易发性评价
在线阅读 下载PDF
基于树模型和神经网络的供热一次网负荷预测
13
作者 闫京 蒋泽龄 +5 位作者 关宝良 孟思宇 王凤龙 杨尚峰 杨众杨 熊亚选 《综合智慧能源》 2025年第12期73-80,共8页
建筑热负荷的精准预测对于优化建筑能源系统的运行、降低能源消耗及实现节能目标具有至关重要的作用。运用机器学习(ML)算法进行预测能够有效克服传统方法的局限性,显著降低传统模拟分析的计算成本并提升系统能效。采用随机森林回归(RFR... 建筑热负荷的精准预测对于优化建筑能源系统的运行、降低能源消耗及实现节能目标具有至关重要的作用。运用机器学习(ML)算法进行预测能够有效克服传统方法的局限性,显著降低传统模拟分析的计算成本并提升系统能效。采用随机森林回归(RFR)、极端随机树回归(ETR)、梯度提升回归(GBR)、极端梯度提升回归(XGBR)及多层感知机(MLP)5种回归模型对建筑热负荷进行预测,并使用4个评价指标来评估预测精度。结果表明,ETR模型与XGBR模型的预测性能最佳。ETR模型的均方根误差(RMSE)低至97.1894 kW,R2值达0.7660。XGBR模型的平均绝对误差(MAE)与平均绝对百分比误差(MAPE)分别低至69.9671 kW和4.0860%。这2种模型均展现出较高的预测精度,为后续建筑热负荷预测研究提供了参考。 展开更多
关键词 建筑能耗 负荷预测 机器学习 树模型 神经网络 相关系数 建筑能源系统 供热
在线阅读 下载PDF
一种随机掩膜和自适应特征蒸馏算法
14
作者 冯健 吴鹏 《电子科技》 2025年第10期1-9,共9页
现有特征蒸馏方法中教师-学生之间特征连接依靠人工设计,且难以确定特征之间的蒸馏强度,导致学生模型学习无用信息。针对该问题,文中提出了一种随机掩膜和自适应特征知识蒸馏(Random Mask and Adaptive Feature Distillation,MAFD)算法... 现有特征蒸馏方法中教师-学生之间特征连接依靠人工设计,且难以确定特征之间的蒸馏强度,导致学生模型学习无用信息。针对该问题,文中提出了一种随机掩膜和自适应特征知识蒸馏(Random Mask and Adaptive Feature Distillation,MAFD)算法。该算法通过引入自注意力机制来自适应地确定教师-学生候选特征层之间的蒸馏强度。在学生特征生成阶段,引入随机像素掩膜策略使教师模型指导学生特征生成,以提高剩余像素的代表性,从而增强学生网络的表征能力。实验结果表明,该知识蒸馏网络在CIFAR100和ImageNet数据集上使学生模型相对基线性能提升2.0~6.2百分点,在任务CUB-200、indoor、Actions和Dogs上相对于基线分别提高27.27百分点、14.75百分点、25.55百分点和12.55百分点。文中还验证了RetinaNet模型在COCO-2017数据集上的性能提升,说明MAFD能够更好地减少教师模型和学生模型之间的知识转移损失。 展开更多
关键词 特征蒸馏 模型轻量化 卷积神经网络 计算机视觉 深度学习 掩膜策略 自适应特征连接
在线阅读 下载PDF
A neural-network-enhanced parameter-varying framework for multi-objective model predictive control applied to buildings
15
作者 Dylan Wald Olga Doronina +7 位作者 Kathryn Johnson Ryan King Michael Sinner Kevin Griffin Rohit Chintala Deepthi Vaidhynathan Jibonananda Sanyal Marc Day 《Energy and AI》 2025年第3期655-672,共18页
Management of the electrical grid is becoming more complex due to the increased penetration of alternative energy generation technologies and a broadening diversity of electric loads.This complexity creates challenges... Management of the electrical grid is becoming more complex due to the increased penetration of alternative energy generation technologies and a broadening diversity of electric loads.This complexity creates challenges in balancing demand and generation that can increase the potential for grid instabilities.One effective way to address this issue is to leverage previously unexploited demand flexibility through advanced control strategies.In this work,we propose an advanced control method,called adaptive neural parameter-varying model predictive control(ANPV-MPC),to control the temperature and energy consumption of a building via its Heating,Ventilation,and Air Conditioning system.ANPV-MPC combines key ideas in varying parameter-control,adaptive control,and online learning strategies to bridge the gap between computationally efficient linear model predictive control and more accurate nonlinear model predictive control.The novelty in ANPV-MPC is the use of a physics-inspired Bayesian neural network to estimate the coefficients of the parameter-varying linear control model.The Bayesian neural network additionally provides uncertainty estimates,triggering online training to capture evolving building system conditions.We show that ANPV-MPC can approximate the building system dynamics with a 28.39%higher accuracy than traditional linear model predictive control,resulting in 36.23%better control performance without increasing complexity of the optimal control problem.ANPV-MPC also adapts in real time to previously unseen conditions using online learning,further improving its performance. 展开更多
关键词 Bayesian neural networks Online learning Parameter-varying control model predictive control adaptive control Building supervisory HVAC control
在线阅读 下载PDF
基于自适应高斯混合模型与ResDN的火焰检测算法
16
作者 王文标 时启衡 郝友维 《科学技术与工程》 北大核心 2025年第4期1580-1586,共7页
针对火焰检测算法在复杂场景下误检率高、算法适应性差、效率低等问题,设计一种轻量高效的两阶段视频火焰检测算法。第一阶段采用改进的自适应高斯混合模型(adaptive gaussian mixture model, AGMM)对视频图像序列进行快速背景建模,利... 针对火焰检测算法在复杂场景下误检率高、算法适应性差、效率低等问题,设计一种轻量高效的两阶段视频火焰检测算法。第一阶段采用改进的自适应高斯混合模型(adaptive gaussian mixture model, AGMM)对视频图像序列进行快速背景建模,利用火焰的闪烁和涌动特性,提取出序列中的可疑候选区域。第二阶段使用残差深度归一化卷积神经网络(residual deep normalization and convolutional neural network, ResDN)对可疑候选区域进行判别,并引入简化的残差块替换原有的卷积层进行轻量化设计,实现对火焰的检测与定位。相比于传统分类算法,所设计的两阶段视频火焰检测算法能够有效克服复杂场景下的环境干扰,准确快速地识别火焰,具有更高的检测率和适应性。 展开更多
关键词 火焰检测 自适应高斯混合模型(AGMM) 残差深度归一化卷积神经网络(ResDN) 机器视觉 深度学习
在线阅读 下载PDF
深度学习在农业病虫害智能识别中的研究综述
17
作者 李季 杨淑婷 +3 位作者 周慧 冶鑫 李娜 梁爱银 《宁夏农林科技》 2025年第12期55-59,共5页
为应对传统方法在农业病虫害识别中效率低下、过度依赖专家知识的瓶颈,深度学习技术提供了新的技术途径。从“技术-场景-落地”的适应性视角出发,对该领域研究进行系统综述。通过构建“模型-数据-环境”分析框架,系统综述了基于CNN(卷... 为应对传统方法在农业病虫害识别中效率低下、过度依赖专家知识的瓶颈,深度学习技术提供了新的技术途径。从“技术-场景-落地”的适应性视角出发,对该领域研究进行系统综述。通过构建“模型-数据-环境”分析框架,系统综述了基于CNN(卷积神经网络)与Transformer的分类检测模型及优化技术进展,剖析了公开数据集构建与标准化的现状与挑战,并深入探讨了模型泛化能力不足、小目标与遮挡物检测困难、硬件资源限制等制约技术落地的核心难题。在此基础上,提出了以“场景自适应”为核心的技术框架,强调需在数据、算法与部署三个层面进行协同创新,即构建贯通实验室与田间的渐进式数据集、发展具备在线学习与领域泛化能力的自适应模型及形成“云-边-端”协同的弹性计算架构,以期为推动深度学习在智慧农业中的深度融合与应用提供理论参考与实践指引。 展开更多
关键词 深度学习 病虫害识别 目标检测 卷积神经网络 模型泛化 场景自适应
在线阅读 下载PDF
基于神经网络的智能下肢假肢自适应控制 被引量:8
18
作者 马玉良 徐文良 +2 位作者 孟明 罗志增 杨家强 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2010年第7期1373-1376,1381,共5页
下肢假肢的膝关节是一种具有高度非线性、时变、强耦合的阻尼系统,传统控制方法很难达到良好控制效果.针对这一问题,提出将神经网络(NN)应用于下肢假肢控制.以学习矢量量化(LVQ)神经网络为基础,提出神经网络模型参考自适应控制方法.该... 下肢假肢的膝关节是一种具有高度非线性、时变、强耦合的阻尼系统,传统控制方法很难达到良好控制效果.针对这一问题,提出将神经网络(NN)应用于下肢假肢控制.以学习矢量量化(LVQ)神经网络为基础,提出神经网络模型参考自适应控制方法.该方法通过选择适当的参考模型和自适应算法,利用参考模型输出与实际系统输出之间的误差信号,由自适应算法计算当前的控制量以控制智能下肢假肢,达到自适应控制的目的.该方法不需要进行性能指标的变换,容易实现且自适应速度快,仿真结果表明了该方法的有效性. 展开更多
关键词 智能下肢假肢 自适应控制 学习矢量量化(LVQ) 神经网络(NN) 参考模型
在线阅读 下载PDF
一种基于混合梯度下降算法的模糊神经网络设计及应用 被引量:15
19
作者 韩红桂 林征来 乔俊飞 《控制与决策》 EI CSCD 北大核心 2017年第9期1635-1641,共7页
为了提高模糊神经网络(FNN)的收敛速度和泛化能力,提出一种基于混合梯度下降算法(HG)的模糊神经网络(HG-FNN).HG-FNN通过设计FNN参数调整过程的自适应学习率,利用链式法则获取FNN参数学习过程的梯度,在实现FNN参数自校正的同时,给出HG-... 为了提高模糊神经网络(FNN)的收敛速度和泛化能力,提出一种基于混合梯度下降算法(HG)的模糊神经网络(HG-FNN).HG-FNN通过设计FNN参数调整过程的自适应学习率,利用链式法则获取FNN参数学习过程的梯度,在实现FNN参数自校正的同时,给出HG-FNN的收敛性证明,保证HG-FNN的收敛速度和泛化能力.最后,将所设计的HG-FNN应用于非线性系统建模与污水处理过程关键水质参数预测,实验比较结果显示,HG-FNN不仅具有较快的收敛速度,而且具有较好的泛化能力. 展开更多
关键词 模糊神经网络 混合梯度 自适应学习率 非线性系统建模
原文传递
基于模糊分类的模糊神经网络辨识方法及应用 被引量:9
20
作者 江善和 李强 《控制工程》 CSCD 2005年第3期266-269,276,共5页
基于改进的T S模型,提出一种自适应模糊神经网络模型(AFNN),给出了网络的连接结构和学习算法。基于竞争学习算法的模糊分类器确定系统的模糊空间和模糊规则数,并得出每个样本对每条规则的适用程度。利用卡尔曼滤波算法在线辨识AFNN的后... 基于改进的T S模型,提出一种自适应模糊神经网络模型(AFNN),给出了网络的连接结构和学习算法。基于竞争学习算法的模糊分类器确定系统的模糊空间和模糊规则数,并得出每个样本对每条规则的适用程度。利用卡尔曼滤波算法在线辨识AFNN的后件参数。AFNN结构简洁,逼近能力强,能够显著提高辨识精度,并且在线辨识的模糊模型简单有效。将该AFNN用于非线性系统的模糊辨识和化工过程连续搅拌反应器(CSTR)的建模中,仿真结果验证了该方法的有效性,表明该网络能够实现复杂非线性系统的建模,而且建模精度高、收敛速度快,可当作复杂系统建模的一种有效手段。 展开更多
关键词 辨识方法 模糊神经网络模型 卡尔曼滤波算法 连续搅拌反应器 复杂非线性系统 应用 竞争学习算法 复杂系统建模 在线辨识 T-S模型 模糊分类器 连接结构 模糊规则 模糊空间 逼近能力 辨识精度 模糊模型 化工过程 模糊辨识
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部