期刊文献+
共找到182,215篇文章
< 1 2 250 >
每页显示 20 50 100
面向克隆语音的目标说话人鉴别方法
1
作者 苏兆品 魏玉洋 +2 位作者 张国富 廉晨思 岳峰 《中国图象图形学报》 北大核心 2026年第1期167-176,共10页
目的随着文本到语音(text to speech,TTS)、语音转换(voice conversion,VC)等克隆语音技术的快速发展,如何在司法实践中准确识别克隆语音,即克隆语音是否来源于目标说话人特征,成为一个极具挑战性的难题。虽然现有说话人识别技术可以通... 目的随着文本到语音(text to speech,TTS)、语音转换(voice conversion,VC)等克隆语音技术的快速发展,如何在司法实践中准确识别克隆语音,即克隆语音是否来源于目标说话人特征,成为一个极具挑战性的难题。虽然现有说话人识别技术可以通过声纹特征比对确认自然语音的说话人身份,但由于克隆语音不仅与目标说话人音色相似,且又包含源说话人的特点,使得传统说话人识别技术难以去除源说话人音色的干扰,难以直接应用于深度克隆语音。基于此,研究了一种面向克隆语音的目标说话人鉴别方法。方法基于Res2Block设计组渐进信道融合模块(group progressive channel fusion,GPCF),以有效提取自然语音与克隆语音之间的公共有效声纹特征信息;采用基于K独立的动态全局滤波器(dynamic global filter,DGF),以有效抑制源说话人的影响,提高模型表征和泛化能力;利用基于多尺度层注意力的特征融合机制,以有效融合不同层次GPCF模块和DGF模块的深浅层特征;使用注意力统计池(attentive statistics pooling,ASP)层,进一步增强表示特征张量中的目标说话人信息。结果在所设计的数据集上与3种较新的方法进行实验比较,相对于其他3种方法,本文方法等错误率(equal error rate,EER)分别降低了1.38%、0.92%和0.61%,最小检测代价函数(minimum detection cast function,minDCF)分别降低了0.0125、0.0067和0.0445。结论在FastSpeech2(fast and high-quality end-to-end text to speech)、TriAANVC(triple adaptive attention normalization for any-to-any voice conversion)、FreeVC(high-quality text-free one-shot voice conversion)和KnnVC(nearest neighbors voice conversion)共4种语音克隆数据集上的对比实验结果表明,所提方法在处理面向克隆语音的声纹认定任务时更具有优势,可以有效提取克隆语音中的目标说话人特征,为克隆语音的声纹认定提供方法指导。 展开更多
关键词 克隆语音 声纹认定 组渐进信道融合(GPCF) 动态全局滤波器(DGF) 多尺度层注意力机制
原文传递
融合视觉Mamba与自适应多尺度损失的医学图像分割 被引量:1
2
作者 刘建明 曹圣浩 张志鹏 《中国图象图形学报》 北大核心 2026年第1期335-348,共14页
目的在医学图像分割领域,传统基于卷积神经网络(convolutional neural network,CNN)的模型在捕捉长距离依赖信息方面存在固有局限,而基于视觉Transformer(vision Transformer,ViT)的模型其自注意力机制的计算复杂度与图像尺寸呈平方关系... 目的在医学图像分割领域,传统基于卷积神经网络(convolutional neural network,CNN)的模型在捕捉长距离依赖信息方面存在固有局限,而基于视觉Transformer(vision Transformer,ViT)的模型其自注意力机制的计算复杂度与图像尺寸呈平方关系,在资源有限的现实环境中难以部署。为了解决这些问题,提出一种融合视觉Mamba和自适应多尺度损失的医学图像分割方法VMAML-UNet(medical image segmentation with vision Mamba and adaptive multi-scale loss)。方法VMAML-UNet采用编码器—解码器架构。在编码阶段,设计了融合小波卷积的视觉Mamba块,以线性复杂度提取病变区域的精确特征并扩大感受野,并通过块合并进行下采样。解码阶段同样引入融合小波卷积的视觉Mamba块并利用块扩展进行上采样。跳跃连接中,提出小波卷积注意力聚合模块,用于提取并融合不同尺度下的图像特征。此外,设计了柯尔莫哥洛夫—阿诺德网络(Kolmogorov-Arnold network,KAN)调控多尺度加权损失,动态调控各层级损失权重。结果在BUSI(breast ultrasound images dataset)、GlaS(gland segmenta⁃tion in histology images challenge dataset)和CVC(CVC-ClinicDB dataset)3个异质性显著的医学图像数据集上的实验结果表明,与主流的VM-UNet(vision Mamba UNet)等采用Mamba的医学图像分割方法相比取得显著的性能提升。在BUSI数据集上,交并比(intersection over union,IoU)和F1分数分别提升2.72%和2.02%;在GlaS数据集上,IoU和F1分数分别提升3.38%和1.89%;在CVC数据集上,IoU和F1分数分别提升2.51%和1.42%。结论提出的VMAML-UNet采用基于视觉Mamba的线性复杂度的长距离依赖建模与基于KAN的动态损失优化机制,显著减少了计算成本,同时提升了模型对复杂医学图像的分割精度。该模型在3个数据集上的优异表现证明了其在不同医学图像场景下的广泛适用性和高效性。 展开更多
关键词 状态空间模型(SSM) 柯尔莫哥洛夫-阿诺德网络(KAN) 小波卷积 多尺度加权损失 连续流
原文传递
具身智能的模型分析:基于语义自主视角 被引量:1
3
作者 段玉聪 《新疆师范大学学报(哲学社会科学版)》 北大核心 2026年第2期93-102,共10页
具身智能强调智能体通过传感—行动与物理环境交互,进而涌现更高级的认知能力。DIKWP语义模型将认知过程视为包含数据、信息、知识、智慧和意图五要素的网状交互转化系统,突破了传统层级模型的局限;意识“BUG”理论认为意识是认知系统... 具身智能强调智能体通过传感—行动与物理环境交互,进而涌现更高级的认知能力。DIKWP语义模型将认知过程视为包含数据、信息、知识、智慧和意图五要素的网状交互转化系统,突破了传统层级模型的局限;意识“BUG”理论认为意识是认知系统因信息处理限制产生的“错误”,这种“错误”可能孕育创新和意识跃迁;DIKWP×DIKWP交互模型揭示跨主体语义映射与人格映射机制。文本基于上述模型理论,对认知与物理鸿沟、语义不一致、安全伦理和高投入等进行分析,并立足哲学基础和国际比较视野探讨语义自主、人工意识和自我模型等深层问题,力图为具身智能的发展提供理论参考和实践建议。 展开更多
关键词 具身智能 DIKWP语义模型 意识“BUG”理论 语义闭环 语义主权 人机共融 人工意识
原文传递
面向人脸视频防伪检测的大规模中文数据测评基准
4
作者 贝毅君 娄恒瑞 +7 位作者 高克威 宋杰 王蕊 金苍宏 雷杰 宋明黎 胡秉德 冯尊磊 《中国图象图形学报》 北大核心 2026年第1期82-98,共17页
目的针对生成式人工智能(artificial intelligence generated content,AIGC)技术生成的高逼真伪造人脸视频对人类视觉感知的欺骗性问题,以及当前人脸防伪检测算法评估体系在中文数据层面有效性和应用性验证方面的空白,旨在构建面向中文... 目的针对生成式人工智能(artificial intelligence generated content,AIGC)技术生成的高逼真伪造人脸视频对人类视觉感知的欺骗性问题,以及当前人脸防伪检测算法评估体系在中文数据层面有效性和应用性验证方面的空白,旨在构建面向中文场景的量化评估基准以推动防伪检测技术迭代发展。方法提出面向大规模中文人脸伪造视频的CHN-DF(Chinese-deepfake)数据集,详细阐述数据采集、伪造样本生成及质量评估的全流程构建方法。通过多维度实验验证数据集复杂性,兼顾跨模态伪造技术覆盖、环境干扰因子完备性等复杂因素,并建立基于深度检测模型的系统性评测基准。结果发布全球首个包含434727样本的中文人脸视频防伪数据集,实验显示该数据集鉴别难度高,在16种包含SOTA(state-of-the-art)与主流防伪模型的测评中视觉与视听结合的准确率分别控制在85%与70%以下。构建的评测基准覆盖了视觉与听觉模态场景,在跨域泛化性测试中显示模型准确率性能波动平均幅度达19.6%,显著揭示现有算法的应用局限性。结论构建的中文防伪评测基准有效填补领域空白,通过系统性实验阐明数据集特性与算法性能的关联机制,提出针对模型鲁棒性增强、跨模态泛化能力提升等关键发展方向,为面向中文场景的量化评估以及人脸视频防伪技术的实际部署提供数据支撑与实践指导。CHN-DF数据集在线发布地址为:https://doi.org/10.57760/sciencedb.j00240.00067和https://github.com/HengruiLou/CHN-DF. 展开更多
关键词 深度伪造 人脸伪造视频 人脸防伪评测基准 中文数据集 多模态
原文传递
基于多策略改进蜣螂优化算法的无人机3维路径规划
5
作者 王翊 单军柯 +4 位作者 王贵竹 许耀华 曹静 吴志阳 付星月 《安徽大学学报(自然科学版)》 北大核心 2026年第1期65-75,共11页
无人机的效率在很大程度上依赖于其在复杂3维环境中的路径规划能力.针对蜣螂优化算法在处理具有复杂环境和多种约束条件下的无人机3维路径规划任务时,仍然存在易陷入局部最优解、路径规划质量差等问题,提出了一种改进的蜣螂优化算法.首... 无人机的效率在很大程度上依赖于其在复杂3维环境中的路径规划能力.针对蜣螂优化算法在处理具有复杂环境和多种约束条件下的无人机3维路径规划任务时,仍然存在易陷入局部最优解、路径规划质量差等问题,提出了一种改进的蜣螂优化算法.首先,对无人机的飞行环境进行空间建模并制定目标函数;其次,通过引入Chebyshev映射进行种群初始化以提高算法的多样性,采用黄金正弦策略增强局部搜索能力,并在偷窃行为中添加动态权重系数以提升动态环境适应性;最后,通过仿真实验验证所提算法的优越性.仿真结果表明,改进后的蜣螂优化算法在多个测试函数和测试环境中均表现良好,有效提高了无人机路径规划的寻优质量. 展开更多
关键词 路径规划 蜣螂优化算法 映射 黄金正弦 无人机
在线阅读 下载PDF
融合参考向量更新的约束高维多目标进化算法
6
作者 李俊 刘伟康 +1 位作者 吴颖波 陈黎 《小型微型计算机系统》 北大核心 2026年第3期563-578,共16页
为有效解决约束高维多目标优化问题,本文提出了一种新型的融合参考向量更新的双种群双阶段进化算法WDPEA-RVU,旨在高维空间中有效平衡可行性、收敛性和多样性.首先,算法采用双种群双阶段机制,通过辅助种群与主要种群的信息交流,实现全... 为有效解决约束高维多目标优化问题,本文提出了一种新型的融合参考向量更新的双种群双阶段进化算法WDPEA-RVU,旨在高维空间中有效平衡可行性、收敛性和多样性.首先,算法采用双种群双阶段机制,通过辅助种群与主要种群的信息交流,实现全局搜索与局部集中的有效协作.其次,针对在高维空间中传统Pareto支配关系影响力减弱的问题,算法结合θ-支配,提出新的环境选择策略,以增强在高维空间中收敛性的选择压力.最后,为解决可行区域内个体分布不均的问题,设计了一种参考向量更新机制,以改善可行区域内个体的分布多样性.通过与其它代表性算法在C_DTLZ、DC_DTLZ和MW测试套件上进行不同目标数量的对比实验,展现了WDPEA-RVU的先进性;并通过在ZXH_CF测试套件上进行不同目标数量的消融实验,验证了本文所提出参考向量更新机制的有效性. 展开更多
关键词 约束高维多目标 双种群 双阶段 进化算法 环境选择 参考向量更新
在线阅读 下载PDF
频率感知驱动的深度鲁棒图像水印
7
作者 张国富 李鑫 +2 位作者 苏兆品 方涵 廉晨思 《中国图象图形学报》 北大核心 2026年第1期197-211,共15页
目的近年来,基于深度学习的水印方法得到了广泛研究。现有方法通常对特征图的低频和高频部分同等对待,忽视了不同频率成分之间的重要差异,导致模型在处理多样化攻击时缺乏灵活性,难以同时实现水印的高保真性和强鲁棒性。为此,本文提出... 目的近年来,基于深度学习的水印方法得到了广泛研究。现有方法通常对特征图的低频和高频部分同等对待,忽视了不同频率成分之间的重要差异,导致模型在处理多样化攻击时缺乏灵活性,难以同时实现水印的高保真性和强鲁棒性。为此,本文提出一种频率感知驱动的深度鲁棒图像水印技术(deep robust image watermarking driven by frequency awareness,RIWFP)。方法通过差异化机制处理低频和高频成分,提升水印性能。具体而言,低频成分通过小波卷积神经网络进行建模,利用宽感受野卷积在粗粒度层面高效学习全局结构和上下文信息;高频成分则采用深度可分离卷积和注意力机制组成的特征蒸馏块进行精炼,强化图像细节,在细粒度层面高效捕捉高频信息。此外,本文使用多频率小波损失函数,引导模型聚焦于不同频带的特征分布,进一步提升生成图像的质量。结果实验结果表明,提出的频率感知驱动的深度鲁棒图像水印技术在多个数据集上均表现出优越性能。在COCO(common objects in context)数据集上,RIWFP在随机丢弃攻击下的准确率达到91.4%;在椒盐噪声和中值滤波攻击下,RIWFP分别以100%和99.5%的准确率达到了最高水平,展现了其对高频信息的高效学习能力。在Ima⁃geNet数据集上,RIWFP在裁剪攻击下的准确率为93.4%;在JPEG压缩攻击下的准确率为99.6%,均显著优于其他对比方法。综合来看,RIWFP在COCO和ImageNet数据集上的平均准确率分别为96.7%和96.9%,均高于其他对比方法。结论本文所提方法通过频率感知的粗到细处理策略,显著增强了水印的不可见性和鲁棒性,在处理多种攻击时表现出优越性能。 展开更多
关键词 鲁棒图像水印 小波卷积神经网络 深度可分离卷积 注意力机制 多频率小波损失
原文传递
深度学习在细胞图像自动分割中的应用与进展
8
作者 王旭 王晓燕 +3 位作者 郭英慧 蔡肖红 刘艳艳 张文凯 《计算机工程与应用》 北大核心 2026年第2期73-91,共19页
细胞分割研究对于细胞形态学分析、疾病早期诊断、药物筛选以及个性化医疗具有重要意义。细胞图像分割作为一种核心任务,旨在从复杂的生物图像中提取细胞边界和结构,支持疾病诊断和研究。因此,对细胞进行精确分割是解决细胞形态学分析... 细胞分割研究对于细胞形态学分析、疾病早期诊断、药物筛选以及个性化医疗具有重要意义。细胞图像分割作为一种核心任务,旨在从复杂的生物图像中提取细胞边界和结构,支持疾病诊断和研究。因此,对细胞进行精确分割是解决细胞形态学分析、肿瘤检测以及药物筛选等生物医学问题的首要任务。深度学习以其良好的特征提取和自适应学习能力,近年来成为细胞图像自动分割领域的重要技术手段。为推动细胞图像分割研究,在介绍常用细胞图像分割性能评价指标的基础上,梳理了CNN、U-Net、Mask R-CNN、GAN、Transformer、GNN、弱监督学习、迁移学习和视觉大模型以及混合架构在细胞图像分割中的应用,并通过对各模型优缺点进行对比分析,明确了当前研究中存在的主要问题,并展望了未来的研究方向。 展开更多
关键词 细胞分割 深度学习 TRANSFORMER 弱监督学习 混合架构
在线阅读 下载PDF
激光视觉融合的改进图优化智能轮椅建图算法
9
作者 戚开诚 李超 单新颖 《科学技术与工程》 北大核心 2026年第3期1087-1097,共11页
为了改进传统图优化建图算法在建图时环境检测能力差、特征提取不明显以及累积误差大等问题,提出一种激光与视觉融合的改进图优化建图算法。首先,标定激光雷达与深度相机,完成数据处理与融合初步消除传感器误差与数据冗余;其次,采用引... 为了改进传统图优化建图算法在建图时环境检测能力差、特征提取不明显以及累积误差大等问题,提出一种激光与视觉融合的改进图优化建图算法。首先,标定激光雷达与深度相机,完成数据处理与融合初步消除传感器误差与数据冗余;其次,采用引入距离评价函数的协方差分析(principal component analysis,PCA)方法并结合自适应阈值设定方法选取点云特征点;然后,使用IMU(inertial measurement unit)预积分技术获得初始位姿变换矩阵完成初步扫描匹配,在此基础上采用点对面ICP(iterative closest point)算法完成最终扫描匹配,得到最终位姿变换矩阵;最后,采用蒙特卡洛定位(Monte Carlo localization,MCL)方法并结合里程计数据完成回环检测,消除累积误差。使用智能轮椅在实际场景进行建图验证,结果表明提出的改进图优化算法相比于传统图优化算法有更好的环境检测能力,并且在大环境可以有效减少累积误差,相比于传统图优化算法有一定的改进与提升。 展开更多
关键词 智能轮椅 激光与视觉 图优化 特征提取 点对面ICP 蒙特卡洛定位
在线阅读 下载PDF
融合手物特征的三维手部姿态估计网络
10
作者 贾迪 王建淳 +2 位作者 韩雪峰 张藩 王骁 《中国图象图形学报》 北大核心 2026年第2期628-641,共14页
目的 手部姿态估计作为人机交互的核心感知技术,在复杂交互场景下,面临多尺度特征融合过程中信道丢失以及手物交互过程中遮挡干扰等挑战,现有方法多依赖单一特征提取策略或静态注意力机制,无法同时兼顾精度与鲁棒性。为此,提出一种融合... 目的 手部姿态估计作为人机交互的核心感知技术,在复杂交互场景下,面临多尺度特征融合过程中信道丢失以及手物交互过程中遮挡干扰等挑战,现有方法多依赖单一特征提取策略或静态注意力机制,无法同时兼顾精度与鲁棒性。为此,提出一种融合手物特征的三维手部姿态估计网络(hand object collaborative enhancement network,HOCEN),旨在通过多层次跨模态交互优化,提升遮挡场景下的手部姿态估计性能。方法 设计双流特征金字塔,通过双向跨尺度信息聚合捕获局部细节与全局语义依赖,缓解传统特征金字塔的通道信息丢失问题;给出一种基于外部注意力的动态调整模块,对提取后的手部特征进行动态注意力权重分配,抑制噪声干扰;构建双流协同注意力机制,结合手—物几何约束与语义互补特性,增强跨模态特征对齐能力;通过层级特征解码器重构精准的手部姿态参数。结果 在Dex-YCB(dexterous-YCB)与HO3D(hand-object 3D)数据集上的实验结果表明,本文方法在遮挡场景下的手部关节定位精度高于当前的主流模型,在Dex-YCB数据集上,手部姿态估计指标MPJPE(mean per joint position error)和PA-MPJPE(procrustes-aligned mean per joint position error)分别达到12.4 mm和5.4 mm,均优于SemGCN(semantic graph convolutional network)、HFL(harmonious feature learning)等先进模型,在HO3D数据集上,手部姿态估计指标Join和Mesh上分别达到9.2 mm和9.1 mm,实现了极低的误差。此外,在Dex-YCB与HO3D数据集上分别进行消融实验,进一步证明各模块在手—物协同估计指标上的独立贡献与协同增益。结论 本文提出一种基于动态手物交互特征融合的三维手部姿态估计网络架构,通过跨模态特征协同建模机制有效提升姿态估计精度。实验结果表明,本文方法在复杂交互场景下具有较高的鲁棒性与泛化能力,提出的动态特征校准与手物协同策略为提升遮挡场景下的手部姿态估计提供了全新的解决方案。 展开更多
关键词 手势姿态估计 双流金字塔特征融合 动态注意力机制 动态特征调整 手物协同增强
原文传递
基于多特征融合的车辆轨迹预测研究
11
作者 王庆荣 郝福乐 +1 位作者 朱昌锋 王俊杰 《计算机工程》 北大核心 2026年第2期331-341,共11页
针对现有模型对车辆特征提取不足和预测场景单一的问题,提出了一种在多场景下融合多特征的车辆轨迹预测模型MTF-GRU-MTSHMA。该模型由编码器模块、多特征提取模块、多特征融合模块和轨迹预测模块组成。在编码器模块,利用门控循环单元(G... 针对现有模型对车辆特征提取不足和预测场景单一的问题,提出了一种在多场景下融合多特征的车辆轨迹预测模型MTF-GRU-MTSHMA。该模型由编码器模块、多特征提取模块、多特征融合模块和轨迹预测模块组成。在编码器模块,利用门控循环单元(GRU)对车辆历史信息进行编码得到车辆的历史状态;在多特征提取模块,考虑目标车辆区域内周围车辆之间的空间关联性,通过多维度空间注意力机制挖掘周围车辆的深层特征,并引入三重注意力机制对编码后的状态向量进行特征提取;在多特征融合模块,将提取到的多种特征进行线性拼接,并输入到多特征融合网络中进行融合;在轨迹预测模块,对GRU进行改进,提出混合示教门控循环单元(MTF-GRU)并作为解码器,通过引入示教率来控制解码模式以提高解码性能,将融合后的特征输入到解码器中生成未来轨迹。在NGSIM数据集上进行的仿真实验结果表明,与最优基准模型相比,所提模型在直线道路、十字路口以及环岛道路场景下的均方根误差(RMSE)分别提高了8.16%、10.31%和8.37%,证明了所提模型的有效性。 展开更多
关键词 轨迹预测 注意力机制 多特征融合 混合示教门控循环单元 解码模式
在线阅读 下载PDF
基于多目标优化算法的多无人机海上搜救路径规划
12
作者 章文俊 廖凯 +3 位作者 孟祥坤 杨雪 周翔宇 郑怀宇 《中国航海》 北大核心 2026年第1期66-77,共12页
针对多变海洋环境与紧迫时间需求下的多无人机海上搜救任务,提出一种面向搜索效率与资源均衡的覆盖路径规划方法。首先,通过基于网格的区域分解方法将复杂的海上环境简化为可视化的规划单元,引入高斯混合模型对目标漂移分布进行先验建模... 针对多变海洋环境与紧迫时间需求下的多无人机海上搜救任务,提出一种面向搜索效率与资源均衡的覆盖路径规划方法。首先,通过基于网格的区域分解方法将复杂的海上环境简化为可视化的规划单元,引入高斯混合模型对目标漂移分布进行先验建模,生成概率分布图以引导路径搜索。其次,在多无人机覆盖路径规划中,基于改进的多目标粒子群优化算法,融合任务分配、路径安全、高优先级区域覆盖及能耗控制等多个优化目标。再次,为提升算法全局搜索能力与收敛性能,引入基于Sigmoid函数的自适应动态权重调整机制、双层精英交叉策略以及路径约束惩罚等改进策略。最后,部署三架无人机在多种形状搜救区域中开展仿真试验。结果表明:所提方法在无人机前50步目标累计发现概率、任务均衡度和路径总长度方面,分别较传统经典算法最高提升了30.27%、82.5%和1.28%,验证了所提方法在提升搜救效率和任务均衡性方面的有效性与可行性。 展开更多
关键词 海上搜救 无人机 覆盖路径规划 粒子群优化 多目标优化
在线阅读 下载PDF
考虑学习效应的灾情下应急救援点选址与建设任务调度研究
13
作者 黄基诞 戴韬 窦玉浩 《东华大学学报(自然科学版)》 北大核心 2026年第1期189-200,共12页
设立应急救援点是地震等灾情下救援受伤灾民的最有效途径之一。如何合理地选择应急救援点位置,并安排工程队快速完成建设,是灾情救治的重点与难点。在模型建立方面:首先,将选址区域抽象为无向图,其中乡村作为节点,道路作为边;其次,将节... 设立应急救援点是地震等灾情下救援受伤灾民的最有效途径之一。如何合理地选择应急救援点位置,并安排工程队快速完成建设,是灾情救治的重点与难点。在模型建立方面:首先,将选址区域抽象为无向图,其中乡村作为节点,道路作为边;其次,将节点分为三种类型,即轻灾区(低风险区)、灾区(中风险区)、重灾区(高风险区),并根据相关文献提炼了应急救援点设置的基本规则。考虑到工程队建设应急救援点存在学习效应、各点之间的路程时间以及不同类型节点的优先级约束,构建了以最大完成时间为目标的选址与建设任务联合调度优化模型。在算法设计中,设计了采用三角形扰动机制的改进鲸鱼优化算法(WOA)。数值仿真结果表明,改进算法相较于经典的鲸鱼优化算法、遗传算法有一定的优势,验证了模型与算法的有效性。 展开更多
关键词 应急救援点 学习效应 选址 三角形扰动 鲸鱼优化算法(WOA)
在线阅读 下载PDF
基于云端自进化学习的车辆轨迹预测方法
14
作者 胡钊政 王圆海 +3 位作者 黄岩军 张佳楠 冯锋 孟杰 《汽车工程》 北大核心 2026年第2期308-320,共13页
在自动驾驶技术中,轨迹预测是保障系统安全与决策效率的关键环节。然而,现有方法普遍缺乏持续学习和自我进化能力,难以实现模型性能持续提升。为此,本文提出了一种基于云端自进化学习的车辆轨迹预测优化方法,结合闭环反馈机制与自适应... 在自动驾驶技术中,轨迹预测是保障系统安全与决策效率的关键环节。然而,现有方法普遍缺乏持续学习和自我进化能力,难以实现模型性能持续提升。为此,本文提出了一种基于云端自进化学习的车辆轨迹预测优化方法,结合闭环反馈机制与自适应学习策略,提升模型的性能和泛化能力。首先,构建云支持下轨迹预测自进化学习优化框架,通过车端数据实时采集与筛选、分布式云端自动化训练与验证以及优化模型自动下发,实现模型在多轮闭环反馈中高效持续优化。其次,设计多车协同的数据增强机制,通过虚实结合实现多模式数据采集并引入师徒模式进行车端负样本数据筛选,增强训练数据的代表性。最后,提出分布式云端轨迹预测模型优化方法,搭建分布式云端平台,其中,数据云负责融合多车异构数据,训练云与校验云分别执行大规模模型训练与迭代验证,并通过车云协同机制实现模型快速迭代与自适应部署。实验结果显示,经过多轮自进化学习,模型性能持续提升,车辆轨迹预测平均位移误差和最终位移误差相对改进率最高分别达到66.1%和57.1%,该方法显著提升了轨迹预测的准确性,具备良好的自适应性和持续优化能力。 展开更多
关键词 轨迹预测 自进化学习 分布式云端 闭环反馈
在线阅读 下载PDF
基于全导波场图像目标识别的损伤检测研究
15
作者 冯侃 闫静 +4 位作者 姚雨 李容 胡旭 任梦凡 励争 《北京大学学报(自然科学版)》 北大核心 2026年第1期21-28,共8页
提出一种基于深度学习目标检测算法的导波损伤识别方法。该方法根据结构局部损伤处的波数变化特性,利用图像识别算法,对结构全域波场图像进行检测,进而实现损伤定位识别。在获取训练图像样本时,构建一系列含不同位置盲孔损伤铝板的数值... 提出一种基于深度学习目标检测算法的导波损伤识别方法。该方法根据结构局部损伤处的波数变化特性,利用图像识别算法,对结构全域波场图像进行检测,进而实现损伤定位识别。在获取训练图像样本时,构建一系列含不同位置盲孔损伤铝板的数值模型,通过多频率激励,得到结构的稳态波场图像,并利用图像增强技术扩充样本数据库。选取YOLOv5s网络进行训练,并分别对仿真模型和实验结构的时域导波场进行检测。结果表明,当导波传播经过损伤处时,导波场中存在由损伤引起的局部畸变,损伤检测框与实际结构的损伤特征一致。因此该目标检测算法能够避开激励点的图像特征,有效地抓取盲孔损伤的图像特征。 展开更多
关键词 损伤检测 导波场识别 深度学习 图像目标识别
在线阅读 下载PDF
融合Transformer与DF-GAN的文本生成图像方法
16
作者 马静 车进 孙末贤 《计算机工程》 北大核心 2026年第2期413-422,共10页
文本生成图像任务中的文本编码器不能深度挖掘文本信息,导致后续生成的图像语义不一致。针对该问题,提出一种DXC-GAN文本生成图像方法。引入Transformer系列中的XLNet(Xtra Long Network)预训练模型替换原始文本编码器,捕获大量文本的... 文本生成图像任务中的文本编码器不能深度挖掘文本信息,导致后续生成的图像语义不一致。针对该问题,提出一种DXC-GAN文本生成图像方法。引入Transformer系列中的XLNet(Xtra Long Network)预训练模型替换原始文本编码器,捕获大量文本的先验知识,实现对上下文信息的深度挖掘。添加CBAM(Convolutional Block Attention Module)注意力模块,使生成器更加关注图像中的重要信息,从而解决生成图像细节不完整和空间结构错误问题。在判别器中引入对比损失,与模型中匹配感知梯度惩罚和单向输出结合,使得相同语义图像之间更加接近,不同语义图像之间更加疏远,从而增强文本与生成图像之间的语义一致性。实验结果表明:与DF-GAN相对比,DXC-GAN在CUB数据集上的IS(Inception Score)与FID(Fréchet Inception Distance)分别提升了4.42%和17.96%;在Oxford-102数据集上,IS为3.97,FID为37.82;相较于DF-GAN,DXC-GAN在鸟类图像生成方面有效避免了多头少脚等畸形问题,同时在花卉图像生成上也显著减少了花瓣残缺等图像质量问题;此外,DXC-GAN还增强了文本与图像的对齐性,显著提升了图像的完整度和生成效果。 展开更多
关键词 生成对抗网络 文本生成图像 XLNet CBAM 对比损失
在线阅读 下载PDF
考虑概念漂移的数据驱动证据推理决策方法
17
作者 薛旻 王晓婧 +1 位作者 付超 刘卫勇 《控制与决策》 北大核心 2026年第2期481-493,共13页
面向信息时代的决策问题,数据驱动的决策方法日益成为主流.然而,数据的长期累积促使概念漂移现象不断涌现.针对动态决策环境下存在的概念漂移现象,提出一种考虑概念漂移的数据驱动证据推理决策方法.首先,考虑历史决策数据中概念漂移的... 面向信息时代的决策问题,数据驱动的决策方法日益成为主流.然而,数据的长期累积促使概念漂移现象不断涌现.针对动态决策环境下存在的概念漂移现象,提出一种考虑概念漂移的数据驱动证据推理决策方法.首先,考虑历史决策数据中概念漂移的特异性,运用早期漂移检测思想以及累计和控制图检测方法,能够有效检测决策数据中存在的细微漂移;然后,基于此,运用证据推理融合算法,提出双重集成策略进行漂移适应,先基于属性权重进行局部集结,获得局部最优决策结果,进而定义数据局部贡献度进行全局集结,以实现兼顾模型精度、动态适应性和可解释性的全局最优决策;最后,将所提出方法应用于安徽省合肥市某三甲医院超声科乳腺结节辅助诊断问题中,验证其有效性和实用性. 展开更多
关键词 数据驱动决策 证据推理 概念漂移 医疗辅助诊断
原文传递
大语言模型预训练系统关键技术综述
18
作者 高彦杰 陈跃国 《软件学报》 北大核心 2026年第1期200-229,共30页
在人工智能时代,如何高效地完成大语言模型的预训练,以满足其在扩展性、性能与稳定性方面的需求,是亟需解决的重要问题.大语言模型系统充分利用加速器和高速网卡进行并行张量计算和通信,极大地提高了模型训练的性能,这一进展伴随着一系... 在人工智能时代,如何高效地完成大语言模型的预训练,以满足其在扩展性、性能与稳定性方面的需求,是亟需解决的重要问题.大语言模型系统充分利用加速器和高速网卡进行并行张量计算和通信,极大地提高了模型训练的性能,这一进展伴随着一系列尚待解决的系统设计问题.首先,在分析大语言模型预训练过程的基础上,介绍了其训练流程与负载特点.其次,从预训练系统的扩展性、性能和可靠性角度出发,分别介绍了各类系统技术的分类、原理、研究现状及热点问题.最后,从总体层面深入分析了大型语言预训练系统面临的挑战,并展望了其未来的发展前景. 展开更多
关键词 人工智能 大语言模型 大语言模型预训练系统
在线阅读 下载PDF
人工智能方法在水利问题中的若干应用进展
19
作者 金菊良 蒋尚明 +4 位作者 周亮广 李家耀 周戎星 崔毅 吴成国 《江淮水利科技》 2026年第1期1-10,46,共11页
随着水利迈向高质量发展阶段,人工神经网络、遗传算法等人工智能定量计算方法在水利领域的应用日趋广泛,显著推动了智慧水利的深入发展。论文系统梳理了上述方法在复杂水利系统建模、优化、定性经验定量化、辩证不确定关系定量计算及随... 随着水利迈向高质量发展阶段,人工神经网络、遗传算法等人工智能定量计算方法在水利领域的应用日趋广泛,显著推动了智慧水利的深入发展。论文系统梳理了上述方法在复杂水利系统建模、优化、定性经验定量化、辩证不确定关系定量计算及随机模拟方面的应用研究进展。人工神经网络具备自适应学习系统输入输出关系的能力,适用于复杂水利系统建模;遗传算法拥有较为稳健的群体全局优化搜索能力,可处理复杂水利系统优化问题;模糊数学能将定性的专家经验概念和关系转化为隶属函数和模糊关系的定量运算,推动了水利专家经验的理论化和科学化;集对分析方法可通过同异反关系及其运算,系统描述和定量刻画水利系统辩证不确定关系及其相互联系和相互转换的复杂问题;随机模拟能够直接复现实际水利系统的复杂特征和多元可能情景。这些人工智能方法的应用和推广,有效推动了水利工程学科的智能化发展,为解决复杂水利问题提供重要技术支撑。上述人工智能方法以数据驱动为核心,直接模拟水利问题的输入-输出功能映射关系,未纳入水利问题中研究变量的作用机制,实际应用效果常缺乏稳定性。在智慧水利领域,“人工智能方法+水利专业模型”的融合应用是一个重要发展趋势,只有耦合数据驱动的人工智能方法与机理驱动的水利专业模型,才能综合运用水利问题中研究对象、研究变量、研究目标三要素的作用关系信息,进而揭示数据驱动与机理驱动相结合的人工智能方法象数理三元结构原理。 展开更多
关键词 水利系统 人工智能方法 人工神经网络 遗传算法 人工智能方法象数理三元结构原理
原文传递
融合多尺度特征与可变形注意力的机车圆弹簧缺陷检测方法
20
作者 彭珍瑞 裴志彪 《中国图象图形学报》 北大核心 2026年第2期499-511,共13页
目的 机车圆弹簧缺陷检测对机车的安全运行至关重要,受限于检测车间复杂环境的影响,机车圆弹簧缺陷检测存在漏检、误检及检测效率低下的问题,为此,提出一种基于改进RT-DETR(real-time detection Transformer)的机车圆弹簧缺陷检测方法... 目的 机车圆弹簧缺陷检测对机车的安全运行至关重要,受限于检测车间复杂环境的影响,机车圆弹簧缺陷检测存在漏检、误检及检测效率低下的问题,为此,提出一种基于改进RT-DETR(real-time detection Transformer)的机车圆弹簧缺陷检测方法。方法 首先,应用结构重参数化(structural re-parameterization,Rep)方法来改进部分卷积(partial convolution, Pconv),构建重参数化的部分卷积(Rep-Pconv)替换原始主干中的Basic block;其次,在基于注意力的尺度内特征交互(attention-based intra-scale feature interaction,AIFI)模块中引入可变形注意力(deformable attention,DA)机制修正原有结构中的多头自注意力机制(multi-head self-attention),提高模型对局部区域的关注度;最后,在颈部网络添加P2检测层,结合尺度序列特征融合(scale-sequence feature fusion,SSFF)思想与三重特征编码器(triple feature encoder,TFE)结构,构建轻量的跨尺度特征信息融合模块。结果 利用自建机车圆弹簧缺陷数据集对所提方法进行验证,相较于原始的RT-DETR算法,改进后RT-DETR算法在参数量减少54%的同时,将mAP50提升至97.2%,提高2.8%,精度以及召回率分别提升0.8%和1.2%;与YOLOv5s、YOLOv8s、YOLO11s和YOLO12s相比,所提算法在多项指标上表现出显著优势。结论 本文所改进的RT-DETR机车圆弹簧缺陷检测算法,能够有效应对机车圆弹簧在车间复杂环境检测的要求,通过实验验证并与当前主流目标检测算法进行对比分析,结果表明所提算法在实验数据集上表现优异。 展开更多
关键词 机车圆弹簧 缺陷检测 RT-DETR 部分卷积(Pconv) 结构重参数化(Rep) 可变形注意力机制 特征融合
原文传递
上一页 1 2 250 下一页 到第
使用帮助 返回顶部