期刊文献+
共找到40,912篇文章
< 1 2 250 >
每页显示 20 50 100
多尺度反向校正增强和无损下采样的毫米波图像目标检测方法 被引量:1
1
作者 叶学义 韩卓 +2 位作者 蒋甜甜 王佳欣 陈华华 《电子测量与仪器学报》 北大核心 2025年第4期50-61,共12页
针对毫米波图像中隐匿目标局部信噪比低导致检测障碍的问题,提出了一种基于多尺度反向校正增强和无损下采样的检测方法。首先设计了一种多尺度反向校正特征增强模块,在提取多尺度特征的多卷积核Res2Net上融合反向校正操作,实现大感受野... 针对毫米波图像中隐匿目标局部信噪比低导致检测障碍的问题,提出了一种基于多尺度反向校正增强和无损下采样的检测方法。首先设计了一种多尺度反向校正特征增强模块,在提取多尺度特征的多卷积核Res2Net上融合反向校正操作,实现大感受野区域对区域内相关小感受野区域卷积计算的反向校正,使得深度模型不仅能够获取更细粒度的特征,而且使宏观判别性表示贯穿多个尺度的特征信息;其次,利用非跨步卷积层的SPD-Conv实现无损下采样,缓解卷积下采样导致的信息丢失;最后,采用K-means++聚类算法生成适合隐匿目标检测任务的新锚框。实验在YOLO系列中选择了各方面性能都适中的YOLOv5s作为基础框架,针对现有的两种毫米波图像数据集(阵列图像集和线扫图像集)平均精度均值(mAP)mAP@0.5分别达到了96.21%和97.97%,相较于原版YOLOv5s以及YOLO其他系列等性能有显著提升。实验结果表明,该方法在不明显增加参数量和推理时间的同时,能够有效提升深度模型的检测性能。 展开更多
关键词 隐匿目标检测 主动毫米波图像 多尺度反向校正特征增强 无损下采样 K-means++
原文传递
自适应聚类中心个数选择:一种联邦学习的隐私效用平衡方法 被引量:1
2
作者 宁博 宁一鸣 +3 位作者 杨超 周新 李冠宇 马茜 《电子与信息学报》 北大核心 2025年第2期519-529,共11页
联邦学习是一种分布式机器学习方法,它使多个设备或节点能够协作训练模型,同时保持数据的本地性。但由于联邦学习是由不同方拥有的数据集进行模型训练,敏感数据可能会被泄露。为了改善上述问题,已有相关工作在联邦学习中应用差分隐私对... 联邦学习是一种分布式机器学习方法,它使多个设备或节点能够协作训练模型,同时保持数据的本地性。但由于联邦学习是由不同方拥有的数据集进行模型训练,敏感数据可能会被泄露。为了改善上述问题,已有相关工作在联邦学习中应用差分隐私对梯度数据添加噪声。然而在采用了相应的隐私技术来降低敏感数据泄露风险的同时,模型精度和效果因为噪声大小的不同也受到了部分影响。为解决此问题,该文提出一种自适应聚类中心个数选择机制(DP-Fed-Adap),根据训练轮次和梯度的变化动态地改变聚类中心个数,使模型可以在保持相同性能水平的同时确保对敏感数据的保护。实验表明,在使用相同的隐私预算前提下DP-Fed-Adap与添加了差分隐私的联邦相似算法(FedSim)和联邦平均算法(FedAvg)相比,具有更好的模型性能和隐私保护效果。 展开更多
关键词 联邦学习 差分隐私保护 梯度聚类 自适应选择
在线阅读 下载PDF
基于空时分形的网络流量认知模型
3
作者 汤萍萍 张晖 +1 位作者 董育宁 董国青 《通信学报》 北大核心 2025年第5期258-271,共14页
为解决传统分形特征在网络流量认知精度和速度上难以兼具的问题,以分形理论为基础提出网络流量空时分离思想并创建空时分形特征,以此设计一种新型的流量认知模型——空时分形模型(SFM)。空时分形观测空间序列和时间序列,然后基于勒让德... 为解决传统分形特征在网络流量认知精度和速度上难以兼具的问题,以分形理论为基础提出网络流量空时分离思想并创建空时分形特征,以此设计一种新型的流量认知模型——空时分形模型(SFM)。空时分形观测空间序列和时间序列,然后基于勒让德变换建立向量再折射到对偶空间形成特征。空时分形的物理含义在于从不同空间和时间尺度上获得数据突发特征,而传统分形是空时分形在空间和时间维度上的特征融合,空时分形相比传统分形刻画出更多细节特征,以此进行流量认知更为精准。此外,空时分形相比传统分形更易计算,使SFM在增强认知精度的同时提升认知速度。实验数据显示,SFM的认知性能优于其他方法。 展开更多
关键词 网络流量 认知精度 认知速度 分形理论
在线阅读 下载PDF
基于模态分解和多模型融合的IES多元负荷预测
4
作者 李大华 赵志成 +1 位作者 田禾 高强 《电子测量技术》 北大核心 2025年第17期81-93,共13页
针对综合能源系统中多元负荷的随机性和高波动性所带来的挑战,现有的负荷预测方法通常难以实现高精度和稳定的预测效果。为解决这一问题,提出一种基于模态分解和多模型融合的IES短期负荷预测方法。首先,利用最大互信息系数对输入特征进... 针对综合能源系统中多元负荷的随机性和高波动性所带来的挑战,现有的负荷预测方法通常难以实现高精度和稳定的预测效果。为解决这一问题,提出一种基于模态分解和多模型融合的IES短期负荷预测方法。首先,利用最大互信息系数对输入特征进行筛选,旨在有效识别与负荷变化相关的关键因素;其次,将样本熵结合互信息为适应度函数,采用指数三角优化算法获得VMD的最优参数组合,从而实现对IES负荷的有效分解,得到多个本征模态函数;接着,采用排列熵对分解结果进行筛选,提取出反映负荷变化特征的低频和高频分量;最后,采用BiLSTM网络对低频分量进行预测,并通过BiTCN-LPTransformer-BiGRU模型对高频分量的预测,将各分量的预测结果叠加得到最终预测结果。通过对实际负荷数据验证,以春季电负荷为例,该模型的RMSE、R2、MAPE分别为118.394kW、0.991和0.351%,相较于传统模型,显著提高了预测精度,验证所提方法的有效性。 展开更多
关键词 综合能源系统 模态分解 最大互信息系数 指数三角优化算法 负荷预测
原文传递
UAT2数据链状态位图时隙分配与监视性能研究
5
作者 汤新民 汤盛家 +1 位作者 文旌宇 顾俊伟 《电子与信息学报》 北大核心 2025年第10期3549-3561,共13页
随着城市空中交通(UAM)概念的提出,为应对可预见的未来该场景下飞行器数量激增,迫切需要研究第2代通用接入收发器(UAT2)数据链的时隙分配算法以获得更大的监视容量。该文以UAT2数据链为研究对象,围绕下行报文的时隙分配管理,分析原始时... 随着城市空中交通(UAM)概念的提出,为应对可预见的未来该场景下飞行器数量激增,迫切需要研究第2代通用接入收发器(UAT2)数据链的时隙分配算法以获得更大的监视容量。该文以UAT2数据链为研究对象,围绕下行报文的时隙分配管理,分析原始时隙分配算法及局限性。根据报文特性,提出基于状态位图并引入随机漂移机制的改进时隙分配算法。此外,研究提出3种时隙数目扩充传输方案并建立监视容量计算模型,最后对各传输方案在不同时隙分配情况下的性能表现进行仿真分析。结果表明所提优化时隙分配算法在各传输方案达到最大监视容量时,较原始算法报文时隙碰撞概率减小16.14%,时隙使用率提升16.13%,较固定时间窗实时动态时隙分配算法报文时隙碰撞概率减小9.36%,时隙使用率提高10.48%,使得监视容量均有显著提升。 展开更多
关键词 UAT2数据链 时隙分配 监视容量 随机系统建模
在线阅读 下载PDF
双线性自注意力机制CAN总线入侵检测方法研究
6
作者 陈彦彬 刘桂雄 《电子测量技术》 北大核心 2025年第2期122-130,共9页
控制器局域网络(CAN)总线广泛应用于工业数据采集、车联网等领域,对其安全入侵检测非常重要。为全面提升检测方法性能,提出一种双线性自注意力机制CAN总线入侵检测方法,首先基于堆叠集成思想利用DNN、CNN和LSTM模型提取深度学习层特征;... 控制器局域网络(CAN)总线广泛应用于工业数据采集、车联网等领域,对其安全入侵检测非常重要。为全面提升检测方法性能,提出一种双线性自注意力机制CAN总线入侵检测方法,首先基于堆叠集成思想利用DNN、CNN和LSTM模型提取深度学习层特征;随后通过双线性层分别提取自注意力机制Transformer与FNet特征,再将其与深度学习层特征残差连接融合;最后通过全连接层入侵检测预测,体现高准确率、检测率和良好泛化性特点。在Car_Hacking公开数据集上实验表明,准确率、精确率、召回率、F1值和AUC值分别达0.951、0.996、0.997、0.960和0.984,且随着训练轮数增加其准确率、损失值误差分别保持在5%、10%以内,本文方法优于其他比较方法。应用于物联网实验装置评估结果显示,本文方法在异常攻击识别检测率达99.23%,对于提高测控系统安全性能具有重要推广价值。 展开更多
关键词 入侵检测系统 控制区域网络CAN 自注意力机制 FNet
原文传递
融合时间信息的解耦自注意力序列推荐方法
7
作者 唐宏 杨力鸣 +3 位作者 刘琦 陈映霏 李晓玥 祝鹤 《重庆邮电大学学报(自然科学版)》 北大核心 2025年第4期565-575,共11页
为了解决当前序列推荐方法存在的用户行为信息利用不完全以及易受噪声影响的问题,提出了一种融合时间信息的解耦自注意力序列推荐方法。针对未充分利用的与用户行为相关的时间信息,将项目特征和时间间隔融合到门控循环单元中,使模型能... 为了解决当前序列推荐方法存在的用户行为信息利用不完全以及易受噪声影响的问题,提出了一种融合时间信息的解耦自注意力序列推荐方法。针对未充分利用的与用户行为相关的时间信息,将项目特征和时间间隔融合到门控循环单元中,使模型能够捕捉时间对用户偏好的影响;针对自注意力机制所受到的秩瓶颈,设计数据增强模块,以降低秩瓶颈的影响,增强时间与位置信息的表征;针对噪声影响,引入对抗解耦模块,提高模型对噪声输入的鲁棒性。实验表明,提出的方法在各项性能指标上均有提高。 展开更多
关键词 序列推荐系统 融合时间信息 自注意力机制 数据增强模块 对抗解耦模块
在线阅读 下载PDF
基于FPGA的PCB缺陷检测系统设计与实现
8
作者 任喜伟 刘嘉玥 +1 位作者 余杰 孙悦 《仪表技术与传感器》 北大核心 2025年第3期58-64,71,共8页
为应对传统印刷电路板(PCB)缺陷检测方法存在的检测速度慢、准确率低等问题,设计了基于FPGA的PCB缺陷检测系统。系统采用CMOS OV5640传感器采集PCB图像数据,并对采集的图像进行灰度化、滤波及边缘检测等图像预处理。提出了改进的灰度拉... 为应对传统印刷电路板(PCB)缺陷检测方法存在的检测速度慢、准确率低等问题,设计了基于FPGA的PCB缺陷检测系统。系统采用CMOS OV5640传感器采集PCB图像数据,并对采集的图像进行灰度化、滤波及边缘检测等图像预处理。提出了改进的灰度拉伸算法,通过整体线性拉伸灰度值,图像对比度显著增强;提出了改进的边缘检测算法,扩展传统Sobel边缘检测2算子至8算子边缘检测,提高图像边缘信息的清晰度,增强图像分析与识别的准确性。系统将预处理后的PCB图像和标准模板图像存储在SDRAM中,采用背景差分比算法进行缺陷检测,并选用EP4CE10F17C8N芯片实现系统各模块的FPGA设计。实验结果表明:改进的检测系统在检测精度方面较其他方法显著提升,且相比于PCB缺陷检测软件,FPGA硬件处理速度明显提高。 展开更多
关键词 图像处理 FPGA 背景差分算法 缺陷检测
在线阅读 下载PDF
面向LVDS传输误码的时钟恢复改进研究
9
作者 王洋 张会新 闫文璇 《舰船电子工程》 2025年第4期120-123,153,共5页
针对LVDS在长距离高速链路传输过程中出现的信号衰减过大、累积抖动严重以及数据误码率高等问题分别从硬件设计及逻辑设计提出优化设计。在硬件设计方面LVDS接收端添加差分输出时钟恢复器,可有效恢复信号经长距离传输而产生的累积抖动... 针对LVDS在长距离高速链路传输过程中出现的信号衰减过大、累积抖动严重以及数据误码率高等问题分别从硬件设计及逻辑设计提出优化设计。在硬件设计方面LVDS接收端添加差分输出时钟恢复器,可有效恢复信号经长距离传输而产生的累积抖动和衰减。在逻辑设计中采用8B/10B编码,不仅维持了数据在平衡双绞线的直流平衡而且实现了DC补偿使得信号保持长时间稳定。经实验验证,改进后的LVDS串行传输能够以400 Mb/s的速率更稳定地在100 m的平衡双绞线上进行无误码传输。这将为实现长距离高可靠性数据传输提供了可行的解决方案。 展开更多
关键词 LVDS 长距离传输 累积抖动 时钟恢复 8B/10B编码
在线阅读 下载PDF
战术数据链高精度时频同步技术
10
作者 康荣雷 班亚龙 +1 位作者 王翔 常军 《舰船电子工程》 2025年第3期72-76,共5页
论文为解决战术数据链网络内信号级协同作战对高精度时频的需求难题,设计了本地-绝对-相对三种同步运行的时间系统,用以统筹管理战术数据链网络内的时频同步系统。该技术采用北斗/数据链/时钟源的融合架构,通过构建时频同步卡尔曼滤波模... 论文为解决战术数据链网络内信号级协同作战对高精度时频的需求难题,设计了本地-绝对-相对三种同步运行的时间系统,用以统筹管理战术数据链网络内的时频同步系统。该技术采用北斗/数据链/时钟源的融合架构,通过构建时频同步卡尔曼滤波模型,联合处理北斗差分授时与数据链往返计时(Round Trip Timing,RTT)授时结果,实现数据链节点间的高精度时间和频率同步。仿真结果表明,在北斗可用时的相对时间同步精度可优于0.33 ns,频率同步精度优于2.3E-10,绝对时间同步精度优于2.3 ns;在北斗拒止时的时间同步精度优于3.58 ns,频率同步精度优于2.6E-9。 展开更多
关键词 战术数据链 时频同步 北斗拒止 卡尔曼滤波
在线阅读 下载PDF
基于人工智能的大学生学业预警模式研究 被引量:3
11
作者 肖明 余琳 +3 位作者 肖毅 陈锟 周东波 赵亮 《现代电子技术》 北大核心 2025年第8期155-163,共9页
人工智能如何赋能人才培养是新一代信息技术与教育深度融合的重要研究内容,赋能大学生的学业预警是及时发现大学生成长问题、确保其成才的重要手段。为此,提出一种基于人工智能的大学生学业预警模式,以某高校近1 000名大一新生为研究对... 人工智能如何赋能人才培养是新一代信息技术与教育深度融合的重要研究内容,赋能大学生的学业预警是及时发现大学生成长问题、确保其成才的重要手段。为此,提出一种基于人工智能的大学生学业预警模式,以某高校近1 000名大一新生为研究对象,在遵循隐私保护、防止个人隐私泄露的前提下,对所采集的校园网络大数据、上网行为数据、教务数据等进行脱敏处理,运用人工智能的感知、分析与反馈技术来探究大学生的上网等行为与其学业的相关性,构建学业预警模型。结果表明,所研究的学业预警模型能够较好地预测学生学业风险,有助于实现规模化学生群体下的个性化人才培养模式探索,可为人工智能技术的教育教学落地应用建立有效途径。 展开更多
关键词 人工智能赋能 教育大数据 上网行为 学业预警 预警模型 隐私保护
在线阅读 下载PDF
基于三维自组织映射的视频帧间预测编码算法
12
作者 覃远年 陈超群 《中国高新科技》 2025年第1期126-127,133,共3页
文章针对视频帧间编码中运动估计和运动补偿(ME+MC)算法的不足,提出一种基于三维自组织映射的帧间预测编码方法。该方法将FS-3DSOM算法用于运动模式库的训练,通过运动模式库和运动估计算法分别获取最佳匹配块,选择率失真代价最低的匹配... 文章针对视频帧间编码中运动估计和运动补偿(ME+MC)算法的不足,提出一种基于三维自组织映射的帧间预测编码方法。该方法将FS-3DSOM算法用于运动模式库的训练,通过运动模式库和运动估计算法分别获取最佳匹配块,选择率失真代价最低的匹配块作为预测块,从而提高帧间预测准确度。同时,为了减小运动模式库的匹配误差,采用了基于聚类的运动模式库构造方法。实验结果表明,在相同码率的情况下,基于三维自组织映射的帧间预测编码方法比传统方法具有更好的编码性能。 展开更多
关键词 自组织映射 视频编码 帧间预测 运动估计 运动补偿
在线阅读 下载PDF
基于随机森林的图书云存储传输密文快速检索方法
13
作者 贾娟 《电子设计工程》 2025年第12期25-30,共6页
针对现有图书云存储传输密文检索方法存在检索速度慢、精度低的问题,采用随机森林与K均值聚类算法相结合的方式,以实现图书云存储传输密文的快速检索。通过Matlab仿真实验,在数据集大小为120、决策树(min_sampiles_split)设为2的条件下... 针对现有图书云存储传输密文检索方法存在检索速度慢、精度低的问题,采用随机森林与K均值聚类算法相结合的方式,以实现图书云存储传输密文的快速检索。通过Matlab仿真实验,在数据集大小为120、决策树(min_sampiles_split)设为2的条件下,该算法的检索误差低至0.143 7,精准率-召回率曲线线下面积达0.987 3。所提图书云存储密文检索方法平均检索时间仅15.7 s,较高级加密标准(AES)算法的36.8 s与数据加密标准(DES)算法的85.3 s大幅缩短。此外,在十六进制编码(HEX)、网络局域网管理(NTLM)和散列消息鉴别码(HMAC)三种不同类型密文检索中,精度分别达到0.98、0.99和1。结果表明,该检索方法显著提升了密文检索速度与精度,能更好地满足云存储传输密文的检索需求。 展开更多
关键词 随机森林 K均值聚类 云存储 密文传输 数据检索
在线阅读 下载PDF
5G专网场景下的DPI部署方案研究
14
作者 文涛 谭蓓 《邮电设计技术》 2025年第2期37-41,共5页
随着5G专网的日益普及,越来越多的行业客户提出了5G专网场景下的DPI部署需求,期望通过部署DPI实现更精准的网络维护优化以及终端业务控制。在分析DPI架构及5G专网架构的基础上,结合5G专网客户的典型DPI需求,提出了5G专网场景下的DPI部... 随着5G专网的日益普及,越来越多的行业客户提出了5G专网场景下的DPI部署需求,期望通过部署DPI实现更精准的网络维护优化以及终端业务控制。在分析DPI架构及5G专网架构的基础上,结合5G专网客户的典型DPI需求,提出了5G专网场景下的DPI部署建议。 展开更多
关键词 5G专网 DPI部署 XDR 业务识别 策略控制
在线阅读 下载PDF
APN6技术及应用研究
15
作者 张桂玉 王路 +2 位作者 白露莹 邓木明 岳一凡 《邮电设计技术》 2025年第7期77-82,共6页
APN6是一种新的网络架构,能够有效感知关键应用(组)、关键用户(组)及其对网络的性能需求,将极大地丰富云网服务维度、精细化云网运营,为用户提供更加精细的网络服务。分析了APN6背景需求、关键技术、典型应用场景、技术优势和不足,并提... APN6是一种新的网络架构,能够有效感知关键应用(组)、关键用户(组)及其对网络的性能需求,将极大地丰富云网服务维度、精细化云网运营,为用户提供更加精细的网络服务。分析了APN6背景需求、关键技术、典型应用场景、技术优势和不足,并提出发展策略,以推动IPv6+技术的落地普及。 展开更多
关键词 APN6 IPv6+ SRv6 应用侧方案 网络侧方案
在线阅读 下载PDF
机器学习模型提升航班延误预测性能的研究
16
作者 田亚楠 Adil Khan 刘菲 《电子设计工程》 2025年第15期120-125,130,共7页
航班延误预测对于航空公司和机场提升运营效率、控制成本至关重要。监督学习模型已应用于航班延误预测,但其准确度有限。为提升航班延误预测的准确性,该文基于机器学习算法,采用标签编码和支持向量机(Support Vector Machine,SVM)构建... 航班延误预测对于航空公司和机场提升运营效率、控制成本至关重要。监督学习模型已应用于航班延误预测,但其准确度有限。为提升航班延误预测的准确性,该文基于机器学习算法,采用标签编码和支持向量机(Support Vector Machine,SVM)构建航班延误预测(Airline Delay Prediction,ADP)模型。使用巴基斯坦国际航空公司2022至2023年的航班数据作为数据集,用于评估不同因素对航班延误和运营效率的影响。研究通过准确率和混淆矩阵验证所提出的ADP模型的性能。仿真结果显示,所提ADP模型的准确率达到98%,分别高出逻辑回归(LR)11.25%、决策树(DT)8.69%、K近邻(KNN)11.39%和朴素贝叶斯(NB)13.25%,充分证明了所提方法的优越性。 展开更多
关键词 航班规划 航班延误 机器学习 SVM 标签编码
在线阅读 下载PDF
基于Unity3D的大学生宿舍消防安全教育游戏设计与实现
17
作者 孙丽娜 李天雨 +3 位作者 邓雨婕 李世浩 黄应平 赵鸿宇 《电子设计工程》 2025年第5期166-171,共6页
随着虚拟现实技术的发展,游戏与教育相融合已成为一种新的教学方法。文中以Unity3D游戏引擎为核心开发平台,结合宿舍消防安全教学内容,设计并实现了一款基于Unity3D的大学生宿舍消防安全教育游戏。游戏包括消防知识、火灾扑救、逃生系... 随着虚拟现实技术的发展,游戏与教育相融合已成为一种新的教学方法。文中以Unity3D游戏引擎为核心开发平台,结合宿舍消防安全教学内容,设计并实现了一款基于Unity3D的大学生宿舍消防安全教育游戏。游戏包括消防知识、火灾扑救、逃生系统三个模块,涵盖了消防知识答题、违禁物品随机生成、灭火器操作交互、生命值机制、人机任务交互、人物动作控制等技术。实践结果表明,该游戏不仅具有良好的交互性能和临场感游戏体验,还增强了学生的宿舍消防安全意识和火灾应急处理能力,具有较为广阔的应用前景。 展开更多
关键词 UNITY3D 宿舍消防安全 教育游戏 游戏化学习
在线阅读 下载PDF
一种基于AI大数据的用户满意度预测算法
18
作者 周文红 孙军亮 +2 位作者 许妍青 杨嘉忱 孙凡晰 《移动信息》 2025年第2期199-201,共3页
随着大数据技术的发展和人工智能应用的广泛化,用户满意度预测已成为运营商解决信号差和网络质量问题,减少用户投诉并获取竞争优势的关键手段.文中提出了一种结合机器学习技术的用户满意度预测算法,通过分析用户行为数据和反馈,构建了... 随着大数据技术的发展和人工智能应用的广泛化,用户满意度预测已成为运营商解决信号差和网络质量问题,减少用户投诉并获取竞争优势的关键手段.文中提出了一种结合机器学习技术的用户满意度预测算法,通过分析用户行为数据和反馈,构建了一个高精度的预测模型.通过实验验证,该模型在多个数据集上表现出优越的预测准确性和良好的泛化能力.该算法的实现,对于理解用户需求和改进服务质量具有重要意义. 展开更多
关键词 大数据 用户满意度 预测算法 机器学习
在线阅读 下载PDF
基于Ray框架的AI工业检测SaaS平台研究
19
作者 陈亚峰 徐玉龙 +1 位作者 张黎明 刘江锋 《邮电设计技术》 2025年第8期69-74,共6页
介绍了AI工业检测SaaS平台的设计背景及设计目标,提出了基于AI图像检测原子能力和检测流程编排进行图像集中化处理的检测模式;详细阐述了AI工业检测平台的工作流程;分析了平台实现方案中涉及的图像文件共享访问、大规模异构GPU集群下资... 介绍了AI工业检测SaaS平台的设计背景及设计目标,提出了基于AI图像检测原子能力和检测流程编排进行图像集中化处理的检测模式;详细阐述了AI工业检测平台的工作流程;分析了平台实现方案中涉及的图像文件共享访问、大规模异构GPU集群下资源调度等技术问题,并提供了使用Ray开源框架解决上述问题的实现方案。 展开更多
关键词 RAY AI 工业检测 图像处理
在线阅读 下载PDF
基于多模态融合Transformer的视听广义零次学习方法 被引量:1
20
作者 杨静 李小勇 +3 位作者 阮小利 李少波 唐向红 徐计 《电子与信息学报》 北大核心 2025年第7期2375-2384,共10页
视听零次学习需要理解音频和视觉信息之间的关系,以便能够推理未见过的类别。尽管领域做出了许多努力并取得了重大进展,但往往专注于学习强大的表征,从而忽视了音频和视频之间的依赖关系和输出分布与目标分布不一致的问题。因此,该文提... 视听零次学习需要理解音频和视觉信息之间的关系,以便能够推理未见过的类别。尽管领域做出了许多努力并取得了重大进展,但往往专注于学习强大的表征,从而忽视了音频和视频之间的依赖关系和输出分布与目标分布不一致的问题。因此,该文提出了基于Transformer的视听广义零次学习方法。具体来说,使用注意力机制来学习数据的内部信息,增强不同模态的信息交互,以捕捉视听数据之间的语义一致性;为了度量不同概率分布之间的差异和类别之间的一致性,引入了Kullback-Leibler(KL)散度和余弦相似度损失。为了评估所提方法,在VGGSound-GZSL^(cls),UCF-GZSL^(cls)和ActivityNet-GZSL^(cls)3个基准数据集上进行测试。大量的实验结果表明,所提方法在3个数据集上都取得了最先进的性能。 展开更多
关键词 视听零次学习 视频分类 注意力机制 KL散度
在线阅读 下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部