期刊文献+
共找到4,720篇文章
< 1 2 236 >
每页显示 20 50 100
Content-aware robust semantic transmission of images over wireless channels with GANs
1
作者 Xuyang Chen Daquan Feng +3 位作者 Qi He Yao Sun Gaojie Chen Xiang-Gen Xia 《Digital Communications and Networks》 2025年第4期1204-1212,共9页
Semantic Communication(SemCom)can significantly reduce the transmitted data volume and keep robustness.Task-oriented SemCom of images aims to convey the implicit meaning of source messages correctly,rather than achiev... Semantic Communication(SemCom)can significantly reduce the transmitted data volume and keep robustness.Task-oriented SemCom of images aims to convey the implicit meaning of source messages correctly,rather than achieving precise bit-by-bit reconstruction.Existing image SemCom systems directly perform semantic encoding and decoding on the entire image,which has not considered the correlation between image content and downstream tasks or the adaptability to channel noise.To this end,we propose a content-aware robust SemCom framework for image transmission based on Generative Adversarial Networks(GANs).Specifically,the accurate semantics of the image are extracted by the semantic encoder,and divided into two parts for different downstream tasks:Regions of Interest(ROI)and Regions of Non-Interest(RONI).By reducing the quantization accuracy of RONI,the amount of transmitted data volume is reduced significantly.During the transmission process of semantics,a Signal-to-Noise Ratio(SNR)is randomly initialized,enabling the model to learn the average noise distribution.The experimental results demonstrate that by reducing the quantization level of RONI,transmitted data volume is reduced up to 60.53%compared to using globally consistent quantization while maintaining comparable performance to existing methods in downstream semantic segmentation tasks.Moreover,our model exhibits increased robustness with variable SNRs. 展开更多
关键词 Semantic communication gans Image transmission ROI
在线阅读 下载PDF
SLAE-Projected GANs的煤矿井下图像生成方法
2
作者 高志军 孙丽丽 +1 位作者 彭重霄 孙银焕 《黑龙江科技大学学报》 2025年第1期153-159,共7页
针对煤矿井下复杂多变的环境而无法获取高质量的煤矿井下图像的问题,提出了一种基于SLAE-Projected GANs的煤矿井下图像生成方法。采用Projected GANs网络框架,向该网络的上采样结构中注入噪声,保证模型生成图像过程中的稳定性,引入空... 针对煤矿井下复杂多变的环境而无法获取高质量的煤矿井下图像的问题,提出了一种基于SLAE-Projected GANs的煤矿井下图像生成方法。采用Projected GANs网络框架,向该网络的上采样结构中注入噪声,保证模型生成图像过程中的稳定性,引入空间注意力机制,增强模型的表征能力从而有效地提取图像的特征信息。结果表明,文中的方法生成图像的峰值信噪比、结构相似性和Frechet Inception距离分别为19.065、0.629和30.022,优于其他现有图像生成算法,能够生成更加稳定、高质量和高分辨率的煤矿井下图像,有助于图像的目标检测和图像识别。 展开更多
关键词 煤矿井下图像 图像生成 空间注意力机制 SLAE-Projected gans
在线阅读 下载PDF
Mobile Crowdsourcing Task Allocation Based on Dynamic Self-Attention GANs
3
作者 Kai Wei Song Yu Qingxian Pan 《Computers, Materials & Continua》 SCIE EI 2024年第4期607-622,共16页
Crowdsourcing technology is widely recognized for its effectiveness in task scheduling and resource allocation.While traditional methods for task allocation can help reduce costs and improve efficiency,they may encoun... Crowdsourcing technology is widely recognized for its effectiveness in task scheduling and resource allocation.While traditional methods for task allocation can help reduce costs and improve efficiency,they may encounter challenges when dealing with abnormal data flow nodes,leading to decreased allocation accuracy and efficiency.To address these issues,this study proposes a novel two-part invalid detection task allocation framework.In the first step,an anomaly detection model is developed using a dynamic self-attentive GAN to identify anomalous data.Compared to the baseline method,the model achieves an approximately 4%increase in the F1 value on the public dataset.In the second step of the framework,task allocation modeling is performed using a twopart graph matching method.This phase introduces a P-queue KM algorithm that implements a more efficient optimization strategy.The allocation efficiency is improved by approximately 23.83%compared to the baseline method.Empirical results confirm the effectiveness of the proposed framework in detecting abnormal data nodes,enhancing allocation precision,and achieving efficient allocation. 展开更多
关键词 Mobile crowdsourcing task allocation anomaly detection GAN attention mechanisms
在线阅读 下载PDF
多光谱数据融合和GANs算法的COD浓度预测 被引量:4
4
作者 陈颖 许扬眉 +5 位作者 邸远见 崔行宁 张杰 周鑫德 肖春艳 李少华 《光谱学与光谱分析》 SCIE EI CAS CSCD 北大核心 2021年第1期188-193,共6页
水体中过高浓度的有机污染物含量危害巨大,不仅会造成严重的环境污染,而且会危害人类身体健康。化学需氧量(COD)表征了水体中有机污染物的污染程度。提出了一种将紫外(UV)光谱和近红外(NIR)光谱进行多光谱数据级融合(LLDF)和特征级融合(... 水体中过高浓度的有机污染物含量危害巨大,不仅会造成严重的环境污染,而且会危害人类身体健康。化学需氧量(COD)表征了水体中有机污染物的污染程度。提出了一种将紫外(UV)光谱和近红外(NIR)光谱进行多光谱数据级融合(LLDF)和特征级融合(MLDF),进而构建基于生成对抗式网络(GANs)算法的COD浓度定量预测模型。首先按照一定的浓度梯度配制COD标准液样本,分别采集标准液的UV光谱(190~310 nm)和NIR光谱(830~2100 nm),对获取到的UV和NIR光谱数据进行一阶导数和Savitzky-Golay(S-G)平滑的预处理,消除基线漂移和干扰噪声;基于预处理过的光谱,直接进行数据级和特征级的数据融合,结合G ANs算法搭建COD浓度预测模型。并使用评价参数相关系数的平方(R^2)、预测值与真实浓度值的均方根误差(RMSEP)和预测偏差来对模型进行评价。结果表明,不论是特征级融合模型还是数据级融合模型都不够理想。分析原因可知,由于UV和NIR波段数据量不均衡,导致NIR波段掩盖掉了UV光谱的模型贡献度,让光谱融合失去意义。为了避免融合失败,拟采用归一化的方法处理多光谱数据,并讨论了标准归一化(SNV)、最大最小归一化(MMN)和矢量归一化(VN)对建模的影响。将经过归一化后的UV和NIR光谱数据再次进行融合,分别作为GANs模型的输入X,将真实测量COD值作为输出值Y,建立不同归一化方法处理后的COD浓度预测模型。建模结果显示,采用不同归一化方法对多光谱数据融合模型的影响较大,不论是数据级融合模型还是特征级融合模型的预测精度较未归一化之前有明显的提升,其中采用最大最小归一化的预测模型效果提升最为明显。与单一谱源的全波长UV波段的GANs预测模型、全波长NIR波段的GANs预测模型进行对比来验证多光谱数据融合GANs预测模型的精度,结果表明:基于UV和NIR光谱的特征级光谱融合模型的R 2为0.9947,RMSEP为0.976,比数据级融合的预测模型误差降低了52.9%,预测回收率为98.4%~103.1%,远好于其他几组,模型的泛化能力更强,预测精度也更高。与单一谱源的预测模型相比,多光谱数据融合能反应更多的水体样品的化学信息,更加全面揭示水体的污染物程度,从不同的层面上反应水体中污染物的差异,为在线监测水体中COD浓度提供一定的技术支持。 展开更多
关键词 紫外光谱 近红外光谱 数据融合 gans模型 COD浓度预测
在线阅读 下载PDF
扁椭球雨滴后向散射的Gans理论和T矩阵差异对雷达探测释义的影响 被引量:1
5
作者 郭丽君 王振会 +2 位作者 张培昌 郭学良 董慧杰 《热带气象学报》 CSCD 北大核心 2014年第4期755-762,共8页
非球形粒子的散射特性研究是双偏振雷达探测数据处理和释义的基础,非球形状同样会影响常规雷达探测数据的处理和释义。在利用雷达进行降水观测的过程中,需要考虑旋转扁椭球雨滴的散射特性。Gans理论和T矩阵法是常用于计算椭球粒子散射... 非球形粒子的散射特性研究是双偏振雷达探测数据处理和释义的基础,非球形状同样会影响常规雷达探测数据的处理和释义。在利用雷达进行降水观测的过程中,需要考虑旋转扁椭球雨滴的散射特性。Gans理论和T矩阵法是常用于计算椭球粒子散射特性的算法,但其算法差异会对雷达探测反演带来不同的结果。利用Gans理论和T矩阵法的数值计算,分析旋转扁椭球雨滴的后向散射截面,同时对比常用雷达波段(S、C、X和Ku)内两种算法的后向散射截面的相对差别,以相对差别的阈值得到Gans理论可适用于计算旋转扁椭球雨滴后向散射截面的最大等效半径和尺度参数。在常用雷达波长处对该差异造成的雷达反射率因子Zh和差反射率因子ZDR的影响进行分析。结果表明,在MP雨滴谱下,X波段处Zh的算法差异可达1.66 dBZ,在C波段处ZDR的算法差异可达0.75 dBZ,其他各波长处也有差异。 展开更多
关键词 雷达探测 gans理论 T矩阵 旋转扁椭球雨滴 后向散射截面
在线阅读 下载PDF
基于生成对抗网络(GANs)革新包装设计 被引量:2
6
作者 姚大斌 《丝网印刷》 2023年第18期50-52,共3页
深度学习模型生成对抗网络(GANs)可以在包装设计领域良好的应用,探讨如何使用生成对抗网络(GANs)来革新包装设计。阐述GANs的基本原理和工作方式,引入了一种基于GANs的新型包装设计方法,通过将GANs应用于包装设计的生成和选择中,可以实... 深度学习模型生成对抗网络(GANs)可以在包装设计领域良好的应用,探讨如何使用生成对抗网络(GANs)来革新包装设计。阐述GANs的基本原理和工作方式,引入了一种基于GANs的新型包装设计方法,通过将GANs应用于包装设计的生成和选择中,可以实现更加创新、个性化的包装设计效果。通过GANs在包装设计中的应用,可以大幅提高设计的多样性、创意性以及用户体验。 展开更多
关键词 生成对抗网络 gans 人工智能 包装设计
在线阅读 下载PDF
基于轻量化GANs的引水隧洞充水试验数据生成分析
7
作者 方卫华 张慧 夏童童 《水利信息化》 2021年第2期34-39,共6页
针对水工程现场运行环境恶劣,监测仪器损坏率高、实时性分析不及时,不具备大型计算分析设备,从而导致统计分析和建模样本容量不够的问题。基于有限稀疏样本采用轻量化生成式对抗网络(GANs)进行数据现场生成试验研究。在优化生成器和判... 针对水工程现场运行环境恶劣,监测仪器损坏率高、实时性分析不及时,不具备大型计算分析设备,从而导致统计分析和建模样本容量不够的问题。基于有限稀疏样本采用轻量化生成式对抗网络(GANs)进行数据现场生成试验研究。在优化生成器和判别网络结构及优选激活函数的基础上,搭建轻量化GANs模型,采用笔记本电脑在工程现地实现数据快速生成。KL散度及Wasserstein距离分析表明,与时间序列预测方法相比,生成数据与原始数据概率分布之间的距离最高减少33.3%。研究表明:采用基于轻量化GANs的数据生成方法可用于现场数据便捷生成,解决样本数量不够问题,为今后应用大样本建模和实测数据总体特征分析提供有效的解决方法,对进一步推广人工智能在水利工程上的应用具有重要意义。 展开更多
关键词 轻量化gans 现场数据生成 充水试验 时间序列 概率距离 引水隧洞
在线阅读 下载PDF
非均衡小样本条件下基于SAE - ACGANs的复杂 供输机构故障诊断方法 被引量:1
8
作者 闫啸家 梁伟阁 +2 位作者 张钢 佘博 田福庆 《振动与冲击》 EI CSCD 北大核心 2023年第2期89-99,共11页
非均衡和小样本问题是制约深度学习技术在复杂供输机构故障诊断领域中应用效果的关键因素。为克服传统深度学习方法难以获取小样本数据内在分布和传统非均衡数据处理方法未考虑类别信息均衡化的缺陷,提出一种基于稀疏自编码辅助分类生... 非均衡和小样本问题是制约深度学习技术在复杂供输机构故障诊断领域中应用效果的关键因素。为克服传统深度学习方法难以获取小样本数据内在分布和传统非均衡数据处理方法未考虑类别信息均衡化的缺陷,提出一种基于稀疏自编码辅助分类生成式对抗网络(sparse autoencoder auxiliary classifier generative adversarial networks,SAE-ACGANs)的复杂供输机构故障诊断方法。首先,对供输机构振动信号进行连续小波变换(continuous wavelet transform,CWT),得到反映信号时频特征的二维时频图;然后,运用稀疏编码器提取图像特征,并与类别信息融合为隐变量,强化其表征与图像所属类别相关特征的能力;生成器将融合隐变量映射为与真实样本分布类似的生成样本,从而扩展训练数据集;判别器从扩展数据集中挖掘有效的深度特征,并实现样本真伪和类别的判断;最后,通过优化后的生成器和判别器对抗学习训练机制,相互交替优化以达到纳什平衡,提高方法在非均衡小样本条件下样本生成质量和故障判定能力。复杂供输机构台架试验研究结果表明:SAE-ACGANs框架可以充分学习输入样本的内在分布和深度特征,相较于原ACGANs框架提升了判别器的性能,实现了模型收敛速度、训练精度和稳定性的提升;相较于传统非均衡数据处理算法,模型有效改善多数类分类偏好的影响,对于少数类故障样本的识别能力大幅提升。 展开更多
关键词 故障诊断 生成式对抗网络(gans) 非均衡数据 小样本 复杂供输机构
在线阅读 下载PDF
基于GANs的训练技术的改进及应用 被引量:2
9
作者 杨振 李丹 《现代信息科技》 2021年第21期102-104,共3页
GANs作为典型的生成对抗网络,具有较高的应用价值和发展潜力,文章改进了GANs网络的一些新技术(训练深度生成半质量网络dcgan),针对其中部分缺点进行了有效改善,从网络架构、特征匹配和多形差值学习技术维度进行优化,并将其与bird数据集... GANs作为典型的生成对抗网络,具有较高的应用价值和发展潜力,文章改进了GANs网络的一些新技术(训练深度生成半质量网络dcgan),针对其中部分缺点进行了有效改善,从网络架构、特征匹配和多形差值学习技术维度进行优化,并将其与bird数据集*80进行训练,得出观察结果,为未来的应用前景和环境拓展研究提供进一步可能性,以期在更多的场景中使用该算法。 展开更多
关键词 gans网络的技术改进 数据新集 网络机构 特征匹配 多形差值学习
在线阅读 下载PDF
基于改进CGANs的入侵检测方法研究 被引量:4
10
作者 彭中联 万巍 +1 位作者 荆涛 魏金侠 《信息网络安全》 CSCD 北大核心 2020年第5期47-56,共10页
近年来,机器学习算法在入侵检测系统(IDS)中的应用获得越来越多的关注。然而,传统的机器学习算法更多的依赖于已知样本,因此需要尽可能多的数据样本来对模型进行训练。遗憾地是,随着越来越多未知攻击的出现,且用于训练的攻击样本具有不... 近年来,机器学习算法在入侵检测系统(IDS)中的应用获得越来越多的关注。然而,传统的机器学习算法更多的依赖于已知样本,因此需要尽可能多的数据样本来对模型进行训练。遗憾地是,随着越来越多未知攻击的出现,且用于训练的攻击样本具有不平衡性,传统的机器学习模型会遇到瓶颈。文章提出一种将改进后的条件生成对抗网络(CGANs)与深度神经网络(DNN)相结合的入侵检测模型(CGANs-DNN),通过解决样本不平衡性问题来提高检测模型对未知攻击类型或只有少数攻击样本类型的检测率。深度神经网络(DNN)具有表征数据潜在特征的能力,而经过改进后的条件CGANs,能够通过学习已知攻击样本潜在数据特征分布,来根据指定类型生成新的攻击样本。此外,与生成对抗网络(GANs)和变分自编码器(VAE)等无监督生成模型相比,CGANsDNN经过改进后加入梯度惩罚项,在训练的稳定性上有了很大地提升。通过NSL-KDD数据集对模型进行评估,与传统算法相比CGANs-DNN不仅在整体准确率、召回率和误报率等方面有更好的性能,而且对未知攻击和只有少数样本的攻击类型具有较高的检测率。 展开更多
关键词 入侵检测 生成对抗网络 条件GAN
在线阅读 下载PDF
Novel Framework for Generating Criminals Images Based on Textual Data Using Identity GANs
11
作者 Mohamed Fathallah Mohamed Sakr Sherif Eletriby 《Computers, Materials & Continua》 SCIE EI 2023年第7期383-396,共14页
Text-to-image generation is a vital task in different fields,such as combating crime and terrorism and quickly arresting lawbreakers.For several years,due to a lack of deep learning and machine learning resources,poli... Text-to-image generation is a vital task in different fields,such as combating crime and terrorism and quickly arresting lawbreakers.For several years,due to a lack of deep learning and machine learning resources,police officials required artists to draw the face of a criminal.Traditional methods of identifying criminals are inefficient and time-consuming.This paper presented a new proposed hybrid model for converting the text into the nearest images,then ranking the produced images according to the available data.The framework contains two main steps:generation of the image using an Identity Generative Adversarial Network(IGAN)and ranking of the images according to the available data using multi-criteria decision-making based on neutrosophic theory.The IGAN has the same architecture as the classical Generative Adversarial Networks(GANs),but with different modifications,such as adding a non-linear identity block,smoothing the standard GAN loss function by using a modified loss function and label smoothing,and using mini-batch training.The model achieves efficient results in Inception Distance(FID)and inception score(IS)when compared with other architectures of GANs for generating images from text.The IGAN achieves 42.16 as FID and 14.96 as IS.When it comes to ranking the generated images using Neutrosophic,the framework also performs well in the case of missing information and missing data. 展开更多
关键词 GAN deep learning text-to-image identity GAN
在线阅读 下载PDF
GaN功率芯片走向成熟,纳微GaNSense开启智能集成时代
12
作者 迎九 《电子产品世界》 2022年第1期15-17,共3页
2021年11月,消费类GaN(氮化镓)功率解决方案供应商——纳微半导体宣布推出全球首款智能GaNFast^(TM)功率芯片,采用了GaNSense^(TM)专利技术。值此机会,《电子产品世界》采访了销售营运总监李铭钊、高级应用总监黄秀成和高级研发总监徐... 2021年11月,消费类GaN(氮化镓)功率解决方案供应商——纳微半导体宣布推出全球首款智能GaNFast^(TM)功率芯片,采用了GaNSense^(TM)专利技术。值此机会,《电子产品世界》采访了销售营运总监李铭钊、高级应用总监黄秀成和高级研发总监徐迎春。 展开更多
关键词 电子产品世界 智能集成 氮化镓 专利技术 供应商 高级应用 GAN
在线阅读 下载PDF
英飞凌完成对氮化镓系统公司GaNSystems的收购
13
《变频器世界》 2023年第10期41-41,共1页
英飞凌科技于2023年10月24日宣布完成收购氮化镓系统公司(GaNSystems,以下同)。这家总部位于加拿大渥太华的公司,为英飞凌带来了丰富的氮化镓(GaN)功率转换解决方案产品组合和领先的应用技术。已获得所有必要的监管部门审批,交易结束后,... 英飞凌科技于2023年10月24日宣布完成收购氮化镓系统公司(GaNSystems,以下同)。这家总部位于加拿大渥太华的公司,为英飞凌带来了丰富的氮化镓(GaN)功率转换解决方案产品组合和领先的应用技术。已获得所有必要的监管部门审批,交易结束后,GaNSystems已正式成为英飞凌的组成部分。 展开更多
关键词 英飞凌科技 加拿大渥太华 功率转换 产品组合 收购 GAN SYSTEMS 监管部门
在线阅读 下载PDF
The combination of Convolutional Neural Networks(CNNs)and Generative Adversarial Networks(GANs)for image super-resolution reconstruction
14
作者 Kaitian Chai 《Advances in Engineering Innovation》 2025年第6期95-99,共5页
This study developed a hybrid model combining a Convolutional Neural Network(CNN)and a Generative Adversarial Network(GAN)for the task of single-image super-resolution reconstruction.The CNN is responsible for hierarc... This study developed a hybrid model combining a Convolutional Neural Network(CNN)and a Generative Adversarial Network(GAN)for the task of single-image super-resolution reconstruction.The CNN is responsible for hierarchical image feature extraction and maintaining structural integrity,while the GAN synthesizes realistic texture details through an adver sarial training m echanism to enhance visual realism.The generator is constructed using densely connected convolutional blocks and is combined with an image block-based discriminator to evaluate the authenticity of local regions.The composite loss function is designed to integrate the root mean square error,perceptual loss,and adversarial loss of the pre-trained GTS network,balancing pixel-level accuracy and visual perceptual effect.Tests on benchmark datasets such as DIV2K and Set14 show that this model outperforms tr aditional interpolation algorithms and deep learning models in objective indicators such as PSNR and SSIM,as well as in the perception evaluation of LPIPS.Especially in complex texture restoration tasks,the model demonstrates excellent d etail restoratio n capabilities.Experimental data confirm that the adversarial training mechanism effectively solves the common problem of excessive smoothing in traditional super-resolution methods,making the reconstructed image closer to the actual optical imaging effe ct.This technology provides new ideas for scenarios that require high-fidelity reconstruction,such as medical image analysis and satellite map optimization. 展开更多
关键词 image super-resolution Convolutional Neural Network(CNN) Generative Adversarial Network(GAN) deep learning high-resolution reconstruction
在线阅读 下载PDF
Alleviating limit cycling in training GANs with an optimization technique 被引量:2
15
作者 Keke Li Liping Tang Xinmin Yang 《Science China Mathematics》 SCIE CSCD 2024年第6期1287-1316,共30页
In this paper,we undertake further investigation to alleviate the issue of limit cycling behavior in training generative adversarial networks(GANs)through the proposed predictive centripetal acceleration algorithm(PCA... In this paper,we undertake further investigation to alleviate the issue of limit cycling behavior in training generative adversarial networks(GANs)through the proposed predictive centripetal acceleration algorithm(PCAA).Specifically,we first derive the upper and lower complexity bounds of PCAA for a general bilinear game,with the last-iterate convergence rate notably improving upon previous results.Then,we combine PCAA with the adaptive moment estimation algorithm(Adam)to propose PCAA-Adam,for practical training of GANs to enhance their generalization capability.Finally,we validate the effectiveness of the proposed algorithm through experiments conducted on bilinear games,multivariate Gaussian distributions,and the CelebA dataset,respectively. 展开更多
关键词 gans general bilinear game predictive centripetal acceleration algorithm lower and upper complexity bounds PCAA-Adam
原文传递
基于深度学习的TBM运行参数预测及小样本扩充研究 被引量:1
16
作者 李晓静 张永华 +3 位作者 魏小兵 李玉龙 杨为民 王锦江 《应用基础与工程科学学报》 北大核心 2025年第3期727-742,共16页
为解决全断面隧道掘进机(TBM)运行参数预测精度不足及小样本数据困境,构建了融合深度学习与生成式对抗网络(GAN)的联合预测框架.以吉林中部城市引松供水工程TBM施工数据为研究对象,通过建立二值判别函数筛选有效数据段,结合箱型图法剔... 为解决全断面隧道掘进机(TBM)运行参数预测精度不足及小样本数据困境,构建了融合深度学习与生成式对抗网络(GAN)的联合预测框架.以吉林中部城市引松供水工程TBM施工数据为研究对象,通过建立二值判别函数筛选有效数据段,结合箱型图法剔除离群值、Z-Score归一化处理多源异构数据;建立深度神经网络(DNN)、长短期记忆网络(LSTM)、卷积神经网络(CNN)3类预测模型,采用随机梯度下降(SGD)、自适应学习率AdaGrad、Adam算法优化网络参数,搭配ReLU、Leaky ReLU等激活函数提升非线性拟合能力;引入GAN生成高质量扩充数据,与深度学习模型耦合形成GAN-DNN、GAN-LSTM、GAN-CNN预测架构.对比分析显示,GAN-CNN模型在预测精度(RMSE=0.041,R^(2)=0.912)和训练效率上优势显著.工程验证,该方法在吉林引松工程和青岛地铁工程中有效提升掘进效率18%~22%,为复杂地质条件下TBM施工参数优化提供可靠的智能化解决方案. 展开更多
关键词 隧道工程 TBM 参数预测 生成式对抗网络(GAN) 小样本扩充 深度学习 人工智能
原文传递
BSGAN-GP:类别均衡驱动的半监督图像识别模型 被引量:1
17
作者 胡静 张汝敏 连炳全 《中国图象图形学报》 北大核心 2025年第1期95-109,共15页
目的已有的深度学习图像识别模型严重依赖于大量专业人员手工标记的数据,这些专业图像标签信息难以获取,人工标记代价昂贵。实际场景中的数据集大多具有不平衡性,正负样本偏差严重导致模型在拟合时常偏向多数类,对少数类的识别精度不足... 目的已有的深度学习图像识别模型严重依赖于大量专业人员手工标记的数据,这些专业图像标签信息难以获取,人工标记代价昂贵。实际场景中的数据集大多具有不平衡性,正负样本偏差严重导致模型在拟合时常偏向多数类,对少数类的识别精度不足。这严重阻碍了深度学习在实际图像识别中的广泛应用。方法结合半监督生成式对抗网络(semi-supervised generative adversarial netowrk)提出了一种新的平衡模型架构BSGAN-GP(balancing semi-supervised generative adversarial network-gradient penalty),使得半监督生成式对抗网络的鉴别器可以公平地判别每一个类。其中,提出的类别均衡随机选择算法(class balancing random selection,CBRS)可以解决图像样本类别不均导致少数类识别准确度低的问题。将真实数据中有标签数据按类别随机选择,使得输入的有标签数据每个类别都有相同的数量,然后将训练后参数固定的生成器NetG生成每个类同等数量的假样本输入鉴别器,更新鉴别器NetD保证了鉴别器可以公平地判别所有类;同时BSGAN-GP在鉴别器损失函数中添加了一个额外的梯度惩罚项,使得模型训练更稳定。结果实验在3个主流数据集上与9种图像识别方法(包含6种半监督方法和3种全监督方法)进行了比较。为了证明对少数类的识别准确度提升,制定了3个数据集的不平衡版本。在Fashion-MNIST数据集中,相比于基线模型,总体准确率提高了3.281%,少数类识别率提升了7.14%;在MNIST数据集中,相比于基线模型,对应的4个少数类识别率提升了2.68%~7.40%;在SVHN(street view house number)数据集中,相比于基线模型,总体准确率提高了3.515%。同时也在3个数据集中进行了合成图像质量对比以验证CBRS算法的有效性,其少数类合成图像质量以及数量的提升证明了其效果。消融实验评估了所提出模块CBRS与引进模块在网络中的重要性。结论本文所提出的BSGAN-GP模型能够实现更公平的图像识别以及更高质量的合成图像结果。实验结果开放源代码地址为https://github.com/zrm0616/BSGAN-GP.git。 展开更多
关键词 深度学习 半监督学习(SSL) 生成式对抗网络(GAN) 不平衡性图像识别 梯度惩罚
原文传递
基于OD_SeGAN的断奶前仔猪实例分割方法
18
作者 李鹏 沈明霞 +4 位作者 刘龙申 陈金鑫 薛鸿翔 衡熙 孙玉文 《农业机械学报》 北大核心 2025年第5期482-491,共10页
在猪只智慧养殖中,猪只实例分割方法是实现猪只自动化检测的关键技术之一,但在实际分割场景中,存在猪只遮挡粘连等现象,易导致分割困难。针对产房中仔猪分割困难问题,本文提出一种基于YOLO v5s和GAN(Generative adversarial network)的... 在猪只智慧养殖中,猪只实例分割方法是实现猪只自动化检测的关键技术之一,但在实际分割场景中,存在猪只遮挡粘连等现象,易导致分割困难。针对产房中仔猪分割困难问题,本文提出一种基于YOLO v5s和GAN(Generative adversarial network)的实例分割模型OD_SeGAN。该方法通过目标检测算法YOLO v5s提取出仔猪目标,并输入至语义分割算法GAN实现分割,并使用空洞卷积替换GAN中的普通卷积,扩大网络感受野;其次,使用挤压-激励注意力机制模块,增强模型对仔猪全局特征的学习能力,提高模型的分割精度。实验结果表明,OD_SeGAN在测试集上IoU为88.6%,分别比YOLO v5s_Seg、Cascade_Mask_RCNN、Mask_RCNN、SOLO、Yolact高3.4、3.3、4.1、9.7、8.1个百分点。将OD_SeGAN应用于仔猪窝均质量估测任务中,测得仔猪窝均质量和仔猪像素点数之间皮尔逊相关系数为0.956。OD_SeGAN在实际生产场景中具有良好的仔猪分割性能,可为仔猪窝均质量估测等后续研究提供技术基础。 展开更多
关键词 仔猪 实例分割 注意力机制 GAN 窝均质量
在线阅读 下载PDF
基于深度图像遮挡补全的南瓜幼苗叶面积无损测量技术
19
作者 徐胜勇 胡世灵 +4 位作者 郭正晓 吴思霄 别之龙 胡甲魁 黄远 《农业机械学报》 北大核心 2025年第10期539-548,574,共11页
叶面积无损检测中,难以避免的遮挡可能导致严重的测量误差。全三维重建或单视角补全是解决遮挡问题的有效方法。提出了一种基于D-Cycle GAN网络的叶片遮挡补全及叶面积无损测量方法。设计了基于Azure Kinect相机的图像采集装置与软件,... 叶面积无损检测中,难以避免的遮挡可能导致严重的测量误差。全三维重建或单视角补全是解决遮挡问题的有效方法。提出了一种基于D-Cycle GAN网络的叶片遮挡补全及叶面积无损测量方法。设计了基于Azure Kinect相机的图像采集装置与软件,用于拍摄高分辨率的D-RGB对齐图像。运用Mask R-CNN网络对RGB图像进行实例分割获取子叶、真叶的掩膜,以此在D-RGB对齐图像中分割单个叶片的16位深度图。对Cycle GAN网络进行改进,通过添加独特的输入输出模块,使其可以补全16位的叶片深度图像。此外,采用ROI区域裁剪方法,有效避免了图像缩放时叶片尺寸过小造成的分辨率损失。补全后的叶片深度图像经点云生成、预处理及三角化后,可用于计算叶面积。实验结果显示,与人工测量、点云补全、RGB补全等方法相比,本文方法在不同生长期种苗的叶面积检测中兼具高精度(R2=0.968)和高速度(3.63 s/株),在精度和通量上达成了很好的平衡,具有最好的综合性能,具有良好的应用潜力。 展开更多
关键词 南瓜幼苗 种苗 叶面积测量 遮挡补全 深度图补全 Cycle GAN
在线阅读 下载PDF
基于多浮标空间多特征融合的海水溶解氧浓度预测
20
作者 朱奇光 申震 +4 位作者 李享 魏祯 乔文静 张淋淞 陈颖 《海洋学报》 北大核心 2025年第1期104-116,共13页
溶解氧浓度是衡量海水水质的重要指标之一。为了及时掌握海水水质变化情况,降低海水污染风险及其带来的损失,建立海洋水质参数预测机制至关重要。为此,本文提出了一种基于浮标网络时空信息融合和改进生成对抗网络(Generative Adversaria... 溶解氧浓度是衡量海水水质的重要指标之一。为了及时掌握海水水质变化情况,降低海水污染风险及其带来的损失,建立海洋水质参数预测机制至关重要。为此,本文提出了一种基于浮标网络时空信息融合和改进生成对抗网络(Generative Adversarial Networks,GAN)的海水溶解氧浓度预测模型,旨在整合监测区域内浮标网络的拓扑信息并实现浮标传感器的多特征融合。该模型利用图注意力网络(Graph Attention Mechanism,GAT)挖掘不同近邻点对目标节点的影响,计算邻接节点的权重,从而捕获浮标数据的时空特征;通过双头注意力机制与双时间尺度更新规则(Two Time-Scale Update Rule,TTUR)优化GAN预测网络及网络训练过程,改善生成对抗网络的训练速度平衡问题,提高生成器网络的拟合效果。以均方误差、均方根误差、平均绝对误差与决定系数为评价指标进行模型预测性能对比,结果表明,所提出模型的各项评价指标均优于其他模型,能够有效挖掘多浮标的空间信息,克服了传统方法在海水溶解氧浓度预测中存在的精度低、无法灵活利用历史空间数据、训练稳定性差和速度慢等不足,可为海洋水质监测及预测提供重要的技术支撑。 展开更多
关键词 溶解氧浓度预测 空间多特征融合 GAT GAN TTUR
在线阅读 下载PDF
上一页 1 2 236 下一页 到第
使用帮助 返回顶部