期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
基于改进StyleGAN2的织物瑕疵图像生成算法
1
作者 牛奎 向忠 《软件工程》 2025年第11期28-32,共5页
纺织工业验布环节自动检测是大势所趋,受工厂实际生产状况导致的异类瑕疵样本不均问题一直限制织物瑕疵检测算法的泛化应用。因此,提出基于改进StyleGAN2的织物瑕疵图像生成算法。在原算法架构上引入多尺度特征融合模块,帮助网络学习到... 纺织工业验布环节自动检测是大势所趋,受工厂实际生产状况导致的异类瑕疵样本不均问题一直限制织物瑕疵检测算法的泛化应用。因此,提出基于改进StyleGAN2的织物瑕疵图像生成算法。在原算法架构上引入多尺度特征融合模块,帮助网络学习到关键特征;提出混合注意力机制,有效提取纹理和边缘特征信息;提出特征匹配和风格损失函数,增加细节特征的多样性和生成图像的保真性。所生成的织物瑕疵图像相比其他网络模型的图像评价指标FID(Fréchet Inception Distance)、峰值信噪比PSNR(Peak Signal-to-Noise Ratio)和感知图像损失LPIPS(Learned Perceptral Image Patch Similarity)分别至少提升36.35%、7.00%、62.50%,因此,进行图像生成可实现数据集的样本增强,进而提升检测算法的整体泛化性应用。 展开更多
关键词 stylegan2 图像生成 织物瑕疵 生成对抗网络
在线阅读 下载PDF
基于StyleGAN2-ADA和改进YOLO v7的葡萄叶片早期病害检测方法 被引量:37
2
作者 张林鍹 巴音塔娜 曾庆松 《农业机械学报》 EI CAS CSCD 北大核心 2024年第1期241-252,共12页
为实现葡萄早期病害的快速准确识别,针对葡萄病害的相似表型症状识别率低及小病斑检测困难的问题,以葡萄黑腐病和黑麻疹病为研究对象,提出了一种基于自适应鉴别器增强的样式生成对抗网络与改进的YOLO v7相结合的葡萄黑腐病和黑麻疹病的... 为实现葡萄早期病害的快速准确识别,针对葡萄病害的相似表型症状识别率低及小病斑检测困难的问题,以葡萄黑腐病和黑麻疹病为研究对象,提出了一种基于自适应鉴别器增强的样式生成对抗网络与改进的YOLO v7相结合的葡萄黑腐病和黑麻疹病的病斑检测方法。通过自适应鉴别器增强的样式生成对抗网络和拉普拉斯滤波器的方差扩充葡萄病害数据。采用MSRCP算法进行图像增强,改善光照环境凸显病斑特征。以YOLO v7网络框架为基础,将BiFormer注意力机制嵌入特征提取网络,强化目标区域的关键特征;采用BiFPN代替PA-FPN,更好地实现低层细节特征与高层语义信息融合,以同时降低计算复杂度;在YOLO v7的检测头部分嵌入SPD模块,以提高模型对低分辨率图像的检测性能;并采用CIoU与NWD损失函数组合对损失函数重新定义,实现对小目标快速、准确识别。实验结果表明,该方法病斑检测精确率达到94.1%,相比原始算法提升5.7个百分点,与Faster R-CNN、YOLO v3-SPP和YOLO v5x等模型相比分别提高3.3、3.8、4.4个百分点,能够实现葡萄早期病害快速准确识别,对于保障葡萄产业发展具有重要意义。 展开更多
关键词 葡萄 病害识别 stylegan2-ADA 目标检测 自注意力机制 YOLO v7
在线阅读 下载PDF
基于深度学习的StyleGAN2合成人脸识别系统
3
作者 向志华 高庆 马楚涛 《信息技术与信息化》 2021年第6期254-257,共4页
StyleGAN2合成人脸识别系统专门针对StyleGAN2合成人脸进行识别,可以识别出人脸图片是否由StyleGAN2合成而来。StyleGAN2合成人脸识别系统基于C/S(客服端/服务器)架构,系统的核心部分为部署在服务器上的识别模型,该模型的隐含层网络结... StyleGAN2合成人脸识别系统专门针对StyleGAN2合成人脸进行识别,可以识别出人脸图片是否由StyleGAN2合成而来。StyleGAN2合成人脸识别系统基于C/S(客服端/服务器)架构,系统的核心部分为部署在服务器上的识别模型,该模型的隐含层网络结构为深度学习中的卷积神经网络。识别模型经大数据的支撑下训练数次而得,训练后的模型准确率达到97.22%,交叉验证后的模型准确率达到98.33%,由此验证了基于深度学习可以识别出StyleGAN2合成人脸图片。 展开更多
关键词 stylegan2合成人脸 深度学习 卷积神经网络
在线阅读 下载PDF
面向小样本苗绣图像的生成与识别研究
4
作者 吴菁 杨邦勤 +2 位作者 张银建 李明珠 陈妍 《现代信息科技》 2025年第2期24-32,共9页
为了解决苗绣图像样本量不足以及识别精度较低的问题,提出了一个新颖的样式生成对抗网络(StyleGAN2)结合高效通道注意力机制(ECA)优化的残差神经网络(ResNet50)苗绣图像分类模型。首先,利用StyleGAN2对原始苗绣数据集进行训练和生成,以... 为了解决苗绣图像样本量不足以及识别精度较低的问题,提出了一个新颖的样式生成对抗网络(StyleGAN2)结合高效通道注意力机制(ECA)优化的残差神经网络(ResNet50)苗绣图像分类模型。首先,利用StyleGAN2对原始苗绣数据集进行训练和生成,以扩充小样本数据集。接着,在ResNet50骨干网络中融入ECA注意力机制,增强了模型的特征提取能力。最终,结合StyleGAN2和ECA优化后的ResNet50创建了新的StyleGAN2-ECA-ResNet50模型,用于小样本苗绣图像的识别。实验结果显示,该方法在测试集上的准确率达到了89.29%,较传统的ResNet50模型提高了5.87%,并且在性能上超过了多个先进的深度学习模型。 展开更多
关键词 苗绣 小样本图像分类 数据增强 stylegan2 ECA
在线阅读 下载PDF
基于数据扩增的轻量化布匹缺陷检测系统设计
5
作者 张平均 苏杰义 +2 位作者 赖礼泮 蔡俊杰 马振江 《闽江学院学报》 2025年第5期54-62,共9页
针对传统布匹缺陷样本数据少、检测效率低以及深度学习模型泛化能力不足等问题,提出一种融合StyleGAN2数据增强与改进YOLOv10n的布匹缺陷检测方案。基于StyleGAN2的数据扩增模块通过权重调制与解调机制等改进策略生成高逼真缺陷样本,缓... 针对传统布匹缺陷样本数据少、检测效率低以及深度学习模型泛化能力不足等问题,提出一种融合StyleGAN2数据增强与改进YOLOv10n的布匹缺陷检测方案。基于StyleGAN2的数据扩增模块通过权重调制与解调机制等改进策略生成高逼真缺陷样本,缓解数据不平衡与模式崩溃问题。改进YOLOv10n检测模块引入GSConv混合卷积、C2f-Faster与C3f-Faster通道子集卷积模块,优化特征提取效率并降低计算复杂度。此外,该系统还集成工业相机与均匀照明设备以实现实时图像采集,同时搭配基于PyQt5的图形化用户界面,可支持实验检测及其他功能。测试表明,在6类布匹缺陷检测中mAP@0.5达90.1%,较原始模型提升13.6%,参数数量减少3.70%,GFLOPs降低7.14%。测试结果兼顾检测精度、速度与轻量化,为工业布匹质量检测提供了高效解决方案。 展开更多
关键词 布匹缺陷检测 数据增强 stylegan2 YOLOv10n 轻量化模型
在线阅读 下载PDF
基于深层特征嵌入的无人机图像高分辨率重建
6
作者 吴晓鹏 王朝 张方锐 《北京测绘》 2025年第7期960-966,共7页
无人机图像采集过程中易受外界环境和自身系统影响,导致图像出现清晰度低、细节信息模糊,以及特征退化明显,难以进行目标识别等问题。因此,提出基于深层特征嵌入的无人机图像高分辨率重建方法。该方法首先利用基于样式的生成对抗网络第... 无人机图像采集过程中易受外界环境和自身系统影响,导致图像出现清晰度低、细节信息模糊,以及特征退化明显,难以进行目标识别等问题。因此,提出基于深层特征嵌入的无人机图像高分辨率重建方法。该方法首先利用基于样式的生成对抗网络第二版(StyleGAN2)作为特征嵌入空间,将无人机图像输入网络,通过逐层提取、控制和训练图像特征,优化并约束图像边缘和细节特征,从而生成高分辨率重建图像。同时,引入损失函数以保留更多原始图像纹理细节信息。实验结果表明,该方法在确保Q相关系数接近最优值的前提下,有效实现了无人机图像的高分辨率重建。 展开更多
关键词 深层特征嵌入 无人机图像 高分辨率重建 基于样式的生成对抗网络第二版(stylegan2) 纹理细节
在线阅读 下载PDF
双重对比学习框架下近红外-可见光人脸图像转换方法 被引量:11
7
作者 孙锐 单晓全 +2 位作者 孙琦景 韩春军 张旭东 《光电工程》 CAS CSCD 北大核心 2022年第4期26-38,共13页
随着可见光-红外双模相机在视频监控中的广泛应用,跨模态人脸识别也成为计算机视觉领域的研究热点,而将近红外域人脸图像转化为可见光域人脸图像是跨模态人脸识别中的关键问题,在刑侦安防领域有着重要研究价值。针对近红外人脸图像在着... 随着可见光-红外双模相机在视频监控中的广泛应用,跨模态人脸识别也成为计算机视觉领域的研究热点,而将近红外域人脸图像转化为可见光域人脸图像是跨模态人脸识别中的关键问题,在刑侦安防领域有着重要研究价值。针对近红外人脸图像在着色过程中面部轮廓易被扭曲、肤色还原不真实等问题,本文提出了一种双重对比学习框架下的近红外-可见光人脸图像转换方法。该方法构建了基于StyleGAN2结构的生成器网络并将其嵌入到双重对比学习框架下,利用双向的对比学习挖掘人脸图像的精细化表征。同时,本文设计了一种面部边缘增强损失,利用从源域图像中提取的面部边缘信息进一步强化生成人脸图像中的面部细节、提高人脸图像的视觉效果。最后,在NIR-VIS Sx1和NIR-VIS Sx2数据集上的实验表明,与近期的主流方法相比,本文方法生成的可见光人脸图像更加贴近真实图像,能够更好地还原人脸图像的面部边缘细节和肤色信息。 展开更多
关键词 跨模态人脸识别 人脸图像转换 对比学习 stylegan2
在线阅读 下载PDF
基于改进YOLOX的地下排水管道缺陷识别算法 被引量:14
8
作者 陆绮荣 丁昕 梁雅雯 《电子测量技术》 北大核心 2022年第21期161-168,共8页
CCTV检测技术在地下排水管道缺陷检测被广泛应用,但CCTV收集的缺陷图像需要依赖专业的检测人员进行检测识别,结果具有一定主观性且耗费大量时间。为了实现地下排水管道缺陷检测识别自动化,提出了一种基于改进YOLOX的地下排水管道缺陷识... CCTV检测技术在地下排水管道缺陷检测被广泛应用,但CCTV收集的缺陷图像需要依赖专业的检测人员进行检测识别,结果具有一定主观性且耗费大量时间。为了实现地下排水管道缺陷检测识别自动化,提出了一种基于改进YOLOX的地下排水管道缺陷识别方法。首先针对数据集过少的问题,通过StyleGAN2对原始图像进行预处理,生成多缺陷图像。其次,为了提高检测精度,对YOLOX的特征融合层进行改进,借鉴空洞空间卷积池化金字塔思想并引入SE注意力机制解决顶层特征仅包含单尺度特征且不与其它特征图进行融合的问题,同时设计了一种基于权重的特征融合模块,解决不同特征层融合带来的特征混叠问题。最后,将YOLOX边界损失函数改为CIOU,提高目标检测框回归的效率。实验结果表明,所提的算法能够很好对沉积、渗漏、树根入侵、裂缝和错口5种缺陷进行识别,mAP达到68.76%,相比原始YOLOX算法提升了1.62%。 展开更多
关键词 地下排水管道 YOLOX 缺陷识别 stylegan2 特征融合 目标检测
原文传递
小样本药用玻璃瓶缺陷生成方法及应用
9
作者 陈宏彩 程煜 任亚恒 《包装工程》 CAS 北大核心 2024年第9期135-140,共6页
目的为了克服药包玻璃瓶缺陷样本不足带来的缺陷检测模型精度不准的问题,提出改进StyleGAN2-ADA的缺陷样本生成方法,提升模型鲁棒性。方法首先,基于StyleGAN2-ADA算法,在无缺陷图像集上训练网络模型并作为骨干。其次,在骨干网络上添加... 目的为了克服药包玻璃瓶缺陷样本不足带来的缺陷检测模型精度不准的问题,提出改进StyleGAN2-ADA的缺陷样本生成方法,提升模型鲁棒性。方法首先,基于StyleGAN2-ADA算法,在无缺陷图像集上训练网络模型并作为骨干。其次,在骨干网络上添加缺陷感知残差块,生成缺陷掩码,在少量的缺陷图像数据集上训练网络模型操纵掩码区域的特征,模拟缺陷图像生成过程,合成缺陷图像。最后,采用YOLOv7检测网络验证该样本生成方法的效果。结果实验结果表明,该方法在大量正常图像和少量缺陷图像基础上生成逼真且多样性的缺陷图像,应用该缺陷样本合成方法丰富数据集后,西林瓶缺陷检测平均准确率(mAP)达到97.3%,较原始数据集合和StyleGAN2-ADA算法分别提高了33.1%和4.1%。结论该图像生成方法可以在少量缺陷样本下生成高质量的缺陷图像,优化不均衡数据集,增强模型训练的稳定性,提高药用玻璃包装产品的质量和合格率。 展开更多
关键词 药包玻璃瓶 图像生成 stylegan2-ADA 缺陷检测 YOLOv7
在线阅读 下载PDF
基于YOLO v7-RA的火龙果品质与成熟度双指标检测方法 被引量:8
10
作者 徐婷婷 宋亮 +1 位作者 卢学鹤 张海东 《农业机械学报》 EI CAS CSCD 北大核心 2024年第7期405-414,共10页
已有火龙果检测方法仅针对单一性能指标,难以满足农业真实场景的需要,为此提出了一种精准高效的火龙果品质与成熟度双指标检测方法。首先,利用自适应鉴别器增强的样式生成对抗网络扩充火龙果图像,建立复杂环境火龙果数据集。采用伽马变... 已有火龙果检测方法仅针对单一性能指标,难以满足农业真实场景的需要,为此提出了一种精准高效的火龙果品质与成熟度双指标检测方法。首先,利用自适应鉴别器增强的样式生成对抗网络扩充火龙果图像,建立复杂环境火龙果数据集。采用伽马变换进行图像增强,凸显火龙果特征,降低光照环境的影响。其次,提出了YOLO v7-RA模型。通过设计ELAN_R3替代ELAN(Efficient layer aggregation network)模块,减少主干网络对重复特征的提取,增强模型对细粒度特征关注度,提高双指标检测准确率。融入混合注意力机制(Mixture of self-attention and convolution,ACmix),增强模型对特征的提取和整合能力,降低杂乱背景信息干扰。最后,通过实验验证了YOLO v7-RA模型的检测性能。实验结果表明,该方法精准率为97.4%,召回率为97.7%,mAP_(0.5)为96.2%,FSP为74 f/s,实现了检测精度与检测速度的均衡。即使在遮挡情况下,YOLO v7-RA模型检测精准率仍达到91.4%,具有较好泛化能力,能够为火龙果智能化采摘的发展提供技术支持。 展开更多
关键词 火龙果 深度学习 品质 成熟度 stylegan2-ADA YOLO v7
在线阅读 下载PDF
低剂量CT图像的噪声提取研究 被引量:2
11
作者 焦枫媛 杨志秀 +2 位作者 方帆 刘祎 桂志国 《测试技术学报》 2023年第3期249-252,259,共5页
为了解决CT辐射剂量降低时重建图像质量低的问题,研究了基于StyleGAN2 GAN学习对给定噪声图像的噪声提取,采用从训练的GAN模型中采样大量噪声块的方法,提取噪声特征而不是噪声图像。通过引入轻量级Squeeze-and-Excitation(SE)模块可以... 为了解决CT辐射剂量降低时重建图像质量低的问题,研究了基于StyleGAN2 GAN学习对给定噪声图像的噪声提取,采用从训练的GAN模型中采样大量噪声块的方法,提取噪声特征而不是噪声图像。通过引入轻量级Squeeze-and-Excitation(SE)模块可以更好地为图像不同部分分配权重,使得浅层网络的局部信息在图像分割时能够很好地分割边缘细节图像,深层网络输出的特征图可以捕捉同一幅图像的不同尺度信息。实验结果表明,采用本文方法处理低剂量CT图像的细节还原度真实、局部器官光滑性较好。 展开更多
关键词 低剂量CT图像 降噪 stylegan2 GAN 纹理保持
在线阅读 下载PDF
Generation and Analysis of Sandstone Pore Structure Images Based on CT Scanning and Generative Adversarial Network
12
作者 Zhaowei WANG Limin SUO +7 位作者 Hailong LIU Wenlong SU Xianda SUN Likai CUI Yangdong CAO Tao LIU Wenjie YANG Wenying SUN 《Agricultural Biotechnology》 2024年第6期99-101,共3页
In this study,cylindrical sandstone samples were imaged by CT scanning technique,and the pore structure images of sandstone samples were analyzed and generated by combining with StyleGAN2-ADA generative adversarial ne... In this study,cylindrical sandstone samples were imaged by CT scanning technique,and the pore structure images of sandstone samples were analyzed and generated by combining with StyleGAN2-ADA generative adversarial network(GAN)model.Firstly,nine small column samples with a diameter of 4 mm were drilled from sandstone samples with a diameter of 2.5 cm,and their CT scanning results were preprocessed.Because the change between adjacent slices was little,using all slices directly may lead to the problem of pattern collapse in the process of model generation.In order to solve this problem,one slice was selected as training data every 30 slices,and the diversity of slices was verified by calculating the LPIPS values of these slices.The results showed that the strategy of selecting one slice every 30 slices could effectively improve the diversity of images generated by the model and avoid the phenomenon of pattern collapse.Through this process,a total of 295 discontinuous two-dimensional slices were generated for the generation and segmentation analysis of sandstone pore structures.This study can provide effective data support for accurate segmentation of porous medium structures,and simultaneously improves the stability and diversity of generative adversarial network under the condition of small samples. 展开更多
关键词 stylegan2-ADA Generative adversarial network Adaptive data augmentation CT scanning Sandstone pore structure
在线阅读 下载PDF
基于SASGAN-ADA的川剧脸谱图像生成方法
13
作者 刘春宏 王欢欢 凌源贞 《电脑知识与技术》 2026年第7期4-7,共4页
针对小样本条件下川剧脸谱图像生成过程中易出现几何结构畸变和多样性不足的问题,提出了一种图像生成方法SASGAN-ADA。通过引入自注意力机制,强化模型对脸谱全局拓扑结构的捕获能力;集成自适应增强(ADA)模块,以抑制小样本训练环境下的... 针对小样本条件下川剧脸谱图像生成过程中易出现几何结构畸变和多样性不足的问题,提出了一种图像生成方法SASGAN-ADA。通过引入自注意力机制,强化模型对脸谱全局拓扑结构的捕获能力;集成自适应增强(ADA)模块,以抑制小样本训练环境下的判别器过拟合。实验结果表明,该方法在FID、IS及SSIM指标上均优于基线模型,能够有效减少生成脸谱图像中的构图错位与局部结构失真现象,并提升纹理生成的多样性。 展开更多
关键词 图像生成 stylegan2 自注意力机制 自适应增强
在线阅读 下载PDF
人工智能在城市更新中的应用探讨——以对抗神经网络为例
14
作者 杨文忻 《中国住宅设施》 2025年第7期62-65,共4页
近年来,随着人工智能(AI)技术的快速发展,对抗神经网络(GANs)在城市更新领域的应用成为备受关注的话题。本文深入探讨了GANs在城市更新中的潜在应用,并以其在信息获取与认知、创新与设计生成和性能的评估优化等方面的影响为例进行了详... 近年来,随着人工智能(AI)技术的快速发展,对抗神经网络(GANs)在城市更新领域的应用成为备受关注的话题。本文深入探讨了GANs在城市更新中的潜在应用,并以其在信息获取与认知、创新与设计生成和性能的评估优化等方面的影响为例进行了详细分析。首先,本文介绍了GANs的基本原理,阐述了其由生成器和判别器组成的结构。随后,着重探讨了GANs在城市规划中的应用。其次,本文详细介绍和对比分析城市更新领域中的两种GANs,分别为有代表性的无监督学习算法StyleGAN和监督学习算法Pix2Pix。本文指出了在应用GANs时需要考虑的一些挑战,如隐私问题、数据伦理和社会公平等方面的关切。在技术不断发展的同时,城市规划者和决策者需要与社会各界共同努力,确保人工智能技术在城市更新中的应用能够最大化地服务于社会的利益和可持续发展的目标。综合而言,对抗神经网络作为人工智能技术的代表之一,在城市更新中的应用前景广阔。通过更智能、高效的规划和设计,城市可以更好地适应不断变化的社会需求,取得更为可持续的发展成就。 展开更多
关键词 人工智能 城市更新 对抗神经网络 Pix2Pix、StyleGAN
在线阅读 下载PDF
AI for conceptual architecture:Reflections on designing with text-to-text,text-to-image,and image-to-image generators 被引量:1
15
作者 Anca-Simona Horvath Panagiota Pouliou 《Frontiers of Architectural Research》 CSCD 2024年第3期593-612,共20页
In this paper we present a research-through-design study where we employed text-to-text,text-to-image,and image-to-image generative tools for a conceptual architecture project for the eVolo skyscraper competition.We t... In this paper we present a research-through-design study where we employed text-to-text,text-to-image,and image-to-image generative tools for a conceptual architecture project for the eVolo skyscraper competition.We trained these algorithms on a dataset that we collected and curated,consisting of texts about and images of architecture.We describe our design process,present the final proposal,reflect on the usefulness of such tools for early-stage design,and discuss implications for future research and practice.By analysing the results from training the text-to-text generators we could establish a specific design brief that informed the final concept.The results from the image-to-image generator gave an overview of the shape grammars of previous submissions.All results were intriguing and can assist creativity and in this way,the tools were useful for gaining insight into historical architectural data,helped shape a specific design brief,and provoked new ideas.By reflecting on our design process,we argue that the use of language when employing such tools takes a new role and that three layers of language intertwined in our work:architectural discourse,programming languages,and annotations.We present a map that unfolds how these layers came together as a contribution to making machine learning more explainable for creatives. 展开更多
关键词 Machine learning stylegan2-ADA RNN TensorFlow VQGAN+clip AD journal eVolo Conceptual design Architectural design
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部