期刊文献+
共找到66篇文章
< 1 2 4 >
每页显示 20 50 100
基于SAM和pix2pix的商品数据集生成网络
1
作者 于惠钧 邹志豪 康帅 《电子技术应用》 2025年第4期23-28,共6页
针对商品包装快速变换带来的商品数据集采集和标注过程繁琐的问题,设计了一种基于SAM和pix2pix的商品数据集生成网络。该网络以单个商品多角度图像作为输入,生成与实际结算场景相近似的数据集。在RPC大型商品数据集上进行数据集生成,在Y... 针对商品包装快速变换带来的商品数据集采集和标注过程繁琐的问题,设计了一种基于SAM和pix2pix的商品数据集生成网络。该网络以单个商品多角度图像作为输入,生成与实际结算场景相近似的数据集。在RPC大型商品数据集上进行数据集生成,在YOLOv7、Fast R-CNN、AlexNet三种目标检测网络上验证生成数据集对目标检测效果的提升。实验结果表明,生成数据集融合到原数据集后用于训练模型能够有效提升商品识别准确率,并且与真实数据集相比具有较好的替代性。相较于原数据集,融合生成数据集三个网络上识别精度分别提升7.3%、4.9%、7.8%。通过该方法,显著提高了模型训练的效率与实用性,减轻传统商品数据集采集与标注所需的人力物力投入。 展开更多
关键词 商品识别 SAM pix2pix 数据集生成
在线阅读 下载PDF
基于注意力机制改进的Pix2Pix探地雷达道路病害检测方法
2
作者 庞荣 熊昊旻 +3 位作者 曹礼刚 胡俊 邓欢 秦锐 《物探化探计算技术》 2025年第4期577-585,共9页
针对高速公路长期运行过程中出现的道路病害,如层间不良、层间松散和裂缝等问题,笔者提出一种基于注意力机制改进的Pix2Pix探地雷达(GPR)道路病害检测方法。该方法通过在Pix2Pix网络中集成卷积块注意力模块(CBAM)和空间注意力机制(SAM)... 针对高速公路长期运行过程中出现的道路病害,如层间不良、层间松散和裂缝等问题,笔者提出一种基于注意力机制改进的Pix2Pix探地雷达(GPR)道路病害检测方法。该方法通过在Pix2Pix网络中集成卷积块注意力模块(CBAM)和空间注意力机制(SAM),并使用LSGAN损失函数优化网络结构和训练过程。在仅100张图像的小样本数据集中,提出的方法检测精度达到85.45%,显著优于传统的YOLOv5和Faster RCNN方法。实验结果表明,该方法在小样本情景下具备较高的检测精度与泛化能力,为道路病害的自动化检测提供了新的解决方案。 展开更多
关键词 探地雷达 pix2pix 注意力机制 目标检测
在线阅读 下载PDF
基于改进Pix2Pix的地质剖面生成方法
3
作者 孙子奇 曹战 陈华 《科学技术与工程》 北大核心 2025年第19期8025-8033,共9页
传统的地质方法对于地质剖面的确定过于依赖地震反射分辨率以及井数据的质量,针对实际情况中开发早期可用于标定的井数据数量极少,且传统地质建模方法生成地质剖面效率较低,难以支撑模型建立和频繁更新的问题,提出了基于改进Pix2Pix网... 传统的地质方法对于地质剖面的确定过于依赖地震反射分辨率以及井数据的质量,针对实际情况中开发早期可用于标定的井数据数量极少,且传统地质建模方法生成地质剖面效率较低,难以支撑模型建立和频繁更新的问题,提出了基于改进Pix2Pix网络的地质剖面生成方法。首先对初始的三维数据进行切片处理,在深度学习网络综合分析基础上,构建了基于残差和多尺度判别器的Pix2Pix网络模型,在生成器部分引入残差机制以提高网络对地质特征的学习能力,并为模型设定多尺度判别器,增强网络的判别性能。使用油田的真实地震反射数据和地质剖面数据对模型进行训练,实验结果显示:网络模型在引进残差机制和多尺度判别器后性能得到显著提升,生成结果与真实地质剖面的SSIM(structural similarity)分数能够达到91.89%,生成结果中的地质特征与实际情况高度拟合。 展开更多
关键词 图像语义识别 深度生成模型 pix2pix网络 地质建模
在线阅读 下载PDF
基于改进Pix2pix的变压器多物理场耦合温度分布高效计算方法
4
作者 李紫豪 何怡刚 +2 位作者 周亚中 汤海宁 张滔 《高电压技术》 北大核心 2025年第10期4992-5002,共11页
针对变压器多物理场耦合关系复杂,材料呈现非线性特性,现有状态参量分布特性求解技术难以兼顾模型准确性和实时性,无法满足变压器全局场量可视化与状态实时评估分析需求。该文提出变压器多物理场耦合温度分布高效计算方法,首先搭建变压... 针对变压器多物理场耦合关系复杂,材料呈现非线性特性,现有状态参量分布特性求解技术难以兼顾模型准确性和实时性,无法满足变压器全局场量可视化与状态实时评估分析需求。该文提出变压器多物理场耦合温度分布高效计算方法,首先搭建变压器电磁-热-流多物理场耦合模型,基于有限元分析技术构建温度分布样本库;然后提出基于差分优化算法的传感器布控优化方法,建立基于改进Pix2pix神经网络的变压器温度分布高效计算模型,引入多感受野特征挖掘及多尺度特征判别技术提高全局及局部计算精度;最后采用基于克里金插值的降尺度技术,提高温度分布面的空间分辨率,实现变压器多物理场耦合温度分布精细化计算。通过变压器仿真模型及实际变压器数据验证,结果表明该文所提方法在仿真模型的温度分布计算精度达到98%以上,在实际变压器的温度分布计算精度达到85%以上,且计算时间均小于6 s。该文所提方法兼顾计算准确性和高效性,为变压器安全运行提供有力技术支撑。 展开更多
关键词 多物理场耦合 传感器布控优化技术 改进的pix2pix神经网络 温度分布高效计算 降尺度技术
原文传递
基于Pix2Pix模型的康普顿相机图像重建优化研究
5
作者 赵丽文 卢棚 +1 位作者 金龙泉 宋耀洲 《齐齐哈尔大学学报(自然科学版)》 2025年第1期43-49,共7页
为改善康普顿相机传统重建算法中重建质量差、重建速度慢的问题,使用基于Pix2Pix深度学习模型的康普顿相机重建算法优化重建图像质量。首先,通过蒙特卡罗方法模拟康普顿相机获取实验数据过程,制作部分数据集,并利用数据增强技术扩充模... 为改善康普顿相机传统重建算法中重建质量差、重建速度慢的问题,使用基于Pix2Pix深度学习模型的康普顿相机重建算法优化重建图像质量。首先,通过蒙特卡罗方法模拟康普顿相机获取实验数据过程,制作部分数据集,并利用数据增强技术扩充模型所需数据集。其次,通过在生成器引入16层的U-Net模型,并结合SimAM模块,增强模型的特征提取能力,降低模型训练中模式崩塌的可能性。最后,在判别器中加入残差模块,使模型训练过程更稳定,提升模型性能。实验结果表明,在提升传统重建方法图像质量的基础上,峰值信噪比较原模型提升了3.05,结构相似性提升了1.83%。 展开更多
关键词 SimAM 康普顿相机 pix2pix 重建算法
在线阅读 下载PDF
Research on multi-view collaborative detection system for UAV swarms based on Pix2Pix framework and BAM attention mechanism
6
作者 Yan Ding Qingxin Cao +2 位作者 Bozhi Zhang Peilin Li Zhongjiao Shi 《Defence Technology(防务技术)》 2025年第4期213-226,共14页
Drone swarm systems,equipped with photoelectric imaging and intelligent target perception,are essential for reconnaissance and strike missions in complex and high-risk environments.They excel in information sharing,an... Drone swarm systems,equipped with photoelectric imaging and intelligent target perception,are essential for reconnaissance and strike missions in complex and high-risk environments.They excel in information sharing,anti-jamming capabilities,and combat performance,making them critical for future warfare.However,varied perspectives in collaborative combat scenarios pose challenges to object detection,hindering traditional detection algorithms and reducing accuracy.Limited angle-prior data and sparse samples further complicate detection.This paper presents the Multi-View Collaborative Detection System,which tackles the challenges of multi-view object detection in collaborative combat scenarios.The system is designed to enhance multi-view image generation and detection algorithms,thereby improving the accuracy and efficiency of object detection across varying perspectives.First,an observation model for three-dimensional targets through line-of-sight angle transformation is constructed,and a multi-view image generation algorithm based on the Pix2Pix network is designed.For object detection,YOLOX is utilized,and a deep feature extraction network,BA-RepCSPDarknet,is developed to address challenges related to small target scale and feature extraction challenges.Additionally,a feature fusion network NS-PAFPN is developed to mitigate the issue of deep feature map information loss in UAV images.A visual attention module(BAM)is employed to manage appearance differences under varying angles,while a feature mapping module(DFM)prevents fine-grained feature loss.These advancements lead to the development of BA-YOLOX,a multi-view object detection network model suitable for drone platforms,enhancing accuracy and effectively targeting small objects. 展开更多
关键词 Drone swarm systems Reconnaissance and strike Image generation Multi-view detection pix2pix framework Attention mechanism
在线阅读 下载PDF
A Study on Polyp Dataset Expansion Algorithm Based on Improved Pix2Pix
7
作者 Ziji Xiao Kaibo Yang +3 位作者 Mingen Zhong Kang Fan Jiawei Tan Zhiying Deng 《Computers, Materials & Continua》 2025年第2期2665-2686,共22页
The polyp dataset involves the confidentiality of medical records, so it might be difficult to obtain datasets with accurate annotations. This problem can be effectively solved by expanding the polyp data set with alg... The polyp dataset involves the confidentiality of medical records, so it might be difficult to obtain datasets with accurate annotations. This problem can be effectively solved by expanding the polyp data set with algorithms. The traditional polyp dataset expansion scheme usually requires the use of two models or traditional visual methods. These methods are both tedious and difficult to provide new polyp features for training data. Therefore, our research aims to efficiently generate high-quality polyp samples, so as to effectively expand the polyp dataset. In this study, we first added the attention mechanism to the generation model and improved the loss function to reduce the interference caused by reflection in the image generation process. Meanwhile, we used the improved generation model to remove polyps from the original image. In addition, we used masks of different shapes generated by random combinations to generate polyps with more characteristic information. The same generation model was used for the removal and generation of polyps. The generated polyp image has its own annotation, which is conducive to us directly using the expanded data set for training. Finally, we verified the effectiveness of the improved model and the dataset expansion scheme through a series of comparative experiments on the public dataset. The results showed that using the dataset we generate for training can significantly optimize the main performance indicators. 展开更多
关键词 Polyp formation polyp detection image synthesis generative adversarial network pix2pix
在线阅读 下载PDF
SC-GAN:A Spectrum Cartography with Satellite Internet Based on Pix2Pix Generative Adversarial Network
8
作者 Zhen Pan Zhang Bangning +2 位作者 Wang Heng MaWenfeng Guo Daoxing 《China Communications》 2025年第2期47-61,共15页
The increasing demand for radioauthorized applications in the 6G era necessitates enhanced monitoring and management of radio resources,particularly for precise control over the electromagnetic environment.The radio m... The increasing demand for radioauthorized applications in the 6G era necessitates enhanced monitoring and management of radio resources,particularly for precise control over the electromagnetic environment.The radio map serves as a crucial tool for describing signal strength distribution within the current electromagnetic environment.However,most existing algorithms rely on sparse measurements of radio strength,disregarding the impact of building information.In this paper,we propose a spectrum cartography(SC)algorithm that eliminates the need for relying on sparse ground-based radio strength measurements by utilizing a satellite network to collect data on buildings and transmitters.Our algorithm leverages Pix2Pix Generative Adversarial Network(GAN)to construct accurate radio maps using transmitter information within real geographical environments.Finally,simulation results demonstrate that our algorithm exhibits superior accuracy compared to previously proposed methods. 展开更多
关键词 electromagnetic situation pix2pix generative adversarial network radio map satellite internet spectrum cartography
在线阅读 下载PDF
基于pix2pixHD图像修复的光伏电站秒级功率预测方法 被引量:3
9
作者 孟祥剑 石欣羽 +2 位作者 张承慧 张玉敏 杨明 《高电压技术》 EI CAS CSCD 北大核心 2024年第9期3894-3903,共10页
云团遮挡导致地面辐照度发生瞬变是光伏电站出力剧烈波动的根本原因,为提高在云团遮挡情况下光伏功率预测的精度,提出一种基于pix2pix HD图像修复的光伏电站秒级功率预测方法。首先,依据光伏电站光伏组件的参数、内部光伏阵列的排列结... 云团遮挡导致地面辐照度发生瞬变是光伏电站出力剧烈波动的根本原因,为提高在云团遮挡情况下光伏功率预测的精度,提出一种基于pix2pix HD图像修复的光伏电站秒级功率预测方法。首先,依据光伏电站光伏组件的参数、内部光伏阵列的排列结构和布局,推导光伏电站精细化模型;其次,深入挖掘逆变器集群输出的光伏功率数据特征,剖析光伏功率与辐照度的映射关系,构建能够描述云团形状、厚度和运动方向的虚拟云图用以表征云团遮挡(功率缺失)情况;随后,提出生成对抗网络的pix2pixHD图像修复算法对缺损的虚拟云图进行修复,融合最近5s的修复云图,提高对云团性质的精确表达;最后,依据光伏功率、辐照度、虚拟云图像素值三者之间的线性关系,实现高精度的光伏电站秒级功率预测;以山东某地市的实际光伏电站为例,仿真结果表明所提pix2pixHD图像修复的预测模型能够有效提高秒级光伏功率预测精度。 展开更多
关键词 秒级光伏功率预测 虚拟云图 pix2pix HD 图像修复 云团遮挡 深度学习
原文传递
基于改进pix2pix的红外图像转换技术 被引量:1
10
作者 叶明亮 史春景 +1 位作者 郝永平 李大伟 《激光与红外》 CAS CSCD 北大核心 2024年第7期1157-1163,共7页
针对不同波段图像获取代价不同的问题,提出一种基于pix2pix的图像转换方法并进行改进。主要针对生成器和鉴别器两方面进行改进。生成器方面,使用残差结构的生成器替换原来的U-Net生成器以缓解梯度消失问题;引入可变形卷积,提高目标边缘... 针对不同波段图像获取代价不同的问题,提出一种基于pix2pix的图像转换方法并进行改进。主要针对生成器和鉴别器两方面进行改进。生成器方面,使用残差结构的生成器替换原来的U-Net生成器以缓解梯度消失问题;引入可变形卷积,提高目标边缘和小目标的生成效果;引入BAM注意力机制,提高了算法对图像中主要目标的特征提取能力以提升生成图像的效果。鉴别器方面:改变PatchGAN中卷积层的层数(原PatchGAN为3层卷积),设置对照实验找到转换效果最好的卷积层数。以可见光图像和红外图像之间的转换为例进行实验。实验结果表明,改进后的算法在生成图像上的均方根误差(MSE)下降了31.4%、结构相似性(SSIM)提高了11.2%,可以更好的实现红外图像和可见光图像之间的转换。 展开更多
关键词 生成对抗网络 pix2pix 图像转换 残差结构
在线阅读 下载PDF
基于改进Pix2Pix-HD网络的多品种水稻生长可视化预测方法 被引量:4
11
作者 段凌凤 王新轶 +3 位作者 王治昊 耿泽栋 卢运瑞 杨万能 《作物学报》 CAS CSCD 北大核心 2024年第12期3083-3095,共13页
植物生长建模与预测能模拟植物的生长过程,有助于生理学家和植物学家分析植物未来的生长模式,缩短试验周期、降低试验成本,受时间和条件限制的植物试验与研究指导。生长可视化预测能提供未来生长时间点的植物图像,能更逼真、直观地描述... 植物生长建模与预测能模拟植物的生长过程,有助于生理学家和植物学家分析植物未来的生长模式,缩短试验周期、降低试验成本,受时间和条件限制的植物试验与研究指导。生长可视化预测能提供未来生长时间点的植物图像,能更逼真、直观地描述植物的生长过程。水稻作为重要的粮食作物,实现水稻的生长可视化预测,对水稻生长发育分析具有十分重要的意义。针对传统作物生长预测方法存在的视觉真实度和可视化效果较差等问题,本文提出了一种基于改进Pix2Pix-HD模型的多品种水稻生长可视化预测方法,利用数据驱动的方式,实现了对水稻抽穗期到灌浆期的高分辨率生长可视化预测,通过水稻抽穗期的图像预测灌浆期水稻生长图像。方法评估中,本文从视觉相似性、表型准确性和不同尺度评估模型预测性能,通过消融实验评估改进方法的有效性,并与现有研究进行比较。结果表明,测试集预测的灌浆期水稻图像与真实灌浆期水稻图像之间的FID、PSNR和SSIM值分别达到24.75、13.58和0.78,预测表型和真实表型相关系数的平均值为0.762,在不同尺度上都能保持较好的准确性。本文提出的基于数据驱动的水稻生长预测方法能够实现高分辨率和高视觉真实性的水稻生长可视化预测,为水稻生长预测提供了新思路。 展开更多
关键词 水稻 生长可视化预测 生成对抗网络 pix2pix-HD 数字植物
在线阅读 下载PDF
基于Pix2pix网络的遥感影像样本扩增方法 被引量:1
12
作者 谢威夷 徐锡杰 +1 位作者 芮小平 邹亚荣 《遥感技术与应用》 CSCD 北大核心 2024年第5期1151-1158,共8页
基于深度学习的遥感影像土地分类应用需要海量的数据集作为训练样本,影像标签数据集常因数量少而难以满足训练要求,利用现有样本进行扩增是一种有效的技术手段。传统的数据扩增技术仅改变影像颜色、清晰度等,且扩增数量有一定上限,为了... 基于深度学习的遥感影像土地分类应用需要海量的数据集作为训练样本,影像标签数据集常因数量少而难以满足训练要求,利用现有样本进行扩增是一种有效的技术手段。传统的数据扩增技术仅改变影像颜色、清晰度等,且扩增数量有一定上限,为了自动化大幅扩增更具多样性的样本,研究设计了一种基于Pix2pix网络的遥感影像样本扩增方法。利用Pix2pix网络生成器根据无人机和谷歌影像标签生成虚拟影像,判定器对虚拟影像与真实影像进行比对,在生成对抗训练多次后输出样本对实现扩增。结果表明:生成结果的视觉对比相似度高,无人机影像和谷歌影像对比原始图像平均余弦相似度分别为0.85与0.96,平均直方图相似度为0.50和0.61,是一种有效的遥感影像样本扩增方法。 展开更多
关键词 样本扩增 pix2pix网络 深度学习 遥感影像
原文传递
基于Pix2pix模型的继电器动作状态识别方法研究 被引量:1
13
作者 李永燕 叶伟 金雪军 《铁道通信信号》 2024年第8期16-21,共6页
为解决采用深度学习算法识别信号继电器组合动作状态时难以获取大量高质量标注数据的问题,利用Pix2pix模型小样本学习能力强的优点,研究基于Pix2pix算法模型的继电器动作状态识别方法。首先,使用labelimg图像标注软件对继电器组合图像... 为解决采用深度学习算法识别信号继电器组合动作状态时难以获取大量高质量标注数据的问题,利用Pix2pix模型小样本学习能力强的优点,研究基于Pix2pix算法模型的继电器动作状态识别方法。首先,使用labelimg图像标注软件对继电器组合图像进行标注,根据标注信息对继电器组合图像进行处理,得到与继电器组合图像对应的标注图像数据集;其次,划分数据集并对训练集进行数据增强处理,并训练Pix2pix网络得到生成器,使用Pix2pix模型的生成器对继电器组合进行图像转译得到生成图像;然后,使用图像后处理技术对生成图进行分析,得到继电器位置和状态属性信息;最后,通过测试集对该算法进行试验验证,得到继电器动作状态识别的准确率达到94%。试验结果表明,使用Pix2pix模型对信号继电器组合进行图像转译具有可行性和有效性。 展开更多
关键词 继电器组合 图像转译 深度学习 准确率 pix2pix模型
在线阅读 下载PDF
Prediction of the Pore-Pressure Built-Up and Temperature of Fire-Loaded Concrete with Pix2Pix
14
作者 Xueya Wang Yiming Zhang +1 位作者 Qi Liu Huanran Wang 《Computers, Materials & Continua》 SCIE EI 2024年第5期2907-2922,共16页
Concrete subjected to fire loads is susceptible to explosive spalling, which can lead to the exposure of reinforcingsteel bars to the fire, substantially jeopardizing the structural safety and stability. The spalling ... Concrete subjected to fire loads is susceptible to explosive spalling, which can lead to the exposure of reinforcingsteel bars to the fire, substantially jeopardizing the structural safety and stability. The spalling of fire-loaded concreteis closely related to the evolution of pore pressure and temperature. Conventional analytical methods involve theresolution of complex, strongly coupled multifield equations, necessitating significant computational efforts. Torapidly and accurately obtain the distributions of pore-pressure and temperature, the Pix2Pix model is adoptedin this work, which is celebrated for its capabilities in image generation. The open-source dataset used hereinfeatures RGB images we generated using a sophisticated coupled model, while the grayscale images encapsulate the15 principal variables influencing spalling. After conducting a series of tests with different layers configurations,activation functions and loss functions, the Pix2Pix model suitable for assessing the spalling risk of fire-loadedconcrete has been meticulously designed and trained. The applicability and reliability of the Pix2Pix model inconcrete parameter prediction are verified by comparing its outcomes with those derived fromthe strong couplingTHC model. Notably, for the practical engineering applications, our findings indicate that utilizing monochromeimages as the initial target for analysis yields more dependable results. This work not only offers valuable insightsfor civil engineers specializing in concrete structures but also establishes a robust methodological approach forresearchers seeking to create similar predictive models. 展开更多
关键词 Fire loaded concrete spalling risk pore pressure generative adversarial network(GAN) pix2pix
在线阅读 下载PDF
一种应用于Pix2Pix的水下鱼类图像增强训练集构建新方法
15
作者 李沅衡 林茂兹 +1 位作者 丁可武 陈文辉 《福建技术师范学院学报》 2024年第2期10-16,共7页
提出一种量化对比不同参数下带色彩恢复的多尺度网膜增强(MSRCR)算法的图像增强效果,选取最优组成训练集的方法,并基于该训练集训练Pix2Pix模型.实验结果表明,利用该方法所建立的训练集,可以获得用于水下鱼类图像增强的优质Pix2Pix模型... 提出一种量化对比不同参数下带色彩恢复的多尺度网膜增强(MSRCR)算法的图像增强效果,选取最优组成训练集的方法,并基于该训练集训练Pix2Pix模型.实验结果表明,利用该方法所建立的训练集,可以获得用于水下鱼类图像增强的优质Pix2Pix模型参数,且此方法还可以扩展应用于其他对抗神经网络(GAN)模型训练中. 展开更多
关键词 水下鱼类图像增强 训练集 MSRCR pix2pix
在线阅读 下载PDF
基于生成对抗网络(Pix2pix)的家具设计草图渲染 被引量:7
16
作者 朱文霜 王禹钧 郑文俊 《家具与室内装饰》 北大核心 2023年第10期117-121,共5页
家具设计师工作初期通常会借助手绘线稿来描绘创意与灵感,但手绘线稿往往难以快速深化效果。为改善该状态,故尝试运用生成对抗网络(Generative Adversarial Network, GAN)门类中的深度学习图像转译模型(Pix2pix)对手绘线稿进行快速渲染... 家具设计师工作初期通常会借助手绘线稿来描绘创意与灵感,但手绘线稿往往难以快速深化效果。为改善该状态,故尝试运用生成对抗网络(Generative Adversarial Network, GAN)门类中的深度学习图像转译模型(Pix2pix)对手绘线稿进行快速渲染。先以样本采集法创建家具数据集,据此对Pix2pix进行训练;再建立交互界面来满足用户操作需求;最后通过两组测试验证其可行性。通过对Pix2pix生成的图像效果与使用者的反馈分析可知,Pix2pix能有效辅助家具设计师进行草图渲染,同时也能帮助非专业设计人员呈现自身创意。这既为家具设计效果表现探索出一条数字化路径,也是一次设计学和计算机科学与技术的深度融合研究。 展开更多
关键词 生成对抗网络 图像转译 深度学习 家具设计 pix2pix
在线阅读 下载PDF
一种基于pix2pix改进的工业缺陷数据增强方法 被引量:4
17
作者 罗月童 段昶 +1 位作者 江佩峰 周波 《计算机工程与科学》 CSCD 北大核心 2022年第12期2206-2212,共7页
基于深度学习的目标检测算法在工业检测中应用广泛,为解决工业缺陷数据不足的问题,提出了一种基于pix2pix改进的缺陷数据增强方法。从加强生成器和判别器对图像中缺陷区域的注意力出发,针对pix2pix进行了如下改进:(1)仅将整幅图像的缺... 基于深度学习的目标检测算法在工业检测中应用广泛,为解决工业缺陷数据不足的问题,提出了一种基于pix2pix改进的缺陷数据增强方法。从加强生成器和判别器对图像中缺陷区域的注意力出发,针对pix2pix进行了如下改进:(1)仅将整幅图像的缺陷区域作为判别器的输入,以此提升生成器对缺陷区域的注意力,同时,判别器采用了更小的卷积核提取缺陷区域的特征;(2)仅将图像中所有缺陷区域的平均生成对抗损失作为该图像的生成对抗损失,使网络更加关注缺陷区域的特征学习。在工业LED缺陷数据集上的实验结果表明,本方法生成的缺陷具有更逼真的视觉效果和更低的FID指数,同时有效提升了基于RetinaNet算法的缺陷检测精度。 展开更多
关键词 目标检测 数据增强 pix2pix 注意力
在线阅读 下载PDF
基于pix2pix模型的单幅图像去雾算法 被引量:7
18
作者 马悦 《电子设计工程》 2021年第4期62-65,70,共5页
图像去雾技术在各领域广泛应用,是复杂环境条件下提高图像辨识度的重要环节。但现有的图像去雾算法在自然真实情形下大多表现不佳,为了进一步提升图像去雾水平,文中采用了一种基于pix2pix模型的单幅图像去雾方法,通过利用编码器和解码... 图像去雾技术在各领域广泛应用,是复杂环境条件下提高图像辨识度的重要环节。但现有的图像去雾算法在自然真实情形下大多表现不佳,为了进一步提升图像去雾水平,文中采用了一种基于pix2pix模型的单幅图像去雾方法,通过利用编码器和解码器网络结构来解决图像去雾问题,并利用了马尔可夫判别器(PatchGAN)进行判断。实验结果表明,该方法在人工合成图像和自然真实图像上都取得了较好的视觉效果,得出的结论是,该方法在PSNR和SSIM指标上平均提升了5%。 展开更多
关键词 pix2pix 图像去雾 生成对抗网络 马尔可夫判别器
在线阅读 下载PDF
基于Pix2Pix网络的印章去除 被引量:3
19
作者 王俊 苗军 +1 位作者 卿来云 乔元华 《北京信息科技大学学报(自然科学版)》 2021年第4期39-43,共5页
针对印章会影响发票文字识别的问题,提出了一种基于Pix2Pix网络去除印章的方法:采用HSV颜色空间的方法,筛选出包括印章在内的信息;通过二值化、图片腐蚀、轮廓集检测、椭圆拟合算法,确定椭圆印章的位置;将检测到的印章位置的外接矩形作... 针对印章会影响发票文字识别的问题,提出了一种基于Pix2Pix网络去除印章的方法:采用HSV颜色空间的方法,筛选出包括印章在内的信息;通过二值化、图片腐蚀、轮廓集检测、椭圆拟合算法,确定椭圆印章的位置;将检测到的印章位置的外接矩形作为图片送入Pix2Pix网络,得到去除印章的图片。实验结果表明,Pix2Pix网络可以有效地去除印章。 展开更多
关键词 文字识别 二值化 椭圆拟合 pix2pix网络
在线阅读 下载PDF
基于pix2pix的类平面图生成及评价方法研究 被引量:2
20
作者 崔哲 郭昱 李华 《住宅科技》 2023年第9期27-35,共9页
文章定义“类平面图”的概念,通过统一规则生成4556套不重复的类平面图样本,以此解决样本收集和量化评价难的问题;并基于pix2pix算法,设置单一GAN、堆叠GAN两种构架的生成模型,从生成图与真实图的像素相似度和主观评分两方面评价模型的... 文章定义“类平面图”的概念,通过统一规则生成4556套不重复的类平面图样本,以此解决样本收集和量化评价难的问题;并基于pix2pix算法,设置单一GAN、堆叠GAN两种构架的生成模型,从生成图与真实图的像素相似度和主观评分两方面评价模型的学习效果。结果显示:①单一GAN模型的学习效果随样本量和学习回合的增加而稳步提升,而堆叠GAN模型的学习效果与训练参数的相关性较弱;②从像素相似度的平均值来看,单一GAN模型优于堆叠GAN模型;③从像素相似度的最高值和主观评分来看,堆叠GAN模型优于单一GAN模型;④整体而言,单一GAN模型生成的平面图空间分割更清晰,对规则的学习效果也优于堆叠GAN模型。研究结果为后续复杂建筑的训练、生成图中的断线优化、损失函数梯度的降低提供研究思路,也为大规模生成数字建成环境提供技术和理论基础。 展开更多
关键词 pix2pix 平面图生成 类平面图 训练方法 评价方法
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部