判别增强的生成对抗模型在文本至图像生成中的研究与应用被引量：1

Discrimination-enhanced generative adversarial network in text-to-image generation

下载PDF

导出

摘要目前大部分基于生成对抗网络GAN的文本至图像生成算法着眼于设计不同模式的注意力生成模型,以提高图像细节的刻画与表达,但忽略了判别模型对局部关键语义的感知,以至于生成模型可能生成较差的图像细节“欺骗”判别模型。提出了判别语义增强的生成对抗网络DE-GAN模型,试图在判别模型中设计词汇-图像判别注意力模块,增强判别模型对关键语义的感知和捕捉能力,驱动生成模型生成高质量图像细节。实验结果显示,在CUB-Bird数据集上,DE-GAN在IS指标上达到了4.70,相比基准模型提升了4.2%,达到了较高的性能表现。 Based on Generative Adversarial Networks(GANs),most current text-to-image generation algorithms focus on designing different attention generation models to improve the characterization and expression of image details.However,they ignore the discriminator’s perception of key local semantics,so the generation models can easily generate poor image details to “fool” the discriminators.This paper designs a vocabulary-image discriminative attention module in the discriminators to enhance the discriminators’ ability to perceive and capture key semantics,and drive the generation model to generate high-quality image details.Therefore,a discrimination-enhanced generative adversarial model(DE-GAN) is proposed.The experimental results show that,on the CUB-Bird dataset,DE-GAN achieves 4.70 on the IS index,which is 4.2% higher than the baseline model and achieves high performance.

作者谭红臣黄世华肖贺文于冰冰刘秀平 TAN Hong-chen;HUANG Shi-hua;XIAO He-wen;YU Bing-bing;LIU Xiu-ping(School of Artificial Intelligence and Automation,Beijing University of Technology,Beijing 100124;Department of Computer Science,The Hong Kong Polytechnic University,Hongkong 999077;School of Mathematical Sciences,Dalian University of Technology,Dalian 116024,China)

机构地区北京工业大学人工智能与自动化学院香港理工大学计算机科学系大连理工大学数学科学学院

出处《计算机工程与科学》 CSCD 北大核心 2022年第5期855-861,共7页 Computer Engineering & Science

基金国家自然科学基金(61976040,62172073) 中国博士后科学基金委第70批博士后面上项目(2021M700303)。

关键词文本至图像生成生成对抗网络注意力机制判别模型 text-to-image generation generative adversarial network attention mechanism discrimination model

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1莫建文,徐凯亮,林乐平,欧阳宁.结合互信息最大化的文本到图像生成方法[J].西安电子科技大学学报,2019,46(5):180-188. 被引量：7
2孙钰,李林燕,叶子寒,胡伏原,奚雪峰.多层次结构生成对抗网络的文本生成图像方法[J].计算机应用,2019,39(11):3204-3209. 被引量：15
3徐天宇,王智.基于美学评判的文本生成图像优化[J].北京航空航天大学学报,2019,45(12):2438-2448. 被引量：4

二级参考文献4

1赵树阳,李建武.基于生成对抗网络的低秩图像生成方法[J].自动化学报,2018,44(5):829-839. 被引量：24
2郭雨潇,陈雷霆,董悦.单帧图像下的环境光遮蔽估计[J].计算机研究与发展,2019,56(2):385-393. 被引量：3
3何新宇,张晓龙.基于深度神经网络的肺炎图像识别模型[J].计算机应用,2019,39(6):1680-1684. 被引量：22
4陈晓范,申海杰,边倩,王振铎,田新志.结合注意力机制的人脸超分辨率重建[J].西安电子科技大学学报,2019,46(3):148-153. 被引量：10

共引文献20

1张帅,杨雪霞.基于文本—图像及流形插值的对抗模型[J].软件导刊,2020,19(8):216-220.
2庄兴旺,丁岳伟.多维度注意力和语义再生的文本生成图像模型[J].计算机技术与发展,2020,30(12):27-33. 被引量：1
3许一宁,何小海,张津,卿粼波.基于多层次分辨率递进生成对抗网络的文本生成图像方法[J].计算机应用,2020,40(12):3612-3617. 被引量：5
4甘岚,沈鸿飞,王瑶,张跃进.基于改进DCGAN的数据增强方法[J].计算机应用,2021,41(5):1305-1313. 被引量：27
5程换新,张志浩,刘文翰,郭占广.基于生成对抗网络的图像识别[J].计算机技术与发展,2021,31(6):175-180. 被引量：2
6马力,邹亚莉.嵌入自注意力机制的美学特征图像生成方法[J].计算机科学与探索,2021,15(9):1728-1739. 被引量：3
7杨静波,赵启军,吕泽均.维度情感模型下的表情图像生成及应用[J].西安电子科技大学学报,2021,48(5):30-37. 被引量：3
8李小瑞,谢诚,李宾,柳青,胡健龙.基于知识元模型的跨模态聊天卡通表情图像合成[J].图学学报,2021,42(6):908-916. 被引量：1
9谈馨悦,何小海,王正勇,罗晓东,卿粼波.基于Transformer交叉注意力的文本生成图像技术[J].计算机科学,2022,49(2):107-115. 被引量：6
10张静,农昌瑞,杨智勇,刘镇毓,曾庆松.改进DCGAN的飞机蒙皮图像生成方法[J].兵器装备工程学报,2022,43(3):286-292. 被引量：4

同被引文献2

1刘星.融合局部语义信息的多模态舆情分析模型[J].信息安全研究,2019,5(4):340-345. 被引量：7
2梁毅,吐尔地·托合提,艾斯卡尔·艾木都拉.多层CNN特征融合及多分类器混合预测的多模态虚假信息检测[J].计算机工程与科学,2023,45(6):1087-1096. 被引量：8

引证文献1

1杨春苗,王杨,韩力英,孙赫彬.基于生成对抗网络的跨模态图像情感感知描述[J].计算机工程与科学,2025,47(5):894-901. 被引量：1

二级引证文献1

1黄国庆,焦斌,斯蒂凡诺·佛利萨.基于AI优化的个性化文创产品设计路径研究——以大卫雕塑文创冰箱贴为例[J].洛阳师范学院学报,2025,44(9):49-52.

1吕丹丹.谈谈进行高中英语词汇教学的方法[J].语数外学习（高中版）（上）,2021(6):74-74.
2应卫强,张帆,张玲燕.一种强真实感的图像生成算法设计与仿真[J].计算机仿真,2022,39(4):492-495. 被引量：2
3陈云翔,王巍,宁娟,陈怡丹,赵永新,周庆华.PSWGAN-GP:改进梯度惩罚的生成对抗网络[J].计算机与现代化,2022(4):21-26.
4张明珠,牛敏昌,刘菲菲,董景云,唐丽玮,高岩冰.高频超声评价产后女性腹直肌分离类型的初步研究[J].中国临床医学影像杂志,2022,33(3):201-205. 被引量：17
5南淑良,刘菲菲,刘莉,徐姣姣,刘玮,穆靓.超声评估产后早期腹直肌分离与盆底功能障碍性疾病发生关系的研究[J].中国临床医学影像杂志,2022,33(3):206-209. 被引量：16
6陈荣荣,黄健源,陈静,郭丽萍,陆芳.全景超声成像检测产后女性腹直肌间距的有效性评估[J].右江民族医学院学报,2022,44(2):251-254.
7Michalis Georgiou,Kaoru Fujinami,Michel Michaelides.Retinal imaging in inherited retinal diseases[J].Annals of Eye Science,2020(3):30-49. 被引量：1

计算机工程与科学

2022年第5期

浏览历史

内容加载中请稍等...

判别增强的生成对抗模型在文本至图像生成中的研究与应用被引量：1

参考文献3

二级参考文献4

共引文献20

同被引文献2

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

判别增强的生成对抗模型在文本至图像生成中的研究与应用 被引量：1

参考文献3

二级参考文献4

共引文献20

同被引文献2

引证文献1

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

判别增强的生成对抗模型在文本至图像生成中的研究与应用被引量：1