基于美学评判的文本生成图像优化被引量：4

Text-to-image synthesis optimization based on aesthetic assessment

导出

摘要在对抗生成网络(GAN)这一概念的诞生及发展推动下,文本生成图像的研究取得进展和突破,但大部分的研究内容集中于提高生成图片稳定性和解析度的问题,提高生成结果美观度的研究则很少。而计算机视觉中另一项经典的课题——图像美观度评判的研究也在深度神经网络的推动下提出了一些成果可信度较高的美观度评判模型。本文借助美观度评判模型,对实现文本生成图像目标的GAN模型进行了改造,以期提高其生成图片的美观度指标。首先针对StackGAN++模型,通过选定的美观度评判模型从美学角度评估其生成结果;然后通过借助评判模型构造美学损失的方式对其进行优化。结果使得其生成图像的总体美学分数比原模型提高了3.17%,同时Inception Score提高了2.68%,证明所提方法具有一定效果,但仍存在一定缺陷和提升空间。 Due to the development of generative adversarial network(GAN),much progress has been achieved in the research of text-to-image synthesis.However,most of the researches focus on improving the stability and resolution of generated images rather than aesthetic quality.On the other hand,image aesthetic assessment research is also a classic task in computer vision field,and currently there exists several state-of-the-art models on image aesthetic assessment.In this work,we propose to improve the aesthetic quality of images generated by text-to-image GAN by incorporating an image aesthetic assessment model into a conditional GAN.We choose StackGAN++,a state-of-the-art text-to-image synthesis model,assess the aesthetic quality of images generated by it with a chosen aesthetic assessment model,then define a new loss function:aesthetic loss,and use it to improve StackGAN++.Compared with the original model,the total aesthetic score of generated images is improved by 3.17%and the inception score is improved by 2.68%,indicating that the proposed optimization is effective but still has several weaknesses that can be improved in future work.

作者徐天宇王智 XU Tianyu;WANG Zhi(Department of Computer Science and Technology,Tsinghua University,Shenzhen 518055,China)

机构地区清华大学计算机科学与技术系

出处《北京航空航天大学学报》 EI CAS CSCD 北大核心 2019年第12期2438-2448,共11页 Journal of Beijing University of Aeronautics and Astronautics

基金国家自然科学基金(61872215,61531006)~~

关键词文本生成图像对抗生成网络(GAN) 美观度评判 StackGAN++ 美学损失 text-to-image synthesis generative adversarial networks(GAN) aesthetic assessment StackGAN++ aesthetic loss

分类号 TP391.41 [自动化与计算机技术—计算机应用技术] TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

同被引文献12

1王伟凝,蚁静缄,贺前华.可计算图像美学研究进展[J].中国图象图形学报,2012,17(8):893-901. 被引量：31
2孙旭,李晓光,李嘉锋,卓力.基于深度学习的图像超分辨率复原研究进展[J].自动化学报,2017,43(5):697-709. 被引量：75
3葛瑞雪.融合色彩和谐性与构图的图像美学分类方法研究[J].软件导刊,2017,16(11):221-224. 被引量：2
4谢志华,江鹏,余新河,张帅.基于VGGNet和多谱带循环网络的高光谱人脸识别系统[J].计算机应用,2019,39(2):388-391. 被引量：12
5陈耀,宋晓宁,於东军.迭代化代价函数及超参数可变的生成对抗网络[J].南京理工大学学报,2019,43(1):35-40. 被引量：3
6邵清,马慧萍.融合self-attention机制的卷积神经网络文本分类模型[J].小型微型计算机系统,2019,40(6):1137-1141. 被引量：22
7莫建文,徐凯亮,林乐平,欧阳宁.结合互信息最大化的文本到图像生成方法[J].西安电子科技大学学报,2019,46(5):180-188. 被引量：7
8孙钰,李林燕,叶子寒,胡伏原,奚雪峰.多层次结构生成对抗网络的文本生成图像方法[J].计算机应用,2019,39(11):3204-3209. 被引量：15
9徐冰冰,岑科廷,黄俊杰,沈华伟,程学旗.图卷积神经网络综述[J].计算机学报,2020,43(5):755-780. 被引量：345
10郭媛媛.人工智能融入中学地理教学过程:进展、挑战与应对[J].地理教学,2025(1):29-32. 被引量：11

引证文献4

1张帅,杨雪霞.基于文本—图像及流形插值的对抗模型[J].软件导刊,2020,19(8):216-220.
2马力,邹亚莉.嵌入自注意力机制的美学特征图像生成方法[J].计算机科学与探索,2021,15(9):1728-1739. 被引量：3
3谭红臣,黄世华,肖贺文,于冰冰,刘秀平.判别增强的生成对抗模型在文本至图像生成中的研究与应用[J].计算机工程与科学,2022,44(5):855-861. 被引量：1
4韩芳怡,周丹丹.生成式人工智能赋能地理课程资源开发与实践——以“Meshy AI平台构建甘洛滑坡动态模拟模型”为例[J].地理教学,2026(1):26-30.

二级引证文献4

1王威,李玉洁,郭富林,刘岩,何俊霖.生成对抗网络及其文本图像合成综述[J].计算机工程与应用,2022,58(19):14-36. 被引量：13
2张镭赋,高家骥.多模态图像局部极值点特征生成方法仿真[J].计算机仿真,2024,41(8):481-485. 被引量：1
3杨春苗,王杨,韩力英,孙赫彬.基于生成对抗网络的跨模态图像情感感知描述[J].计算机工程与科学,2025,47(5):894-901. 被引量：1
4王建华,崔鑫龙,陈渝,彭浩.生成式人工智能赋能艺术设计领域的研究述评与展望[J].包装工程,2025,46(16):387-400. 被引量：4

1杨桐,张姗姗,江方舟,李奕飞,俞戈昊,赵地.基于深度学习与自适应对比度增强的臂丛神经超声图像优化[J].计算机科学,2019,46(S11):236-240. 被引量：11
2李竹林,马燕,车雯雯.能力评判模型研究及其在程序设计类课程能力培养中的应用[J].延安大学学报（自然科学版）,2019,38(4):38-41.
3程吉云.微小超声探头及其临床应用[J].影像研究与医学应用,2019,3(20):158-159.
4孟莉.高质量发展的国际智慧：从经济角度评估纸机效益及工厂产品结构优化[J].中华纸业,2019,40(23):41-45.
5黄惠芳,凌玲,杨超敏.从语料难度角度评估国别教材的针对性[J].文学教育,2020,0(3):32-33.
6刘波.批评的动能和穿透力[J].长江丛刊,2019,0(28):16-16.
7孟庆霄,邵星灵,杨卫.基于扩张状态观测器的四旋翼无人机姿态受限控制[J].飞行力学,2019,37(6):34-39. 被引量：9
8高睿.基于改进组合权-Grey法的公路绿色施工评价研究[J].建筑施工,2019,41(12):2245-2249. 被引量：2
9杨龙,苏娟,李响.基于生成式对抗网络的合成孔径雷达舰船数据增广在改进单次多盒检测器中的应用[J].兵工学报,2019,40(12):2488-2496. 被引量：9
10Severin Sikanja.A Vision of the Planet of the Earth in the Next 300-500 Years under Climate Change with Proposed Measures to Mitigate the Effects of Climate Change[J].Open Journal of Forestry,2020,10(1):155-171.

北京航空航天大学学报

2019年第12期

浏览历史

内容加载中请稍等...

基于美学评判的文本生成图像优化被引量：4

同被引文献12

引证文献4

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于美学评判的文本生成图像优化 被引量：4

同被引文献12

引证文献4

二级引证文献4

相关作者

相关机构

相关主题

浏览历史

基于美学评判的文本生成图像优化被引量：4