-
题名基于空间注意力及条件增强的文本生成图像方法
- 1
-
-
作者
马军
车进
贺愉婷
马鹏森
-
机构
宁夏大学电子与电气工程学院
宁夏沙漠信息智能感知重点实验室
-
出处
《山东大学学报(工学版)》
CSCD
北大核心
2024年第6期49-56,共8页
-
基金
国家自然科学基金资助项目(61861037)
宁夏大学研究生创新研究基金资助项目(CXXM202223)。
-
文摘
针对文本生成图像语义不一致、训练不稳定、生成图像单一等问题,在一种简单有效的文本生成图像基准模型上提出基于空间注意力及条件增强的文本生成图像模型。为提高训练过程的稳定性、增加生成图像的多样性,在原有模型基础上增加条件增强模型;从文本分布出发拟合图像分布,增加视觉特征的多样性,扩大表现空间,在原有的DF-Block模块中增加一层Affine仿射块。在判别器中加入空间注意力模型,提高文本与合成图像的语义一致性。试验结果表明,在CUB和Oxford-102数据集上,初始得分分别提高了2.05%和2.63%;在CUB和COCO数据集上,特征空间距离分别降低了20.73%和9.25%。本研究提出的模型生成的图像更具多样性且更接近真实图像。
-
关键词
文本生成图像
df-gan
条件增强模型
Affine仿射块
空间注意力模型
-
Keywords
text-to-images
df-gan
conditional augmentation model
Affine block
spatial attention model
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-