品玩8月25日讯,据 Arxiv 页面显示,中国科学技术大学近日联手新加坡管理大学发布一款图像生成模型 CgT-Gan。

CgT-GAN通过将图像纳入训练过程,使模型能够“看到”真实的视觉模态。具体来说,研究团队采用对抗训练来教导CgT-GAN模型模仿外部文本语料库的短语,同时利用基于CLIP的奖励机制提供语义指导。

实验结果显示,CgT-GAN在所有指标上明显优于现有的方法。

推荐内容