2019 CVPR|INIT:针对实例级的图像翻译

一.研究动机

近年来关于图像翻译的研究越来越多,其中比较经典的有监督模型包括Pix2Pix, BicycleGAN等,无监督模型包括CycleGAN, MUNIT, StarGAN, DRIT等。由于这些模型无论是针对多领域翻译还是单领域翻译都是将目标域图像的风格/属性整个迁移到源域图像上,因此虽然这些方法可以很好的解决风格统一或者内容相关的图像翻译问题,但对于有大量实例物体并且物体与背景之间的风格差异非常巨大的复杂结构图像翻译来说是很困难的。为了解决该问题作者基于MUNIT模型提出了基于端到端的训练模型INIT,其采用不同的风格编码来独立的翻译图像中的物体、背景以及全局区域。

在这里插入图片描述
图1.现有图像翻译模型的局限

二.模型架构

INIT的网络架构非常类似于MUNIT模型,但不同于MUNIT模型,作者提出的模型不仅对全局图像进行内容和属性编码,而且还对实例物体以及背景也进行内容-属性编码。即首先给定一对未对齐的图像和实例物体的坐标位置,应用全局编码器Eg以及局部编码器Eo分别获取全局图像和实例物体图像内容c和属性向量s,然后通过交换属性向量来获取跨域的目标实例对象图像,整个模型的架构如下图所示。
在这里插入图片描述
图2.INIT模型网络结构
另外作者修改了原始的循环重建过程使其不仅包括跨域(X域->Y域)模式重建还包括了跨粒度级(实例物体->全局图像࿰

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值