这篇论文中使用的损失函数是基于CycleGAN的标准损失函数,同时结合了Channel Attention Mechanism(通道注意力机制)来进一步提高模型性能。具体来说,该方法设计了以下四个损失函数:
- Adversarial Loss(对抗性损失):CycleGAN最基本的目标是让生成器G和判别器D之间进行对抗训练,以使得生成器能够生成与真实图像相似的假图像,并且判别器无法区分真假图像。因此,对于每个域i,Adversarial Loss可以表示为:
L_GAN(G_i, Di) = E{x_j \sim p_j(x_j)}[log(D_i(xj))] + E{z_i \sim p_z(z_i)}[log(1-D_i(G_i(z_i)))]
其中x_j表示从真实域j中采样得到的图像,z_i表示从噪声分布p_z采样得到的随机向量。
- Cycle Consistency Loss(循环一致性损失):为了保证转换后的图像在语义上保持不变,CycleGAN引入了循环一致性损失。即将一个真实图像通过生成器G映射到另一个域并再次通过反向映射回原始域时应该恢复为原始图像。因此,在每个域i中,循环一致性损失可以表示为:
L_{cyc}(G_i, Fi) = E{x_j \sim p_j(x_j)}[|F_i(G_i(x_j))-x_j|1] + E{z_i \sim p_z(z_i)}[|G_i(F_i(z_i))-z_i|_1]
其中F_i表示域i到另一个域的反向映射器。
- Identity Loss(恒等性损失):在某些情况下,输入图像与输出图像应该是相同的。例如,在人脸转换中,如果输入和输出是同一人的不同照片,则应该保持身份不变。因此,在每个域i中,恒等性损失可以表示为:
L_{idt}(G_i,Fi) = E{x_j \sim p_j(x_j)}[|G_i(x_j)-x_j|1] + E{z_i \sim p_z(z_i)}[|F_i(z_i)-z_i|_1]
- Channel Attention Loss(通道注意力损失):通过对生成器G和判别器D引入Channel Attention Mechanism,可以进一步提高模型性能。具体来说,该机制使得网络更加关注重要的特征通道,以便更好地区分不同类别之间的差异。因此,在每个域i中,通道注意力损失可以表示为:
L_{att}(G,D) = \sumk|\frac{1}{N}\sum{j=1}^N(G(x_j)_k-\mu_k)\odot A_k-D(x_j)_k|_2
其中G(x_j)_k表示生成器G在第k个通道上对输入图像x_j的输出,\mu_k表示该通道上所有样本的均值,A_k是Channel Attention Mechanism得到的权重矩阵,\odot表示逐元素相乘。
最终,总损失函数可以表示为:
L(G,D) = \sum_i(L_GAN(G_i, Di) + \lambda L{cyc}(G_i, Fi) + \alpha L{idt}(G_i,Fi)) + \beta L{att}(G,D)
其中,\lambda、\alpha和\beta分别是循环一致性损失、恒等性损失和通道注意力损失的超参数。