兔子哥哥带你漫游Wasserstein GAN
发布网友
发布时间:2024-10-20 05:24
我来回答
共1个回答
热心网友
时间:2024-11-16 04:06
兔子哥哥带你深入理解Wasserstein GAN
最初,我们了解到GAN并非只能通过DCGAN生成图像,但原始GAN在尝试生成MNIST手写数字时遇到了挑战,生成的图像全为噪点。这促使兔子哥哥转向Wasserstein GAN(WGAN),一篇改变观念的论文。WGAN优化目标并非原始GAN中的JS散度,而是Wasserstein距离,一个更严谨的度量方式。
Wasserstein距离,也称EM距离,是通过计算真实样本与生成样本之间的最小“消耗”来衡量两者间的差异。在WGAN中,生成器G的目标是减小样本间的Wasserstein距离,而判别器D的任务则是拟合样本间的距离,从分类任务转变为回归。这种改变使得模型训练更为稳定,避免了传统GAN中的梯度问题。
个人经验表明,虽然WGAN在理论上表现优秀,但实际应用中可能需要更多迭代和优化才能达到理想效果。如读者中有使用原始GAN成功生成高质量图片的朋友,欢迎分享交流。以下是使用WGAN对MNIST的初步尝试结果,还有待进一步提升。
最后,WGAN的理论基础源于[1701.07875] Wasserstein GAN论文,有兴趣的朋友可以参考。我的代码在Github上的MashiMaroLjc/learn-GAN项目中能找到。这只是一个学习心得分享,如有错误,期待您的指正和讨论。
插图来源:pixiv[63051614]