本文主要是介绍pix2pix在keras上的训练以及优化效果过程,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
pix2pix在keras上训练
- 1 背景
- 2 初步训练
- 3 优化
- 3.1. 工具类优化:
- 3.2 算法类优化
- 4. 优化效果
- 5. 存在的问题
- 6. 如果有什么建议可以评论联系我,一起来讨论下.
1 背景
pix2pix提供的示例是使用tensorflow,我我参考着来做了一个keras的实现,原项目中使用的是生成网络加上判别网络来提升生成网络,而我观察实际在训练中判别部分起到的作用比较小,所以我先尝试只使用生成网络来做训练.
具体的项目代码在:pix2pix-keras
2 初步训练
下图为迭代了80次之后在训练下的一个效果,纹理上是逐渐变清晰的.
但是问题是左上部分的几乎没到训练出效果.
3 优化
此问题的根本是在最后一层时左上部分的输出值过大.
为了定位解决此问题我尝试了几个角度的优化:
3.1. 工具类优化:
- 将所有layer的输出绘制成图像打出,用于观察在那一层开始出现的偏差
- 将所有layer的weight输出,用于观察是如何滚最后一层的时候出现过大数值.
- 将训练过程中每次样本产生梯度更新是的输入输出画出来观察是从那些步骤开始出现问题.
![将没一层输出可视化](https://img-blog.csdnimg.cn/2019122015281159.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2hscG93ZXI=,size_16,color_FFFFFF,t_70)![将所有训练步骤产生的跟新全部打出来](https://img-blog.csdnimg.cn/20191220150910498.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L2hscG93ZXI=,size_16,color_FFFFFF,t_70)
工具类代码均更新在git上.
最终定位到是是部分样本上由于光照和裁剪的问题
如遇到以下的样本,对训练引起的偏差较大.
图片中最下层是容易一起训练跑偏的样本,分析如,周边有几个黑色三角型的剪裁.将建筑物遮挡过多,但输入是未处理这些遮挡
3.2 算法类优化
为了更好训练,我重新审核了一次训练样本,将其中比较差的样本剔除,然后调整loss从mse到mae,之前使用平方是为了加大对误差的灵敏度,后来发现最后输出的数值过小平方反而降低了训练效率.另外为了提高训练速度吧batch该为了2,这个是我的内存能够加载的上限.
4. 优化效果
loss曲线如下:
不同epho下测试数据上效果:
总的来说相对于之前的效果好了不少.
5. 存在的问题
我把测试集所有的建筑物全部过了一遍发现以下问题:
- 纹理特征还是有一点模糊.
- 会丢失一些建筑物特有特征,如屋檐,窗帘,阳台等
- 输出墙面基本都是以灰土色为主,原本建筑物可能是红色墙面
原因分析: - 细致话的特征样本较少,如阳台虽然都拿绿色标记,但是不同建筑物的阳台各有风格,少量的样本对这种细的纹理特征较难学习到.
6. 如果有什么建议可以评论联系我,一起来讨论下.
这篇关于pix2pix在keras上的训练以及优化效果过程的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!