本文主要是介绍PSMNet:Pyramid Stereo Matching Network学习测试笔记03-如何训练网络,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
写在前面的话:
2019年09月28日18:02:55补充说明:CSDN博客发布版权更新,如果您看了博客并且用到PSMNet相关东西,请注明引用原作者的文章:
@inproceedings{chang2018pyramid,
title={Pyramid Stereo Matching Network},
author={Chang, Jia-Ren and Chen, Yong-Sheng},
booktitle={Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition},
pages={5410–5418},
year={2018}
}
这里开始看PSMNet源码
数据集如何组织输入不看,只看这个网络做了哪些工作。
if self.training: w, h = left_img.sizeth, tw = 256, 512x1 = random.randint(0, w - tw)y1 = random.randint(0, h - th)left_img = left_img.crop((x1, y1, x1 + tw, y1 + th))right_img = right_img.crop((x1, y1, x1 + tw, y1 + th))dataL = dataL[y1:y1 + th, x1:x1 + tw]processed = preprocess.get_transform(augment=False) left_img = processed(left_img)right_img = processed(right_img)return left_img, right_img, dataLelse:w, h = left_img.sizeprint('WARRING:\tw = %d\th = %d' % (w, h))left_img = left_img.crop((w-960, h-544, w, h))right_img = right_img.crop((w-960, h-544, w, h))processed = preprocess.get_transform(augment=False) left_img = processed(left_img)right_img = processed(right_img)return left_img, right_img, dataL
这里,是dataloader/SceneFlowLoader.py,数据输入经过预处理,如果是训练阶段,就会随机进行图像裁剪(常见的数据集扩充手法,还可以避免过拟合),如果是测试阶段,就会在原图上面添加四行空白作为扩充。另外preprocess还对输入的左右图像进行了预处理。
未完待续,因为转头整理发展路线去了,发现PSMNet就是PSPNet结合了GCNet
这篇关于PSMNet:Pyramid Stereo Matching Network学习测试笔记03-如何训练网络的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!