本文主要是介绍deep learning for image compression,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
说起“深度学习”,最近可是火的一塌糊涂啊,去年年末百度的语音识别取得成效之后,更是让人看到了deep learning广泛的应用前景。
最近老师提了一个用“深度学习”做图像压缩的想法,于是吭哧吭哧埋头研究学习了一段时间的deep learning,其中重点就是学习AutoEncoder。跟我一起做deep learning的师兄是用“深度学习”做识别,并且取得了不错的识别率,让老夫压力颇大。而我在做的过程中重构出来的图像总是不知所云,完全是错误的。我觉得应该是我的训练数据集太小,并且网络不够深(计算资源和数据量都不够),使得网络的表达能力没那么强。于是我把训练集限定为一些特定的对象集,最后还是能重构出来一个初步的结果,虽然在细节上还是模糊的,但是大体轮廓还是能体现出来,部分特征点明显的位置还是重构得比较好,还是小有成就感的。
最近读了一篇“K-SVD:An Algorithm for Designing Overcomplete Dictionaries for Sparse Representation"的paper,发现我用”深度学习“做的事情跟K-SVD其实本质上差不多,都是用固定的基做线性组合,来表示一个信号,而K-SVD实际上已经做的比较成熟了。估计最近会被老师派到百度的IDL学习一段时间,希望在更深入的了解了deep learning之后能有些新的启发和思路吧!
这篇关于deep learning for image compression的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!