本文主要是介绍coursera-斯坦福-机器学习-吴恩达-第11周笔记-ORC系统,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
coursera-斯坦福-机器学习-吴恩达-第11周笔记-ORC系统
- coursera-斯坦福-机器学习-吴恩达-第11周笔记-ORC系统
- 1图像ORC
- 1问题描述
- 2 滑动窗sliding windows
- 3获取大量的图片
- 4分析
- 2复习 quiz
- 1图像ORC
1图像ORC
1.1问题描述
在这一段介绍一种 机器学习的应用实例 照片OCR技术。 我想介绍这部分内容的原因 主要有以下三个 ,
1. 第一 我想向你展示 一个复杂的机器学习系统 是如何被组合起来的
2. 第二 我想介绍一下 机器学习流水线(machine learning pipeline)的有关概念, 以及在决定下一步做什么时, 如何分配资源。
3. 最后,通过介绍照片OCR问题 的机会来告诉你, 机器学习的诸多 有意思的想法和理念 。其中之一是如何将机器学习 应用到计算机视觉问题中, 第二是有关 人工数据合成(artificial data synthesis)的概念。
OCR技术 主要解决的问题是让计算机 读出照片中拍到的文字信息。
OCR pipeline的意思主要是把一个ML系统分割为几个连续的部分,如下图:
如果你有一个工程师的团队 在完成同样类似的任务, 那么通常你可以让 不同的人来完成 不同的模块 ,所以我可以假设 文字检测这个模块 需要大概1到5个人 ,字符分割部分 需要另外1到5个人 ,字母识别部分 还需要另外1到5个人。
在复杂的机器学习系统中 流水线的概念 已经渗透到各种应用中
1.2 滑动窗(sliding windows)
为了更好地介绍 图像的检测 ,我们从一个简单一点的例子开始, 我们先看这个探测行人的例子:
在行人检测中 你希望照一张相片 然后找出图像中 出现的行人。
这个问题似乎 比文字检测的问题更简单, 原因是 大部分的 行人都比较相似, 因此可以使用一个固定宽高比的 矩形来分离出你希望找到的行人。
我们要做的是 首先对这个图像取一小块长方形, 比如这是一个 82×36的图像块, 我们将这个图像块 ,通过我们训练得到的分类器 来确定 这个图像块中是不是有行人。 如果没问题的话&#
这篇关于coursera-斯坦福-机器学习-吴恩达-第11周笔记-ORC系统的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!