【图像识别】心得小结(育儿手册)

2023-11-01 02:21

本文主要是介绍【图像识别】心得小结(育儿手册),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

最近又来了很多师弟都在埋头搞图像,但都理不清头绪,迫于导师交待的任务纷纷求教。这里我总结了点经验,或者说育儿手册吐舌笑脸

A、图像识别就像在教小孩辩物,要向他解释目标的主要特征;

   (尽量用他知道的特征,否则还需要解释每个特征的定义)

例如识别矩形,那么可以告诉他 矩形由4条直线段组成(因为他学过hough变换),相交的线段彼此垂直(斜率互为负倒数)……

X20ABVWBAY%1[8PCASE~HL6


B、有时感觉特征太多则退而求其次,解释目标与视野中其他对象的区别就好;

例如识别车辆,你需要教他什么是车。

如果场景中只有车辆在动,那么只要告诉他“会动的就是车辆”,这样子只要解释什么是“动”这个特征,或者什么是“不动”也就是“静止”或者“没有变化”(考虑给他借本“帧差法”教材,或者进阶的“光流法”)他就懂了,至少在当前场景下正确……

 

未标题-3


C、另外这个小孩目前数学(客观)学的好,语文(主观)特别差,为了让他学习得更有效率,最好用数学去描述,免得还要先给他补习语文;

还是车辆识别,如果场景非常单调,只有一色的地面跟车,那么你会说“那就是车”。

“那”这个词解释非常麻烦,还需要配合指定方向。你可以换个说法,就是“他看到的物体就是车”,这样你只要解释什么是“物体”,比如物体有“形状”也就是有“轮廓”(边缘检测的话他会很多方法sobel、canny不要太基础)。

未标题-2


D、他会非常听话,但也非常较真,或者特别敏感;

例如,你觉得视野里只有地面跟车,但他能发现很多细小的“物体”,比如地上的小石头、车的阴影。你可以让他不敏感(模糊或者说滤波,eg. 均值、中值、高斯,并规定亮度的阈值);再保险一些,你还可能告诉它只有“大”的物体才是车。“大”这个词比较模糊,所幸补习起来不太难——因为“大”是相对的,如果不想再解释什么是“小石头”的话,你最好给他一个已知的参照物,比如他的“视野范围”,最后你跟他说“占了你视野1/3的那个物体就是车”……

 

u=72227056,216711126&fm=21&gp=0


E、他可以有一些基础,但多数情况是在某个领域\场景下我们必须从零教起;

因此我们需要耐心与信任,因为他是个天才;也因为他是个天才,如果他做错了,唯一的可能就是我们教的不对,幸运的是我们可以一次次重来。

 

u=2605296290,461568325&fm=21&gp=0


F、其实不止是图像识别,机器学习甚至人工智能,我们都可以把电脑看成一个乖孩子……

你可以通过一些描述/特征去教他,也可以利用训练让他自己摸索——告诉他的越多,他所认识到的越接近真相(但这样我们往往很难知道他对真相的认知/解释是否真的跟我们完全一样,甚至他可能从另一个角度给出一个当前足够自洽的真相)。

 

 

Y]0862%10$Y8_2F[%0D292H

转载于:https://www.cnblogs.com/KC-Mei/p/4582263.html

这篇关于【图像识别】心得小结(育儿手册)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/319811

相关文章

分布式系统的个人理解小结

分布式系统:分的微小服务,以小而独立的业务为单位,形成子系统。 然后分布式系统中需要有统一的调用,形成大的聚合服务。 同时,微服务群,需要有交流(通讯,注册中心,同步,异步),有管理(监控,调度)。 对外服务,需要有控制的对外开发,安全网关。

linux dlopen手册翻译

名称 dlclose, dlopen, dlmopen 打开和关闭一个共享对象 简介 #include <dlfcn.h>void *dlopen(const char*filename, int flags);int dlclose(void *handle);#define _GNU_SOURCE#include <dlfcn.h>void *dlmoopen(Lmid_t lm

Linux环境配置中问题小结

在Linux环境配置中,遇到问题首先猜测: 1、是否是权限问题; 2、软连接是否配置;

Git命令文本手册

git init # 初始化本地git仓库(创建新仓库)git config --global user.name "xxx" # 配置用户名git config --global user.email "xxx@xxx.com"

Resnet图像识别入门——残差结构

桃树、杏树、梨树,你不让我,我不让你,都开满了花赶趟儿。红的像火,粉的像霞,白的像雪。花里带着甜味儿;闭了眼,树上仿佛已经满是桃儿、杏儿、梨儿。花下成千成百的蜜蜂嗡嗡地闹着,大小的蝴蝶飞来飞去。野花遍地是:杂样儿,有名字的,没名字的,散在草丛里,像眼睛,像星星,还眨呀眨的。 朱自清在写《春》的时候,或许也没有完全认清春天的所有花,以至于写出了“有名字的,没名字的,散在草丛中”这样的句子。

long long,_int64使用小结

前言:   在16位环境下,int/unsigned int 占16位,long/unsigned long占32位   在32位环境下,int占32位,unsigned int占16位,long/unsigned long占32位 何时需要使用:   long 和 int 范围是[-2^31,2^31),即-2147483648~2147483647,而unsigned范围是[0,2^32),

密码学读书笔记小结

密码学是保证消息的私密性和完整性以及消息认证的基础。加密算法的选择和密钥的管理是安全机制的效率、性能和可用性的关键。 公钥加密算法: 分发密钥比较容易,但是对大数据量的加密性能较差密钥加密算法: 更适合大批的加密任务混合型加密协议: 例如TLS,先用公钥加密建立一个安全通道,然后使用通道交换密钥,并将此密钥用于后续数据交换。 对分布式系统攻击的分类: 窃听: 未经授权获得消息副本伪装: 在未

SMIDI-SAP接口配置手册

目录 一、 SAPERP相关接口配置(必要条件) 1. SAP ERP 配置 1.1 配置

五一假期出行必备的高科技手册

今天小编看了眼朋友圈,发现无节操的同学真是太多了,你们出去玩就好了,为啥要发图呢……各种晒,简直要虐死上班狗啊。 不过掐指一算,小编期盼已久的五一马上就要来了。抱着拯救同样期待假期出行同胞们的想法,小编给大家准备了一份出行旅游必备的高科技手册,助大家防火防水防(yi)搭(yue)讪( pao),下面将会开启高(zhuang)冷(BI)模式,如有雷同,纯属故意。 攻略篇 攻略在手,说走就走。

【python 百度指数抓取】python 模拟登陆百度指数,图像识别百度指数

一、算法思想 目的奔着去抓取百度指数的搜索指数,搜索指数的爬虫不像是其他爬虫,难度系数很高,分析之后发现是图片,坑爹的狠,想了下,由于之前做过身份证号码识别,验证码识别之类,豁然开朗,不就是图像识别麽,图像识别我不怕你,于是就有了思路,果然有异曲同工之妙,最后成功被我攻破了,大致思路如下: 1、首先得模拟登陆百度账号(用selenium+PhantomJS模拟登陆百度,获取cookie) 2