【大厂AI课学习笔记NO.51】2.3深度学习开发任务实例(4)计算机视觉实际应用的特点

本文主要是介绍【大厂AI课学习笔记NO.51】2.3深度学习开发任务实例(4)计算机视觉实际应用的特点,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

今天考试通过腾讯云人工智能从业者TCA级别的认证了!

还是很开心的,也看不到什么更好的方向,把一切能利用的时间用来学习,总是对的。

我把自己考试通过的学习笔记,都分享到这里了,另外还有一个比较全的思维脑图,我导出为JPG文件了。下载地址在这里:https://download.csdn.net/download/giszz/88868909

这个号码真好,88868909,我喜欢。

今天来总结计算机视觉实际应用的特点。

机器学习和深度学习,总算是搞明白了。今天考试,有好几个考点,都和这个有关系。

我理解的机器学习和深度学习的区别和联系

  • 机器学习包含了深度学习;
  • 深度学习主要是神经网络技术,这是Hinton这个大神,也就是人工智能之父,40年坚持的结果;
  • 机器学习主要是特征工程的存在,有标注,也有标签,深度学习也需要数据标注,但是基本不需要做特征工程,也就是人工进行数据预处理、特征抽取、特征选择、特征这些工作;
  • 深度学习只关注端到端,就是输入到输出的过程。其中也有多隐层神经网络等,在例子中的前馈神经网络,是最简单的神经网络模型;
  • 机器学习由于有人的参与,所以可解释性很强,很多时候其实是为了特定任务而去做的,普适性不是很强,而深度学习,自己就能学习;
  • 比如在图片分类中,机器学习要对图片进行特征工程,就是打标签,找出汽车车身的特征,而深度学习,直接用卷积算法就可以,滑动窗口,整个图片使用同一个权重,得到特征值,通过多层神经网络,学习哪个是汽车;
  • 所以说机器学习是人工来提取特征,深度学习是从数据中创建新的特征;
  • 机器学习要把复杂的工作,拆分为小的任务,逐个攻克;深度学习只关注端到端;
  • 机器学习可以使用少量的数据,就能预测,而深度学习不行;
  • 机器学习用低性能的计算机就能计算,而深度学习不行;

大概就是这样。

这是整个人工智能课程的核心。

当然,现在大家都普遍关心的,是sora,大模型LLM等,这肯定更有魅力的应用方向。大模型的出现,让人工智能真的是走向了新的高峰。

有人说,之前的人工智能,都是针对特定任务的,没有普适性。从大模型的出现来看,AGI也许已经在某个实验室里面实现了。

AGI是Artificial General Intelligence的首字母缩写,意为人工通用智能,也称为强人工智能。它指的是一种具有类似于人类全面智能的人工智能系统,可以处理不同领域的任务和问题,包括学习、推理、理解语言、感知环境、创造性思考等多种能力。与只能处理特定任务的狭窄人工智能(Narrow AI)不同,AGI旨在实现人类智能的全面模拟,并可以在不同场景和任务中表现出与人类相似的智能水平。

AGI的实现需要融合多个领域的知识和技术,包括机器学习、自然语言处理、计算机视觉、机器人技术等,同时也需要解决许多挑战和难题,如理解自然语言、掌握常识知识、具备有效的推理能力、能够感知和适应不同的环境等。

虽然AGI的实现仍面临着许多挑战和风险,如数据隐私、伦理道德等问题,但其对人类社会的影响和意义是巨大的。AGI可以帮助我们解决许多重大问题,如环境保护、医疗保健、安全保障等,同时也可以在各个领域中充当人类的助手、合作伙伴甚至是导师的角色,推动人类社会的进步和发展。

因此,AGI是当前人工智能领域的一个重要研究方向,也是未来人工智能发展的一个重要趋势。

言归正传,我们今天该学习机器视觉的一些普通特性了。

看,就是这些核心的内容。

很多朋友又要感觉没意思了,觉得没有关键技术名词,没有英文对照,没有示例代码等等。

其实,这些理念,是更重要的东西。

当前我们的任务,是要给玩具小车,加上自动识别标识牌的能力,我们暂且不管,边缘端的情况,我们来看这些要注意的事项。

  • 样本具象化。图像是具体表现形式,除了主体外,还有大量的信息,如背景,光照等。
  • 算法光线敏感性。侧光,面向光,背光,强光,暗光,都有影响,如果样本没有这些光线的图片,效果会欠佳。
  • 理解硬件条件可能造成的图片效果偏差。带来色差、模糊、角度变化,样本如果没有这些资料,效果会欠佳。
  • 客户理解的偏差。不理解光线影响,不能清晰的表达述求,都在需求梳理时摸清,否则影响交付。

前面都好说,有经验的项目人员,就能知道怎么来理解了。

最后的客户理解偏差,反而是我在实践中,感觉最头疼的。

客户认为,这不是很简单的事吗!

这要很久吗?!

这那个什么什么公司,不是早就做出来了吗?我们只是要做个一样的,甚至还更简答的而已!

好吧,客户不知道,除了识别这些标志,我们还要看,你这个场地,有什么特点,光线,硬件条件等等,包括这些小车搭载的摄像机,是多少分辨率!

延伸学习:


在计算机视觉的实际应用中,有许多关键的注意事项和经验,这些可以影响算法的准确性和效率。以下是一些主要的考虑因素:

  1. 图像质量:高质量的图像对于计算机视觉算法至关重要。图像的清晰度、分辨率和噪声水平都会影响算法的性能。因此,在实际应用中,需要确保使用的图像采集设备能够提供高质量的图像,或者采用图像增强技术来改善图像质量。
  2. 光照条件:光照条件是影响计算机视觉算法性能的另一个重要因素。不同的光照条件(如亮度、颜色温度、方向等)会对图像的外观产生显著影响,从而影响算法的准确性。为了解决这个问题,可以采用背景光照补偿技术、阴影去除技术等,以提升计算机视觉系统的鲁棒性。同时,在实际应用中,应尽量选择光线充足、均匀的环境,避免强光和暗光交替的情况出现。
  3. 数据集偏差:训练数据集的选择和准备对于计算机视觉算法的性能至关重要。如果训练数据集中存在偏差,比如样本不平衡、类别不均衡等,可能导致算法的泛化能力下降。为了解决这个问题,可以采用数据集采样均衡化、数据增强等技术,以改善模型的性能。同时,应注意数据的质量和多样性,确保数据集具有足够的标签和多样的样本。
  4. 镜头选择:在计算机视觉应用中,镜头的选择也会影响图像的质量和算法的准确性。不同的镜头有不同的焦距、光圈和景深等特性,这些特性会影响图像的清晰度和细节表现。因此,在实际应用中,应根据具体的需求选择合适的镜头。
  5. 避免畸变:在定位及高精度测量的系统中,畸变是一个需要特别注意的问题。畸变会导致图像中的物体形状发生扭曲,从而影响算法的准确性。为了解决这个问题,可以采用畸变校正技术,或者在系统标定时使用远心镜头等特殊镜头来减小畸变的影响。
  6. 恰当的照明与曝光:照明和曝光是影响图像质量的关键因素之一。如果照明不足或曝光过度,图像将不能提供足够的反差和细节信息,这将严重影响算法的准确性。因此,在实际应用中,需要选择适合的灯源和曝光设置,以确保图像具有足够的反差和细节信息。同时,还应注意系统周围环境的影响,避免其他光源对图像产生干扰。
  7. 算法选择与调优:对于不同的视觉任务,可能有多种不同的算法可供选择。在实际应用中,应根据任务的要求和数据集的特点选择合适的算法,并进行必要的调优。这包括选择合适的网络结构、调整超参数、使用正则化技术等手段来提高算法的准确性和效率。
  8. 实时性与性能平衡:在计算机视觉应用中,实时性和性能之间往往存在一定的权衡关系。为了提高算法的实时性,可能需要牺牲一部分性能;反之,为了提高性能,可能需要增加计算复杂度和时间成本。因此,在实际应用中,需要根据具体的需求和场景来平衡实时性和性能之间的关系。

总之,在计算机视觉的实际应用中,需要考虑多个方面的因素来确保算法的准确性和效率。通过注意以上提到的注意事项和经验,可以更好地应用计算机视觉技术来解决实际问题。

这篇关于【大厂AI课学习笔记NO.51】2.3深度学习开发任务实例(4)计算机视觉实际应用的特点的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/744784

相关文章

HarmonyOS学习(七)——UI(五)常用布局总结

自适应布局 1.1、线性布局(LinearLayout) 通过线性容器Row和Column实现线性布局。Column容器内的子组件按照垂直方向排列,Row组件中的子组件按照水平方向排列。 属性说明space通过space参数设置主轴上子组件的间距,达到各子组件在排列上的等间距效果alignItems设置子组件在交叉轴上的对齐方式,且在各类尺寸屏幕上表现一致,其中交叉轴为垂直时,取值为Vert

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

这15个Vue指令,让你的项目开发爽到爆

1. V-Hotkey 仓库地址: github.com/Dafrok/v-ho… Demo: 戳这里 https://dafrok.github.io/v-hotkey 安装: npm install --save v-hotkey 这个指令可以给组件绑定一个或多个快捷键。你想要通过按下 Escape 键后隐藏某个组件,按住 Control 和回车键再显示它吗?小菜一碟: <template

中文分词jieba库的使用与实景应用(一)

知识星球:https://articles.zsxq.com/id_fxvgc803qmr2.html 目录 一.定义: 精确模式(默认模式): 全模式: 搜索引擎模式: paddle 模式(基于深度学习的分词模式): 二 自定义词典 三.文本解析   调整词出现的频率 四. 关键词提取 A. 基于TF-IDF算法的关键词提取 B. 基于TextRank算法的关键词提取

水位雨量在线监测系统概述及应用介绍

在当今社会,随着科技的飞速发展,各种智能监测系统已成为保障公共安全、促进资源管理和环境保护的重要工具。其中,水位雨量在线监测系统作为自然灾害预警、水资源管理及水利工程运行的关键技术,其重要性不言而喻。 一、水位雨量在线监测系统的基本原理 水位雨量在线监测系统主要由数据采集单元、数据传输网络、数据处理中心及用户终端四大部分构成,形成了一个完整的闭环系统。 数据采集单元:这是系统的“眼睛”,

Hadoop企业开发案例调优场景

需求 (1)需求:从1G数据中,统计每个单词出现次数。服务器3台,每台配置4G内存,4核CPU,4线程。 (2)需求分析: 1G / 128m = 8个MapTask;1个ReduceTask;1个mrAppMaster 平均每个节点运行10个 / 3台 ≈ 3个任务(4    3    3) HDFS参数调优 (1)修改:hadoop-env.sh export HDFS_NAMENOD

【前端学习】AntV G6-08 深入图形与图形分组、自定义节点、节点动画(下)

【课程链接】 AntV G6:深入图形与图形分组、自定义节点、节点动画(下)_哔哩哔哩_bilibili 本章十吾老师讲解了一个复杂的自定义节点中,应该怎样去计算和绘制图形,如何给一个图形制作不间断的动画,以及在鼠标事件之后产生动画。(有点难,需要好好理解) <!DOCTYPE html><html><head><meta charset="UTF-8"><title>06

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

学习hash总结

2014/1/29/   最近刚开始学hash,名字很陌生,但是hash的思想却很熟悉,以前早就做过此类的题,但是不知道这就是hash思想而已,说白了hash就是一个映射,往往灵活利用数组的下标来实现算法,hash的作用:1、判重;2、统计次数;