手机也可以训练视频识别模型?麻省理工找到全新应用落地场景

本文主要是介绍手机也可以训练视频识别模型?麻省理工找到全新应用落地场景,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

近日,麻省理工学院和IBM沃森人工智能实验室的研究人员开发了一种新技术,可以在处理能力非常有限的手机或其他设备上训练视频识别模型。用户可以上传任何照片,并编辑建筑物、植物群和固定装置外观的工具。视觉识别作为深度学习的最强技能,已经成为了计算机视觉算法可用来分析医学图像,使自动驾驶汽车成为可能,并驱动人脸识别的发展。

通常算法将视频分割成图像帧,并在每个帧上运行识别算法。然后通过观察对象在随后的帧中的变化,将视频中显示的动作拼接在一起。该方法要求算法“记住”它在每一帧中看到的内容,以及它看到这些内容的顺序。新方法中,算法提取每一帧对象的基本草图,并将它们叠加起来。算法可以观察草图中物体在空间中的移动,而不是记住什么时候发生了什么。在测试中,研究人员发现,这种新方法训练视频识别模型的速度是现有方法的三倍。它还能通过一台小型电脑和照相机来识别手势,这些设备的电量仅够给自行车灯照明用。

这项新技术有助于减少现有计算机视觉商业应用中的延迟和计算成本。它可以通过加速自动驾驶汽车对传入视觉信息的反应,让它们变得更安全。还可以解锁以前无法实现的新应用,比如让手机帮助诊断病人或分析医学图像。

麻省理工学院和IBM沃森人工智能实验室的研究是这一日益增长的趋势的一部分,这种趋势将最先进的模型缩小到更易于管理的规模,也为计算机视觉领域找到了更多的落地方向。

当前计算机视觉的应用场景主要有以下几个方向:

人脸识别

相关数据显示人脸识别是人工智能计算机视觉领域中最热门的应用。人脸识别技术目前已经广泛应用于金融、司法、军队、公安、边检、政府、航天、电力、工厂、教育、医疗等行业。据业内人士分析,我国的人脸识别产业的需求旺盛,需求推动导致企业敢于投入资金。目前,该技术已具备大规模商用的条件,未来三到五年将高速增长。而今年,这一技术有望在金融与安防领域迎来大爆发。

代表企业:旷视科技、依图科技、商汤科技、极链科技、云从科技等。

视频监控

视频监控分析是人工智能计算机视觉领域中第二大热门应用。 人工智能技术可以对结构化的人、车、物等视频内容信息进行快速检索、查询。这项应用使得让公安系统在繁杂的监控视频中搜寻到罪犯的有了可能。在大量人群流动的交通枢纽,该技术也被广泛用于人群分析、防控预警等。

视频监控领域盈利空间广阔,商业模式多种多样,既可以提供行业整体解决方案,也可以销售集成硬件设备。将技术应用于视频及监控领域在人工智能公司中正在形成一种趋势,这项技术应用将率先在安防、交通甚至零售等行业掀起应用热潮。

代表企业:商汤科技、旷视科技、依图科技等。

图片识别分析

静态图片识别应用热度在视觉与图像领域中排名第三。将人工智能技术单纯用于图片识别分析的应用企业数量并不如预想的多,可能有以下几个方面原因:

1、目前视频监控方向的盈利空间大,众多企业的注意力都放在了视频监控领域。

2、人脸识别属于图片识别的一个应用场景,做人脸识别的大多数企业同时也在提供图片识别服务,但是销售效果不佳,主要赢利点还在于人脸识别。

3、图片识别大多商用场景还属于蓝海,潜力有待开发。

4、图片数据大多被大型互联网企业所掌握,创业公司数据资源稀少。

代表企业:旷视科技、极链科技、码隆科技等。

无人驾驶

随着汽车的普及,汽车已经成为人工智能技术非常大的应用投放方向,但就目前来说,想要完全实现自动驾驶/无人驾驶,距离技术成熟还有一段路要走。不过利用人工智能技术,汽车的驾驶辅助的功能及应用越来越多,这些应用多半是基于计算机视觉和图像处理技术来实现。

代表企业:纵目科技、Waymo、图森科技、驭势科技、佑驾创新、中天安驰等。

工业视觉

机器视觉可以快速获取大量信息,并进行自动处理。在自动化生产过程中,人们将机器视觉系统广泛地用于工况监视、成品检验和质量控制等领域。机器视觉系统的特点是提高生产的柔性和自动化程度。运用在一些危险工作环境或人工视觉难以满足要求的场合;此外,在大批量工业生产过程中,机器视觉检测可以大大提高生产效率和生产的自动化程度。

代表企业:创想智控、凯视佳、拓视觉、帆声图像、华睿科技等。

随着越来越多的人工智能研究被转化为应用,对更小模型的需求将会增加。国内也在计算机视觉领域加大了技术投资力度,诞生了诸如商汤科技、旷视科技、依图科技、极链科技等优秀的人工智能初创企业。未来,这些优秀的人工智能企业也会寻找到更多的落地场景,继续推动计算机视觉这一技术在应用场景快速落地。

这篇关于手机也可以训练视频识别模型?麻省理工找到全新应用落地场景的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/506482

相关文章

用js控制视频播放进度基本示例代码

《用js控制视频播放进度基本示例代码》写前端的时候,很多的时候是需要支持要网页视频播放的功能,下面这篇文章主要给大家介绍了关于用js控制视频播放进度的相关资料,文中通过代码介绍的非常详细,需要的朋友可... 目录前言html部分:JavaScript部分:注意:总结前言在javascript中控制视频播放

Python基于wxPython和FFmpeg开发一个视频标签工具

《Python基于wxPython和FFmpeg开发一个视频标签工具》在当今数字媒体时代,视频内容的管理和标记变得越来越重要,无论是研究人员需要对实验视频进行时间点标记,还是个人用户希望对家庭视频进行... 目录引言1. 应用概述2. 技术栈分析2.1 核心库和模块2.2 wxpython作为GUI选择的优

Python中随机休眠技术原理与应用详解

《Python中随机休眠技术原理与应用详解》在编程中,让程序暂停执行特定时间是常见需求,当需要引入不确定性时,随机休眠就成为关键技巧,下面我们就来看看Python中随机休眠技术的具体实现与应用吧... 目录引言一、实现原理与基础方法1.1 核心函数解析1.2 基础实现模板1.3 整数版实现二、典型应用场景2

Java的IO模型、Netty原理解析

《Java的IO模型、Netty原理解析》Java的I/O是以流的方式进行数据输入输出的,Java的类库涉及很多领域的IO内容:标准的输入输出,文件的操作、网络上的数据传输流、字符串流、对象流等,这篇... 目录1.什么是IO2.同步与异步、阻塞与非阻塞3.三种IO模型BIO(blocking I/O)NI

Python Dash框架在数据可视化仪表板中的应用与实践记录

《PythonDash框架在数据可视化仪表板中的应用与实践记录》Python的PlotlyDash库提供了一种简便且强大的方式来构建和展示互动式数据仪表板,本篇文章将深入探讨如何使用Dash设计一... 目录python Dash框架在数据可视化仪表板中的应用与实践1. 什么是Plotly Dash?1.1

基于Flask框架添加多个AI模型的API并进行交互

《基于Flask框架添加多个AI模型的API并进行交互》:本文主要介绍如何基于Flask框架开发AI模型API管理系统,允许用户添加、删除不同AI模型的API密钥,感兴趣的可以了解下... 目录1. 概述2. 后端代码说明2.1 依赖库导入2.2 应用初始化2.3 API 存储字典2.4 路由函数2.5 应

Python实现自动化接收与处理手机验证码

《Python实现自动化接收与处理手机验证码》在移动互联网时代,短信验证码已成为身份验证、账号注册等环节的重要安全手段,本文将介绍如何利用Python实现验证码的自动接收,识别与转发,需要的可以参考下... 目录引言一、准备工作1.1 硬件与软件需求1.2 环境配置二、核心功能实现2.1 短信监听与获取2.

Android Kotlin 高阶函数详解及其在协程中的应用小结

《AndroidKotlin高阶函数详解及其在协程中的应用小结》高阶函数是Kotlin中的一个重要特性,它能够将函数作为一等公民(First-ClassCitizen),使得代码更加简洁、灵活和可... 目录1. 引言2. 什么是高阶函数?3. 高阶函数的基础用法3.1 传递函数作为参数3.2 Lambda

Java中&和&&以及|和||的区别、应用场景和代码示例

《Java中&和&&以及|和||的区别、应用场景和代码示例》:本文主要介绍Java中的逻辑运算符&、&&、|和||的区别,包括它们在布尔和整数类型上的应用,文中通过代码介绍的非常详细,需要的朋友可... 目录前言1. & 和 &&代码示例2. | 和 ||代码示例3. 为什么要使用 & 和 | 而不是总是使

使用PyTorch实现手写数字识别功能

《使用PyTorch实现手写数字识别功能》在人工智能的世界里,计算机视觉是最具魅力的领域之一,通过PyTorch这一强大的深度学习框架,我们将在经典的MNIST数据集上,见证一个神经网络从零开始学会识... 目录当计算机学会“看”数字搭建开发环境MNIST数据集解析1. 认识手写数字数据库2. 数据预处理的