手机也可以训练视频识别模型?麻省理工找到全新应用落地场景

本文主要是介绍手机也可以训练视频识别模型?麻省理工找到全新应用落地场景,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

近日,麻省理工学院和IBM沃森人工智能实验室的研究人员开发了一种新技术,可以在处理能力非常有限的手机或其他设备上训练视频识别模型。用户可以上传任何照片,并编辑建筑物、植物群和固定装置外观的工具。视觉识别作为深度学习的最强技能,已经成为了计算机视觉算法可用来分析医学图像,使自动驾驶汽车成为可能,并驱动人脸识别的发展。

通常算法将视频分割成图像帧,并在每个帧上运行识别算法。然后通过观察对象在随后的帧中的变化,将视频中显示的动作拼接在一起。该方法要求算法“记住”它在每一帧中看到的内容,以及它看到这些内容的顺序。新方法中,算法提取每一帧对象的基本草图,并将它们叠加起来。算法可以观察草图中物体在空间中的移动,而不是记住什么时候发生了什么。在测试中,研究人员发现,这种新方法训练视频识别模型的速度是现有方法的三倍。它还能通过一台小型电脑和照相机来识别手势,这些设备的电量仅够给自行车灯照明用。

这项新技术有助于减少现有计算机视觉商业应用中的延迟和计算成本。它可以通过加速自动驾驶汽车对传入视觉信息的反应,让它们变得更安全。还可以解锁以前无法实现的新应用,比如让手机帮助诊断病人或分析医学图像。

麻省理工学院和IBM沃森人工智能实验室的研究是这一日益增长的趋势的一部分,这种趋势将最先进的模型缩小到更易于管理的规模,也为计算机视觉领域找到了更多的落地方向。

当前计算机视觉的应用场景主要有以下几个方向:

人脸识别

相关数据显示人脸识别是人工智能计算机视觉领域中最热门的应用。人脸识别技术目前已经广泛应用于金融、司法、军队、公安、边检、政府、航天、电力、工厂、教育、医疗等行业。据业内人士分析,我国的人脸识别产业的需求旺盛,需求推动导致企业敢于投入资金。目前,该技术已具备大规模商用的条件,未来三到五年将高速增长。而今年,这一技术有望在金融与安防领域迎来大爆发。

代表企业:旷视科技、依图科技、商汤科技、极链科技、云从科技等。

视频监控

视频监控分析是人工智能计算机视觉领域中第二大热门应用。 人工智能技术可以对结构化的人、车、物等视频内容信息进行快速检索、查询。这项应用使得让公安系统在繁杂的监控视频中搜寻到罪犯的有了可能。在大量人群流动的交通枢纽,该技术也被广泛用于人群分析、防控预警等。

视频监控领域盈利空间广阔,商业模式多种多样,既可以提供行业整体解决方案,也可以销售集成硬件设备。将技术应用于视频及监控领域在人工智能公司中正在形成一种趋势,这项技术应用将率先在安防、交通甚至零售等行业掀起应用热潮。

代表企业:商汤科技、旷视科技、依图科技等。

图片识别分析

静态图片识别应用热度在视觉与图像领域中排名第三。将人工智能技术单纯用于图片识别分析的应用企业数量并不如预想的多,可能有以下几个方面原因:

1、目前视频监控方向的盈利空间大,众多企业的注意力都放在了视频监控领域。

2、人脸识别属于图片识别的一个应用场景,做人脸识别的大多数企业同时也在提供图片识别服务,但是销售效果不佳,主要赢利点还在于人脸识别。

3、图片识别大多商用场景还属于蓝海,潜力有待开发。

4、图片数据大多被大型互联网企业所掌握,创业公司数据资源稀少。

代表企业:旷视科技、极链科技、码隆科技等。

无人驾驶

随着汽车的普及,汽车已经成为人工智能技术非常大的应用投放方向,但就目前来说,想要完全实现自动驾驶/无人驾驶,距离技术成熟还有一段路要走。不过利用人工智能技术,汽车的驾驶辅助的功能及应用越来越多,这些应用多半是基于计算机视觉和图像处理技术来实现。

代表企业:纵目科技、Waymo、图森科技、驭势科技、佑驾创新、中天安驰等。

工业视觉

机器视觉可以快速获取大量信息,并进行自动处理。在自动化生产过程中,人们将机器视觉系统广泛地用于工况监视、成品检验和质量控制等领域。机器视觉系统的特点是提高生产的柔性和自动化程度。运用在一些危险工作环境或人工视觉难以满足要求的场合;此外,在大批量工业生产过程中,机器视觉检测可以大大提高生产效率和生产的自动化程度。

代表企业:创想智控、凯视佳、拓视觉、帆声图像、华睿科技等。

随着越来越多的人工智能研究被转化为应用,对更小模型的需求将会增加。国内也在计算机视觉领域加大了技术投资力度,诞生了诸如商汤科技、旷视科技、依图科技、极链科技等优秀的人工智能初创企业。未来,这些优秀的人工智能企业也会寻找到更多的落地场景,继续推动计算机视觉这一技术在应用场景快速落地。

这篇关于手机也可以训练视频识别模型?麻省理工找到全新应用落地场景的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/506482

相关文章

在Ubuntu上部署SpringBoot应用的操作步骤

《在Ubuntu上部署SpringBoot应用的操作步骤》随着云计算和容器化技术的普及,Linux服务器已成为部署Web应用程序的主流平台之一,Java作为一种跨平台的编程语言,具有广泛的应用场景,本... 目录一、部署准备二、安装 Java 环境1. 安装 JDK2. 验证 Java 安装三、安装 mys

Python中构建终端应用界面利器Blessed模块的使用

《Python中构建终端应用界面利器Blessed模块的使用》Blessed库作为一个轻量级且功能强大的解决方案,开始在开发者中赢得口碑,今天,我们就一起来探索一下它是如何让终端UI开发变得轻松而高... 目录一、安装与配置:简单、快速、无障碍二、基本功能:从彩色文本到动态交互1. 显示基本内容2. 创建链

Node.js 中 http 模块的深度剖析与实战应用小结

《Node.js中http模块的深度剖析与实战应用小结》本文详细介绍了Node.js中的http模块,从创建HTTP服务器、处理请求与响应,到获取请求参数,每个环节都通过代码示例进行解析,旨在帮... 目录Node.js 中 http 模块的深度剖析与实战应用一、引言二、创建 HTTP 服务器:基石搭建(一

你的华为手机升级了吗? 鸿蒙NEXT多连推5.0.123版本变化颇多

《你的华为手机升级了吗?鸿蒙NEXT多连推5.0.123版本变化颇多》现在的手机系统更新可不仅仅是修修补补那么简单了,华为手机的鸿蒙系统最近可是动作频频,给用户们带来了不少惊喜... 为了让用户的使用体验变得很好,华为手机不仅发布了一系列给力的新机,还在操作系统方面进行了疯狂的发力。尤其是近期,不仅鸿蒙O

java中VO PO DTO POJO BO DO对象的应用场景及使用方式

《java中VOPODTOPOJOBODO对象的应用场景及使用方式》文章介绍了Java开发中常用的几种对象类型及其应用场景,包括VO、PO、DTO、POJO、BO和DO等,并通过示例说明了它... 目录Java中VO PO DTO POJO BO DO对象的应用VO (View Object) - 视图对象

Python基于火山引擎豆包大模型搭建QQ机器人详细教程(2024年最新)

《Python基于火山引擎豆包大模型搭建QQ机器人详细教程(2024年最新)》:本文主要介绍Python基于火山引擎豆包大模型搭建QQ机器人详细的相关资料,包括开通模型、配置APIKEY鉴权和SD... 目录豆包大模型概述开通模型付费安装 SDK 环境配置 API KEY 鉴权Ark 模型接口Prompt

Python中异常类型ValueError使用方法与场景

《Python中异常类型ValueError使用方法与场景》:本文主要介绍Python中的ValueError异常类型,它在处理不合适的值时抛出,并提供如何有效使用ValueError的建议,文中... 目录前言什么是 ValueError?什么时候会用到 ValueError?场景 1: 转换数据类型场景

Go信号处理如何优雅地关闭你的应用

《Go信号处理如何优雅地关闭你的应用》Go中的优雅关闭机制使得在应用程序接收到终止信号时,能够进行平滑的资源清理,通过使用context来管理goroutine的生命周期,结合signal... 目录1. 什么是信号处理?2. 如何优雅地关闭 Go 应用?3. 代码实现3.1 基本的信号捕获和优雅关闭3.2

正则表达式高级应用与性能优化记录

《正则表达式高级应用与性能优化记录》本文介绍了正则表达式的高级应用和性能优化技巧,包括文本拆分、合并、XML/HTML解析、数据分析、以及性能优化方法,通过这些技巧,可以更高效地利用正则表达式进行复杂... 目录第6章:正则表达式的高级应用6.1 模式匹配与文本处理6.1.1 文本拆分6.1.2 文本合并6

python中的与时间相关的模块应用场景分析

《python中的与时间相关的模块应用场景分析》本文介绍了Python中与时间相关的几个重要模块:`time`、`datetime`、`calendar`、`timeit`、`pytz`和`dateu... 目录1. time 模块2. datetime 模块3. calendar 模块4. timeit