AI 实战训练营(Class 1)OpenMMLab 概述

2023-10-13 17:10

本文主要是介绍AI 实战训练营(Class 1)OpenMMLab 概述,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

AI 实战训练营(Class 1)OpenMMLab 概述

    • OpenMMLab 概述
  • OpenMMLab各开源算法库详细介绍
    • 明星算法库:MMDetection
    • MMYOLO
    • MMOCR
    • MMDetection3D
    • MMRotate
    • MMSegmentation
    • MMpretrain
    • MMpose
    • MMHuman3D
    • MMAction2
    • MMagic
    • MMDeploy
    • Playground
  • OpenMMLab开源生态

OpenMMLab 概述

OpenMMLab诞生于2018年,是一个由中国开发者主导,有国际影响力的人工智能·
计算机视觉开源算法体系。
OpenMMLab是开源社区的后起之秀
OpenMMLab累计开源超过30个算法库、2400个预训练模型,涵盖图像识别分类、目 标检测、图像分割、姿态估计、视频理解、OCR、3D目标检测、3D人体姿态估计、模 型轻量化、自监督、少样本、光流、预训练、多模态、AIGC、推理部署等等计算机 视觉任务,在Github上累计获得十万颗star,超过了Pytorch。

OpenMMLab的构成

无论是巨头公司做商业产品,研究机构发顶会论文,各行各业做AI应用,大学生做毕 业设计,中小学生参加科创竞赛,都可以站在OpenMMLab巨人肩膀上,开箱即用, 开发自己的人工智能项目。 也许大家的下一个课程作业,下一场kaggle竞赛,下一 篇毕业论文,下一家入职的公司,就能用到OpenMMLab。

面向人群

OpenMMLab所有算法库都在Github上免费开源,并且有专人维护,我们可以进入每 个算法库的Github主页,点star或者提issue、提PR,下载所有的源代码和模型文 件。
OpenMMLab 整体框架

OpenMMLab 包含了多个项目,涵盖了图像分类、目标检测、语义分割、人脸识别、人体姿态估计、视频理解、文本生成等多个任务。每个项目都提供了灵活的配置系统、丰富的数据增强、模块化的设计和易于扩展的接口,以满足不同场景的需求。

其中包含的领域有:

  • 学术:提供高质量代码框架和算法基准,促进学术界健康、快速发展。
  • 产业:缩短算法落地链条,促进产学研打通;为行业降本增效。
  • 生态:提高中国在 AI 生态上的话语权;促进上下游企业发展。
  • 人才:行程持续成长的开源社区,促进 AI 行业人才成长;构建课程体系,助力人才培养。

OpenMMLab各开源算法库详细介绍

明星算法库:MMDetection

目标检测算法库MMDetection,它可以解决目标检测实例分割全景分割 和目标追踪任务 这是OpenMMLab在业界最有影响力的算法库,在github上有2万多star~
在这里插入图片描述
OpenMMLab是开源算法体系,它已经提供了各个计算机视觉方向的大量开箱即用的 预训练模型和算法。也就是说 OpenMMLab的算法研究员已经帮我们把这些cv任务的常见算法都现好了!
MMDetection被广泛用于学术界和工业界,很多顶会论文,很多比赛的冠军,很多 商业落地的产品都是基于MMDetection实现的!

MMYOLO

目标检测算法:MMYOLO,它是专门用来解决YOLO目标检测问题 的,它的特点就是特别快!!!
在这里插入图片描述

MMOCR

OpenMMLab还有一个文字检测识别的算法库,叫做MMOCR,那这也是计算机视觉很 古老的一个经典问题了,它主要解决三类问题,文本检测就是把图像上的文本区域抠 出来,或者说画出来,文本识别呢是把文字的内容识别出来,关键信息提取呢是对一 些结构化的票据,证件牌照来进行信息的提取。在这里插入图片描述

MMDetection3D

MMDetection3D是专门做3D目标检测的算法库,这个在无人驾驶中用的特别多,要 通过激光雷达和毫米波雷达,感知无人驾驶车周围的3d点云数据,来进行3d目标检 测,很多无人驾驶的初创公司都使用MMDetection3D来实现自己的无人驾驶算法。在这里插入图片描述

MMRotate

MMRotate是专门做旋转目标检测算法库,在传统的目标检测框是横平竖直的,但是 在旋转目标检测框有方向,比如说不同方向的车,不同方向的船,那这是一个比较小 众的研究领域,如果你的研究领域恰恰是旋转框目标检测,那MMRotate将是你最佳 的学习资料!在这里插入图片描述

MMSegmentation

MMSegmentation是专门做图像分割,特别是语义分割的算法库,在街景,在无人 驾驶遥感图像医疗领域,语义分割都是非常重要的算法,任务本质上就是给每一个像 素进行分类。可以用它来识别医疗影像中的病灶区域,肿瘤的区域,遥感图像中河流 山地农田的面积,街景数据里边的马路牙,交通标志和其他车的位置以及车道线,所 以语义分割是一个非常常用的计算机视觉任务,MMSegmentation提供了600多个预 训练模型,复现了40多篇的经典和前沿的语义分割的论文,那如果你想入门语义分割 领域,MMSegmentation将是你最佳的学习资料!在这里插入图片描述

MMpretrain

MMpretrain呢是做图像分类,预训练和多模态的算法库,那图像分类也是计算机视 觉解决的,基础任务之一,用MMpretrain可以实现图像分类,图像描述,视觉问 答,视觉定位和视觉检索。在这里插入图片描述

MMpose

MMPose 是一款基于 PyTorch 的姿态分析的开源工具箱,所谓的姿态估计其实就 是关键点检测,比如说把这么一个人各个的关节骨架的点识别出来,然后串成一个火 柴人,那这就叫做姿态估计,通过姿态估计,我们就能定量的去衡量这个人的行为动 作,比如说健身的打分~在这里插入图片描述

MMHuman3D

MMHuman3D 是一款基于 PyTorch 的人体参数化模型的开源工具箱。
所谓的三维人体姿态估计就是要用一个3d的模型去包络出人体,我们就可以用一个 3d的数字人去拟合一个真人,特别是在动作捕捉领域和虚拟现实领域,有了一个3d 的人,就能跟真实世界的人进行对应了,比如说在足球运动里,在交通事故的模拟 中,甚至在很多的竞技类运动中,都可以用到这个算法。在这里插入图片描述

MMAction2

MMAction2 是一款基于 PyTorch 的视频理解开源工具箱,MMAction2 支持多 种视频理解任务,包括动作识别,时序动作检测,时空动作检测以及基于人体姿态的 动作识别。在这里插入图片描述

MMagic

MMagic 是基于 PyTorch 的图像&视频编辑和生成开源工具箱,MMagic 支持了 流行的图像修复、图文生成、3D生成、图像修补、抠图、超分辨率和生成等任务的应 用。特别是 MMagic 支持了 Stable Diffusion 的微调和许多激动人心的 diffusion 应用,例如 ControlNet 动画生成。MMagic 也支持了 GANs 的插 值,投影,编辑和其他流行的应用。
在这里插入图片描述

MMDeploy

MMDeploy 提供了一系列工具,帮助我们更轻松的将 OpenMMLab 下的算法部署到 各种设备与平台上。在这里插入图片描述

Playground

OpenMMLab还有一个趣味应用的游乐场,叫做playground,在playground里有 很多有趣的项目,其中一些项目也很前沿,比如说结合最新的这个SAM视觉大模型, 你可以用它来辅助你标注,用它来做视频实例分割。这样。就可以结合我们其他的算 法库,来开发出你自己的有趣又有用的好玩应用!在这里插入图片描述

OpenMMLab开源生态

全球有超过1800个开发者参与了OpenMMLab开源算法库的代码贡献;OpenMMLab的 使用者涵盖了科研院所,高校和各行各业的商业公司;同时有一些大家耳熟能详的, 影响力非常大的开源项目,也是基于OpenMMLab开发的!在这里插入图片描述

这篇关于AI 实战训练营(Class 1)OpenMMLab 概述的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/204687

相关文章

网页解析 lxml 库--实战

lxml库使用流程 lxml 是 Python 的第三方解析库,完全使用 Python 语言编写,它对 XPath表达式提供了良好的支 持,因此能够了高效地解析 HTML/XML 文档。本节讲解如何通过 lxml 库解析 HTML 文档。 pip install lxml lxm| 库提供了一个 etree 模块,该模块专门用来解析 HTML/XML 文档,下面来介绍一下 lxml 库

Ilya-AI分享的他在OpenAI学习到的15个提示工程技巧

Ilya(不是本人,claude AI)在社交媒体上分享了他在OpenAI学习到的15个Prompt撰写技巧。 以下是详细的内容: 提示精确化:在编写提示时,力求表达清晰准确。清楚地阐述任务需求和概念定义至关重要。例:不用"分析文本",而用"判断这段话的情感倾向:积极、消极还是中性"。 快速迭代:善于快速连续调整提示。熟练的提示工程师能够灵活地进行多轮优化。例:从"总结文章"到"用

AI绘图怎么变现?想做点副业的小白必看!

在科技飞速发展的今天,AI绘图作为一种新兴技术,不仅改变了艺术创作的方式,也为创作者提供了多种变现途径。本文将详细探讨几种常见的AI绘图变现方式,帮助创作者更好地利用这一技术实现经济收益。 更多实操教程和AI绘画工具,可以扫描下方,免费获取 定制服务:个性化的创意商机 个性化定制 AI绘图技术能够根据用户需求生成个性化的头像、壁纸、插画等作品。例如,姓氏头像在电商平台上非常受欢迎,

水位雨量在线监测系统概述及应用介绍

在当今社会,随着科技的飞速发展,各种智能监测系统已成为保障公共安全、促进资源管理和环境保护的重要工具。其中,水位雨量在线监测系统作为自然灾害预警、水资源管理及水利工程运行的关键技术,其重要性不言而喻。 一、水位雨量在线监测系统的基本原理 水位雨量在线监测系统主要由数据采集单元、数据传输网络、数据处理中心及用户终端四大部分构成,形成了一个完整的闭环系统。 数据采集单元:这是系统的“眼睛”,

从去中心化到智能化:Web3如何与AI共同塑造数字生态

在数字时代的演进中,Web3和人工智能(AI)正成为塑造未来互联网的两大核心力量。Web3的去中心化理念与AI的智能化技术,正相互交织,共同推动数字生态的变革。本文将探讨Web3与AI的融合如何改变数字世界,并展望这一新兴组合如何重塑我们的在线体验。 Web3的去中心化愿景 Web3代表了互联网的第三代发展,它基于去中心化的区块链技术,旨在创建一个开放、透明且用户主导的数字生态。不同于传统

AI一键生成 PPT

AI一键生成 PPT 操作步骤 作为一名打工人,是不是经常需要制作各种PPT来分享我的生活和想法。但是,你们知道,有时候灵感来了,时间却不够用了!😩直到我发现了Kimi AI——一个能够自动生成PPT的神奇助手!🌟 什么是Kimi? 一款月之暗面科技有限公司开发的AI办公工具,帮助用户快速生成高质量的演示文稿。 无论你是职场人士、学生还是教师,Kimi都能够为你的办公文

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置

Andrej Karpathy最新采访:认知核心模型10亿参数就够了,AI会打破教育不公的僵局

夕小瑶科技说 原创  作者 | 海野 AI圈子的红人,AI大神Andrej Karpathy,曾是OpenAI联合创始人之一,特斯拉AI总监。上一次的动态是官宣创办一家名为 Eureka Labs 的人工智能+教育公司 ,宣布将长期致力于AI原生教育。 近日,Andrej Karpathy接受了No Priors(投资博客)的采访,与硅谷知名投资人 Sara Guo 和 Elad G

C#实战|大乐透选号器[6]:实现实时显示已选择的红蓝球数量

哈喽,你好啊,我是雷工。 关于大乐透选号器在前面已经记录了5篇笔记,这是第6篇; 接下来实现实时显示当前选中红球数量,蓝球数量; 以下为练习笔记。 01 效果演示 当选择和取消选择红球或蓝球时,在对应的位置显示实时已选择的红球、蓝球的数量; 02 标签名称 分别设置Label标签名称为:lblRedCount、lblBlueCount

AI hospital 论文Idea

一、Benchmarking Large Language Models on Communicative Medical Coaching: A Dataset and a Novel System论文地址含代码 大多数现有模型和工具主要迎合以患者为中心的服务。这项工作深入探讨了LLMs在提高医疗专业人员的沟通能力。目标是构建一个模拟实践环境,人类医生(即医学学习者)可以在其中与患者代理进行医学