记一次:Datawhale AI夏令营-第五期-CV-Task01

2024-08-23 02:04

本文主要是介绍记一次:Datawhale AI夏令营-第五期-CV-Task01,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

前言:前面参加了第四期AIGC算是入门了,第五期我又来了,这期我参加了两个,计算机视觉CV所以按照惯例写一个笔记。

学习任务

一、计算机视觉CV的了解

1.1、什么是计算机视觉?

1.2、什么是YOLO?什么是物体检测模型?

1.3、YOLO模型需要什么训练格式?

二、赛事环境与实践环境准备

2.1、赛事介绍

2.2、各平台环境准备

2.3、创建实例并体验baseline

2.4、提交成绩

一、计算机视觉CV的了解

1.1、什么是计算机视觉?

        计算机视觉(Computer Vision,简称CV)是‌计算机科学领域中的一个重要分支‌,主要研究如何让计算机能够“看”懂周围的世界。简单来说就是让计算机拥有眼睛。

        通过数字图像处理、模式识别、机器学习、深度学习等技术,计算机视觉使计算机具备类似于人类视觉系统的感知和理解能力。它的研究内容包括图像识别、目标检测、图像分割、图像重建、图像增强、视频分析等多个方面。

        计算机视觉的应用非常广泛,包括但不限于自动驾驶、工业检测、视频监控、航空航天等领域。例如,目标检测是计算机视觉领域的一个热门方向,其基本流程是在给定图像中找到关注目标,确定目标类别并输出相应的坐标位置(常使用矩形框)。图像分类、目标检测、分割是计算机视觉领域的三大任务。‌

        计算机视觉不仅使计算机能够识别和理解图像和视频中的物体和人,还通过模拟人类视觉系统,帮助计算机理解和解释数字图像和视频的内容。整个过程涉及图像获取、筛选、分析、识别和提取信息。

我的总结就是:计算机比喻为人,那么计算机视觉就是我们人的眼睛系统。

1.2、什么是YOLO?什么是物体检测模型?

        YOLO,全称为“You Only Look Once”(你只看一眼),是一种流行的实时目标检测系统,由Joseph Redmon等人在2015年提出。简单说就是一个系统。

        YOLO模型的核心思想是将目标检测任务视为一个单一的回归问题,通过一个卷积神经网络(CNN)直接从图像像素到边界框坐标和类别概率的映射。YOLO模型经过了多次迭代,包括YOLOv2(YOLO9000)、YOLOv3和YOLOv4等版本,每个版本都在性能和速度上有所提升,同时也引入了一些新的技术,如更深的网络结构、更好的锚框机制、多尺度特征融合等。

1.3、YOLO模型需要什么训练格式?

        YOLO使用的标注格式是每张图像一个文本文件,文件名与图像文件名相对应。文本文件中每一行对应一个边界框,格式为:<class> <x_center> <y_center> <width> <height>。

其中,<class>是类别索引,<x_center>和<y_center>是边界框中心点相对于图像宽度和高度的比例,<width>和<height>是边界框的宽度和高度相对于图像宽度和高度的比例。

二、赛事环境与实践环境准备

2.1、赛事介绍

赛事链接:https://www.marsbigdata.com/competition/details?id=3839107548872

此次是2024大运河杯,城市治理方面的比赛如图

2.2、各平台环境准备

1》准备MARS数据科学平台账号并实名认证,然后参赛

实名认证

参赛

2》准备厚德云平台账号并支付宝授权

租用4090!链接:https://portal.houdeyun.cn/console/apparatus/gpu/generic

2.3、创建实例并体验baseline

step0、打开环境终端

step1、下载baseline相关文件

apt install git-lfs
git lfs install
git clone https://www.modelscope.cn/datasets/Datawhale/AI_Camp5_baseline_CV.git

将命令粘贴上

step2、一键运行baseline!

step3、下载结果文件result.zip

step4、GPU使用完成后,关机(重要不然计费)

2.4、提交成绩

得到分数

总结:第一次了解计算机视觉,代码原理和其他内容理解的不是很深刻,但是没有关系,学习任何东西我们先跑起来了,然后在抽丝拔茧一点一点了了解其原理。后续有更深的体会在完善这个笔记

这篇关于记一次:Datawhale AI夏令营-第五期-CV-Task01的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1098037

相关文章

Spring定时任务只执行一次的原因分析与解决方案

《Spring定时任务只执行一次的原因分析与解决方案》在使用Spring的@Scheduled定时任务时,你是否遇到过任务只执行一次,后续不再触发的情况?这种情况可能由多种原因导致,如未启用调度、线程... 目录1. 问题背景2. Spring定时任务的基本用法3. 为什么定时任务只执行一次?3.1 未启用

基于Flask框架添加多个AI模型的API并进行交互

《基于Flask框架添加多个AI模型的API并进行交互》:本文主要介绍如何基于Flask框架开发AI模型API管理系统,允许用户添加、删除不同AI模型的API密钥,感兴趣的可以了解下... 目录1. 概述2. 后端代码说明2.1 依赖库导入2.2 应用初始化2.3 API 存储字典2.4 路由函数2.5 应

Spring AI ectorStore的使用流程

《SpringAIectorStore的使用流程》SpringAI中的VectorStore是一种用于存储和检索高维向量数据的数据库或存储解决方案,它在AI应用中发挥着至关重要的作用,本文给大家介... 目录一、VectorStore的基本概念二、VectorStore的核心接口三、VectorStore的

Spring AI集成DeepSeek三步搞定Java智能应用的详细过程

《SpringAI集成DeepSeek三步搞定Java智能应用的详细过程》本文介绍了如何使用SpringAI集成DeepSeek,一个国内顶尖的多模态大模型,SpringAI提供了一套统一的接口,简... 目录DeepSeek 介绍Spring AI 是什么?Spring AI 的主要功能包括1、环境准备2

Spring AI集成DeepSeek实现流式输出的操作方法

《SpringAI集成DeepSeek实现流式输出的操作方法》本文介绍了如何在SpringBoot中使用Sse(Server-SentEvents)技术实现流式输出,后端使用SpringMVC中的S... 目录一、后端代码二、前端代码三、运行项目小天有话说题外话参考资料前面一篇文章我们实现了《Spring

Spring AI与DeepSeek实战一之快速打造智能对话应用

《SpringAI与DeepSeek实战一之快速打造智能对话应用》本文详细介绍了如何通过SpringAI框架集成DeepSeek大模型,实现普通对话和流式对话功能,步骤包括申请API-KEY、项目搭... 目录一、概述二、申请DeepSeek的API-KEY三、项目搭建3.1. 开发环境要求3.2. mav

C#集成DeepSeek模型实现AI私有化的流程步骤(本地部署与API调用教程)

《C#集成DeepSeek模型实现AI私有化的流程步骤(本地部署与API调用教程)》本文主要介绍了C#集成DeepSeek模型实现AI私有化的方法,包括搭建基础环境,如安装Ollama和下载DeepS... 目录前言搭建基础环境1、安装 Ollama2、下载 DeepSeek R1 模型客户端 ChatBo

Spring AI集成DeepSeek的详细步骤

《SpringAI集成DeepSeek的详细步骤》DeepSeek作为一款卓越的国产AI模型,越来越多的公司考虑在自己的应用中集成,对于Java应用来说,我们可以借助SpringAI集成DeepSe... 目录DeepSeek 介绍Spring AI 是什么?1、环境准备2、构建项目2.1、pom依赖2.2

Deepseek R1模型本地化部署+API接口调用详细教程(释放AI生产力)

《DeepseekR1模型本地化部署+API接口调用详细教程(释放AI生产力)》本文介绍了本地部署DeepSeekR1模型和通过API调用将其集成到VSCode中的过程,作者详细步骤展示了如何下载和... 目录前言一、deepseek R1模型与chatGPT o1系列模型对比二、本地部署步骤1.安装oll

Spring AI Alibaba接入大模型时的依赖问题小结

《SpringAIAlibaba接入大模型时的依赖问题小结》文章介绍了如何在pom.xml文件中配置SpringAIAlibaba依赖,并提供了一个示例pom.xml文件,同时,建议将Maven仓... 目录(一)pom.XML文件:(二)application.yml配置文件(一)pom.xml文件:首