阿里云高校计划视觉AI五天训练营教程 Day 1

2023-10-30 12:50

本文主要是介绍阿里云高校计划视觉AI五天训练营教程 Day 1,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

视觉生产技术

一、定义和分类

定义:通过一个/一系列视觉过程,产出新的视觉表达
产出:人或机器 能够感知的图像视频,而不是标签和物证
要求:新的和输入的不一样
分类:从0到1
拓展:从1到N
摘要:从N到1
升维:从An到An+1
增强/变换:从A到B
插入/合成:A+B=C
擦除:A-B=C
通用基础框架
输入(请求 Request)
生产类型(分发 Dispatch)
视觉生产引擎(服务Service)
输出 图像/视频/3D(响应Response)
五个关键维度
1、满足视觉/美学表现{可看}
2、合乎语义/内容逻辑{合理}
3、保证结果的丰富性{多样}
4、提供用户预期的抓手{可控}
5、带来用户/商业价格{可用}

二、精细理解-寻微入里

1、识别 知道是什么

2、检测 识别+知道在哪儿

3、分割: 识别+检测+知道每一个像素是什么

分割抠图-难点
复杂背景、遮挡、发丝精抠、边缘反色、透明材质、多尺度/目标

分割抠图-解题思路
1、复杂问题拆解:粗mask估计+精准matting
2、丰富数据样本:设计图像mask统一模型

分割抠图-模型框架
1、mask粗分割
2、mask质量统一
3、估计精确alpha
在这里插入图片描述
分割抠图-效果展示
在这里插入图片描述
分割抠图-人像抠图拓展
在这里插入图片描述
分割抠图-物体抠图拓展
细节部分处理
在这里插入图片描述
分割抠图-场景抠图拓展
在这里插入图片描述

3、视觉生成-从无到有

视觉生成-鹿班
平面图像设计生成
鹿班是视觉生成领域在业界落地的先行者,对外提供大规模在线的AI设计服务;
视觉生成——框架流程
在这里插入图片描述
视觉生成-鹿班电商设计
**照图生图:**参考原图,将风格、布局等信息学习并迁移到目标数据上;
**个性化设计:**多元化设计风格,结合商品品类、投放场景、目标客群的差异设计订制化设计

视觉生成-鹿班场景智能美工
在这里插入图片描述
鹿班在各行业中的应用
视频、娱乐、母婴等

视觉生成-AlibabaWood

视频生成-框架流程
视频生成-框架流程
视觉生成-视频封面

可以对视频内容全自动完成质量审核、内容分析与图像增强,输出多帧静止或动图。
图像增强:在内容理解的基础上裁剪或组合。
内容分析:基于深度学习的语义分析,根据吸引力挑选内容。
质量审核:根据模糊、爆光等因素过滤低质图像。

4、视觉编辑-移花接木

视觉编辑-视频植入
挖掘视频核心价值:扩展广告爆光渠道,创新广告形式,提升用户体验。 电视剧植入

扩大植入覆盖范围 :自动化批量处理视频内容,挖掘海量短视频、UGC内容等的广告价值,扩大植入内容的覆盖面。电影植入

提升植入效果效率:取代手工后期,缩短植入周期,降低人力成本,给广告招商留出充足时间,且不需要修改与流出媒资。综艺植入

考虑各个环节细节
在这里插入图片描述

视觉编辑-动态检测分割
自动检测到要处理的部分

视觉编辑-视频内容擦除
相关实用技术 :字幕擦除、台标擦除、广告擦除、场景文字擦除、人体擦除
核心挑战与亮点 粗定位、精分割、像素填充、在线训练

视觉编辑-文字擦除
去掉后期字幕 去掉原生文字
提升视频效果
视觉编辑-Logo擦除
视频某边角的平台Logo 擦除,
去掉广告 (区域大,标识无限)
去掉台标(标识有限)

视觉编辑-画幅变化
主体检测分割+背景拉伸+背景补全+智能构图裁剪+超分辨率=多保留50%有效画面;

视觉编辑-图像尺寸变化

在这里插入图片描述

5、视觉增强-修旧如新

视觉增强-视频增强
在这里插入图片描述

视觉增强-人脸修复增强
人脸是最重要的目标对象,对人像进行细节修复增强,有很重要的意义和价值。如提升清晰度

视觉增强-视频超分
整体提高视频分辨率

视觉增强-视频插帧

视觉增强-HDR色彩扩展
提升色彩 透亮

视觉增强-风格迁移
在这里插入图片描述
视觉迁移-颜色拓展
在这里插入图片描述

6、视觉制造-由虚入实

实体设计制造
在这里插入图片描述

视觉制造-核心编辑
在这里插入图片描述
视觉制造-包装几何生成
在这里插入图片描述

在这里插入图片描述

视觉制造-材质工艺
在这里插入图片描述

视觉制造-视觉迁移及融合
在这里插入图片描述
视觉制造-多样化拓展
在这里插入图片描述
**视觉制造-2D3D融合 **
在这里插入图片描述

7、视频智能开放平台-万剑归宗

官网:vision.aliyun.com
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

通过以上的内容对视觉已经有了初步的认知
每天进步一点点!

这篇关于阿里云高校计划视觉AI五天训练营教程 Day 1的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/308028

相关文章

VScode连接远程Linux服务器环境配置图文教程

《VScode连接远程Linux服务器环境配置图文教程》:本文主要介绍如何安装和配置VSCode,包括安装步骤、环境配置(如汉化包、远程SSH连接)、语言包安装(如C/C++插件)等,文中给出了详... 目录一、安装vscode二、环境配置1.中文汉化包2.安装remote-ssh,用于远程连接2.1安装2

vscode保存代码时自动eslint格式化图文教程

《vscode保存代码时自动eslint格式化图文教程》:本文主要介绍vscode保存代码时自动eslint格式化的相关资料,包括打开设置文件并复制特定内容,文中通过代码介绍的非常详细,需要的朋友... 目录1、点击设置2、选择远程--->点击右上角打开设置3、会弹出settings.json文件,将以下内

PyCharm接入DeepSeek实现AI编程的操作流程

《PyCharm接入DeepSeek实现AI编程的操作流程》DeepSeek是一家专注于人工智能技术研发的公司,致力于开发高性能、低成本的AI模型,接下来,我们把DeepSeek接入到PyCharm中... 目录引言效果演示创建API key在PyCharm中下载Continue插件配置Continue引言

Window Server创建2台服务器的故障转移群集的图文教程

《WindowServer创建2台服务器的故障转移群集的图文教程》本文主要介绍了在WindowsServer系统上创建一个包含两台成员服务器的故障转移群集,文中通过图文示例介绍的非常详细,对大家的... 目录一、 准备条件二、在ServerB安装故障转移群集三、在ServerC安装故障转移群集,操作与Ser

windos server2022的配置故障转移服务的图文教程

《windosserver2022的配置故障转移服务的图文教程》本文主要介绍了windosserver2022的配置故障转移服务的图文教程,以确保服务和应用程序的连续性和可用性,文中通过图文介绍的非... 目录准备环境:步骤故障转移群集是 Windows Server 2022 中提供的一种功能,用于在多个

龙蜥操作系统Anolis OS-23.x安装配置图解教程(保姆级)

《龙蜥操作系统AnolisOS-23.x安装配置图解教程(保姆级)》:本文主要介绍了安装和配置AnolisOS23.2系统,包括分区、软件选择、设置root密码、网络配置、主机名设置和禁用SELinux的步骤,详细内容请阅读本文,希望能对你有所帮助... ‌AnolisOS‌是由阿里云推出的开源操作系统,旨

PyTorch使用教程之Tensor包详解

《PyTorch使用教程之Tensor包详解》这篇文章介绍了PyTorch中的张量(Tensor)数据结构,包括张量的数据类型、初始化、常用操作、属性等,张量是PyTorch框架中的核心数据结构,支持... 目录1、张量Tensor2、数据类型3、初始化(构造张量)4、常用操作5、常用属性5.1 存储(st

Ubuntu系统怎么安装Warp? 新一代AI 终端神器安装使用方法

《Ubuntu系统怎么安装Warp?新一代AI终端神器安装使用方法》Warp是一款使用Rust开发的现代化AI终端工具,该怎么再Ubuntu系统中安装使用呢?下面我们就来看看详细教程... Warp Terminal 是一款使用 Rust 开发的现代化「AI 终端」工具。最初它只支持 MACOS,但在 20

Java操作PDF文件实现签订电子合同详细教程

《Java操作PDF文件实现签订电子合同详细教程》:本文主要介绍如何在PDF中加入电子签章与电子签名的过程,包括编写Word文件、生成PDF、为PDF格式做表单、为表单赋值、生成文档以及上传到OB... 目录前言:先看效果:1.编写word文件1.2然后生成PDF格式进行保存1.3我这里是将文件保存到本地后

windows系统下shutdown重启关机命令超详细教程

《windows系统下shutdown重启关机命令超详细教程》shutdown命令是一个强大的工具,允许你通过命令行快速完成关机、重启或注销操作,本文将为你详细解析shutdown命令的使用方法,并提... 目录一、shutdown 命令简介二、shutdown 命令的基本用法三、远程关机与重启四、实际应用