【CANN文档速递16期】揭秘应用开发之媒体数据处理

2023-10-19 01:40

文章标签 文档 16 应用开发媒体数据处理揭秘速递 cann

本文主要是介绍【CANN文档速递16期】揭秘应用开发之媒体数据处理，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

01 媒体数据处理是什么

AscendCL提供了媒体数据处理的接口，用于处理图片、视频等数据，主要功能如下表所示。

AscendCL提供了V1、V2两个版本的媒体数据处理接口，从时间顺序上看，V2版本是新一代的媒体数据处理接口，已在新一代的昇腾AI处理器昇腾710 上适配，且其功能比V1版本更多，例如：

• JPEGE：V2版本接口支持高级的参数配置，如huffman表配置。

• VENC：V2版本接口支持更加细化的码控参数配置和效果调优，如I/P帧QP、宏块码控等。

• VDEC：V2版本接口支持更细化的内存控制，如设置输入码流缓存。

02 什么场景需要媒体数据处理

如果源图或视频的分辨率、格式等与模型的要求不一致时，我们可以通过AscendCL提供的媒体数据处理接口，将源图或视频处理成符合模型的要求。如下为典型场景的举例。

▶ 媒体数据处理（视频解码、缩放）

使用Yolov3模型实现目标检测的场景下，用户提供的输入视频为H264/H265编码格式、分辨率为1920*1080，但Yolov3模型要求的输入图片格式为RGB/YUV、分辨率为416*416，两者不一致，此时可以使用媒体数据处理接口执行以下一系列处理。

▶ 媒体数据处理（图片解码、缩放）

使用Resnet50模型实现图片分类的场景下，用户提供的输入图片为JPEG编码格式、分辨率为1280*720，但Resnet50模型要求的输入图片格式为RGB、分辨率为224*224，两者不一致，此时可以使用媒体数据处理接口执行以下一系列处理。

▶ 媒体数据处理（抠图、缩放、格式转换）

使用Resnet50模型实现图片分类的场景下，用户提供的输入图片格式为YUV420SP、分辨率为1280*720，但Resnet50模型要求的输入图片格式为RGB、分辨率为224*224，两者不一致，此时可以使用媒体数据处理接口执行以下一系列处理。

03 怎么实现媒体数据处理

本节以Resnet50模型图片分类的场景、用户输入图片为*.jpg图片文件为例，说明如何实现媒体数据处理。关于模型推理的详细描述，请参见《文档速递 09期AscendCL应用开发之「推理场景」》。

1、初始化AscendCL。

初始化AscendCL内部资源，为运行应用做准备。

2、申请运行管理资源。申请运行时相关资源，例如计算设备、Context（管理运行时资源生命周期的容器）。

3、初始化媒体数据处理模块。初始化媒体数据处理模块的内部资源，为处理数据做准备。

4、JPEG图片解码。4.1 创建解码通道。

4.2 通知解码器开始接收码流。

4.3 发送解码码流。

4.4 获取解码结果，作为图片缩放的输入数据。

4.5 释放视频图像帧相关的资源。

4.6 通知解码器停止接收码流。

4.7 销毁解码通道。

5、图片缩放。

5.1 创建图片缩放通道。

5.2 图片缩放。

5.3 获取缩放后的输出图片数据，作为模型推理的输入。

5.4 销毁图片缩放通道。

6、去初始化媒体数据处理模块。

7、释放运行管理资源。

8、去初始化AscendCL。

在确定完成了AscendCL的所有调用之后，或者进程退出之前，需调用AscendCL接口实现AscendCL去初始化。

04 更多介绍

了解更详细内容，登录昇腾社区，在开发者文档中心(https://www.hiascend.com/document?tag=community-developer)阅读相关文档：

昇腾CANN文档中心致力于为开发者提供更优质的内容和更便捷的开发体验，助力CANN开发者共建AI生态。任何意见和建议都可以在评论区留言，您的每一份关注都是我们前进的动力。

这篇关于【CANN文档速递16期】揭秘应用开发之媒体数据处理的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http://www.chinasem.cn/article/236444。 23002807@qq.com

相关文章

C语言函数递归实际应用举例详解

C语言函数递归实际应用举例详解

《C语言函数递归实际应用举例详解》程序调用自身的编程技巧称为递归,递归做为一种算法在程序设计语言中广泛应用,：本文主要介绍C语言函数递归实际应用举例的相关资料,文中通过代码介绍的非常详细,需要的朋... 目录前言一、递归的概念与思想二、递归的限制条件三、递归的实际应用举例（一）求 n 的阶乘（二）顺序打印

阅读更多...

Python通过模块化开发优化代码的技巧分享

Python通过模块化开发优化代码的技巧分享

《Python通过模块化开发优化代码的技巧分享》模块化开发就是把代码拆成一个个“零件”,该封装封装,该拆分拆分,下面小编就来和大家简单聊聊python如何用模块化开发进行代码优化吧... 目录什么是模块化开发如何拆分代码改进版：拆分成模块让模块更强大：使用 __init__.py你一定会遇到的问题模www.

阅读更多...

Spring Security基于数据库的ABAC属性权限模型实战开发教程

Spring Security基于数据库的ABAC属性权限模型实战开发教程

《SpringSecurity基于数据库的ABAC属性权限模型实战开发教程》：本文主要介绍SpringSecurity基于数据库的ABAC属性权限模型实战开发教程,本文给大家介绍的非常详细,对大... 目录1. 前言2. 权限决策依据RBACABAC综合对比3. 数据库表结构说明4. 实战开始5. MyBA

阅读更多...

使用Python开发一个简单的本地图片服务器

使用Python开发一个简单的本地图片服务器

《使用Python开发一个简单的本地图片服务器》本文介绍了如何结合wxPython构建的图形用户界面GUI和Python内建的Web服务器功能,在本地网络中搭建一个私人的,即开即用的网页相册,文中的示... 目录项目目标核心技术栈代码深度解析完整代码工作流程主要功能与优势潜在改进与思考运行结果总结你是否曾经

阅读更多...

Java利用docx4j+Freemarker生成word文档

Java利用docx4j+Freemarker生成word文档

《Java利用docx4j+Freemarker生成word文档》这篇文章主要为大家详细介绍了Java如何利用docx4j+Freemarker生成word文档,文中的示例代码讲解详细,感兴趣的小伙伴... 目录技术方案maven依赖创建模板文件实现代码技术方案Java 1.8 + docx4j + Fr

阅读更多...

揭秘Python Socket网络编程的7种硬核用法

揭秘Python Socket网络编程的7种硬核用法

《揭秘PythonSocket网络编程的7种硬核用法》Socket不仅能做聊天室,还能干一大堆硬核操作,这篇文章就带大家看看Python网络编程的7种超实用玩法,感兴趣的小伙伴可以跟随小编一起... 目录1.端口扫描器：探测开放端口2.简易 HTTP 服务器：10 秒搭个网页3.局域网游戏：多人联机对战4.

阅读更多...

使用C#代码在PDF文档中添加、删除和替换图片

使用C#代码在PDF文档中添加、删除和替换图片

《使用C#代码在PDF文档中添加、删除和替换图片》在当今数字化文档处理场景中,动态操作PDF文档中的图像已成为企业级应用开发的核心需求之一,本文将介绍如何在.NET平台使用C#代码在PDF文档中添加、... 目录引言用C#添加图片到PDF文档用C#删除PDF文档中的图片用C#替换PDF文档中的图片引言在当

阅读更多...

详解C#如何提取PDF文档中的图片

详解C#如何提取PDF文档中的图片

《详解C#如何提取PDF文档中的图片》提取图片可以将这些图像资源进行单独保存,方便后续在不同的项目中使用,下面我们就来看看如何使用C#通过代码从PDF文档中提取图片吧... 当 PDF 文件中包含有价值的图片，如艺术画作、设计素材、报告图表等，提取图片可以将这些图像资源进行单独保存，方便后续在不同的项目中使

阅读更多...

Spring Boot + MyBatis Plus 高效开发实战从入门到进阶优化(推荐)

Spring Boot + MyBatis Plus 高效开发实战从入门到进阶优化(推荐)

《SpringBoot+MyBatisPlus高效开发实战从入门到进阶优化(推荐)》本文将详细介绍SpringBoot+MyBatisPlus的完整开发流程,并深入剖析分页查询、批量操作、动... 目录Spring Boot + MyBATis Plus 高效开发实战：从入门到进阶优化1. MyBatis

阅读更多...

Python基于wxPython和FFmpeg开发一个视频标签工具

Python基于wxPython和FFmpeg开发一个视频标签工具

《Python基于wxPython和FFmpeg开发一个视频标签工具》在当今数字媒体时代,视频内容的管理和标记变得越来越重要,无论是研究人员需要对实验视频进行时间点标记,还是个人用户希望对家庭视频进行... 目录引言1. 应用概述2. 技术栈分析2.1 核心库和模块2.2 wxpython作为GUI选择的优

阅读更多...