【CANN文档速递16期】揭秘应用开发之媒体数据处理

2023-10-19 01:40

本文主要是介绍【CANN文档速递16期】揭秘应用开发之媒体数据处理,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

01 媒体数据处理是什么

AscendCL提供了媒体数据处理的接口,用于处理图片、视频等数据,主要功能如下表所示。

AscendCL提供了V1、V2两个版本的媒体数据处理接口,从时间顺序上看,V2版本是新一代的媒体数据处理接口,已在新一代的昇腾AI处理器昇腾710 上适配,且其功能比V1版本更多,例如:

• JPEGE:V2版本接口支持高级的参数配置,如huffman表配置。

• VENC:V2版本接口支持更加细化的码控参数配置和效果调优,如I/P帧QP、宏块码控等。

• VDEC:V2版本接口支持更细化的内存控制,如设置输入码流缓存。

02 什么场景需要媒体数据处理

如果源图或视频的分辨率、格式等与模型的要求不一致时,我们可以通过AscendCL提供的媒体数据处理接口,将源图或视频处理成符合模型的要求。如下为典型场景的举例。

▶ 媒体数据处理(视频解码、缩放)

使用Yolov3模型实现目标检测的场景下,用户提供的输入视频为H264/H265编码格式、分辨率为1920*1080,但Yolov3模型要求的输入图片格式为RGB/YUV、分辨率为416*416,两者不一致,此时可以使用媒体数据处理接口执行以下一系列处理。

▶ 媒体数据处理(图片解码、缩放)

使用Resnet50模型实现图片分类的场景下,用户提供的输入图片为JPEG编码格式、分辨率为1280*720,但Resnet50模型要求的输入图片格式为RGB、分辨率为224*224,两者不一致,此时可以使用媒体数据处理接口执行以下一系列处理。

▶ 媒体数据处理(抠图、缩放、格式转换)

使用Resnet50模型实现图片分类的场景下,用户提供的输入图片格式为YUV420SP、分辨率为1280*720,但Resnet50模型要求的输入图片格式为RGB、分辨率为224*224,两者不一致,此时可以使用媒体数据处理接口执行以下一系列处理。

03 怎么实现媒体数据处理

本节以Resnet50模型图片分类的场景、用户输入图片为*.jpg图片文件为例,说明如何实现媒体数据处理。关于模型推理的详细描述,请参见《文档速递 09期AscendCL应用开发之「推理场景」》。

1、初始化AscendCL。

初始化AscendCL内部资源,为运行应用做准备。

2、申请运行管理资源。申请运行时相关资源,例如计算设备、Context(管理运行时资源生命周期的容器)。

3、初始化媒体数据处理模块。初始化媒体数据处理模块的内部资源,为处理数据做准备。

4、JPEG图片解码。4.1 创建解码通道。

4.2 通知解码器开始接收码流。

4.3 发送解码码流。

4.4 获取解码结果,作为图片缩放的输入数据。

4.5 释放视频图像帧相关的资源。

4.6 通知解码器停止接收码流。

4.7 销毁解码通道。

5、图片缩放。

5.1 创建图片缩放通道。

5.2 图片缩放。

5.3 获取缩放后的输出图片数据,作为模型推理的输入。

5.4 销毁图片缩放通道。

6、去初始化媒体数据处理模块 。

7、释放运行管理资源。

8、去初始化AscendCL。

在确定完成了AscendCL的所有调用之后,或者进程退出之前,需调用AscendCL接口实现AscendCL去初始化。

04 更多介绍

了解更详细内容,登录昇腾社区,在开发者文档中心(https://www.hiascend.com/document?tag=community-developer)阅读相关文档:

昇腾CANN文档中心致力于为开发者提供更优质的内容和更便捷的开发体验,助力CANN开发者共建AI生态。任何意见和建议都可以在评论区留言,您的每一份关注都是我们前进的动力。

这篇关于【CANN文档速递16期】揭秘应用开发之媒体数据处理的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/236444

相关文章

Android 悬浮窗开发示例((动态权限请求 | 前台服务和通知 | 悬浮窗创建 )

《Android悬浮窗开发示例((动态权限请求|前台服务和通知|悬浮窗创建)》本文介绍了Android悬浮窗的实现效果,包括动态权限请求、前台服务和通知的使用,悬浮窗权限需要动态申请并引导... 目录一、悬浮窗 动态权限请求1、动态请求权限2、悬浮窗权限说明3、检查动态权限4、申请动态权限5、权限设置完毕后

使用Python快速实现链接转word文档

《使用Python快速实现链接转word文档》这篇文章主要为大家详细介绍了如何使用Python快速实现链接转word文档功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 演示代码展示from newspaper import Articlefrom docx import

浅析如何使用Swagger生成带权限控制的API文档

《浅析如何使用Swagger生成带权限控制的API文档》当涉及到权限控制时,如何生成既安全又详细的API文档就成了一个关键问题,所以这篇文章小编就来和大家好好聊聊如何用Swagger来生成带有... 目录准备工作配置 Swagger权限控制给 API 加上权限注解查看文档注意事项在咱们的开发工作里,API

基于Python开发PPTX压缩工具

《基于Python开发PPTX压缩工具》在日常办公中,PPT文件往往因为图片过大而导致文件体积过大,不便于传输和存储,所以本文将使用Python开发一个PPTX压缩工具,需要的可以了解下... 目录引言全部代码环境准备代码结构代码实现运行结果引言在日常办公中,PPT文件往往因为图片过大而导致文件体积过大,

5分钟获取deepseek api并搭建简易问答应用

《5分钟获取deepseekapi并搭建简易问答应用》本文主要介绍了5分钟获取deepseekapi并搭建简易问答应用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需... 目录1、获取api2、获取base_url和chat_model3、配置模型参数方法一:终端中临时将加

使用DeepSeek API 结合VSCode提升开发效率

《使用DeepSeekAPI结合VSCode提升开发效率》:本文主要介绍DeepSeekAPI与VisualStudioCode(VSCode)结合使用,以提升软件开发效率,具有一定的参考价值... 目录引言准备工作安装必要的 VSCode 扩展配置 DeepSeek API1. 创建 API 请求文件2.

JavaScript中的isTrusted属性及其应用场景详解

《JavaScript中的isTrusted属性及其应用场景详解》在现代Web开发中,JavaScript是构建交互式应用的核心语言,随着前端技术的不断发展,开发者需要处理越来越多的复杂场景,例如事件... 目录引言一、问题背景二、isTrusted 属性的来源与作用1. isTrusted 的定义2. 为

Python调用另一个py文件并传递参数常见的方法及其应用场景

《Python调用另一个py文件并传递参数常见的方法及其应用场景》:本文主要介绍在Python中调用另一个py文件并传递参数的几种常见方法,包括使用import语句、exec函数、subproce... 目录前言1. 使用import语句1.1 基本用法1.2 导入特定函数1.3 处理文件路径2. 使用ex

基于Python开发电脑定时关机工具

《基于Python开发电脑定时关机工具》这篇文章主要为大家详细介绍了如何基于Python开发一个电脑定时关机工具,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下... 目录1. 简介2. 运行效果3. 相关源码1. 简介这个程序就像一个“忠实的管家”,帮你按时关掉电脑,而且全程不需要你多做

Python xmltodict实现简化XML数据处理

《Pythonxmltodict实现简化XML数据处理》Python社区为提供了xmltodict库,它专为简化XML与Python数据结构的转换而设计,本文主要来为大家介绍一下如何使用xmltod... 目录一、引言二、XMLtodict介绍设计理念适用场景三、功能参数与属性1、parse函数2、unpa