福州大学《嵌入式系统综合设计》实验五:图像裁剪及尺寸变换

本文主要是介绍福州大学《嵌入式系统综合设计》实验五:图像裁剪及尺寸变换,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

一、实验目的

在深度学习中,往往需要从一张大图中裁剪出一张张小图,以便适应网络输入图像的尺寸,这可以通过bmcv_image_crop函数实现。 实践中,经常需要对输入图像的尺寸进行调整,以适用于网络输入图片尺寸,这可以通过bmcv提供的resize函数实现。目标检测时需要将检测到的目标位置用矩形框出来,这可以通过bmcv_image_draw_rectangle函数实现。本实验的目的是掌握算能的BMCV函数bmcv_image_crop, bmcv_image_resize,bmcv_image_draw_rectangle的使用方法。

二、实验内容

编写bmcv代码,调用bmcv_image_crop, bmcv_image_resize函数实现图片裁剪及尺寸的变换,调用bmcv_image_draw_rectangle函数来在指定的位置上画矩形框。

三、开发环境

开发主机:Ubuntu 22.04 LTS

硬件:算能SE5

本地如果有SE5硬件,则可以PC机作为客户端,SE5作为服务器端。本地如果没有SE5硬件,只有云空间,则可以直接将客户端和服务器端都通过云空间实现,机在云空间的SE5模拟环境中实现。

四、实验器材

开发主机 + 云平台

五、实验过程与结论

本实验涉及的程序框架与实验4的图4-1一致,仅需根据具体调用的API函数配置相关参数即可,因此接下来重点介绍API函数的参数及其调用方法。

BMCV关键函数介绍-bmcv_image_crop

算能BMCV提供了bmcv_image_crop,方便根据需要裁剪所需数量、大小的图,具体函数形式如下:

bm_status_t bmcv_image_crop(bm_handle_t handle,  //句柄int crop_num,bmcv_rect_t* rects,bm_image input,bm_image* output)

函数的接口中,crop_num为需要裁剪出的小图数量,input 指针指向输入图像,即 bm_image 对象;output指向输出图像,rects指针指向bmcv_rect_t的结构体,表示裁剪相关的信息,包括起始坐标、crop 宽高。该指针指向了若干个crop 框的信息,框的个数由crop_num 决定。

返回值bm_status_t为BM_SUCCESS则表示裁剪成功,否则为失败。

bmcv_rect_t结构体的格式如下所示: 

Typedef struct bmcv_rect{int start_x;    // 起始横坐标int start_y;    // 起始纵坐标int crop_x;     // 输出图像宽度int crop_y;     // 输出图像高度
} bmcv_rect_t;

代码调用方式如下:

//配置crop矩形的相关信息
bmcv_rect_t crop_attr;
crop_attr.start_x = 0;
crop_attr.start_y = 0;
crop_attr.crop_w = 600;
crop_attr.crop_h = 600;
bm_image input, output;
//input, output的创建代码省略
//代码主要框架参考实验4
bmcv_image_crop(handle,1,&crop_attr,input,&output)

BMCV关键函数介绍bmcv_image_resize

算能BMCV提供了bmcv_image_resize,方便对输入的若干张图片进行尺寸调整,或者在一张大图上进行抠图并进行尺寸调整,具体函数形式如下:

bm_status_t bmcv_image_resize(bm_handle_t handle,   // bm_handle句柄int input_num,bmcv_resize_image resize_attr[4],bm_image* input,bm_image* output)

函数参数中,返回值为BM_SUCCESS表明尺寸调整成功,否则为失败;

在调用bmcv_image_resize() 之前必须确保输入的image 内存已经申请。支持最大尺寸为2048*2048,最小尺寸为16*16,最大缩放比为32。

input 和output参数为指向输入/输出 bm_image 对象的指针。每个bm_image 需要外部调用bmcv_image_create 创建。image内存可以使用bm_image_alloc_dev_ mem 或者bm_image_copy_host_to_device 来开辟新的内存,或者使用bmcv_ image_attach 来attach 已有的内存,在输出时如无分配将在api 内部自行分配。

image_num 表示输入待调整尺寸的图片数,最多支持4张,如果input_num > 1, 那么多个输入图像必须是连续存储的(可以使用bm_image_alloc_contiguous_mem 给多张图申请连续空间);resize_attr[4]为每张图片对应的 resize 参数, 最多支持 4 张图片,其类型为bmcv_resize_image结构体。

bmcv_resize_image描述了一张图中resize 配置信息,其具体格式如下:

typedef struct bmcv_resize_image_s{bmcv_resize_t *resize_img_attr;int roi_num;unsigned char stretch_fit;unsigned char padding_b;unsigned char padding_g;unsigned char padding_r;unsigned int interpolation;
}bmcv_resize_image;

其中,roi_num 描述了一副图中需要进行resize 的子图总个数;stretch_fit 表示是否按照原图比例对图片进行缩放,1 表示无需按照原图比例进行缩放,0表示按照原图比例进行缩放,当采用这种方式的时候,结果图片中未进行缩放的地方将会被填充成特定值;padding_r,padding_g, padding_b 表示当stretch_fit 设成0的情况下,rgb通道上被填充的值; interpolation 表示缩图所使用的算法, 设为BMCV_INTER_NEAREST 表示最近邻算法,设为BMCV_INTER_LINEAR 表示线性插值算法。

resize_img_attr为bmcv_resize_t结构体类型的指针,其具体内容如下所示:

typedef struct bmcv_resize_s{int start_x;int start_y;int in_width;int in_height;int out_width;int out_height;
}bmcv_resize_t;

其中,start_x 描述了resize 起始横坐标(相对于原图),常用于抠图功能, start_y 描述了resize 起始纵坐标(相对于原图),常用于抠图功能;in_width, in_height描述了crop 图像的宽和高。out_width 和out_height描述了输出图像的宽和高。

函数调用方式如下:

int image_num = 1;
int crop_w = 400, crop_h = 400;
int resize_w = 400, resize_h = 400;
int image_w = 1000, image_h = 1000;
int img_size_i = image_w * image_h * 3;
int img_size_o = resize_w * resize_h * 3;bmcv_resize_image resize_attr[image_num];
bmcv_resize_t resize_img_attr[image_num];for (int img_idx = 0; img_idx < image_num; img_idx++) {resize_img_attr[img_idx].start_x = 0;            //抠图的起始横坐标resize_img_attr[img_idx].start_y = 0;            //抠图的起始纵坐标resize_img_attr[img_idx].in_width = crop_w;      //抠图的宽resize_img_attr[img_idx].in_height = crop_h;     //抠图的高resize_img_attr[img_idx].out_width = resize_w;   //输出的宽resize_img_attr[img_idx].out_height = resize_h;  //输出的高
}for (int img_idx = 0; img_idx < image_num; img_idx++) {resize_attr[img_idx].resize_img_attr = &resize_img_attr[img_idx];resize_attr[img_idx].roi_num = 1;resize_attr[img_idx].stretch_fit = 1;resize_attr[img_idx].interpolation = BMCV_INTER_NEAREST;
}bm_image input[image_num];
bm_image output[image_num];cv::Mat Input,Out;
Input = cv::imread(argv[1], 0);for (int img_idx = 0; img_idx < image_num; img_idx++) {//创建输入输出图像对象,并分配空间,转化为BMI格式bmcv_image_resize(handle, image_num, resize_attr, input, output);
}

BMCV关键函数介绍-bmcv_image_draw_rectangle

算能BMCV提供了bmcv_image_draw_rectangle,以便用矩形框出感兴趣区域。具体函数形式如下:

bm_status_t bmcv_image_draw_rectangle(bm_handle_t handle,bm_image image,int rect_num,* rects,int line_width,unsigned char r,unsigned char g,unsigned char b)

其中,handle为bm_handle 句柄;image是需要在其上画矩形框的bm_image 对象;rect_num为绘制矩形数量,指rects 指针中所包含的bmcv_rect_t 对象个数;rects为指向bmcv_rect_t对象(参考bm_image_resize函数参数说明)的指针,用以表示各个框所绘制的矩形数据(宽高等);line_width表示线宽;r,g,b为所绘制线条三原色的值。

在代码中调用方式如下:

bm_image src;
//创建图像
bmcv_rect_t rect;
rect.start_x = 100;
rect.start_y = 100;
rect.crop_w = 200;
rect.crop_h = 300;//在src对应的图像对象上,画1个框,框的信息在rect对象里描述。矩形线宽为3,颜色为红色。
bmcv_image_draw_rectangle(handle,src,1,&rect,3,255,0,0);

OpenCV函数介绍 

在OpenCV中,可以直接通过对图像长、宽维度进行操作,以实现图像剪裁的效果,如下所示

dst=src[200:2560,300:2062]

OpenCV提供resize函数,可以用于图像尺寸缩放,其函数接口如下所示

void resize (InputArray src,OutputArray dst,Size dsize,double fx=0, double fy=0,int interpolation=INTER_LINEAR)

其中,src是原图,dst是输出结果图,fx表达横向的放缩倍数,fy表达纵向的放缩倍数,dsize表达放缩后的图像的横和纵向长度;interpolation为插值方式。

其调用方式如下图所示。

resize(src, dst, Size(), 0.5, 0.5, interpolation);

OpenCV提供rectangle函数,以实现在输入图像img上画出一个矩形,此时矩形通过左上角的点和右下角的点坐标pt1,pt2 表示。 函数参数含义与

void cv::rectangle(InputOutputArray img,Point 	pt1,                // 矩形框左上角点的坐标Point 	pt2,                // 矩形框右下角点的坐标const Scalar & 	color,      // 线的颜色int 	thickness = 1,      // 线的宽度int 	lineType = LINE_8,  // 线的类型int 	shift = 0           // 点坐标中小数位数。
)	

执行结果

bmcv_crop:

执行make后上传到云平台或者SOC盒子中,即可实现对图片的裁剪。

root@06416e512cb7:/tmp/crop# chmod 777 bmcv_crop
root@06416e512cb7:/tmp/crop# ./bmcv_crop cutecat.jpeg
open /dev/jpu successfully,device index = 0, jpu fd = 8,vpp fd = 9

效果如下:

root@b3e319d8a0c8:~/bmnnsdk2-bm1684_v2.7.0/examples/bmcv_resize# ls
Makefile Readme.md bmcv_resize2 bmcv_resize2.cpp bmcv_resize2.o common.h cutecat.jpeg out.jpe

bmcv_resize:

按照实验1、实验2步骤,生成可执行文件并上传到算能盒子,执行:

bmcv_resize文件夹内的文件如图所示

root@b3e319d8a0c8:~/bmnnsdk2-bm1684_v2.7.0/examples/bmcv_resize# ls

Makefile Readme.md bmcv_resize2 bmcv_resize2.cpp bmcv_resize2.o common.h cutecat.jpeg out.jpeg

 Greycat.jpeg如图所示

给可执行文件赋权限并执行

root@06416e512cb7:/tmp/crop# chmod 777 bmcv_resize
root@06416e512cb7:/tmp/crop# ./bmcv_resize greycat.jpeg bmcv
Open /dev/jpu successfully,device index = 0,jpu fd = 8,vpp fd = 9

root@06416e512cb7:/tmp/crop# ./bmcv_resize greycat.jpeg opencv
Open /dev/jpu successfully,device index = 0,jpu fd = 4,vpp fd = 5

执行结果如下所示(生成out.jpg)

root@b3e319d8aoc8:~/bmnnsdk2-bm1684_v2.7.0/examples/bmcv_resize# ls
Makefile Readme.md bmcv_resize2 bmcv_resize2.cpp bmcv_resize2.o common.h cutecat.jpeg out.jpg 

bmcv_drawrect:

类似地,执行画矩形框的代码,可画出矩形框,具体如下:

root@06416e512cb7 : /tmp/crop# chmod 777 bmcv_ drawrect
root@06416e512cb7:/tmp/crop# ./bmcv_drawrect greycat.jpeg bmcv
Open /dev/jpu successfully,device index = 0, jpu fd = 4,vpp fd = 5

执行结果如下所示(生成out.jpg)

root@b3e319d8a0c8:~/bmnnsdk2-bm1684_v2.7.0/examples/bmcv_drawrect# ls
Makefile Readme.md bmcv_drawrect bmcv_drawrect.cpp bmcv_drawrect.o  common.h cutecat.jpeg greycat.jpeg out.jpg

root@b3e319d8a0c8:~/bmnnsdk2-bm1684_v2.7.0/examples/bmcv_drawrect# 

生成的结果out.jpg如上图所示。

这篇关于福州大学《嵌入式系统综合设计》实验五:图像裁剪及尺寸变换的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/418764

相关文章

不懂推荐算法也能设计推荐系统

本文以商业化应用推荐为例,告诉我们不懂推荐算法的产品,也能从产品侧出发, 设计出一款不错的推荐系统。 相信很多新手产品,看到算法二字,多是懵圈的。 什么排序算法、最短路径等都是相对传统的算法(注:传统是指科班出身的产品都会接触过)。但对于推荐算法,多数产品对着网上搜到的资源,都会无从下手。特别当某些推荐算法 和 “AI”扯上关系后,更是加大了理解的难度。 但,不了解推荐算法,就无法做推荐系

基于人工智能的图像分类系统

目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 图像分类是计算机视觉中的一个重要任务,目标是自动识别图像中的对象类别。通过卷积神经网络(CNN)等深度学习技术,我们可以构建高效的图像分类系统,广泛应用于自动驾驶、医疗影像诊断、监控分析等领域。本文将介绍如何构建一个基于人工智能的图像分类系统,包括环境

水位雨量在线监测系统概述及应用介绍

在当今社会,随着科技的飞速发展,各种智能监测系统已成为保障公共安全、促进资源管理和环境保护的重要工具。其中,水位雨量在线监测系统作为自然灾害预警、水资源管理及水利工程运行的关键技术,其重要性不言而喻。 一、水位雨量在线监测系统的基本原理 水位雨量在线监测系统主要由数据采集单元、数据传输网络、数据处理中心及用户终端四大部分构成,形成了一个完整的闭环系统。 数据采集单元:这是系统的“眼睛”,

综合安防管理平台LntonAIServer视频监控汇聚抖动检测算法优势

LntonAIServer视频质量诊断功能中的抖动检测是一个专门针对视频稳定性进行分析的功能。抖动通常是指视频帧之间的不必要运动,这种运动可能是由于摄像机的移动、传输中的错误或编解码问题导致的。抖动检测对于确保视频内容的平滑性和观看体验至关重要。 优势 1. 提高图像质量 - 清晰度提升:减少抖动,提高图像的清晰度和细节表现力,使得监控画面更加真实可信。 - 细节增强:在低光条件下,抖

嵌入式QT开发:构建高效智能的嵌入式系统

摘要: 本文深入探讨了嵌入式 QT 相关的各个方面。从 QT 框架的基础架构和核心概念出发,详细阐述了其在嵌入式环境中的优势与特点。文中分析了嵌入式 QT 的开发环境搭建过程,包括交叉编译工具链的配置等关键步骤。进一步探讨了嵌入式 QT 的界面设计与开发,涵盖了从基本控件的使用到复杂界面布局的构建。同时也深入研究了信号与槽机制在嵌入式系统中的应用,以及嵌入式 QT 与硬件设备的交互,包括输入输出设

JAVA智听未来一站式有声阅读平台听书系统小程序源码

智听未来,一站式有声阅读平台听书系统 🌟&nbsp;开篇:遇见未来,从“智听”开始 在这个快节奏的时代,你是否渴望在忙碌的间隙,找到一片属于自己的宁静角落?是否梦想着能随时随地,沉浸在知识的海洋,或是故事的奇幻世界里?今天,就让我带你一起探索“智听未来”——这一站式有声阅读平台听书系统,它正悄悄改变着我们的阅读方式,让未来触手可及! 📚&nbsp;第一站:海量资源,应有尽有 走进“智听

【区块链 + 人才服务】可信教育区块链治理系统 | FISCO BCOS应用案例

伴随着区块链技术的不断完善,其在教育信息化中的应用也在持续发展。利用区块链数据共识、不可篡改的特性, 将与教育相关的数据要素在区块链上进行存证确权,在确保数据可信的前提下,促进教育的公平、透明、开放,为教育教学质量提升赋能,实现教育数据的安全共享、高等教育体系的智慧治理。 可信教育区块链治理系统的顶层治理架构由教育部、高校、企业、学生等多方角色共同参与建设、维护,支撑教育资源共享、教学质量评估、

软考系统规划与管理师考试证书含金量高吗?

2024年软考系统规划与管理师考试报名时间节点: 报名时间:2024年上半年软考将于3月中旬陆续开始报名 考试时间:上半年5月25日到28日,下半年11月9日到12日 分数线:所有科目成绩均须达到45分以上(包括45分)方可通过考试 成绩查询:可在“中国计算机技术职业资格网”上查询软考成绩 出成绩时间:预计在11月左右 证书领取时间:一般在考试成绩公布后3~4个月,各地领取时间有所不同

系统架构师考试学习笔记第三篇——架构设计高级知识(20)通信系统架构设计理论与实践

本章知识考点:         第20课时主要学习通信系统架构设计的理论和工作中的实践。根据新版考试大纲,本课时知识点会涉及案例分析题(25分),而在历年考试中,案例题对该部分内容的考查并不多,虽在综合知识选择题目中经常考查,但分值也不高。本课时内容侧重于对知识点的记忆和理解,按照以往的出题规律,通信系统架构设计基础知识点多来源于教材内的基础网络设备、网络架构和教材外最新时事热点技术。本课时知识

怎么让1台电脑共享给7人同时流畅设计

在当今的创意设计与数字内容生产领域,图形工作站以其强大的计算能力、专业的图形处理能力和稳定的系统性能,成为了众多设计师、动画师、视频编辑师等创意工作者的必备工具。 设计团队面临资源有限,比如只有一台高性能电脑时,如何高效地让七人同时流畅地进行设计工作,便成为了一个亟待解决的问题。 一、硬件升级与配置 1.高性能处理器(CPU):选择多核、高线程的处理器,例如Intel的至强系列或AMD的Ry