基于opencv SGBM的双目深度图提取在FPGA上的实现

2024-04-04 18:18

本文主要是介绍基于opencv SGBM的双目深度图提取在FPGA上的实现,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

代码分享于github:   https://github.com/tishi43/sgbm

主要包含以下部分:

line_buffer_8row.sv, 从ddr读左图和右图,缓存8行,为什么8行,5x5的cost加窗运算最多要7行图像,此7行用来输出,另一行用来从ddr读入。

calc_bt_cost.sv,代价计算,正向的代价计算,从x=minD开始到width-1,反向的代价计算,从x=width-1开始,计算到x=minD,为什么要反向,右左方向代价聚合时,是从最右边开始的,

sgbm_aggr_down.sv,sgbm_aggr_down_left.sv,sgbm_aggr_right_left.sv

5个方向的代价聚合,sgbm_aggr_down_left复用了down right和down left两个方向的代价聚合,目的是为了省一些资源,

sgbm_aggr_right_left复用了左右和右左方向的代价聚合。

sgbm.sv 顶层文件,也包含其它处理,包括唯一性检测,左右一致性检测,输出结果到ddr。

最长的路径来自左右和右左聚合,左右和右左聚合因为后一点的计算需要用到前一点的最小值,所以不能pipeline,只能1周期算完,有一个128个cost求最小值minLr,Logic level达到44级.

Max Delay Paths--------------------------------------------------------------------------------------Slack:                    infSource:                 i_P1[1](input port)Destination:            sgbm_aggr_right_left_inst/Delta_reg[9]_rep/DPath Group:             (none)Path Type:              Max at Slow Process CornerData Path Delay:        15.836ns  (logic 6.617ns (41.782%)  route 9.219ns (58.218%))Logic Levels:           44  (CARRY4=21 IBUF=1 LUT2=2 LUT3=4 LUT4=4 LUT5=2 LUT6=10)Location             Delay type                Incr(ns)  Path(ns)    Netlist Resource(s)-------------------------------------------------------------------    -------------------0.000     0.000 r  i_P1[1] (IN)net (fo=0)                   0.000     0.000    i_P1[1]r  i_P1_IBUF[1]_inst/IIBUF (Prop_ibuf_I_O)         0.606     0.606 r  i_P1_IBUF[1]_inst/Onet (fo=473, unplaced)       0.419     1.025    sgbm_aggr_right_left_inst/i_P1_IBUF[1]r  sgbm_aggr_right_left_inst/ram_reg_46_i_95/I1LUT2 (Prop_lut2_I1_O)        0.043     1.068 r  sgbm_aggr_right_left_inst/ram_reg_46_i_95/Onet (fo=1, unplaced)         0.000     1.068    sgbm_aggr_right_left_inst/ram_reg_46_i_95_n_0r  sgbm_aggr_right_left_inst/ram_reg_46_i_53/S[1]CARRY4 (Prop_carry4_S[1]_CO[3])0.256     1.324 r  sgbm_aggr_right_left_inst/ram_reg_46_i_53/CO[3]net (fo=1, unplaced)         0.007     1.331    sgbm_aggr_right_left_inst/ram_reg_46_i_53_n_0r  sgbm_aggr_right_left_inst/ram_reg_46_i_69/CI

这个算法最大的问题是ram的消耗量,以1280x960,disp range 128来计算,4个方向的代价聚合,每个方向需要存1280 * 128 * cost_bits,

这里cost_bits 是每方向聚合后的结果需要的bit数,算12bit,所以一个方向需要1280 * 128 * 12=1966080 bits, 4个方向需要,4 * 1966080 =7864320 bits, 约等于1MB的ram。

如果中间数据放ddr,每帧数据对ddr会产生1280*960*128*12*4= 7549747200 bits,约等于7Gbits,的读写,按照每秒30帧来算,需要占210Gbits约等于26GBytes的ddr读写带宽,这个带宽对于实际系统来说是一个很大的带宽。

这里的代价计算使用了5个calc_bt_cost模块同时算,这样每次加窗计算(window cost), 把这5个calc_bt_cost的计算结果相加,

按照正常的算法,是需要缓存一行window cost,计算最新一行的window cost是缓存的window cost+最新行的cost-最老行的cost,这样又需要1个1280 * 128 * 12bit的大缓存,这里5个calc_bt_cost仅仅是为了省一个大的缓存。

这写都是按照默认blocksize=5来设计的,如果blocksize可配,那这一个大的缓存也是省不的。

起初设计的时候用了10个calc_bt_cost, 5个反向bt cost来求右左方向的聚合,右左方向的聚合比左右和其它三个方向的提前一行算,这样算左右和右左并行。综合下来LUT直接超了1倍,改成5个calc_bt_cost先算右左,再算左右,这样速度降一半,资源还是超很多,后面又经过很多资源上的优化。

这篇关于基于opencv SGBM的双目深度图提取在FPGA上的实现的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/876511

相关文章

hdu1043(八数码问题,广搜 + hash(实现状态压缩) )

利用康拓展开将一个排列映射成一个自然数,然后就变成了普通的广搜题。 #include<iostream>#include<algorithm>#include<string>#include<stack>#include<queue>#include<map>#include<stdio.h>#include<stdlib.h>#include<ctype.h>#inclu

使用opencv优化图片(画面变清晰)

文章目录 需求影响照片清晰度的因素 实现降噪测试代码 锐化空间锐化Unsharp Masking频率域锐化对比测试 对比度增强常用算法对比测试 需求 对图像进行优化,使其看起来更清晰,同时保持尺寸不变,通常涉及到图像处理技术如锐化、降噪、对比度增强等 影响照片清晰度的因素 影响照片清晰度的因素有很多,主要可以从以下几个方面来分析 1. 拍摄设备 相机传感器:相机传

【C++】_list常用方法解析及模拟实现

相信自己的力量,只要对自己始终保持信心,尽自己最大努力去完成任何事,就算事情最终结果是失败了,努力了也不留遗憾。💓💓💓 目录   ✨说在前面 🍋知识点一:什么是list? •🌰1.list的定义 •🌰2.list的基本特性 •🌰3.常用接口介绍 🍋知识点二:list常用接口 •🌰1.默认成员函数 🔥构造函数(⭐) 🔥析构函数 •🌰2.list对象

【Prometheus】PromQL向量匹配实现不同标签的向量数据进行运算

✨✨ 欢迎大家来到景天科技苑✨✨ 🎈🎈 养成好习惯,先赞后看哦~🎈🎈 🏆 作者简介:景天科技苑 🏆《头衔》:大厂架构师,华为云开发者社区专家博主,阿里云开发者社区专家博主,CSDN全栈领域优质创作者,掘金优秀博主,51CTO博客专家等。 🏆《博客》:Python全栈,前后端开发,小程序开发,人工智能,js逆向,App逆向,网络系统安全,数据分析,Django,fastapi

让树莓派智能语音助手实现定时提醒功能

最初的时候是想直接在rasa 的chatbot上实现,因为rasa本身是带有remindschedule模块的。不过经过一番折腾后,忽然发现,chatbot上实现的定时,语音助手不一定会有响应。因为,我目前语音助手的代码设置了长时间无应答会结束对话,这样一来,chatbot定时提醒的触发就不会被语音助手获悉。那怎么让语音助手也具有定时提醒功能呢? 我最后选择的方法是用threading.Time

Android实现任意版本设置默认的锁屏壁纸和桌面壁纸(两张壁纸可不一致)

客户有些需求需要设置默认壁纸和锁屏壁纸  在默认情况下 这两个壁纸是相同的  如果需要默认的锁屏壁纸和桌面壁纸不一样 需要额外修改 Android13实现 替换默认桌面壁纸: 将图片文件替换frameworks/base/core/res/res/drawable-nodpi/default_wallpaper.*  (注意不能是bmp格式) 替换默认锁屏壁纸: 将图片资源放入vendo

C#实战|大乐透选号器[6]:实现实时显示已选择的红蓝球数量

哈喽,你好啊,我是雷工。 关于大乐透选号器在前面已经记录了5篇笔记,这是第6篇; 接下来实现实时显示当前选中红球数量,蓝球数量; 以下为练习笔记。 01 效果演示 当选择和取消选择红球或蓝球时,在对应的位置显示实时已选择的红球、蓝球的数量; 02 标签名称 分别设置Label标签名称为:lblRedCount、lblBlueCount

Kubernetes PodSecurityPolicy:PSP能实现的5种主要安全策略

Kubernetes PodSecurityPolicy:PSP能实现的5种主要安全策略 1. 特权模式限制2. 宿主机资源隔离3. 用户和组管理4. 权限提升控制5. SELinux配置 💖The Begin💖点点关注,收藏不迷路💖 Kubernetes的PodSecurityPolicy(PSP)是一个关键的安全特性,它在Pod创建之前实施安全策略,确保P

工厂ERP管理系统实现源码(JAVA)

工厂进销存管理系统是一个集采购管理、仓库管理、生产管理和销售管理于一体的综合解决方案。该系统旨在帮助企业优化流程、提高效率、降低成本,并实时掌握各环节的运营状况。 在采购管理方面,系统能够处理采购订单、供应商管理和采购入库等流程,确保采购过程的透明和高效。仓库管理方面,实现库存的精准管理,包括入库、出库、盘点等操作,确保库存数据的准确性和实时性。 生产管理模块则涵盖了生产计划制定、物料需求计划、

C++——stack、queue的实现及deque的介绍

目录 1.stack与queue的实现 1.1stack的实现  1.2 queue的实现 2.重温vector、list、stack、queue的介绍 2.1 STL标准库中stack和queue的底层结构  3.deque的简单介绍 3.1为什么选择deque作为stack和queue的底层默认容器  3.2 STL中对stack与queue的模拟实现 ①stack模拟实现