Yolov3源码解析:reorg_cpu

2024-03-15 23:08
文章标签 源码 yolov3 解析 cpu reorg

本文主要是介绍Yolov3源码解析:reorg_cpu,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

函数原型如下,

void reorg_cpu(float *x, int out_w, int out_h, int out_c, int batch, int stride, int forward, float *out)
{int b,i,j,k;int in_c = out_c/(stride*stride); //printf("\n out_c = %d, out_w = %d, out_h = %d, stride = %d, forward = %d \n", out_c, out_w, out_h, stride, forward);//printf("  in_c = %d,  in_w = %d,  in_h = %d \n", in_c, out_w*stride, out_h*stride);for(b = 0; b < batch; ++b){for(k = 0; k < out_c; ++k){for(j = 0; j < out_h; ++j){for(i = 0; i < out_w; ++i){int in_index  = i + out_w*(j + out_h*(k + out_c*b));int c2 = k % in_c;     // 分成4个后属于哪个,求具体位置,e.g. 125%64 = 61int offset = k / in_c; // 分成4个后属于哪个 e.g. 125/64=1int w2 = i*stride + offset % stride; int h2 = j*stride + offset / stride;int out_index = w2 + out_w*stride*(h2 + out_h*stride*(c2 + in_c*b));if(forward) out[out_index] = x[in_index];    // used by default for forward (i.e. forward = 0)else out[in_index] = x[out_index];}}}}
}

考虑 ! forward 的情况,相当于一个大channel拆分成stride*stride个子channel
考虑  forward 的情况,相当于stride*stride个子channel合成一个大channel
例如stride=2时,每个子channel中矩阵的大小为8*8=64,则大channel矩阵的大小为16*16=256

输入矩阵为8x256x8x8:
in_index = i(col) + width*j(row) + width*heigth*c + width*hight*out_channel*b
表示:
第b个batch, 第c个channel, 第j个行, 第i个列,

输出矩阵为8x64x16x16:(注意此矩阵宽为width*stride, 高为height*stride)
out_index = w2 + width*stride*h2 + width*stride*height*stride*c2 + width*stride*height*stride*in_channel*b
表示:第b个batch, 第c2个channel, 第h2个行, 第w2个列,

根据源码中的计算,举个例子,如图,

k = channel = 5
-> i j k b = 3,4,5,6 ==> c2 = k%64 = 5 offset = 5/64=0 w2 = 6 h2 = 8
-> i j k b = 3,5,5,6 ==> c2 = k%64 = 5 offset = 5/64=0 w2 = 6 h2 = 10
-> i j k b = 4,4,5,6 ==> c2 = k%64 = 5 offset = 5/64=0 w2 = 8 h2 = 8
-> i j k b = 4,5,5,6 ==> c2 = k%64 = 5 offset = 5/64=0 w2 = 8 h2 = 10

k = chanel = 64+5 = 69
-> i j k b = 3,4,68,6 ==> c2 = k%64 = 5 offset = 69/64=1 w2 = 7 h2 = 8
-> i j k b = 3,5,68,6 ==> c2 = k%64 = 5 offset = 69/64=1 w2 = 7 h2 = 10
-> i j k b = 4,4,68,6 ==> c2 = k%64 = 5 offset = 69/64=1 w2 = 9 h2 = 8
-> i j k b = 4,5,68,6 ==> c2 = k%64 = 5 offset = 69/64=1 w2 = 9 h2 = 10

 

k = chanel = 64 + 64 + 5 = 133
-> i j k b = 3,4,68,6 ==> c2 = k%64 = 5 offset = 133/64=2 w2 = 6 h2 = 9
-> i j k b = 3,5,68,6 ==> c2 = k%64 = 5 offset = 133/64=2 w2 = 6 h2 = 11
-> i j k b = 4,4,68,6 ==> c2 = k%64 = 5 offset = 133/64=2 w2 = 8 h2 = 9
-> i j k b = 4,5,68,6 ==> c2 = k%64 = 5 offset = 133/64=2 w2 = 8 h2 = 11

 

k = chanel = 64 + 64 + 64 + 5 = 192+5 = 197
-> i j k b = 3,4,68,6 ==> c2 = k%64 = 5 offset = 197/64=3 w2 = 7 h2 = 9
-> i j k b = 3,5,68,6 ==> c2 = k%64 = 5 offset = 197/64=3 w2 = 7 h2 = 11
-> i j k b = 4,4,68,6 ==> c2 = k%64 = 5 offset = 197/64=3 w2 = 9 h2 = 9
-> i j k b = 4,5,68,6 ==> c2 = k%64 = 5 offset = 197/64=3 w2 = 9 h2 = 11

这篇关于Yolov3源码解析:reorg_cpu的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/813553

相关文章

网页解析 lxml 库--实战

lxml库使用流程 lxml 是 Python 的第三方解析库,完全使用 Python 语言编写,它对 XPath表达式提供了良好的支 持,因此能够了高效地解析 HTML/XML 文档。本节讲解如何通过 lxml 库解析 HTML 文档。 pip install lxml lxm| 库提供了一个 etree 模块,该模块专门用来解析 HTML/XML 文档,下面来介绍一下 lxml 库

JAVA智听未来一站式有声阅读平台听书系统小程序源码

智听未来,一站式有声阅读平台听书系统 🌟&nbsp;开篇:遇见未来,从“智听”开始 在这个快节奏的时代,你是否渴望在忙碌的间隙,找到一片属于自己的宁静角落?是否梦想着能随时随地,沉浸在知识的海洋,或是故事的奇幻世界里?今天,就让我带你一起探索“智听未来”——这一站式有声阅读平台听书系统,它正悄悄改变着我们的阅读方式,让未来触手可及! 📚&nbsp;第一站:海量资源,应有尽有 走进“智听

【C++】_list常用方法解析及模拟实现

相信自己的力量,只要对自己始终保持信心,尽自己最大努力去完成任何事,就算事情最终结果是失败了,努力了也不留遗憾。💓💓💓 目录   ✨说在前面 🍋知识点一:什么是list? •🌰1.list的定义 •🌰2.list的基本特性 •🌰3.常用接口介绍 🍋知识点二:list常用接口 •🌰1.默认成员函数 🔥构造函数(⭐) 🔥析构函数 •🌰2.list对象

Java ArrayList扩容机制 (源码解读)

结论:初始长度为10,若所需长度小于1.5倍原长度,则按照1.5倍扩容。若不够用则按照所需长度扩容。 一. 明确类内部重要变量含义         1:数组默认长度         2:这是一个共享的空数组实例,用于明确创建长度为0时的ArrayList ,比如通过 new ArrayList<>(0),ArrayList 内部的数组 elementData 会指向这个 EMPTY_EL

如何在Visual Studio中调试.NET源码

今天偶然在看别人代码时,发现在他的代码里使用了Any判断List<T>是否为空。 我一般的做法是先判断是否为null,再判断Count。 看了一下Count的源码如下: 1 [__DynamicallyInvokable]2 public int Count3 {4 [__DynamicallyInvokable]5 get

工厂ERP管理系统实现源码(JAVA)

工厂进销存管理系统是一个集采购管理、仓库管理、生产管理和销售管理于一体的综合解决方案。该系统旨在帮助企业优化流程、提高效率、降低成本,并实时掌握各环节的运营状况。 在采购管理方面,系统能够处理采购订单、供应商管理和采购入库等流程,确保采购过程的透明和高效。仓库管理方面,实现库存的精准管理,包括入库、出库、盘点等操作,确保库存数据的准确性和实时性。 生产管理模块则涵盖了生产计划制定、物料需求计划、

OWASP十大安全漏洞解析

OWASP(开放式Web应用程序安全项目)发布的“十大安全漏洞”列表是Web应用程序安全领域的权威指南,它总结了Web应用程序中最常见、最危险的安全隐患。以下是对OWASP十大安全漏洞的详细解析: 1. 注入漏洞(Injection) 描述:攻击者通过在应用程序的输入数据中插入恶意代码,从而控制应用程序的行为。常见的注入类型包括SQL注入、OS命令注入、LDAP注入等。 影响:可能导致数据泄

从状态管理到性能优化:全面解析 Android Compose

文章目录 引言一、Android Compose基本概念1.1 什么是Android Compose?1.2 Compose的优势1.3 如何在项目中使用Compose 二、Compose中的状态管理2.1 状态管理的重要性2.2 Compose中的状态和数据流2.3 使用State和MutableState处理状态2.4 通过ViewModel进行状态管理 三、Compose中的列表和滚动

Spring 源码解读:自定义实现Bean定义的注册与解析

引言 在Spring框架中,Bean的注册与解析是整个依赖注入流程的核心步骤。通过Bean定义,Spring容器知道如何创建、配置和管理每个Bean实例。本篇文章将通过实现一个简化版的Bean定义注册与解析机制,帮助你理解Spring框架背后的设计逻辑。我们还将对比Spring中的BeanDefinition和BeanDefinitionRegistry,以全面掌握Bean注册和解析的核心原理。

CSP 2023 提高级第一轮 CSP-S 2023初试题 完善程序第二题解析 未完

一、题目阅读 (最大值之和)给定整数序列 a0,⋯,an−1,求该序列所有非空连续子序列的最大值之和。上述参数满足 1≤n≤105 和 1≤ai≤108。 一个序列的非空连续子序列可以用两个下标 ll 和 rr(其中0≤l≤r<n0≤l≤r<n)表示,对应的序列为 al,al+1,⋯,ar​。两个非空连续子序列不同,当且仅当下标不同。 例如,当原序列为 [1,2,1,2] 时,要计算子序列 [