caffe源码解析-im2col

2024-08-31 21:32
文章标签 源码 解析 caffe im2col

本文主要是介绍caffe源码解析-im2col,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

im2col这个函数特别棒!为啥?因为它让卷积变得简单,他将卷积操作转变为矩阵乘法,对比发现全连接层的实质就是矩阵乘法,所以这个函数使得卷积层的很多操作只需要仿照全连接层就可以了。下面主要介绍一下这两个函数:

  1. im2col_cpu,将输入feature map转变为矩阵
  2. col2im_cpu,将输出的残差map传递给输入的残差map,具体的残差传递还涉及权重

**

im2col_cpu

**

template <typename Dtype>
void im2col_cpu(const Dtype* data_im, const int channels,const int height, const int width, const int kernel_h, const int kernel_w,const int pad_h, const int pad_w,const int stride_h, const int stride_w,const int dilation_h, const int dilation_w,Dtype* data_col)
{//计算输出的size,这个公式应该不需要介绍const int output_h = (height + 2 * pad_h -(dilation_h * (kernel_h - 1) + 1)) / stride_h + 1;const int output_w = (width + 2 * pad_w -(dilation_w * (kernel_w - 1) + 1)) / stride_w + 1;//channel_size是每个输入feature map的sizeconst int channel_size = height * width;//data_im是输入数据的指针,每遍历一次就移动channel_size的位移for (int channel = channels; channel--; data_im += channel_size){for (int kernel_row = 0; kernel_row < kernel_h; kernel_row++){for (int kernel_col = 0; kernel_col < kernel_w; kernel_col++){//dilation_h这个变量是每隔多少个像素取值,比如dilation_h=2//那就是每隔2个像素取值,现在我们为了便于思考,都假设dilation_h=1//逐行遍历卷积窗口的输入数据int input_row = -pad_h + kernel_row * dilation_h;//逐行遍历输出数据for (int output_rows = output_h; output_rows; output_rows--){//如果坐标超出输入数据的界限,一般出现这种情况是因为pad!=0if (!is_a_ge_zero_and_a_lt_b(input_row, height)){//逐列遍历输出数据,由于输入数据的行超出界限(补0),对应的输出为0for (int output_cols = output_w; output_cols; output_cols--){*(data_col++) = 0;}}else{//逐列遍历卷积窗口的输入数据int input_col = -pad_w + kernel_col * dilation_w;for (int output_col = output_w; output_col; output_col--){//输入数据的行坐标和列坐标均没有超过界限if (is_a_ge_zero_and_a_lt_b(input_col, width)){//那么输出的值便等于输入的值*(data_col++) = data_im[input_row * width + input_col];}else{//如果输入列坐标超过界限,便置0*(data_col++) = 0;}//输出列坐标移动(下一个卷积窗口了)input_col += stride_w;}}//输入行坐标移动(下一个卷积窗口了)input_row += stride_h;}}}}
}

**

col2im_cpu

**

template <typename Dtype>
void col2im_cpu(const Dtype* data_col, const int channels,const int height, const int width, const int kernel_h, const int kernel_w,const int pad_h, const int pad_w,const int stride_h, const int stride_w,const int dilation_h, const int dilation_w,Dtype* data_im)
{caffe_set(height * width * channels, Dtype(0), data_im);const int output_h = (height + 2 * pad_h -(dilation_h * (kernel_h - 1) + 1)) / stride_h + 1;const int output_w = (width + 2 * pad_w -(dilation_w * (kernel_w - 1) + 1)) / stride_w + 1;const int channel_size = height * width;for (int channel = channels; channel--; data_im += channel_size){for (int kernel_row = 0; kernel_row < kernel_h; kernel_row++){for (int kernel_col = 0; kernel_col < kernel_w; kernel_col++){int input_row = -pad_h + kernel_row * dilation_h;for (int output_rows = output_h; output_rows; output_rows--){if (!is_a_ge_zero_and_a_lt_b(input_row, height)){//其他逻辑都是相同的,只是前者置0,这里就是直接跳过什么也不做data_col += output_w;}else{int input_col = -pad_w + kernel_col * dilation_w;for (int output_col = output_w; output_col; output_col--){if (is_a_ge_zero_and_a_lt_b(input_col, width)){//注意这里是累加,因为这个函数一般用于卷积层的反向传播//的残差传递,在卷积的前向过程中,每个输入数据是对应多个//卷积窗口的,因此再反向残差传递时需要将这一对多的关系合并//故进行累加data_im[input_row * width + input_col] += *data_col;}data_col++;input_col += stride_w;}}input_row += stride_h;}}}}
}

这篇关于caffe源码解析-im2col的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1125042

相关文章

网页解析 lxml 库--实战

lxml库使用流程 lxml 是 Python 的第三方解析库,完全使用 Python 语言编写,它对 XPath表达式提供了良好的支 持,因此能够了高效地解析 HTML/XML 文档。本节讲解如何通过 lxml 库解析 HTML 文档。 pip install lxml lxm| 库提供了一个 etree 模块,该模块专门用来解析 HTML/XML 文档,下面来介绍一下 lxml 库

JAVA智听未来一站式有声阅读平台听书系统小程序源码

智听未来,一站式有声阅读平台听书系统 🌟&nbsp;开篇:遇见未来,从“智听”开始 在这个快节奏的时代,你是否渴望在忙碌的间隙,找到一片属于自己的宁静角落?是否梦想着能随时随地,沉浸在知识的海洋,或是故事的奇幻世界里?今天,就让我带你一起探索“智听未来”——这一站式有声阅读平台听书系统,它正悄悄改变着我们的阅读方式,让未来触手可及! 📚&nbsp;第一站:海量资源,应有尽有 走进“智听

【C++】_list常用方法解析及模拟实现

相信自己的力量,只要对自己始终保持信心,尽自己最大努力去完成任何事,就算事情最终结果是失败了,努力了也不留遗憾。💓💓💓 目录   ✨说在前面 🍋知识点一:什么是list? •🌰1.list的定义 •🌰2.list的基本特性 •🌰3.常用接口介绍 🍋知识点二:list常用接口 •🌰1.默认成员函数 🔥构造函数(⭐) 🔥析构函数 •🌰2.list对象

Java ArrayList扩容机制 (源码解读)

结论:初始长度为10,若所需长度小于1.5倍原长度,则按照1.5倍扩容。若不够用则按照所需长度扩容。 一. 明确类内部重要变量含义         1:数组默认长度         2:这是一个共享的空数组实例,用于明确创建长度为0时的ArrayList ,比如通过 new ArrayList<>(0),ArrayList 内部的数组 elementData 会指向这个 EMPTY_EL

如何在Visual Studio中调试.NET源码

今天偶然在看别人代码时,发现在他的代码里使用了Any判断List<T>是否为空。 我一般的做法是先判断是否为null,再判断Count。 看了一下Count的源码如下: 1 [__DynamicallyInvokable]2 public int Count3 {4 [__DynamicallyInvokable]5 get

工厂ERP管理系统实现源码(JAVA)

工厂进销存管理系统是一个集采购管理、仓库管理、生产管理和销售管理于一体的综合解决方案。该系统旨在帮助企业优化流程、提高效率、降低成本,并实时掌握各环节的运营状况。 在采购管理方面,系统能够处理采购订单、供应商管理和采购入库等流程,确保采购过程的透明和高效。仓库管理方面,实现库存的精准管理,包括入库、出库、盘点等操作,确保库存数据的准确性和实时性。 生产管理模块则涵盖了生产计划制定、物料需求计划、

OWASP十大安全漏洞解析

OWASP(开放式Web应用程序安全项目)发布的“十大安全漏洞”列表是Web应用程序安全领域的权威指南,它总结了Web应用程序中最常见、最危险的安全隐患。以下是对OWASP十大安全漏洞的详细解析: 1. 注入漏洞(Injection) 描述:攻击者通过在应用程序的输入数据中插入恶意代码,从而控制应用程序的行为。常见的注入类型包括SQL注入、OS命令注入、LDAP注入等。 影响:可能导致数据泄

从状态管理到性能优化:全面解析 Android Compose

文章目录 引言一、Android Compose基本概念1.1 什么是Android Compose?1.2 Compose的优势1.3 如何在项目中使用Compose 二、Compose中的状态管理2.1 状态管理的重要性2.2 Compose中的状态和数据流2.3 使用State和MutableState处理状态2.4 通过ViewModel进行状态管理 三、Compose中的列表和滚动

Spring 源码解读:自定义实现Bean定义的注册与解析

引言 在Spring框架中,Bean的注册与解析是整个依赖注入流程的核心步骤。通过Bean定义,Spring容器知道如何创建、配置和管理每个Bean实例。本篇文章将通过实现一个简化版的Bean定义注册与解析机制,帮助你理解Spring框架背后的设计逻辑。我们还将对比Spring中的BeanDefinition和BeanDefinitionRegistry,以全面掌握Bean注册和解析的核心原理。

CSP 2023 提高级第一轮 CSP-S 2023初试题 完善程序第二题解析 未完

一、题目阅读 (最大值之和)给定整数序列 a0,⋯,an−1,求该序列所有非空连续子序列的最大值之和。上述参数满足 1≤n≤105 和 1≤ai≤108。 一个序列的非空连续子序列可以用两个下标 ll 和 rr(其中0≤l≤r<n0≤l≤r<n)表示,对应的序列为 al,al+1,⋯,ar​。两个非空连续子序列不同,当且仅当下标不同。 例如,当原序列为 [1,2,1,2] 时,要计算子序列 [