NCNN使用总结

2024-05-28 19:58
文章标签 总结 使用 ncnn

本文主要是介绍NCNN使用总结,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

文章目录

  • 友情提示
    • NCNN简介
    • NCNN注意事项
    • **NCNN使用心得**
      • 小技巧
      • 小想法

友情提示

友情提示不针对第三方,为了给读者更好的体验

  • 建议去我的博客园进行阅读
  • 微信地址
  • GitHub地址
  • 欢迎大家关注我的微信公众号

NCNN简介

ncnn 是一个为手机端极致优化的高性能神经网络前向计算框架。ncnn 从设计之初深刻考虑手机端的部署和使用。无第三方依赖,跨平台,手机端 cpu 的速度快于目前所有已知的开源框架。基于 ncnn,开发者能够将深度学习算法轻松移植到手机端高效执行,开发出人工智能 APP,将 AI 带到你的指尖。ncnn 目前已在腾讯多款应用中使用,如 QQ,Qzone,微信,天天P图等。

关于安装、编译、使用步骤等不在赘述,官网有很详细文档

WindowsLinuxMacOSAndroidiOS
intel-cpu✔️✔️✔️/
intel-gpu✔️✔️/
amd-cpu✔️✔️✔️/
amd-gpu✔️✔️/
nvidia-gpu✔️✔️/
qcom-cpu✔️//
qcom-gpu✔️/✔️/
arm-cpu//
arm-gpu/✔️/
apple-cpu////
apple-gpu////✔️

NCNN注意事项

其实ncnn已经是一个完整的库,很少有人去改源码,当然如果你项目特别需要使可以的。

使用出现问题主要是输入输出的地方不对应,以下是本人使用出现的问题。

  • 网络问题一

使用caffe模型的时候,input部分一定要写成规范格式:

input: "data"
layer {name: "data"type: "Input"top: "data"input_param { shape: { dim: 1 dim: 1 dim: 256 dim: 512 } }
}

千万别图省事写成如下格式,caffe可以运行没问题,但是转化无法识别,这个ncnn数据结构导致!!!

input: "data"
input_dim: 1
input_dim: 1
input_dim: 256
input_dim: 512
  • 网络问题二

网络定义的层千万别出现重复情况,一定要规范定义:

layer {name: "AAAA"type: "Concat"bottom: "box_softmax"bottom: "conv6_2"top: "concat_out1"concat_param {axis: 2}
}
layer {name: "BBBB"type: "Concat"bottom: "box_softmax"bottom: "concat_out1"top: "concat_out2"concat_param {axis: 2}
}

千万别写成如下网络,在caffe可以稳定运行,但是ncnn会读取上第一次出现的top层!!!

第一层输出是concat_out1,第二层输出也是concat_out1,当使用ncnn.extract会出现错误!!!

layer {name: "AAAA"type: "Concat"bottom: "box_softmax"bottom: "conv6_2"top: "concat_out1"concat_param {axis: 2}
}
layer {name: "BBBB"type: "Concat"bottom: "box_softmax"bottom: "concat_out1"top: "concat_out1"concat_param {axis: 2}
}
  • NCNN网络问题三

这貌似是算作caffe的问题,在笔者使用的过程忽略了这一点,干脆算NCNN操作里面了。

Batch Normalization层有个use_global_stats参数,这个操作的作用是:是否使用caffe内部的均值和方差

换句话的意思就是:

---------true :使用caffe内部的均值和方差,其中方差和均值都是固定的,模型训练好之后,这两个值就固定了。
---------false :使用当前层计算的方差和均值,这个是不固定的,是在训练过程一直改变,训练好的时候达到最优。

其中NCNN默认使用true状态,不管是false还是true,最终都是算作true

caffe测试的时候得手动设置为true

  • NCNN输入数据一

正常来说ncnncaffe原版的误差范围在0.001左右,我的数据在0.000X范围徘徊,如果你的数据精确不到第三个有效数字,那就得检查网络输入精度了。

输入的substract_mean_normalize得尽量精确,尤其是归一化的值!!!

假设0-255的图像需要归一化到0-1

const float noml_vals[1] = { 0.0078431372549019607843137254902f };

千万不要写成下面这样,读者可以自己测试,精度差别较大。

const float noml_vals[1] = { 0.0078 }
  • NCNN输入数据二

这里没有错误点,只有心得点。

  1. 如果输入的是opencv的Mat对象,那只能是CV_8U类型,别想着去使用CV_32F等其他类型,对结果没有影响的。
  2. 关于使用opencv的处理图像和ncnn的处理图像效果一样,比如opencv的resize、normalize、cvtcolor等函数,和ncnn的from_pixels_resize、substract_mean_normalize效果基本没有区别,本人已经测试。

NCNN使用心得

小技巧

  • 输出为多层

看了NCNN的官网给的例子,它是将输出转化为一行数据,然后一个一个的进行处理:

ncnn::Mat out_flatterned = out.reshape(out.w * out.h * out.c);
std::vector<float> scores;
scores.resize(out_flatterned.w);
for (int j=0; j<out_flatterned.w; j++)
{scores[j] = out_flatterned[j];
}

个人感觉使用这种处理小数据还是可以的,本人使用网络输出100 × 100 × 10,这种情况该如何处理?

  1. 你可以使用那种方法去一个一个保存到数组,就是浪费点时间。
  2. 当你需要处理结果的时候呢?比如简单说去找每个channels的最大值,且主要知道坐标?

本人使用处理如下:

	for (size_t i = 0; i < out.c; i++){cv::Mat cv_mat = cv::Mat::zeros(cv::Size(100, 100), CV_8UC1);ncnn::Mat ppp = out.channel(i);//转化为opencv的Mat进行操作,因为有很多矩阵运算就很方便ppp.to_pixels(cv_mat.data, ncnn::Mat::PIXEL_GRAY);double max_c = 0, min_c = 0;cv::Point min_loc, max_loc;cv::minMaxLoc(cv_mat, &min_c, &max_c, &min_loc, &max_loc);/*---------------后续操作-----------------*/}

小想法

NCNN官网有个人问能不能输入和输出多个通道数据,后者已经在上文实现,以下看前者。

  • NCNN的输入为Extractor.input(const char* blob_name, const Mat& in),其中inncnn::Mat类型数据,显然是

    可以多个channels输入的。

  • 可以使用ncnn创建100×100×10数据,然后对每个channel通过from_pixel进行赋值操作即可。

没有经过具体实现,官网也没说明,不清楚能不能行,读者可以根据以上自己尝试。

这篇关于NCNN使用总结的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1011538

相关文章

Java使用Mail构建邮件功能的完整指南

《Java使用Mail构建邮件功能的完整指南》JavaMailAPI是一个功能强大的工具,它可以帮助开发者轻松实现邮件的发送与接收功能,本文将介绍如何使用JavaMail发送和接收邮件,希望对大家有所... 目录1、简述2、主要特点3、发送样例3.1 发送纯文本邮件3.2 发送 html 邮件3.3 发送带

使用DeepSeek搭建个人知识库(在笔记本电脑上)

《使用DeepSeek搭建个人知识库(在笔记本电脑上)》本文介绍了如何在笔记本电脑上使用DeepSeek和开源工具搭建个人知识库,通过安装DeepSeek和RAGFlow,并使用CherryStudi... 目录部署环境软件清单安装DeepSeek安装Cherry Studio安装RAGFlow设置知识库总

Python FastAPI入门安装使用

《PythonFastAPI入门安装使用》FastAPI是一个现代、快速的PythonWeb框架,用于构建API,它基于Python3.6+的类型提示特性,使得代码更加简洁且易于绶护,这篇文章主要介... 目录第一节:FastAPI入门一、FastAPI框架介绍什么是ASGI服务(WSGI)二、FastAP

Spring-AOP-ProceedingJoinPoint的使用详解

《Spring-AOP-ProceedingJoinPoint的使用详解》:本文主要介绍Spring-AOP-ProceedingJoinPoint的使用方式,具有很好的参考价值,希望对大家有所帮... 目录ProceedingJoinPoijsnt简介获取环绕通知方法的相关信息1.proceed()2.g

Maven pom.xml文件中build,plugin标签的使用小结

《Mavenpom.xml文件中build,plugin标签的使用小结》本文主要介绍了Mavenpom.xml文件中build,plugin标签的使用小结,文中通过示例代码介绍的非常详细,对大家的学... 目录<build> 标签Plugins插件<build> 标签<build> 标签是 pom.XML

JAVA虚拟机中 -D, -X, -XX ,-server参数使用

《JAVA虚拟机中-D,-X,-XX,-server参数使用》本文主要介绍了JAVA虚拟机中-D,-X,-XX,-server参数使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有... 目录一、-D参数二、-X参数三、-XX参数总结:在Java开发过程中,对Java虚拟机(JVM)的启动参数进

Java中使用注解校验手机号格式的详细指南

《Java中使用注解校验手机号格式的详细指南》在现代的Web应用开发中,数据校验是一个非常重要的环节,本文将详细介绍如何在Java中使用注解对手机号格式进行校验,感兴趣的小伙伴可以了解下... 目录1. 引言2. 数据校验的重要性3. Java中的数据校验框架4. 使用注解校验手机号格式4.1 @NotBl

Python使用DeepSeek进行联网搜索功能详解

《Python使用DeepSeek进行联网搜索功能详解》Python作为一种非常流行的编程语言,结合DeepSeek这一高性能的深度学习工具包,可以方便地处理各种深度学习任务,本文将介绍一下如何使用P... 目录一、环境准备与依赖安装二、DeepSeek简介三、联网搜索与数据集准备四、实践示例:图像分类1.

Linux系统之authconfig命令的使用解读

《Linux系统之authconfig命令的使用解读》authconfig是一个用于配置Linux系统身份验证和账户管理设置的命令行工具,主要用于RedHat系列的Linux发行版,它提供了一系列选项... 目录linux authconfig命令的使用基本语法常用选项示例总结Linux authconfi

Windows server服务器使用blat命令行发送邮件

《Windowsserver服务器使用blat命令行发送邮件》在linux平台的命令行下可以使用mail命令来发送邮件,windows平台没有内置的命令,但可以使用开源的blat,其官方主页为ht... 目录下载blatBAT命令行示例备注总结在linux平台的命令行下可以使用mail命令来发送邮件,Win