RK3588人工智能开发----【1】初识NPU

2024-08-25 20:04

本文主要是介绍RK3588人工智能开发----【1】初识NPU,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

NPU 的诞生!

      随着人工智能和大数据时代的到来,传统嵌入式处理器中的CPU和GPU逐渐无法满足日益增长的深度学习需求。为了应对这一挑战,在一些高端处理器中,NPU(神经网络处理单元)也被集成到了处理器里。NPU的出现不仅减轻了CPU和GPU的负担,还让复杂的计算任务得以高效处理。在典型的工作流中,CPU会首先接收任务,并根据任务的性质将其分配给合适的处理单元,图像处理任务由GPU处理,而人工智能相关任务则交给NPU。     
      什么是 NPU 呢? 在谈这个问题之前,可以先来看看什么是 CPU 和 GPU,CPU 就是中央处理器,中央处理器就好像是人类的大脑,主要负责各种逻辑控制和任务调度。所以 CPU 的计算能力相对来说不是最强的。GPU 是图形处理器,顾名思义,图形处理器是用来处理图形的,那处理图形就要 涉及到大量的计算,所以 GPU 相对 CPU 来说更擅长计算,但是不擅长逻辑控制和调度。从这 方面来讲就可以说 GPU 是 CPU 的互补。 但是随着人工智能,大数据的时代来临,以前嵌入式处理器中的 CPU 和 GPU 渐渐的难以满足与日俱增的需求,尤其是深度学习方面。为了应对日渐增长的需求,NPU 就诞生的了。 
      NPU 英语全称为 Neural Process Unit,译为神经网络处理器。NPU 是在电路层来模拟人类的神经元和突触,所以特别擅长处理人工智能任务。
      NPU 的诞生大大的降低了 CPU 和 GPU 的负担,任何工作首先要经过 CPU,然后 CPU 在根据这个任务的性质来决定是分给 GPU 还是 NPU,如果是图像处理器方面,就分给 GPU,如果是人工智能方面,就分给 NPU。
      NPU 的应用场景非常的广泛,如人脸跟踪、手势和身体跟踪、图像分类、视频监控、自动语音识别(ASR)和先进的驾驶员辅助系统(ADAS)等等。

总结 

      NPU 是 "Neural Processing Unit"(神经网络处理单元)的缩写,是一种专门用于加速深度学习和神经网络计算的硬件处理器。NPU 是为了满足机器学习任务中高效处理大规模矩阵运算和复杂模型推理的需求而设计的,特别适合处理卷积神经网络(CNNs)、循环神经网络(RNNs)、生成对抗网络(GANs)等深度学习模型。 

 

初识 RKNPU


      为了满足人工智能的需要,瑞芯微的处理器也逐渐集成了 NPU,瑞芯微的处理器内置的 NPU,称之为 RKNPU。 RKNPU 经过了几代的发展,首代初次引入了 RKNPU 是从 RK3399pro 和 RK1808 开始的, 相比传统的 CPU 和 GPU,在深度学习运算能力上有比较大幅度的提升。接下来在 RV1109 和 RV1126 上使用了第二代 NPU,提升了 NPU 的利用率。第三代 NPU 应用在 RK3566 和 RK3568 上,搭载全新 NPU 自研架构。第四代 NPU 应用在 RK3588 和 RK3588s 上,自研架构再升级。 RKNPU 发展过程如下图所示: 

瑞芯微 RK3588 芯片内置 NPU,是 RKNPU 第四代的代表产品。第四代 RKNPU 特点如下所示:

RK3588NPU 是 3 个核心,包含 CNA 模块、 DPU 模块、PPU 模块。
CNA 模块全称是 Convolution Neural Network Accelerator,也就是卷积神经网络加速器。
DPU 模块全称是 dada processing Unit,也就是数据处理单元。
PPU 模块全称是 Planar Processing Unit,平面处理单元。
NPU 框图如下图所示:

这篇关于RK3588人工智能开发----【1】初识NPU的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1106525

相关文章

这15个Vue指令,让你的项目开发爽到爆

1. V-Hotkey 仓库地址: github.com/Dafrok/v-ho… Demo: 戳这里 https://dafrok.github.io/v-hotkey 安装: npm install --save v-hotkey 这个指令可以给组件绑定一个或多个快捷键。你想要通过按下 Escape 键后隐藏某个组件,按住 Control 和回车键再显示它吗?小菜一碟: <template

基于人工智能的图像分类系统

目录 引言项目背景环境准备 硬件要求软件安装与配置系统设计 系统架构关键技术代码示例 数据预处理模型训练模型预测应用场景结论 1. 引言 图像分类是计算机视觉中的一个重要任务,目标是自动识别图像中的对象类别。通过卷积神经网络(CNN)等深度学习技术,我们可以构建高效的图像分类系统,广泛应用于自动驾驶、医疗影像诊断、监控分析等领域。本文将介绍如何构建一个基于人工智能的图像分类系统,包括环境

Hadoop企业开发案例调优场景

需求 (1)需求:从1G数据中,统计每个单词出现次数。服务器3台,每台配置4G内存,4核CPU,4线程。 (2)需求分析: 1G / 128m = 8个MapTask;1个ReduceTask;1个mrAppMaster 平均每个节点运行10个 / 3台 ≈ 3个任务(4    3    3) HDFS参数调优 (1)修改:hadoop-env.sh export HDFS_NAMENOD

嵌入式QT开发:构建高效智能的嵌入式系统

摘要: 本文深入探讨了嵌入式 QT 相关的各个方面。从 QT 框架的基础架构和核心概念出发,详细阐述了其在嵌入式环境中的优势与特点。文中分析了嵌入式 QT 的开发环境搭建过程,包括交叉编译工具链的配置等关键步骤。进一步探讨了嵌入式 QT 的界面设计与开发,涵盖了从基本控件的使用到复杂界面布局的构建。同时也深入研究了信号与槽机制在嵌入式系统中的应用,以及嵌入式 QT 与硬件设备的交互,包括输入输出设

OpenHarmony鸿蒙开发( Beta5.0)无感配网详解

1、简介 无感配网是指在设备联网过程中无需输入热点相关账号信息,即可快速实现设备配网,是一种兼顾高效性、可靠性和安全性的配网方式。 2、配网原理 2.1 通信原理 手机和智能设备之间的信息传递,利用特有的NAN协议实现。利用手机和智能设备之间的WiFi 感知订阅、发布能力,实现了数字管家应用和设备之间的发现。在完成设备间的认证和响应后,即可发送相关配网数据。同时还支持与常规Sof

活用c4d官方开发文档查询代码

当你问AI助手比如豆包,如何用python禁止掉xpresso标签时候,它会提示到 这时候要用到两个东西。https://developers.maxon.net/论坛搜索和开发文档 比如这里我就在官方找到正确的id描述 然后我就把参数标签换过来

Linux_kernel驱动开发11

一、改回nfs方式挂载根文件系统         在产品将要上线之前,需要制作不同类型格式的根文件系统         在产品研发阶段,我们还是需要使用nfs的方式挂载根文件系统         优点:可以直接在上位机中修改文件系统内容,延长EMMC的寿命         【1】重启上位机nfs服务         sudo service nfs-kernel-server resta

【区块链 + 人才服务】区块链集成开发平台 | FISCO BCOS应用案例

随着区块链技术的快速发展,越来越多的企业开始将其应用于实际业务中。然而,区块链技术的专业性使得其集成开发成为一项挑战。针对此,广东中创智慧科技有限公司基于国产开源联盟链 FISCO BCOS 推出了区块链集成开发平台。该平台基于区块链技术,提供一套全面的区块链开发工具和开发环境,支持开发者快速开发和部署区块链应用。此外,该平台还可以提供一套全面的区块链开发教程和文档,帮助开发者快速上手区块链开发。

Vue3项目开发——新闻发布管理系统(六)

文章目录 八、首页设计开发1、页面设计2、登录访问拦截实现3、用户基本信息显示①封装用户基本信息获取接口②用户基本信息存储③用户基本信息调用④用户基本信息动态渲染 4、退出功能实现①注册点击事件②添加退出功能③数据清理 5、代码下载 八、首页设计开发 登录成功后,系统就进入了首页。接下来,也就进行首页的开发了。 1、页面设计 系统页面主要分为三部分,左侧为系统的菜单栏,右侧

v0.dev快速开发

探索v0.dev:次世代开发者之利器 今之技艺日新月异,开发者之工具亦随之进步不辍。v0.dev者,新兴之开发者利器也,迅速引起众多开发者之瞩目。本文将引汝探究v0.dev之基本功能与优势,助汝速速上手,提升开发之效率。 何谓v0.dev? v0.dev者,现代化之开发者工具也,旨在简化并加速软件开发之过程。其集多种功能于一体,助开发者高效编写、测试及部署代码。无论汝为前端开发者、后端开发者