什么是 NPU?NPU 与 GPU 与 CPU 的区别

2024-06-04 16:12
文章标签 区别 gpu cpu npu

本文主要是介绍什么是 NPU?NPU 与 GPU 与 CPU 的区别,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

NPU 是什么?为什么它对在设备上激活生成式人工智能的过程至关重要?

NPU专为人工智能设计,并与其他处理器配合工作,加快生成式人工智能体验。

这是人工智能(AI)生成式革命的开端。显而易见,为了满足各个垂直领域对生成式 AI 用例不断增长的需求和运营要求,需要一种专门用于人工智能的新计算架构。随后开始使用神经网络处理器(NPU),该处理器从一开始就旨在生成智能机器。

此外,它利用了各种处理器的异构混合,例如中央处理单元(CPU)和图形处理单元(GPU)。为了实现新的和改进的生成人工智能体验,异构计算增强了应用程序性能、热效率和电池寿命。这是通过将适当的处理器与神经处理单元(NPU)结合来实现的。

GPU 和 NPU 的融合

为了满足生成人工智能的各种标准和计算需求,有必要拥有各种处理器。利用每个处理器的能力,比如以人工智能为中心的定制神经处理单元(NPU),与中央处理单元(CPU)和图形处理单元(GPU)一起工作,每个处理器在不同的工作领域都表现出色,这是通过使用处理多样性的异构计算架构实现的。

例如,中央处理器(CPU)负责顺序控制和即时性,图形处理器(GPU)负责流式并行数据,神经处理器(NPU)负责基本人工智能任务,包括标量、向量和张量运算。

计算是异构的,可以提高应用程序性能、设备热效率和电池寿命,从而增强终端用户与生成人工智能的体验。

NPU 是什么?

神经处理单元(NPU)是从头开始设计的,旨在加快人工智能推断速度,同时使用最少的功率。其架构随着新的 AI 算法、模型和用例的引入而发展。人工智能大部分工作涉及计算由标量、向量和张量数学组成的神经网络层,然后是非线性激活函数。更好的 NPU 设计是与 AI 行业发展方向密切对齐,并做出适当的设计决策来管理与 AI 相关的工作负载。

高通通过提供异构计算和网络处理单元的领先解决方案,将智能计算带到各个领域。高通 Hexagon 神经处理单元(NPU)旨在在使用最少功耗的同时提供持续高性能的人工智能推断。NPU 通过系统方法、定制设计和快速创新区别于行业其他产品。他们能够快速调整和扩展设计,以克服瓶颈并最大化性能。这得益于定制设计神经处理单元(NPU)和调整指令集架构(ISA)。

在最佳异构计算架构中最重要的处理器之一是高通人工智能引擎,即 Hexagon NPU。该架构还包括高通 Adreno GPU、高通 Kryo 或高通 Oryon CPU、高通感应中心和内存子系统。在设备上,这些处理器被设计为相互协作,以快速有效地运行人工智能应用程序。

作为证据,它在人工智能基准测试和实际生成式人工智能应用中的表现在市场上名列前茅。你可以通过阅读白皮书了解更多关于自然语言处理(NPU)、它的其他异构处理器以及她在骁龙 8 Gen 3 和骁龙 X Elite 上领先行业的人工智能性能。见Qualcomm-美国高通公司官方网站

这能为开发人员提供加速使用生成式人工智能的应用程序的能力,主要重点是简化开发和部署流程,覆盖全球数十亿由高通和骁龙平台驱动的设备。这使其能够赋予开发人员权力。开发人员可以利用高通人工智能堆栈在硬件上构建、优化和部署他们的人工智能应用程序。这使他们只需编写一次代码,然后利用芯片组解决方案在各种产品和市场上分发。

这篇关于什么是 NPU?NPU 与 GPU 与 CPU 的区别的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/1030496

相关文章

AI Toolkit + H100 GPU,一小时内微调最新热门文生图模型 FLUX

上个月,FLUX 席卷了互联网,这并非没有原因。他们声称优于 DALLE 3、Ideogram 和 Stable Diffusion 3 等模型,而这一点已被证明是有依据的。随着越来越多的流行图像生成工具(如 Stable Diffusion Web UI Forge 和 ComyUI)开始支持这些模型,FLUX 在 Stable Diffusion 领域的扩展将会持续下去。 自 FLU

native和static native区别

本文基于Hello JNI  如有疑惑,请看之前几篇文章。 native 与 static native java中 public native String helloJni();public native static String helloJniStatic();1212 JNI中 JNIEXPORT jstring JNICALL Java_com_test_g

如何用GPU算力卡P100玩黑神话悟空?

精力有限,只记录关键信息,希望未来能够有助于其他人。 文章目录 综述背景评估游戏性能需求显卡需求CPU和内存系统需求主机需求显式需求 实操硬件安装安装操作系统Win11安装驱动修改注册表选择程序使用什么GPU 安装黑神话悟空其他 综述 用P100 + PCIe Gen3.0 + Dell720服务器(32C64G),运行黑神话悟空画质中等流畅运行。 背景 假设有一张P100-

Android fill_parent、match_parent、wrap_content三者的作用及区别

这三个属性都是用来适应视图的水平或者垂直大小,以视图的内容或尺寸为基础的布局,比精确的指定视图的范围更加方便。 1、fill_parent 设置一个视图的布局为fill_parent将强制性的使视图扩展至它父元素的大小 2、match_parent 和fill_parent一样,从字面上的意思match_parent更贴切一些,于是从2.2开始,两个属性都可以使用,但2.3版本以后的建议使

Collection List Set Map的区别和联系

Collection List Set Map的区别和联系 这些都代表了Java中的集合,这里主要从其元素是否有序,是否可重复来进行区别记忆,以便恰当地使用,当然还存在同步方面的差异,见上一篇相关文章。 有序否 允许元素重复否 Collection 否 是 List 是 是 Set AbstractSet 否

javascript中break与continue的区别

在javascript中,break是结束整个循环,break下面的语句不再执行了 for(let i=1;i<=5;i++){if(i===3){break}document.write(i) } 上面的代码中,当i=1时,执行打印输出语句,当i=2时,执行打印输出语句,当i=3时,遇到break了,整个循环就结束了。 执行结果是12 continue语句是停止当前循环,返回从头开始。

maven发布项目到私服-snapshot快照库和release发布库的区别和作用及maven常用命令

maven发布项目到私服-snapshot快照库和release发布库的区别和作用及maven常用命令 在日常的工作中由于各种原因,会出现这样一种情况,某些项目并没有打包至mvnrepository。如果采用原始直接打包放到lib目录的方式进行处理,便对项目的管理带来一些不必要的麻烦。例如版本升级后需要重新打包并,替换原有jar包等等一些额外的工作量和麻烦。为了避免这些不必要的麻烦,通常我们

ActiveMQ—Queue与Topic区别

Queue与Topic区别 转自:http://blog.csdn.net/qq_21033663/article/details/52458305 队列(Queue)和主题(Topic)是JMS支持的两种消息传递模型:         1、点对点(point-to-point,简称PTP)Queue消息传递模型:         通过该消息传递模型,一个应用程序(即消息生产者)可以

深入探讨:ECMAScript与JavaScript的区别

在前端开发的世界中,JavaScript无疑是最受欢迎的编程语言之一。然而,很多开发者在使用JavaScript时,可能并不清楚ECMAScript与JavaScript之间的关系和区别。本文将深入探讨这两者的不同之处,并通过案例帮助大家更好地理解。 一、什么是ECMAScript? ECMAScript(简称ES)是一种脚本语言的标准,由ECMA国际组织制定。它定义了语言的语法、类型、语句、

Lua 脚本在 Redis 中执行时的原子性以及与redis的事务的区别

在 Redis 中,Lua 脚本具有原子性是因为 Redis 保证在执行脚本时,脚本中的所有操作都会被当作一个不可分割的整体。具体来说,Redis 使用单线程的执行模型来处理命令,因此当 Lua 脚本在 Redis 中执行时,不会有其他命令打断脚本的执行过程。脚本中的所有操作都将连续执行,直到脚本执行完成后,Redis 才会继续处理其他客户端的请求。 Lua 脚本在 Redis 中原子性的原因