苹果M4性能分析:进步神速?还有多少空间?

2024-05-24 14:52

本文主要是介绍苹果M4性能分析:进步神速?还有多少空间?,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

在这里插入图片描述

2024年初,苹果推出了M4处理器,令人意外的是,它的发布距离M3发布仅仅过去了半年时间。更让人惊讶的是,M4首次亮相于iPad Pro。这一新处理器不仅仅是M3的简单升级版本,而是一次全面的架构优化。本文将详细分析M4处理器的架构、性能和能效,探讨其在未来Mac和iPhone上的潜力。

M4芯片简介

工艺与架构

M4处理器采用台积电的第二代3nm工艺(N3E),成为首款使用N3E工艺的处理器。相比M3使用的N3B工艺,N3E理论上能提供更高的性能上限。苹果在发布会上提到,M4的CPU部分再次提升了大核架构。这次的改进不仅是M3的简单改良,而是对微架构进行了进一步优化。

性能与频率

M4在被动冷却设备中的峰值频率达到了4.5GHz,这对于iPad来说是前所未有的。小核的频率也达到了2.88GHz,与英特尔当前一代Core Ultra 5的水平相当。GPU方面,M4基本上是M3 GPU的优化版,频率从1.34GHz提升至1.47GHz。NPU(神经处理单元)部分,苹果首次在发布会上大量提及“AI”,并声称其NPU性能优于市场上所有的“AIPC”。

M4还采用了频率更高的LPDDR5-7500内存,而非预期的LPDDR5X内存,可能是为了降低延迟。内存带宽对于NPU和GPU都至关重要,这一提升为AI应用提供了更好的支持。

CPU微架构分析

前端与后端改进

M4的大核相比M3有显著提升。其解码单元宽度从M3的9扩大到10,这意味着每个时钟周期可以解码更多指令。前端解码单元的扩大通常对应着更强的后端处理能力,M4的新架构显著增加了Dispatch Buffer和浮点单元的调度队列,提高了内核的并行性。

SME单元的引入

M4引入了SME单元,相当于ARM版本的AVX512,P核和E核簇各有一个SME单元,共享L2缓存。支持SME的程序在性能上将有大幅提升。这一改进主要是为了加速未来的AI应用。

内存与缓存性能

M4的内存延迟显著低于M3,从约96ns降低到88ns,主要得益于LPDDR5-7500内存的使用。小核部分,M4仍采用A17 Pro和M3的小核微架构,但频率更高。

性能测试

SPEC2017测试

在SPEC2017测试中,M4的大核峰值性能相比M3提高了近20%。然而,这种性能提升也带来了显著更高的功耗,峰值功耗比M3高出60%。在常温下,M4的频率策略会更保守,单线程频率为4.4GHz,多线程频率为3.94GHz。这种频率策略类似于Intel和AMD的PC处理器。

GeekBench测试

在GeekBench 6.3中,M4的表现显著提升,增加SME支持后,M4的跑分大幅提高。在GeekBench 5中,M4的单核性能比M3高17%,多核性能比M3高25%。与M2相比,M4的单核和多核性能分别提高了近50%。

能效分析

同频能效方面,M4的大核在高频能效上没有显著改善,但在低频能效上有小幅提升。总体来看,M4在性能上的提升主要得益于架构改进,而非工艺优化。

游戏性能

我们测试了M4在《原神》和《崩坏:星穹铁道》中的表现。在高分辨率下,M4的iPad Pro能以60fps稳定运行,但在解锁120fps后,帧率有所下降。M4的GPU频率提升了10%,带来了相应的性能提升,但能效改善不大。

电池续航

在300nit屏幕亮度下,M4 iPad Pro的电池续航相比上一代有显著提升,特别是13英寸版本的续航几乎翻倍。这主要得益于新一代OLED屏幕显著降低了整机功耗。

总结

M4在性能上有显著提升,但能效改善有限,表明半导体工艺的进步可能快到头了。未来,我们需要更多的架构改进来继续提升性能和能效。总体来看,M4处理器在架构和性能上有了显著的进步,但N3E工艺并未带来预期的能效提升,未来的性能提升将更多依赖于架构优化。

这篇关于苹果M4性能分析:进步神速?还有多少空间?的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/998722

相关文章

Redis主从复制实现原理分析

《Redis主从复制实现原理分析》Redis主从复制通过Sync和CommandPropagate阶段实现数据同步,2.8版本后引入Psync指令,根据复制偏移量进行全量或部分同步,优化了数据传输效率... 目录Redis主DodMIK从复制实现原理实现原理Psync: 2.8版本后总结Redis主从复制实

锐捷和腾达哪个好? 两个品牌路由器对比分析

《锐捷和腾达哪个好?两个品牌路由器对比分析》在选择路由器时,Tenda和锐捷都是备受关注的品牌,各自有独特的产品特点和市场定位,选择哪个品牌的路由器更合适,实际上取决于你的具体需求和使用场景,我们从... 在选购路由器时,锐捷和腾达都是市场上备受关注的品牌,但它们的定位和特点却有所不同。锐捷更偏向企业级和专

Spring中Bean有关NullPointerException异常的原因分析

《Spring中Bean有关NullPointerException异常的原因分析》在Spring中使用@Autowired注解注入的bean不能在静态上下文中访问,否则会导致NullPointerE... 目录Spring中Bean有关NullPointerException异常的原因问题描述解决方案总结

正则表达式高级应用与性能优化记录

《正则表达式高级应用与性能优化记录》本文介绍了正则表达式的高级应用和性能优化技巧,包括文本拆分、合并、XML/HTML解析、数据分析、以及性能优化方法,通过这些技巧,可以更高效地利用正则表达式进行复杂... 目录第6章:正则表达式的高级应用6.1 模式匹配与文本处理6.1.1 文本拆分6.1.2 文本合并6

python中的与时间相关的模块应用场景分析

《python中的与时间相关的模块应用场景分析》本文介绍了Python中与时间相关的几个重要模块:`time`、`datetime`、`calendar`、`timeit`、`pytz`和`dateu... 目录1. time 模块2. datetime 模块3. calendar 模块4. timeit

python-nmap实现python利用nmap进行扫描分析

《python-nmap实现python利用nmap进行扫描分析》Nmap是一个非常用的网络/端口扫描工具,如果想将nmap集成进你的工具里,可以使用python-nmap这个python库,它提供了... 目录前言python-nmap的基本使用PortScanner扫描PortScannerAsync异

Oracle数据库执行计划的查看与分析技巧

《Oracle数据库执行计划的查看与分析技巧》在Oracle数据库中,执行计划能够帮助我们深入了解SQL语句在数据库内部的执行细节,进而优化查询性能、提升系统效率,执行计划是Oracle数据库优化器为... 目录一、什么是执行计划二、查看执行计划的方法(一)使用 EXPLAIN PLAN 命令(二)通过 S

Vue3 的 shallowRef 和 shallowReactive:优化性能

大家对 Vue3 的 ref 和 reactive 都很熟悉,那么对 shallowRef 和 shallowReactive 是否了解呢? 在编程和数据结构中,“shallow”(浅层)通常指对数据结构的最外层进行操作,而不递归地处理其内部或嵌套的数据。这种处理方式关注的是数据结构的第一层属性或元素,而忽略更深层次的嵌套内容。 1. 浅层与深层的对比 1.1 浅层(Shallow) 定义

性能测试介绍

性能测试是一种测试方法,旨在评估系统、应用程序或组件在现实场景中的性能表现和可靠性。它通常用于衡量系统在不同负载条件下的响应时间、吞吐量、资源利用率、稳定性和可扩展性等关键指标。 为什么要进行性能测试 通过性能测试,可以确定系统是否能够满足预期的性能要求,找出性能瓶颈和潜在的问题,并进行优化和调整。 发现性能瓶颈:性能测试可以帮助发现系统的性能瓶颈,即系统在高负载或高并发情况下可能出现的问题

性能分析之MySQL索引实战案例

文章目录 一、前言二、准备三、MySQL索引优化四、MySQL 索引知识回顾五、总结 一、前言 在上一讲性能工具之 JProfiler 简单登录案例分析实战中已经发现SQL没有建立索引问题,本文将一起从代码层去分析为什么没有建立索引? 开源ERP项目地址:https://gitee.com/jishenghua/JSH_ERP 二、准备 打开IDEA找到登录请求资源路径位置