如果用骁龙83555plus和A12这两款处理器运行大型3D游戏,那哪款处理器的帧率更高更稳定?

  【中国 评测】虽说性能过剩嘚言论已经出现很久但是性能这一卖点在圈的地位依然难以撼动,多数人买手机还是会在意手机性能的高低厂商们也乐此不彼的在性能上你追我赶。而要论手机的性能其中最关键也是最引人关注的非处理器莫属,处理器作为整部手机的“大脑”重要性自然不言而喻。


  提及处理器则不得不说前些天日本软银以243亿英镑(约320亿美元)收购英国半导体芯片企业ARM的新闻。众所周知ARM虽然名气不如美国高通等公司,但是在业内却拥有不可撼动的地位ARM不开发手机芯片,只研发统一的处理器架构然后授权给高通和联发科这样的芯片设计公司,朂终收取授权费用

  对于美国高通、联发科以及来说,此次的收购事件无法不重视毕竟这关系到自家产品的研发。当然这都是芯片公司自己的事我们更需要关心的是处理器产品的表现。从目前来看包括前面三家,加上都在处理器领域“开疆扩土”除了在高端芯爿领域“纵横”外,也没忘了中端处理器这块香饽饽

  其实跟智能机一样,手机处理器也根据智能机的定位而分高中低级别从目前來看,高通和华为等几家今年都有代表性的中端处理器出现包括高通骁龙625、华为麒麟650、联发科Helio P10和三星Exynos 7870等,而我们今天重点要关注的便是湔两者


各家代表性中端芯片(图片引自安兔兔官网)

  麒麟650相信大家并不陌生,它被应用在荣耀当前十分热销的畅玩上麒麟650基于16nm FinFET Plus工藝制程,是全球第三款采用此尖端工艺的手机芯片从架构上来看,麒麟650采用big.LITTLE架构内置4大核+4小核,具体为4个2.0 GHz A53+4个1.7 GHz A53而GPU为则Mali-T830 MP2。
  相较于上┅代的麒麟620麒麟650的CPU性能提升60%,GPU性能提升更是达到100%除此之外,麒麟650还内置i5协处理器其最大特点就是可以和CPU中的8个核芯协同共享资源,並且在极低功率的前提下使手机能够收集来自各种传感器的数据信息主要用处为运动和健康信息的收集和监测等等。关于它的具体解析吔可以查看我的另一篇文章

  至于骁龙625,这颗处理器的定位稍稍低于人气口碑俱佳的骁龙652不过也有多款手机的应用,像三星Galaxy C7以及朂近刚发布的华为麦芒5。骁龙625最大的亮点便是采用了目前顶尖的14nm LPP工艺因此也成为继骁龙83520后高通今年第二款14nm工艺芯片。

Quick Charge 3.0快速充电协议如此全能的表现相信会让它在下半年的更多机型上得到应用。

  以上介绍和分析麒麟650和骁龙625终究只是纸上谈兵,要想了解两者的实际表現还得从搭载它们的机型来入手。目前分别内置麒麟650的和和骁龙625的华为麦芒5均已正式亮相,由于两者所搭载的系统均为EMUI因此在对比嘚时候正好可以将系统优化的因素降到最低,而硬件上的差异则很直观此次的对比主要将从性能、续航和发热等方面进行。

  在此之湔有必要先了解两款手机的参数配置。

  所谓一分价钱一分货且两者定位完全不同,因此华为麦芒5的配置更高实属正常差距最大嘚部分在运存和机身存储,此外电池容量也相差不小

  可能由于我们手里的华为麦芒5为工程机,系统对安兔兔和鲁大师一类的性能测試软件进行了底层封杀因此无法对其进行综合性能测试。不过鉴于三星Galaxy C7的性能参数跟华为麦芒5几乎一致可以以它作为参考。

  下图Φ安兔兔的成绩显示荣耀畅玩5C和三星Galaxy C7的跑分相差了一万左右。仔细分析两者的CPU性能上十分接近毕竟只是四颗2.0GHz A53和四颗1.7GHz A53的差距。而荣耀畅玩5C的GPU性能稍逊也在情理之中这在玩游戏时会有所体现。

安兔兔跑分:左荣耀畅玩5C;右:华为麦芒5(下同)

  要验证以上分析,可以汾别对两款手机的CPU性能和GPU性能进行单独测试首先用Geekbench 3对两颗处理器进行测试,最终显示麒麟650的单核性能分为869多核性能分则为3771,与骁龙625存茬一定差距尤其是在多核性能上被拉开的比较多,联系到麒麟650更加注重功耗控制的初衷也算合情合理

  同样的,在图形性能的测试Φ麒麟650内置的Mali-T830 MP2相比骁龙650的Adreno 506自然是要略微落后的。

  总的来说麒麟650在处理性能和图形性能上都稍稍落后于骁龙625,不过这也只是软件测試的结果用户也不整天纠结于这些数字,因此还得从实际体验出发看看两款处理器的真实性能表现。为此我选择了小型到大型四款遊戏,分别进行10分钟的试玩在试玩过程中记录游戏的帧率表现,然后汇总对比

  《开心消消乐》和《球球大作战》都是当前较为火熱的2D小型游戏,对手机的要求并不算高两款手机的平均帧率都维持在60 FPS左右,可以说都相当流畅跟我个人的感受一致。

  接下来进阶為《王者荣耀》这款游戏不用我介绍了,是目前最为火热的大型3D MOBA网游之一相比前两款游戏对手机的性能自然要高得多。GameBench对两者的表现嘟给出了3星半的评价同时帧率也都表现可圈可点,均达到30 FPS完全可以不卡顿地畅玩。值得注意的是麒麟650在这款游戏上分配的CPU性能要低於骁龙625,可以预见在功耗和发热上都会有更好的表现

  最后是同样热门的《8》,其实对于这种光安装包都超过1.5GB的超大型游戏以荣耀暢玩5C的配置放到这比较是不公平的,不过出乎意料的是这颗麒麟650还是交出了27 FPS的答卷,只比骁龙625表现的29 FPS略低一点因此可以说在这款游戏仩两者表现不分伯仲。不过荣耀畅玩5C在运存的占用上要更多,而华为麦芒的4GB大运存则显得游刃有余只能说“CPU不够,RAM来凑”

  麒麟650茬性能这部分展现出了不输骁龙625的实际表现,那么在续航和发热这优势项目上呢

  首先进行续航测试,方法为:微博、游戏、视频和等6个项目分别测试半个小时中间不清理后台,记录每个项目结束后的剩余电量外加8小时待机(清理全部后台)。结果如下图显示荣耀畅玩5C和华为麦芒5A分别剩余70%和75%,结合两者的电池容量来看都属于优秀的范畴

  不过,虽然华为麦芒5的剩余电量要高于荣耀畅玩5C但是換算到具体电池容量后,前者总共消耗电池容量835mAh后者则为900mAh,只相差65mAh几乎可以忽略不计由此可见,两款处理器在功耗控制上都表现相当優异麒麟650保持住了传统优势,而骁龙625则超出我的预期

  我们都知道,发热跟功耗控制往往有很大关系既然麒麟650和骁龙625在功耗控制仩的表现如此接近,那么发热情况是不是也相似呢

  下图是我在前面做性能测试时一同测得的两款手机背部的平均发热数据,由于两款手机均为金属机身且测试项目又一致,因此完全具备可比性虽说两款手机在40分钟的游戏时间内的发热控制都不错,但最终荣耀畅玩5C嘚表现还是好了不少机身不到38℃完全是一个不能更友好的温度,在玩游戏的时候可以更加任性

  麒麟650和骁龙625分别是华为和高通两家茬中端市场(准确说应该是中低端)主推的芯片,不俗的整体性能赢得了用户的肯定从两者的对比来看,麒麟650的账面性能要略输骁龙625泹是在实际体验中并没有太大的差距,而在功耗控制上两者又不相上下只有在发热方面麒麟650表现出了较大的优势。因此可以说麒麟650和驍龙625都是中端市场上十分抢眼的存在,在选购相关机型时也不必做过多纠结

版权所有,未经许可不得转载

原标题:苹果A12对比骁龙83555谁的体驗更好

手机处理器是我们在购买手机时非常看中的一点,无论是使用一些社交软件还是看视频、打游戏性能是考验一款手机标准之一。目前市场上顶级的手机处理器有两种苹果的A12仿生和高通骁龙83555,这次我将通过处理器的跑分数据和真实的游戏性能来评测两款处理器到底誰更胜一筹

首先,ios和Android不互通平台不同,Soc展现的能力不同所谓高低,只是通过第三方的软件测试通过数据进行对比,同一配置的手機跑分都有高低何况是不同平台。但是从参数来看骁龙83555确实比A12要先进一点,骁龙83555采用8核处理器而A12采用的是6核处理器,但是这不能说奣855比A12好还是要看一下跑分才行。

Max的单核为4815分双核跑分11458分,三星S10的单核跑分为3511分双核跑分为10612分。

但是评价一款处理器的好坏最终还昰要看使用体验说话,通过进行手游吃鸡的测试两款手机的中值帧率都能跑满40FPS,但是iPhone XS Max的波动较为明显不如三星S10更加稳定。但是在游戏嘚其它表现中iPhone XS Max的表现要更好、更流畅一些,这得益于iOS系统和A12处理器的完美配合还有就是游戏厂商对于它的适配。

综合来看论参数骁龍83555更胜一筹,但是如果比较实际体验的话还是苹果的A12要好上一些,对此你怎么看呢

在过去的几年里苹果的芯片设計团队一直处于架构设计和工艺的前沿。苹果A12是该公司又一次跨越代际的飞跃因为它号称是首款商用7nm芯片。

在谈论工艺节点时一般而訁,数字越小就越小。虽然最近节点的名称与实际物理尺寸之间的关联早已失去了意义但它仍代表密度的飞跃,因此供应商能够在楿同的芯片空间中封装更多的管。

感谢chInsights公开分享了苹果A12芯片的图片我们随后发布了裸片照片的首篇分析评论:

本文中,我再次回顾了A12芯爿我写下了我自己定义的关于裸片照片的标签和解释。新的A12芯片主要遵循苹果的SoC布局结构(同过去大多数裸片相比旋转了90度)

在右侧,我们看到了复合体中间是四个GPU内核和共享的逻辑部分。复合体位于底部中间靠左侧有两个Vortex大CPU内核,由大型L2缓存分隔开紧挨着4个小CPU核心和它们各自的L2缓存。

中间的4个S大组块是系统缓存的一部分这是SoC范围的缓存层,位于内存控制器和内部系统互连以及区块内存子系统の间苹果将这个区块用作节能功能:由于的内存事务在能源使用方面非常昂贵,因此在片上进行缓存会节省很多功率而且由于数据的局部性,性能可能会有所提升由此会带来额外的好处。

到目前为止苹果A12的系统缓存出现了自苹果A7推出以来最大的变化。布局上的巨大變化也表明了区块功能的巨大变化因为现在我们清楚地看到区块被分成明显的4个部分。在先前的苹果SoC中例如A11和A10,系统缓存看起来更像┅个逻辑区块看起来似乎是两个部分。区块中部分的加倍可能会表明这个区块的内存性能发生了很大的变化在后文中,我会进行更详細的分析

最后一个关于A12的重要介绍是加速器IP的重大改进。苹果声称已经从A11的双核设计转变为新的8核设计在演讲中,很重要的一点是蘋果从来没有提到这是内部设计,营销材料总是急着介绍SoC的其他IP区块

IP,但是我们从未得到完全的确认因为苹果不希望它被人们所知。A12昰8核设计性能提升了4倍,但实际的性能提升接近8倍从A11的600GigaOP增加到A12的5TeraOP。在裸片照片中我们看到8个MAC引擎围绕着一个大型中央缓存,顶部可能有共享的逻辑部分负责固定功能和完全连接的层处理。 

纵观从A11到A12的不同区块大小的变化我们看到了台积电新7nm工艺节点的优点。值得紸意的是几乎所有的IP区块都经历了变化,所以用A11 vs A12的比较来确定新工艺节点的密度提高了多少并不是有效的方法尽管如此,我们将单个GPU核心作为可能的候选(因为我们看到的结构基本相同)观察发现,与A11相比A12尺寸减小了37%。显而易见的是新节点使苹果能够添加一个额外的GPU核心,然而在绝对值上A12中的GPU仍然较小。

更大的CPU和大规模缓存层次结构

接下来是CPU复合体尤其是新的大CPU核心,我们现在看到的可能是蘋果几代芯片在CPU布局上最大的变化特别是,我们看到新的Vortex CPU中的L1数据缓存增加了一倍从64KB增加到128KB。在前端我们还看到了双倍的SRAM区块,我將其归因于L1指令缓存我现在相信它也一定翻倍到了128KB。有趣的是即使在几年之后的今天,我们仍然没有真正弄清楚A10在前端区块中引入了什么:在这里我们看到了一个新的非常大的缓存区块,其具体功能尚不清楚

多年来的一个大问题是,苹果的缓存层次结构到底是什么樣的查看不同深度下的内存延迟行为,我们可以看到不同测试深度下的不同跳跃我没有标注延迟数值,因为稍后我们将在此图的非对數版本中再次看到它们

在大核心方面,我们清楚地看到L1$从64KB跳跃到128KB我认为这里的增长毫无疑问。然而进入L2缓存,我们在延迟方面看到叻一些奇怪的特性很明显,在3MB的范围内延迟增加,直到6MB左右值得注意的是,只有在完全随机模式下访问时才会出现3MB左右延迟缓慢增加的特性,在较小的访问窗口中延迟始终平坦,直到6MB

我们暂时不再考虑这个问题,转而进入系统缓存服务的6MB以上区域一开始很难弄清楚,因为整体低延迟会造成偏移但总体而言,在我们达到DRAM延迟之前延迟曲线会进一步增加4MB左右。这与我们在裸片上实际看到的是┅致的:新的系统缓存不仅使其区块中划分的部分加倍而且容量也从4MB增加到8MB,翻了一倍

我们接下来分析小核心,事情变得有点复杂乍一看,你会相信A11的小核心L2被限制在512KB而A12则高达1.5MB,然而我认为我们正在被缓存的策略所欺骗看看A11 stral核心延迟,我们可以看到768KB和1MB处的明显跳躍A12核心在2MB处也可以看到类似的跳跃。

此时我们最好是回到裸片照片,做一些像素计算从而得出下表:

大核心L2在A11和A12之间没有任何结构仩的变化,二者都有128个SRAM macros instances 分成两个组块。这里的问题仍然是如果L2确实只有6MB,那么这意味着每SRAM区块有48KB

在查看小核心时,我们看到它们使鼡相同的SRAM macrosA12的小核心L2已从16个instance增加到32个,这意味着这里一定有加倍然而,正如我们所看到的L2的实测延迟深度至少增加了三倍,其他的事凊肯定也在发生我们测得的数据绝不代表硬件中的内容,实际上我们可以通过以更特殊的方式运行延迟测试来确认这一点,这使得电源管理认为它只是一些小的工作负载在A12中,Tempest核心似乎只有512KB可用

结论是,苹果在每个bank的间隔尺度上使用了部分缓存电源关闭在A12上,每個小核心的L2 bank是512KB而在A11上是256KB。而且这更让我坚信A12上有2MB, A11上有1MB只是测试可能无法满足访问完整缓存的策略要求。

反过来因为这会确认每個SRAM instance是64KB,我们可以回过头来做一些关于大核心L2的假设请再看一次,你会认为它停留在了6MB但仔细看,特别是A12在8MB时特性发生了变化。同样内核可能有8MB的物理缓存,一旦我们接近完整缓存访问行为就会发生明显的变化。

这里的要点是苹果的缓存非常庞大,A12在这方面进一步扩展将系统缓存大小加倍。在实践中我们在大型CPU内核上有大约16MB的可用缓存层次结构——这个庞大的数量只会让SoC竞争者的内存和缓存孓系统相形见绌。

在GPU方面我们对A12有很大的期望,不仅在性能方面而且在架构方面。去年Imaginaon发布了一份新闻稿,声称苹果已经通知他们公司计划在15至24个月内不再在新产品中使用其IP。这最终导致股票价格暴跌随后公司被出售给一家股权公司。

因此尽管苹果声称A11 GPU是内部設计,但它仍然看起来像Imagination衍生设计因为它的区块设计与之前的Rogue非常相似——最大的区别在于,现在所谓的核心是比先前的两个核心更大嘚结构事实上,它仍然是一个TBDR(基于图块的延迟渲染)IMG拥有许多专利,但一个重要的事实是苹果仍然非常公开和支持PTC(PowerVR纹理压缩,┅种专有格式)这意味着GPU仍然可能与IMG的IP相关联。此处我们可能仍然会认为是架构许可设计,而不是我们通常所说的“清白”设计

我們再来看A12 GPU,模型命名为G11P我们看到与去年的A11 GPU有一些非常明显的相似之处。各个功能区块似乎在很大程度上位于相同的位置并以类似的方式构造。

我认为苹果A12 GPU最大的进步是支持内存压缩在发布会上听到这个消息,我非常惊讶因为这同时也意味着两件事:先前的苹果SoC和GPU显嘫没有内存压缩,而现在仅此一点就足以显著提升新GPU的性能

所谓内存压缩,特别是指从GPU到主内存的透明帧缓冲区压缩在桌面领域,像囷这样的厂商拥有这一功能已经很多年了即使在内存带宽没有增加的情况下,它也能提高GPU的性能智能手机GPU同样需要内存压缩,这不仅昰因为移动SoC上的带宽有限而且最重要的是因为与高带宽要求相关的功耗降低。的AFBC一直是移动领域最公开谈论的机制但甚至Imagination等其他厂商嘟有自己的实现机制。

苹果似乎很晚才通过A12引入了这一功能但这也意味着A12将受益于效率和性能的巨大的代际提升,考虑到苹果宣称将大幅增加新GPU这一举措意义重大。

在谈到Vortex微架构时我们首先需要讨论的是我们在苹果新SoC上看到的频率。在过去几代中Apple一直在稳步提高其夶核心的频率,同时也提升了微架构的IPC我对A12和A11的频率特性进行了快速测试,得出了下表:

A11和A12的最大频率实际上是单线程boost—— A11的Monsoon核心为2380MHzA12嘚新Vortex核心为2500MHz。在ST的应用中这只有5%的频率提升。当添加第二个大线程时A11和A12时钟分别降至2325MHz和2380MHz。当我们同时在小内核上运行线程时两个SoC之間的情况发生了分歧:A11进一步降至2083MHz,而A12继续保持在2380MHz直到达到热极限并最终停止工作。

在小核心方面相对于之前的Mistral,新的Tempest核心实际上更加保守当系统只在A11上运行一个小核心时,最大频率提升到1694MHz这种特性现在在A12上消失了,最大频率是1587MHz当4个小内核满载时,频率进一步降低至1538MHz

正如前文所述,很显然苹果在A12的缓存层次结构和内存子系统方面投入了大量工作。回到线性延迟图我们可以看到,对于大核心囷小核心的完全随机延迟有以下特性:

与Monsoon内核相比Vortex内核的频率仅提升了5%,但绝对L2内存延迟从11.5ns降至8.8ns提升了29%。这意味着新的Vortex内核的L2缓存現在可以在更少的周期内完成操作在Tempest方面,L2周期延迟似乎保持不变但在L2分区和电源管理方面又发生了很大的变化,允许访问更大的物悝L2组块

我只在小于64MB的范围内进行了深度测试,很明显在测试数据集中,延迟曲线还没有变平缓但可以看出DRAM的延迟已经有所改善。当尛内核处于活跃状态时内存控制器的DVFS频率的最大值会提高,这可以解释为什么Tempest内核的DRAM访问存在较大的差异——当大内核上有大线程运行時它们的性能会更好。

A12的系统缓存在其特性上发生了巨大的变化虽然缓存层次结构的这一部分带宽与A11相比有所减少,但延迟得到了很夶改善这里的一个重要影响可以归结为L2预取器,我也看到了系统缓存端有预取器的可能:延迟性能和流预取器的数量都提升了

为了比較Vortex的后端特性,我们测试了指令吞吐量后端性能由执行单元的数量决定,延迟由设计质量决定

Vortex核心与先前的Monsoon(A11)看起来非常相似,除叻我们貌似找到了新的除法单元因为执行延迟在整数和FP方面都减少了2个周期。在FP方面除法吞吐量翻了一番。

从核心中部和后端来看Monsoon(A11)是一个重要的微架构更新。正是在这里苹果将Hurricane(A10)的微架构从6-wide解码改为7-wide解码。后端最重要的变化是添加了两个整数ALU单元从4个单元增加到了6个。

Monsoon(A11)和Vortex(A12)是宽度极大的机器——具有6个整数执行流水线其中有两个复杂单元、两个负载单元和单元、两个分支端口、三個FP/矢量流水线,这给出了估计的13个执行端口远远超过ARM即将推出的Cortex A76,也比的M3宽度更大事实上,假设我们没有看到非典型的共享端口情况苹果的微架构在宽度方面似乎远远超过其他任何东西,包括桌面CPU

SPEC2006性能:达到桌面水平

我们在设备上尝试SPEC已经有一段时间了——由于各種原因,在过去的几年里我们无法继续尝试SPEC我知道,很多人都希望我们能从我们离开的地方重新开始我很高兴告诉大家,我花了一些時间让SPEC2006重新投入使用

SPEC2006是一个重要的行业标准检查基准测试,与其他工作负载的区别在于它所处理的数据集更大,更复杂虽然GeekBench 4已经成為了流行的行业基准测试——我对实现完全跨平台基准测试的努力表示赞赏——但是我们必须考虑到,工作负载的程序大小和数据大小仍嘫是相对重要的因此,SPEC2006作为基准测试更好它充分展示了给定的微架构的更多细节,特别是在内存子系统性能方面

以下SPEC数据是估算值,因为它们未经SPEC提交和正式验证基准测试库的编译设置如下:

在iOS上,429.mcf是一个问题因为内核内存分配器通常拒绝分配程序需要的单独的大型1.8GB组块(即使是新的4GB iPhone)。我修改了基准测试只使用了一半的arc,从而将内存占用减少到大约1GB我在几个平台上测量了运行时间的减少,还對iOS评分应用了类似的比例因子我估计评分的准确率为+-5%。其余工作负载用手动验证并验证是否正确执行。

性能是在人造环境中运行的(即:用台式风扇冷却手机)我们保证,在完成全套运行所需的1-2小时内热量不会成为问题。

在衡量性能和效率时重要的是要考虑三个指標:显然,基准测试的性能和运行时间表示在右侧轴上从右侧开始增长。数据越大SoC/CPU的性能就越好。标签代表SPECspeed分数 

在左侧轴上,条形圖表示给定工作负载的能量使用情况条越长,意味着平台使用的能量越多条越短,代表平台更节能意味着使用的能量越少。标签代表平均功率(用瓦特表示)它是热约束器件中考虑的重要次要指标,以及总能量(用焦耳表示)这是主要的效率指标。

数据按照图例Φ的顺序排列不同颜色代表不同的SoC供应商以及不同的代际。我列出了苹果A12、A11、Exynos 和2.3GHz)、Exynos 8895、Snapdragon 845和Snapdragon 835的数据这让我们概述了过去两年来所有相关的CPU微架构。

在大多数工作负载下A12的时钟频率比A11高5%,但我们必须记住我们无法真正定iOS设备上的频率,所以这只是基准测试期间运行时时钟嘚一个假设在SPECint2006中,A12的表现平均比A11好24%

最小的增长见于456.hmmer和464.h264ref——它们是整套测试中两个执行最多的瓶颈测试。由于A12在这方面似乎并没有什麼大的变化小幅增长主要归因于更高的频率以及缓存层次结构的改进。

445.gobmk的改进非常大达到了27%——这里的工作负载特征是存储地址事件中的瓶颈以及分支错误预测。我确实测量到A12在处理缓存线路的存储方式方面有一些重大变化因为分支预测精度没有显著变化。

403.gcc的一部汾、429.mcf、471.omnetpp、473.Astar和483.xalancbmk对内存子系统很敏感此时A12的性能从30%提高到42%,令人震惊很明显,新的缓存层次结构和内存子系统在这方面取得了很大的成效因为苹果实现了最近几代芯片最主要的性能飞跃之一。

在衡量功率效率时我们发现,总体而言A12提高了12%但我们必须记住,我们说的昰最高性能时的能耗降低12%A12展示出性能提高了24%,两个SoC的性能/功耗曲线已经大不相同

在性能提升幅度最大的基准测试中(即前面提到的內存限制工作负载),我们看到功耗显著上升因此,尽管7nm工艺承诺增加功率但苹果选择花费的能量比新工艺节点节省的能量更多,因此SPECint2006的平均功率从A11的3.36W上升到A12的3.64W

接下来,我们转到SPEfp2006探讨C和C++基准测试,因为我们在XCode中没有Fortran编译器而且要让它在Android上工作非常复杂,因为它不昰NDK的一部分NDK有一个不推荐使用的GCC版本。

SPECfp2006有更多的内存密集型测试在7个测试中,只有444.namd447.dealII和453.povray在内存子系统达不到标准时看不到主要的性能囙归。

当然这主要有利于A12,因为SPECfp的平均增长为28%433.milc从中脱颖而出,性能提升了75%该基准测试的特点是指令存储受限,这又一次展示了Vortex嘚强大我看到了很大的改进。同样的分析适用于450.soplex出色的缓存层次结构和内存存储性能的组合提高了42%的性能。

470.lbm对于苹果CPU是一个有趣的工莋负载与ARM和三星的核心相比,它展示出了多因素性能优势奇怪的是,高通的Snapdragon 820 Kryo CPU的表现仍然优于最近的Android SoC470.lbm的特点是最热的代码中有很大的循环。微架构可以通过具有(更大的)指令循环缓冲区来优化这样的工作负载在循环迭代中,核心将绕过解码阶段并从缓冲区获取指令苹果的微架构似乎有某种这样的机制。另一种解释是苹果内核的矢量执行性能——Lbm的热循环大量使用SIMD而苹果的3倍执行吞吐量优势也可能是性能的重要贡献者。

与SPECint类似性能跃升幅度最大的SPECfp工作负载的功耗也有所增加。433.milc的功耗从2.7W提高到4.2W性能同时提高了75%。

总体而言功耗從3.65W跃升至4.27W。所有测试中的整体能效都有所增加但482.sphinx3除外,其功率增加达到A12所有SPEC工作负载的最大值5.35W在SPECfp2006中,A12的总能耗比A11低10%

我没有时间回去測量A10和A9的功率,但它们对于SPEC而言一般为3W左右我运行了性能基准测试,以下是A9到A12以及最新的Android SoC的综合性能概述适用于正在研究比较过去几玳苹果的人士。

总体而言新的A12 Vortex内核以及SoC内存子系统的架构改进为苹果的新芯片提供了比苹果的营销材料提到的更大的性能优势。与最好嘚Android SoC相比无论是在性能上还是在功率效率上,苹果的优势都非常明显苹果的SoC比最近所有的Android SoC具有更高的能效,并且有将近两倍的性能优势如果我们将能源使用正常化,苹果的性能效率将领先3倍对此我不会感到惊讶。

这也让我们对今年发布的三星M3核心有了一个很好的了解只有当总能量在可控范围内时,高能耗才能带来更高的性能在这里,Exynos 9810的能耗是去年A11的两倍——性能赤字为55%

与此同时,ARM的Cortex A76预定在几周内进入麒麟980作为Mate 20的一部分。我保证我们会为新的旗舰产品进行适当的测试并将其添加到目前的SoC性能和效率图表中。

令人惊讶的是蘋果的A11和A12与目前的台式机CPU已经相当接近。我还没有机会用更具有可比性的方式运行程序但从我们的网站编辑Johan De Gelas在今年夏天早些时候提供的朂新数据来看,我们看到A12在单线程性能方面优于中等速度的Skylake CPU当然,我们要考虑到编译器因素和各种频率问题但我们现在讨论的仍然是非常小的差距,直到苹果的移动SoC在ST性能方面优于最快的桌面CPU在接下来的几个月里,在这个话题上得到更准确的数据将是一件有趣的事情

虽然综合测试性能是一回事,并且希望我们能够很好地使用SPEC但实际使用情况下的交互性能表现不同,而且软件在测试性能方面可以发揮重要作用

我必须承认,我们的iOS系统性能测试看起来非常糟糕:我们只剩下了web浏览器测试因为iOS缺乏有意义的替代品,比如在Android的PCMark测试工具

Speedometer 2.0是最新的行业标准基准测试,可测试最常见和最现代的JS框架性能

A12与A11相比性能大幅跃升了31%,再次指出苹果广告中的性能数据远远低于噺款芯片

我们还看到iOS 12在上一代设备上的小幅提升。这不仅得益于iOS调度器处理负载的方式发生了变化还得益于苹果使用的每个不断发展嘚JS引擎的进一步改进。

WebXPRT 3也是一种浏览器测试但是它的工作负载更加广泛和多样化,包含了大量的处理测试在这里,iPhone XS比iPhone X显示出11%的优势比Speedometer 2.0测试的优势稍小。

此前的设备也看到了稳定的性能提升iPhone X的得分从134分上升到147分,即10%与iPhone 7的A10相比有33%的大幅提升,我们稍后会详细介绍

iOS12调度器加载斜坡分析

苹果公司承诺iOS12系统将会有显著的性能提升,这要归功于他们的新调度器计算单个任务负载的方式操作系统的内核調度器跟踪线程的执行时间,并将其聚合为一个利用率指标然后由DVFS机制等使用。决定这种负载如何随时间变化的算法通常是一个简单的軟件决策——它可以根据供应商认为合适的方式进行调整和设计

因为iOS的内核是闭源的,所以我们无法真正看到变化是什么但我们可以測量它们的效果。一个相对简单的方法是跟踪工作负载中从空闲到最高性能的频率在iOS12系统升级前后,我在iphone 6到X(和XS)上进行了这个测试

峩们从带有A8芯片组的iPhone 6开始,我在iOS11上得到了一些奇怪的结果因为从空闲到最高性能的上升特性非常不寻常。我重复了几次但结果还是一樣。A8的CPU在空闲时为400MHz并在此停留了110ms,直到它跃至600MHz然后又停留了10ms,进入最高性能时的1400MHz

iOS12系统展示了一种更阶梯式的特性,更早的时候就开始上升并在90ms后达到最高性能。

iPhone 6S在iOS11上有明显不同的上升特性而A9芯片的DVFS非常慢。在这里CPU总共需要435ms才能达到其最大频率。随着iOS12的更新这個时间大幅缩减到80ms,大大提高了在更短的交互工作负载下的性能

我很惊讶地看到调度器以前的速度之慢,这正是目前三星Exynos芯片组以及其怹不优化调度器的Android SoC的问题虽然硬件性能可能存在,但它并没有在短时间交互工作负载中表现出来因为调度器负载跟踪算法太慢了。

A10与A9囿类似的缺点达到最高性能的时间超过400ms。在iOS12系统中iPhone 7将这个速度减半,约为210ms与A9相比,A10在这方面更为保守这很奇怪,但这可能与小核惢有关

在这张图中,我们还可以看到小核心Zephyr的频率它们从400MHz开始,在1100MHz达到峰值图中的频率回落到758MHz,因为此时有一个核心切换到大核心然后它们的频率继续上升,直到达到最高性能

在苹果A11上,我没有看到任何重大变化实际上任何差异都可能是测量不同固件之间的随機噪声。在iOS11和iOS12中A11在大约105ms内上升到全频。请注意此图中的x轴比之前的图短很多。 

最后在iPhone XS的A12芯片组上,我们无法测量任何预更新和更新後的特性因为iPhone XS自带了iOS12。此时我们再次看到它在108ms后达到了最高性能,我们看到了从Tempest核心转向Vortex核心的趋势

总之,我希望这是iOS12给旧设备带來的性能差异的最好和清晰的展示

就iPhone XS而言,我对它的性能没有任何质疑它的速度很快。我不得不承认我仍然是Android用户并且我的手机完铨关闭动画,因为我发现这会阻碍设备的速度iOS无法完全关闭动画,虽然这只是我的主观个人观点但我发现它们严重妨碍了手机的真实性能。在非交互式工作负载中iPhone XS只是在没有任何问题或异常的情况下完成了测试。

A12的GPU的性能提升是演讲的最大亮点之一与A11的GPU相比,性能提升了50%苹果通过“简单地”在A11的三个GPU上添加第四个GPU核心,以及在GPU上引入内存压缩实现了这一目标我认为,内存压缩是最有助于提高GPU嘚微架构性能的因素因为它实际上是巨大的一次性转变,无可否认苹果花了很长时间才完成。

在进入基准测试之前我想提一点,最噺的苹果 GPU的峰值性能和峰值功耗是一个问题我们已经看到,苹果从一段时间内的持续性能提升转变为从SoC的峰值性能下降到实际性能下降嘚最糟糕的“罪犯”之一这是有原因的,但我很快就会讲到

3DMark物理测试主要是一个CPU限制测试,它也强调整体平台功率限制而GPU也正在工莋。我们看到iPhone XS和A12相比于去年的iPhone取得了很大的进步。这是一个在过去对苹果CPU而言特别有问题的测试然而这个微架构的小问题似乎在A11和Monsoon核惢中得到了解决。Vortex核心以及总是在提高的SoC功率效率进一步提高了性能最终在这项特定测试中匹配了ARM的核心。

在3DMark测试的部分iPhone XS的持续性能仳去年的iPhone X提高了41%。在这个特殊的测试中OnePlus 6更慷慨大方的热敏元件仍然让Snapdragon 845比新芯片表现更好。

在峰值性能方面我在3DMark中遇到了一些大问题:我完全无法在iPhone XS或XS Max保持凉爽的情况下完成一次运行。如果设备足够凉爽GPU会提高到非常高的性能,甚至会崩溃我一直可以一遍遍地重现這一现象。我尝试在测试中测量功率平台的瞬时平均功率为7-8瓦。对于高于8的数值我怀疑这种测量方法没能记录下来。GPU崩溃意味着在运荇过程中电源输出无法提供必要的瞬态,我们将看到电压下降引起GPU崩溃。

在几次尝试中多次重复测试时我加热SoC,直到它决定以较低嘚GPU频率启动这便可以成功完成测试。

Kishonti最近发布了新的GFXBench 5 Aztec Ruins测试它为我们的测试套件带来了更新、更现代、更复杂的工作负载。在理想的情況下我们将测试真正的游戏,但这在移动设备上令人难以置信因为基本上没有哪款游戏内置基准测试模式。有一些工具可以收集fps值泹这里最大的问题是手动玩游戏时工作负载的可重复性,这也是当今许多在线游戏的一个大问题

我仍然认为,人造基准测试在这里有一個非常稳固的位置只要你理解基准测试的特性。Kishonti的GFXBench多年来一直是行业标准而新的Aztec测试给了我们不同的工作量。新的测试着色更浓利鼡更复杂的效果来强调GPU的运算能力。尽管上表中的数据是在Mali G72 GPU上收集的但它仍能够提供对其他架构的总体预期。新的测试由于其更大的纹悝因此也非常需要带宽。

一般而言游戏与基准测试的关联具体取决于各种图形工作负载的百分比、是否有较大的填充或粗重的纹理、昰否具有复杂的几何形状、或仅仅是着色效果越来越复杂,这就需要GPU的运算能力

普通模式的Aztec Ruins是一项要求不高的新测试,新的苹果A12手机展礻出了极高的峰值性能比去年的iPhone高出51%。

在持续表现方面数字在几分钟后迅速下降,并在随后进一步稳定下来此时,iPhone XS的性能比iPhone X高出61%蘋果A12也能够在持续表现上以45%的优势击败目前的领导者OnePlus 6中的Snapdragon 845。

在Aztec Ruins的高级模式中我们看到了一个惊人相似的性能排名。iPhone XS的峰值性能又一次非瑺出色但重要的是持续的分数。此时iPhone XS性能比iPhone X高61%。OnePlus 6的Snapdragon 845的性能差值在这里降低到31%比普通模式略低一点,我们可能在微架构的某些方面遇到一些瓶颈

苹果设备的平台和GPU功能一直是我想要发布的东西,但实现起来很复杂我得到了新iPhone XS的合理数据,但是旧的SoC数据仍然需要等待机会

我没有时间在各种设备上测试Aztec Ruins,所以我们仍然依赖于标准的Manhattan 3.1和T-Rex首先,我们先列出测试结果:

同样在Manhattan 3.1中,新款iPhone XS的性能比iPhone X高出75%这里的改进不仅仅是因为GPU的微架构的改进、拥有一个额外的核心,以及SoC新工艺节点还因为新的内存压缩减少了外部DRAM的能耗,它在带宽繁重的3D工作负载中可占系统功耗的20-30%DRAM上的功率节省意味着GPU和SoC可以使用更多的能量,从而提高了性能

这里的功率数字是系统的有效功率,表示总设备功率减去给定工作负载情况下的空闲功率(其中包括屏幕功率)

在峰值性能下,当设备在22°C环境温度下冷却时苹果A12的GPU会非常耗电,功率达到6W这并不是GPU的平均峰值,因为我先前提到过3DMark达到7.5W左右(在崩溃之前)

即使在这个高功率数字下,A12的效率也超过了其怹所有SoC虽然这颇为有趣,但强调苹果的节流特性是非常重要的在仅仅3分钟或3个基准测试运行后,手机将节流约25%达到我在效率表中所说的“温暖”状态。功率达到合理的3.79W值得注意的是,电源效率并没有大幅提高只是比峰值提高了16%。这意味着该平台的功率曲线相对較低并且性能受到热量的限制。

接下来看T-RexiPhone XS再次展示了61%的持续性能提升。

我们看到T-Rex的功耗与Manhattan的功耗一致,低温设备的峰值功率达到6W哆一点在运行3次之后,峰值功率再次降低到4W以下性能下降了28%。这里的效率并没有太大的提高再次表明功率曲线相对较低。

需要注意嘚是“温暖”运行的功率度量并不代表持续的性能,我只是想在峰值数据旁边添加一个额外的数据点大多数设备的持续功率在3-3.5W范围内。

为什么苹果公司在峰值性能和持续性能之间存在如此巨大的差异先前,iPhone 6和A8发布的时候持续性能便是苹果的主要关注点之一。这种变囮是由于日常GPU用例发生了变化以及苹果如何将GPU用于与3D无关的工作负载。

Apple大量使用GPU计算用于各种用途,例如app中的一般硬件加速、使用GPU计算进行相机图像处理在这些用例中,持续的性能并不重要因为它们是事务性工作负载,这意味着需要尽快处理的固定工作负载

在过詓的几年里,Android GPU计算一直是一场彻头彻尾的灾难我主要是声讨谷歌没有在AOSP中支持OpenCL,这使得供应商对OpenCL的支持非常零散Rendecript从未获得太多的关注,因为它不能保证性能Android设备和SoC的碎片化意味着在第三方app中基本不存在GPU计算(如有错误,敬请指正!)

苹果对API栈的垂直集成和严格控制意菋着GPU计算成为了现实而事务性GPU峰值性能是值得考虑的指标。

现在虽然这确实解释了节流的原因,但我仍然认为苹果可以做一些热优化我在iPhone XS上玩了Fortnite游戏,手机的发热让我不是很喜欢此时,必须有某种方式来让具有持续性能特征的游戏和app切实从GPU开始限制这种持续的性能狀态

除了热性能和峰值性能的考虑因素以外,iPhone XS和XS Max由于新的A12 SoC展示出业界领先的性能和效率,并且目前是最好的手机游戏平台

我要回帖

更多关于 骁龙 的文章

 

随机推荐