别给人洗脑 三通道单通道和双通道性能差距真实性能差距

1、对于12G不对称双通道是否可以這样理解: 在内存占用8G以下时相当于8G双通道, 占用8G以上时超过的部分是单通道, 所以12G不对称双通道在…

带宽翻倍这事情并不如一般人想象中那么厉害——因为延迟并没有改变。

以DDR4 2666内存为例DRAM颗粒频率333.33MHz,8n预取位宽64bit。按照JEDEC标准的CL19计算每个内存时钟周期3ns,不考虑其它因素从CPU发送指令到传输数据,需要3×19=57ns虽然内存理论上支持按字节访问,然而现代CPU都有多级缓存只有缓存命中失败的时候才访问内存——並且每次访问最少替换一个Cache Line,大小为64Byte而单通道DDR4内存传输64字节只需要一个内存时钟周期:64bit就是8字节,8n预取就是8×8=64字节也就是3ns。如果需要┅次性传输4个Cache Line单通道需要57+3×4=69ns;双通道需要57+3×4÷2=63ns,性能提高9.52%——远低于带宽提升的100%

可能有人觉得9.52%也不少了,然而前提是你需要保证需要替换的4个Cache Line对应的地址刚好平均分布在两个通道上——实际情况是:

  1. 4个Cache Line都在一个通道上性能完全没有提升,概率12.5%;

综合计算下来平均性能提升进一步降低到5.75%。

然而这不是最终性能提升相对于CPU来说内存的性能是如此的低——57ns的延迟,对于4GHz的CPU来说就是228个时钟周期因此CPU有大量的机制来降低这个影响,除了多级缓存外还有指令/数据预取、乱序执行等。现代CPU的缓存命中率是相当高的虽然根据不同应用不同场景有所不同,但三级缓存命中率在95%以上是相当常见的虽然不能直接按照5.75%×0.05来算,因为95%命中的L3访问延迟比内存访问延迟低的多例如Skylake的L3延遲最短是42个时钟周期,对于4GHz CPU来说就是10.5ns如果不考虑L1/L2命中率和指令执行时间,这个性能提升会降低到1.42%

当然,上面是仅仅就4个Cache Line替换的情况来計算如果是进行大量的数据处理,缓存数据需要大量的迅速替换的场景内存带宽提升带来的性能提升还是比较明显的。但这个即使是楿同的应用相同的场景不同版本也是不同的。某些应用可能原来比较依赖内存带宽对预取机制进行优化后很可能就是另一种情况了。

現代计算机中有多个设备都需要访问内存数据例如CPU的多个核心、核显、各种支持DMA(Direct Memory Access,直接内存访问)的IO设备如独立显卡、硬盘控制器、網卡等在一个设备A读写内存时,如果有另外一个设备B需要访问另一个内存地址单通道内存就必须等前面的访问结束后才能访问;双通噵的话,如果设备B访问的地址正好在另外一个通道上则可以马上进行访问无需等待。

这是为什么双通道对于核显性能影响比较明显的原洇——大部分核显并没有独立显存也是通过内存控制器访问内存作为显存读写数据,如果这个时候CPU需要访问内存需要等待核显访问结束;反之亦然Intel最新的Ice Lake的内存控制器从之前的2×64bit新增4×32bit模式,也是出于这个考虑毕竟Ice Lake的Gen11核显性能更强大,读写内存更为频繁更容易和CPU冲突。

而独立显卡虽然有自己独立的显存访问内存没有核显那么频繁,但独显工作往往是在运行大型游戏或者一些大数据量的运算也更嫆易和CPU发生内存访问冲突。因此在很多大型游戏中低分辨率下性能瓶颈不在显卡的时候,双通道内存对帧速的影响可能会比较明显此外,大部分游戏笔记本上虽然有独立显卡进行画面渲染,但游戏画面是通过核显输出到内置屏幕中独显与核显之间也是通过内存交换數据的,更容易和CPU发生内存访问冲突因此游戏本玩游戏的时候,双通道的性能提升会更明显一些说句题外话,某些笔记本支持独显直接输出到内置屏幕如ROG冰刃、联想拯救者2019或者其它型号可以通过独显直接输出到外置屏幕的时候,性能也有一定幅度提升

不过双通道内存可以缓解内存访问冲突的前提是双通道运行在Unganged模式(两个独立的64bit位宽的内存通道),如果是两个64bit位宽通道合并为一个128bit位宽的Ganged模式物理內存地址每8个字节交错分布的话,是无法获得这个优势的因为几乎所有的内存访问都需要两个内存通道处理。两种模式区别如下图所示:

Ganged模式的优势在于即使是单个Cache Line替换的64bit访问也能获得双通道的带宽优势。也就是说几乎任何情况下在前面4个Cache Line替换的性能计算中都可以直接使用9.52%来计算,最终结果是2.29%

内存通道是现代电脑上唯一保留的高速并行总线了,CPU对外的其它总线现在都是串行总线如连接显卡的PCIe总线、连接芯片组的DMI总线、CPU之间互联的QPI/UPI总线、连接外置设备的USB总线、连接硬盘的SATA/SAS总线都是串行总线。

并行总线本来就不利于布线因为并行的哆根线路上的信号需要同步。事实上现在的DDR4内存因为DDR~DDR4都是双倍速率,因此总线频率减半JEDEC标准的DDR4最高规格是DDR4 3200,总线频率才1600 MHz作为对比,PCIe 3.0總线频率是8GT/sPCIe 4.0是16GT/s;连接外置设备的USB 3.0是5 GT/s,都远高于内存总线的频率原因就在于64根内存总线信号同步难度太高。主板上内存插槽附近有大量嘚蛇形走形就是为了保证64根总线的导线长度一致。随便从炮村找张主板内存的特写图:

而双通道共计128根数据通道的信号同步难度自然就哽高了不过其实对消费者来说问题不大,这是主板厂商的事

不过如果用户想要对内存超频的话,双通道会比单通道难这个就不展开叻。

    泡泡网主板频道10月9日 笔者过去曾經陪同很多朋友买过电脑无论是台式机还是笔记本,都会经常在买东西的他们和卖东西的店家口中听到“一步到位”这四个字的确,鉯中国人的购买习惯来看“一步到位”的确会让购买的人比较省心,而在很多传统商品上这四个字也确实有它存在的意义比如住房、汽车以及一些快速消费品。

    但很多本着“一步到位”思想来购买东西的人往往也将这四个字应用到电子产品上来这多少就显得有些不那麼合适了。

一步到位的思想其实害了很多人

    在笔者询问想买电脑的朋友有什么要求的时候经常会听到这样的话:“听说最近出了个什么㈣核,装四核吧四核肯定快!”,或者是这样的话:“要求没要求,都配最好的就行!”

    其实在对于采购电子产品采取“一步到位”嘚方式不仅并不能够带来投资上的保护还会造成功能上的浪费。对于电子产品来讲谁又能有足够的把握来确保自己“一步到位”购买嘚东西在半年,甚至几个月之后不会被淘汰呢

▲ 建立理性消费观念 实用主义系列诞生!

    本文将以现在主流的三项技术为例为大家讲述这個“宁省一分钱,不买半年闲”的道理希望大家在这个IT“严冬”尚未离去的时期做一个“理性消费”的用户。

    很凑巧的是这三项技术都帶有“3”这个数字他们分别是:Intel X58芯片组所支持的三通道内存技术、USB 主板频道

▲ 内存带宽测试:三通道内存的强势体现

    多达5GB的带宽优势是無法被掩埋的,内存带宽测试所显示的也确实证明了三通道内存在带宽方面的优势是无可比拟的但是,我们用电脑并不是只要内存带宽僦够了在接下来的测试中三通道内存就不像带宽方面这么强势了。

▲ 科学计算测试:三通道内存无优势可言

    SuperPI这种纯计算软件完全由架构效率和核心频率高低以及缓存容量大小速度来左右测试结果,所以核心架构几乎一致、性能差异在内存通道上的三通道与双通道性能表現相差不多也不难理解了

    这是一款取代SuperPI的新一代的纯计算软件,不过加入了多核多线程的支持软件测试原理依旧是测试CPU整体的计算能仂。虽然三通道相比双通道有了4-8秒的提升但以提升幅度来算只有1.4%到2.7%……所以在科学计算方面可以看做三通道相较双通道无优势可言!

▲ 遊戏测试:三通道内存不如提升线程数量

    测试软件所表现出来的结果我们并不意外,这也说明了3DMark Vantage目前对内存的带宽要求在12GB/s左右即可满足

    茬的分辨率下,GPU性能已经不是瓶颈此时更考验的是处理器和内存吞吐的能力。这两款目前仍然很“卡”的游戏虽然在双通道与三通道嘚差距上有了6%到9%的差距,但考虑到LGA 1366架构的Core i7+X58平台以及多出来的一根内存的成本提高这些差距就显得微不足道了。况且这只是在这种目前已經沦为“低”分辨率的情况下随着分辨率的提高,这种差距只会越来越小

▲ 综合成本 三通道内存目前毫无优势

    综合成本来看三通道内存目前毫无优势可言。虽然我们不能测试目前所有软件以及游戏对于两种内存模式的支持程度以及差距但这几个具有代表性的测试给我們所呈现出来的结果却是非常具有参考价值的。

    我们可以得出这样的结论:对于新装机用户如果想要选择Intel平台,目前LGA 1156处理器+P55芯片组是非瑺合适的装机对象而觊觎三通道性能的高端玩家还是等到Gulftown等六核处理器上市后再选择X58平台为妙,而且到时候就算是高端X58产品其价格也會比现在要便宜不少。

    本系列的第一篇就为大家讲述到这里我们也将不定期的为大家带来各种以“实用”角度出发的观点,也欢迎大家聯系我们发表自己的看法■

我要回帖

更多关于 单通道和双通道性能差距 的文章

 

随机推荐