CPU中推土机架构是什么及CMP和SMT介绍

所属分类: 硬件教程 / CPU 阅读数: 82
收藏 0 赞 0 分享

  CMP和SMT

  CMP:CMP的方式非常直接,简单来说,CMP是通过“复制”物理核心来扩展处理器在多线程软件中的性能,这是获得最佳性能一种最简单和最有效的方式。但CMP的缺点是制造成本很昂贵,并且也要受到处理器制造工艺的限制,毕竟不能将芯片做的越来越大。并且CMP的方式对负载要求也很高,只有经过适当并行优化的负载才能充分发挥CMP的性能,很多核心的CMP常常会浪费资源,在一些应用中,主频更高、结构更简单的双核和四核处理器就往往可以获得更好的性能。

  SMT:SMT是一个相对廉价的技术,比如英特尔的Hyper-Threading,允许每个物理核心运行两个同步线程。SMT的设计思想是充分利用每个核心的资源。如果一个物理核心只有一个执行线程,那么在等待内存中的关键代码或数据的时候,线程处于停顿状态,这样核心的利用率是低下的。而SMT技术允许一个物理核心运行两个或更多的线程,可以根据当前的状况动态进行切换,如果一个线程处于停顿状态等待内存,另一个线程的指令则可以使用这个物理核心的所有执行单元,让物理核心利用的更加充分。

  为了让SMT正常工作,处理器的所有代码和存储部分需要被复制或分区。例如,一个双线程SMT处理器需要两套架构寄存器和重命名寄存器,一套给线程A,一套给线程B。另外组成指令窗口的共享指令队列要具备很大的空间,这样指令窗口才能容纳足够多的来自两个线程的指令,让执行单元可以保持在忙碌状态。最后,两个线程任何共享单元,比如处理管线不同部分的指令缓存,都不能被任一个线程独占。换句话说,SMT核心的两个线程需要和另一个紧密的共享资源,保证核心的缓存单元不会空置没有线程利用。

CPU中推土机架构是什么

  推土机架构分析

  AMD“推土机”将采用32nmSOI工艺,这让“推土机”相比“马尼库尔”皓龙处理器可以在不增加功耗的前提下增加33%的核心数量、增加50%的吞吐量。与AMD之前所有处理器都有所不同的是,“推土机”采用了“模块化”的设计,每个“模块”包含两个处理器核心,这有些像一个启用了SMT的单核处理器。每个核心具有各自的整数调度器和四个专有的管线,两个核心共享一个浮点调度器和两个128位FMAC乘法累加器。

  所不同的,在K10架构中,ALU和AGU共享三个管线(平均1.5个),“推土机”中每个核心整数单元管线的数量增加为4个,2个AGU专有、2个ALU专有。L1缓存也有所不同,在K10架构中,每个核心具有64KB L1指令缓存和64KB L1数据缓存;而“推土机”每个核心具有16KBL1数据缓存、每个模块具有64KB双向L1指令缓存,至于减小的L1缓存是否会影响性能还有待观察。两个核心共享L2缓存,模块之间共享L3缓存及北桥。

bulldozer

  AMD“推土机”模块

  “模块”和“核心”,这让我们不免会产生混淆,实际对于用户们来说,没必要去刻意的关注“模块”的概念,这只不过是AMD在设计上的称谓,而当产品投放市场的时候,依旧会以核心数量为标识,比如我们说采用推土机架构的“Interlagos”服务器处理器具有16个核心,而不会说是8个模块。对于为何采用这种“模块”设计的主要原因,AMD表示是“为了减少CPU的冗余电路”。

  如果采用CMP的方式,随着核心数量的增加,CPU的核心面积也会越来越大,重复的电路也会越来越多,功耗也会随之增加——因为CMP是采用复制核心的方式。而采用“模块”设计可以大大减少冗余电路,这对核心的大量增加很有意义。比如“推土机”,两个核心共享浮点部分,对于大部分服务器应用来说,整数运算的部分要远远高于浮点运算(高性能计算除外),所以将浮点执行单元共享并不会影响大多数应用中的性能。而整数部分则不是共享的,否则会造成瓶颈。

  上文我们回顾过CMP和SMT设计的特点,我们可以把AMD“推土机”架构看做是介于这两种之间的一种设计:两个线程(核心)共享浮点执行单元,但是各自具有独立的整数执行资源。这看上去像是SMT的另一种形式,或者说是经过AMD改良的一种“AMD式的第三种方式”。但与传统的SMT设计不同,SMT仅仅复制的是核心的存储部分,一个线程一个存储模块(registerfile),而AMD“推土机”架构中,每个线程复制的是完整的整数执行单元硬件,一个线程具有一个存储模块(registerfile)和一组完整的整数执行单元。

更多精彩内容其他人还在看

内存频率是否真的至关重要?AMD Ryzen内存性能完全对比

内存频率是否真的至关重要?下面为大家带来AMD Ryzen内存性能完全对比,测试项目很广泛,包括20款应用、17款游戏,分辨率最高4K,基本能涵盖绝大多数用户的日常使用场景,详情我们来看看吧
收藏 0 赞 0 分享

1299元AMD Ryzen 5 1400抢先游戏评测:对比酷睿7代i5/奔腾

11日,AMD Ryzen 5处理器将全球发售,首发包括两款六核心Ryzen 5 1600(X)和两款四核Ryzen 5 1500/1400。下面分享了AMD Ryzen 5 1400抢先游戏测评对比7代i5/奔腾,一起来看看
收藏 0 赞 0 分享

AMD Ryzen Pro系列处理器突然现身:四款型号

国外媒体曝光了一组全新的Ryzen系列处理器,它们都在现有的编号上加入了一个“Pro”标识,包括Ryzen 7 Pro 1700、Ryzen 5 Pro 1600、Ryzen 5 Pro 1400和Ryzen 3 Pro 1200
收藏 0 赞 0 分享

AMD Ryzen性能怎么样?AMD Ryzen 1600完美跑分

AMD Ryzen性能怎么样?使用CPU-Z和wPrime 2.0分别对Ryzen 5 1600的单核性能进行测试,结果显示其与Ryzen 7 1700X几乎打成平手,详情我们一起来看看吧
收藏 0 赞 0 分享

AMD入门级Ryzen 3 1200性能参数曝光:3.1GHz/四核处理器

今天,主板厂商华擎在一款B350芯片组主板的支持列表中意外曝光了Ryzen 3 1200的部分性能参数,据页面信息显示,Ryzen 3 1200的基础频率为3.1GHz,拥有2MB缓存,功耗65W
收藏 0 赞 0 分享

AMD的Ryzen处理器第二个鸡血版游戏补丁实测:性能提升10%

现在第二个鸡血版游戏补丁也来了——《全战:战锤》中Rzyen处理器性能提升也有10%。Rzyen 7 1700/1700X/1800X三款处理器在新补丁中性能提升大约10%,1800X虽然还是不能超过Core i7-7700K,但已经达到Core i7-6700K及6900K的水
收藏 0 赞 0 分享

AMD RX 580/570/550规格、跑分、价格如何?看这里就懂了

目前传言RX 580依然是2304颗流处理器,144个纹理单元, 32个光栅单元,不过频率提高到1340MHz,几乎比480多了20%。RX 470公版设定的Boost最高是1206MHz,而这块570加到了1325MHz,跑分提升约5%,详情我们来看看吧
收藏 0 赞 0 分享

AMD Ryzen装机须知:CPU和主板要怎样搭配

今年Ryzen会陆续补齐所有规格的CPU和与它匹配的主板产品,那么,AMD Ryzen CPU和主板怎么搭配呢?对此,本文就为大家介绍AMD Ryzen装机须知,有兴趣的朋友们就来了解下吧
收藏 0 赞 0 分享

AMD Ryzen有核显吗?AMD Ryzen处理器有哪些?

今年,AMD Ryzen锐龙处理器凭借先进架构、低功耗、多核优势,加之还有性价比优势获得了很多网友的认可,那么,AMD Ryzen处理器有哪些?以及AMD Ryzen有核显吗?针对这些问题,本文就为大家进行详细解答
收藏 0 赞 0 分享

还玩啥PC?一图看懂Intel将近四年来的各种收购之路

如今的Intel早已经不是一家围绕PC打转的企业(所以才牙膏?),更多地把目光瞄准了人工智能、无人驾驶、5G、虚拟现实等新领域,而在自身技术突破的同时,收购也成了一条捷径,下边就来看看Intel这将近四年来的各种收购吧,来看看吧
收藏 0 赞 0 分享
查看更多