CPU之多媒体指令集详细介绍

所属分类: 硬件教程 / CPU 阅读数: 71
收藏 0 赞 0 分享
CPU依靠指令来计算和控制系统,每款CPU在设计时就规定了一系列与其硬件电路相配合的指令系统。指令的强弱也是CPU的重要指标,指令集是提高微处理器效率的最有效工具之一。从现阶段的主流体系结构讲,指令集可分为复杂指令集和精简指令集两部分,而从具体运用看,如Intel的MMX(Multi Media Extended)、SSE、 SSE2(Streaming-Single instruction multiple data-Extensions 2)和AMD的3DNow!等都是CPU的扩展指令集,分别增强了CPU的多媒体、图形图象和Internet等的处理能力。我们通常会把CPU的扩展指令集称为"CPU的指令集"。
1、精简指令集的运用
在最初发明计算机的数十年里,随着计算机功能日趋增大,性能日趋变强,内部元器件也越来越多,指令集日趋复杂,过于冗杂的指令严重的影响了计算机的工作效率。后来经过研究发现,在计算机中,80%程序只用到了20%的指令集,基于这一发现,RISC精简指令集被提了出来,这是计算机系统架构的一次深刻革命。RISC体系结构的基本思路是:抓住CISC指令系统指令种类太多、指令格式不规范、寻址方式太多的缺点,通过减少指令种类、规范指令格式和简化寻址方式,方便处理器内部的并行处理,提高VLSI器件的使用效率,从而大幅度地提高处理器的性能。
RISC指令集有许多特征,其中最重要的有:
•指令种类少,指令格式规范:RISC指令集通常只使用一种或少数几种格式。指令长度单一(一般4个字节),并且在字边界上对齐,字段位置、特别是操作码的位置是固定的。
•寻址方式简化:几乎所有指令都使用寄存器寻址方式,寻址方式总数一般不超过5个。其他更为复杂的寻址方式,如间接寻址等则由软件利用简单的寻址方式来合成。
•大量利用寄存器间操作:RISC指令集中大多数操作都是寄存器到寄存器操作,只以简单的Load和Store操作访问内存。因此,每条指令中访问的内存地址不会超过1个,访问内存的操作不会与算术操作混在一起。
•简化处理器结构:使用RISC指令集,可以大大简化处理器的控制器和其他功能单元的设计,不必使用大量专用寄存器,特别是允许以硬件线路来实现指令操作,而不必像CISC处理器那样使用微程序来实现指令操作。因此RISC处理器不必像CISC处理器那样设置微程序控制存储器,就能够快速地直接执行指令。
•便于使用VLSI技术:随着LSI和VLSI技术的发展,整个处理器(甚至多个处理器)都可以放在一个芯片上。RISC体系结构可以给设计单芯片处理器带来很多好处,有利于提高性能,简化VLSI芯片的设计和实现。基于VLSI技术,制造RISC处理器要比CISC处理器工作量小得多,成本也低得多。
•加强了处理器并行能力:RISC指令集能够非常有效地适合于采用流水线、超流水线和超标量技术,从而实现指令级并行操作,提高处理器的性能。目前常用的处理器内部并行操作技术基本上是基于RISC体系结构发展和走向成熟的。
正由于RISC体系所具有的优势,它在高端系统得到了广泛的应用,而CISC体系则在桌面系统中占据统治地位。而在如今,在桌面领域,RISC也不断渗透,预计未来,RISC将要一统江湖。
2、CPU的扩展指令集
对于CPU来说,在基本功能方面,它们的差别并不太大,基本的指令集也都差不多,但是许多厂家为了提升某一方面性能,又开发了扩展指令集,扩展指令集定义了新的数据和指令,能够大大提高某方面数据处理能力,但必需要有软件支持。
•MMX 指令集
MMX(Multi Media eXtension,多媒体扩展指令集)指令集是Intel公司于1996年推出的一项多媒体指令增强技术。MMX指令集中包括有57条多媒体指令,通过这些指令可以一次处理多个数据,在处理结果超过实际处理能力的时候也能进行正常处理,这样在软件的配合下,就可以得到更高的性能。MMX的益处在于,当时存在的操作系统不必为此而做出任何修改便可以轻松地执行MMX程序。但是,问题也比较明显,那就是MMX指令集与x87浮点运算指令不能够同时执行,必须做密集式的交错切换才可以正常执行,这种情况就势必造成整个系统运行质量的下降。
•SSE指令集
SSE(Streaming SIMD Extensions,单指令多数据流扩展)指令集是Intel在Pentium III处理器中率先推出的。其实,早在PIII正式推出之前,Intel公司就曾经通过各种渠道公布过所谓的KNI(Katmai New Instruction)指令集,这个指令集也就是SSE指令集的前身,并一度被很多传媒称之为MMX指令集的下一个版本,即MMX2指令集。究其背景,原来"KNI"指令集是Intel公司最早为其下一代芯片命名的指令集名称,而所谓的"MMX2"则完全是硬件评论家们和媒体凭感觉和印象对"KNI"的 评价,Intel公司从未正式发布过关于MMX2的消息。
而最终推出的SSE指令集也就是所谓胜出的"互联网SSE"指令集。SSE指令集包括了70条指令,其中包含提高3D图形运算效率的50条SIMD(单指令多数据技术)浮点运算指令、12条MMX 整数运算增强指令、8条优化内存中连续数据块传输指令。理论上这些指令对目前流行的图像处理、浮点运算、3D运算、视频处理、音频处理等诸多多媒体应用起到全面强化的作用。SSE指令与3DNow!指令彼此互不兼容,但SSE包含了3DNow!技术的绝大部分功能,只是实现的方法不同。SSE兼容MMX指令,它可以通过SIMD和单时钟周期并行处理多个浮点数据来有效地提高浮点运算速度。
SSE2指令集
SSE2(Streaming SIMD Extensions 2,Intel官方称为SIMD 流技术扩展 2或数据流单指令多数据扩展指令集 2)指令集是Intel公司在SSE指令集的基础上发展起来的。相比于SSE,SSE2使用了144个新增指令,扩展了MMX技术和SSE技术,这些指令提高了广大应用程序的运行性能。随MMX技术引进的SIMD整数指令从64位扩展到了128 位,使SIMD整数类型操作的有效执行率成倍提高。双倍精度浮点SIMD指令允许以 SIMD格式同时执行两个浮点操作,提供双倍精度操作支持有助于加速内容创建、财务、工程和科学应用。除SSE2指令之外,最初的SSE指令也得到增强,通过支持多种数据类型(例如,双字和四字)的算术运算,支持灵活并且动态范围更广的计算功能。SSE2指令可让软件开发员极其灵活的实施算法,并在运行诸如MPEG-2、MP3、3D图形等之类的软件时增强性能。Intel是从Willamette核心的Pentium 4开始支持SSE2指令集的,而AMD则是从K8架构的SledgeHammer核心的Opteron开始才支持SSE2指令集的。
SSE3指令集
SSE3(Streaming SIMD Extensions 3,Intel官方称为SIMD 流技术扩展 3或数据流单指令多数据扩展指令集 3)指令集是Intel公司在SSE2指令集的基础上发展起来的。相比于SSE2,SSE3在SSE2的基础上又增加了13个额外的SIMD指令。SSE3 中13个新指令的主要目的是改进线程同步和特定应用程序领域,例如媒体和游戏。这些新增指令强化了处理器在浮点转换至整数、复杂算法、视频编码、SIMD浮点寄存器操作以及线程同步等五个方面的表现,最终达到提升多媒体和游戏性能的目的。Intel是从Prescott核心的Pentium 4开始支持SSE3指令集的,而AMD则是从2005年下半年Troy核心的Opteron开始才支持SSE3的。但是需要注意的是,AMD所支持的SSE3与Intel的SSE3并不完全相同,主要是删除了针对Intel超线程技术优化的部分指令。
•3D Now!(3D no waiting)指令集
3DNow!是AMD公司开发的SIMD指令集,可以增强浮点和多媒体运算的速度,并被AMD广泛应用于其K6-2 、K6-3以及Athlon(K7)处理器上。3DNow!指令集技术其实就是21条机器码的扩展指令集。
与Intel公司的MMX技术侧重于整数运算有所不同,3DNow!指令集主要针对三维建模、坐标变换 和效果渲染等三维应用场合,在软件的配合下,可以大幅度提高3D处理性能。后来在Athlon上开发了Enhanced 3DNow!。这些AMD标准的SIMD指令和Intel的SSE具有相同效能。因为受到Intel在商业上以及Pentium III成功的影响,软件在支持SSE上比起3DNow!更为普遍。Enhanced 3DNow!AMD公司继续增加至52个指令,包含了一些SSE码,因而在针对SSE做最佳化的软件中能获得更好的效能。
更多精彩内容其他人还在看

内存频率是否真的至关重要?AMD Ryzen内存性能完全对比

内存频率是否真的至关重要?下面为大家带来AMD Ryzen内存性能完全对比,测试项目很广泛,包括20款应用、17款游戏,分辨率最高4K,基本能涵盖绝大多数用户的日常使用场景,详情我们来看看吧
收藏 0 赞 0 分享

1299元AMD Ryzen 5 1400抢先游戏评测:对比酷睿7代i5/奔腾

11日,AMD Ryzen 5处理器将全球发售,首发包括两款六核心Ryzen 5 1600(X)和两款四核Ryzen 5 1500/1400。下面分享了AMD Ryzen 5 1400抢先游戏测评对比7代i5/奔腾,一起来看看
收藏 0 赞 0 分享

AMD Ryzen Pro系列处理器突然现身:四款型号

国外媒体曝光了一组全新的Ryzen系列处理器,它们都在现有的编号上加入了一个“Pro”标识,包括Ryzen 7 Pro 1700、Ryzen 5 Pro 1600、Ryzen 5 Pro 1400和Ryzen 3 Pro 1200
收藏 0 赞 0 分享

AMD Ryzen性能怎么样?AMD Ryzen 1600完美跑分

AMD Ryzen性能怎么样?使用CPU-Z和wPrime 2.0分别对Ryzen 5 1600的单核性能进行测试,结果显示其与Ryzen 7 1700X几乎打成平手,详情我们一起来看看吧
收藏 0 赞 0 分享

AMD入门级Ryzen 3 1200性能参数曝光:3.1GHz/四核处理器

今天,主板厂商华擎在一款B350芯片组主板的支持列表中意外曝光了Ryzen 3 1200的部分性能参数,据页面信息显示,Ryzen 3 1200的基础频率为3.1GHz,拥有2MB缓存,功耗65W
收藏 0 赞 0 分享

AMD的Ryzen处理器第二个鸡血版游戏补丁实测:性能提升10%

现在第二个鸡血版游戏补丁也来了——《全战:战锤》中Rzyen处理器性能提升也有10%。Rzyen 7 1700/1700X/1800X三款处理器在新补丁中性能提升大约10%,1800X虽然还是不能超过Core i7-7700K,但已经达到Core i7-6700K及6900K的水
收藏 0 赞 0 分享

AMD RX 580/570/550规格、跑分、价格如何?看这里就懂了

目前传言RX 580依然是2304颗流处理器,144个纹理单元, 32个光栅单元,不过频率提高到1340MHz,几乎比480多了20%。RX 470公版设定的Boost最高是1206MHz,而这块570加到了1325MHz,跑分提升约5%,详情我们来看看吧
收藏 0 赞 0 分享

AMD Ryzen装机须知:CPU和主板要怎样搭配

今年Ryzen会陆续补齐所有规格的CPU和与它匹配的主板产品,那么,AMD Ryzen CPU和主板怎么搭配呢?对此,本文就为大家介绍AMD Ryzen装机须知,有兴趣的朋友们就来了解下吧
收藏 0 赞 0 分享

AMD Ryzen有核显吗?AMD Ryzen处理器有哪些?

今年,AMD Ryzen锐龙处理器凭借先进架构、低功耗、多核优势,加之还有性价比优势获得了很多网友的认可,那么,AMD Ryzen处理器有哪些?以及AMD Ryzen有核显吗?针对这些问题,本文就为大家进行详细解答
收藏 0 赞 0 分享

还玩啥PC?一图看懂Intel将近四年来的各种收购之路

如今的Intel早已经不是一家围绕PC打转的企业(所以才牙膏?),更多地把目光瞄准了人工智能、无人驾驶、5G、虚拟现实等新领域,而在自身技术突破的同时,收购也成了一条捷径,下边就来看看Intel这将近四年来的各种收购吧,来看看吧
收藏 0 赞 0 分享
查看更多