轉(zhuǎn)自:http://blog.csdn.net/psusong/archive/2009/01/08/3737047.aspx
MMX和SSE都是INTEL開發(fā)的基于SIMD(單指令多數(shù)據(jù)流)的技術(shù)。所謂單指令多數(shù)據(jù)流是指可以用一條指令可以完成多個數(shù)據(jù)的操作。雖然64位系統(tǒng)已經(jīng)推出,但是我們大部分都是使用32位系統(tǒng),所以如果要完成兩個128位的相加運算,用普通32位指令很明顯要執(zhí)行4條相加指令,而基于64位的MMX指令只需要執(zhí)行兩次即可完成,更強大的SSE能一次處理128位,故一次就可以完成操作,所以采用MMX及SSE優(yōu)化能夠大幅度提升程序性能。
MMX采用處理器的80位的浮點寄存器的低64位作為MMX寄存器,一共有8個,從mm0到mm7,因為是“借用”浮點寄存器的低64位所以每次在用完MMX指令后一定要用EMMS指令將寄存器清空,MMX主要是針對整數(shù)運算進行優(yōu)化,一個64位的MMX寄存器可以同時存入8個8位或者4個16位的整數(shù),估計一次性就可以完成8次8位運算或者4次16位運算,要注意的MMX指令不能直接對32位數(shù)進行2次運算,但可以把32位拆分成兩個16位再進行運算。MMX技術(shù)還有一個非常有用的特性是飽和運算,比如兩個8位數(shù)相加:128+129相加后很明顯超過了8位的最大值256,但是進行飽和運算相加的結(jié)果將是最大值256,飽和運算將運算結(jié)果控制在相應(yīng)位數(shù)的范圍內(nèi)。
最近在調(diào)試開發(fā)一個多媒體相關(guān)的程序,發(fā)現(xiàn)一個非常奇怪的問題,某些操作之后會導(dǎo)致隨后的float數(shù)運算結(jié)果混亂,花了1個小時的時間才發(fā)現(xiàn)是因為自己在使用完MMX指令后忘記用emms指令將浮點寄存器復(fù)位!