轉自:http://blog.csdn.net/psusong/archive/2009/01/08/3737047.aspx
MMX和SSE都是INTEL開發的基于SIMD(單指令多數據流)的技術。所謂單指令多數據流是指可以用一條指令可以完成多個數據的操作。雖然64位系統已經推出,但是我們大部分都是使用32位系統,所以如果要完成兩個128位的相加運算,用普通32位指令很明顯要執行4條相加指令,而基于64位的MMX指令只需要執行兩次即可完成,更強大的SSE能一次處理128位,故一次就可以完成操作,所以采用MMX及SSE優化能夠大幅度提升程序性能。
MMX采用處理器的80位的浮點寄存器的低64位作為MMX寄存器,一共有8個,從mm0到mm7,因為是“借用”浮點寄存器的低64位所以每次在用完MMX指令后一定要用EMMS指令將寄存器清空,MMX主要是針對整數運算進行優化,一個64位的MMX寄存器可以同時存入8個8位或者4個16位的整數,估計一次性就可以完成8次8位運算或者4次16位運算,要注意的MMX指令不能直接對32位數進行2次運算,但可以把32位拆分成兩個16位再進行運算。MMX技術還有一個非常有用的特性是飽和運算,比如兩個8位數相加:128+129相加后很明顯超過了8位的最大值256,但是進行飽和運算相加的結果將是最大值256,飽和運算將運算結果控制在相應位數的范圍內。
最近在調試開發一個多媒體相關的程序,發現一個非常奇怪的問題,某些操作之后會導致隨后的float數運算結果混亂,花了1個小時的時間才發現是因為自己在使用完MMX指令后忘記用emms指令將浮點寄存器復位!