作者:azure
轉自:
http://www.azure.com.cn/article.asp?id=192通常影響程序運行速度的地方,都是在執(zhí)行次數(shù)最多的地方。比如顯示一張800*600的256色圖形,如果在設置調色板時浪費了0.001秒,那么對整個程序不會有很大影響,因為設置調色板的操作只要作一次就完成,但是每繪出一點要多浪費0.001秒,那么整張圖畫完就會慢上800*600*0.001秒,這是一個相當可觀的數(shù)目。下面介紹一些常用的技巧。
一.盡量使用整數(shù),少用浮點數(shù)
整數(shù)運算比浮點數(shù)快得多,而在繪圖程序中用到小數(shù)點的機會實在少之又少,所以這是很容易做到的技巧。
二.避免乘法與除法
乘法與除法都是相當浪費CPU運算時間的一種運算,所以在繪圖程序中應盡量避免,在無法避免時,如果乘除的數(shù)目為2次方,例如2、4、8、16等,則可改用左移或右移來取代:
a*2^n-->a<<n 例:a*16-->a<<4
a/2^n-->a>>n 例:a/32-->a>>5
上式中2^n表示2的n次方。
三.少用求模運算
求模的運算(%)通常也是用乘除來完成的,所以速度很慢,我們也要盡量避免,當然如果除數(shù)為2的次方,那么可以改用&來替代:
a%2^n --> a&(2^n-1)
例:a%8 --> a&0x07
注意,如果除數(shù)不是2的次方,絕不能用&來替代。
四.復雜的二維計算改用查表法
所謂查表法,就是事先將一些運算結果存入表格中,然后在需要時直接取出來使用而不必再做運算。最常見的例子就是在做圖形旋轉時,往往會用到sin()、cos()等函數(shù)來計算角度,如果能將這些運算結果事先存于表格中,那么必能省下相當多的時間。
對于較簡單的顯示圖形的程序,我們也可以利用查表法來避免乘法的使用。例如在320*200*256模式下,我們要在(x,y)的地方畫出一點,那么必然要做(y*320+x)的計算,如果能將每一條起始掃描線的位置事先算出并存入表格中:
unsinged table[200];
for( i=0; i<200; i++ )
table[i] = i * 320;
那么在繪點時便可以直接使用下面的方法來取得位置:
table[y] + x;
避免了乘法運算,這就是“以空間換取時間“的做法。還有一種變形的查表法也值得一提,那就是如果在程序中有很多地方都用到了相同的運算,那么可以事先算出結果并加以儲存,例如:
......
MaxSize = width * height * 3 + 200;
......
MinSize = width * height * 3 - 100;
......
則可先算出size:
size = width * height * 3;
......
MaxSize = size + 200;
......
MinSize = size - 100;
......
五.將耗時的運算移到循環(huán)之外
通常在循環(huán)內的程序碼會執(zhí)行較多次,所以應減少耗時的運算,例如320*200*256模式政繪制一個實心的矩形時:
char far *vp = (char far *)0xA0000000L;
for( y=50; y<150; y++ )
for( x=100; x<200; x++ )
*(vp+y*320+x) = 0x0f;
可以改成:
char far *vp = (char far *)0xA0000000L;
char far *p;
for( y=50; y<150; y++ )
{
p = vp+y*320+100; /* 將乘法移出內層循環(huán)*/
for( x=100; x<200; x++ )
*(p++) = 0x0f;
}
再進一步還可以更上一層樓,將乘法完全移出循環(huán):
char far *vp = (char far *)0xA0000000L;
char far *p;
int offset = 320-(200-100);
p = vp+50*320+100;
for( y=50; y<150; y++ )
{
for( x=100; x<200; x++ )
*(p++) = 0x0f;
p += offset;
}
其中offset的值正是矩形中最右邊的一點到下一條掃描線最左邊一點的差距值。
六.使用寄存器變量
寄存器的存取速度要比內存快,一般c/c++編譯器都至少提供1~2個寄存器變量給程序使用,我們應該將使用最頻繁的變量定義成寄存器變量,這樣可以加快執(zhí)行效率,例如:
register int i;
for( i=0; i<3000; i++ )
*(p+i) = 0x0f;
七.編譯器的設置
在編譯程序時,我們也可以通過某些設置來加快程序效率,例如,產(chǎn)生最快的執(zhí)行速度的最佳化,不做堆棧溢出檢查等,如果你使用tc20,那么只要在Option菜單中選Compiler/Optimizations,然后選擇底部的Fastest Code按鈕便可。讀者可以自行參考相關手冊。