1.2 表達式和語句
名字的合理選擇可以幫助讀者理解程序,同樣,我們也應該以盡可能一目了然的形式寫好表
達式和語句。應該寫最清晰的代碼,通過給運算符兩邊加空格的方式說明分組情況,更一般的是
通過格式化的方式來幫助閱讀。這些都是很瑣碎的事情,但卻又是非常有價值的,就像保持書桌
整潔能使你容易找到東西一樣。與你的書桌不同的是,你的程序代碼很可能還會被別人使用。
用縮行顯示程序的結構。采用一種一致的縮行風格,是使程序呈現出結構清晰的最省力的方
法。下面這個例子的格式太糟糕了:
for(n++; n < 100; field[n++] = '\0');
*i = '\0'; return ('\n');
重新調整格式,可以改得好一點:
for(n++; n < 100; field[n++] = '\0')
;
*i = '\0';
return ('\n');
更好的是把賦值作為循環體,增量運算單獨寫。這樣循環的格式更普通也更容易理解:
for (n++; n < 100; n++)
field[n] = '\0';
*i = '\O1;
return '\n';
使用表達式的自然形式。表達式應該寫得你能大聲念出來。含有否定運算的條件表達式比較
難理解:
i f (! (block-id < actbl ks) I I ! (block-id >= unblocks))
....
在兩個測試中都用到否定,而它們都不是必要的。應該改變關系運算符的方向,使測試變成
肯定的:
i f ((block-id >= actblks) I I (blockkid < unblocks))
...
現在代碼讀起來就自然多了。
用加括號的方式排除二義性。括號表示分組,即使有時并不必要,加了括號也可能把意圖表
示得更清楚。在上面的例子里,內層括號就不是必需的,但加上它們沒有壞處。熟練的程序
員會忽略它們,因為關系運算符(< <= == != >= )比> 邏輯運算符(& &和| |)的優先級更高。
在混合使用互相無關的運算符時,多寫幾個括號是個好主意。C語言以及與之相關的語言
存在很險惡的優先級問題,在這里很容易犯錯誤。例如,由于邏輯運算符的約束力比賦值運
算符強,在大部分混合使用它們的表達式中,括號都是必需的。
while ((c = getchar()) != EOF)
....
字位運算符(&和| )的優先級低于關系運算符(比如= = ),不管出現在哪里:
i f (x&MASK == BITS)
. . .
實際上都意味著
i f (x & (MASK == BITS))
. . .
這個表達式所表達的肯定不會是程序員的本意。在這里混合使用了字位運算和關系運算符號,
表達式里必須加上括號:
if ((x&MASK) == BITS)
...
如果一個表達式的分組情況不是一目了然的話,加上括號也可能有些幫助,雖然這種括號可能不是必需的。
下面的代碼本來不必加括號:
leap-year = y % 4 == 0 && y % 100 != 0 I ) y % 400 == 0;
但加上括號,代碼將變得更容易理解了:
leap-year = ((y % 4 == 0 && y % 100 != 0) || (y % 400 == 0));
這里還去掉了幾個空格:使優先級高的運算符與運算對象連在一起,幫助讀者更快地看清表
達式的結構。
分解復雜的表達式。C、C + +和J a v a語言都有很豐富的表達式語法結構和很豐富的運算符。因
此,在這些語言里就很容易把一大堆東西塞進一個結構中。下面這樣的表達式雖然很緊湊,
但是它塞進一個語句里的東西確實太多了:
*x += (*xp = (2 * k < (n - m) ? c[k+1] : d[k--]));
把它分解成幾個部分,意思更容易把握:
i f (2kk < n-m)
axp = c [k+l] ;
else
*xp = d [k--1 ;
*x += *xp;
要清晰。程序員有時把自己無窮盡的創造力用到了寫最簡短的代碼上,或者用在尋求得到結
果的最巧妙方法上。有時這種技能是用錯了地方,因為我們的目標應該是寫出最清晰的代碼,
而不是最巧妙的代碼。
下面這個難懂的計算到底想做什么?
subkey = subkey >> ( b i t o f f - ( ( b i t o f f >> 3) << 3));
最內層表達式把b i t o f f右移3位,結果又被重新移回來。這樣做實際上是把變量的最低3位設
置為0。從b i t o f f的原值里面減掉這個結果,得到的將是b i t o f f的最低3位。最后用這3位
的值確定s u b k e y的右移位數。
上面的表達式與下面這個等價:
subkey = subkey >> ( b i t o f f & 0x7);
要弄清前一個版本的意思簡直像猜謎語,而后面這個則又短又清楚。經驗豐富的程序員會把
它寫得更短,換一個賦值運算符:
subkey >>= b i t o f f & 0x7;
有些結構似乎總是要引誘人們去濫用它們。運算符? :大概屬于這一類:
child = (!LC && !RC) ? 0 : (!LC ? RC : LC);
如果不仔細地追蹤這個表達式的每條路徑,就幾乎沒辦法弄清它到底是在做什么。下面的形
式雖然長了一點,但卻更容易理解,其中的每條路徑都非常明顯:
if (LC == 0 && RC == 0)
child = 0;
else if (LC == 0)
child = RC;
else
child = LC;
運算符? :適用于短的表達式,這時它可以把4行的i f - e l s e程序變成1行。例如這樣:
max = (a > b) ? a : b;
或者下面這樣:
p r i n t f ("The l i s t has %d item%s\n", n, n==l ? "" : "s");
但是它不應該作為條件語句的一般性替換。
清晰性并不等同于簡短。短的代碼常常更清楚,例如上面移字位的例子。不過有時代碼
長一點可能更好,如上面把條件表達式改成條件語句的例子。在這里最重要的評價標準是易
于理解。
當心副作用。像++ 這一類運算符具有副作用,它們除了返回一個值外,還將隱含地改變變量
的值。副作用有時用起來很方便,但有時也會成為問題,因為變量的取值操作和更新操作可
能不是同時發生。C和C++ 對與副作用有關的執行順序并沒有明確定義,因此下面的多次賦
值語句很可能將產生錯誤結果:
str[i++] = str[i++] = ' ';
這樣寫的意圖是給s t r中隨后的兩個位置賦空格值,但實際效果卻要依賴于i的更新時刻,很可
能把s t r里的一個位置跳過去,也可能導致只對i實際更新一次。這里應該把它分成兩個語句:
str[i++] = ' ';
str[i++] = ' ';
下面的賦值語句雖然只包含一個增量操作,但也可能給出不同的結果:
array[i++] = i;
如果初始時i的值是3,那么數組元素有可能被設置成3或者4。
不僅增量和減量操作有副作用, I / O也是一種附帶地下活動的操作。下面的例子希望從標準輸入讀入兩個互相有關的數:
scanf("%d %d", &yr, &profit[yr]);
這樣做很有問題,因為在這個表達式里的一個地方修改了y r,而在另一個地方又使用它。這
樣,除非y r的新取值與原來的值相同,否則p r o f i t [ y r ]就不可能是正確的。你可能認為事
情依賴于參數的求值順序,實際情況并不是這樣。這里的問題是: s c a n f的所有參數都在函
數被真正調用前已經求好值了,所以& p r o f i t [ y r ]實際使用的總是y r原來的值。這種問題可
能在任何語言里發生。糾正的方法就是把語句分解為兩個:
scanf ("%dm. &yr ) ;
scanf ("%dm, &profit [yr]) ;