《C陷阱與缺陷》中有一個有意思的問題:“某些C編譯器允許嵌套注釋。請寫一個測試程序,要求:無論是對允許嵌套注釋的編譯器,還是對不允許嵌套注釋的編譯器,該程序都能正常通過編譯(無錯誤消息出現),但是這兩種情況下程序執行的結果卻不相同。
(提示:在用引號括起來的字符串中,注釋符I*屬于字符串的一部分,而在注釋中出現的雙引號””又屬于注釋的一部分。)”
我覺得這對C的詞法分析挺有意思的。要是聰明的您,有什么辦法呢?
以下是作者給出的答案,確實很精妙,尤其第二個。
——為了判斷編譯器是否允許嵌套注釋,必須找到這樣一組符號序列,無論是對于允許嵌套注釋的編譯器,還是不允許嵌套注釋的編譯器,它都是合法的;但是,對于兩類不同的編譯器,它卻意味著不同的事物。這樣一組符號序列不可避免地要涉及嵌套注釋,讓我們從這里開始討論:
/*/**/
對于一個允許嵌套注釋的C編譯器,無論上面的符號序列后面跟什么,都屬于注釋的一部分;而對于不允許嵌套注釋的C編譯器,后面跟的就是實實在在的代碼內容。也許有人因此想到可以在后面再跟一個用一對引號引起的注釋結束符:
/*/**/ "*/"
如果允許嵌套注釋,上面的符號序列就等效于一個引號;如果不允許,那么就等效于一個字符串"*I"。因此,我們可以接著在后面跟一個注釋開始符以及一個引號:
/*/**/ "*/"/*"
如果允許嵌套注釋,上面就等效于用一對引號引起的注釋開始符"/*";如果不允許,那么就等效于一個用引號括起的注釋結束符,后跟一段未結束的注釋。我們可以簡單地讓最后的注釋結束:
/*/**/ "*/"/*" /**/
這樣,如果允許嵌套注釋,上面的表達式就等效于"/*",:如果不允許,那么就等效于,"*/"。
在我用基本上類似于上面的形式解決這個問題之后,Doug McIlroy發現了下面這個讓人拍案叫絕的解法:
/*/*/0*/**/1
這個解法主要利用了編譯器作詞法分析時的“大嘴法”規則。如果編譯器允許嵌套注釋,則上式將被解釋為:
/*/*/0*/**/1
兩個/*符號與兩個*/符號正好匹配,所以上式的值就是1。如果不允許嵌套注釋,注釋中的/*將被忽略。因此,即使卿出現在注釋中也沒有特殊的含義:上面的表達式因此將被這樣解釋:
/*/*/0*/**/1
它的值就是0*1,也就是0o
上面利用一個特殊構造的字符串就完成了這個任務,果然精妙!
而當時我對這個特殊字符串推導時沒有看到希望,用了宏來幫忙,設計了下面的程序:
#define A /* aaa /* a*/ a
#define B */

bool CanNesting()


{
#ifdef B
return false;
#else
return true;
#endif
}
上面程序中,如果支持嵌套,B的宏定義屬于注釋的一部分,所以B應該沒有被定義,函數返回true。否則,就不支持嵌套,函數返回false。