1.概述
許多初學者對C/C++語言中的void及void指針類型不甚理解,因此在使用上出現了一些錯誤。本文將對void關鍵字的深刻含義進行解說,并詳述void及void指針類型的使用方法與技巧。
2.void的含義
void的字面意思是“無類型”,void *則為“無類型指針”,void *可以指向任何類型的數據。
void幾乎只有“注釋”和限制程序的作用,因為從來沒有人會定義一個void變量,讓我們試著來定義:
void a; |
這行語句編譯時會出錯,提示“illegal use of type 'void'”。不過,即使void a的編譯不會出錯,它也沒有任何實際意義。
void真正發揮的作用在于:
?。?)對函數返回的限定;
?。?)對函數參數的限定。
我們將在第三節對以上二點進行具體說明。
眾所周知,如果指針p1和p2的類型相同,那么我們可以直接在p1和p2間互相賦值;如果p1和p2指向不同的數據類型,則必須使用強制類型轉換運算符把賦值運算符右邊的指針類型轉換為左邊指針的類型。
例如:
float *p1; int *p2; p1 = p2; |
其中p1 = p2語句會編譯出錯,提示“'=' : cannot convert from 'int *' to 'float *'”,必須改為:
p1 = (float *)p2; |
而void *則不同,任何類型的指針都可以直接賦值給它,無需進行強制類型轉換:
void *p1; int *p2; p1 = p2; |
但這并不意味著,void *也可以無需強制類型轉換地賦給其它類型的指針。因為“無類型”可以包容“有類型”,而“有類型”則不能包容“無類型”。道理很簡單,我們可以說“男人和女人都是人”,但不能說“人是男人”或者“人是女人”。下面的語句編譯出錯:
void *p1; int *p2; p2 = p1; |
提示“'=' : cannot convert from 'void *' to 'int *'”。
3.void的使用
下面給出void關鍵字的使用規則:
規則一如果函數沒有返回值,那么應聲明為void類型
在C語言中,凡不加返回值類型限定的函數,就會被編譯器作為返回整型值處理。但是許多程序員卻誤以為其為void類型。例如:
add ( int a, int b ) { return a + b; } int main(int argc, char* argv[]) { printf ( "2 + 3 = %d", add ( 2, 3) ); } |
程序運行的結果為輸出:
2 + 3 = 5
這說明不加返回值說明的函數的確為int函數。
林銳博士《高質量C/C++編程》中提到:“C++語言有很嚴格的類型安全檢查,不允許上述情況(指函數不加類型聲明)發生”。可是編譯器并不一定這么認定,譬如在Visual C++6.0中上述add函數的編譯無錯也無警告且運行正確,所以不能寄希望于編譯器會做嚴格的類型檢查。
因此,為了避免混亂,我們在編寫C/C++程序時,對于任何函數都必須一個不漏地指定其類型。如果函數沒有返回值,一定要聲明為void類型。這既是程序良好可讀性的需要,也是編程規范性的要求。另外,加上void類型聲明后,也可以發揮代碼的“自注釋”作用。代碼的“自注釋”即代碼能自己注釋自己。
規則二如果函數無參數,那么應聲明其參數為void
在C++語言中聲明一個這樣的函數:
int function(void) { return 1; } |
則進行下面的調用是不合法的:
function(2); |
因為在C++中,函數參數為void的意思是這個函數不接受任何參數。
我們在Turbo C 2.0中編譯:
#include "stdio.h" fun() { return 1; } main() { printf("%d",fun(2)); getchar(); } |
編譯正確且輸出1,這說明,在C語言中,可以給無參數的函數傳送任意類型的參數,但是在C++編譯器中編譯同樣的代碼則會出錯。在C++中,不能向無參數的函數傳送任何參數,出錯提示“'fun' : function does not take 1 parameters”。
所以,無論在C還是C++中,若函數不接受任何參數,一定要指明參數為void。
規則三小心使用void指針類型
按照ANSI(American National Standards Institute)標準,不能對void指針進行算法操作,即下列操作都是不合法的:
void * pvoid; pvoid++; //ANSI:錯誤 pvoid += 1; //ANSI:錯誤 //ANSI標準之所以這樣認定,是因為它堅持:進行算法操作的指針必須是確定知道其指向數據類型大小的。 //例如: int *pint; pint++; //ANSI:正確 |
pint++的結果是使其增大sizeof(int)。
但是大名鼎鼎的GNU(GNU's Not Unix的縮寫)則不這么認定,它指定void *的算法操作與char *一致。
因此下列語句在GNU編譯器中皆正確:
pvoid++; //GNU:正確 pvoid += 1; //GNU:正確 |
pvoid++的執行結果是其增大了1。
在實際的程序設計中,為迎合ANSI標準,并提高程序的可移植性,我們可以這樣編寫實現同樣功能的代碼:
void * pvoid; (char *)pvoid++; //ANSI:正確;GNU:正確 (char *)pvoid += 1; //ANSI:錯誤;GNU:正確 |
GNU和ANSI還有一些區別,總體而言,GNU較ANSI更“開放”,提供了對更多語法的支持。但是我們在真實設計時,還是應該盡可能地迎合ANSI標準。
規則四如果函數的參數可以是任意類型指針,那么應聲明其參數為void *
典型的如內存操作函數memcpy和memset的函數原型分別為:
void * memcpy(void *dest, const void *src, size_t len); void * memset ( void * buffer, int c, size_t num ); |
這樣,任何類型的指針都可以傳入memcpy和memset中,這也真實地體現了內存操作函數的意義,因為它操作的對象僅僅是一片內存,而不論這片內存是什么類型。如果memcpy和memset的參數類型不是void *,而是char *,那才叫真的奇怪了!這樣的memcpy和memset明顯不是一個“純粹的,脫離低級趣味的”函數!
下面的代碼執行正確:
//示例:memset接受任意類型指針 int intarray[100]; memset ( intarray, 0, 100*sizeof(int) ); //將intarray清0 //示例:memcpy接受任意類型指針 int intarray1[100], intarray2[100]; memcpy ( intarray1, intarray2, 100*sizeof(int) ); //將intarray2拷貝給intarray1 |
有趣的是,memcpy和memset函數返回的也是void *類型,標準庫函數的編寫者是多么地富有學問啊!
規則五 void不能代表一個真實的變量
下面代碼都企圖讓void代表一個真實的變量,因此都是錯誤的代碼:
void a; //錯誤 function(void a); //錯誤 |
void體現了一種抽象,這個世界上的變量都是“有類型”的,譬如一個人不是男人就是女人(還有人妖?)。
void的出現只是為了一種抽象的需要,如果你正確地理解了面向對象中“抽象基類”的概念,也很容易理解void數據類型。正如不能給抽象基類定義一個實例,我們也不能定義一個void(讓我們類比的稱void為“抽象數據類型”)變量。
4.總結
小小的void蘊藏著很豐富的設計哲學,作為一名程序設計人員,對問題進行深一個層次的思考必然使我們受益匪淺
C/C++大多數時候是可以混著說的,有時候不行,比如void*到T*的隱式轉換。
int* pi;
void* pv;
pv = pi; /* C and C++ ok */
pi = pv; /* C ok, C++ error */
2.
如果一個函數:
1. 可以被C編譯器編譯
2. 參數列表為空
確實在參數列表中加上void是一個好習慣??梢宰鳛橐粋€規范。
但不是為了自注釋與可讀性。
自注釋與可讀性是瞎扯 —— 連這都不知道的C程序員就別寫C代碼射自己的腳。
對其他情況,加上void也不是自注釋。
struct C
{
C(void);
/* 嘿,其實C()是C(void)的意思! */
static void operator new(size_t);
/* 嘿,其實這里加不加static它都只能是static! */
};
而是羅嗦。 連這都不知道的C++程序員更去別寫C++代碼炸自己的腳。
3. void* pv; ++pv;
GCC這個擴展很多時候還是很方便的……
但是,如果想將程序移植到非GCC上,應該克制使用這個擴展。
檢測出這個擴展的方法是:
3.1 使用其他不支持這個擴展的編譯器編譯……
3.1 使用GCC編譯,并使用-Wpointer-arith 或者 -Werror=pointer-arith選項
4.
【
void * pvoid;
(char *)pvoid++; //ANSI:正確;GNU:正確
(char *)pvoid += 1; //ANSI:錯誤;GNU:正確
】
這段代碼…… 要一句話說清楚挺困難……
總的來說,遵守ANSI的編譯器上,2行都是錯的。
GCC上如果正確總是因為GCC的擴展。
4.1 (char *)pvoid++;
它的意思是 (char*)(pvoid++); 利用了GCC對void*進行算術操作的擴展。
所以在GCC上是正確的,在ANSI上是錯誤的。
4.2 (char *)pvoid += 1; 以及:
++(char*)pvoid;
((char *)pvoid)++; /* 使用括號改變優先級 */
在ANSI上也是錯的。因為后綴前綴++,還有復合賦值的操作數必須是左值,而轉型操作符只能得到右值。
GCC較低版本在此處又有擴展…… 可以在右值上執行上述操作,所以可以編譯通過。
但這個擴展被標記為廢棄,在GCC高版本中被移除。
多謝補充,受教了 ^ ^
對于規則四,如果聲明為void* 的參數(例如a)在函數中要進行delete操作(delete a),會有warning,而且意義上比較復雜,對此有沒有什么建議?其實我只是針對與void*的delete,模板中總會有void*的寫法,而對于其delete的問題頭痛了我幾天了。
delete操作符有2層意思。 析構和釋放內存。
delete pv的話,無法推斷應該調用什么析構函數。
看你的需求了。
1. 如果真的是需要析構,pv的類型再某個地方丟失了,那必須找回來。
2. 如果不需要析構,而僅僅是為了釋放內存。如果是malloc分配的,那就free;如果是operator new分配的,那就operator delete;一定要配對。
問題在于,在模板中使用void*來配對不同類型的指針,如果我希望的是析構,那么,使用delete ptr會出現warning,而且意義上也許也是有問題的,這樣的話,如何正確達到我的目的呢?
不知道你具體代碼是怎樣的。
我猜可能是這樣。 一個調用鏈上
1. 一開始是有類型的
2. 到了某個地方,使用了void*去保存任意類型,原來的類型就丟失了。
3. 需要析構,找不到類型了。
要想辦法把類型信息帶著。
舉個標準庫中的例子, 保存指針的容器:
vector<int*> vi;
vector<char*> vc;
vi.push_back( new int );
vc.push_back( new char );
實際上,不需要生成T=int*, T=char*這2套模板的代碼。
void* 就可以保存任意對象的指針。
vector<void*> vi;
vector<void*> vc;
vi.push_back( new int);
vc.push_back( new char );
但這樣就丟失了原來的類型。
取出時,就無法得知正確類型了。
delete vi[0]; // error, delete void*
delete vc[0]; // error, delete void*
所以,這里可以作一個偏特化。
template<typename T> // 對指針類型做偏特化
class vector<T*>
{
vector<void*> c_; // 底層容器
public:
// 轉發給底層容器
push_back(T* p)
{
// 隱式類型轉換,void* 可以保存任意對象指針。
return c_.push_back(p);
}
// 取出
T* operator[](size_type index)
{
void* pv = c_[index]; // c_沒有類型信息
T* p = staic_cast<T*>(pv); // 但這個偏特化模板含有類型信息,還原它
return p; // 返回帶有類型信息的指針。
}
...
};
現在客戶代碼依然這么寫:
vector<int*> vi; // 底層使用vector<void*>
vector<char*> vc;
vi.push_back( new int ); // 轉發函數僅含有一個隱式轉換,不生成代碼
vc.push_back( new char ); // inline展開,直接調用vector<void*>::push_backinline
delete vi[0]; // 調用vector<void*>::operator [](index);
delete vc[0]; // 但類型信息沒有丟失
就是這個問題。實在是受教了,謝謝!