以下代碼在VC6.0中并不會拋出異常
try
{
??
int
?
*
?p?
=
?
new
?
int
[
/*
0xFFFFFFE0
*/
numeric_limits
<
int
>
::max()];
?}
?
catch
(bad_alloc?x){
??cerr
<<
x.what();
?}
和標準C++描述的不一樣.
new會被鏈接到一個debug版本的庫,然后跳出一個assert.
就算參數符合assert條件,若分配失敗,只是返回0,并不拋出bac_alloc異常.
在網上找了兩篇文章,對VC甚不耐煩
(據說出自CSDN,誰寫的無心情去考究了):
在VC6.0中如何讓new操作失敗后拋出異常?
標準C++規定new一個對象時如果分配內存失敗就應拋出一個std::bad_alloc異常,如果不希望拋出異常而僅僅傳回一個NULL指針,可以用new的無異常版本:new(nothrow)。
VC6.0在<new>頭文件中聲明了這兩種operator new操作符:
void *__cdecl operator new(size_t) _THROW1(std::bad_alloc);
void *__cdecl operator new(size_t, const std::nothrow_t&) _THROW0();
并分別定義在newop.cpp和newop2.cpp中。而_THROW0和_THROW1則是兩個宏,在Include目錄的xstddef文件中定義:
#define _THROW0() throw ()
#define _THROW1(x) throw (x)
newop.cpp和newop2.cpp對應的目標模塊被打包進標準C++庫中。標準C++庫有若干個版本: libcp.lib(單線程靜態版)、libcpd.lib(單線程靜態調試版)、libcpmt.lib(多線程靜態版)、libcpmtd.lib(多線程靜態調試版)、msvcprt.lib(多線程動態版的導入庫),msvcprtd.lib(多線程動態調試版的導入庫),這些庫與相應版本的C標準庫一起使用,比如libcp.lib與libc.lib搭配。另外,VC6.0在new.cpp還定義了一個operator new,原型如下 :
void * operator new( unsigned int cb )
而new.cpp對應的目標模塊卻是被打包進C標準庫中的(是不是有點奇怪?)。
一般來說,程序員不會顯式指定鏈接C++標準庫,可是當程序中確實使用了標準C++庫時鏈接器卻能聰明地把相應的C++標準庫文件加進輸入文件列表,這是為什么?其實任何一個C++標準頭文件都會直接或間接地包含use_ansi.h文件,打開它一看便什么都清楚了(源碼之前,了無秘密) :
/***
*use_ansi.h - pragmas for ANSI Standard C++ libraries
*
* Copyright (c) 1996-1997, Microsoft Corporation. All rights reserved.
*
*Purpose:
* This header is intended to force the use of the appropriate ANSI
* Standard C++ libraries whenever it is included.
*
* [Public]
*
****/
#if _MSC_VER > 1000
#pragma once
#endif
#ifndef _USE_ANSI_CPP
#define _USE_ANSI_CPP
#ifdef _MT
#ifdef _DLL
#ifdef _DEBUG
#pragma comment(lib,"msvcprtd")
#else// _DEBUG
#pragma comment(lib,"msvcprt")
#endif// _DEBUG
#else// _DLL
#ifdef _DEBUG
#pragma comment(lib,"libcpmtd")
#else// _DEBUG
#pragma comment(lib,"libcpmt")
#endif// _DEBUG
#endif// _DLL
#else// _MT
#ifdef _DEBUG
#pragma comment(lib,"libcpd")
#else// _DEBUG
#pragma comment(lib,"libcp")
#endif// _DEBUG
#endif
#endif// _USE_ANSI_CPP
現在我們用實際代碼來測試一下new會不會拋出異常,建一個test.cpp源文件:
// test.cpp
#include <new>
#include <iostream>
using namespace std;
class BigClass
{
public:
BigClass() {}
~BigClass(){}
char BigArray[0x7FFFFFFF];
};
int main()
{
try
{
BigClass *p = new BigClass;
}
catch( bad_alloc &a)
{
cout << "new BigClass, threw a bad_alloc exception" << endl;
}
BigClass *q = new(nothrow) BigClass;
if ( q == NULL )
cout << "new(nothrow) BigClass, returned a NULL pointer" << endl;
try
{
BigClass *r = new BigClass[1];
}
catch( bad_alloc &a)
{
cout << "new BigClass[1], threw a bad_alloc exception" << endl;
}
return 0;
}
根據VC6.0編譯器與鏈接器的做法(請參考《為什么會出現LNK2005"符號已定義"的鏈接錯誤?》),鏈接器會首先在C++標準庫中解析符號,然后才是C標準庫,所以如果開發者沒有自定義operator new的話最后程序鏈接的應該是C++標準庫中newop.obj和newop2.obj模塊里的代碼。可是程序運行的結果卻是:
new(nothrow) BigClass, returned a NULL pointer
顯然程序始終未拋出bad_alloc異常。單步跟蹤觀察,發現第1個和第3個new實際上調用了new.cpp里的operator new,而第二個new(nothrow)則正確地調用了newop2.cpp定義的版本。很難理解是吧?但是當你用
dumpbin /SYMBOLS libcp.lib
dump出libcp.lib所有的符號信息時,你會發現其中的newop.obj模塊沒有定義任何符號(其它版本也一樣)。不可思議!newop.cpp的實現代碼明明寫在那兒,怎么會....?讓我們再仔細看看newop.cpp,咦,operator new的定義被包裹在一個#if...#endif塊中:
#if !defined(_MSC_EXTENSIONS)
...
...
void *__cdecl operator new(size_t size) _THROW1(_STD bad_alloc)
{
...
...
}
#endif
哦,原來需要_MSC_EXTENSIONS宏未定義,實現代碼才是有效的啊。那么這個宏是什么意思?其實Visual C++在語言層面上對ANSI C標準做了一些特殊的擴展,定義_MSC_EXTENSIONS意味著編譯器支持這樣的擴展,沒有定義它編譯器就會嚴格按照ANSI C標準來編譯程序。實際上如果指定了編譯選項/Ze編譯器就會自動定義這個宏,指定/Za則不會,而且/Ze是缺省選項。作者猜想Visual Studio的開發人員在build標準C++庫時很可能沒有指定/Za,導致newop.cpp中的operator new定義被無情拋棄。是他們的疏漏嗎?我看未必,大家可以試試用/Za選項去編譯那些標準庫文件,看看有多少編譯不通過。VC標準庫的實現用了很多微軟擴展的語言特性,不指定/Za是情有可原的,我不明白的是newop.cpp的作者(好象是P.J. Plauger老人家)為什么會加上一個如此愚蠢的"#if !defined(_MSC_EXTENSIONS)",因為實在看不出這個operator new定義與_MSC_EXTENSIONS有什么沖突的地方。
既然標準C++庫里的newop.obj是個空殼,那我們就只好自己動手豐衣足食了。把newop.cpp和dbgint.h(都在VC98\crt\src目錄下)拷貝到test.cpp所在的目錄,并將newop.cpp中的
#include <dbgint.h>
改成
#include "dbgint.h"
然后用
cl /c /Za /D_CRTBLD newop.cpp
編譯它。/D_CRTBLD定義了_CRTBLD宏,為什么這么做呢?因為dbgint.h屬于內部頭文件,VC不希望應用程序用到它,便在文件中埋伏了這么一段:
#ifndef _CRTBLD
/*
* This is an internal C runtime header file. It is used when building
* the C runtimes only. It is not to be used as a public header file.
*/
#error ERROR: Use of C runtime library internal header file.
#endif /* _CRTBLD */
可我們確確實實是想build標準庫(的一部分),所以只好強行突破這個限制了。然后編譯test.cpp:
cl /c /GX test.cpp
最后進行鏈接:
link test.obj newop.obj
這時再運行test.exe輸出的結果就是
new BigClass, threw a bad_alloc exception
new(nothrow) BigClass, returned a NULL pointer
new BigClass[1], threw a bad_alloc exception
值得慶幸的是雖然VC6.0如此弱智,但VC7.1卻表現良好,原因是VC7.1的newop.cpp和newaop.cpp(數組版)取消了那個愚的"#if !defined(_MSC_EXTENSIONS)",于是標準C++庫中的newop.obj和newaop.obj模塊都實實在在地有了相應代碼。另外,nothrow版的定義也分別轉移到了newopnt.cpp和newaopnt.cpp中。
后記: 作者在2001年便碰到過這個問題,百思不得其解,于是在CSDN論壇上發問,也不見答復。從此便擱置一旁,直到最近因探究LNK2005鏈接錯誤而徹底弄清楚VC鏈接器解析符號的規則后,才意識到二者或有聯系。于是重拾舊疑,順藤而上,果然問題就迎刃而解。此題雖小,功夫卻做足,最后總算水落石出,解除了4年的積惑。
另一篇文章(網上被大量轉載,來源不可知,我覺得這篇文章有些內容不一定正確):
為什么會出現LNK2005"符號已定義"的鏈接錯誤?
? 許多Visual C++的使用者都碰到過LNK2005:symbol already defined和LNK1169:one or more multiply defined symbols found這樣的鏈接錯誤,而且通常是在使用第三方庫時遇到的。對于這個問題,有的朋友可能不知其然,而有的朋友可能知其然卻不知其所以然,那么本文就試圖為大家徹底解開關于它的種種疑惑。
??? 大家都知道,從C/C++源程序到可執行文件要經歷兩個階段:(1)編譯器將源文件編譯成匯編代碼,然后由匯編器(assembler)翻譯成機器指令(再加上其它相關信息)后輸出到一個個目標文件(object file,VC的編譯器編譯出的目標文件默認的后綴名是.obj)中;(2)鏈接器(linker)將一個個的目標文件(或許還會有若干程序庫)鏈接在一起生成一個完整的可執行文件。
??? 編譯器編譯源文件時會把源文件的全局符號(global symbol)分成強(strong)和弱(weak)兩類傳給匯編器,而隨后匯編器則將強弱信息編碼并保存在目標文件的符號表中。那么何謂強弱呢?編譯器認為函數與初始化了的全局變量都是強符號,而未初始化的全局變量則成了弱符號。比如有這么個源文件:
extern int errorno;
int buf[2] = {1,2};
int *p;
int main()
{
?? return 0;
}
其中main、buf是強符號,p是弱符號,而errorno則非強非弱,因為它只是個外部變量的使用聲明。
??? 有了強弱符號的概念,我們就可以看看鏈接器是如何處理與選擇被多次定義過的全局符號:
規則1: 不允許強符號被多次定義(即不同的目標文件中不能有同名的強符號);
規則2: 如果一個符號在某個目標文件中是強符號,在其它文件中都是弱符號,那么選擇強符號;
規則3: 如果一個符號在所有目標文件中都是弱符號,那么選擇其中任意一個;
??? 由上可知多個目標文件不能重復定義同名的函數與初始化了的全局變量,否則必然導致LNK2005和LNK1169兩種鏈接錯誤。可是,有的時候我們并沒有在自己的程序中發現這樣的重定義現象,卻也遇到了此種鏈接錯誤,這又是何解?嗯,問題稍微有點兒復雜,容我慢慢道來。
??? 眾所周知,ANSI C/C++ 定義了相當多的標準函數,而它們又分布在許多不同的目標文件中,如果直接以目標文件的形式提供給程序員使用的話,就需要他們確切地知道哪個函數存在于哪個目標文件中,并且在鏈接時顯式地指定目標文件名才能成功地生成可執行文件,顯然這是一個巨大的負擔。所以C語言提供了一種將多個目標文件打包成一個文件的機制,這就是靜態程序庫(static library)。開發者在鏈接時只需指定程序庫的文件名,鏈接器就會自動到程序庫中尋找那些應用程序確實用到的目標模塊,并把(且只把)它們從庫中拷貝出來參與構建可執行文件。幾乎所有的C/C++開發系統都會把標準函數打包成標準庫提供給開發者使用(有不這么做的嗎?)。
??? 程序庫為開發者帶來了方便,但同時也是某些混亂的根源。我們來看看鏈接器是如何解析(resolve)對程序庫的引用的。
???
??? 在符號解析(symbol resolution)階段,鏈接器按照所有目標文件和庫文件出現在命令行中的順序從左至右依次掃描它們,在此期間它要維護若干個集合:(1)集合E是將被合并到一起組成可執行文件的所有目標文件集合;(2)集合U是未解析符號(unresolved symbols,比如已經被引用但是還未被定義的符號)的集合;(3)集合D是所有之前已被加入到E的目標文件定義的符號集合。一開始,E、U、D都是空的。
(1): 對命令行中的每一個輸入文件f,鏈接器確定它是目標文件還是庫文件,如果它是目標文件,就把f加入到E,并把f中未解析的符號和已定義的符號分別加入到U、D集合中,然后處理下一個輸入文件。
(2): 如果f是一個庫文件,鏈接器會嘗試把U中的所有未解析符號與f中各目標模塊定義的符號進行匹配。如果某個目標模塊m定義了一個U中的未解析符號,那么就把m加入到E中,并把m中未解析的符號和已定義的符號分別加入到U、D集合中。不斷地對f中的所有目標模塊重復這個過程直至到達一個不動點(fixed point),此時U和D不再變化。而那些未加入到E中的f里的目標模塊就被簡單地丟棄,鏈接器繼續處理下一輸入文件。
(3): 如果處理過程中往D加入一個已存在的符號,或者當掃描完所有輸入文件時U非空,鏈接器報錯并停止動作。否則,它把E中的所有目標文件合并在一起生成可執行文件。
??? VC帶的編譯器名字叫cl.exe,它有這么幾個與標準程序庫有關的選項: /ML、/MLd、/MT、/MTd、/MD、/MDd。這些選項告訴編譯器應用程序想使用什么版本的C標準程序庫。/ML(缺省選項)對應單線程靜態版的標準程序庫(libc.lib);/MT對應多線程靜態版標準庫(libcmt.lib),此時編譯器會自動定義_MT宏;/MD對應多線程DLL版(導入庫msvcrt.lib,DLL是msvcrt.dll),編譯器自動定義_MT和_DLL兩個宏。后面加d的選項都會讓編譯器自動多定義一個_DEBUG宏,表示要使用對應標準庫的調試版,因此/MLd對應調試版單線程靜態標準庫(libcd.lib),/MTd對應調試版多線程靜態標準庫(libcmtd.lib),/MDd對應調試版多線程DLL標準庫(導入庫msvcrtd.lib,DLL是msvcrtd.dll)。雖然我們的確在編譯時明白無誤地告訴了編譯器應用程序希望使用什么版本的標準庫,可是當編譯器干完了活,輪到鏈接器開工時它又如何得知一個個目標文件到底在思念誰?為了傳遞相思,我們的編譯器就干了點秘密的勾當。在cl編譯出的目標文件中會有一個專門的區域(關心這個區域到底在文件中什么地方的朋友可以參考COFF和PE文件格式)存放一些指導鏈接器如何工作的信息,其中有一種就叫缺省庫(default library),這些信息指定了一個或多個庫文件名,告訴鏈接器在掃描的時候也把它們加入到輸入文件列表中(當然順序位于在命令行中被指定的輸入文件之后)。說到這里,我們先來做個小實驗。寫個頂頂簡單的程序,然后保存為main.c :
/* main.c */
int main() { return 0; }
用下面這個命令編譯main.c(什么?你從不用命令行來編譯程序?這個......) :
cl /c main.c
/c是告訴cl只編譯源文件,不用鏈接。因為/ML是缺省選項,所以上述命令也相當于: cl /c /ML main.c 。如果沒什么問題的話(要出了問題才是活見鬼!當然除非你的環境變量沒有設置好,這時你應該去VC的bin目錄下找到vcvars32.bat文件然后運行它。),當前目錄下會出現一個main.obj文件,這就是我們可愛的目標文件。隨便用一個文本編輯器打開它(是的,文本編輯器,大膽地去做別害怕),搜索"defaultlib"字符串,通常你就會看到這樣的東西: "-defaultlib:LIBC -defaultlib:OLDNAMES"。啊哈,沒錯,這就
是保存在目標文件中的缺省庫信息。我們的目標文件顯然指定了兩個缺省庫,一個是單線程靜態版標準庫libc.lib(這與/ML選項相符),另外一個是oldnames.lib(它是為了兼容微軟以前的C/C++開發系統)。
??? VC的鏈接器是link.exe,因為main.obj保存了缺省庫信息,所以可以用
link main.obj libc.lib
或者
link main.obj
來生成可執行文件main.exe,這兩個命令是等價的。但是如果你用
link main.obj libcd.lib
的話,鏈接器會給出一個警告: "warning LNK4098: defaultlib "LIBC" conflicts with use of other libs; use /NODEFAULTLIB:library",因為你顯式指定的標準庫版本與目標文件的缺省值不一致。通常來說,應該保證鏈接器合并的所有目標文件指定的缺省標準庫版本一致,否則編譯器一定會給出上面的警告,而LNK2005和LNK1169鏈接錯誤則有時會出現有時不會。那么這個有時到底是什么時候?呵呵,別著急,下面的一切正是為喜歡追根究底的你準備的。
??? 建一個源文件,就叫mylib.c,內容如下:
/* mylib.c */
#include <stdio.h>
void foo()
{
?? printf("%s","I am from mylib!\n");
}
用
cl /c /MLd mylib.c
命令編譯,注意/MLd選項是指定libcd.lib為默認標準庫。lib.exe是VC自帶的用于將目標文件打包成程序庫的命令,所以我們可以用
lib /OUT:my.lib mylib.obj
將mylib.obj打包成庫,輸出的庫文件名是my.lib。接下來把main.c改成:
/* main.c */
void foo();
int main()
{
?? foo();
?? return 0;
}
用
cl /c main.c
編譯,然后用
link main.obj my.lib
進行鏈接。這個命令能夠成功地生成main.exe而不會產生LNK2005和LNK1169鏈接錯誤,你僅僅是得到了一條警告信息:"warning LNK4098: defaultlib "LIBCD" conflicts with use of other libs; use /NODEFAULTLIB:library"。我們根據前文所述的掃描規則來分析一下鏈接器此時做了些啥。
??? 一開始E、U、D都是空集,鏈接器首先掃描到main.obj,把它加入E集合,同時把未解析的foo加入U,把main加入D,而且因為main.obj的默認標準庫是libc.lib,所以它被加入到當前輸入文件列表的末尾。接著掃描my.lib,因為這是個庫,所以會拿當前U中的所有符號(當然現在就一個foo)與my.lib中的所有目標模塊(當然也只有一個mylib.obj)依次匹配,看是否有模塊定義了U中的符號。結果mylib.obj確實定義了foo,于是它被加入到E,foo從U轉移到D,mylib.obj引用的printf加入到U,同樣地,mylib.obj指定的默認標準庫是libcd.lib,它也被加到當前輸入文件列表的末尾(在libc.lib的后面)。不斷地在my.lib庫的各模塊上進行迭代以匹配U中的符號,直到U、D都不再變化。很明顯,現在就已經到達了這么一個不動點,所以接著掃描下一個輸入文件,就是libc.lib。鏈接器發現libc.lib里的printf.obj里定義有printf,于是printf從U移到D,而printf.obj被加入到E,它定義的所有符號加入到D,它里頭的未解析符號加入到U。鏈接器還會把每個程序都要用到的一些初始化操作所在的目標模塊(比如crt0.obj等)及它們所引用的模塊(比如malloc.obj、free.obj等)自動加入到E中,并更新U和D以反應這個變化。事實上,標準庫各目標模塊里的未解析符號都可以在庫內其它模塊中找到定義,因此當鏈接器處理完libc.lib時,U一定是空的。最后處理libcd.lib,因為此時U已經為空,所以鏈接器會拋棄它里面的所有目標模塊從而結束掃描,然后合并E中的目標模塊并輸出可執行文件。
??? 上文描述了雖然各目標模塊指定了不同版本的缺省標準庫但仍然鏈接成功的例子,接下來你將目睹因為這種不嚴謹而導致的悲慘失敗。
??? 修改mylib.c成這個樣子:
#include <crtdbg.h>
void foo()
{
?? // just a test , don't care memory leak
?? _malloc_dbg( 1, _NORMAL_BLOCK, __FILE__, __LINE__ );
}
其中_malloc_dbg不是ANSI C的標準庫函數,它是VC標準庫提供的malloc的調試版,與相關函數配套能幫助開發者抓各種內存錯誤。使用它一定要定義_DEBUG宏,否則預處理器會把它自動轉為malloc。繼續用
cl /c /MLd mylib.c
lib /OUT:my.lib mylib.obj
編譯打包。當再次用
link main.obj my.lib
進行鏈接時,我們看到了什么?天哪,一堆的LNK2005加上個貴為"fatal error"的LNK1169墊底,當然還少不了那個LNK4098。鏈接器是不是瘋了?不,你冤枉可憐的鏈接器了,我拍胸脯保證它可是一直在盡心盡責地照章辦事。
??? 一開始E、U、D為空,鏈接器掃描main.obj,把它加入E,把foo加入U,把main加入D,把libc.lib加入到當前輸入文件列表的末尾。接著掃描my.lib,foo從U轉移到D,_malloc_dbg加入到U,libcd.lib加到當前輸入文件列表的尾部。然后掃描libc.lib,這時會發現libc.lib里任何一個目標模塊都沒有定義_malloc_dbg(它只在調試版的標準庫中存在),所以不會有任何一個模塊因為_malloc_dbg而加入E,但是每個程序都要用到的初始化模塊(如crt0.obj等)及它們所引用的模塊(比如malloc.obj、free.obj等)還是會自動加入到E中,同時U和D被更新以反應這個變化。當鏈接器處理完libc.lib時,U只剩_malloc_dbg這一個符號。最后處理libcd.lib,發現dbgheap.obj定義了_malloc_dbg,于是dbgheap.obj加入到E,它里頭的未解析符號加入U,它定義的所有其它符號也加入D,這時災難便來了。之前malloc等符號已經在D中(隨著libc.lib里的malloc.obj加入E而加入的),而dbgheap.obj又定義了包括malloc在內的許多同名符號,這引發了重定義沖突,鏈接器只好中斷工作并報告錯誤。
??? 現在我們該知道,鏈接器完全沒有責任,責任在我們自己的身上。是我們粗心地把缺省標準庫版本不一致的目標文件(main.obj)與程序庫(my.lib)鏈接起來,導致了大災難。解決辦法很簡單,要么用/MLd選項來重編譯main.c;要么用/ML選項重編譯mylib.c。
??? 在上述例子中,我們擁有庫my.lib的源代碼(mylib.c),所以可以用不同的選項重新編譯這些源代碼并再次打包。可如果使用的是第三方的庫,它并沒有提供源代碼,那么我們就只有改變自己程序的編譯選項來適應這些庫了。但是如何知道庫中目標模塊指定的默認庫呢?其實VC提供的一個小工具便可以完成任務,這就是dumpbin.exe。運行下面這個命令
dumpbin /DIRECTIVES my.lib
然后在輸出中找那些"Linker Directives"引導的信息,你一定會發現每一處這樣的信息都會包含若干個類似"-defaultlib:XXXX"這樣的字符串,其中XXXX便代表目標模塊指定的缺省庫名。
??? 知道了第三方庫指定的默認標準庫,再用合適的選項編譯我們的應用程序,就可以避免LNK2005和LNK1169鏈接錯誤。喜歡IDE的朋友,你一樣可以到 "Project屬性" -> "C/C++" -> "代碼生成(code generation)" -> "運行時庫(run-time library)" 項下設置應用程序的默認標準庫版本,這與命令行選項的效果是一樣的。
好文章還不是一般的多:
Under The Hood, July 1997
http://comcamp.diy.myrice.com/techarticles/vc/0010.htm
為什么全局變量沒有初始化?
http://comcamp.diy.myrice.com/techarticles/vc/0011.htm
鏈接一個靜態LIB,不在客戶端代碼中使用它的任何變量和代碼,但要讓這個LIB的全局變量被初始化的方法是:
這個鏈接庫頭文件應該這么寫:
extern CMyClass *g_pObject ;
static void *__dummy = (void*)g_pObject ;
// lib.cpp
CMyClass *g_pObject = CMyClass::Instance() ; // Singleton
__dummy會出現在任何包含這個頭文件的CPP文件的OBJ中,所以LINKER會把靜態庫中的g_pObject鏈接到Exe中,包括它的構造和析構
<iostream>很有意思,其中有一行
static ios_base::Init _Ios_init;
ios_base::Init是個類,在類的構造中判斷構造是否第一次被調用,如果是,則初始化cout,cin,cerr等
在類的析構中判斷這是不是最后一次構造,如果是,則調用cout.flush() .... (basic_ostream等的析構并沒有調用flush)
具體怎么判斷是否第一次調用構造,是否最后一次調用析構,那是用一個int的靜態類成員來計算...
其實這樣會增加exe文件的尺寸,降低程序啟動速度....