Ansi、Unicode、UTF8字符串之間的轉換和寫入文本文件
摘要: Ansi字符串最熟悉,英文占一個字節(jié),漢字2個字節(jié),以一個\0結尾,常用于txt文本文件
Unicode字符串,每個字符(漢字、英文字母)都占2個字節(jié),以2個連續(xù)的\0結尾,NT操作系統(tǒng)內(nèi)核用的是這種字符串,常被定義為typedef unsigned short wchar_t;所以我們有時常會見到什么char*無法轉換為unsigned short*之類的錯誤,其實就是unicode
UTF8是Unicode一種壓縮形式,英文A在unicode中表示為0x0041,老外覺得這種存儲方式太浪費,因為浪費了50%的空間,于是就把英文壓縮成1個字節(jié),成了utf8編碼,但是漢字在utf8中占3個字節(jié),顯然用做中文不如ansi合算,這就是中國的網(wǎng)頁用作ansi編碼而老外的網(wǎng)頁常用utf8的原因。
閱讀全文
posted @
2008-08-31 22:29 greatws 閱讀(24742) |
評論 (26) 編輯
今天做了個小試驗,類成員變量的初始化,發(fā)現(xiàn)放在參數(shù)列表和構造函數(shù)體內(nèi)是一樣的
摘要: 編譯器:VC2005 Release模式,代碼不優(yōu)化
調(diào)試器: OllyDBG 1.10
閱讀全文
posted @
2008-08-07 16:09 greatws 閱讀(2711) |
評論 (12) 編輯