• <ins id="pjuwb"></ins>
    <blockquote id="pjuwb"><pre id="pjuwb"></pre></blockquote>
    <noscript id="pjuwb"></noscript>
          <sup id="pjuwb"><pre id="pjuwb"></pre></sup>
            <dd id="pjuwb"></dd>
            <abbr id="pjuwb"></abbr>
            posts - 15,comments - 21,trackbacks - 0
                  相信大家在開發(fā)后臺的過程中都遇到過中文亂碼的問題,今天我就來講講其中的原因。
                  我這建了3張表,test_latin1,test_utf8,test_gbk,表結(jié)構(gòu)如下
                  +-------+----------+------+-----+---------+-------+
                  | Field | Type     | Null | Key | Default | Extra |
                  +-------+----------+------+-----+---------+-------+
                  | name  | char(32) | YES  |     | NULL    |       |
                  +-------+----------+------+-----+---------+-------+

                  我的前端是gbk的編碼
                  執(zhí)行下面的語句
                  set names 'latin1'
                  insert into test_latin1 set name='王';('王'字是GBK編碼)
                  select name from test_latin1;
                  結(jié)果是否為亂碼?

                  執(zhí)行下面的語句
                  set names 'gbk'
                  insert into test_latin1 set name='王';('王'字是GBK編碼)
                  select name from test_latin1;
                  結(jié)果是否為亂碼?

                  執(zhí)行下面的語句
                  set names 'latin1'
                  insert into test_utf8 set name='王';('王'字是GBK編碼)
                  select name from test_utf8 ;
                  結(jié)果是否為亂碼?

                  我們舉個例子,假設(shè)一個漢字的字符編碼為0xFFFF,它在屏幕上能夠正常顯示,如果漢字存入數(shù)據(jù)庫的時候和從數(shù)據(jù)庫中取出的時候,編碼一致,那么它肯定不是亂碼。反過來,如果輸出的時候是亂碼,那么它肯定被轉(zhuǎn)碼了,至于為什么被轉(zhuǎn)碼了,我們得看看mysql里面做了什么(mysql難道會把無碼片變成了有碼片?)
                  首先mysql里面有2個概念,一個叫character set,一個叫collation。我們先說說character set。字符集就是數(shù)字,英文字符,漢字等編碼格式,我們常見的是utf8,gbk,gb2312。mysql里面比較復(fù)雜,有4個東西跟它有關(guān),分別是character_set_client,character_set_connection,character_set_database,character_set_results。set names (latin1)其實(shí)就是character_set_client=latin1,character_set_connection=latin1,character_set_results=latin1,它的流程是character_set_client ==> character_set_connection ==> Table Character ==> character_set_results。
                  我們按照上面的流程,來分析第一個問題。
                  set names 'latin1'----執(zhí)行了character_set_client=latin1,character_set_connection=latin1,character_set_results=latin1;
                  insert into test_latin1 set name='王';這句話,mysql做了什么事呢?首先,character_set_client,它會把王字的編碼當(dāng)成latin1的編碼傳遞給character_set_connection(此時不會轉(zhuǎn)碼),character_set_connection會把編碼傳遞給Table Character,因?yàn)楸肀旧硎莑atin1,所以此時也不需要轉(zhuǎn)碼,select name from test_latin1;mysql會把test_latin1中的編碼傳遞給前端,此時也不需要轉(zhuǎn)碼,所以,走個流程下來,我們輸入的是什么編碼,輸出的還是相同的編碼,因此,第一個問題的答案是不會是亂碼。我畫個流程圖latin1==>latin1==>latin1==>latin1,沒有轉(zhuǎn)碼的過程
                  
                  我們在來看第二個問題。
                  set names 'test_gbk'----執(zhí)行了character_set_client=gbk,character_set_connection=gbk,character_set_results=gbk;
                  insert into test_latin1 set name='王';character_set_client,它會把王字的編碼當(dāng)成gbk的編碼傳遞給character_set_connection(此時不會轉(zhuǎn)碼),character_set_connection會把編碼傳遞給Table Character,因?yàn)楸硎莑anti1的編碼格式,這個過程的時候就會進(jìn)行轉(zhuǎn)碼,但是latin1的字符集小于gbk的字符集,所以它會找不到對應(yīng)字符的編碼,此時會以?代替。select name from test_latin1,此時會從latin1轉(zhuǎn)碼成gbk,但是此時latin1已經(jīng)是錯誤的數(shù)據(jù)了,所以得到的gbk編碼也是錯誤的了。流程gbk==>gbk==>latin1==>gbk,其中g(shù)bk==>latin1出了問題,我們select出來的數(shù)據(jù)也就不可能是輸入時候的數(shù)據(jù)了。因此,這個問題的答案是亂碼。

                  第三個。
                  set names 'test_latin1'
                  insert into test_utf8 set name='王';character_set_client,它會把王字的編碼當(dāng)成latin1的編碼傳遞給character_set_connection(此時不會轉(zhuǎn)碼),character_set_connection會把編碼傳遞給Table Character,此時表是utf8的格式,因此會進(jìn)行轉(zhuǎn)碼,latin1==>utf8,因?yàn)閡tf8的字符集>latin1字符集,因此,轉(zhuǎn)碼正常。select name from test_utf8;會從utf8轉(zhuǎn)碼成latin1,此時可以轉(zhuǎn)碼成功,因此我們最終得到的和輸入的時候是一致的,因此答案不是亂碼。流程latin1==>latin1==>utf8==>latin1,從小的字符集到大的字符集再到小的字符集,轉(zhuǎn)碼是不會有問題的。
                  屁話了這么多,無非想告訴大家一個萬精油方法,表創(chuàng)建的字符集和set names都設(shè)置成同一個字符集,就基本可以滿足輸入數(shù)據(jù)不會在轉(zhuǎn)換過程中失真,也就是說輸入是什么,輸出就是什么。建議有中文的都設(shè)置成utf8字符集,一勞永逸。
            posted on 2012-11-26 19:56 梨樹陽光 閱讀(2561) 評論(2)  編輯 收藏 引用 所屬分類: 數(shù)據(jù)庫

            FeedBack:
            # re: mysql中文亂碼解析
            2012-11-27 09:18 | zuhd
            最后一句話是亮點(diǎn)  回復(fù)  更多評論
              
            # re: mysql中文亂碼解析
            2012-11-27 12:23 | cy
            分析的非常透徹,受用!  回復(fù)  更多評論
              
            久久乐国产综合亚洲精品| 久久国产精品99国产精| 久久99精品国产麻豆蜜芽| 欧美无乱码久久久免费午夜一区二区三区中文字幕 | 国产精品久久亚洲不卡动漫| 久久精品国产福利国产琪琪| 无码精品久久久久久人妻中字| 久久97久久97精品免视看秋霞| 久久精品国产99久久久| 武侠古典久久婷婷狼人伊人| 99久久国产热无码精品免费| 色婷婷综合久久久久中文字幕| 国产精品久久精品| 久久婷婷五月综合成人D啪| 中文字幕久久欲求不满| 亚洲国产精品一区二区久久hs| 久久精品无码av| 一本大道加勒比久久综合| 久久久一本精品99久久精品88| 久久夜色撩人精品国产| 国产成人精品久久免费动漫| 久久精品人妻中文系列| 九九精品久久久久久噜噜| 国产精品激情综合久久| 777久久精品一区二区三区无码| 久久久久久久人妻无码中文字幕爆| 久久综合亚洲色HEZYO国产| 国产高潮久久免费观看| 国产精品成人精品久久久 | 久久久精品人妻无码专区不卡| 97久久香蕉国产线看观看| 午夜精品久久久久久毛片| 亚洲色大成网站www久久九| 无码国内精品久久人妻麻豆按摩| 国产国产成人久久精品| 国产精品免费久久| 99久久精品免费观看国产| 91精品日韩人妻无码久久不卡| 91精品国产高清久久久久久io| 国产精品久久久久久搜索| 久久成人精品视频|