編碼范圍
1. GBK (GB2312/GB18030)
x00-xff GBK雙字節(jié)編碼范圍
x20-x7f ASCII
xa1-xff 中文
x80-xff 中文
2. UTF-8 (Unicode)
u4e00-u9fa5 (中文)
x3130-x318F (韓文)
xAC00-xD7A3 (韓文)
u0800-u4e00 (日文)
ps: 韓文是大于[u9fa5]的字符
有時(shí)候我們也會(huì)用到全角英文、特殊符號(hào)等
全角英文的UTF8是: uff21 – uff5a ,是從大寫(xiě)A開(kāi)始到小寫(xiě)的z。
utf8中的全角數(shù)字是 uff10 – uff19 ,對(duì)應(yīng)關(guān)系自然是 0 – 9 。
utf8中的 uff01 到 uff09 是我們美式鍵盤(pán)上shift + 從1到9鍵上的特殊符號(hào)。
utf8中的 uff20是@, 要注意的是因?yàn)锧是 uff20,所以 uff02 是雙引號(hào),
6的……是兩個(gè)符號(hào)的組合,
也就是說(shuō)ff06是&, ff09是 )。
正則例子(使用PHP):
preg_replace(“/([x80-xff])/”,”",$str); //GBK中匹配
preg_replace(“/([u4e00-u9fa5])/”,”",$str); //UTF8中匹配
轉(zhuǎn)載地址:http://blog.csdn.net/sjw890821sjw/article/details/7004474
@import url(http://www.shnenglu.com/CuteSoft_Client/CuteEditor/Load.ashx?type=style&file=SyntaxHighlighter.css);@import url(/css/cuteeditor.css);