最近一段時間老弄Utf8編碼,工作時寫了幾個函數,給大家指正一下
//////////////////////////////////////////////
//---------取得utf8字符的長度---------------//
//Str:String 源字符串
//Result:Integer utf8字符串長度
class function TPduPush.getUTF8Len(Str: string): Integer;
var
i: integer;
tmpChar: Pchar;
begin
tmpChar := pchar(str);
i := 0;
result := 0;
while i < length(tmpChar) do begin
if ord(tmpChar[i]) < $80 then begin
i := i + 1;
result := result + 1;
end else begin
i := i + 2;
result := result + 3;
end;
end;
end;
////////////////////////////////////////////////
//----------取得字符串中的字符個數------------//
//str:String 源字符串
//Result:Integer 字符個數,兼容中文雙字節
class function TPduPush.getAnsiLen(Str: string): integer;
var
i: integer;
tmpChar: Pchar;
begin
tmpChar := pchar(str);
i := 0;
result := 0;
while i < length(tmpChar) do begin
if ord(tmpChar[i]) < $80 then
i := i + 1
else
i := i + 2;
result := result + 1;
end;
end;
/////////////////////////////////////////////////
//---------截取指定長度的utf8字符串------------//
//str:string 源字符串
//count:Integer 指定長度 一個漢字占三個字節,長度只能小,不能大
//Result:string 截取后的utf8字符串
class function TPduPush.getUTF8String(Str: string; count: Integer): string;
var
i, j: integer;
tmpChar: Pchar;
begin
tmpChar := pchar(str);
i := 0;
j := 0;
result := '';
while i < length(tmpChar) do begin
if j >= count then break; //英文轉碼后不能超過指定的位數
if ord(tmpChar[i]) < $80 then begin
result := result + string(tmpChar[i]);
i := i + 1;
j := j + 1;
end else begin
if j + 2 >= count then break; //漢字轉碼后不能超過指定的位數
result := result + string(tmpChar[i]) + string(tmpChar[i + 1]);
i := i + 2;
j := j + 3;
end;
end;
end;