1. 基礎(chǔ)字符串函數(shù):
字符串庫(kù)中有一些函數(shù)非常簡(jiǎn)單,如:
1). string.len(s) 返回字符串s的長(zhǎng)度;
2). string.rep(s,n) 返回字符串s重復(fù)n次的結(jié)果;
3). string.lower(s) 返回s的副本,其中所有的大寫都被轉(zhuǎn)換為了小寫形式,其他字符不變;
4). string.upper(s) 和lower相反,將小寫轉(zhuǎn)換為大寫;
5). string.sub(s,i,j) 提取字符串s的第i個(gè)到第j個(gè)字符。Lua中,第一個(gè)字符的索引值為1,最后一個(gè)為-1,以此類推,如:
print(string.sub("[hello world]",2,-2)) --輸出hello world
6). string.format(s,...) 返回格式化后的字符串,其格式化規(guī)則等同于C語(yǔ)言中printf函數(shù),如:
print(string.format("pi = %.4f",math.pi)) --輸出pi = 3.1416
7). string.char(...) 參數(shù)為0到多個(gè)整數(shù),并將每個(gè)整數(shù)轉(zhuǎn)換為對(duì)應(yīng)的字符。然后返回一個(gè)由這些字符連接而成的字符串,如:
print(string.char(97,98,99)) --輸出abc
8). string.byte(s,i) 返回字符串s的第i個(gè)字符的Ascii值,如果沒(méi)有第二個(gè)參數(shù),缺省返回第一個(gè)字符的Ascii值。
print(string.byte("abc")) --輸出97
print(string.byte("abc",-1)) --輸出99
由于字符串類型的變量都是不可變類型的變量,因此在所有和string相關(guān)的函數(shù)中,都無(wú)法改變參數(shù)中的字符串值,而是生成一個(gè)新值返回。
2. 模式匹配函數(shù):
Lua的字符串庫(kù)提供了一組強(qiáng)大的模式匹配函數(shù),如find、match、gsub和gmatch。
1). string.find函數(shù):
在目標(biāo)字符串中搜索一個(gè)模式,如果找到,則返回匹配的起始索引和結(jié)束索引,否則返回nil。如:
1 s = "hello world"
2 i, j = string.find(s,"hello")
3 print(i, j) --輸出1 5
4 i, j = string.find(s,"l")
5 print(i, j) --輸出3 3
6 print(string.find(s,"lll")) --輸出nil
string.find函數(shù)還有一個(gè)可選參數(shù),它是一個(gè)索引,用于告訴函數(shù)從目標(biāo)字符串的哪個(gè)位置開(kāi)始搜索。主要用于搜索目標(biāo)字符串中所有匹配的子字符串,且每次搜索都從上一次找到的位置開(kāi)始。如:
1 local t = {}
2 local i = 0
3 while true do
4 i = string.find(s,"\n",i+1)
5 if i == nil then
6 break
7 end
8 t[#t + 1] = i
9 end
2). string.match函數(shù):
該函數(shù)返回目標(biāo)字符串中和模式字符串匹配的部分。如:
1 date = "Today is 2012-01-01"
2 d = string.match(date,"%d+\-%d+\-%d+")
3 print(d) --輸出2012-01-01
3). string.gsub函數(shù):
該函數(shù)有3個(gè)參數(shù),目標(biāo)字符串、模式和替換字符串。基本用法是將目標(biāo)字符串中所有出現(xiàn)模式的地方替換為替換字符串。如:
print(string.gsub("Lua is cute","cute","great")) --輸出Lua is great
該函數(shù)還有可選的第4個(gè)參數(shù),即實(shí)際替換的次數(shù)。
print(string.gsub("all lii","l","x",1)) --輸出axl lii
print(string.gsub("all lii","l","x",2)) --輸出axx lii
函數(shù)string.gsub還有另一個(gè)結(jié)果,即實(shí)際替換的次數(shù)。
count = select(2, string.gsub(str," "," ")) --輸出str中空格的數(shù)量
4). string.gmatch函數(shù):
返回一個(gè)函數(shù),通過(guò)這個(gè)返回的函數(shù)可以遍歷到一個(gè)字符串中所有出現(xiàn)指定模式的地方。如:
1 words = {}
2 s = "hello world"
3 for w in string.gmatch(s,"%a+") do
4 print(w)
5 words[#words + 1] = w
6 end
7 --輸出結(jié)果為:
8 --hello
9 --world
3. 模式:
下面的列表給出了Lua目前支持的模式元字符;
模式元字符 | 描述 |
. | 所有字符 |
%a | 字母 |
%c | 控制字符 |
%d | 數(shù)字 |
%l | 小寫字母 |
%p | 標(biāo)點(diǎn)符號(hào) |
%s | 空白字符 |
%u | 大寫字母 |
%w | 字母和數(shù)字字符 |
%x | 十六進(jìn)制數(shù)字 |
%z | 內(nèi)部表示為0的字符 |
這些元字符的大寫形式表示它們的補(bǔ)集,如%A,表示所有非字母字符。
print(string.gsub("hello, up-down!","%S",".")) --輸出hello..up.down. 4
上例中的4表示替換的次數(shù)。
除了上述元字符之外,Lua還提供了另外幾個(gè)關(guān)鍵字符。如:( ) . % + - * ? [ ] ^ $
其中%表示轉(zhuǎn)義字符,如%.表示點(diǎn)(.),%%表示百分號(hào)(%)。
方括號(hào)[]表示將不同的字符分類,即可創(chuàng)建出屬于自己的字符分類,如[%w_]表示匹配字符、數(shù)字和下劃線。
橫線(-)表示連接一個(gè)范圍,比如[0-9A-Z]
如果^字符在方括號(hào)內(nèi),如[^\n],表示除\n之外的所有字符,即表示方括號(hào)中的分類的補(bǔ)集。如果^不在方括號(hào)內(nèi),則表示以后面的字符開(kāi)頭,$和它正好相反,表示以前面的字符結(jié)束。如:^Hello%d$,匹配的字符串可能為Hello1、Hello2等。
在Lua中還提供了4種用來(lái)修飾模式中的重復(fù)部分,如:+(重復(fù)1次或多次)、*(重復(fù)0次或多次)、-(重復(fù)0次或多次)和?(出現(xiàn)0或1次)。如:
print(string.gsub("one, and two; and three","%a+","word")) --輸出word, word word; word word
print(string.match("the number 1298 is even","%d+")) --輸出1298
星號(hào)(*)和橫線(-)的主要差別是,星號(hào)總是試圖匹配更多的字符,而橫線則總是試圖匹配最少的字符。
4. 捕獲(capture):
捕獲功能可根據(jù)一個(gè)模式從目標(biāo)字符串中抽出匹配于該模式的內(nèi)容。在指定捕獲是,應(yīng)將模式中需要捕獲的部分寫到一對(duì)圓括號(hào)內(nèi)。對(duì)于具有捕獲的模式,函數(shù)string.match會(huì)將所有捕獲到的值作為單獨(dú)的結(jié)果返回。即它會(huì)將目標(biāo)字符串切成多個(gè)捕獲到的部分。如:
1 pair = "name = Anna"
2 key,value = string.match(pair,"(%a+)%s*=%s*(%a+)")
3 print(key,value) --輸出name anna
4
5 date = "Today is 2012-01-02"
6 y,m,d = string.match(date,"(%d+)\-(%d+)\-(%d+)")
7 print(y,m,d) --輸出2012 01 02
還可以對(duì)模式本身使用捕獲。即%1表示第一個(gè)捕獲,以此類推,%0表示整個(gè)匹配,如:
1 print(string.gsub("hello Lua","(.)(.)","%2%1")) --將相鄰的兩個(gè)字符對(duì)調(diào),輸出為ehll ouLa
2 print(string.gsub("hello Lua!","%a","%0-%0")) --輸出為h-he-el-ll-lo-o L-Lu-ua-a!
5. 替換:
string.gsub函數(shù)的第三個(gè)參數(shù)不僅可以是字符串,也可以是函數(shù)或table,如果是函數(shù),string.gsub會(huì)在每次找到匹配時(shí)調(diào)用該函數(shù),調(diào)用時(shí)的參數(shù)就是捕獲到的內(nèi)容,而該函數(shù)的返回值則作為要替換的字符串。當(dāng)用一個(gè)table來(lái)調(diào)用時(shí),string.gsub會(huì)用每次捕獲到的內(nèi)容作為key,在table中查找,并將對(duì)應(yīng)的value作為要替換的字符串。如果table中不包含這個(gè)key,那么string.gsub不改變這個(gè)匹配。如:
1 function expand(s)
2 return (string.gsub(s,"$(%w+)",_G))
3 end
4
5 name = "Lua"; status = "great"
6 print(expand("$name is $status, isn't it?")) --輸出 Lua is great, isn't it?
7 print(expand("$othername is $status, isn't it?")) --輸出 $othername is great, isn't it?
8
9 function expand2(s)
10 return (string.gsub(s,"$(%w+)",function(n) return tostring(_G[n]) end))
11 end
12
13 print(expand2("print = $print; a = $a")) --輸出 print = function: 002B77C0; a = nil