1. 基礎字符串函數:
字符串庫中有一些函數非常簡單,如:
1). string.len(s) 返回字符串s的長度;
2). string.rep(s,n) 返回字符串s重復n次的結果;
3). string.lower(s) 返回s的副本,其中所有的大寫都被轉換為了小寫形式,其他字符不變;
4). string.upper(s) 和lower相反,將小寫轉換為大寫;
5). string.sub(s,i,j) 提取字符串s的第i個到第j個字符。Lua中,第一個字符的索引值為1,最后一個為-1,以此類推,如:
print(string.sub("[hello world]",2,-2)) --輸出hello world
6). string.format(s,...) 返回格式化后的字符串,其格式化規則等同于C語言中printf函數,如:
print(string.format("pi = %.4f",math.pi)) --輸出pi = 3.1416
7). string.char(...) 參數為0到多個整數,并將每個整數轉換為對應的字符。然后返回一個由這些字符連接而成的字符串,如:
print(string.char(97,98,99)) --輸出abc
8). string.byte(s,i) 返回字符串s的第i個字符的Ascii值,如果沒有第二個參數,缺省返回第一個字符的Ascii值。
print(string.byte("abc")) --輸出97
print(string.byte("abc",-1)) --輸出99
由于字符串類型的變量都是不可變類型的變量,因此在所有和string相關的函數中,都無法改變參數中的字符串值,而是生成一個新值返回。
2. 模式匹配函數:
Lua的字符串庫提供了一組強大的模式匹配函數,如find、match、gsub和gmatch。
1). string.find函數:
在目標字符串中搜索一個模式,如果找到,則返回匹配的起始索引和結束索引,否則返回nil。如:
1 s = "hello world"
2 i, j = string.find(s,"hello")
3 print(i, j) --輸出1 5
4 i, j = string.find(s,"l")
5 print(i, j) --輸出3 3
6 print(string.find(s,"lll")) --輸出nil
string.find函數還有一個可選參數,它是一個索引,用于告訴函數從目標字符串的哪個位置開始搜索。主要用于搜索目標字符串中所有匹配的子字符串,且每次搜索都從上一次找到的位置開始。如:
1 local t = {}
2 local i = 0
3 while true do
4 i = string.find(s,"\n",i+1)
5 if i == nil then
6 break
7 end
8 t[#t + 1] = i
9 end
2). string.match函數:
該函數返回目標字符串中和模式字符串匹配的部分。如:
1 date = "Today is 2012-01-01"
2 d = string.match(date,"%d+\-%d+\-%d+")
3 print(d) --輸出2012-01-01
3). string.gsub函數:
該函數有3個參數,目標字符串、模式和替換字符串。基本用法是將目標字符串中所有出現模式的地方替換為替換字符串。如:
print(string.gsub("Lua is cute","cute","great")) --輸出Lua is great
該函數還有可選的第4個參數,即實際替換的次數。
print(string.gsub("all lii","l","x",1)) --輸出axl lii
print(string.gsub("all lii","l","x",2)) --輸出axx lii
函數string.gsub還有另一個結果,即實際替換的次數。
count = select(2, string.gsub(str," "," ")) --輸出str中空格的數量
4). string.gmatch函數:
返回一個函數,通過這個返回的函數可以遍歷到一個字符串中所有出現指定模式的地方。如:
1 words = {}
2 s = "hello world"
3 for w in string.gmatch(s,"%a+") do
4 print(w)
5 words[#words + 1] = w
6 end
7 --輸出結果為:
8 --hello
9 --world
3. 模式:
下面的列表給出了Lua目前支持的模式元字符;
模式元字符 | 描述 |
. | 所有字符 |
%a | 字母 |
%c | 控制字符 |
%d | 數字 |
%l | 小寫字母 |
%p | 標點符號 |
%s | 空白字符 |
%u | 大寫字母 |
%w | 字母和數字字符 |
%x | 十六進制數字 |
%z | 內部表示為0的字符 |
這些元字符的大寫形式表示它們的補集,如%A,表示所有非字母字符。
print(string.gsub("hello, up-down!","%S",".")) --輸出hello..up.down. 4
上例中的4表示替換的次數。
除了上述元字符之外,Lua還提供了另外幾個關鍵字符。如:( ) . % + - * ? [ ] ^ $
其中%表示轉義字符,如%.表示點(.),%%表示百分號(%)。
方括號[]表示將不同的字符分類,即可創建出屬于自己的字符分類,如[%w_]表示匹配字符、數字和下劃線。
橫線(-)表示連接一個范圍,比如[0-9A-Z]
如果^字符在方括號內,如[^\n],表示除\n之外的所有字符,即表示方括號中的分類的補集。如果^不在方括號內,則表示以后面的字符開頭,$和它正好相反,表示以前面的字符結束。如:^Hello%d$,匹配的字符串可能為Hello1、Hello2等。
在Lua中還提供了4種用來修飾模式中的重復部分,如:+(重復1次或多次)、*(重復0次或多次)、-(重復0次或多次)和?(出現0或1次)。如:
print(string.gsub("one, and two; and three","%a+","word")) --輸出word, word word; word word
print(string.match("the number 1298 is even","%d+")) --輸出1298
星號(*)和橫線(-)的主要差別是,星號總是試圖匹配更多的字符,而橫線則總是試圖匹配最少的字符。
4. 捕獲(capture):
捕獲功能可根據一個模式從目標字符串中抽出匹配于該模式的內容。在指定捕獲是,應將模式中需要捕獲的部分寫到一對圓括號內。對于具有捕獲的模式,函數string.match會將所有捕獲到的值作為單獨的結果返回。即它會將目標字符串切成多個捕獲到的部分。如:
1 pair = "name = Anna"
2 key,value = string.match(pair,"(%a+)%s*=%s*(%a+)")
3 print(key,value) --輸出name anna
4
5 date = "Today is 2012-01-02"
6 y,m,d = string.match(date,"(%d+)\-(%d+)\-(%d+)")
7 print(y,m,d) --輸出2012 01 02
還可以對模式本身使用捕獲。即%1表示第一個捕獲,以此類推,%0表示整個匹配,如:
1 print(string.gsub("hello Lua","(.)(.)","%2%1")) --將相鄰的兩個字符對調,輸出為ehll ouLa
2 print(string.gsub("hello Lua!","%a","%0-%0")) --輸出為h-he-el-ll-lo-o L-Lu-ua-a!
5. 替換:
string.gsub函數的第三個參數不僅可以是字符串,也可以是函數或table,如果是函數,string.gsub會在每次找到匹配時調用該函數,調用時的參數就是捕獲到的內容,而該函數的返回值則作為要替換的字符串。當用一個table來調用時,string.gsub會用每次捕獲到的內容作為key,在table中查找,并將對應的value作為要替換的字符串。如果table中不包含這個key,那么string.gsub不改變這個匹配。如:
1 function expand(s)
2 return (string.gsub(s,"$(%w+)",_G))
3 end
4
5 name = "Lua"; status = "great"
6 print(expand("$name is $status, isn't it?")) --輸出 Lua is great, isn't it?
7 print(expand("$othername is $status, isn't it?")) --輸出 $othername is great, isn't it?
8
9 function expand2(s)
10 return (string.gsub(s,"$(%w+)",function(n) return tostring(_G[n]) end))
11 end
12
13 print(expand2("print = $print; a = $a")) --輸出 print = function: 002B77C0; a = nil