I/O庫(kù)為文件操作提供了兩種不同的模型,簡(jiǎn)單模型和完整模型。簡(jiǎn)單模型假設(shè)一個(gè)當(dāng)前輸入文件和一個(gè)當(dāng)前輸出文件,他的I/O操作均作用于這些文件。完整模型則使用顯式的文件句柄,并將所有的操作定義為文件句柄上的方法。
1. 簡(jiǎn)單模型:
I/O庫(kù)會(huì)將進(jìn)程標(biāo)準(zhǔn)輸入輸出作為其缺省的輸入文件和輸出文件。我們可以通過io.input(filename)和io.output(filename)這兩個(gè)函數(shù)來改變當(dāng)前的輸入輸出文件。
1). io.write函數(shù):
函數(shù)原型為io.write(...)。該函數(shù)將所有參數(shù)順序的寫入到當(dāng)前輸出文件中。如:
io.write("hello","world") --寫出的內(nèi)容為helloworld
2). io.read函數(shù):
下表給出了該函數(shù)參數(shù)的定義和功能描述:
參數(shù)字符串 | 含義 |
"*all" | 讀取整個(gè)文件 |
"*line" | 讀取下一行 |
"*number" | 讀取一個(gè)數(shù)字 |
<num> | 讀取一個(gè)不超過<num>個(gè)字符的字符串 |
調(diào)用io.read("*all")會(huì)讀取當(dāng)前輸入文件的所有內(nèi)容,以當(dāng)前位置作為開始。如果當(dāng)前位置處于文件的末尾,或者文件為空,那個(gè)該調(diào)用返回一個(gè)空字符串。由于Lua可以高效的處理長(zhǎng)字符串,因此在Lua中可以先將數(shù)據(jù)從文件中完整讀出,之后在通過Lua字符串庫(kù)提供的函數(shù)進(jìn)行各種處理。
調(diào)用io.read("*line")會(huì)返回當(dāng)前文件的下一行,但不包含換行符。當(dāng)?shù)竭_(dá)文件末尾時(shí),該調(diào)用返回nil。如:
1 for count = 1,math.huge do
2 local line = io.read("*line") --如果不傳參數(shù),缺省值也是"*line"
3 if line == nil then
4 break
5 end
6 io.write(string.format("%6d ",count),line,"\n")
7 end
如果只是為了迭代文件中的所有行,可以使用io.lines函數(shù),以迭代器的形式訪問文件中的每一行數(shù)據(jù),如:
1 local lines = {}
2 for line in io.lines() do --通過迭代器訪問每一個(gè)數(shù)據(jù)
3 lines[#lines + 1] = line
4 end
5 table.sort(lines) --排序,Lua標(biāo)準(zhǔn)庫(kù)的table庫(kù)提供的函數(shù)。
6 for _,l in ipairs(lines) do
7 io.write(l,"\n")
8 end
調(diào)用io.read("*number")會(huì)從當(dāng)前輸入文件中讀取一個(gè)數(shù)字。此時(shí)read將直接返回一個(gè)數(shù)字,而不是字符串。"*number"選項(xiàng)會(huì)忽略數(shù)字前面所有的空格,并且能處理像-3、+5.2這樣的數(shù)字格式。如果當(dāng)前讀取的數(shù)據(jù)不是合法的數(shù)字,read返回nil。在調(diào)用read是可以指定多個(gè)選項(xiàng),函數(shù)會(huì)根據(jù)每個(gè)選項(xiàng)參數(shù)返回相應(yīng)的內(nèi)容。如:
1 --[[
2 6.0 -3.23 1000
3 ... ...
4 下面的代碼讀取注釋中的數(shù)字
5 --]]
6 while true do
7 local n1,n2,n3 = io.read("*number","*number","*number")
8 if not n1 then
9 break
10 end
11 print(math.max(n1,n2,n3))
12 end
調(diào)用io.read(<num>)會(huì)從輸入文件中最多讀取n個(gè)字符,如果讀不到任何字符,返回nil。否則返回讀取到的字符串。如:
1 while true do
2 local block = io.read(2^13)
3 if not block then
4 break
5 end
6 io.write(block)
7 end
io.read(0)是一種特殊的情況,用于檢查是否到達(dá)了文件的末尾。如果沒有到達(dá),返回空字符串,否則nil。
2. 完整I/O模型:
Lua中完整I/O模型的使用方式非常類似于C運(yùn)行時(shí)庫(kù)的文件操作函數(shù),它們都是基于文件句柄的。
1). 通過io.open函數(shù)打開指定的文件,并且在參數(shù)中給出對(duì)該文件的打開模式,其中"r"表示讀取,"w"表示覆蓋寫入,即先刪除文件原有的內(nèi)容,"a"表示追加式寫入,"b"表示以二進(jìn)制的方式打開文件。在成功打開文件后,該函數(shù)將返回表示該文件的句柄,后面所有基于該文件的操作,都需要將該句柄作為參數(shù)傳入。如果打開失敗,返回nil。其中錯(cuò)誤信息由該函數(shù)的第二個(gè)參數(shù)返回,如:
assert(io.open(filename,mode)) --如果打開失敗,assert將打印第二個(gè)參數(shù)給出的錯(cuò)誤信息。
2). 文件讀寫函數(shù)read/write。這里需要用到冒號(hào)語(yǔ)法,如:
1 local f = assert(io.open(filename,"r"))
2 local t = f:read("*all") --對(duì)于read而言,其參數(shù)完全等同于簡(jiǎn)單模型下read的參數(shù)。
3 f:close()
此外,I/O庫(kù)還提供了3個(gè)預(yù)定義的文件句柄,即io.stdin(標(biāo)準(zhǔn)輸入)、io.stdout(標(biāo)準(zhǔn)輸出)、io.stderr(標(biāo)準(zhǔn)錯(cuò)誤輸出)。如:
io.stderr:write("This is an error message.")
事實(shí)上,我們也可以混合使用簡(jiǎn)單模式和完整模式,如:
1 local temp = io.input() --將當(dāng)前文件句柄保存
2 io.input("newInputfile") --打開新的輸入文件
3 io.input():close() --關(guān)閉當(dāng)前文件
4 io.input(temp) --恢復(fù)原來的輸入文件
3). 性能小技巧:
由于一次性讀取整個(gè)文件比逐行讀取要快一些,但對(duì)于較大的文件,這樣并不可行,因此Lua提供了一種折中的方式,即一次讀取指定字節(jié)數(shù)量的數(shù)據(jù),如果當(dāng)前讀取中的最后一行不是完整的一行,可通過該方式將該行的剩余部分也一并讀入,從而保證本次讀取的數(shù)據(jù)均為整行數(shù)據(jù),以便于上層邏輯的處理。如:
local lines,rest = f:read(BUFSIZE,"*line") --rest變量包含最后一行中沒有讀取的部分。
下面是Shell中wc命令的一個(gè)簡(jiǎn)單實(shí)現(xiàn)。
1 local BUFSIZE = 8192
2 local f = io.input(arg[1]) --打開輸入文件
3 local cc, lc, wc, = 0, 0, 0 --分別計(jì)數(shù)字符、行和單詞
4 while true do
5 local lines,rest = f:read(BUFSIZE,"*line")
6 if not lines then
7 break
8 end
9 if rest then
10 lines = lines .. rest .. "\n"
11 end
12 cc = cc + #lines
13 --計(jì)算單詞數(shù)量
14 local _, t = string.gsub(lines."%S+","")
15 wc = wc + t
16 --計(jì)算行數(shù)
17 _,t = string.gsub(line,"\n","\n")
18 lc = lc + t
19 end
20 print(lc,wc,cc)
4). 其它文件操作:
如io.flush函數(shù)會(huì)將io緩存中的數(shù)據(jù)刷新到磁盤文件上。io.close函數(shù)將關(guān)閉當(dāng)前打開的文件。io.seek函數(shù)用于設(shè)置或獲取當(dāng)前文件的讀寫位置,其函數(shù)原型為f:seek(whence,offset),如果whence的值為"set",offset的值則表示為相對(duì)于文件起始位置的偏移量。如為"cur"(默認(rèn)值),offset則為相對(duì)于當(dāng)前位置的偏移量,如為"end",則為相對(duì)于文件末尾的偏移量。函數(shù)的返回值與whence參數(shù)無關(guān),總是返回文件的當(dāng)前位置,即相對(duì)于文件起始處的偏移字節(jié)數(shù)。offset的默認(rèn)值為0。如:
1 function fsize(file)
2 local current = file:seek() --獲取當(dāng)前位置
3 local size = file:seek("end") --獲取文件大小
4 file:seek("set",current) --恢復(fù)原有的當(dāng)前位置
5 return size
6 end
最后需要指出的是,如果發(fā)生錯(cuò)誤,所有這些函數(shù)均返回nil和一條錯(cuò)誤信息。