先來看看不帶緩存的I/O和標準(帶緩存的)I/O都有那些
不帶緩存的I/O: read,write,open......
標準(帶緩存的)I/O: fgets,fread,fwrite.....
這里使用兩個對應的函數進行比較:
ssize_t write(int filedes, const void *buff, size_t nbytes)
size_t fwrite(const void *ptr, size_t size, size_t nobj, FILE *fp)
上面的buff和ptr都是指應用程序自己使用的buffer,實際上當需要對文件進行寫操作時,都會先寫到內核所設的緩沖存儲器。如果該緩存未滿,則并不將其排入輸出隊列,直到緩存寫滿或者內核再次需要重新使用此緩存時才將其排入磁盤I/O輸入隊列,再進行實際的I/O操作,也就是此時才把數據真正寫到磁盤,這種技術叫延遲寫。
如果我們直接用非緩存I/O對內核的緩沖區進行讀寫,會產生許多管理不善而造成的麻煩(如一次性寫入過多,或多次系統調用導致的效率低下)。
標準(帶緩存的)I/O為我們解決了這些問題,它處理很多細節,如緩沖區分配,以優化長度執行I/O等,更便于我們使用。
由于標準(帶緩存的)I/O在系統調用的上一層多加了一個緩沖區,也因此引入了流的概念,在UNIX/Linux下表示為FILE*(并不限于UNIX/Linux,ANSI C都有FILE的概念),FILE實際上包含了為管理流所需要的所有信息:實際I/O的文件描述符,指向流緩存的指針(標準I/O緩存,由malloc分配,又稱為用戶態進程空間的緩存,區別于內核所設的緩存),緩存長度,當前在緩存中的字節數,出錯標志等。
因此可知,不帶緩存的I/O對文件描述符操作,帶緩存的標準I/O是針對流的。
標準I/O對每個I/O流自動進行緩存管理(標準I/O函數通常調用malloc來分配緩存)。它提供了三種類型的緩存:
1) 全緩存。當填滿標準I/O緩存后才執行I/O操作。磁盤上的文件通常是全緩存的。
2) 行緩存。當輸入輸出遇到新行符或緩存滿時,才由標準I/O庫執行實際I/O操作。stdin、stdout通常是行緩存的。
3) 無緩存。相當于read、write了。stderr通常是無緩存的,因為它必須盡快輸出。
一般而言,由系統選擇緩存的長度,并自動分配。標準I/O庫在關閉流的時候自動釋放緩存。另外,也可以使用函數fflush()將流所有未寫的數據送入(刷新)到內核(內核緩沖區),fsync()將所有內核緩沖區的數據寫到文件(磁盤)。
在標準I/O庫中也有引入緩存管理而帶來的缺點--效率問題。例如當使用每次一行函數fgets和fputs時,通常需要復制兩次數據:一次是在內核和標準I/O緩存之間(當調用read和write時),第二次是在標準I/O緩存(通常系統分配和管理)和用戶程序中的行緩存(fgets的參數就需要一個用戶行緩存指針)之間。