為了提高性能,幾乎所有互聯網應用都有緩存機制,其中Memcache是使用非常廣泛的一個分布式緩存系統。眾所周知,LAMP是非常經典的Web架構方式,但是隨著Nginx的成熟,越來越多的系統開始轉型為LNMP(Linux+Nginx+MySQL+PHP with fpm),這是因為Nginx采用基于事件機制的I/O多路復用思想設計,在高并發情況下其性能遠遠優于默認采用prefork模式的Apache,另外,相對于Apache,Nginx更輕量,同時擁有大量優秀的擴展模塊,使得在Nginx上可以實現一些美妙的功能。
傳統上,PHP中使用memcache的方法是使用php-memcache或php-memached擴展操作memcache,然而在Nginx上有構建更高效緩存機制的方法,本文將首先介紹這種機制,然后介紹具體的操作步驟方法,最后將對這種機制和傳統的PHP操作memcache的性能進行一個benchmark。
Nginx的Memc和SR Cache模塊
緩存策略的改進
我們知道,Nginx的核心設計思想是事件驅動的非阻塞I/O。Nginx被設計為可以配置I/O多路復用策略,在Unix系統中傳統的多路復用是采用select或poll,但是這兩個方法的問題是隨著監聽socket的增加,性能會下降,因為在linux內核中是采用輪詢的方式判斷是否可以觸發事件,換句話說算法的復雜度為O(N),而在較新的linux內核中引入了復雜度為O(1)的epoll,因此Nginx在Linux下默認采用epoll,而在FreeBSD下默認采用kqueue作為I/O策略。
即便是這樣,傳統的緩存策略仍可能造成效率低下,因為傳統上是通過PHP操作memcache的,要執行PHP代碼,Nginx就必然要和FastCGI通信,同時也要進入PHP的生命周期,因此SAPI、PHP Core和Zend Engine的一系列邏輯會被執行。更糟糕的是,fpm和PHP可能會阻塞,因此破壞了Nginx的非阻塞性。下圖展示了在memcache命中時整個處理過程。
可以看到,即使memcache命中,還是要進入PHP的生命周期。我們知道,目前很多互聯網應用都使用RESTful規范進行設計,在RESTful應用下,普遍使用uri和查詢參數作為緩存的key,因此一種更高效的緩存策略是Nginx直接訪問memcache,并用$uri和$args等Nginx內置變量設定緩存key規則,這樣,當緩存命中時,Nginx可以跳過通過fastcgi和PHP通信的過程,直接從memcache中獲取數據并返回。memc-nginx和srcache-nginx正是利用這種策略提高了緩存的效率。下圖是這種高效緩存策略的示意圖(當memcache命中時)。

模塊介紹
memc-nginx和srcache-nginx模塊均為前淘寶工程師agentzh(章亦春)開發。其中memc模塊擴展了Nginx標準的memcache模塊,增加了set、add、delete等memcache命令,而srcache則是為location增加了透明的基于subrequest的緩存層。兩者配合使用,可以實現上一節提到的高效緩存機制。關于兩個模塊的詳細信息可以參考它們Nginx官網的wiki(memc wiki,srcache wiki)頁。
安裝及配置
下面以LNMP環境介紹如何使用這兩個模塊構建緩存層。
因為Nginx并不支持模塊動態加載,所以要安裝新的模塊,必須重新編譯Nginx。首先下載兩個模塊(memc下載地址,srcache下載地址),另外,為了發揮出緩存的最大性能,建議將memcache的upstream配置為keep-alive,為了支持upstream的keep-alive需要同時安裝http-upstream-keepalive-module。
將模塊下載并解壓到合適的目錄,這里我Nginx使用的版本是1.0.4,與相關模塊一起解壓到了/home/zhangyang/downloads,如下圖所示。

其中紅框框起來的是我們需要用到的模塊。進入nginx目錄,執行下列命令:
./configure --prefix=/usr/local/nginx --add-module=../memc-nginx-module --add-module=../srcache-nginx-module --add-module=../ngx_http_upstream_keepalive
make
make install
這里我將nginx安裝到/usr/local/nginx下,你可以根據自己的需要更改安裝路徑,另外,我只列出了本文必要的configure命令,你也可以增加需要的configure選項。
然后需要對nginx進行配置,nginx默認主配置文件放在安裝目錄的conf下,例如我的主配置文件為/usr/local/nginx/conf/nginx.conf。
這里我只貼出相關的配置:
#Memcache服務upstream
upstream memcache {
server localhost:11211;
keepalive 512 single;
}
server {
listen 80;
server_name localhost;
#memc-nginx-module
location /memc {
internal;
memc_connect_timeout 100ms;
memc_send_timeout 100ms;
memc_read_timeout 100ms;
set $memc_key $query_string;
set $memc_exptime 300;
memc_pass memcache;
}
location / {
root /var/www;
index index.html index.htm index.php;
}
# pass the PHP scripts to FastCGI server listening on 127.0.0.1:9000
#
location ~ \.php$ {
charset utf-8;
default_type text/html;
#srcache-nginx-module
set $key $uri$args;
srcache_fetch GET /memc $key;
srcache_store PUT /memc $key;
root /var/www;
fastcgi_pass 127.0.0.1:9000;
fastcgi_index index.php;
include fastcgi_params;
fastcgi_param SCRIPT_FILENAME $document_root$fastcgi_script_name;
}
}
下面解釋一下其中幾個點。
上文說過,memc-nginx是一個標準的upstream模塊,因此首先需要定義memcache的upstream。這里我在本機上啟動了一個memcache服務,端口為默認的11211,keepalive指令是http-upsteram-keepalive-module提供的功能,這里我們最大保持512個不立即關閉的連接用于提升性能。
下面是為memc-nginx-module配置location,我們配置為/memc,所有請求都通過請求這個location來操作memcache,memc-nginx-module存取memcache是基于http method語義的,使用http的GET方法表示get、PUT方法表示set、DELETE方法表示delete。這里我們將/memc設為internal表示只接受內部訪問,不接收外部http請求,這是為了安全考慮,當然如果需要通過http協議開放外部訪問,可以去掉internal然后使用deny和allow指令控制權限。比較重要的是$memc_key這個變量,它表示以什么作為key,這里我們直接使用Nginx內置的$query_string來作為key,$memc_exptime表示緩存失效時間,以秒記。這里統一設為300(5分鐘),在實際應用中可以根據具體情況為不同的內容設置不同的過期時間。
最后我們為“~ \.php$”這個location配置了緩存,這表示所有以“.php”結尾的請求都會結果被緩存,當然這里只是示例需要,實際中一般不會這么配,而是為特定需要緩存的location配置緩存。
srcache_fetch表示注冊一個輸入攔截處理器到location,這個配置將在location進入時被執行;而srcache_store表示注冊一個輸出攔截器到location,當location執行完成并輸出時會被執行。注意srcache模塊實際可以與任何緩存模塊進行配合使用,而不必一定是memc。這里我們以$uri$args作為緩存的key。
經過上述配置后,相當于對Nginx增加了如下邏輯:當所請求的uri以“.php”結尾時,首先到memcache中查詢有沒有以$uri$args為key的數據,如果有則直接返回;否則,執行location的邏輯,如果返回的http狀態碼為200,則在輸出前以$uri$args為key,將輸入結果存入memcache。
更多配置
上一節給出了使用memc和srcache構建緩存層的最基本方法,實際應用中可能需要更多靈活的配置,例如為不同的location配置不同的緩存參數,根據返回內容而不是返回的http狀態碼確定是否緩存等等。可以有很多的方法實現這些需求,例如,srcache還支持兩個指令:srcache_fetch_skip和srcache_fetch_skip,這兩個指令接受一個參數,當參數已定義且非0時,則進行相應操作,否則不進行。例如,如果配置了srcache_fetch_skip $skip,這條指令,那么只有當$skip的值為非0時,才將結果緩存,如果配合ngx_lua模塊的set_by_lua指令,則可以實現復雜的緩存控制。如:
location /xxxx {
set $key ...;
set_by_lua $skip '
if ngx.var.cookie_foo == "bar" then
return 1
end
return 0
';
srcache_fetch_skip $skip;
srcache_store_skip $skip;
srcache_fetch GET /memc $key;
srcache_store GET /memc $key;
# proxy_pass/fastcgi_pass/...
}
這表示對/xxxx這個location的訪問,只有存在cookie “foo”且值為“bar”時緩存機制才起作用。關于ngx_lua的更多內容請參考其主頁。
另外,我最近在春哥(章亦春在淘寶的昵稱)的微博上看到他目前正在完善srcache的功能,為其實現更多RFC2616的緩存行為標準。關于這個模塊的最新動態可以關注其github主頁。
Benchmark
下面對使用memc和srcache構建的緩存機制進行一個簡單的benchmark,并與使用PHP操作memcache的策略進行一個對比。為了簡單起見,我們的測試PHP腳本不去訪問I/O,而僅僅是調用phpinfo函數輸出PHP相關信息。
測試一共分三組進行:第一組在Nginx和PHP中均不開啟緩存,第二組僅使用PHP memcache緩存,第三組僅使用Nginx memcache緩存。三組都用ab程序去壓,并發數為20,請求次數為10000。
這里的測試環境是我的一個虛擬機,操作系統為Ubuntu10,內存512M。Nginx采用epoll,單worker進程,memcache最大并發數為1024,最大使用內存64m。
不開啟緩存
這一組我們不開啟緩存,PHP程序非常簡單:
測試結果如下:

PHP memcache緩存策略
第二組我們用PHP操作緩存,測試腳本為:
<?php
$memc = new Memcached;
$memc->addServer('localhost', 11211) or die('Connect to memcache server failed!');
$output = $memc->get('my_key');
if(empty($output))
{
ob_start();
phpinfo();
$output = ob_get_contents();
ob_end_clean();
$memc->set('my_key', $output, 300);
}
echo $output;*/
?>
測試結果如下:

Nginx memcache緩存策略
最后,我們將PHP腳本回歸到不使用緩存的版本,并配置好memc和srcache緩存機制。測試結果如下:

結果對比分析
為了直觀,我取“每秒處理請求數”、“平均每個請求處理時間”和“吞吐率”作為評價指標,制作了一張圖表。

我想看到圖表,結論已毋需我多言。在各項指標上使用memc和srcache構建的緩存機制都大大優于使用PHP操作memcache。其中每秒處理請求數(并發度)和吞吐率都是其9倍左右,而平均個請求所用時間僅有傳統策略的1/8。
這里要特別說明一下,這里之所以PHP memcache策略比不使用緩存優勢不明顯,是因為我們的PHP腳本不涉及I/O操作,如果其中存在如數據庫存取,PHP memcache的優勢還是有的,但不論如何,Nginx memcache策略在性能上的優勢是其無法比擬的。
另外,除了性能優勢外,使用這種策略還可以簡化PHP邏輯,因為緩存這一層都放在Nginx中了,PHP就從緩存操作中解放了出來,因此是一舉多得。
如果你的系統也構建在LNMP上(或LAMP)上,不妨使用本文提到的方法替代傳統的緩存策略,盡情享受性能上的提升。
本文轉載自 http://www.cnblogs.com/leoo2sk/archive/2011/10/02/nginx-memc-and-srcache.html
posted on 2011-10-09 09:42
日需博客 閱讀(1528)
評論(1) 編輯 收藏 引用 所屬分類:
Linux 、
技術文章 、
轉載