4.1連接池知識簡介
總所周知建立數據庫連接是一個非常耗時耗資源的行為,因此現代的Web中間件,無論是開源的Tomcat、 Jboss還是商業的websphere、weblogic都提供了數據庫連接池功能,可以毫不夸張的說,數據庫連接池性能的好壞,不同廠商對連接池有著 不同的實現,本文只介紹拜特公司使用較多的開源web中間件Tomcat中默認的連接池DBCP(DataBase connection pool)的使用。
4.2 Tomcat下配置連接池
下面以tomcat5.5.26為例來介紹如何配置連接池
1:需要的jar
在tomcat的安裝目錄common\lib下有一個naming-factory-dbcp.jar,這個是tomcat修改后的dbcp連接池實現,同時為了能夠正常運行,還需要commons-pool.jar。
2:建立context文件
進入到conf\Catalina\localhost新建一個上下文文件,文件的名稱既為將來要訪問是輸入url上下文名稱,例如我們建立一個名為btweb的文件內容如下:
<Context debug="0"docBase="D:\v10_workspace\build\WebRoot" reloadable="false">
<Resource
name="jdbc/btdb1"
type="javax.sql.DataSource"
factory="org.apache.tomcat.dbcp.dbcp.BasicDataSourceFactory"
username="v10"
password="v10"
driverClassName="oracle.jdbc.driver.OracleDriver"
url="jdbc:oracle:thin:@127.0.0.1:1521:cahs"
maxActive="5"
maxIdle="3"
maxWait="5000"
removeAbandoned="true"
removeAbandonedTimeout="60"
testOnBorrow="true"
validationQuery="selectcount(*) from bt_user"
logAbandoned="true"
/>
</Context>
4.3參數分步介紹
u 數據庫連接相關
username="v10"
password="v10"
driverClassName="oracle.jdbc.driver.OracleDriver"
url="jdbc:oracle:thin:@127.0.0.1:1521:cahs"
u jndi相關
name="jdbc/btdb1"
type="javax.sql.DataSource"
factory="org.apache.tomcat.dbcp.dbcp.BasicDataSourceFactory"
factory默認是org.apache.tomcat.dbcp.dbcp.BasicDataSourceFactory,tomcat也允許采用其他連接實現,不過默認使用dbcp。
u 連接數控制與連接歸還策略
maxActive="5"
maxIdle="3"
minIdle=”2”
maxWait="5000"
u 應對網絡不穩定的策略
testOnBorrow="true"
validationQuery="selectcount(*) from bt_user"
u 應對連接泄漏的策略
removeAbandoned="true"
removeAbandonedTimeout="60"
logAbandoned="true"
如下圖所示:連接池處于應用程序與數據庫之間,一方面應用程序通過它來獲取連接,歸還連接,另一方面連接又需要從數據里獲取連接,歸還連接。
步驟1:系統啟動
系統啟動時,初始化連接池,由于沒有任何請求連接池中連接數為0。
maxActive="5"
表 示并發情況下最大可從連接池中獲取的連接數。如果數據庫不是單獨,供一個應用使用,通過設置maxActive參數可以避免某個應用無限制的獲取連接對其 他應用造成影響,如果一個數據庫只是用來支持一個應用那么maxActive理論上可以設置成該數據庫可以支撐的最大連接數。maxActive只是表示 通過連接池可以并發的獲取的最大連接數。
從圖上我們可以看到連接的獲取與釋放是雙向,當應用程序并發請求連接池時,連接池就需要從數據庫獲 取連接,那么但應用程序使用完連接并將連接歸還給連接池時,連接池是否也同時將連接歸還給數據庫呢?很顯然答案是否定的,如果那樣的話連接池就變得多此一 舉,不但不能提高性能,反而會降低性能,那么但應用成歸還連接后,連接池如何處理呢?
maxIdle="3"
如果在并發時達到了maxActive=5,那么連接池就必須從數據庫中獲取5個連接來供應用程序使用,當應用程序關閉連接后,由于maxIdle=3,因此并不是所有的連接都會歸還給數據庫,將會有3個連接保持在連接池種中,狀態為空閑。
minIdle=”2”
最小默認情況下并不生效,它的含義是當連接池中的連接少有minIdle,系統監控線程將啟動補充功能,一般情況下我們并不啟動補充線程。
問題:如何設置maxActive和maxIdle?
理 論上講maxActive應該設置成應用的最大并發數,這樣一來即便是在最大并發的情況下,應用依然能夠從連接池中獲取連接,但是困難時的是我們很難準確 估計到最大并發數,設置成最大并發數是一種最優的服務質量保證,事實上,如果某個用戶登錄提示系統繁忙,那么在他再次登錄時,可能系統資源已經充足,對于 拜特資金管理系統我們建議將maxActive設置為系統注冊人數的十分之一到二十分之一之間。例如系統的注冊人數為1000,那么設置成50-100靠近100的數字,例如85或90。
maxIdle對應的連接,實際上是連接池保持的長連接,這也是連接池發揮優勢的部分,理論上講保持較多的長連接,在應用請求時可以更快的響應,但是過多的連接保持,反而會消耗數據庫大量的資源,因此maxIdle也并不是越大越好,同上例我們建議將 maxIdle設置成
50-100中靠近50的數字,例如55。這樣就能在兼顧最大并發同時,保持較少的數據庫連接,而且在絕大多情況,能夠為應用程序提供最快的相應速度。
testOnBorrow="true"
validationQuery="selectcount(*) from bt_user"
我 們知道數據庫連接從本質上架構在tcp/ip連接之上,一般情況下web服務器與數據庫服務器都不在同一臺物理機器上,而是通過網絡進行連接,那么當建立 數據庫連接池的機器與數據庫服務器自己出現網絡異常時,保持在連接池中的連接將失效,不能夠在次使用,傳統的情況下只能通過重新啟動,再次建立連接,通過 設置以上兩個參數,但應用程序從連接池中獲取連接時,會首先進行活動性檢測,當獲取的連接是活動的時候才會給應用程序使用,如果連接失效,連接將釋放該連 接。validationQuery是一條測試語句,沒有實際意義,現實中,一般用一條最為簡單的查詢語句充當。
removeAbandoned="true"
removeAbandonedTimeout="60"
logAbandoned="true"
有時粗心的程序編寫者在從連接池中獲取連接使用后忘記了連接的關閉,這樣連池的連接就會逐漸達到maxActive直至連接池無法提供服務。現代連接池一般提供一種“智能”的檢查,但設置了removeAbandoned="true"時,當連接池連接數到達(getNumIdle() < 2) and (getNumActive() > getMaxActive() - 3)時便會啟動連接回收,那種活動時間超過removeAbandonedTimeout="60"的連接將會被回收,同時如果logAbandoned="true"設置為true,程序在回收連接的同時會打印日志。removeAbandoned是連接池的高級功能,理論上這中配置不應該出現在實際的生產環境,因為有時應用程序執行長事務,可能這種情況下,會被連接池誤回收,該種配置一般在程序測試階段,為了定位連接泄漏的具體代碼位置,被開啟,生產環境中連接的關閉應該靠程序自己保證。