Amoeba for MySQL 位于Client、Database Server(s)之間,具有負載均衡、高可用性、sql過濾、可承受高并發、讀寫分離、Query Route(解析sql query語句,并且根據條件與預先設定的規則,請求到指定的目標數據庫。可并發請求多臺數據庫合并結果)、對客戶端透明,能降低數據切分帶來的復雜多數據庫結構、數據切分規則給應用帶來的影響。適用mysql 4.1或者以上版本(mysql 協議版本:10)暫時不支持事務、DDL語句目前只會分配給默認的數據庫執行,運行環境至少需要運行 mysql 4.1以上服務, Java 1.5或以上版本。
Amoeba與mysql proxy存在一些區別。在mysql proxy上面如果想要讀寫分離并且讀集群、寫集群機器比較多情況下,用mysql proxy 需要自己寫一個LUA腳本,目前mysql proxy沒有現成的比較好的lua腳本。amoeba只需要進行相關的配置就可以滿足需求。
一、Mysql Master/Slave 結構之下的讀寫分離:
Master: serverM (主庫,接收寫操作)
slaves:serverA、serverB、serverC(3個輔庫,只讀操作)
amoeba提供讀寫分離pool相關配置,可配置serverA、serverB、serverC形成一個虛擬的virtualSlave,該配置提供LB,failover/failbackup功能.
<dbServer name="virtualSlave" virtual="true">
<poolConfig>
<className>com.meidusa.amoeba.server.MultipleServerPool</className>
<!-- 負載均衡參數 1=ROUNDROBIN , 2=WEIGHTBASED -->
<property name="loadbalance">1</property>
<!-- 參與該pool負載均衡的poolName列表以逗號分割 -->
<property name="poolNames">serverA,serverB,serverC</property>
</poolConfig>
</dbServer>
<dbServer name="virtualSlave" virtual="true">
<poolConfig>
<className>com.meidusa.amoeba.server.MultipleServerPool</className>
<!-- 負載均衡參數 1=ROUNDROBIN , 2=WEIGHTBASED -->
<property name="loadbalance">1</property>
<!-- 參與該pool負載均衡的poolName列表以逗號分割 -->
<property name="poolNames">serverA,serverB,serverC</property>
</poolConfig>
</dbServer>
如果不啟用數據切分功能,那么只需要配置QueryRouter屬性
wirtePool=serverM
readPool=virtualSlave
<queryRouter>
<className>com.meidusa.amoeba.mysql.parser.MysqlQueryRouter</className>
<property name="LRUMapSize">1500</property>
<property name="defaultPool">serverM</property>
<property name="writePool">serverM</property>
<property name="readPool">virtualSlave</property>
<property name="needParse">true</property>
</queryRouter>
<queryRouter>
<className>com.meidusa.amoeba.mysql.parser.MysqlQueryRouter</className>
<property name="LRUMapSize">1500</property>
<property name="defaultPool">serverM</property>
<property name="writePool">serverM</property>
<property name="readPool">virtualSlave</property>
<property name="needParse">true</property>
</queryRouter>
client發送過來的update/insert/delete語句被發送到wirtePool,將select語句發送到readPool機器執行。
二、數據切分方面:
這方面amoeba顯然也很容易,舉個數據切分例子:
select * from user_event where user_id='test' and gmt_create between Sysdate() -1 and Sysdate()
如果根據gmt_create 時間進行數據切分,比如6個月進行切分一次,amoeba提供利用類似sql表達式進行數據切分:
規則1:GMT_CREATE > to_date('2008-01-01','yyyy-mm-dd') and GMT_CREATE < to_date('2008-05-31','yyyy-mm-dd')
規則1對應服務器1
規則2:GMT_CREATE > to_date('2008-06-01','yyyy-mm-dd') and GMT_CREATE < to_date('2008-12-31','yyyy-mm-dd')
規則2對應服務器2
上面的sql的條件 gmt_create 與規則里面的的gmt_create 進行交集判斷,如果存在交集則表示符合規則,則會將sql轉移到 規則1 的相應的服務器上面執行。
利用amoeba寫出這種類似規則很容易,但是要想做到數據切分以后可線性擴容,那么這樣的規則需要自己根據業務實際情況進行設置。amoeba可同時將 sql并發分發到多臺服務器、然后將結果合并再反饋給客戶端,而且amoeba內部采用無阻塞模式,工作線程是不會等待的,并發請求多臺 database server情況下,客戶端等待的時間基本上面是性能最差的那臺database server+amoeba內部解析協議時間。
中文文檔地址: http://amoeba.sourceforge.net/amoeba.pdf
amoeba 未來發展方向: http://amoeba.sourceforge.net/amoeba-big-picture.pdf
文件下載: http://www.sourceforge.net/projects/amoeba
amoeba 開發者博客: http://amoeba.meidusa.com