電力研究院應(yīng)用平臺(tái)是一個(gè)非常重要的應(yīng)用平臺(tái),對(duì)數(shù)據(jù)的可靠性和安全性具有極高的要求。通過與客戶協(xié)調(diào),決定使用IBM Pserver小型機(jī)和IBM DS4300來搭建這個(gè)應(yīng)用平臺(tái)的硬件部分。通過IBM AIX操作系統(tǒng)和HACMP 5.3來實(shí)現(xiàn)這個(gè)硬件平臺(tái)的高可用性。由于平臺(tái)只有一個(gè)應(yīng)用程序,為了測試更加方便和直觀性,于是決定整個(gè)平臺(tái)為雙機(jī)熱備平臺(tái)。
整個(gè)平臺(tái)具有以下特點(diǎn):
1. 應(yīng)用同時(shí)運(yùn)行在兩臺(tái)主機(jī)上,A機(jī)對(duì)外提供服務(wù),B機(jī)做為備用機(jī)運(yùn)行應(yīng)用。
2. 在平臺(tái)中,如果網(wǎng)卡和網(wǎng)線出現(xiàn)問題,會(huì)及時(shí)切換平臺(tái),保證平臺(tái)的應(yīng)用性。
3. 在應(yīng)用時(shí),如果應(yīng)用機(jī)(A機(jī))突然斷電,應(yīng)用程序會(huì)自動(dòng)切換到備份機(jī)(B機(jī))機(jī)器上。保證平臺(tái)的應(yīng)用性
硬件平臺(tái):
|
Hostname
|
配置
|
備注
|
主機(jī)1
|
P55A1/P55A Lpar1
|
2C/4G/2*146G/2*Fc/sa
|
|
主機(jī)2
|
P55A2/P55A Lpar1
|
2C/4G/2*146G/2*Fc/sa
|
|
磁盤陣列
|
DS4300 5*146GB (raid5)
|
軟件平臺(tái):
名稱
|
描述
|
備注
|
IBM AIX
|
IBM AIX操作系統(tǒng)
|
|
IBM HA
|
IBM HACMP雙機(jī)應(yīng)用軟件
|
|
現(xiàn)在整個(gè)硬件平臺(tái)已經(jīng)架構(gòu)好,可以安裝系統(tǒng)和配置HA軟件。以為為配置步驟及注意事項(xiàng):
1. 規(guī)劃整個(gè)平臺(tái)的資源
2. ip地址、hostname。
備注:整個(gè)平臺(tái)的Boot、sty、svrIP地址不能在同一個(gè)網(wǎng)段,否則HA不能接管
Cluster Name
|
P55Asvr
|
Node Name
|
P55A1
|
SvrIP
|
P55A2
|
IP Label
|
P55A1boot
|
P55A1stby
|
P55A1serv
|
P55A2boot
|
P55A2stby
|
Network Type
|
ether
|
ether
|
ether
|
ether
|
ether
|
Network Attribute
|
public
|
public
|
public
|
public
|
public
|
IP Address
|
192.168.10.11
|
192.168.100.101
|
192.168.1.12
|
192.168.10.10
|
192.168.100.100
|
Adapter Function
|
boot
|
stby
|
service
|
boot
|
stby
|
Adapter Name
|
1En
|
En1
|
|
En0
|
En1
|
3. HA模式規(guī)劃
Res. Grp. Name
|
Node Rel.
|
Part. Node Name
|
orapp
|
Cascading
|
P55A1 P55A2
|
4. 應(yīng)用服務(wù)規(guī)劃
App Name
|
Start Script
|
Stop Script
|
P55Asvr
|
/usr/es/sbin/cluster/app/orastart
|
/usr/es/sbin/cluster/app/orastop
|
5. 資源組規(guī)劃
Res. Grp. Name
|
Service IP
|
|
Application Servers
|
P55Asvr
|
192.168.1.12
|
oravg
|
P55Asvr
|
實(shí)施步驟
1. 安裝操作系統(tǒng),調(diào)整文件系統(tǒng)和交換空間
2. 配置ip地址,編寫/etc/hosts文件
3. 編寫.rhosts文件。拷貝到/usr/es/sbin/cluster/etc/rhosts,修改root limits權(quán)限
chuser fsize=-1 core=-1 data=-1 stack=-1 rss=-1 nofiles=-1 root
4. 查看是否安裝 bos.adt.libm 5.3.0.10 bos.adt.syscalls 5.3.0.10 rsct.compat.basic.hacmp 2.4.2.0 rsct.compat.clients.hacmp 2.4.2.0 oracleIY58143 補(bǔ)丁:bos.adt.prof,bos.cifs_fs.rte
5. 安裝ha 5.3,重新啟動(dòng)系統(tǒng)(注意不要安裝clvm和pssp包)。確保其他的補(bǔ)丁安裝成功
6. 添加tty設(shè)備,確保能夠夠正常通信。1.stty < /dev/tty0 2.stty < /dev/tty0
7. 配置vg
8. # smitty chgsys 設(shè)定如下參數(shù)為
maximum number of processes allowed per user 2048
HIGH water mark for pending write I/Os per file(32)
LOW water mark for pending write I/Os per file(24)
9. 創(chuàng)建/usr/es/sbin/cluster/app/orastart,orastop文本
10. 查看集群通信守候進(jìn)程
分別查看 2 個(gè)機(jī)器上的/etc/inittab 文件的最后幾行是否包含以下部分:
clcomdES:2:once:startsrc -s clcomdES >/dev/console 2>&1
主要用于啟動(dòng)Cluster Communications Daemon (clcomd),這也是在配置HACMP
時(shí),運(yùn)行自動(dòng)發(fā)現(xiàn)過程所需要的
11. HACMP詳細(xì)配置 在P55A1上 輸入
smitty hacmp
按回車
>
按回車

輸入群集名稱,因?yàn)檫@是測試,所以我輸入test,并輸入通訊地址,注意這里要 輸入2個(gè)boot地址,如果只輸入P55A1boot,那么就只能發(fā)現(xiàn)自身。按回車后將 運(yùn)行自動(dòng)發(fā)現(xiàn)過程

這里發(fā)現(xiàn)了2個(gè)節(jié)點(diǎn)P55A1,P55A2,6個(gè)接口,群集名稱為test等等
退回到主菜單,選擇Extended Configuration菜單

按回車,選擇Extended Topology Configuration

按回車,返回到Extended Topology Configuration菜單,并選擇Configure HACMP
communication Interfaces/devices按回車按回車,顯示已經(jīng)發(fā)現(xiàn)的網(wǎng)絡(luò)

按回車

按回車


按回車,選擇心跳設(shè)備/dev/tty0,2個(gè)都要選擇

按回車

提示添加成功。 然后查看通信接口和設(shè)備
12. 返回到Extended Resource Configuration菜單

按回車

按回車

按回車

按回車,這里的腳本和應(yīng)用程序名可以根據(jù)實(shí)際的情況來更改,但必須在2個(gè)節(jié) 點(diǎn)上位于相同的路徑,使用相同的名稱。

按回車

應(yīng)用程序服務(wù)器添加完成。 下面我們可以顯示一下剛剛建立的應(yīng)用程序服務(wù)器
13. 退回到HACMP Extended Resources Configuration菜單,選擇配置服務(wù)IP標(biāo)簽/ 地址

按回車

按回車

因?yàn)檫@是2個(gè)節(jié)點(diǎn)公用的服務(wù)IP標(biāo)簽/地址,所以選擇Configurable on Multiple Nodes
按回車

選擇服務(wù)IP標(biāo)簽/地址所在的網(wǎng)絡(luò)

通過按F4或ESC+4來選擇服務(wù)IP標(biāo)簽/地址
按回車

這樣,服務(wù)IP標(biāo)簽/地址就添加完成了
14. 返回到Extended Resource Configuration菜單

按回車

按回車

輸入資源組名稱和參與的節(jié)點(diǎn),按回車

這樣就添加完成資源組了。 下面就是更改資源組,包括添加服務(wù)IP地址和應(yīng)用服務(wù)器名
15. 括服務(wù)IP標(biāo)簽、應(yīng)用程序服

按回車

因?yàn)椋覜]有磁盤陣列,所以沒有配置共享卷組,另外,可以選擇Startup, Fallover和Fallback Timer策略
按回車

資源組修改完成
16. 返回到Extended Configuration菜單,進(jìn)行驗(yàn)證并同步

按回車
把automatically correct error found during verification 選為yes
把Force sysnchronization if verifyication faile 選為yes


OK和yes不一定就是完全成功的,你可以通過查找fail來確認(rèn)有沒有錯(cuò)誤。
到此整個(gè)HACMP配置完成。 這里比較遺憾的是,就是我沒有共享磁盤陣列,后來想通過iscsi來實(shí)現(xiàn),最終 也沒有成功
<![endif]>17. <![endif]> 測試群集
啟動(dòng)HACMP,在P55A1上,命令行下輸入smitty clstart,出現(xiàn)以下界面

按回車
18. 查看P55A1上的服務(wù)IP標(biāo)簽/地址和群集服務(wù)

在P55A2上輸入smitty clstart,出現(xiàn)如下畫面

按回車

群集啟動(dòng)完成
19. 查看P55A2上的接口地址和群集服務(wù)

在P55A1上停止群集,并選擇shutdown模式為takeover,這將切換服務(wù)IP標(biāo)簽/ 地址

按回車

從win客戶端ping服務(wù)IP標(biāo)簽/地址,在準(zhǔn)備關(guān)閉P55A1節(jié)點(diǎn)的群集服務(wù)開始之前, 就應(yīng)該在cmd下運(yùn)行ping 192.168.1.12 –t,發(fā)現(xiàn)整個(gè)切換只斷了一下,這是因 為,我的測試環(huán)境很簡單,一般來說,像oracle服務(wù)的話,可能需要幾十秒鐘
然后再次查看P55A2上的接口地址和群集服務(wù)

可以看到服務(wù)IP標(biāo)簽已經(jīng)切換到了P55A2上。 下面測
20. 試網(wǎng)卡故障的情況
在win客戶端上ping 192.168.1.12 –t
再拔掉P55A2 boot網(wǎng)卡的網(wǎng)線

發(fā)現(xiàn)ping出現(xiàn)斷點(diǎn),然后恢復(fù)。 再次查看P55A2上的接口地址,發(fā)現(xiàn)服務(wù)IP標(biāo)簽/地址已經(jīng)轉(zhuǎn)移到stdby網(wǎng)卡上, 表示切換成功

21. 上面如果測試完成后,說明雙機(jī)熱備已經(jīng)安裝成功
備注:在這個(gè)方案中,需要注意一下幾點(diǎn)。
1. 兩臺(tái)機(jī)器的配置文件和參數(shù)要一致。
2. <![endif]> 中心跳線是否能夠通信
3. <![endif]> 最重要的是和客戶溝通好準(zhǔn)備工作,否則實(shí)施起來很會(huì)麻煩
4. <![endif]> Shutdown 加上參數(shù)是不能讓運(yùn)行應(yīng)用的機(jī)器釋放資源的,是不能夠接管的