電力研究院應用平臺是一個非常重要的應用平臺,對數據的可靠性和安全性具有極高的要求。通過與客戶協調,決定使用IBM Pserver小型機和IBM DS4300來搭建這個應用平臺的硬件部分。通過IBM AIX操作系統和HACMP 5.3來實現這個硬件平臺的高可用性。由于平臺只有一個應用程序,為了測試更加方便和直觀性,于是決定整個平臺為雙機熱備平臺。
整個平臺具有以下特點:
1. 應用同時運行在兩臺主機上,A機對外提供服務,B機做為備用機運行應用。
2. 在平臺中,如果網卡和網線出現問題,會及時切換平臺,保證平臺的應用性。
3. 在應用時,如果應用機(A機)突然斷電,應用程序會自動切換到備份機(B機)機器上。保證平臺的應用性
硬件平臺:
|
Hostname
|
配置
|
備注
|
主機1
|
P55A1/P55A Lpar1
|
2C/4G/2*146G/2*Fc/sa
|
|
主機2
|
P55A2/P55A Lpar1
|
2C/4G/2*146G/2*Fc/sa
|
|
磁盤陣列
|
DS4300 5*146GB (raid5)
|
軟件平臺:
名稱
|
描述
|
備注
|
IBM AIX
|
IBM AIX操作系統
|
|
IBM HA
|
IBM HACMP雙機應用軟件
|
|
現在整個硬件平臺已經架構好,可以安裝系統和配置HA軟件。以為為配置步驟及注意事項:
1. 規劃整個平臺的資源
2. ip地址、hostname。
備注:整個平臺的Boot、sty、svrIP地址不能在同一個網段,否則HA不能接管
Cluster Name
|
P55Asvr
|
Node Name
|
P55A1
|
SvrIP
|
P55A2
|
IP Label
|
P55A1boot
|
P55A1stby
|
P55A1serv
|
P55A2boot
|
P55A2stby
|
Network Type
|
ether
|
ether
|
ether
|
ether
|
ether
|
Network Attribute
|
public
|
public
|
public
|
public
|
public
|
IP Address
|
192.168.10.11
|
192.168.100.101
|
192.168.1.12
|
192.168.10.10
|
192.168.100.100
|
Adapter Function
|
boot
|
stby
|
service
|
boot
|
stby
|
Adapter Name
|
1En
|
En1
|
|
En0
|
En1
|
3. HA模式規劃
Res. Grp. Name
|
Node Rel.
|
Part. Node Name
|
orapp
|
Cascading
|
P55A1 P55A2
|
4. 應用服務規劃
App Name
|
Start Script
|
Stop Script
|
P55Asvr
|
/usr/es/sbin/cluster/app/orastart
|
/usr/es/sbin/cluster/app/orastop
|
5. 資源組規劃
Res. Grp. Name
|
Service IP
|
|
Application Servers
|
P55Asvr
|
192.168.1.12
|
oravg
|
P55Asvr
|
實施步驟
1. 安裝操作系統,調整文件系統和交換空間
2. 配置ip地址,編寫/etc/hosts文件
3. 編寫.rhosts文件。拷貝到/usr/es/sbin/cluster/etc/rhosts,修改root limits權限
chuser fsize=-1 core=-1 data=-1 stack=-1 rss=-1 nofiles=-1 root
4. 查看是否安裝 bos.adt.libm 5.3.0.10 bos.adt.syscalls 5.3.0.10 rsct.compat.basic.hacmp 2.4.2.0 rsct.compat.clients.hacmp 2.4.2.0 oracleIY58143 補丁:bos.adt.prof,bos.cifs_fs.rte
5. 安裝ha 5.3,重新啟動系統(注意不要安裝clvm和pssp包)。確保其他的補丁安裝成功
6. 添加tty設備,確保能夠夠正常通信。1.stty < /dev/tty0 2.stty < /dev/tty0
7. 配置vg
8. # smitty chgsys 設定如下參數為
maximum number of processes allowed per user 2048
HIGH water mark for pending write I/Os per file(32)
LOW water mark for pending write I/Os per file(24)
9. 創建/usr/es/sbin/cluster/app/orastart,orastop文本
10. 查看集群通信守候進程
分別查看 2 個機器上的/etc/inittab 文件的最后幾行是否包含以下部分:
clcomdES:2:once:startsrc -s clcomdES >/dev/console 2>&1
主要用于啟動Cluster Communications Daemon (clcomd),這也是在配置HACMP
時,運行自動發現過程所需要的
11. HACMP詳細配置 在P55A1上 輸入
smitty hacmp
按回車
>
按回車

輸入群集名稱,因為這是測試,所以我輸入test,并輸入通訊地址,注意這里要 輸入2個boot地址,如果只輸入P55A1boot,那么就只能發現自身。按回車后將 運行自動發現過程

這里發現了2個節點P55A1,P55A2,6個接口,群集名稱為test等等
退回到主菜單,選擇Extended Configuration菜單

按回車,選擇Extended Topology Configuration

按回車,返回到Extended Topology Configuration菜單,并選擇Configure HACMP
communication Interfaces/devices按回車按回車,顯示已經發現的網絡

按回車

按回車


按回車,選擇心跳設備/dev/tty0,2個都要選擇

按回車

提示添加成功。 然后查看通信接口和設備
12. 返回到Extended Resource Configuration菜單

按回車

按回車

按回車

按回車,這里的腳本和應用程序名可以根據實際的情況來更改,但必須在2個節 點上位于相同的路徑,使用相同的名稱。

按回車

應用程序服務器添加完成。 下面我們可以顯示一下剛剛建立的應用程序服務器
13. 退回到HACMP Extended Resources Configuration菜單,選擇配置服務IP標簽/ 地址

按回車

按回車

因為這是2個節點公用的服務IP標簽/地址,所以選擇Configurable on Multiple Nodes
按回車

選擇服務IP標簽/地址所在的網絡

通過按F4或ESC+4來選擇服務IP標簽/地址
按回車

這樣,服務IP標簽/地址就添加完成了
14. 返回到Extended Resource Configuration菜單

按回車

按回車

輸入資源組名稱和參與的節點,按回車

這樣就添加完成資源組了。 下面就是更改資源組,包括添加服務IP地址和應用服務器名
15. 括服務IP標簽、應用程序服

按回車

因為,我沒有磁盤陣列,所以沒有配置共享卷組,另外,可以選擇Startup, Fallover和Fallback Timer策略
按回車

資源組修改完成
16. 返回到Extended Configuration菜單,進行驗證并同步

按回車
把automatically correct error found during verification 選為yes
把Force sysnchronization if verifyication faile 選為yes


OK和yes不一定就是完全成功的,你可以通過查找fail來確認有沒有錯誤。
到此整個HACMP配置完成。 這里比較遺憾的是,就是我沒有共享磁盤陣列,后來想通過iscsi來實現,最終 也沒有成功
<![endif]>17. <![endif]> 測試群集
啟動HACMP,在P55A1上,命令行下輸入smitty clstart,出現以下界面

按回車
18. 查看P55A1上的服務IP標簽/地址和群集服務

在P55A2上輸入smitty clstart,出現如下畫面

按回車

群集啟動完成
19. 查看P55A2上的接口地址和群集服務

在P55A1上停止群集,并選擇shutdown模式為takeover,這將切換服務IP標簽/ 地址

按回車

從win客戶端ping服務IP標簽/地址,在準備關閉P55A1節點的群集服務開始之前, 就應該在cmd下運行ping 192.168.1.12 –t,發現整個切換只斷了一下,這是因 為,我的測試環境很簡單,一般來說,像oracle服務的話,可能需要幾十秒鐘
然后再次查看P55A2上的接口地址和群集服務

可以看到服務IP標簽已經切換到了P55A2上。 下面測
20. 試網卡故障的情況
在win客戶端上ping 192.168.1.12 –t
再拔掉P55A2 boot網卡的網線

發現ping出現斷點,然后恢復。 再次查看P55A2上的接口地址,發現服務IP標簽/地址已經轉移到stdby網卡上, 表示切換成功

21. 上面如果測試完成后,說明雙機熱備已經安裝成功
備注:在這個方案中,需要注意一下幾點。
1. 兩臺機器的配置文件和參數要一致。
2. <![endif]> 中心跳線是否能夠通信
3. <![endif]> 最重要的是和客戶溝通好準備工作,否則實施起來很會麻煩
4. <![endif]> Shutdown 加上參數是不能讓運行應用的機器釋放資源的,是不能夠接管的