前幾天北京機(jī)房的奇數(shù)數(shù)據(jù)庫(kù)突然不工作了,經(jīng)過(guò)緊急調(diào)試后,發(fā)現(xiàn)是raid5中的一塊硬盤壞掉了,導(dǎo)致系統(tǒng)
啟動(dòng)失敗。啟動(dòng)緊急應(yīng)對(duì)方案,停掉主庫(kù),啟動(dòng)從庫(kù),讓從庫(kù)工作。
首先是在從庫(kù)上stop slave;
然后讓所有的數(shù)據(jù)代理指向從庫(kù),讓平臺(tái)正常運(yùn)營(yíng)。
經(jīng)過(guò)工程師維修后,主庫(kù)恢復(fù)正常,但不是很信任這臺(tái)機(jī)器了,準(zhǔn)備讓他做從庫(kù)使用,于是就來(lái)了一場(chǎng)主從切換的
實(shí)戰(zhàn)。
從庫(kù):
stop slave;
reset master;
reset slave;
show processlist;
show master status;
記住log以及pos。
主庫(kù):
reset master;
reset slave;
show processlist;
然后就是進(jìn)行change master的操作,讓主庫(kù)變成從庫(kù),并且讓他指向上面的從庫(kù)(后來(lái)的主庫(kù))。
最后 start slave;
為了確保切換是否順利,兩臺(tái)服務(wù)器上分別:
show processlist;
然后在從服務(wù)器上看看
show slave status;
看看是不是有crash的記錄,我這次就遇到了,通過(guò)清理數(shù)據(jù)庫(kù),然后重新同步后解決。
注意的是,要保證所有的serverid 不同。