山東電力建設(shè)某工程公司兩地三中心機(jī)房建設(shè)方案
山東電力建設(shè)某工程公司一直高度重視并不斷加強(qiáng)信息系統(tǒng)建設(shè)。在2008年較早建成同城數(shù)據(jù)中心的基礎(chǔ)上,為進(jìn)一步提高重大災(zāi)難風(fēng)險(xiǎn)防范能力,公司于2015年底啟動(dòng)異地?cái)?shù)據(jù)中心建設(shè),目標(biāo)是建成由A數(shù)據(jù)中心、B同城災(zāi)備中心、C異地災(zāi)備中心組成的“兩地三中心”整體容災(zāi)體系,為打造具有核心競爭優(yōu)勢的現(xiàn)代化金融服務(wù)企業(yè)奠定了堅(jiān)實(shí)的信息科技風(fēng)險(xiǎn)防范基礎(chǔ)。
一、“兩地三中心”布局規(guī)劃
山東電力建設(shè)某工程公司作為扎根山東、服務(wù)全球的國際電站EPC持續(xù)領(lǐng)導(dǎo)者,從風(fēng)險(xiǎn)防范和企業(yè)社會(huì)責(zé)任角度出發(fā),確定了“兩地三中心”整體布局規(guī)劃。針對“單數(shù)據(jù)中心”模式所存在的不足,進(jìn)一步提出實(shí)現(xiàn)“雙中心交替運(yùn)行”的管理目標(biāo),即單個(gè)災(zāi)備應(yīng)用系統(tǒng)(群)要具備切換到異地災(zāi)備中心持續(xù)運(yùn)行、再回切到生產(chǎn)中心的能力,以此提高異地災(zāi)備系統(tǒng)的利用率和異地災(zāi)備運(yùn)維人員的實(shí)戰(zhàn)能力。雙中心交替運(yùn)行體現(xiàn)了“平戰(zhàn)結(jié)合”的災(zāi)備建設(shè)和管理思路,通過生產(chǎn)和災(zāi)備系統(tǒng)的交替運(yùn)行,既能做到切換和演練的常態(tài)化、實(shí)戰(zhàn)化,提高整體災(zāi)難恢復(fù)能力,又能提升異地災(zāi)備建設(shè)投資回報(bào)和災(zāi)備中心的綜合效益。
二、“兩地三中心”架構(gòu)設(shè)計(jì)
基于上述布局規(guī)劃,山東電力建設(shè)某工程公司“兩地三中心”整體容災(zāi)架構(gòu)包括A數(shù)據(jù)中心、B同城災(zāi)備中心和國外C異地災(zāi)備中心,架構(gòu)示意圖如下圖所示。
A數(shù)據(jù)中心配置完整的網(wǎng)絡(luò)接入鏈路、應(yīng)用處理平臺和存儲(chǔ)平臺;B異地災(zāi)備中心配置主要的第三方接入鏈路、關(guān)鍵業(yè)務(wù)的應(yīng)用處理平臺和存儲(chǔ)平臺;B同城災(zāi)備中心只配置關(guān)鍵系統(tǒng)的存儲(chǔ)平臺。
在數(shù)據(jù)層,在三個(gè)中心之間采用三點(diǎn)存儲(chǔ)數(shù)據(jù)復(fù)制架構(gòu)滿足異地容災(zāi)數(shù)據(jù)零丟失業(yè)務(wù)要求,在生產(chǎn)中心和異地災(zāi)備中心之間采用兩點(diǎn)存儲(chǔ)數(shù)據(jù)復(fù)制架構(gòu)滿足異地容災(zāi)數(shù)據(jù)丟失量小于15分鐘的業(yè)務(wù)要求。
在網(wǎng)絡(luò)層,生產(chǎn)中心和同城災(zāi)備中心通過兩條DWDM裸光纖直接連接,而生產(chǎn)中心與異地災(zāi)備中心、同城災(zāi)備中心與異地災(zāi)備中心之間各通過一條2.5G的SDH鏈路連接,同時(shí)滿足存儲(chǔ)數(shù)據(jù)復(fù)制和網(wǎng)絡(luò)數(shù)據(jù)傳輸要求。在IP網(wǎng)絡(luò)上,生產(chǎn)中心和同城災(zāi)備中心二層互聯(lián),與異地災(zāi)備中心三層連接。在SAN網(wǎng)絡(luò)上,采用物理線路環(huán)行布置的方式建立獨(dú)立的三地復(fù)制SAN網(wǎng),以支持存儲(chǔ)數(shù)據(jù)三地雙向復(fù)制。
在應(yīng)用層,異地災(zāi)備中心不同應(yīng)用系統(tǒng)按照災(zāi)備策略部署相應(yīng)的主機(jī)和服務(wù)器;在同城災(zāi)備中心除共用的測試用服務(wù)器外,不部署應(yīng)用主機(jī)和服務(wù)器。
三、主要技術(shù)難點(diǎn)
由于同城災(zāi)備中心與生產(chǎn)中心距離較近,數(shù)據(jù)能夠?qū)崟r(shí)同步復(fù)制,實(shí)現(xiàn)數(shù)據(jù)的零丟失(RPO=0),系統(tǒng)“雙活”也更具實(shí)現(xiàn)可行性,因此相比“單數(shù)據(jù)中心”模式無論在災(zāi)備建設(shè)手段還是在災(zāi)備技術(shù)成熟度方面都具有一定優(yōu)勢。在目前的技術(shù)條件下,相距數(shù)萬公里的兩點(diǎn)之間尚無法做到數(shù)據(jù)的實(shí)時(shí)同步,因此異地應(yīng)用級災(zāi)備建設(shè)較同城應(yīng)用級災(zāi)備建設(shè)難度更大,主要的技術(shù)難點(diǎn)如下。
1.如何解決業(yè)務(wù)數(shù)據(jù)“0”丟失的要求
隨著業(yè)務(wù)處理信息化程度不斷提高,存放在系統(tǒng)內(nèi)的業(yè)務(wù)數(shù)據(jù)成為業(yè)務(wù)能否快速恢復(fù)的關(guān)鍵,因此需要找出既能滿足苛刻數(shù)據(jù)恢復(fù)要求,又能解決長距離數(shù)據(jù)復(fù)制不穩(wěn)定問題的技術(shù)方案。
2.如何同時(shí)滿足網(wǎng)絡(luò)安全控制和快速切換的要求
災(zāi)備系統(tǒng)按其日常工作狀態(tài)可分為主備系統(tǒng)和雙活系統(tǒng),前者僅在災(zāi)難發(fā)生時(shí)才啟用接管業(yè)務(wù),后者則常態(tài)化作為生產(chǎn)系統(tǒng)的組成部分對外服務(wù),這就需要在網(wǎng)絡(luò)上進(jìn)行嚴(yán)格的安全控制,而在災(zāi)難情況下又能靈活快速地切換。
3.如何提高異地災(zāi)備資源利用率
為滿足嚴(yán)格的RPO指標(biāo)要求,在生產(chǎn)中心、同城災(zāi)備中心與異地災(zāi)備中心之間需要建設(shè)多條高帶寬長途通訊線路。這些線路的日常運(yùn)行費(fèi)用在“兩地三中心”總體運(yùn)行成本中占有相當(dāng)大的比例。如何在具體實(shí)現(xiàn)中減少長途線路數(shù)量、提高線路資源利用率,也是需要重點(diǎn)解決的問題。