一、待裁撤數(shù)據(jù)中心面臨的挑戰(zhàn)和機遇數(shù)據(jù)中心的運營壽命通常為8~10年,隨著時間的推移,數(shù)據(jù)中心基礎(chǔ)設(shè)施設(shè)備老化加劇、設(shè)備穩(wěn)定性下降、故障率上升、設(shè)備運營效率下降、維保成本顯著增加;IDC網(wǎng)絡(luò)架構(gòu)難以滿足當(dāng)前業(yè)務(wù)發(fā)展的需求;IT設(shè)備過保、設(shè)備故障率顯著提升、續(xù)保成本增加。
圖1 待裁撤IDC的挑戰(zhàn)
雖然待裁撤IDC面臨諸多問題和挑戰(zhàn),但是他們也有很多值得關(guān)注的優(yōu)勢。近10年的數(shù)據(jù)中心運營,已經(jīng)建成了較為成熟完善的運營體系;運營團隊在技術(shù)積累、梯隊人員培養(yǎng)方面相對穩(wěn)定;更重要的是我們與IDC運營商之間建立的長達(dá)近10年的鋼鐵般的互信情誼。
尤其對于大型數(shù)據(jù)中心園區(qū),對待裁撤數(shù)據(jù)中心進行改造還有以下優(yōu)勢:有利于集中化管理,避免數(shù)據(jù)中心碎片化;大型數(shù)據(jù)中心園區(qū)市政基礎(chǔ)設(shè)施配套建設(shè)有較好的資源投入,特別是外市電、市政供水的可靠性和可用性高;數(shù)據(jù)中心園區(qū)成熟的周邊配套,對運營人員的穩(wěn)定性也有幫助;大型數(shù)據(jù)中心改造的成本低、建設(shè)周期短、相比與重新選址可以大大縮短整個交付周期。
圖2 待裁撤IDC的優(yōu)勢
因此,除了綜合考慮待裁撤數(shù)據(jù)中心基礎(chǔ)設(shè)施等硬件條件外,運營體系等軟件優(yōu)勢也是數(shù)據(jù)中心經(jīng)理對待裁撤數(shù)據(jù)中心評估管理的重要內(nèi)容。
二、老樹發(fā)新枝,待裁撤數(shù)據(jù)中心的改造評估面對業(yè)務(wù)不斷發(fā)展的需求,對于存量老數(shù)據(jù)中心的挑戰(zhàn)日益嚴(yán)峻。待裁撤數(shù)據(jù)中心改造或許將為我們帶來新的機遇。
基礎(chǔ)設(shè)施方面各種設(shè)備的使用年限并不一樣,例如高、低壓配電柜,變壓器設(shè)計使用年限通常為20年;而UPS系統(tǒng)設(shè)計使用年限通常為8~10年(部分部件可能提前更換,例如電池、電容器一般每五年更換一次)。那么待裁撤數(shù)據(jù)中心改造評估需要如何著手呢?
1. 基礎(chǔ)設(shè)施改造評估:
(1) 配電系統(tǒng):市電容量是需要重點關(guān)注的事項,隨著IDC的發(fā)展,單機柜功耗不斷提升,尤其MDC(微模塊數(shù)據(jù)中心)可以實現(xiàn)單機柜6.5~10kW.在單位空間內(nèi)的電力容量需求將顯著提升。
高低壓配電柜及變壓器通常使用年限為20年,對于投產(chǎn)8~10年的IDC,這部分可以考慮繼續(xù)使用,但是需要進行全方位的檢查,并對隱患設(shè)備進行更換。
UPS系統(tǒng),投產(chǎn)8~10年的數(shù)據(jù)中心主要采用UPS系統(tǒng)。根據(jù)UPS的生命周期,UPS主體已經(jīng)達(dá)到報廢年限,而UPS電池和電容(通常每五年更換一次)等部件已經(jīng)經(jīng)歷了2次更替,也不建議保留。同時,我們可以考慮引入能效更高的HVDC系統(tǒng)(雙路HVDC或者HVDC+市電直供)。
(2) 空調(diào)系統(tǒng):對于傳統(tǒng)風(fēng)冷式空調(diào)系統(tǒng),機房整體PUE相對較高,在高溫極端氣候下,制冷效果不佳。在空間滿足的情況下,建議更新為水冷機組,或者配置為雙冷源系統(tǒng)。這將顯著提升系統(tǒng)的運營效率,并增加系統(tǒng)的健壯性和可靠性。
對于水冷機組系統(tǒng),在良好的維保情況下,冷機、水泵的核心設(shè)備通常仍可以正常使用,但是我們需要充分評估其運行效率,并對隱患部件進行更換。管道系統(tǒng)是需要重點關(guān)注的環(huán)節(jié),管道銹蝕以及閥門銹蝕將嚴(yán)重威脅系統(tǒng)運行。
(3) 機柜模式:8~10年的傳統(tǒng)數(shù)據(jù)中心,可能采用當(dāng)時較為先進的機柜下送風(fēng)、冷熱通道隔離技術(shù)。其制冷效率有較大的提升空間。
當(dāng)機房空間以及承重條件較好時,我們建議考慮使用MDC技術(shù)。MDC技術(shù)可以實現(xiàn)制冷效率的顯著提升,同時實現(xiàn)機架快速分批交付,是應(yīng)對業(yè)務(wù)快速發(fā)展需求的不二選擇。
當(dāng)機房層高、承重受限時,冷熱通道隔離技術(shù)仍然可以發(fā)揮重要的作用。
(4) 其他系統(tǒng):對于消防系統(tǒng),相對于傳統(tǒng)運營商數(shù)據(jù)中心廣泛采用的氣體消防系統(tǒng),騰訊數(shù)據(jù)中心致力于推動預(yù)作用高壓細(xì)水霧消防系統(tǒng)(IT機房內(nèi))的應(yīng)用。當(dāng)面臨火災(zāi)等風(fēng)險的時候,騰訊數(shù)據(jù)中心始終將運維人員的生命安全放在第一位。
門禁和監(jiān)控系統(tǒng),需要考慮原有的門禁和監(jiān)控系統(tǒng)是否可以覆蓋改造后的新增擴容需求,例如動環(huán)監(jiān)控、群控、CCTV、MDC監(jiān)控數(shù)據(jù)對接等。
2. 網(wǎng)絡(luò)架構(gòu)改造評估:
(1) 網(wǎng)絡(luò)架構(gòu):為了滿足業(yè)務(wù)的發(fā)展需求,網(wǎng)絡(luò)架構(gòu)也是日新月異。以騰訊數(shù)據(jù)中心為例,傳統(tǒng)數(shù)據(jù)中心主要采用千兆網(wǎng)絡(luò)架構(gòu),而當(dāng)前我們主要建設(shè)的是萬兆網(wǎng)絡(luò)架構(gòu),兩種架構(gòu)下的設(shè)備無法完全匹配(通常萬兆服務(wù)器可以兼容千兆網(wǎng)絡(luò)架構(gòu),而千兆服務(wù)器不能兼容萬兆網(wǎng)絡(luò)架構(gòu))。因此,我們需要根據(jù)當(dāng)前的業(yè)務(wù)需求,選擇適宜的網(wǎng)絡(luò)架構(gòu)。
(2) 機位上架標(biāo)準(zhǔn):機位上架標(biāo)準(zhǔn)是結(jié)合網(wǎng)絡(luò)架構(gòu)、設(shè)備功耗、機架空間及電力容量等多方面制定的規(guī)范。傳統(tǒng)機架主要為16A或者20A機架(單機柜4.4kW以下),而騰訊IDC當(dāng)前主要采用30A機架,因而上架標(biāo)準(zhǔn)也需要更新。
3. 服務(wù)器評估:服務(wù)器技術(shù)的更新周期很快,通常服務(wù)器的生命周期為3-5年,對于在使用年限且符合新網(wǎng)絡(luò)架構(gòu)的服務(wù)器可以繼續(xù)搬遷使用,對于過期過保的設(shè)備可以更新淘汰。另外服務(wù)器對于交流、直流配電系統(tǒng)以及制冷系統(tǒng)的兼容性相對較好,通常不是決定數(shù)據(jù)中心去留改造的瓶頸。
4. 相關(guān)業(yè)務(wù)評估:對于多點分布、業(yè)務(wù)健壯性好、抗風(fēng)險能力好、能夠快速靈活調(diào)度的業(yè)務(wù),且對改造時間要求緊迫,對基礎(chǔ)設(shè)施側(cè)健壯性要求不苛刻,同時也追求運營成本的業(yè)務(wù)??梢钥紤],選擇快速、低改造成本,適度小改為“廉價”機房供此類業(yè)務(wù)使用。(此處“廉價”已包括對改造后數(shù)據(jù)中心的低維保投入)
對于業(yè)務(wù)健壯性較弱,且對基礎(chǔ)設(shè)施側(cè)健壯性依賴大的業(yè)務(wù),可以考慮高改造投入,適度改建為高可靠性的數(shù)據(jù)中心,滿足業(yè)務(wù)需求。
當(dāng)然,不管哪一類業(yè)務(wù),我們都還需要考綜合考慮業(yè)務(wù)的遷移成本。
「結(jié)束語」
數(shù)據(jù)中心裁撤是數(shù)據(jù)中心生命周期管理的重要組成部分,隨著時間的推移,更多的傳統(tǒng)數(shù)據(jù)中心將迎來裁撤和退役。如何最大程度的利用現(xiàn)有的基礎(chǔ)設(shè)施條件,同時滿足業(yè)務(wù)發(fā)展需求將是考驗數(shù)據(jù)中心經(jīng)理(簡稱“數(shù)經(jīng)”)管理能力的重要課題。
今天,我們提出這個話題,是因為我們自己在海量運營過程中也剛剛碰到這個難題,怎么做才是最佳,我們目前也沒有答案,希望接下來能夠和大家多多討論。當(dāng)然如果在實踐的過程中我們摸索出一點點經(jīng)驗的話,也會及時對外分享。
老樹發(fā)新枝,數(shù)經(jīng)在行動!
本文來源:騰訊數(shù)據(jù)中心