強(qiáng)大的災(zāi)難恢復(fù)測(cè)試戰(zhàn)略的優(yōu)秀實(shí)踐

良好的災(zāi)難恢復(fù)測(cè)試來(lái)自周密的規(guī)劃和準(zhǔn)備,未經(jīng)測(cè)試的計(jì)劃是另一場(chǎng)將會(huì)發(fā)生的危機(jī),因此制定災(zāi)難恢復(fù)測(cè)試戰(zhàn)略至關(guān)重要。
完整的災(zāi)難恢復(fù)計(jì)劃測(cè)試不是許多企業(yè)可以經(jīng)常進(jìn)行的。計(jì)劃和執(zhí)行災(zāi)難恢復(fù)測(cè)試需要兩個(gè)寶貴的資源:時(shí)間和金錢(qián),僅出于這一原因,災(zāi)難恢復(fù)團(tuán)隊(duì)必須現(xiàn)實(shí)地確定他們每年可以執(zhí)行的測(cè)試數(shù)量。大多數(shù)主要應(yīng)用程序一年最多只進(jìn)行一次端到端測(cè)試,有些應(yīng)用程序可以每三年測(cè)試一次,這取決于災(zāi)難恢復(fù)團(tuán)隊(duì)的要求。
這將災(zāi)難恢復(fù)團(tuán)隊(duì)置于兩難境地:如果他們不能足夠頻繁地進(jìn)行測(cè)試,關(guān)鍵應(yīng)用程序或進(jìn)程可能會(huì)錯(cuò)過(guò)必要的更新,然而,如果他們用無(wú)關(guān)的測(cè)試分散太多,他們就有可能耗盡前面提到的寶貴資源,測(cè)試戰(zhàn)略必須幾乎和恢復(fù)本身一樣徹底,這將確保災(zāi)難恢復(fù)團(tuán)隊(duì)不會(huì)錯(cuò)過(guò)任何必要的更改,并可以最大限度地利用有限的資源。
要最大限度地利用災(zāi)難恢復(fù)測(cè)試策略,請(qǐng)考慮納入這些最佳實(shí)踐。
確定測(cè)試類(lèi)型并制定相應(yīng)的計(jì)劃
災(zāi)難恢復(fù)測(cè)試分為兩種類(lèi)型:完全災(zāi)難恢復(fù)測(cè)試和組件測(cè)試,不同之處在于,組件測(cè)試本質(zhì)上較小,并且測(cè)試應(yīng)用程序的子集,大多數(shù)組件測(cè)試實(shí)際上是冒煙測(cè)試,以在投入大量資源進(jìn)行全面災(zāi)難恢復(fù)測(cè)試之前,幫助確保整個(gè)應(yīng)用程序的較小部分正常工作。
在討論測(cè)試的技術(shù)方面之前,了解正在測(cè)試的內(nèi)容至關(guān)重要,這是否是一個(gè)完整的交互式災(zāi)難恢復(fù)測(cè)試,要求用戶登錄,在危機(jī)情況下執(zhí)行,并測(cè)試應(yīng)用程序是否按預(yù)期工作,或者,是否足以驗(yàn)證系統(tǒng)和軟件是否可用?根據(jù)企業(yè)災(zāi)難恢復(fù)計(jì)劃中的工具或流程,可能需要對(duì)該計(jì)劃執(zhí)行一次全面檢查,以測(cè)試該計(jì)劃在危機(jī)中將如何運(yùn)行。
確保一切及早就位——并反復(fù)檢查
這可能看起來(lái)微不足道,但在運(yùn)行完整測(cè)試之前沒(méi)有檢查關(guān)鍵組件是企業(yè)最常見(jiàn)和可以預(yù)防的錯(cuò)誤之一。災(zāi)難恢復(fù)測(cè)試的重點(diǎn)是確保事情按預(yù)期運(yùn)行,但如果有一個(gè)修復(fù)可以在完整測(cè)試之外完成,那么就值得檢查一下是否一切都預(yù)先設(shè)置好了,這是組件測(cè)試可以派上用場(chǎng)的一個(gè)領(lǐng)域。
一個(gè)常見(jiàn)的例子是,IT團(tuán)隊(duì)發(fā)現(xiàn)所需的防火墻端口未打開(kāi),這是他們?cè)谕暾臑?zāi)難恢復(fù)測(cè)試中可能會(huì)發(fā)現(xiàn)的,但為了節(jié)省時(shí)間和資源,提前檢查仍然更容易。修復(fù)防火墻問(wèn)題可能是一個(gè)令人沮喪的過(guò)程,而且這可能不是安全和網(wǎng)絡(luò)工作人員在運(yùn)行端到端災(zāi)難恢復(fù)測(cè)試期間想要處理的事情。
好的文檔始終是重要事項(xiàng)
良好文檔的重要性至高無(wú)上,如果災(zāi)難恢復(fù)測(cè)試是由經(jīng)驗(yàn)較少的員工進(jìn)行的,他們可能會(huì)在測(cè)試過(guò)程中面臨并解決幾個(gè)問(wèn)題,然而,如果他們不記錄這些問(wèn)題和補(bǔ)救措施,重要信息的丟失可能會(huì)顯著影響災(zāi)難恢復(fù)測(cè)試或?qū)嶋H恢復(fù)的速度。
災(zāi)難恢復(fù)團(tuán)隊(duì)必須具備四種類(lèi)型的文檔,才能制定強(qiáng)大的測(cè)試策略:
- 當(dāng)前的災(zāi)難恢復(fù)計(jì)劃是書(shū)面的,有離散的步驟和時(shí)間表。
- 關(guān)于測(cè)試過(guò)程中出現(xiàn)的任何問(wèn)題以及如何修復(fù)這些問(wèn)題的說(shuō)明,如果有臨時(shí)解決方法,請(qǐng)概述它是什么。
- 測(cè)試過(guò)程的詳細(xì)文檔,這應(yīng)該包括正在測(cè)試什么以及由誰(shuí)測(cè)試。
- 測(cè)試完成時(shí)管理員簽字。
不要繞過(guò)全面的總結(jié)和報(bào)告
這看起來(lái)可能很簡(jiǎn)單,但測(cè)試后報(bào)告是許多災(zāi)難恢復(fù)團(tuán)隊(duì)的不足之處,不幸的是,這是對(duì)管理層影響最大、影響最大的任務(wù)。
管理層通常對(duì)IT的具體細(xì)節(jié)不感興趣,但在高層次上傳遞成功或失敗是一項(xiàng)復(fù)雜的任務(wù),在關(guān)閉生產(chǎn)系統(tǒng)以測(cè)試災(zāi)難恢復(fù)方案時(shí)尤其如此,就像處理真正的災(zāi)難一樣,IT團(tuán)隊(duì)?wèi)?yīng)該在整個(gè)過(guò)程中創(chuàng)建全面的文檔,以告知管理層測(cè)試是如何進(jìn)行的,以及他們必須解決的任何領(lǐng)域。
為避免在總結(jié)過(guò)程中因技術(shù)細(xì)節(jié)而使管理負(fù)擔(dān)過(guò)重,在測(cè)試過(guò)程中及時(shí)溝通高級(jí)狀態(tài)至關(guān)重要,請(qǐng)記住,某些災(zāi)難恢復(fù)測(cè)試的執(zhí)行時(shí)間可能相當(dāng)長(zhǎng),跨越24小時(shí)或更長(zhǎng)時(shí)間,確保這些關(guān)鍵的利益相關(guān)者隨時(shí)了解正在發(fā)生的事情,這讓他們感到高興,并顯示出良好的溝通。






















