你的企業(yè)網(wǎng)絡(luò)是否也出現(xiàn)過這樣的業(yè)務(wù)中斷問題?
原創(chuàng)【51CTO.com原創(chuàng)稿件】為保證核心業(yè)務(wù)的正常運(yùn)行,各單位在對自身網(wǎng)絡(luò)的規(guī)劃中,都會考慮通過設(shè)備冗余來提升網(wǎng)絡(luò)運(yùn)行的可靠性。筆者所在單位在進(jìn)行網(wǎng)絡(luò)設(shè)計規(guī)劃時,也在網(wǎng)絡(luò)的核心區(qū)進(jìn)行了冗余性考慮。
但是,就在前段時間,由于核心交換機(jī)出現(xiàn)單板故障,單位的所有辦公應(yīng)用系統(tǒng)無法訪問。這說明在網(wǎng)絡(luò)的冗余性設(shè)計中對此場景考慮的還不夠周全,導(dǎo)致網(wǎng)絡(luò)的可靠性下降。本文將對此次出現(xiàn)的故障原因進(jìn)行詳細(xì)分析,并提出有效的解決方案。
問題描述:
單位的網(wǎng)絡(luò)在核心區(qū)通過兩臺華為的S7706交換機(jī)進(jìn)行冗余部署,兩臺核心交換機(jī)之間通過多模光纖接口互連,之間部署了VRRP協(xié)議;樓層業(yè)務(wù)區(qū)交換機(jī)及應(yīng)用業(yè)務(wù)區(qū)交換機(jī)采用雙上連方式分別與主備核心交換機(jī)相連,部署了STP協(xié)議。
唯一不同之處在于,應(yīng)用業(yè)務(wù)區(qū)交換機(jī)與核心交換機(jī)因為在同一機(jī)房,所以通過五類雙絞線互連,而樓層業(yè)務(wù)區(qū)交換機(jī)與核心交換機(jī)在不同的樓層,所以通過多模光纖相連。(簡要流量拓?fù)鋱D見下圖圖1)
問題發(fā)生時,主核心交換機(jī)的光纖接口板上所有接口都出現(xiàn)故障,樓層業(yè)務(wù)區(qū)交換機(jī)上連主核心交換機(jī)的接口以及主備核心交換機(jī)之間的心跳線都在此光纖接口板上,所以都發(fā)生了中斷;而應(yīng)用業(yè)務(wù)區(qū)交換機(jī)是通過五類雙絞線與主核心交換機(jī)相連,所以工作正常,沒有發(fā)生中斷。
按照網(wǎng)絡(luò)的設(shè)計初衷,當(dāng)主核心交換機(jī)失效時,業(yè)務(wù)流量應(yīng)該切換到備核心交換機(jī)上,業(yè)務(wù)不應(yīng)該中斷,但是在本問題中,主交換機(jī)的光纖接口板故障,導(dǎo)致了樓層業(yè)務(wù)區(qū)所有用戶都無法訪問應(yīng)用業(yè)務(wù)區(qū)的系統(tǒng)。
故障分析:
如圖2所示,光纖接口板故障時,樓層業(yè)務(wù)區(qū)交換機(jī)上連主核心交換機(jī)的接口中斷,通過STP協(xié)議切換到備核心交換機(jī)上,當(dāng)樓層辦公終端訪問應(yīng)用系統(tǒng)時,流量經(jīng)過備核心交換機(jī)到達(dá)應(yīng)用業(yè)務(wù)區(qū)的應(yīng)用服務(wù)器,而應(yīng)用服務(wù)器回復(fù)信息到達(dá)主核心交換機(jī)后,由于主備核心交換機(jī)之間的心跳線故障,所以業(yè)務(wù)流量到達(dá)主核心交換機(jī)后無法轉(zhuǎn)發(fā),導(dǎo)致業(yè)務(wù)中斷。
解決方案:
本網(wǎng)絡(luò)核心區(qū)冗余性設(shè)計的初衷是通過主備核心交換機(jī)及其之間的心跳線來保證在主核心交換機(jī)故障時業(yè)務(wù)正常運(yùn)行。在上述問題場景時,如果能夠保證主備核心交換機(jī)之間的心跳不中斷,那么業(yè)務(wù)流量就可以通過備核心交換機(jī)到達(dá)樓層業(yè)務(wù)區(qū),從而保證業(yè)務(wù)正常運(yùn)行。
在光纖接口板故障時,以太網(wǎng)電口接口板正常工作,如果主備交換機(jī)之間的心跳線能夠通過電口實現(xiàn)連接,就可以滿足我們的需求。但如果只通過電口實現(xiàn)心跳連接的話,那么我們會自然想到,要是電口接口板故障了豈不是心跳線也會故障?答案是肯定的。
所以,我們可以采用光口與電口進(jìn)行捆綁方式的,恰好筆者單位的華為7706核心交換機(jī)也支持此功能,配置也非常簡單。
首先,在交換上創(chuàng)建一個Eth-trunk接口,配置成二層trunk模式,允許除vlan 1之外的所有其它vlan通過,配置如下所示:
interface Eth-Trunk1
port link-type trunk
port trunk allow-pass vlan 2 to 4094
Eth-trunk接口配置完成之后,再將一個光接口及一個電接口綁定到此Eth-trunk接口下即可,配置如下所示。其中,光纖接口板槽位號為2,電接口板槽位號為5。
interface GigabitEthernet2/0/47
eth-trunk 1
interface GigabitEthernet5/0/47
eth-trunk 1
綁定之后,當(dāng)其中一個接口故障時,所有心跳報文都通過另一個接口進(jìn)行轉(zhuǎn)發(fā),確保業(yè)務(wù)正常運(yùn)行,如果還需要進(jìn)一步增加鏈路的可靠性,還可以考慮分別將兩個光纖接口及兩個電接口進(jìn)行四接口捆綁。
測試驗證:
當(dāng)業(yè)務(wù)正常運(yùn)行時,通過手動將主核心交換機(jī)的光纖接口板拔出進(jìn)行故障模擬,業(yè)務(wù)中斷4秒鐘左右之后(由于樓層交換機(jī)STP協(xié)議切換),自動恢復(fù)正常。(網(wǎng)絡(luò)流量如圖3所示)
再將光纖接口板插入主核心交換機(jī),接口板自動注冊成功,恢復(fù)正常工作,在此過程中,業(yè)務(wù)中斷4秒鐘左右之后恢復(fù)正常(STP協(xié)議回切)。
綜上所述,在進(jìn)行網(wǎng)絡(luò)冗余性設(shè)計時,不僅要考慮設(shè)備的冗余,還需要考慮鏈路冗余,對于某些重要的鏈路,必要時可以采取跨板捆綁的方式進(jìn)行保護(hù),盡可能將鏈路中斷的可能性降到***。
個人簡介:
何濤,男,畢業(yè)于北京郵電大學(xué)電磁場與微波技術(shù)專業(yè),從業(yè)十年,現(xiàn)任職中國交通通信信息中心保障與網(wǎng)絡(luò)中心高級工程師,專注于數(shù)據(jù)通信及網(wǎng)絡(luò)安全方向的研究工作。原文標(biāo)題為“通過跨板接口捆綁 解決業(yè)務(wù)中斷問題”
【51CTO原創(chuàng)稿件,合作站點(diǎn)轉(zhuǎn)載請注明原文作者和出處為51CTO.com】