高可用方案成為企業(yè)上云最重要的選擇標(biāo)準(zhǔn)之一
根據(jù)明尼蘇達(dá)大學(xué)的研究,在云服務(wù)器遭遇災(zāi)難的同時(shí)又沒有容災(zāi)備份與恢復(fù)計(jì)劃的云計(jì)算服務(wù)商中,將有超過60%的云服務(wù)商在兩到三年后退出市場,而隨著企業(yè)對數(shù)據(jù)處理依賴程度的遞增,該比例還有逐漸上升的趨勢。
IDC在全球范圍內(nèi),針對多個(gè)行業(yè)的中小型企業(yè)(員工數(shù)小于1000名)的調(diào)研顯示,近80%的公司預(yù)計(jì),云服務(wù)器每小時(shí)的停機(jī)成本至少在2萬美元以上,而超過20%的企業(yè)估算其云服務(wù)器每小時(shí)的停機(jī)成本至少為10萬美元。
由此可見,云服務(wù)器停機(jī)對于云上企業(yè)的損失不容小覷,云服務(wù)商高可用方案越來越成為企業(yè)上云最重要的選擇標(biāo)準(zhǔn)之一。在“上云”已經(jīng)成為共識之后,如何保障云上企業(yè)業(yè)務(wù)的連續(xù)性和可用性,成為業(yè)界關(guān)注的一個(gè)重要話題。
根據(jù)阿里、騰訊、華為等品牌云活動(dòng)代金券免費(fèi)領(lǐng)取平臺(tái)“尊托云數(shù)”(zuntop.cn)了解到的情況,目前,不管是對于云計(jì)算廠商,還是對于上云企業(yè),高可用都已經(jīng)成為業(yè)務(wù)架構(gòu)設(shè)計(jì)中必須考慮的因素之一,它通常是指通過技術(shù)手段,盡可能縮短因日常維護(hù)操作(計(jì)劃)和突發(fā)的故障(非計(jì)劃)所導(dǎo)致的停機(jī)時(shí)間,以提高業(yè)務(wù)的可用性。
以國內(nèi)領(lǐng)先的云計(jì)算廠商騰訊云為例,騰訊云目前在高可用性這塊做了很多的努力,無論是技術(shù)架構(gòu)還是落地實(shí)踐都走在國內(nèi)公有云廠商的前列。架構(gòu)上,騰訊云高可用包括客戶端接入、外網(wǎng)接入、云內(nèi)網(wǎng)絡(luò)、云上服務(wù)器、中間件、數(shù)據(jù)層等多個(gè)層面。
詳細(xì)來說,在客戶端引入騰訊云全球領(lǐng)先的接入層技術(shù)(云解析、httpdns和IP直連),通過騰訊云智能調(diào)度系統(tǒng),可以保證任意節(jié)點(diǎn)發(fā)生故障均能無縫切換到其他節(jié)點(diǎn);針對外網(wǎng)接入,高達(dá)40+ BGP線路和跨區(qū)域容災(zāi)能力,能夠第一時(shí)間對故障快速調(diào)度切換,防止骨干網(wǎng)故障;云內(nèi)網(wǎng)絡(luò)通過跨區(qū)域數(shù)據(jù)中心互聯(lián)互通,形成雙環(huán)路保護(hù)。
最核心的云上服務(wù)器,騰訊云目前支持宕機(jī)遷移無感知,同時(shí),云硬盤三副本存儲(chǔ)策略,可以消除單點(diǎn)故障;騰訊云中間件能夠?qū)崿F(xiàn)跨區(qū)域集群,在保障數(shù)據(jù)正確的同時(shí),減少業(yè)務(wù)感知;騰訊云數(shù)據(jù)庫支持實(shí)時(shí)熱備,讀寫分離,實(shí)現(xiàn)了同城多可用區(qū)、異地災(zāi)備和兩地三中心,滿足跨地域容災(zāi)金融級需求。
除了上述六層高可用方案保證之外,在最關(guān)鍵以及最主要的基礎(chǔ)設(shè)施層,騰訊云也具備高可用方案。比如,依托遍布全球五大洲25個(gè)地區(qū)的53個(gè)可用區(qū),騰訊云為國內(nèi)外用戶提供強(qiáng)有力的技術(shù)支持,助力業(yè)務(wù)飛速拓展。另外,部署全球的超1300+個(gè)加速節(jié)點(diǎn),超過100T的帶寬儲(chǔ)備,能夠?qū)⒎?wù)內(nèi)容分發(fā)到全網(wǎng)加速節(jié)點(diǎn),支持千萬級用戶并發(fā),有效解決跨運(yùn)營商、跨地域高延遲訪問等問題。
對于越來越多的上云企業(yè)而言,除了選擇有高可用架構(gòu)的云服務(wù)商之外,更要搭建符合自身業(yè)務(wù)特色的高可用架構(gòu),才是業(yè)務(wù)穩(wěn)定性的重要保證。
比如,作為目前國民級短視頻社區(qū)快手。短視頻和直播業(yè)務(wù)是快手最重要的業(yè)務(wù),其中訪問量,突發(fā),高性能處理等并發(fā)要求高,平臺(tái)服務(wù)器一旦故障,將會(huì)對其產(chǎn)生巨大的損失。
為了確保平臺(tái)服的高可用,騰訊云從接入層、邏輯層、以及數(shù)據(jù)層幫助快手建設(shè)高可用解決方案。在接入層,通過專線鏈接各大機(jī)房,利用騰訊云的安全產(chǎn)品,保障全站的網(wǎng)絡(luò)攻擊;邏輯層和數(shù)據(jù)層針對核心的業(yè)務(wù)做異地多活,定期演練,以應(yīng)對機(jī)房災(zāi)難性故障的快速恢復(fù)。通過多項(xiàng)高可用方案,騰訊云全面護(hù)航快手業(yè)務(wù)連續(xù)性和穩(wěn)定性。
電商平臺(tái)由于自身的業(yè)務(wù)特性,需要應(yīng)對節(jié)假日等流量高峰和高并發(fā)沖擊,其對高可用的需求更為強(qiáng)烈。在移動(dòng)電商領(lǐng)域,每日優(yōu)鮮是這個(gè)領(lǐng)域最典型的案例。作為致力于重構(gòu)供應(yīng)鏈,連接生鮮生產(chǎn)者和消費(fèi)者的領(lǐng)導(dǎo)電商,每日優(yōu)鮮目前在北上廣深等10多個(gè)城市構(gòu)筑了“城市分選中心+社區(qū)配送中心”的極速達(dá)冷鏈物流體系,為全國數(shù)百萬客戶提供會(huì)員1小時(shí)送貨上門服務(wù)。
游戲場景對于高可用方案的需要?jiǎng)t更為迫切,一款熱門游戲,在極短的時(shí)間內(nèi)需要應(yīng)對10倍以及百倍的用戶量增長。完善的高可用解決方案對于保障游戲的順利運(yùn)營,起到極為重要的作用。作為國內(nèi)知名的游戲平臺(tái),樂逗游戲承載數(shù)款熱門網(wǎng)絡(luò)游戲,其最重要的業(yè)務(wù)模塊為游戲平臺(tái)服務(wù)系統(tǒng),為了確保該系統(tǒng)的高可用,騰訊云為樂逗游戲平臺(tái)提供了一整套異地容災(zāi)高可用解決方案。
為了實(shí)現(xiàn)游戲平臺(tái)服的跨城異地容災(zāi),規(guī)避機(jī)房故障等災(zāi)難性故障對業(yè)務(wù)造成的影響,騰訊云通過負(fù)載均衡接入,并將BGP高防包綁定負(fù)載均衡做抵御網(wǎng)絡(luò)攻擊;同時(shí),為應(yīng)對業(yè)務(wù)用戶激增方便擴(kuò)展,系統(tǒng)接入自動(dòng)擴(kuò)容,根據(jù)業(yè)務(wù)流量動(dòng)態(tài)擴(kuò)縮容;另外,在關(guān)鍵的數(shù)據(jù)層采用數(shù)據(jù)庫讀寫分離架構(gòu)和主備容災(zāi)架構(gòu)做好高可用。
隨著越來越多的企業(yè)將業(yè)務(wù)部署在云上,故障已經(jīng)成為企業(yè)不得不重點(diǎn)關(guān)注的重點(diǎn),采用高可用架構(gòu)和方案也成為企業(yè)運(yùn)維人員必須思考的話題,除此之外,作為企業(yè)技術(shù)人員,如何保證企業(yè)業(yè)務(wù)和服務(wù)的穩(wěn)定性,值得業(yè)界一起探索。