国产福利在线播放|久久精品福利网站免费|国产呻吟视频在线观看|日韩一区二区三区免费高清|久996视频精品免费观看|欧美日本在线一区二区三区|在线最新无码经典无码免費資訊|国产午夜亚洲精品国产成人最大

始創(chuàng)于2000年 股票代碼:831685
咨詢熱線:0371-60135900 注冊有禮 登錄
  • 掛牌上市企業(yè)
  • 60秒人工響應
  • 99.99%連通率
  • 7*24h人工
  • 故障100倍補償
全部產(chǎn)品
您的位置: 網(wǎng)站首頁 > 幫助中心>文章內(nèi)容

大規(guī)模云計算平臺的技術挑戰(zhàn)

發(fā)布時間:  2012/7/22 16:17:05

正如單機操作系統(tǒng)的內(nèi)核,在阿里云OS中,飛天大規(guī)模分布式計算平臺起到了承上啟下的關鍵作用。飛天運行在通過網(wǎng)絡互聯(lián)的通用服務器集群上,隱藏了海量硬件所帶來的復雜度和不可靠,向云OS的其他組件提供可信賴的的計算能力和存儲能力。

具體來講,飛天本身是一個由多個組件所構成的復雜的分布式系統(tǒng),其中的核心組件是以下兩個子系統(tǒng)。

·計算資源調度系統(tǒng)(又稱伏羲):管理和調度集群計算資源;在多個云服務間動態(tài)分配計算資源,以滿足用戶的計算需求;自動檢測服務器故障并遷移故障服務器上的服務。

·分布式文件系統(tǒng)(又稱盤古):管理集群的所有硬盤;合理地安排數(shù)據(jù)存放位置以兼顧性能和數(shù)據(jù)安全性;自動檢測磁盤故障并復制數(shù)據(jù)以保證安全。

在實現(xiàn)飛天億恩石頭QQ:673606008 電話:18237160419平臺的過程中,工程師們面臨了許多技術挑戰(zhàn),包括:

·在不可靠硬件基礎上提供高可靠的計算能力和存儲能力;

·提供高可用服務;

·低成本運維海量硬件;

·在線應用與離線應用并存;

·克服節(jié)點間帶寬的限制;

·最大化利用計算資源,等等。

其中,不可靠的硬件是最基本的挑戰(zhàn)。集群規(guī)模達到上千臺后,單機上的小概率事件變成了必然的、頻繁發(fā)生的事件。硬盤、硬盤控制器、CPU、內(nèi)存、主板、電源等故障造成的宕機每天都會發(fā)生。這類硬件失效故障,我們稱之為“硬”故障(fail-stop故障)。此外,還有一類故障現(xiàn)象不那么明顯,稱之為“軟”故障,例如,磁盤可訪問但速度只有正常的1/10、服務器沒有宕機但程序運行緩慢、網(wǎng)絡時好時壞等。這類“軟”故障同樣會影響服務質量,因為在線服務如果執(zhí)行緩慢會造成客戶端超時,而對離線作業(yè)而言,哪怕只有1%的數(shù)據(jù)處理任務緩慢,也會拖延整個數(shù)據(jù)分析作業(yè)的完成時間。

硬、軟故障發(fā)生都會對系統(tǒng)的可靠性甚至可用性造成不良影響,因此如何及時有效地進行故障檢測和恢復就變得比較關鍵。對于硬故障的檢測業(yè)界已有成熟的方案,本文第一部分只重點討論軟故障的檢測;本文的第二部分將集中探討故障恢復策略相關的問題;最后,我們將介紹如何在保證數(shù)據(jù)可靠的同時滿足在線應用的低延時需求。

云環(huán)境中的軟故障檢測

檢測“軟”故障有兩種思路。

·一種思路是針對每種具體故障設計檢測方法。但“軟”故障產(chǎn)生的原因可能很多,例如執(zhí)行緩慢可能是服務器硬件故障、網(wǎng)絡故障、磁盤故障、操作系統(tǒng)軟件故障等,逐一檢測會使系統(tǒng)過于復雜。

·另一種思路是從宏觀現(xiàn)象來檢測,下面看兩個例子。

例子一:檢測作業(yè)在某臺服務器上執(zhí)行特別緩慢的情況。

我們統(tǒng)計每個作業(yè)在每臺服務器上的執(zhí)行時間。因為輸入數(shù)據(jù)被均勻地切片,每臺服務器上的執(zhí)行時間應該大致相同。如果某臺服務器上執(zhí)行時間超過了平均時間的三倍,它就被標記為“緩慢”。如果各種不同作業(yè)在某臺服務器上都“緩慢”,那么我們有充分理由懷疑這臺服務器有問題(但不知道原因)。調度系統(tǒng)會自動把這臺服務器加入黑名單,不再用它執(zhí)行作業(yè)。之后再自動或人工檢查這些可疑服務器的具體故障原因。

例子二:檢測磁盤讀寫慢的情況。

我們在分布式文件系統(tǒng)里也會統(tǒng)計每次磁盤訪問的時間。如果某塊磁盤有大比率的訪問時間遠遠超過系統(tǒng)平均值,那么很有可能是這塊磁盤快要發(fā)生故障了。文件系統(tǒng)此時會做三件事:

·停止寫新數(shù)據(jù)到這塊磁盤,防止更多數(shù)據(jù)處于危險中;

·開始為這塊磁盤上的數(shù)據(jù)增加更多副本;

·當這塊磁盤上的所有數(shù)據(jù)都有額外的副本,就可以將它下線,待運維處理。

故障自動恢復的策略

在檢測到故障后,需要有自動及時的故障恢復機制。然而,故障自動恢復機制一旦沒有考慮周全就會成為一把雙刃劍。讓我們從Amazon云服務那次嚴重的事故說起。

  Amazon EC2大規(guī)模停機事件

2011年4月21日,Amazon的虛擬主機服務EC2發(fā)生大規(guī)模停機,時間超過兩天,影響波及Reddit、Foursquare、Quora等眾多網(wǎng)站。事后Amazon對此次事故作了詳細分析。事故起因是Amazon對集群網(wǎng)絡作日常維護升級時操作錯誤,網(wǎng)絡流量被全部切換到備用網(wǎng)絡,導致備用網(wǎng)絡過載。自動故障恢復機制檢測到網(wǎng)絡不通,認為服務器大量宕機,馬上開始數(shù)據(jù)復制以替換“宕機”的服務器上的數(shù)據(jù)副本,引發(fā)了“鏡像風暴”(大量服務器同時嘗試創(chuàng)建數(shù)據(jù)鏡像)。而由此增加的數(shù)據(jù)流量更加劇了網(wǎng)絡過載,從而使故障在集群中蔓延,進入惡性循環(huán)。最終采取了包括暫時關閉自動故障恢復系統(tǒng)和增加硬件在內(nèi)的多種措施,服務于故障發(fā)生兩天半以后恢復。

在此案例中,故障自動檢測和恢復的策略是“在數(shù)據(jù)副本所在服務器失去聯(lián)系時,復制數(shù)據(jù)”。這一策略對“一臺服務器故障”這種小范圍的常見問題很有效,然而在大范圍故障如“網(wǎng)絡過載”的場景下,可能會起反作用。在這個案例中,如果根本沒有故障自動恢復機制,故障影響范圍反而不會有那么大。

實際上,這一模式在過去的大規(guī)模分布式系統(tǒng)故障中反復出現(xiàn):發(fā)生了未曾預料到的、中小范圍的故障

→故障自動恢復機制采取了錯誤的手段

→故障惡化,進入惡性循環(huán)

Amazon S3存儲服務2008年的故障就僅僅是由于故障自動檢測機制的自身狀態(tài)中一個bit出錯,然而故障同樣迅速蔓延到整個系統(tǒng),導致服務在沒有發(fā)生硬件故障的情況下不可用。

對此,我們的策略是限制故障自動恢復機制的作用范圍:

·正常情況下,任何時候集群中都有且僅有很小比例的服務器發(fā)生故障,此時自動恢復有效,即使無效也不會造成災難;

·如果發(fā)生(罕見的)大范圍故障,明智的策略是盡量降低系統(tǒng)負載,因為此時實際上已不可能靠故障自動恢復來保持服務質量。萬一此時故障自動恢復機制試圖進行大量操作,并超出預設的限制,即暫時禁止掉這部分邏輯。

以前面提到的硬盤訪問變慢為例:考慮到硬盤平均日故障率小于千分之一,我們給前述的疑似問題硬盤自動下線機制設置上限,例如,任何時候只能通過此機制下線總數(shù)1%的硬盤。此限制可以防止極端情況下,如大量硬盤出現(xiàn)問題,或者自動下線機制本身故障時,故障恢復機制本身不會引發(fā)災難。

數(shù)據(jù)可靠性和實時性能優(yōu)化

云環(huán)境中,由于分布式系統(tǒng)有硬件故障多發(fā)的特點,保證數(shù)據(jù)可靠性成為文件系統(tǒng)的一個挑戰(zhàn)。

在飛天億恩石頭QQ:673606008 電話:18237160419平臺的實際運營中發(fā)生故障最多的硬件是硬盤。硬盤故障占阿里云數(shù)據(jù)中心故障總數(shù)的80%。原因之一是硬盤是數(shù)量最多的部件,例如一個3000節(jié)點的集群就有30000多塊硬盤,即使硬盤本身的平均無故障工作時間(MTBF)達到1,000,000小時,30000塊硬盤也意味著平均每33小時就有一次硬盤故障發(fā)生。實際運營數(shù)據(jù)顯示硬盤廠家標稱的MTBF值并不可靠,生產(chǎn)環(huán)境的硬盤故障率可以幾倍到幾十倍于標稱值。

硬盤故障最直接影響的就是盤古分布式文件系統(tǒng)。為了保證數(shù)據(jù)安全性,盤古文件系統(tǒng)對所有的數(shù)據(jù)均采用了多份拷貝。在創(chuàng)建文件時,用戶可以指定文件數(shù)據(jù)的拷貝數(shù)目,文件系統(tǒng)會保證數(shù)據(jù)分布在不同的節(jié)點和不同的機架上,使得單個硬件故障不會造成數(shù)據(jù)無法訪問。

多副本技術是業(yè)內(nèi)廣泛認可的有效防止數(shù)據(jù)丟失的技術,通常采用流水線方式傳遞寫需求以減輕單個節(jié)點的負載。但這會導致數(shù)據(jù)寫入的延遲增大,因為只有當所有副本都寫成功后才能結束一個寫操作。

由于磁盤讀寫特性,上述多副本寫入磁盤的延遲通常在幾十毫秒量級,有時可達100毫秒以上。云環(huán)境中的線上應用,有時會有更高的實時性要求。盤古通過內(nèi)存日志文件(in-memory redo log)來解決此問題。

內(nèi)存日志文件的基本思想基于以下事實:雖然服務器因為掉電或者宕機丟失內(nèi)存數(shù)據(jù)的概率高于硬盤損壞的概率(所以在單機系統(tǒng)中我們會把日志文件寫入磁盤以避免內(nèi)存數(shù)據(jù)丟失),但多臺服務器同時故障的概率卻可以低到能夠滿足數(shù)據(jù)可靠性的要求。對于實時性要求高的應用,盤古提供接口,使得數(shù)據(jù)文件進入指定數(shù)量服務器的內(nèi)存即可認為是寫成功;盤古的后臺線程隨后會把內(nèi)存中的數(shù)據(jù)批量寫入磁盤。

盤古在保證內(nèi)存日志的可靠性和低延時上做了如下考慮。

·保證redo log是多份拷貝的,避免單機故障造成數(shù)據(jù)損壞或丟失。

·為降低寫入延遲,確保redo log寫入多個數(shù)據(jù)服務器內(nèi)存buffer后即返回成功,由后臺工作線程保證內(nèi)存數(shù)據(jù)在很短時間內(nèi)持久化到磁盤。

·嚴格檢測redo log數(shù)據(jù)的健康狀態(tài),并及時采取補救策略確保數(shù)據(jù)的可靠性。

分布式系統(tǒng)的一個優(yōu)勢是對單點故障的屏蔽:數(shù)據(jù)的可靠性通過多臺服務器間的復制備份得到極大的增強。對于單機,內(nèi)存數(shù)據(jù)是易丟失的;但在多機環(huán)境下,如果能保證服務器不是同一時間宕機,并輔以嚴格的策略保證,內(nèi)存數(shù)據(jù)在不降低可靠性的情況下,可以極大地提高性能。阿里云的數(shù)據(jù)中心保證了很好的硬件隔離和冗余,并備有UPS等應急措施,為我們提供了使用內(nèi)存緩沖的良好硬件環(huán)境。

下面主要介紹我們在內(nèi)存文件數(shù)據(jù)可靠性上的一些考慮。

寫入內(nèi)存階段

·確保多個數(shù)據(jù)服務器成功接收數(shù)據(jù)并放到內(nèi)存buffer中(這點是redo log的設計基礎)。

·選擇數(shù)據(jù)服務器充分考慮硬件的隔離性,避免故障的關聯(lián)。

·在接受數(shù)據(jù)時數(shù)據(jù)服務器判斷自身的健康狀態(tài):

·所寫的磁盤狀態(tài)是正常的,并且剩余空間足夠;

·當前的workload狀況良好,比如內(nèi)存和I/O隊列沒有超負荷。

  內(nèi)存到磁盤持久化階段

·限制從內(nèi)存buffer到磁盤I/O的最長時間(30秒內(nèi))。

·發(fā)現(xiàn)寫入超時后(比如磁盤異常慢或I/O請求超載),立刻通知master服務器進行復制備份。

·當發(fā)現(xiàn)寫入異常(磁盤壞或者滿等)后,立刻報警,通知master復制。

檢測與復制階段

·監(jiān)測磁盤異常和后臺檢查數(shù)據(jù)完整性,發(fā)現(xiàn)異常后立刻通知master復制。

可以看出,寫入內(nèi)存階段的策略是預防措施;內(nèi)存到磁盤持久化階段最危險,我們確保這個階段盡可能短(保證預期性能的情況下給出最長寫入時間),并在確認出錯后及時采取措施;檢測與復制階段是典型的磁盤壞掉但保證數(shù)據(jù)不丟的策略。

小結

在設計和實現(xiàn)飛天億恩石頭QQ:673606008 電話:18237160419平臺過程中,工程師們花費了大量努力來應對海量硬件所帶來的可靠性的挑戰(zhàn)。本文敘述了部分設計思路但遠遠不是全部。錘煉一個健壯的大規(guī)模分布式系統(tǒng)一定需要良好的設計、精致的實現(xiàn)以及嚴格的測試。有了飛天這個穩(wěn)定可靠的云OS內(nèi)核,各種豐富的億恩石頭QQ:673606008 電話:18237160419服務及應用便有了生存、長大的肥沃土壤。我們隨后將會介紹的各種云服務,正是運行建立在阿里云自行研發(fā)的飛天億恩石頭QQ:673606008 電話:18237160419平臺上。億恩科技石頭 負責服務器租用和托管業(yè)務
聯(lián)系人:石頭
QQ:億恩石頭673606008
電話:0371-63322217
手機:18237160419
地址:鄭州市黃河路姚寨路天一大廈B座608室


本文出自:億恩科技【www.riomediacenter.com】

服務器租用/服務器托管中國五強!虛擬主機域名注冊頂級提供商!15年品質保障!--億恩科技[ENKJ.COM]

  • 您可能在找
  • 億恩北京公司:
  • 經(jīng)營性ICP/ISP證:京B2-20150015
  • 億恩鄭州公司:
  • 經(jīng)營性ICP/ISP/IDC證:豫B1.B2-20060070
  • 億恩南昌公司:
  • 經(jīng)營性ICP/ISP證:贛B2-20080012
  • 服務器/云主機 24小時售后服務電話:0371-60135900
  • 虛擬主機/智能建站 24小時售后服務電話:0371-60135900
  • 專注服務器托管17年
    掃掃關注-微信公眾號
    0371-60135900
    Copyright© 1999-2019 ENKJ All Rights Reserved 億恩科技 版權所有  地址:鄭州市高新區(qū)翠竹街1號總部企業(yè)基地億恩大廈  法律顧問:河南亞太人律師事務所郝建鋒、杜慧月律師   京公網(wǎng)安備41019702002023號
      0
     
     
     
     

    0371-60135900
    7*24小時客服服務熱線