云計算的“大數據”之年 盤點PaaS發(fā)展狀況 |
發(fā)布時間: 2012/9/5 17:56:28 |
諸如Amazon公司、Google公司、Heroku、IBM公司以及微軟公司等主要的PaaS廠商將今年定為云計算的“大數據”之年一事已得到了大肆宣傳。但是,實際上在公共云計算中又是哪一家供應商提供了最為完整的Apache Hadoop實施呢?
隨著企業(yè)越來越多地采用平臺即服務(PaaS)云計算模式作為企業(yè)的數據倉庫應用解決方案,Apache Hadoop以及HDFS、MapReduce、Hive、Pig與其他的子組件正在成為大數據分析的主力軍,這一趨勢也變得逐漸明朗化。為了表明Hadoop已經成熟并已可用于生產分析云計算環(huán)境的商用化應用,Apache Foundation已升級至具有里程碑性質的Hadoop v1.0版本。 在供應商的數據中心為批處理托管MapReduce處理創(chuàng)建高擴展性、即付即用Hadoop集群的能力可允許企業(yè)IT部門避免因內部自有服務器的零星使用而造成的資本支出。其結果就是,Hadoop已成為財大氣粗PaaS供應商們(Amazon、Google、IBM和微軟)的必需品,以打包Hadoop、MapReduce或這兩者作為其預建服務。 AWS的彈性MapReduce 2009年四月Amazon網絡服務(AWS)成為了彈性MapReduce(EMR)的始作俑者。EMR處理Hadoop集群配置、運行和終止任務以及在Amazon EC2和Amason S3(簡單存儲服務)之間實現(xiàn)數據傳輸。EMR還提供了Apache Hive,它可建立在Hadoop之上以用于數據倉庫服務。
Amazon網絡服務的彈性MapReduce功能,對CloudWatch工作的工作流指標進行采樣。(圖片由AWS提供) 對于從機故障,EMR是有故障容錯機制的;Amazon建議以Spot Instances只運行任務實例組,從而實現(xiàn)在利用更低成本優(yōu)勢的同時仍然保持可用性。但是,在2011年八月之前AWS并不支持Spot Instances。 Amazon為EMR定出了每小時0.015至0.05美元的附加費標準,并將其作為小型云主機至超強集群云主機EC2實例的額定值。根據AWS的官方說法:一旦你開始了工作流,Amazon彈性MapReduce就處理Amazon EC2的實例配置、安全設置、Hadoop配置以及設置、日志收集、健康監(jiān)控以及其他與硬件相關的復雜性,例如從你正在運行的工作流中自動移除故障實例。AWS于近期為EMR實例發(fā)布了免費CloudWatch指標。(圖1) 本文出自:億恩科技【www.riomediacenter.com】 |