Hadoop掀起大數(shù)據(jù)革命 三巨頭齊發(fā)力
分享 2011.11.15 瀏覽次數(shù):7094次
導(dǎo)讀:開(kāi)源的數(shù)據(jù)處理平臺(tái)憑借其低成本、高擴(kuò)展性和靈活性的優(yōu)勢(shì)已經(jīng)贏得了多數(shù)網(wǎng)絡(luò)巨頭的認(rèn)可?,F(xiàn)在Hadoop將進(jìn)入更多企業(yè)。 IBM將在明年推出內(nèi)置NoSQL技術(shù)的DB2旗艦級(jí)數(shù)據(jù)庫(kù)管理系統(tǒng)。上個(gè)月Oracle和Microsoft也分別透露了將計(jì)劃在明年發(fā)布基于 Hadoop的產(chǎn)品。兩家公司都計(jì)劃提供協(xié)助部署服務(wù)和企業(yè)級(jí)支持。Oracle已經(jīng)承諾將會(huì)在大數(shù)據(jù)設(shè)備中預(yù)裝Hadoop軟件。
大數(shù)據(jù)革命正以Apache Hadoop為呼叫中心如火如荼的進(jìn)行著。自從開(kāi)源分布式數(shù)據(jù)處理平臺(tái)在5年前發(fā)布時(shí)討論之聲就不絕于耳。但在過(guò)去的18個(gè)月中,Hadoop贏得了客戶的認(rèn)可,并得到眾多商業(yè)化的支持以及眾多數(shù)據(jù)庫(kù)和數(shù)據(jù)集成軟件商的整合。在眾多廠商之中最著名的三個(gè)商業(yè)數(shù)據(jù)供應(yīng)商當(dāng)屬Oracle、IBM和 Microsoft。
Hadoop會(huì)在未來(lái)成為大數(shù)據(jù)的重大技術(shù)嗎?
Hadoop是一個(gè)基于Java的分布式密集數(shù)據(jù)處理和數(shù)據(jù)分析的軟件框架。Hadoop在很大程度上是受Google在2004年白皮書(shū)中闡述的 MapReduce的技術(shù)啟發(fā)。MapReduce工作原理是將任務(wù)分解為成百上千塊的小任務(wù),然后發(fā)送到計(jì)算機(jī)集群中。每臺(tái)計(jì)算機(jī)再傳送會(huì)自己那部分信息,MapReduce則迅速整合這些反饋并形成答案。
Hadoop的擴(kuò)展性非常優(yōu)秀,Hadoop可處理分布在數(shù)以千計(jì)的低成本X86服務(wù)器計(jì)算節(jié)點(diǎn)中的大型數(shù)據(jù)。同時(shí)由于眾所周知的摩爾定律,內(nèi)存和磁盤的容量也在不斷增長(zhǎng)。Hadoop對(duì)硬件的支持也在加強(qiáng),現(xiàn)在每個(gè)節(jié)點(diǎn)可部署16核的處理器,12TB甚至24TB磁盤。Cloudera透露其推出的產(chǎn)品每個(gè)節(jié)點(diǎn)的成本大約4000美元。這個(gè)價(jià)格對(duì)于關(guān)系數(shù)據(jù)庫(kù)部署每TB 10000至12000美元來(lái)說(shuō)極具競(jìng)爭(zhēng)優(yōu)勢(shì)。
這種高容量低成本的組合引人注目,但Hadoop最吸引人的是其處理混合數(shù)據(jù)類型的能力。
Hadoop可以管理結(jié)構(gòu)化數(shù)據(jù),以及諸如服務(wù)器日志文件和Web點(diǎn)擊流的數(shù)據(jù)。同時(shí)還可以管理以非結(jié)構(gòu)化文本為中心的數(shù)據(jù),如Facebook和 Twitter。這種處理多類型數(shù)據(jù)的能力非常重要。它催生了NoSQL平臺(tái)和產(chǎn)品。如Cassandra, CouchDB, MongoDB以及Oracle最新的NoSQL數(shù)據(jù)庫(kù)。而傳統(tǒng)關(guān)系型數(shù)據(jù)庫(kù)如Oracle,IBM DB2,Microsoft SQL Server和MySQL則都不能處理混合數(shù)據(jù)類型和非結(jié)構(gòu)化數(shù)據(jù)。 由于事務(wù)處理靈活性的需求,Hadoop獲得大多數(shù)數(shù)據(jù)分析廠商的關(guān)注和支持。
Hadoop已被廣泛應(yīng)用
現(xiàn)今,Hadoop已被認(rèn)為是非結(jié)構(gòu)化數(shù)據(jù)的專用技術(shù)。低成本、高擴(kuò)展性和靈活性等優(yōu)勢(shì)已成為處理大規(guī)模點(diǎn)擊流量分析和廣告定位等網(wǎng)絡(luò)巨頭(如AOL和comScore)的首選。
AOL三年多時(shí)間一直使用Hadoop。AOL的研發(fā)團(tuán)隊(duì)在加利福尼亞州的Mountain View部署了300節(jié)點(diǎn)的系統(tǒng),該系統(tǒng)可以存儲(chǔ)每天數(shù)十億事件和超過(guò)500TB的點(diǎn)擊流數(shù)據(jù)。點(diǎn)擊所帶來(lái)流數(shù)據(jù)是高度結(jié)構(gòu)化的,但數(shù)據(jù)量是非常龐大和多樣的。所以幾乎不可能處理所有的提取、轉(zhuǎn)換和負(fù)載工作。AOL為了解決以上問(wèn)題決定使用Hadoop MapReduce處理分布在數(shù)百個(gè)計(jì)算節(jié)點(diǎn)的數(shù)據(jù)過(guò)濾和關(guān)聯(lián)任務(wù)。由于Hadoop為業(yè)務(wù)帶來(lái)的優(yōu)勢(shì),AOL的Hadoop研發(fā)團(tuán)隊(duì)在今年四月在其總部部署了700節(jié)點(diǎn)的系統(tǒng)。
Hadoop適用于所有類型數(shù)據(jù)的特性注定將使Hadoop在更廣泛的領(lǐng)域使用。例如提供托管服務(wù)和中小型企業(yè)應(yīng)用服務(wù)提供商SunGrad。他們將計(jì)劃推出基于云的托管服務(wù),旨在幫助金融服務(wù)公司處理他們基于Hadoop MapReduce的數(shù)據(jù)處理。
商用軟件廠商Tidemark最近也推出一款SaaS軟件,這種基于云的性能管理應(yīng)用使用MapReduce將混合數(shù)據(jù)源轉(zhuǎn)化為產(chǎn)品或金融規(guī)劃方案。
三巨頭大數(shù)據(jù)領(lǐng)域齊發(fā)力
在上月美國(guó)拉斯維加斯舉行IOD年度大會(huì)上IBM院士、DB2總架構(gòu)師Curt Cotner宣布IBM將在明年推出內(nèi)置NoSQL技術(shù)的DB2旗艦級(jí)數(shù)據(jù)庫(kù)管理系統(tǒng)。他還表示未來(lái)的數(shù)據(jù)庫(kù)發(fā)展方向是非關(guān)系數(shù)據(jù)庫(kù)NoSQL。目前 Google的BigTable和Amazon的Dynamo都用NoSQL型數(shù)據(jù)庫(kù),而傳統(tǒng)的關(guān)系數(shù)據(jù)庫(kù)在應(yīng)付超大規(guī)模、高并發(fā)的SNS、web2.0 網(wǎng)站已經(jīng)力不從心。同時(shí)IBM發(fā)布了一系列數(shù)據(jù)分析軟件,包括云計(jì)算版本的InfoSphere BigInsights。BigInsights是一套建立在Hadoop上的數(shù)據(jù)分析軟件,能夠處理企業(yè)用戶收集大量非結(jié)構(gòu)化資料。
微軟也在10月12日在西雅圖舉行的SQL PASS 2011峰會(huì)宣布將與從雅虎分拆出來(lái)的Hortonworks合作開(kāi)發(fā)Hadoop,并將在Apache Hadoop上實(shí)現(xiàn)搭建Windows Azure以及Windows Server平臺(tái)。同時(shí)基于Hadoop的Windows Server還會(huì)與微軟現(xiàn)有的BI工具聯(lián)合處理任務(wù)。
Oracle作為全球最大的關(guān)系型數(shù)據(jù)庫(kù)提供商也有所行動(dòng)。其在2011 Oracle全球大會(huì)上推出了Big Data Appliance。Big Data Appliance是一個(gè)集成了Hadoop、NoSQL Database、Oracle數(shù)據(jù)庫(kù)Hadoop適配器、Oracle數(shù)據(jù)庫(kù)Hadoop裝載器及R語(yǔ)言的系統(tǒng)。
Hadoop的未來(lái)
根據(jù)目前的狀況來(lái)看,Hadoop作為企業(yè)級(jí)數(shù)據(jù)倉(cāng)庫(kù)體系結(jié)構(gòu)核心技術(shù),在未來(lái)的數(shù)年中將會(huì)保持持續(xù)增長(zhǎng)的勢(shì)頭。包括MapR、Zettaset、 Cloudera、HStreaming、Hadapt、DataStax、Datameer這些與Hadoop相關(guān)的新公司已經(jīng)獲得投資,為人們所熟知,為各種市場(chǎng)帶來(lái)最新技術(shù)。
與此同時(shí)下一代的MapReduce會(huì)完善很多之前不盡人如意的地方。首先節(jié)點(diǎn)數(shù)將從目前的4000增加到6000-10000,其次并發(fā)的任務(wù)數(shù)從目前的40000增加到100000。另外將繼續(xù)加大對(duì)硬件支持,同時(shí)架構(gòu)也會(huì)有所改變,包括更多編程模式的支持。
歡迎轉(zhuǎn)載,本文版權(quán)歸于杭州網(wǎng)站建設(shè)(http://szfjc.cn)
更多IT行業(yè)資訊:怎么樣提升(IT)產(chǎn)品用戶體驗(yàn)?
-
杭州網(wǎng)站設(shè)計(jì)公司:品牌網(wǎng)站開(kāi)發(fā)助力企業(yè)成長(zhǎng)
日期:2024-12-20瀏覽次數(shù):739次
-
杭州網(wǎng)站建設(shè)公司:商城網(wǎng)站建設(shè)的六大關(guān)鍵步驟
日期:2024-12-18瀏覽次數(shù):778次
-
杭州網(wǎng)站制作:醫(yī)院網(wǎng)站設(shè)計(jì)與域名備案的復(fù)雜性探討
日期:2024-12-18瀏覽次數(shù):776次
-
杭州網(wǎng)站制作公司:打造安全可靠的醫(yī)院網(wǎng)站
日期:2024-12-11瀏覽次數(shù):952次
-
杭州網(wǎng)站設(shè)計(jì)公司:數(shù)據(jù)庫(kù)在高端網(wǎng)站制作中的關(guān)鍵作用
日期:2024-12-11瀏覽次數(shù):920次
相關(guān)新聞
整合同類新聞,相關(guān)新聞一手掌握
-
肇慶定制app的常用開(kāi)發(fā)語(yǔ)言有哪些
日期:2020-10-12瀏覽次數(shù):2156次
-
肇慶app開(kāi)發(fā)常常會(huì)遇到的困擾
日期:2020-10-12瀏覽次數(shù):2137次
-
肇慶網(wǎng)站制作:一個(gè)良好的網(wǎng)頁(yè)設(shè)計(jì)有什么用
日期:2020-09-10瀏覽次數(shù):2078次
-
肇慶網(wǎng)站設(shè)計(jì):設(shè)計(jì)反饋如何促成出色的網(wǎng)站設(shè)計(jì)?
日期:2020-09-10瀏覽次數(shù):2014次
最新新聞
與互聯(lián)網(wǎng)同行,實(shí)時(shí)掌握網(wǎng)建行業(yè)最新動(dòng)態(tài)
-
公司網(wǎng)站需求分析
日期:2016-05-06瀏覽次數(shù):5469次
-
紅色系網(wǎng)頁(yè)案例分析
日期:2018-01-16瀏覽次數(shù):5406次
-
杭州定制小程序,如何深挖用戶需求?
日期:2021-08-05瀏覽次數(shù):4102次
-
杭州網(wǎng)站營(yíng)銷推廣三大費(fèi)用
日期:2021-08-06瀏覽次數(shù):4319次
-
杭州開(kāi)發(fā)小程序后,杭州企業(yè)運(yùn)營(yíng)有哪些優(yōu)勢(shì)?
日期:2021-08-24瀏覽次數(shù):4488次
隨機(jī)新聞
新聞新動(dòng)態(tài),您需要的新聞管家
洞悉市場(chǎng)趨勢(shì)演變讓傳播回歸社會(huì)
免費(fèi)獲取網(wǎng)站建設(shè)與網(wǎng)絡(luò)推廣方案報(bào)價(jià)
-
關(guān)于我們
杭州帷拓科技有限公司,是一家新型的全案網(wǎng)絡(luò)開(kāi)發(fā)公司,作為以互聯(lián)網(wǎng)高端網(wǎng)站建設(shè)、APP開(kāi)發(fā)、小程序開(kāi)發(fā)為核心的專業(yè)網(wǎng)絡(luò)技術(shù)服務(wù)供應(yīng)商,帷拓科技致力于全面分析市場(chǎng)環(huán)境、衡量與預(yù)測(cè)市場(chǎng)需求、整合區(qū)別于行業(yè)競(jìng)爭(zhēng)對(duì)手的絕對(duì)優(yōu)勢(shì),結(jié)合品牌理念深度挖掘項(xiàng)目?jī)?yōu)勢(shì)和產(chǎn)品價(jià)值,提升客戶品牌認(rèn)知、認(rèn)可度。
-
我們的客戶
帷拓科技?xì)v經(jīng)十年沉淀,與國(guó)內(nèi)外上千家客戶達(dá)成合作關(guān)系,其中穩(wěn)定合作的公司有:浙江華為、浙江移動(dòng)、浙江5G產(chǎn)業(yè)聯(lián)盟、浙江省社科院、綠城足球俱樂(lè)部、娃哈哈雙語(yǔ)學(xué)校、健康中國(guó)杭州峰會(huì)、科雷機(jī)電等,帷拓科技始終堅(jiān)持“帷有專業(yè),才能拓展無(wú)限”的服務(wù)理念,堅(jiān)持“認(rèn)真堅(jiān)持細(xì)節(jié)”的優(yōu)質(zhì)服務(wù)理念,不斷完善自身,成就企業(yè),最終實(shí)現(xiàn)共贏。
-
我們的業(yè)務(wù)
帷拓科技主營(yíng)業(yè)務(wù)范圍包含互聯(lián)網(wǎng)高端網(wǎng)站建設(shè)、APP開(kāi)發(fā)、小程序開(kāi)發(fā)、商城網(wǎng)站建設(shè)、公眾號(hào)運(yùn)營(yíng)以及數(shù)字營(yíng)銷等,涵蓋了服務(wù)、房產(chǎn)、數(shù)碼、服裝、物流貿(mào)易等行業(yè),根據(jù)品牌現(xiàn)狀,為每個(gè)客戶量身定制項(xiàng)目整體服務(wù)方案,以敏銳的市場(chǎng)洞察力、創(chuàng)新的市場(chǎng)策劃能力,全面把握市場(chǎng)變化,為客戶實(shí)現(xiàn)從企業(yè)到消費(fèi)者的價(jià)值轉(zhuǎn)換。