中國電子學會云計算專家委員會委員、解放軍理工大學教授劉鵬(騰訊科技攝)
騰訊科技訊 11月2日下午消息,“網(wǎng)絡技術創(chuàng)新應用論壇暨2009云計算產(chǎn)業(yè)峰會”在北京國際會議中心舉行。作為2009中國互聯(lián)網(wǎng)大會的重要組成部分,本次峰會將以“解讀云計算中的沸點與精彩”為主題,重點探討云計算的應用與發(fā)展趨勢,對用戶信息化應用將產(chǎn)生的實際影響,分享最新研究成果及實踐經(jīng)驗。云計算的理念和模式如何能夠在中國特色互聯(lián)網(wǎng)應用中落地,給中國互聯(lián)網(wǎng)用戶切實帶來怎樣的革命性進步,都將在2009云計算峰會中給出全新答案。
2009互聯(lián)網(wǎng)大會會于11月2日至3日在北京召開,騰訊科技作為官方指定戰(zhàn)略合作門戶網(wǎng)站、官方指定獨家合作新聞中心進行全方位的視頻、圖文采訪與直播。特設立4個現(xiàn)場專訪間,力邀業(yè)界專家與企業(yè)代表剖析產(chǎn)業(yè)現(xiàn)狀,暢談產(chǎn)業(yè)前景,并就金融危機一年來的發(fā)展進行深度解讀。
以下為中國電子學會云計算專家委員會委員、解放軍理工大學教授劉鵬演講的文字實錄:
演講題目:《云計算--將計算變成水和電》
對應的PPT請下載:http://www.712333com.com/download/ppt/cloud_liupeng.ppt (11MB)
劉鵬:我今天主要講講云計算一些內(nèi)在的東西,從技術上看,它到底是什么?另外,云計算為什么受歡迎?然后我們對未來做一些預測。
我們有一個夢想。這個夢想始于很多年前。就是我們希望使用互聯(lián)網(wǎng)上的資源能不能像水和電一樣,打開龍頭插上插頭就可以使用了,而不必關心計算、存儲、數(shù)據(jù)資源在什么地方。這個夢想有沒有實現(xiàn)呢?我們正一步一步走向這個實現(xiàn)階段。
首先我們看網(wǎng)格計算。所謂網(wǎng)格計算,是在動態(tài)變化,由多個機構組成的虛擬組織中協(xié)調(diào)資源共享和求解問題。網(wǎng)格現(xiàn)在發(fā)展得怎么樣呢?現(xiàn)在美國的TeraGrid網(wǎng)格已經(jīng)集成了幾百家機構的高性能計算資源。歐洲的EGEE網(wǎng)格已經(jīng)集成了48個國家250個站點的資源,平均每天運行的作業(yè)量是15萬個。這個已經(jīng)朝我們剛才說的夢想前進了一大步。但是這個網(wǎng)格為什么沒有引起我們極大的興趣呢,因為這個網(wǎng)格主要是局限于一些大的研究機構,沒有走進我們的日常生活。
走進日常生活的計算就是云計算。由于公眾對網(wǎng)格的熱情不像以前那么濃了,現(xiàn)在逐漸成為科學家的一種基礎設施了,而且它的應用面是有限的。但是云計算,大家可以看到,從07到09年增長速度是非??斓?。包括Google、亞馬遜、微軟、IBM這些重要的大公司,以及Facebook、Salesforce這樣的小公司也在用云計算。
我對云計算下的定義是:云計算是一種商業(yè)計算模型,它是將計算任務分布在由大量計算機構成的資源池上面,使各種應用系統(tǒng)能夠根據(jù)需要獲取計算力,存儲空間和信息服務。我們理解的云計算實際上是一個資源池,就好象今天中午我們在吃自助餐一樣。原來我們各點各的菜,現(xiàn)在我們把所有的菜集中在一起,你可以按需獲取你的資源。資源共享了,品種多了,浪費少了。你點來的菜,可能吃掉的只有50%,這還因為我們每天飲食的需求基本上是確定的。如果你每天的需求是不確定的,浪費還會更嚴重。有的時候我們非常餓的時候,點的菜非常多,但是吃不掉。
我們來看看亞馬遜提供的典型的云計算服務,一個是S3,叫簡單存儲服務。S3提供給公眾的編程接口很簡單,就是把數(shù)據(jù)放到虛擬的桶里,交給亞馬遜。想要的時候,把桶中的數(shù)據(jù)取出來。存儲方式的確非常簡單,但是使用起來不方便,用戶必須要調(diào)這個接口,而且沒有目錄,不能直接存儲文件,因為它不支撐POSIX接口。但是S3非常受歡迎,為什么呢?它非常便宜。你存儲一個GB的數(shù)據(jù),存放一個月只需要花費0.15美元。
我們再來看看亞馬遜的EC2服務,即彈性計算云服務。有了EC2,你可以用租用亞馬遜的服務器,動態(tài)租用它10臺機器,或者是100臺機器。它給你提供一個工具,這個工具可以把你機器目前運行的環(huán)境整個打成一個包,這個包叫一個映象。將這個映象傳到亞馬遜的服務器上面,展開之后就可以恢復出跟你機器一模一樣的環(huán)境,這個過程叫做虛擬化。我想將租來的機器虛擬化什么樣都可以,比如我想將租用的機器做成一個數(shù)據(jù)庫,做成一個網(wǎng)站,做成數(shù)據(jù)處理節(jié)點,都可以。我覺得,這是EC2受歡迎最根本的原因之一,即通用性,它使用亞馬遜云計算可以用來滿足各種應用的要求。EC2受歡迎的第二個原因是它的可伸縮性。你的一個映象可以傳到十臺機器,也可以傳到一百臺機器,只要你付錢。當業(yè)務量大的時候,你可以多租一些機器,當業(yè)務量下來的時候,你可以退掉一些機器。EC2受歡迎的第三個原因是它非常便宜,租用一個服務器一小時,只需要付0.10美元,比到網(wǎng)吧用電腦還要便宜得多。
由于亞馬遜提供了非常便宜又非常強大的服務,所以我們可以用它來做以前想都沒想到的事情。比如這家小公司,它的設施基本都可以租用亞馬遜的機器,存儲的數(shù)據(jù)是放在S3服務,處理節(jié)點用的是EC2。還有一家公司SMUGMUG,它的網(wǎng)站上面已經(jīng)有幾億張高清圖片,擁有幾十萬付費用戶,這么大的規(guī)模,這家公司人數(shù)只有五十人,之所以如此,是因為它所有的設施都是托管于亞馬遜的。紐約時報曾經(jīng)使用亞馬遜的服務,在24小時之內(nèi)就把歷史上所有的文章從TIF格式轉化成PDF格式,一共才花了240美元。別少看這240美元,它可以租2400個機器小時。如果紐約時報要用自己的機器來完成的話,需要幾個月的時間才能做好。所以亞馬遜的服務給業(yè)務量不確定應用帶來非常大的好處。事實上,大多數(shù)互聯(lián)網(wǎng)應用都是業(yè)務量不確定的。
我們再來看看Google。Google幾乎所有的業(yè)務,包括Gmail、Google Maps、Google Earth、Google Docs和新近出來的Google Wave,全部都是在云計算上運行的。我們可以通過各種終端、在各種平臺上訪問Google服務,可以是手機,可以是PC,也可以是Macintosh,或者在Linux環(huán)境中。Google之所以能夠做到這一點,根本原因是它后面的云計算設施。Google把這些云設施建到非常偏遠的地區(qū),比較冷和靠近電站的地區(qū),用電成本非常低,通過光纖傳信息來代替通過電線傳電力。Google有一個說法,傳輸光子的成本要遠遠地公共低于傳輸電子。Google的云計算數(shù)據(jù)計算中心目前分布于30多個不同地點,共有200多萬臺計算機。我們來看看一些圖片,這些云設施,被人們稱為“信息時代的核電站”。再看看機房內(nèi)部,有些機房里的機器就是一大堆普通的PC。極其廉價,但非常容易壞。Google認為,機器會壞是正常的,不壞是不正常的。Google牛就牛在任意一個節(jié)點壞,或者兩個節(jié)點同時壞,它的數(shù)據(jù)不會丟,服務不會中斷。它的云計算設施管理起來也非常方便,一個人可以管理上千臺機器。這個人用小推車推了一些機器,看到機架上哪臺機器的燈在閃,就將它拿下來,換一個新的插上去就可以了。你們看,圖片上的機器是難看的背面對外,為什么?更換方便!
要做到這個境界,Google主要依靠四個技術:GFS、MapReduce、Bigtable和Chubby。這里我主要講下Google文件系統(tǒng)GFS。這個文件系統(tǒng)能做什么呢?我們看這張圖:GFS將集群里的節(jié)點分為管理節(jié)點和數(shù)據(jù)節(jié)點兩類。管理節(jié)點存儲元數(shù)據(jù),客戶端通過訪問管理節(jié)點來獲得文件應該存儲在什么位置的信息。一個文件被分布若干塊存儲于不同的數(shù)據(jù)節(jié)點上,客戶端從管理節(jié)點知道存儲的節(jié)點編號后,就可以直接訪問數(shù)據(jù)節(jié)點存取數(shù)據(jù)。這樣,數(shù)據(jù)傳輸是直接發(fā)生在客戶端與管理節(jié)點之間的,管理節(jié)點只需要處理元數(shù)據(jù)訪問請求,從而不會在管理節(jié)點形成瓶頸。我們再來看數(shù)據(jù)是怎么存放的。Google的數(shù)據(jù)塊是比較大的,默認是64MB一塊,這和Google應用的特點有關。任何一塊數(shù)據(jù)在GFS里默認是有3份的,當客戶端向數(shù)據(jù)節(jié)點A存儲了一個數(shù)據(jù)塊,A會立即將它復制給B和C。如果B壞了,會自動再復制一份給D。Google對GFS的訪問作了許多限制,例如不允許在文件的中間去修改數(shù)據(jù),但可以在后面加數(shù)據(jù)。之所以作限制,是為了實現(xiàn)方便并提高整體的可靠性。這個系統(tǒng)無論規(guī)模做得很大,瓶頸也不會顯現(xiàn)出來,這個Google文件系統(tǒng),看似非常簡單,但是是一個非常巧妙的系統(tǒng)。如果GFS只管理了100臺機器,看起來并不高明,甚至比不上常見的分布式文件系統(tǒng),但當GFS管理了100萬臺機器時,它的優(yōu)勢就顯現(xiàn)出來了。這就是規(guī)模效應。
微軟也推出了Azure云計算服務。你可以到微軟的網(wǎng)站上申請一個帳號,它給你一個空間,這個空間是免費的25個GB。這個免費空間的容量是一個非常驚人的數(shù)字。因為我們知道,原來Google發(fā)布Gmail的時候是一個G,后來163做了3個G的免費空間,現(xiàn)在還是3的G。25GB免費,用傳統(tǒng)的技術是根本做不出來的,成本太高。只有用計算才有可能,因為云計算的成本是傳統(tǒng)技術的1/30。如果25個GB用亞馬遜的架構的話,是多少錢呢?考慮到利用率,大概不到十塊錢人民幣,基本上微軟公司每個月花在你這25個G的空間的成本上是只有十塊錢。
國內(nèi)呢,中移動的“大云”是比較早的,從2007年就開始了。這個云設施一共有256個結點,前面他們已經(jīng)介紹了。我們也做了云計算存儲系統(tǒng)MassCloud,現(xiàn)在有少量的部署,在技術上比較特別和實用。
云計算的技術體系是不統(tǒng)一的,不同廠家,亞馬遜、Google、微軟都有不同的解決方案,現(xiàn)在,我們認為它們其實是有共性的。這是我們畫的云計算共用體系結構圖,它們都有資源池,由中間件來管理,只是不同的廠家實現(xiàn)了不同的模塊。
為什么云計算擁有劃時代的優(yōu)勢?主要原因在于它的成本。企業(yè)的IT開銷,分為三部分:硬件開銷、能耗和管理成本。根據(jù)IDG的調(diào)查,全球企業(yè)IT開銷中的硬件開銷是逐年下降的。能耗的成本上升得很厲害,管理的成本上升最厲害。如果使用云計算的話,成本有很大的區(qū)別。剛才中國移動說成本節(jié)省30倍,Google也說節(jié)省了30倍,我們來算一算:根據(jù)UC Berkeley的統(tǒng)計數(shù)據(jù),使用云計算技術后,特大型數(shù)據(jù)中心的網(wǎng)絡、存儲和管理成本較之中型數(shù)據(jù)中心可以降低5-7倍。另外,雖然在我們國家電是統(tǒng)一價格,但在美國是不一樣的,夏威夷本地沒有資源,要運煤過去發(fā)電,所以價格比較貴。愛達荷州的水電比較方便,所以電價比較便宜。二者相差7倍。再者,資源的利用率也不同。比如一個網(wǎng)站,平時訪問人很少,但是到圣誕節(jié)前時候訪問量很多。再比如某一個網(wǎng)站,之前默默無聞,但是突然來個芙蓉姐姐,訪問量爆增。網(wǎng)站擁有者為了應對這些突發(fā)流量,會按照峰值要求來配置服務器資源,造成這些資源的平均利用率只有10-15%。而云計算平臺是大家共享的,資源的利用率平時都能維持在80%左右,這又是5-7倍。云計算有更低的硬件成本和更低的電價,更高的資源利用率,兩個乘起來就是30倍以上的成本節(jié)省。
在這里,我們總結一下云計算的特點。它是超大規(guī)模,是靠規(guī)模效應取勝的;它是虛擬化的,它是高可靠的。它是通用的,這個和網(wǎng)格有很大不同,云計算可以把遠端的云變成任何想要的樣子,而網(wǎng)格計算只能跑高性能計算程序。另外它是高可擴展的,它是按需服務的,它是非常便宜的。由于云計算有這些驚人的特性,所以,我們可以預料,在未來三到五年里,傳統(tǒng)的IT企業(yè)將發(fā)生翻天覆地的變化。例如,IDC企業(yè)如果不轉型的話,如果國內(nèi)出來一個云計算的數(shù)據(jù)中心,它可以用原來三十分之一的價格拉你的客戶的話,你的客戶肯定跑光了。所以云計算將計算變成了大眾用得上和用得起的水和電。
由于云計算的出現(xiàn),使得曾經(jīng)被認為是正確的,后來又認為是非?;闹嚨念A言又變成接近正確的了。一個是IBM的創(chuàng)始人Thomas Watson,他說:“我認為全球大概只需要五臺計算機就夠了”。的確,云計算是靠規(guī)模取勝的,Google、Amazon、Microsoft和IBM等企業(yè)都在拼命擴展他們的云計算版圖。這至少已經(jīng)有4臺“計算機”了。第5臺是誰的?會是中國的嗎?這需要做許多工作。另一個預言是BillGates作的。他說:“640KB內(nèi)存應該對任何人都夠了”。隨著云計算的發(fā)展,上網(wǎng)本、手機上網(wǎng)流行起來了,甚至彩電、冰箱、攝像頭、數(shù)碼相機都能直接上網(wǎng),對終端的能力要求不強了,即使640KB內(nèi)存不夠,2GB應該在相當長的時間里夠了。我們以前老覺得機器慢,老是升級操作系統(tǒng),但現(xiàn)在Windows XP我們已經(jīng)用了許多年了,還不覺得非換不可,為什么?是因為我們上網(wǎng)了,我們的精彩在網(wǎng)上,不在本機上。試想,有了云平臺,未來的精彩將更精彩!
我們來看看網(wǎng)絡計算發(fā)展的趨勢。95年出現(xiàn)了集群計算,98年出來網(wǎng)格計算,99年出了對等計算(P2P),07年出來云計算,那么下一個會出現(xiàn)什么?我們暫且叫做云格,我造了一個新詞,叫Gloud,它是Grid+Cloud。我們把云計算和網(wǎng)格計算做一個比較,網(wǎng)格計算集成不同單位的異構資源,云計算集成同一單位的同構資源。網(wǎng)格計算以科學計算為主,云計算是以數(shù)據(jù)處理為主,網(wǎng)格計算是共享高性能計算機,云計算共享普通計算機。網(wǎng)格主要用在科學界,云計算主要用在商業(yè)社會。網(wǎng)格計算與云計算有很強的互補性。未來它們將融在一個面向服務的開放環(huán)境里面,云和云之間融合,云和網(wǎng)格融合,所有的東西都是服務,這就是我們的未來。
云格(Gloud)的世界將更精彩...
謝謝!
