2016年3月28日,云創(chuàng)大數(shù)據(jù)宣布正式成立深度學(xué)習(xí)組。自此之后,云 創(chuàng)大數(shù)據(jù)將應(yīng)用趨于成熟的云計(jì)算技術(shù)優(yōu)勢(shì),依托大數(shù)據(jù)的數(shù)據(jù)管理平臺(tái),為全新的深度學(xué)習(xí)版圖提供強(qiáng)有力的支撐。這既是云創(chuàng)大數(shù)據(jù)繼2016年1月4日啟動(dòng) 平臺(tái)部以后的又一重大舉措,也是其順應(yīng)深度學(xué)習(xí)大潮的不二之選。

早在2011年,Google X從YouTube視頻中抽取了1000萬(wàn)張靜態(tài)圖片,把它“喂”給“谷歌大腦”,目標(biāo)是從中尋找重復(fù)出現(xiàn)的圖案。3天后,谷歌大腦在沒(méi)有人類幫助的情況下,從這些圖片中發(fā)現(xiàn)了“貓”,實(shí)現(xiàn)了在互聯(lián)網(wǎng)中“自學(xué)成才”。

2012年,微軟公開(kāi)演示了一個(gè)全自動(dòng)的同聲傳譯系統(tǒng),講演者用英文演講,后臺(tái)的計(jì)算機(jī)一氣呵成自動(dòng)完成語(yǔ)音識(shí)別、英中機(jī)器翻譯和中文語(yǔ)音合成,效果非常流暢,而其支撐的關(guān)鍵技術(shù)也是深度神經(jīng)網(wǎng)絡(luò)(DNN),或者深度學(xué)習(xí)(DL)。

2016年,機(jī)器人AlphaGo在距離擊敗歐洲圍棋冠軍樊輝不到半年的時(shí)間,又以4:1的比分戰(zhàn)勝了九段棋手李世石,以強(qiáng)悍的深度學(xué)習(xí)再一次刷新了人類對(duì)人工智能程序的認(rèn)識(shí)與理解。

上圖為計(jì)算機(jī)眼中的國(guó)際象棋落子思路,而下圖為計(jì)算機(jī)眼中的圍棋落子思路

因此,深度學(xué)習(xí)儼然成為了機(jī)器學(xué)習(xí)研究的新領(lǐng)域,而其動(dòng)機(jī)在于建立、模擬 人腦進(jìn)行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)。這些用多層神經(jīng)元構(gòu)成的電腦神經(jīng)網(wǎng)絡(luò)像人類大腦一樣,可以收集信息,從而模仿人腦的機(jī)制來(lái)解釋數(shù)據(jù),例如圖像,聲音和文本 等,并基于收集到這些信息做出相應(yīng)行為,以達(dá)到機(jī)器學(xué)習(xí)的功能。

深度學(xué)習(xí)廣為人知的便是視覺(jué)功能,如果說(shuō)相機(jī)能夠記錄這個(gè)世界,那么深度 學(xué)習(xí)卻可以看懂這個(gè)世界。有了深度學(xué)習(xí),我們可以很方便地刷臉付款,百度識(shí)圖可以準(zhǔn)確識(shí)別照片中的物體類別,并對(duì)照片進(jìn)行自動(dòng)歸類或搜索,有了深度學(xué)習(xí), 機(jī)器可以檢測(cè)一定空間內(nèi)所有人員、車輛的行蹤,并對(duì)可疑和危險(xiǎn)事件及時(shí)報(bào)警。云創(chuàng)大數(shù)據(jù)深度學(xué)習(xí)組的成立,正是適應(yīng)時(shí)代大潮的必然選擇。
深度學(xué)習(xí)的基礎(chǔ)——海量的數(shù)據(jù)資源
“深度學(xué)習(xí)需要大數(shù)據(jù)的助力,就像火箭有了燃料。”潘爭(zhēng)博士曾介紹,深度 學(xué)習(xí)技術(shù)建立在大量實(shí)例基礎(chǔ)上,就像小孩收集現(xiàn)實(shí)世界的信息一樣,而且“喂”的數(shù)據(jù)越多,它就越聰明,并且不會(huì)“消化不良”。因?yàn)榇髷?shù)據(jù)的不可或缺,所以 目前深度學(xué)習(xí)做得最好的基本是擁有大量數(shù)據(jù)的IT巨頭,如谷歌、微軟、百度等。

對(duì)此,云創(chuàng)大數(shù)據(jù)具有得天獨(dú)厚的大數(shù)據(jù)平臺(tái)優(yōu)勢(shì)。其中,智能硬件大數(shù)據(jù)免 費(fèi)托管平臺(tái)——萬(wàn)物云(http://www.wanwuyun.com/)基于數(shù)據(jù)立方云計(jì)算大數(shù)據(jù)庫(kù),無(wú)限承載物聯(lián)網(wǎng)與智能硬件數(shù)據(jù),支撐數(shù)億個(gè)手機(jī) 的實(shí)時(shí)信令流在線處理,可提供實(shí)時(shí)、可靠、安全、免費(fèi)的一站式數(shù)據(jù)托管服務(wù)。

其次,環(huán)境云(http://www.envicloud.cn/)作為 環(huán)境大數(shù)據(jù)免費(fèi)開(kāi)放平臺(tái),通過(guò)大規(guī)模布設(shè)各種傳感器,全面實(shí)時(shí)感知環(huán)境,以API共享與環(huán)境有關(guān)的多元化數(shù)據(jù)(包括水體環(huán)境、大氣環(huán)境、污染物排放、地質(zhì) 災(zāi)害、氣象災(zāi)害、城市位置查詢、城市編碼查詢等),同時(shí)支持多種應(yīng)用,可提供海量?jī)?yōu)質(zhì)的環(huán)境數(shù)據(jù)。

深度學(xué)習(xí)的支撐——強(qiáng)悍的計(jì)算能力
如前所述,深度學(xué)習(xí)通過(guò)算法快速識(shí)別各種數(shù)據(jù)類型,同時(shí)提升分析能力。在 這個(gè)過(guò)程中,神經(jīng)網(wǎng)絡(luò)的參數(shù)非常多,對(duì)于數(shù)據(jù)存儲(chǔ)和處理的需求不可謂不龐大。對(duì)此,云創(chuàng)大數(shù)據(jù)諸多解決方案可提供一流的設(shè)備和開(kāi)發(fā)環(huán)境,并配備了詳細(xì)的指 導(dǎo)書籍和實(shí)驗(yàn)設(shè)計(jì),依托其cStor云存儲(chǔ)、cProc云處理優(yōu)勢(shì),云創(chuàng)大數(shù)據(jù)將提供強(qiáng)大的計(jì)算能力,為深度學(xué)習(xí)提供數(shù)據(jù)分析支撐。

廣泛應(yīng)用的云創(chuàng)大數(shù)據(jù)產(chǎn)品
此外,云創(chuàng)大數(shù)據(jù)作為江蘇省信息產(chǎn)業(yè)企業(yè)聯(lián)合研發(fā)創(chuàng)新中心與南京市工程技 術(shù)研究中心,與多家專業(yè)機(jī)構(gòu)合作建設(shè)了聯(lián)合實(shí)驗(yàn)室,可滿足大數(shù)據(jù)和深度學(xué)習(xí)的實(shí)驗(yàn)需求,而云創(chuàng)大數(shù)據(jù)旗下的中國(guó)云計(jì)算 (www.712333com.com)、中國(guó)大數(shù)據(jù)(www.thebigdata.cn)、中國(guó)機(jī)器人(http://www.ro-bot.cn/)等在搜索引擎關(guān)鍵詞中排名領(lǐng)先的網(wǎng)站,可為深度學(xué)習(xí)的深化與拓展方面提供多元化的資源。
深度學(xué)習(xí)的保障——優(yōu)秀導(dǎo)師和專業(yè)團(tuán)隊(duì)
在導(dǎo)師方面,作為云創(chuàng)大數(shù)據(jù)的首席科學(xué)家,清華大學(xué)博士、中國(guó)信息學(xué)會(huì)大 數(shù)據(jù)分會(huì)副會(huì)長(zhǎng)劉鵬教授將作為深度學(xué)習(xí)小組的牽頭人,將帶領(lǐng)整個(gè)團(tuán)隊(duì)在機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺(jué)、語(yǔ)義理解檢索等領(lǐng)域展開(kāi)縱深研究。劉鵬教授先后主持完成了科 研項(xiàng)目18項(xiàng),發(fā)表論文80余篇,曾率隊(duì)奪得2002 PennySort國(guó)際計(jì)算機(jī)排序比賽冠軍,并出版了包括國(guó)內(nèi)第一本深入剖析云計(jì)算技術(shù)的教材——《云計(jì)算》、《實(shí)戰(zhàn)Hadoop》等12本專業(yè)書籍,而 其涵蓋大數(shù)據(jù)、機(jī)器學(xué)習(xí)、人工智能等內(nèi)容的系列教材也即將問(wèn)世。

此外,對(duì)于深度學(xué)習(xí)目前應(yīng)用最廣的視覺(jué)功能,云創(chuàng)大數(shù)據(jù)自成立之初就成立 了強(qiáng)大的cVideo云視頻團(tuán)隊(duì),并在早前已實(shí)現(xiàn)視頻整合、轉(zhuǎn)碼處理和智能識(shí)別等功能,可滿足不同終端的訪問(wèn)需求以及實(shí)現(xiàn)車流統(tǒng)計(jì)等交通數(shù)據(jù)的提取,實(shí)現(xiàn) 了與南京青奧專網(wǎng)、交管局、交通局、公安局、城市高點(diǎn)監(jiān)控、道路圖像監(jiān)控“320”工程等現(xiàn)有視頻監(jiān)控平臺(tái)的對(duì)接,在智慧南京、智慧宜昌等多個(gè)項(xiàng)目得到了 廣泛應(yīng)用。


在此基礎(chǔ)上,cVideo云視頻團(tuán)隊(duì)還獨(dú)創(chuàng)了“視頻DNA”檢索技術(shù)。 “視頻DNA”通過(guò)對(duì)人的走路姿態(tài)進(jìn)行建模,充分利用人走路所形成的三維空間特征,加上時(shí)間特征,提取出實(shí)現(xiàn)連續(xù)走路姿態(tài)的一個(gè)DNA樣本,從而在大量樣 本的集合庫(kù)中進(jìn)行與特定人物DNA的比對(duì),實(shí)現(xiàn)實(shí)時(shí)、快速、有效地視頻DNA檢索。目前這一技術(shù)已經(jīng)成功用于案件偵破。

