近日百度宣布在一部超算系統(tǒng)Minwa上部署了深度學(xué)習(xí)算法,進(jìn)而在ImageNet圖像識(shí)別測(cè)試中取得了只有5.98%錯(cuò)誤率的新紀(jì)錄。無(wú)獨(dú)有偶,F(xiàn)acebook也剛剛宣布對(duì)部分深度學(xué)習(xí)代碼開源,以推進(jìn)這項(xiàng)技術(shù)在業(yè)界的普及。深度學(xué)習(xí)這個(gè)概念越來(lái)越頻繁地出現(xiàn)在媒體報(bào)道中,那么究竟什么是“深度學(xué)習(xí)”,它又對(duì)我們的生活有什么影響與好處呢?
讓計(jì)算機(jī)擁有接近人類的智能水平是IT行業(yè)最偉大,也是最難實(shí)現(xiàn)的夢(mèng)想。雖然科幻作品中早就出現(xiàn)了匹敵甚至遠(yuǎn)超人類智能水平的計(jì)算機(jī)、機(jī)器人,但尷尬的是現(xiàn)實(shí)中的計(jì)算機(jī)技術(shù)即使經(jīng)過(guò)六十余年的指數(shù)發(fā)展也仍然與真正的“智能”相去甚遠(yuǎn)。甚至一只小鳥的大腦都要比現(xiàn)時(shí)最強(qiáng)大的超級(jí)計(jì)算機(jī)聰明許多。雖然計(jì)算機(jī)擁有恐怖的計(jì)算能力、數(shù)據(jù)存儲(chǔ)空間,但是一直以來(lái)這些能力卻難以用來(lái)模擬復(fù)雜的思維,而只能執(zhí)行既定的運(yùn)算任務(wù)。
“深度學(xué)習(xí)”是通往人工智能的漫漫長(zhǎng)路上的一項(xiàng)重要的技術(shù)。“深度”是一種專業(yè)術(shù)語(yǔ),表示將某種復(fù)雜問(wèn)題分解成簡(jiǎn)單問(wèn)題的層數(shù)。深度學(xué)習(xí)可以理解為將一項(xiàng)復(fù)雜的概念抽象為多層簡(jiǎn)單概念的疊加,然后通過(guò)簡(jiǎn)單概念的判斷和學(xué)習(xí)來(lái)理解復(fù)雜的整體。例如讓計(jì)算機(jī)從一張圖片上識(shí)別出一只小狗,過(guò)去的做法是由人給圖片加注“圖中有萌犬一只”之類的標(biāo)簽,然后計(jì)算機(jī)根據(jù)標(biāo)簽來(lái)進(jìn)行分類。基于深度學(xué)習(xí)算法的系統(tǒng)的做法完全不同:給計(jì)算機(jī)大量的有小狗內(nèi)容的圖像,然后系統(tǒng)會(huì)自動(dòng)從這些圖像中總結(jié)規(guī)律:所有的圖像中都有一團(tuán)物體、這些物體都有幾條腿、有尾巴、有腦袋、腦袋上有兩只可愛的眼睛……經(jīng)過(guò)大量的訓(xùn)練,計(jì)算機(jī)最終總結(jié)出“小狗”的圖像特征,之后就可以自動(dòng)識(shí)別出圖像是否包含這些特征。這一學(xué)習(xí)過(guò)程不需要人類的太多參與,基本上是自動(dòng)化的。與過(guò)去簡(jiǎn)單的“標(biāo)簽識(shí)別方式”相比,深度學(xué)習(xí)是對(duì)動(dòng)物大腦神經(jīng)網(wǎng)絡(luò)的一種簡(jiǎn)化模擬,離“智能”的目標(biāo)更近了一步。
深度學(xué)習(xí)技術(shù)對(duì)現(xiàn)代IT產(chǎn)業(yè)意義非凡。隨著PC、智能手機(jī)的廣泛普及,互聯(lián)網(wǎng)上產(chǎn)生了大量需要計(jì)算機(jī)來(lái)處理的數(shù)據(jù)。用戶對(duì)數(shù)據(jù)處理的水平要求也不斷增加。諸如復(fù)雜圖像識(shí)別、語(yǔ)音識(shí)別、自動(dòng)翻譯等應(yīng)用的需求越來(lái)越強(qiáng)烈,而這些正是深度學(xué)習(xí)技術(shù)大顯身手的時(shí)候。大型計(jì)算機(jī)網(wǎng)絡(luò)可以通過(guò)海量數(shù)據(jù)的訓(xùn)練不斷提升自己的認(rèn)知水平,進(jìn)而完成許多過(guò)去只能由人工完成的工作。
典型的例子就是谷歌、蘋果和微軟等企業(yè)推出的智能語(yǔ)音助手服務(wù)。這些服務(wù)將用戶的語(yǔ)音指令發(fā)送到數(shù)據(jù)中心,并由中心的計(jì)算集群進(jìn)行分析、處理,再將結(jié)果傳回終端設(shè)備。這一過(guò)程中最困難的一步就是識(shí)別用戶指令的實(shí)際含義,傳統(tǒng)的算法在這里很難起到作用,解決方案就是深度學(xué)習(xí)。使用這些服務(wù)的用戶越多、系統(tǒng)得到的訓(xùn)練越多,整體服務(wù)質(zhì)量就會(huì)越高。類似的應(yīng)用還包括谷歌、百度等提供的智能識(shí)圖服務(wù)、在線翻譯服務(wù),電商網(wǎng)站的機(jī)器人客服,以及堪稱革命的無(wú)人駕駛技術(shù)等。
由于深度學(xué)習(xí)需要海量數(shù)據(jù)作為訓(xùn)練系統(tǒng)的“材料”,那些擁有大量用戶資源的大企業(yè)在這一方面無(wú)疑有先天優(yōu)勢(shì)。目前,全球范圍內(nèi)發(fā)展這一技術(shù)的領(lǐng)跑者就是谷歌、Facebook、蘋果、百度、騰訊等企業(yè)。其中,谷歌、蘋果的相關(guān)服務(wù),尤其是語(yǔ)音助手服務(wù)已經(jīng)部署較長(zhǎng)時(shí)間,也獲得了大量的用戶反饋。國(guó)內(nèi)企業(yè)中,百度在這一領(lǐng)域耕耘較深,不僅模仿谷歌的“谷歌大腦”計(jì)劃建立了“百度大腦”團(tuán)隊(duì),還在百度識(shí)圖、百度翻譯等服務(wù)中應(yīng)用了深度學(xué)習(xí)技術(shù)并取得了不錯(cuò)的成果。不過(guò)從實(shí)際使用體驗(yàn)來(lái)說(shuō)各大企業(yè)的深度學(xué)習(xí)技術(shù)仍處于發(fā)展初期階段,服務(wù)質(zhì)量與用戶的心理預(yù)期仍相去甚遠(yuǎn)。蘋果的Siri上線后就經(jīng)常被用戶“調(diào)戲”,總是難以真正理解操作者的意圖;百度測(cè)試上線圖像內(nèi)容自動(dòng)識(shí)別服務(wù)后也陷入類似的尷尬:由于識(shí)別率較差,多數(shù)用戶僅僅是將它當(dāng)作是娛樂消遣的玩具嘗鮮而已??傊?,深度學(xué)習(xí)離改變我們的生活還有很長(zhǎng)的路要走。
最近幾年,基于GPU運(yùn)算的深度學(xué)習(xí)算法成為這一領(lǐng)域的大趨勢(shì)。此次百度創(chuàng)下新紀(jì)錄的圖像識(shí)別系統(tǒng)即是運(yùn)行在GPU服務(wù)器集群上。GPU運(yùn)算速度的快速提升也讓深度學(xué)習(xí)技術(shù)有了硬件層面的有力支持。業(yè)界對(duì)這一技術(shù)的重視也鼓勵(lì)研究者不斷開發(fā)出更優(yōu)秀的算法與模型。預(yù)計(jì)未來(lái)數(shù)年內(nèi),深度學(xué)習(xí)技術(shù)就將在多個(gè)領(lǐng)域真正實(shí)用化,造福廣大消費(fèi)者。雖然深度學(xué)習(xí)離真正的人工智能仍有較大距離,但它總算能讓計(jì)算機(jī)有一點(diǎn)“聰明”的樣子了。
智能界(m.6567na.cn)是中國(guó)首家專注于報(bào)道智能科技前沿的綜合垂直門戶,秉承“引領(lǐng)未來(lái)智能生活”的理念,持續(xù)關(guān)注智能家居、可穿戴設(shè)備、智能醫(yī)療、機(jī)器人、3D打印、智駕等諸多科技前沿領(lǐng)域,提供最前沿、最時(shí)尚、最實(shí)用、最專業(yè)的硬件產(chǎn)品介紹、硬件評(píng)測(cè)、服務(wù)定制、最新資訊、圈子交流等服務(wù),致力于成為最具價(jià)值的智能科技信息互動(dòng)平臺(tái)。
智能界【微信公眾號(hào)ID:znjchina】【新浪/騰訊微博:@智能界】
評(píng)論列表(已有條評(píng)論)
最新評(píng)論