科幻照進(jìn)現(xiàn)實(shí) 人工智能距離我們有多遠(yuǎn)?
近期,北京車展火爆開幕,無論是各路大牌明星的到來、大量新能源汽車的集體亮相,還是眾品牌主力車型的國(guó)產(chǎn)化都是人們津津樂道的話題。然而在人工智能時(shí)代,汽車智能化毫無疑問才是本次車展真正的主角!

人工智能距離我們還有多遠(yuǎn)?
據(jù)了解,在本屆北京車展上,八成以上的車型都標(biāo)配了智能交互系統(tǒng),而此前剛剛驚艷大眾的樂視,也攜首臺(tái)生態(tài)汽車LeSEE、搭載了樂樂語音交互系統(tǒng)的第二代樂視車聯(lián)版阿斯頓·馬丁Rapide S出席車展,成為車展上最具“智能科技范兒”的代表之一。


實(shí)際上,今年3月發(fā)布的“十三五”規(guī)劃綱要中,就將培育人工智能納入其中。而人工智能技術(shù)在生活消費(fèi)領(lǐng)域的應(yīng)用獲得快速拓展有望創(chuàng)造巨大市場(chǎng)機(jī)會(huì),2016年也被視為“人工智能商用元年”。

可以說,人工智能已經(jīng)不再遙不可及,科幻大片中的“神奇”場(chǎng)景進(jìn)入到尋常百姓家也不再是奢望。僅從現(xiàn)在人們的日常生活中就不難看出,服務(wù)類機(jī)器人,如:掃地機(jī)器人、醫(yī)療護(hù)理機(jī)器人、娛樂機(jī)器人等已經(jīng)走入現(xiàn)實(shí)生活。而工業(yè)機(jī)器人更是現(xiàn)代工業(yè)化高速發(fā)展的中堅(jiān)力量。對(duì)于普通消費(fèi)者而言,智能手機(jī)、客服機(jī)器人、游戲中的電腦AI等等早已見怪不怪,更不必說前些日子引起全世界關(guān)注的谷歌AlphaGo了,只要你細(xì)心觀察其實(shí)人工智能無處不在,它已經(jīng)慢慢滲透到了我們生活的每一個(gè)地方。
然而,盡管人工智能已經(jīng)不再是完全的“新人”,但是它現(xiàn)階段依然不能完全顛覆人們的生活。究其原因就是技術(shù)發(fā)展初期的不成熟,造成部分人工智能并不那么“好用”,尤其是量產(chǎn)產(chǎn)品,這也是現(xiàn)階段許多廠商研究的重點(diǎn)。如何能夠讓擁有“人腦”般思考的“電腦”進(jìn)入普通人的生活是一件看似簡(jiǎn)單卻極為艱難的事。不過大家也不必太過失望,畢竟人工智能的發(fā)展僅有數(shù)十年的基礎(chǔ)就出現(xiàn)了如AlphaGo這樣令全世界驚訝甚至產(chǎn)生恐慌的機(jī)器人,相信人工智能真正的成為人們生活中無處不在的幫手將不會(huì)遙遠(yuǎn)。
語音交互系統(tǒng)到底能幫助我們解決什么問題?
從發(fā)明電腦以來,人機(jī)交互技術(shù)一共經(jīng)歷了五個(gè)階段:機(jī)器語言交互階段、命令語言階段、圖形界面階段、物理通道階段和虛擬現(xiàn)實(shí)階段。目前我們正處在第四個(gè)階段,即“物理多通道交互階段”,用戶可以通過更加自然的手勢(shì)動(dòng)作、語音或表情控制機(jī)器,進(jìn)一步接近人類自然的交流習(xí)慣。同時(shí),上述交互手段的成熟對(duì)于虛擬現(xiàn)實(shí)階段的發(fā)展也有著至關(guān)重要的意義。

相對(duì)于手勢(shì)動(dòng)作進(jìn)行交互來說,語音和表情交互顯然更加令人感到興奮,這也與大量科幻大片中鏡頭的出現(xiàn)不無關(guān)系。在這其中,語音交互是最直接、最自然的方式,也是當(dāng)下最為火爆的領(lǐng)域,甚至被不少人認(rèn)為是人機(jī)交互的下一個(gè)風(fēng)口。如此前蘋果收購(gòu)了VocalIQ以增強(qiáng)Siri的語音助手功能、谷歌入股了國(guó)內(nèi)的語音助手出門問問、微軟將語音助手微軟小娜推廣到IOS和Android平臺(tái)等等動(dòng)作,都顯示出眾多國(guó)際級(jí)科技類企業(yè)對(duì)于語音交互方面的看重。
眾所周知,現(xiàn)階段語音交互領(lǐng)域中以聲紋識(shí)別最為熱門,聲紋識(shí)別的理論基礎(chǔ)是每一個(gè)聲音都具有獨(dú)特的特征,通過該特征能將不同人的聲音進(jìn)行有效的區(qū)分,這對(duì)于人機(jī)交互來說至關(guān)重要,也是精準(zhǔn)識(shí)別、安全等方面的保障基礎(chǔ)。
近期樂視420“無破界,不生態(tài)”全球新品發(fā)布會(huì)上,樂視第四代超級(jí)電視就內(nèi)置了擁有聲紋識(shí)別功能的語音交互系統(tǒng),并且擁有能夠精準(zhǔn)識(shí)別兒童聲音的能力,這也是聲紋識(shí)別功能實(shí)際應(yīng)用的一個(gè)典范。當(dāng)兒童在使用電視的時(shí)候,會(huì)自動(dòng)跳轉(zhuǎn)至兒童搜索,對(duì)孩子進(jìn)行保護(hù)。這對(duì)于當(dāng)前國(guó)內(nèi)沒有影視劇分級(jí)的現(xiàn)狀下,兒童看電視如何更加健康的問題得到了完美的解決。

實(shí)際上,語音交互還能夠解決更多問題,比如:將其應(yīng)用于汽車中,將會(huì)徹底解放人的雙手,就算是現(xiàn)階段也能夠讓駕駛者無需手動(dòng)去開啟如收音機(jī)、后備箱、空調(diào)、車燈、導(dǎo)航等功能,不僅更加方便,而且更加安全。同時(shí)作為智能語音交互系統(tǒng),當(dāng)你駕車出行的時(shí)候,相當(dāng)于多了一位能夠幫你處理任何車內(nèi)事物的小助手,可以盡享最佳的駕車體驗(yàn)!
人工智能現(xiàn)在是時(shí)尚還是實(shí)用?
許多人覺得通過一個(gè)簡(jiǎn)單的手勢(shì),一句話就可以達(dá)到控制某一個(gè)產(chǎn)品的目的非常的時(shí)尚。事實(shí)的確如此,正如蘋果公司在iPhone上首次搭載Siri的時(shí)候,風(fēng)靡全球,以至于隨后智能手機(jī)如果無法實(shí)現(xiàn)語音交互就會(huì)顯得十分落后,甚至很土。

而在時(shí)尚的背后,也存在不少的瑕疵,即便是Siri在實(shí)際應(yīng)用中也并非完美,如何處理語音的地域化、方言、用戶習(xí)慣等都是亟待解決的問題,只有真正完美解決了這些瑕疵,才能真正達(dá)到正確識(shí)別用戶意圖的程度。
而目前非?;鸨募揖宇悪C(jī)器人其實(shí)也遇到了同樣的問題,即此類機(jī)器人基本都是完成單一功能,如清潔清掃、看護(hù)等,用戶體驗(yàn)很不理想。專家認(rèn)為,出現(xiàn)這種情況,主要是服務(wù)機(jī)器人缺少深度學(xué)習(xí)能力,未能識(shí)別用戶的意圖。
而上述這些情況也正是現(xiàn)階段人工智能大眾化所遇到的問題,如何才能讓炫酷的人工智能除了時(shí)尚感以外更加實(shí)用,是擺在當(dāng)下企業(yè)面前最大的問題。
樂樂語音到底是誰?
正如上文所述,說到人工智能就不得不提語音交互,而近期最火爆的語音交互類品牌既不是大家熟悉的蘋果、谷歌,也不是國(guó)內(nèi)最知名的科大訊飛,而是一個(gè)名為“樂樂語音”的品牌。樂樂語音隸屬于樂樂創(chuàng)新智能科技(北京)有限公司,近期樂視420發(fā)布會(huì)上發(fā)布的第四代超級(jí)電視中的聲紋識(shí)別功能、第二代樂視車聯(lián)版阿斯頓·馬丁Rapide S中的車載智能交互系統(tǒng)都是出自這家企業(yè)之手。而這其中,為阿斯頓·馬丁Rapide S量身打造的全球首款全方位立體降噪語音識(shí)別交互系統(tǒng)更是引起了社會(huì)各界的關(guān)注,尤其是多路語音采集降噪模組更是全球首家應(yīng)用于車載交互領(lǐng)域的個(gè)性化語音降噪產(chǎn)品,具有里程碑式的意義與極大的實(shí)際應(yīng)用價(jià)值。

據(jù)了解,全方位立體降噪語音識(shí)別的交互系統(tǒng)是利用多個(gè)層面組合技術(shù)運(yùn)用,以降低在語音控制中噪聲對(duì)語料的干擾。如通過指向型麥克風(fēng)陣列,只接受固定角度和范圍內(nèi)的聲音,從硬件角度上降噪;采用盲源分離、回音消除,從算法上實(shí)現(xiàn)語音降噪。創(chuàng)新性開發(fā)了多路語音采集降噪模組,即前端通過麥克風(fēng)陣列,精確地定位語音來源,經(jīng)過降噪系統(tǒng)提取純凈的語音并對(duì)該路語音進(jìn)行增強(qiáng)及回聲消除,同時(shí)通過車內(nèi)六路語音提取器,精確識(shí)別車內(nèi)不同座駕位置人員發(fā)出的語音指令從而輸入到語音識(shí)別模塊,反饋出適合該人員的實(shí)際操作。

此外,據(jù)樂樂語音工作人員透露,他們已經(jīng)研發(fā)完成一整套基于車載系統(tǒng)的整體解決方案,為車企及車載系統(tǒng)開發(fā)商提供開放性SDK云平臺(tái)及創(chuàng)新性硬件操作系統(tǒng),可以廣泛適配各類型車載操作系統(tǒng),實(shí)現(xiàn)熱喚醒、打斷、降噪等強(qiáng)大功能的語音識(shí)別技術(shù),通過場(chǎng)景化語義解析,涵蓋導(dǎo)航、電臺(tái)、音樂、電話、應(yīng)用操控、汽車操控、違章查詢、指定地點(diǎn)查詢、路況、今日限行等各領(lǐng)域內(nèi)容。

移動(dòng)互聯(lián)網(wǎng)時(shí)代的到來讓萬物互聯(lián)成為可能,而在經(jīng)歷了長(zhǎng)時(shí)間探索階段后,人工智能類產(chǎn)品已經(jīng)擁有不俗的性能和廣泛應(yīng)用性。業(yè)界普遍認(rèn)為,人工智能越來越深入地應(yīng)用于衣食住行、教育、醫(yī)療等領(lǐng)域,不僅可令更多民眾“走近”這一高新技術(shù)并享受其“紅利”,也有望創(chuàng)造巨大的市場(chǎng)機(jī)會(huì)。相信伴隨谷歌AlphaGo、樂樂語音全方位立體降噪語音識(shí)別交互系統(tǒng)等里程碑式的產(chǎn)品、技術(shù)更多的出現(xiàn)、應(yīng)用,人類將會(huì)在不遠(yuǎn)的將來真正的迎來智能時(shí)代!