QQ在線(xiàn)客服

當(dāng)前位置:首頁(yè)> 資訊> 科技評(píng)論

人工智能設(shè)備又邁進(jìn)一步能讀懂唇語(yǔ)

2016-11-29 09:46 來(lái)源: 站長(zhǎng)資源平臺(tái) 瀏覽(794)人   

    人工智能設(shè)備又邁進(jìn)一步:能讀懂唇語(yǔ)。據(jù)外媒報(bào)道,一種新型的語(yǔ)音合成器可以跳過(guò)語(yǔ)音記錄,而直接將說(shuō)話(huà)者嘴部動(dòng)作轉(zhuǎn)換為語(yǔ)句。


人工智能設(shè)備又邁進(jìn)一步能讀懂唇語(yǔ)


    該設(shè)備能“觀(guān)看”嘴唇的動(dòng)作,并利用人工智能網(wǎng)絡(luò)將它們轉(zhuǎn)換成聲音。


    研究人員表示,該設(shè)備將能幫助聲帶麻痹患者發(fā)聲,向腦機(jī)接口又邁進(jìn)一步。


    描述該裝置的研究發(fā)表在《PLOS計(jì)算生物學(xué)》期刊上。


    這項(xiàng)研究的作者來(lái)自法國(guó)國(guó)家科學(xué)研究中心。文章中提到,“這種語(yǔ)音合成器將人體主要語(yǔ)音發(fā)音器(舌,顎,口和嘴唇)的運(yùn)動(dòng)轉(zhuǎn)換成智能語(yǔ)音?!?/p>


    說(shuō)話(huà)者的發(fā)言,以及嘴部各個(gè)部位的位置會(huì)被同時(shí)記錄,然后通過(guò)人工智能網(wǎng)絡(luò)算法進(jìn)行分析。


    此處使用的人工智能算法是基于人類(lèi)大腦建模的深層神經(jīng)網(wǎng)絡(luò)(DNN)。算法設(shè)計(jì)針對(duì)偏復(fù)雜的模式識(shí)別。


    該深層神經(jīng)網(wǎng)絡(luò)DNN通過(guò)測(cè)量舌頭、下顎、軟腭和嘴唇的協(xié)調(diào)動(dòng)作(又稱(chēng)為”發(fā)音語(yǔ)音信號(hào)“)來(lái)識(shí)別嘴正在發(fā)音的某個(gè)詞語(yǔ)。


    作者解釋道,DNN計(jì)算模型對(duì)這些測(cè)量的數(shù)據(jù)進(jìn)行訓(xùn)練,將”發(fā)音語(yǔ)音信號(hào)“轉(zhuǎn)換成”聲學(xué)語(yǔ)音信號(hào)“。


    作者提到,”這項(xiàng)研究中,我們讓用于訓(xùn)練DNN模型的用戶(hù),以及陌生新用戶(hù)都來(lái)測(cè)試語(yǔ)音合成器的實(shí)時(shí)控制性能,從而評(píng)估它在是否能很好地成為腦機(jī)接口的一部分。


    “語(yǔ)音腦機(jī)接口將能通過(guò)解碼皮層的語(yǔ)言相關(guān)活動(dòng),實(shí)時(shí)控制語(yǔ)音合成器,從而幫助有嚴(yán)重發(fā)聲障礙的人恢復(fù)交流。


    為幫助連聲道都無(wú)法震動(dòng)的患者”說(shuō)話(huà)“,科學(xué)家將必須掌握如何解碼大腦信號(hào),并將其翻譯成語(yǔ)音。


    使用人工智能來(lái)解碼語(yǔ)音和語(yǔ)言已有先例。


    谷歌不久前推出了多語(yǔ)言之間機(jī)器翻譯系統(tǒng)。該系統(tǒng)被成為“Zero-Shot翻譯系統(tǒng)“,并具有自我學(xué)習(xí)能力。它能將未學(xué)習(xí)過(guò)的兩種語(yǔ)言翻譯成一種已經(jīng)學(xué)習(xí)過(guò)的語(yǔ)言 ——換言之,通過(guò)人工智能訓(xùn)練學(xué)習(xí)了如何實(shí)現(xiàn)X語(yǔ)言對(duì)Y語(yǔ)言的翻譯后,系統(tǒng)就能立即自動(dòng)掌握從X到Z語(yǔ)言的翻譯。


    Google Brain的博文把這項(xiàng)翻譯技術(shù)稱(chēng)為神經(jīng)機(jī)器翻譯系統(tǒng)(Google Neural Machine Translation ,簡(jiǎn)稱(chēng)GNMT)。


    2898站長(zhǎng)資源平臺(tái)友情鏈接交換:http://www.afrimangol.com/friendchange.htm 


【版權(quán)與免責(zé)聲明】如發(fā)現(xiàn)內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息發(fā)郵件至 kefu@2898.com ,我們將及時(shí)溝通與處理。 本站內(nèi)容除了2898站長(zhǎng)資源平臺(tái)( www.afrimangol.com )原創(chuàng)外,其它均為網(wǎng)友轉(zhuǎn)載內(nèi)容,涉及言論、版權(quán)與本站無(wú)關(guān)。
投稿

關(guān)注我們

站長(zhǎng)資源平臺(tái)微信公眾號(hào)

微信二維碼