教智能音箱學一門新語言,為什么這么難?
教智能音箱學一門新語言,為什么這么難?在全球范圍內,智能音箱正在成為越來越多消費者家中的新寵。得益于以小米小愛音箱與阿里的天貓精靈為首的眾多國內智能音箱生產商,幸運的中國用戶們不僅趕上了這一波潮流,還不用面對國外許多科技愛好者們面對的窘境——許多非英語區(qū)的用戶還在苦苦等待智能音箱能夠聽懂他們的語言。
聽起來似乎很不可思議。智能音箱能夠控制智能家居、回答問題、安排行程,卻無法理解一門被普遍使用的語言?然而這的確是事實。
上個星期,Google Home 發(fā)布了西班牙語的語言包。單就發(fā)布新的語言包可能聽起來沒什么,但在此之前,Google Home 花了將近兩年才讓 Home 學會西班牙語,至于市場份額占據(jù)最大的 Amazon Echo,則至今也未能學會西語,目前它僅僅掌握三門語言:英語、德語與日語。
教智能音箱學一門常用語言,為什么需要這么長的時間?
其背后的原因之一在于,語言遠比文字要復雜多變。
居住在不同地區(qū)的人口也許使用著同樣的書面文字,但口音上卻天差地別。對于發(fā)音特點更加鮮明、使用人數(shù)也更少的方言,絕大多數(shù)廠商則表示暫時無能為力。因此,對于所有智能音箱廠商而言,培養(yǎng)機器的語義理解能力都是巨大的挑戰(zhàn)。
廠商需要在用戶的使用過程中沉淀大量語音數(shù)據(jù),排出優(yōu)先級讓音箱學習,進而慢慢理解以前聽不懂的句子。相比之下,直接輸入的文字很容易就能被機器轉化為有意義的信息。正是因為如此,文字翻譯軟件處理起小眾的蘇格蘭高地語也能得心應手,而Google Home用了將近兩年才學會被廣泛使用的西班牙語。
火狐的開放商 Mozilla 的機器學習部門負責人 Kelly Davis 認為,即使聽懂了句子中的每一個單詞,也不意味著機器理解了這門語言。與親密朋友或與泛泛之交打招呼的用詞有什么區(qū)別?某個笑話在某門語言內是否無傷大雅?要讓智能音箱學習一門語言,還需要教它深入地理解語言背后的文化意涵。
另外一個原因,則是智能音箱廠商們出于商業(yè)考慮的優(yōu)先排序。
廠商們優(yōu)先開發(fā)使用人數(shù)多、消費能力強的地區(qū)的語言包,搶占更有利潤可挖的市場,這不難理解。但這樣的選擇,也意味著失去眾多以這些不被重視的語言為第一語言的潛在用戶。
仍然以西語為例。
根據(jù)維基百科的數(shù)據(jù),截至 2017 年,全球將西語作為母語的人口達到 4.77 億人,全球有 23 個國家和地區(qū)將西語作為官方語言。在美國,西語是第二廣泛使用的語言,將其作為家庭主要語言的人口達到3550 萬。
由于西班牙及拉美地區(qū)足球水平的強勢,西語是全世界球迷中最普及的語言之一。僅僅在美國國內,就有超過 20 個西語的體育頻道或體育網站。然而在 Home 支持西語之前,智能音箱們無法理解用西語提問的哪怕是最簡單的足球問題,也無法與網絡上豐富的西語體育資源對接。
為了收回這些前期戰(zhàn)略性放棄的失地,廠商們正在發(fā)力迎頭趕上。
Google 計劃在今年內讓 Google Home 支持超過30種語言。Amazon 則在A mazon Echo 中加入了Cleo 功能,鼓勵用戶向語音助手 Alexa 傳授更多語言。
加入更多語言包的意義并不止步于賺取利潤。Davis 表示,有很大一部分小眾語言使用者來自于欠發(fā)達地區(qū),他們受教育水平不高,也許甚至不會讀寫。之前的那些電子產品以文字為基礎,且操作較為復雜,使得這一部分人群很難享受到科技發(fā)展的便利。以語言為交互方式且易于上手的智能音箱,也許能夠真正走進并改變他們的生活。
總而言之,智能音箱目前還算不上是個語言通,但它能夠聽懂更多語言的未來,還是值得我們期待一下。
2898站長資源平臺網站資訊:http://afrimangol.com/news/