百度語音搜索:準(zhǔn)備消滅鍵盤輸入
3月22日,百度舉行了首期語音搜索開放日活動,向媒體展示自己正在蓄力的最新技術(shù)應(yīng)用——語音搜索。百度公司技術(shù)副總裁王海峰現(xiàn)場介紹了百度語音搜索的最新進(jìn)展,另有兩位搜索技術(shù)負(fù)責(zé)人對語音搜索的實(shí)際使用問題進(jìn)行了演示說明。在活動中,百度方面接受新浪科技采訪時(shí)表示:堅(jiān)信語音交互將是人機(jī)交互的趨勢所在,這個(gè)趨勢將取代鍵盤輸入。此外百度方面還向新浪科技透露:今年將有重磅產(chǎn)品推出,比去年百度世界大會上推出的度秘厲害得多。
百度語音搜索開放日百度語音搜索開放日:百度搜索產(chǎn)品架構(gòu)師景鯤(左)、百度技術(shù)副總裁王海峰(中),百度多模搜索部總監(jiān)孫雯玉(右)語音搜索≠聽+說百度 語音搜索 物聯(lián)網(wǎng) 百度語音搜索開放日百度技術(shù)副總裁王海峰“語音搜索最常見的誤區(qū)是簡單以為只是聽和說的簡單串聯(lián),其實(shí)并非如此?!蓖鹾7彘_門見山說道。
這位百度技術(shù)副總裁緊接著對百度語音搜索的最新進(jìn)展進(jìn)行了介紹,表示目前的技術(shù)已經(jīng)實(shí)現(xiàn)了語音技術(shù)、自然語言處理、智能搜索三方面的融合,以更自然的交互方式,對用戶所說更準(zhǔn)確地識別,對需求理解更精準(zhǔn),進(jìn)而能提供更滿意的結(jié)果。
王海峰現(xiàn)場進(jìn)行了演示,“請問三亞明天的天氣怎么樣?”他按住語音助手說,搜索框隨機(jī)“打出”了王海峰的問題,并跳轉(zhuǎn)到天氣頁面,還自動朗讀起來:明天三亞天氣多云,23℃到31℃……不過王海峰認(rèn)為詢問天氣只是最基本的語音搜索,他緊接著演示了三個(gè)問題:“謝霆峰的兒子是誰”、“謝霆峰是誰的兒子”,“吳奇隆比劉詩詩大多少歲”……王海峰表示,前兩個(gè)問題從傳統(tǒng)搜索認(rèn)知來看,文字是完全一樣的,但問題缺截然不同,這其中涉及到了對于語言的理解和語義分析。最后一個(gè)問題則涉及兩個(gè)結(jié)果綜合之后的計(jì)算。
“百度語音搜索目前已通過人工智能做到了‘聽’和‘說’,而且還嘗試完成人類復(fù)雜的行為——溝通。集成了語音識別、語義理解、深度問答、知識推理、多輪對話、智能摘要、情感分析、語言生成、語音合成等能力,百度語音搜索已經(jīng)能夠滿足用戶的多種復(fù)雜需求?!蓖鹾7蹇偨Y(jié)說。
此外,這位百度技術(shù)副總裁也談到了語音搜索和當(dāng)下火熱的人工智能的關(guān)系。他表示人工智能實(shí)際上是希望讓機(jī)器可以擁有若干能力,可以讓機(jī)器學(xué)會人的聽、說、看、行,進(jìn)而開始有思考——即機(jī)器學(xué)習(xí),但就人的思考而言,和語言密切相關(guān),后者是思考必需的知識和思維的載體。
王海峰強(qiáng)調(diào)說,語音搜索可以降低用戶搜索門檻,而且在大數(shù)據(jù)的基礎(chǔ)上可以轉(zhuǎn)換為更多的互聯(lián)網(wǎng)產(chǎn)品應(yīng)用,實(shí)現(xiàn)人與信息及服務(wù)的更廣泛連接。
鍵盤要被消滅百度 語音搜索 物聯(lián)網(wǎng) 百度語音搜索開放日百度多模搜索部總監(jiān)孫雯玉關(guān)于搜索門檻被降低的問題,百度多模搜索部總監(jiān)孫雯玉進(jìn)行了進(jìn)一步演示介紹。
她表示語音搜索的好處是比鍵盤輸入“更直接、更快捷”。作為年輕媽媽,孫雯玉海舉例說,女兒現(xiàn)在找動畫片會直接通過語音搜索,“小孩基本不用教,甚至看你做一遍她就會了,她知道按住說話,就能找到自己想要的?!?/span>
語音搜索的直接和快捷同樣體現(xiàn)在老人群體身上,孫雯玉介紹說父母有山東口音,但是搜索在語音識別上沒有問題,“以前搜索需要組織語言思路,明確自己的問題,但是現(xiàn)在像我爸媽一樣在文字輸入上不習(xí)慣的群體,可以直接說,所說即所得?!?/span>
不過,這位多模搜索部總監(jiān)也表示,針對中國方言眾多的情況,目前的主要版本還只是針對以普通話為主的北方方言和相近方言,粵語版、上海話版和西南官話等版本已經(jīng)在開發(fā)中。
孫雯玉認(rèn)為語音搜索的最大意義在于:通過技術(shù)讓人獲得信息和服務(wù)的門檻更低,隨著智能語音搜索進(jìn)一步向前,可能會出現(xiàn)重大卻潤物無聲地變革——鍵盤交互將成為歷史,“我們的調(diào)研顯示,90后、00后有50%的群體的主要搜索方式已經(jīng)變成了語音,而我女兒為代表的10后一代,基本從小的習(xí)慣就是語音搜索,她們這一代未來會覺得語音搜索是一件自然而然且天生如此的事情?!?/span>
物聯(lián)網(wǎng)大趨勢語音搜索比鍵盤輸入搜索更便捷并不令人否認(rèn),但現(xiàn)場有記者認(rèn)為語音搜索存在“場景”問題。
有媒體提問稱,不懷疑語音搜索的效率和便捷程度,但目前來講,拿著手機(jī)不斷說話搜索需要場景,特別涉及多輪交互,可能會變得調(diào)戲Siri一樣——只是個(gè)消遣游戲。
百度搜索產(chǎn)品架構(gòu)師景鯤重點(diǎn)解答了場景問題。他覺得之所以目前還存在“場景”上的尷尬,主要有兩方面的原因。
首先是當(dāng)前的用戶習(xí)慣了鍵盤輸入,對于語音搜索的轉(zhuǎn)換還需要一段時(shí)間,但不可否認(rèn)的是隨著年輕群體進(jìn)一步壯大,語音搜索會成為潮流,“這個(gè)群體已經(jīng)被微信完成了市場教育,現(xiàn)在在地鐵上對著手機(jī)說話‘看起來傻’的問題,估計(jì)以后大家都在做并且習(xí)慣了,就成為潮流了?!?/span>
其次是物聯(lián)網(wǎng)的進(jìn)一步發(fā)展。景鯤表示,目前人機(jī)交互的最主要終端是手機(jī),不過一旦物聯(lián)網(wǎng)進(jìn)一步發(fā)展,人機(jī)交互突破了手機(jī)終端,需要在更多更廣泛的領(lǐng)域進(jìn)行應(yīng)用的時(shí)候,鍵盤輸入可能會變得很不方便,相反,語音輸入的優(yōu)勢會不言自明。
景鯤認(rèn)為,大的潮流和趨勢目前是可以預(yù)見的,語音搜索的普及只是時(shí)間問題而已?,F(xiàn)在手機(jī)屏幕承載的東西特別多,有屏幕的東西大家都愿意看,沒有屏幕的東西就只能搜了。從潮流來看,語音交互絕對是主流。
新浪科技也就此向百度方面提問:“在物聯(lián)網(wǎng)大趨勢下,在硬件方面如何考慮,是否會涉足硬件領(lǐng)域?”
百度方面給出的回答是:不會涉足硬件。
“我們給語音搜索提供一個(gè)全方面的方案,跟各種各樣的廠商一起來合作,我們提供的是能力、信息和資源。我們?nèi)ツ晖瞥隽诵C(jī)器人度秘,通過它來告訴外界我們有什么樣的能力,畢竟口說無憑,百度得把這個(gè)能力包裝成這樣一個(gè)產(chǎn)品,這些能力也可以放到廠商的設(shè)備上,我們做百度最擅長的,其他廠商做他們擅長的方面?!本蚌H回答說,這個(gè)回答也得到了百度技術(shù)副總裁王海峰的贊同。
“但度秘在推出后似乎聲勢不大?”新浪科技進(jìn)一步問道。
孫雯玉回答了該問題,這位百度多模搜索部總監(jiān)解釋稱,度秘在去年推出是一個(gè)能力的展示,但度秘的普及應(yīng)用過程中,可能涉及最多的問題是多輪交互,這對目前的產(chǎn)品形態(tài)和技術(shù)應(yīng)用來說,一旦有不足,就很容易造成糟糕的用戶體驗(yàn),所以百度方面并沒有選擇大力推廣,目的是讓最大程度保證用戶體驗(yàn)。
“但今年會有重磅得多的產(chǎn)品發(fā)布,比度秘要厲害得多?!卑俣人阉鳟a(chǎn)品架構(gòu)師景鯤補(bǔ)充道。
更多同類資訊請?jiān)L問站長資源平臺站長資訊欄目:http://afrimangol.com/articlelist_ac29.htm
更多站長資源可以訪問:http://afrimangol.com/