基礎(chǔ)語音專項(xiàng)評(píng)測(cè):BAT旗下的3款智能音箱表現(xiàn)如何?
基礎(chǔ)語音專項(xiàng)評(píng)測(cè):BAT旗下的3款智能音箱表現(xiàn)如何??jī)H僅在市場(chǎng)上冒泡了沒多久的智能音箱便取代了前輩——智能路由器,成為了智能家居行業(yè)的新寵兒,這在科技界算是蠻有趣的事情了。
數(shù)據(jù)能反映智能音箱的前景有多明朗,據(jù)調(diào)研機(jī)構(gòu) Canalys 在今年年初公布了一份報(bào)告顯示,2017 年出貨量剛剛突破 3000 萬臺(tái)的智能音箱,預(yù)計(jì)將會(huì)在 2018 年達(dá)到 5630 萬臺(tái),預(yù)計(jì)增幅約為 87%。
盡管這只是一個(gè)預(yù)測(cè)的數(shù)字。但當(dāng)蘋果、亞馬遜、Google 以及國(guó)內(nèi)不少科技互聯(lián)網(wǎng)界的巨頭都紛紛推出相應(yīng)的智能音箱產(chǎn)品,相信你也感受到這股趨勢(shì)到底有多火熱。
不過,作為一個(gè)用戶,趨勢(shì)、未來智能家居的核心、重新定義下一個(gè)十年的未來等這些太過于偏行業(yè)的東西,可能并不是我們最關(guān)心的事情,反而是智能音箱本身的「便利」,激起了我們嘗試去體驗(yàn)它的念想。
XXX,明天天氣怎么樣?
XXX,我要聽周杰倫的歌。
XXX,明天上午 7 點(diǎn) 30 分叫我起床。
比如啊,在我體驗(yàn)了各種形形色色的智能音箱一年多的時(shí)間里,這三句平淡無奇甚至聽起來有點(diǎn)傻的語句,卻恰恰是我最得心應(yīng)手,也是最常對(duì)智能音箱使喚的命令。你只需要耗費(fèi)一丁點(diǎn)口舌功夫,你就能把查天氣、聽歌、設(shè)鬧鐘這三件事變得簡(jiǎn)單、優(yōu)雅。
其實(shí),倒不是我不愿意去挖掘智能音箱一些新的使用場(chǎng)景或與智能音箱進(jìn)行更深入的交流,而是一方面這些智能音箱真正實(shí)用的很少;另一方面繁多的花哨功能隨著使用頻率的減少,也容易讓你遺忘它的其他功能。
當(dāng)然,我認(rèn)為這當(dāng)中更為主要的原因是,目前這些打著人工智能旗號(hào)的「家伙」壓根兒就沒法給你提供滿意的人機(jī)交互體驗(yàn)。
回過頭想想,除開娛樂方面的功能,現(xiàn)在的智能音箱在對(duì)話方面的能力,其實(shí)與 7 年前出現(xiàn)在 iPhone 4s 上的 Siri 相近,兩者相比似乎并沒有拉開太大的差距。
為了更深入地了解這些智能音箱,究竟在基礎(chǔ)語音對(duì)話方面的表現(xiàn)如何,愛范兒決定挑選百度、阿里以及騰訊這三家公司旗下的智能音箱產(chǎn)品,來做一個(gè)簡(jiǎn)單的基礎(chǔ)語音專項(xiàng)測(cè)試。
究竟在基礎(chǔ)語音功能方面,百度旗下的渡鴉 Raven H,阿里旗下的天貓精靈 X1,騰訊旗下的聽聽,誰更「懂你」?
讓 TA 隨呼隨應(yīng),其實(shí)是一大考驗(yàn)
實(shí)際上,為了讓語音助手,也就是智能音箱那個(gè)與你交互的東西,不會(huì)因?yàn)橹茉猸h(huán)境的聲音,而胡亂說話,干擾你的生活。目前大多數(shù)語音助手及智能音箱都在設(shè)計(jì)之初,就加入了喚醒詞這一機(jī)制。
并且為了讓這些喚醒詞能夠起到該有的作用,國(guó)內(nèi)的廠商們常常會(huì)使用四個(gè)字組成,且相對(duì)生僻的詞來作為智能音箱的喚醒詞。例如,小米 AI 音箱就采用了「小愛同學(xué)」、百度的渡鴉 Raven H 用了「小度小度」、天貓精靈用了「天貓精靈」、騰訊聽聽則用了「9420」(就是愛你的諧音)…
而這些喚醒詞,作為開啟每次人機(jī)交互的一把鑰匙,它的喚醒成功率也影響了智能音箱的基礎(chǔ)體驗(yàn)。
雖然這當(dāng)中有一部分像渡鴉 Raven H 那樣可以自定義喚醒詞,但通常這些自定義的喚醒詞喚醒的成功率往往不如出廠默認(rèn)的好。因此,在下面這個(gè)喚醒詞測(cè)試環(huán)節(jié)中,我們將默認(rèn)使用 B.A.T 這三家公司旗下的智能音箱產(chǎn)品出廠默認(rèn)的喚醒詞進(jìn)行測(cè)試。
為了盡可能還原用戶實(shí)際使用情況,在測(cè)試喚醒成功率方面,我們選取了 1 米、3 米以及 5 米這幾個(gè)相對(duì)較常出現(xiàn)的距離來喚醒智能音箱,并且將在相對(duì)安靜的環(huán)境中進(jìn)行測(cè)試,同時(shí)將每個(gè)測(cè)試對(duì)象總的測(cè)試次數(shù)定為 20 次,每次喚醒的時(shí)間間隔為 1 分鐘,看看它們的喚醒成功率。
需要補(bǔ)充說明的是,由于人聲不可控,因此我們只能試圖在每次呼喚智能音箱時(shí),盡可能保持音量大小和聲調(diào)相近。
從測(cè)試的數(shù)據(jù)可以看到,無論是百度、阿里,還是騰訊,它們的智能音箱產(chǎn)品在 1 米距離內(nèi)的喚醒表現(xiàn)已經(jīng)做得非常好,基本上能做到接近 100% 的喚醒成功率。
當(dāng)離音箱的距離擴(kuò)大到 3 米的時(shí)候,渡鴉 Raven H、天貓精靈 X1、騰訊聽聽,它們?cè)趩拘殉晒β史矫?,就都出現(xiàn)了一定程度的下降,而三者之間的差異并不明顯。而再當(dāng)距離進(jìn)一步擴(kuò)大到 5 米的時(shí)候,三者之間的差異同樣不太明顯,而喚醒成功率也已經(jīng)大幅下降,在這個(gè)距離下,你喚醒智能音箱的時(shí)候,已經(jīng)沒有之前那么順利了。
除了在安靜環(huán)境下測(cè)試它們的喚醒成功率,我們還模擬了大部分使用智能音箱,常遇到的場(chǎng)景——在智能音箱播放音樂時(shí),喚醒它。
由于 3 款智能音箱的音量很難統(tǒng)一,因此我們選擇將各自的音量均調(diào)至 80% 來看看它們?cè)诿鎸?duì)自己播放音樂時(shí),會(huì)不會(huì)影響它們喚醒表現(xiàn)。
可以看到,當(dāng)播放音樂的時(shí)候,渡鴉 Raven H、天貓精靈 X1、騰訊聽聽都不約而同地受到了自身的影響,它們的喚醒成功率在 3 米、5 米等距離下,都出現(xiàn)了相等幅度的下降,而且三者的差異并不明顯。
不過,我們也注意到當(dāng)智能音箱播放音樂的時(shí)候,它們的喚醒成功率確會(huì)受到一定的影響。
在排除了測(cè)試條件、人聲以及統(tǒng)計(jì)的誤差等方面的因素后,我們認(rèn)為 3 款智能音箱的在喚醒成功率方面表現(xiàn)都比較接近,無論是在相對(duì)安靜的環(huán)境下,還是在自播放音樂的時(shí)候,三者的差距并不明顯。
當(dāng)然, 這與這些智能音箱產(chǎn)品對(duì)喚醒這一交互的重視有關(guān)。比如像渡鴉 Raven H 就專門設(shè)計(jì)了一個(gè)由 4 個(gè)麥克風(fēng)組成的麥克風(fēng)陣列,并在軟件上對(duì)喚醒做優(yōu)化;而像天貓精靈、騰訊聽聽亦是為了達(dá)到更好的喚醒率,而在軟硬件方面投入了許多…
不過,詭異的是,3 款智能音箱已經(jīng)放在我的臥室里用了一周,但在段時(shí)間里,渡鴉 Raven H 曾在我通宵敲打青軸鍵盤寫稿的時(shí)候,突然被喚醒過幾次…
而同樣的時(shí)間里,天貓精靈 X1、騰訊聽聽則沒有出現(xiàn)過這種情況。
你說的話,TA 能懂嗎?
其實(shí),現(xiàn)在我對(duì)于智能音箱已經(jīng)不指望太多了,只求它能在基礎(chǔ)功能的語音指令上懂我的意思,我就心滿意足了。比如說,同一種意思在不同的語述下表達(dá),能否理解人類的意思。
那么當(dāng)它們?cè)跍y(cè)試天氣、播放歌曲、設(shè)鬧鐘這三個(gè)相對(duì)較頻繁的使用場(chǎng)景下,用一些相對(duì)表述廣泛的語音指令,它們能聽得懂嗎?
天氣
今天天氣怎么樣?
今天會(huì)下雨嗎?
今天要帶傘嗎?
其實(shí)在天氣這一個(gè)場(chǎng)景下的語義理解方面,已經(jīng)難不倒普通的智能音箱。像天氣、下雨、傘這幾個(gè)常見的關(guān)鍵詞都已經(jīng)變成廠商們優(yōu)先優(yōu)化的部分。所以啊,B.A.T 這 3 款智能音箱對(duì)以上這幾個(gè)常見的句式,已經(jīng)游刃有余。
只不過,令我想不到的是,渡鴉 Raven H 雖能理解這幾個(gè)簡(jiǎn)單的句式,但有時(shí)候它會(huì)出現(xiàn)聽不懂的情況,即便是你問他今天會(huì)下雨嗎?它仍然回復(fù)「抱歉我太確定你說了什么」。
播放歌曲&定鬧鐘
我想聽周杰倫的歌。
播放周杰倫的歌曲。
說好的幸福呢?
來到播放歌曲這一環(huán)節(jié),3 款智能音箱都能準(zhǔn)確理解并回復(fù)對(duì)應(yīng)的答案。虧我特意還用一個(gè)容易混淆它理解的《說好的幸福呢》,來試探它們的理解能力,但依然沒能騙過他們。
而定鬧鐘也是如此。
明天上午 7 點(diǎn) 30 分叫我起床
給我設(shè)一個(gè)上午 7 點(diǎn) 30 分的鬧鐘
提醒我 7 點(diǎn) 30 分起床
在這些基礎(chǔ)功能方面,基本上渡鴉 Raven H、天貓精靈 X1 以及騰訊聽聽都能在簡(jiǎn)單的句式中理解你的意思,并觸發(fā)相應(yīng)的功能。
總結(jié)
通過這上面的兩個(gè)小實(shí)驗(yàn)的數(shù)據(jù)來看,我們不難發(fā)現(xiàn),不管是渡鴉 Raven H,天貓精靈 X1,還是騰訊聽聽,它們?cè)趩拘言~方面的表現(xiàn)以及簡(jiǎn)單場(chǎng)景下的語義理解方面的表現(xiàn),都拉不開太大的差距。
在喚醒成功率方面,渡鴉 Raven H 的整體表現(xiàn)確要天貓精靈 X1、騰訊聽聽要稍微好那么一點(diǎn),但它也存在相對(duì)較明顯的誤喚醒問題。
而在簡(jiǎn)單場(chǎng)景下的語義理解方面的表現(xiàn),三者其實(shí)都能達(dá)標(biāo),但值得贊揚(yáng)的是,現(xiàn)在廠商們也越來越重視人性化的語義理解。例如啊,在播放音樂的時(shí)候,當(dāng)你想快速讓智能音箱靜下來,又突然想不起對(duì)應(yīng)操作的準(zhǔn)確指令時(shí)。
這個(gè)時(shí)候,我經(jīng)常會(huì)用到的一個(gè)語音口令是「XXX,閉嘴」,而顯然類似的人性化語義識(shí)別已經(jīng)受到了廠商們的重視,無論是小米 AI 音箱、出門問問 Tichome,還是現(xiàn)在所測(cè)試 B.A.T 三款智能音箱,都已經(jīng)將「閉嘴」這一人性化語義映射到靜音這一操作上。
可以預(yù)見的是,隨著人性化語義理解方面的能力提升,智能音箱會(huì)慢慢褪去其機(jī)械化的程序回復(fù),而在與我們交流時(shí)變得越來越自然,越來越像人類。
說回正題,通過這次簡(jiǎn)單測(cè)試,我們已經(jīng)可以看到,百度、阿里、騰訊這些掌握了大數(shù)據(jù)且具備一定研發(fā)實(shí)力的互聯(lián)網(wǎng)巨頭,當(dāng)它們都置身在智能音箱這一片未開荒的領(lǐng)域中時(shí),其實(shí)大家都還處于同一起跑線上,產(chǎn)品的基礎(chǔ)功能以及體驗(yàn)并沒有拉開明顯的差距。
當(dāng)然,智能音箱還處于早期階段,當(dāng)人工智能真正發(fā)展到一個(gè)較為成熟的情況后,也許那個(gè)時(shí)候智能音箱吸引我們的不單是便利,還有能填補(bǔ)人類情感空缺的技能。
2898站長(zhǎng)資源平臺(tái)網(wǎng)站排行榜:http://afrimangol.com/ranklist.htm