谷歌AI團(tuán)隊(duì)推新型“流體標(biāo)注”:圖像標(biāo)注速度提高三倍
谷歌AI團(tuán)隊(duì)推新型“流體標(biāo)注”:圖像標(biāo)注速度提高三倍!谷歌AI團(tuán)隊(duì)近日推出了一款新型圖像標(biāo)注方式——“流體標(biāo)注”,即采用機(jī)器學(xué)習(xí)來注釋分類標(biāo)簽并勾勒出圖片中的每個(gè)對(duì)象和背景區(qū)域。谷歌官方表示其可將標(biāo)記數(shù)據(jù)集的速度提高三倍。
百度眾測(cè)平臺(tái)去年曾發(fā)布了5000萬(wàn)元的數(shù)據(jù)標(biāo)注任務(wù),而今年預(yù)計(jì)將達(dá)3億元。面對(duì)如此大的市場(chǎng)需求,效率低、交付質(zhì)量參差不齊的人工標(biāo)注方式亟待改善。谷歌此次推出的“流體標(biāo)注”如何為圖像標(biāo)注提速?
數(shù)據(jù)標(biāo)注——機(jī)器感知世界的起點(diǎn)
“數(shù)據(jù)標(biāo)注是人工智能產(chǎn)業(yè)的基礎(chǔ),是機(jī)器感知現(xiàn)實(shí)世界的起點(diǎn)。從某種程度上來說,沒有經(jīng)過標(biāo)注的數(shù)據(jù)就是無用數(shù)據(jù)?!泵绹?guó)加州科技大學(xué)校長(zhǎng)秦志剛教授在接受科技日?qǐng)?bào)記者采訪時(shí)表示,機(jī)器識(shí)別事物主要通過物體的一些特征。被識(shí)別的物體還需要通過數(shù)據(jù)標(biāo)注才能讓機(jī)器知道這個(gè)物體是什么。
在機(jī)器的世界里,圖像與語(yǔ)音、視頻等一樣,是數(shù)據(jù)的一個(gè)種類。近年來,隨著數(shù)碼產(chǎn)品以及存儲(chǔ)技術(shù)的迅速普及和發(fā)展,人們每天都可通過相機(jī)、可視電話、監(jiān)控及醫(yī)療設(shè)備等制造大量圖像。因此,現(xiàn)階段圖像已然成為標(biāo)注產(chǎn)業(yè)發(fā)展的重點(diǎn)對(duì)象。
如果素材是一張人物圖像,那么需要標(biāo)注的信息往往是性別、面部朝向、人種、有無帽子眼鏡等,也可以人為地將人物和背景的區(qū)域劃分開來。將成千上萬(wàn)張經(jīng)過標(biāo)注的圖片組成的數(shù)據(jù)集“投喂”給機(jī)器,它才能在一張全新的圖像中分辨出人物在哪個(gè)區(qū)域、具有怎樣的外貌特征。對(duì)于人來說“小兒科”的思考?xì)v程,機(jī)器卻需要大量的標(biāo)記數(shù)據(jù)集進(jìn)行訓(xùn)練。
機(jī)器學(xué)習(xí)——緩解人工標(biāo)注的壓力
提到人工智能產(chǎn)業(yè),人們往往聯(lián)想到繁華的城市和干練的IT精英,但實(shí)際上,支撐起人工智能的數(shù)據(jù)標(biāo)注產(chǎn)業(yè),卻是一個(gè)勞動(dòng)密集型產(chǎn)業(yè)。百度搜索“數(shù)據(jù)標(biāo)注”,會(huì)出現(xiàn)很多圖片語(yǔ)音視頻數(shù)據(jù)采集、標(biāo)注公司。隨機(jī)選擇一個(gè)此類詞條點(diǎn)進(jìn)去,往往會(huì)看到“萬(wàn)人數(shù)據(jù)標(biāo)注團(tuán)隊(duì)”等類似宣傳語(yǔ)??梢娙斯?biāo)注是目前數(shù)據(jù)標(biāo)注的主要方式。
“谷歌推出的流體標(biāo)注模型主要利用人工智能學(xué)習(xí)的基礎(chǔ),對(duì)圖像數(shù)據(jù)進(jìn)行自動(dòng)標(biāo)注,對(duì)于標(biāo)注不準(zhǔn)確或者出現(xiàn)偏差的地方可以通過人工調(diào)整,從而提高標(biāo)注效率?!鼻刂緞傊赋觯幢阍撃P涂山柚鷻C(jī)器學(xué)習(xí)提升標(biāo)注速度,但最初還需進(jìn)行人為地?cái)?shù)據(jù)標(biāo)注,為其提供初始訓(xùn)練數(shù)據(jù)集。事實(shí)也正是如此,為了標(biāo)注圖片,谷歌預(yù)先以約一千張具有分類標(biāo)簽和信任分?jǐn)?shù)的圖片訓(xùn)練了語(yǔ)意分割模型。
但該模型尚不完美,谷歌稱,物體邊界標(biāo)記問題、界面操作速度以及類別擴(kuò)展等仍需進(jìn)一步研究或完善。
人工智能——致力于生活中的簡(jiǎn)單應(yīng)用
雖然還有諸多難題尚待攻克,但以流體標(biāo)注模型為代表的數(shù)據(jù)標(biāo)注新方式無疑順應(yīng)著人工智能的大潮流。實(shí)際上,自人工智能逐漸走熱以來,很多行業(yè)都想搭上這個(gè)熱潮。然而,在灼熱的潮流背后,掩藏著一個(gè)根本性的問題:人工智能終將走向何方?
“人工智能的本質(zhì)是機(jī)器擁有‘學(xué)習(xí)’的能力,可想而知,人工智能可以極度縮短人類自身的學(xué)習(xí)時(shí)間,從而將人從大規(guī)模腦力學(xué)習(xí)活動(dòng)中解放出來,去專注于更有價(jià)值的工作。”秦志剛表示,雖然人們普遍認(rèn)為人工智能終將到來,但現(xiàn)階段人工智能產(chǎn)業(yè)仍在云端。目前大多數(shù)人工智能的應(yīng)用只能生存在高性能處理器的大型廠房中,就如同第一代通用計(jì)算機(jī)ENIAC一樣“大而笨重”?!氨娝苤?,隨后的幾十年內(nèi)計(jì)算機(jī)飛速發(fā)展到小型的筆記本電腦,功能卻比ENIAC更強(qiáng)大。人工智能也當(dāng)如此”。
界面簡(jiǎn)單、功能友好、毫無相關(guān)知識(shí)基礎(chǔ)的人都能使用并獲得舒適感,這是秦志剛設(shè)想的人工智能時(shí)代。一枚小小的人工智能芯片,可以完成學(xué)習(xí)、訓(xùn)練、推理等一系列“思考”過程,而它的終端表現(xiàn)則或許只是人們生活中最為常見的簡(jiǎn)單應(yīng)用。如下班回家,不需再拿出鑰匙開門,智能門鎖就像一位盡職的管家,會(huì)在第一時(shí)間感知你的到來,為你敞開家門?!笆曛?,人工智能將會(huì)成為主流,潛移默化滲透到生活中的各種角落。別看是小事情,背后卻是高密集的技術(shù)支撐?!鼻刂緞偙硎尽?/p>
“愿景十分美好,但如何將人工智能落地和普及推廣?這將是我們下一步亟待攻克的難題?!鼻刂緞傉f。
2898站長(zhǎng)資源平臺(tái)網(wǎng)站資訊:http://afrimangol.com/news/