QQ在線客服

當前位置:首頁> 資訊> 科技評論

創(chuàng)新奇智勇奪人工智能頂級競賽Wider Face人臉檢測冠軍

2019-05-27 10:42 來源: IT之家 編輯: 佚名 瀏覽(914)人   

近日,世界權威的人臉檢測公開評測集WIDER FACE公布最新評測排名。創(chuàng)新奇智(AInnovation)研發(fā)的AInnoFace人臉檢測算法,超越百度、曠視、騰訊、京東、滴滴、卡耐基梅隆大學、北京郵電大學、中國科學院大學等眾多國內(nèi)外知名人工智能企業(yè)和高校人工智能實驗室,在WIDER FACE的Easy、Medium和Hard三個評測子集的六項評估結(jié)果中, 綜合排名第一(六個分項排名中五項第一,一項第二)。

(圖片來自于WIDER FACE官網(wǎng),為方便讀者閱讀該排行榜,筆者標注了部分人臉檢測算法的研發(fā)企業(yè)和高校)

WIDER FACE人臉檢測數(shù)據(jù)集

人臉檢測是計算機視覺領域中非常熱門和非常挑戰(zhàn)的算法難題。人臉檢測也是人工智能算法最重要的商業(yè)場景之一。為了提升人工智能算法和對外顯示人工智能技術實力,很多AI公司都會選擇公開數(shù)據(jù)集來驗證自身的算法能力。在眾多數(shù)據(jù)集中,WIDER FACE是目前業(yè)界公開的規(guī)模最大、檢測難度最高的人臉檢測數(shù)據(jù)集,由香港中文大學于2016年建立。該數(shù)據(jù)集共包含32,203張圖像和393,703個人臉標注。其中40%的數(shù)據(jù)為訓練集(Training),10%的數(shù)據(jù)為驗證集(Validation),50%的數(shù)據(jù)為測試集(Testing)。每個集合中的數(shù)據(jù)根據(jù)人臉檢測的難易程度分為“Easy”,“Medium”,“Hard”。

WIDER FACE的數(shù)據(jù)集識別難度非常大,更加貼近現(xiàn)實的場景,典型例子如下圖所示。

從圖片中可以看到,該數(shù)據(jù)集匯集了劇烈變化的人臉尺寸、各種各樣的拍照角度、人臉姿態(tài)變化,不同程度的人臉遮擋、表情變化,不同類型的光照污染、強弱差異,以及多式多樣的化妝風格等多種影響因素,因此該數(shù)據(jù)集在全球人臉檢測領域極具挑戰(zhàn)性,每次評測均會吸引多家國內(nèi)外科技巨頭及高校院所(包含CMU等海內(nèi)外一流高校,京東、騰訊、百度、華為、IBM、滴滴、曠視等知名AI公司),在該數(shù)據(jù)集上一較高下。

創(chuàng)新奇智AInnoFace算法

創(chuàng)新奇智提出的AInnoFace算法以著名的一階段檢測器RetinaNet為起點,采用了IoU損失函數(shù)(IoU regression loss)進行邊框回歸使得檢測結(jié)果的位置更加精準,使用了選擇性二階段回歸和分類(Selective Refinement Network)讓檢測結(jié)果的召回率更高并且產(chǎn)生的虛檢更少,融合了多種數(shù)據(jù)増廣策略使得最終的檢測模型更加魯棒,借鑒了標簽最大化操作(Max-out Label)讓分類預測結(jié)果更加準確從而降低虛檢,利用了改進的多尺度測試策略以更好地檢測不同尺度的人臉。經(jīng)過上述一系列改進,AInnoFace算法對極端尺寸、模糊、遮擋等姿態(tài)下的人臉都有很好的檢測效果,能有效提升復雜場景下人臉檢測召回率及精準度,更好地解決了開放場景人臉檢測的技術難題。

AInnoFace人臉檢測算法構(gòu)建在RetinaNet網(wǎng)絡的基礎上。(a)骨干網(wǎng)絡:前饋ResNet-152 網(wǎng)絡架構(gòu)用來提取多尺度特征圖。(b)頸部網(wǎng)絡:一個6級特征金字塔網(wǎng)絡(FPN)用來生成更豐富的多尺度卷積特征金字塔,在這之后,連接兩個共享子網(wǎng),一個子網(wǎng)負責分類目標框,另一個網(wǎng)絡負責將目標框回歸到真實框。最后,我們使用focal-loss作為二分類的損失和使用IoU loss 作為框回歸的損失。

以曾經(jīng)有“世界上人數(shù)最多的自拍合影”照片為例,從公開消息查詢,百度的算法PyramidBox在該圖片上檢測到880張人臉,而AInnoFace算法可以檢測出918張人臉,檢測精度遙遙領先,來感受一下AInnoFace算法的威力吧!

具體到本次競賽的各項指標,如下圖所示,也可以在官方主頁中查到。在眾多知名人工智能企業(yè)、高校人工智能實驗室中,創(chuàng)新奇智脫穎而出,奪得冠軍,令業(yè)界印象深刻!

(圖片來自于WIDER FACE官網(wǎng))

厚積薄發(fā),快速發(fā)展

WIDER FACE競賽高手大咖云集,成立一年多的創(chuàng)新奇智力壓群雄獲得第一。這并不是偶然,而是與創(chuàng)新奇智優(yōu)異的商業(yè)化能力和優(yōu)異的技術研發(fā)團隊密不可分。

創(chuàng)新奇智成立于2018年3月,是創(chuàng)新工場的AI子公司,以“人工智能賦能商業(yè)未來”為使命,致力于用最前沿的人工智能技術為企業(yè)提供AI相關產(chǎn)品及商業(yè)解決方案。創(chuàng)新奇智CEO徐輝在IT行業(yè)擁有20余年的銷售、產(chǎn)品、技術、服務、管理經(jīng)驗,歷任IBM、微軟、SAP等多家世界500強科技巨頭企業(yè)高管,對中國市場各個行業(yè)發(fā)展有著深入了解。創(chuàng)新奇智采用“技術產(chǎn)品”+“行業(yè)場景”雙輪驅(qū)動模式,商業(yè)化速度飛快。

創(chuàng)新奇智擁有優(yōu)異的技術研發(fā)團隊,本次WIDER FACE競賽奪冠隊伍由張發(fā)恩、范馨予、艾國、宋劍飛、秦永強和吳佳洪組成。其中團隊Leader張發(fā)恩現(xiàn)任創(chuàng)新奇智CTO、創(chuàng)新工場人工智能工程院首席架構(gòu)師和寧波諾丁漢大學榮譽教授,他在人工智能工業(yè)界和學術界成績不菲,曾任職Microsoft、Google和百度,持有多項國內(nèi)外人工智能算法專利和發(fā)表過數(shù)篇人工智能頂級會議論文。隊伍中其他成員也都有著深厚的人工智能教育背景和從業(yè)經(jīng)歷。

創(chuàng)新奇智自成立伊始就瞄準高精尖的人工智能算法在零售、制造、金融等多個領域的商業(yè)化產(chǎn)品落地,重點突破人工智能算法的領先性和成熟性,形成具有巨大商業(yè)潛力的AI產(chǎn)品和解決方案。心無旁騖,專心突破,自然走得快,走得穩(wěn)。目前,創(chuàng)新奇智已經(jīng)打造出業(yè)界領先的人工智能數(shù)據(jù)平臺和原創(chuàng)的深度學習支撐平臺,并發(fā)表了數(shù)篇頂級會議論文,但這些成果并不是炫技或者灌水的文章,而是實實在在提升了算法在實際場景的精度,提升了訓練和推理的速度,并極為高效地整合了算力資源。

應用為王,商業(yè)落地

不僅僅人臉檢測算法,從2018年成立以來,創(chuàng)新奇智的人工智能視覺算法已經(jīng)在零售渠道陳列監(jiān)控的商品識別、智能貨柜、工業(yè)視覺、智慧園區(qū)社區(qū)等領域取得行業(yè)領頭羊的地位。算法領先,產(chǎn)品成熟,率先攻下陣地,占領市場,為客戶提供了巨大的商業(yè)價值。

從最新的WIDER FACE排行榜來看,創(chuàng)新奇智已經(jīng)具備優(yōu)秀的人工智能技術研發(fā)團隊,研發(fā)出了世界上最先進的人臉檢測算法。相信創(chuàng)新奇智把最先進的人工智能算法應用到產(chǎn)業(yè)中,一定會創(chuàng)造更大的商業(yè)價值,助力企業(yè)客戶及合作伙伴提升商業(yè)效率和價值,為國家的人工智能規(guī)劃實施添磚加瓦!


【版權與免責聲明】如發(fā)現(xiàn)內(nèi)容存在版權問題,煩請?zhí)峁┫嚓P信息發(fā)郵件至 kefu@2898.com ,我們將及時溝通與處理。 本站內(nèi)容除了2898站長資源平臺( afrimangol.com )原創(chuàng)外,其它均為網(wǎng)友轉(zhuǎn)載內(nèi)容,涉及言論、版權與本站無關。