利用AI檢測(cè)上課專心程度是否合理?
近日,一篇有關(guān)課堂監(jiān)控技術(shù)的論文刊登在《IEEE Transactions on Visualization and Computer Graphics》上。在論文中,來自香港科技大學(xué)、哈爾濱工程大學(xué)等機(jī)構(gòu)的研究者提出了一種名為 EmotionCues 的系統(tǒng)。該系統(tǒng)主要關(guān)注如何記錄學(xué)生面部表情,并據(jù)此來分析學(xué)生在課堂上的情緒變化、注意力集中程度。作者之一、香港科技大學(xué)計(jì)算機(jī)教授屈華民介紹說,這個(gè)系統(tǒng)「為教師提供了一種更快速、更方便去衡量學(xué)生在課堂上參與度的方法。」
這項(xiàng)研究的初衷是「善意」的:依靠該系統(tǒng)去監(jiān)控學(xué)生在課堂上的情緒反饋,判斷學(xué)生在什么時(shí)候開始感到無聊,什么時(shí)候注意力更加集中,以此來提醒老師該如何改善課堂內(nèi)容、提高授課質(zhì)量。
研究團(tuán)隊(duì)在兩間教室里對(duì)提出的系統(tǒng)進(jìn)行了測(cè)試,一間教室是香港科技大學(xué)的學(xué)生,代表高校學(xué)生群體;另一間教室是日本某所幼兒園,代表低齡學(xué)生群體。
測(cè)試發(fā)現(xiàn),這套視覺分析系統(tǒng)在檢測(cè)那些「明顯情緒」方面效果比較好,比如學(xué)習(xí)興趣較為強(qiáng)烈時(shí)的愉悅感。但系統(tǒng)對(duì)于「憤怒」或者「悲傷」等表情的解讀能力還是有所欠缺。學(xué)生們可能只是單純地專注于課堂內(nèi)容本身,僅僅因?yàn)樯钊胨伎级櫫艘幌旅碱^,卻容易被系統(tǒng)解讀為「憤怒」。
系統(tǒng)的工作流程
第一階段是處理一系列原始數(shù)據(jù)并利用計(jì)算機(jī)視覺算法提取出情感信息,包括面部檢測(cè)、面部識(shí)別、情感識(shí)別、特征抽取等步驟。在面部檢測(cè)步驟中,研究者采用 MTCNN(多任務(wù)級(jí)聯(lián)卷積網(wǎng)絡(luò),一種用于預(yù)測(cè)面部和 Landmark 位置的深度卷積網(wǎng)絡(luò))去檢測(cè)每個(gè)樣本幀中的人臉。在面部識(shí)別階段,面部對(duì)比的通常方法是對(duì)圖像進(jìn)行矢量化操作。研究者采用了 facenet(一種在面部識(shí)別中較為完善的深度學(xué)習(xí)模型),它可以直接學(xué)習(xí)從面部圖像到緊致歐式空間的映射。
在情感識(shí)別階段,研究者出于直觀和可理解方面的考慮,選擇使用了分類模型。他們微調(diào)了一個(gè) CNN 模型(ResNet-50),采用了 FER 2013 數(shù)據(jù)集。這一數(shù)據(jù)集一直廣泛用于面部表情識(shí)別。站長(zhǎng)資源平臺(tái)考慮到情緒識(shí)別可能沒那么準(zhǔn)確,研究者挑出了一些影響因素(如人臉大小、遮擋情況、圖像分辨率、照明情況等),并在系統(tǒng)中對(duì)它們進(jìn)行了視覺編碼,以此判斷學(xué)生們的情感狀況。
這些影響因素可能在系統(tǒng)情緒分析中起到了比較關(guān)鍵的作用。比如離攝像頭比較遠(yuǎn)的人,他的臉部在視頻中占據(jù)的面積比較小,就更容易被錯(cuò)誤識(shí)別。除此之外,一個(gè)人的臉如果經(jīng)常被他人遮擋,也會(huì)有更高的系統(tǒng)誤判風(fēng)險(xiǎn)。研究者將這些因素整合到了系統(tǒng)分析流程之中,提供了更加豐富的交互功能來改進(jìn)系統(tǒng)性能。
交互式的視覺系統(tǒng)
第二階段是根據(jù)五大要求(細(xì)節(jié)見論文)設(shè)計(jì)一個(gè)交互式的視覺系統(tǒng),該系統(tǒng)可以支持兩種粒度的課堂視頻視覺分析,包括學(xué)生的總體情感演變和某個(gè)學(xué)生單獨(dú)的情感演變過程。研究者基于 Vue.js 前端框架和 Flask 后端框架實(shí)現(xiàn)了一個(gè)基于 web 的系統(tǒng),如下圖 3 所示。該系統(tǒng)包括三大視圖:摘要視圖(summary view,圖 3a-b);人物視圖(character view,圖 3c)和視頻視圖(video view,F(xiàn)ig. 3d)。暗中觀察,沒有“頭環(huán)”:AI攝像頭就可以看出你上課是否走神
為老師提供學(xué)生情感變化的總體情況非常重要,因此研究者設(shè)計(jì)了一個(gè)摘要視圖,讓老師看到學(xué)生情感的靜態(tài)和動(dòng)態(tài)演變數(shù)據(jù)。圖 3(a)顯示的是學(xué)生的情感檔案,用于展示學(xué)生的情感分布(靜態(tài)摘要);圖 3(b)顯示的是學(xué)生的情感變化曲線(動(dòng)態(tài)摘要)。人物視圖通過肖像類標(biāo)志符號(hào),將所選定目標(biāo)人物的情緒狀態(tài)可視化地表現(xiàn)出來。不同情感肖像之間的差異使得用戶能夠識(shí)別和比較不同人物的特征。如下圖 5 所示,研究者在設(shè)計(jì)中采用了定制化的餅狀圖:暗中觀察,沒有“頭環(huán)”:AI攝像頭就可以看出你上課是否走神
通過這種定制化的餅狀圖設(shè)計(jì),用戶可以很容易地觀察到詳細(xì)的情感信息以及對(duì)其感興趣的影響因素。同時(shí),屏幕快照功能使得不同人之間的情感信息比較變得更加容易。如果用戶希望查看詳細(xì)信息,可以單擊感興趣的快照進(jìn)行查看??煺盏氖纠挥谌宋镆晥D(圖 3c)的左側(cè)。在系統(tǒng)中,研究者提供了原始視頻以供用戶在視頻視圖(圖 3d)中瀏覽。同時(shí),用戶可以用不同速度播放視頻,當(dāng)用戶將視頻暫停時(shí),每一幀中對(duì)應(yīng)的面部都會(huì)被高亮顯示。用戶還可以根據(jù)自己對(duì)情感流的觀察挑選出感興趣的部分進(jìn)行進(jìn)一步的探索和挖掘。
「改善」教學(xué),還是「監(jiān)控」教學(xué)?
這項(xiàng)研究的初衷是幫助授課者收集學(xué)生反饋、提升教學(xué)質(zhì)量。但事實(shí)真能如其所愿嗎?
相比于依據(jù)視頻記錄去分析情緒,在國內(nèi)的課堂中,還有更夸張的「智能頭環(huán)」。在浙江金華某小學(xué)的課堂之上,每一個(gè)座位上的學(xué)生都戴著一個(gè)狀如「金箍」的黑色頭環(huán),專注時(shí)亮紅燈,走神時(shí)亮藍(lán)燈,這個(gè)注意力分?jǐn)?shù)每 10 分鐘發(fā)送一次到授課教師的電腦,并同步到家長(zhǎng)微信群中,讓身在校外的家長(zhǎng)隨時(shí)掌握孩子的上課狀態(tài)。
但這種頭環(huán),或者此類課堂監(jiān)控技術(shù),面對(duì)著非常多的質(zhì)疑。比如倫理問題:它暴露了學(xué)生在課堂中的個(gè)人情緒,讓教師能夠知道誰在課堂上專注或不專注。這涉及到學(xué)生的隱私問題。另外,在一節(jié) 40 分鐘的課程中,學(xué)生的注意力本就不可能保持全程專注,持續(xù)性監(jiān)控學(xué)生的注意力并對(duì)任何注意力不專注的行為進(jìn)行校正沒有意義。
還有一方面,這種監(jiān)控系統(tǒng)可能會(huì)分散教師和學(xué)生的注意力,因?yàn)樯碓谄渲械娜藭?huì)覺得有一雙眼睛「無時(shí)無刻不在盯著自己」。如果是頭戴金箍,這種情緒會(huì)變得更加明顯。這種被實(shí)時(shí)監(jiān)控的感覺會(huì)在一定程度上會(huì)影響課堂參與者自由發(fā)表意見。