AI顛覆人類?做高考題還是輸給了中國考生
別輕易相信AI會顛覆人類,做高考題還是輸給了中國考生!當(dāng) Alpha Go 又一次出招,三連勝中國圍棋天才柯潔之后,或許人們擔(dān)心的可能是,人工智能下一步又要在哪個領(lǐng)域干掉人類。不過,在考試這件事兒上,經(jīng)過了大量“學(xué)習(xí)”的機器人,也還是沒能超越人類。不得不說,中國學(xué)霸實在威武。
昨天是2017年全國高考第一天,在當(dāng)天的數(shù)學(xué)考試結(jié)束之后,一場人機高考大戰(zhàn)的對決在北京上演了:在線教育公司“學(xué)霸君”自主研發(fā)的智能教育機器人“Aidam”首次公開亮相,通過現(xiàn)場直播的方式,與六名高考狀元同臺競技今年全國卷文科數(shù)學(xué)試題,完成包括客觀題和主觀題在內(nèi)的整張試卷,并按照評分標(biāo)準(zhǔn)得出最終成績。
不過,出人意料的是,這一次AI并沒有全面碾壓人類。閱卷結(jié)果顯示,三組高考狀元分別得分為146分,140分,119分,而Aidam為134分,總分為150分。
在成都,“國家隊”的成績表現(xiàn)也不是很理想。由國家863計劃 “超腦計劃”牽頭研制的“高考機器人”,成都準(zhǔn)星云學(xué)科技有限公司研發(fā)設(shè)計的數(shù)學(xué)高考機器人AI-MATHS,在斷網(wǎng)斷題庫的環(huán)境下,用時22分鐘完成當(dāng)天北京卷文科數(shù)學(xué)高考試題。
經(jīng)過現(xiàn)場批閱,成績?yōu)?05分(總分150分)。之后,AI-MATHS再次挑戰(zhàn)解答全國二卷數(shù)學(xué)卷,用時10分鐘,考了100分(總分150分)。
AI-MATHS是由國家863計劃 “超腦計劃”牽頭研制的“高考機器人”, 該“類人智能”項目于2015年7月21日由國家科技部正式啟動。
在學(xué)霸君人機大戰(zhàn)考試結(jié)束后的對話環(huán)節(jié)中,小組得分為119的2015年新疆理科狀元多力崗表示,對Aidam的成績有點意外,稱“這個比賽結(jié)果和我們的預(yù)期還是有一定的差距,我們在比賽之后分析了一下,自己在一些細節(jié)或者在一些計算方面出了一些問題”。
當(dāng)然,從接近的分?jǐn)?shù)來看,這次Aidam雖然沒有完勝,然而其在10分鐘解題,獲得了134分的成績,也足夠超越一大批考生。
學(xué)霸君首席科學(xué)家陳銳鋒在考試比賽的現(xiàn)場解釋說,Aidam解題主要分為三大步驟:
第一,把試卷題目變成機器可以理解的形式語言。
第二,在用形式語言完整描述了一系列環(huán)境之后,計算機就會在知識網(wǎng)絡(luò)里啟動搜索,確認題目觸發(fā)了哪些知識點,然后進行一系列的推理,找出最佳解題路徑。
第三,把解題的過程和答案,從形式語言轉(zhuǎn)化為自然語言,完成解題過程。
而要實現(xiàn)這些,基礎(chǔ)是龐大的數(shù)據(jù)庫和人工智能領(lǐng)域多年技術(shù)的積累。從學(xué)霸君官方披露的數(shù)據(jù)來看,截至2017年5月,“學(xué)霸君”App已經(jīng)積累超過7000萬學(xué)生用戶,累計已經(jīng)解決問題100億道,答疑命中率為93%。
那么,為何PK高考狀元選擇的是數(shù)學(xué)學(xué)科?
學(xué)霸君創(chuàng)始人兼CEO張凱磊說,“一千個人有一千個哈姆雷特,但是世界上只有一個勾股定理”。
數(shù)學(xué)、物理等理科類科目是強邏輯鏈路的,考點基本穩(wěn)定,容易判定對錯。同時,數(shù)學(xué)試卷中包括簡單的選擇題,也有復(fù)雜的需要解題過程的大題,非常適合測試AI。
別輕易相信AI顛覆人類,做高考題它們還是輸給了中國考生
學(xué)霸君創(chuàng)始人兼 CEO 張凱磊,他本人以高考數(shù)學(xué)和物理滿分成績考入南開大學(xué)數(shù)學(xué)基地班
對于機器人來說,形式化語言是自動解題的一大挑戰(zhàn),而目前數(shù)學(xué)學(xué)科最大的難點在于應(yīng)用題的解題上,期間涉及到一些社會常識和文字性表述等。
在業(yè)內(nèi)人士看來,讓機器人參加高考,并不是項目的根本目標(biāo),只是其對于人類智能的一種模擬、擴展和延伸。目前來說,高考是一種衡量人的知識水平、理解能力、推理能力等相關(guān)智力水平的測試工具,其包含了對題目的理解、知識表現(xiàn)、邏輯推理等方式獲得知識。
在接受多家媒體采訪時,張凱磊表示,“實現(xiàn)個性化學(xué)習(xí),大幅度提升學(xué)習(xí)效率和成果是學(xué)霸君研發(fā)智能教育機器人的初衷”。
張凱磊表示,中學(xué)期間大概有3529個考點、平均每個做3-4道題就夠了,寫1萬道題目可以做完,但目前絕大部分學(xué)生面對的練習(xí)題有3萬—4萬,其中3/4的題目是不需要寫的,75%的寶貴時間都被浪費掉了。
學(xué)霸君構(gòu)建于深度神經(jīng)網(wǎng)絡(luò)的句法和語義分析器,在海量題庫中不斷強化和擴充訓(xùn)練。在K12中,有大部分的數(shù)學(xué)應(yīng)用題,需要知識圖譜和常識才能解決,學(xué)霸君構(gòu)建的是一個真實題目海洋的模擬器,逐步提升其對于真實世界的接近程度。
基于人工智能的專家系統(tǒng)成就了精準(zhǔn)推理。學(xué)霸君推進圖像識別、自然語言理解、深度學(xué)習(xí)等人工智能領(lǐng)域的研究,并整合成為智能教育機器人。其在現(xiàn)有教育環(huán)境下,使機器判卷、個性化指導(dǎo)、個性化作業(yè)、教案改進等變成可能。
盡管如此,陳銳鋒認為,即便是刷題,AI也并不能代替老師。因為,任何時候機器人都沒有辦法代替老師講解。比如說,這道題為什么對,為什么錯,解題思路為什么這么想不對,為什么那樣想又是對的。但是,AI可以告訴老師說,這個學(xué)生的哪些知識點有問題,應(yīng)該花更多時間在哪些知識點訓(xùn)練,而不是浪費在其他已經(jīng)掌握的知識上。
值得注意的是,無論是作業(yè)幫、猿輔導(dǎo)還是阿凡題,目前市面上大部分工具屬性偏強的題庫類在線教育產(chǎn)品,一直都沒找到盈利爆發(fā)點。張凱磊也向鈦媒體透露,目前學(xué)霸君暫未實現(xiàn)盈利,但是已經(jīng)開始實現(xiàn)了規(guī)?;杖搿?/p>
“國家隊”還將在2019年和2020年參加高考。作為“十二五”863計劃信息技術(shù)領(lǐng)域“基于大數(shù)據(jù)的類人智能關(guān)鍵技術(shù)與系統(tǒng)”項目的牽頭單位,科大訊飛方面表示,語文、地理、歷史高考機器人將于2019、2020年參加高考進行最后的成果測試。
更多可關(guān)注2898站長資源平臺資訊欄目:http://afrimangol.com/news/kjpl/