AI顛覆人類?做高考題還是輸給了中國考生
別輕易相信AI會顛覆人類,做高考題還是輸給了中國考生!當(dāng) Alpha Go 又一次出招,三連勝中國圍棋天才柯潔之后,或許人們擔(dān)心的可能是,人工智能下一步又要在哪個(gè)領(lǐng)域干掉人類。不過,在考試這件事兒上,經(jīng)過了大量“學(xué)習(xí)”的機(jī)器人,也還是沒能超越人類。不得不說,中國學(xué)霸實(shí)在威武。
昨天是2017年全國高考第一天,在當(dāng)天的數(shù)學(xué)考試結(jié)束之后,一場人機(jī)高考大戰(zhàn)的對決在北京上演了:在線教育公司“學(xué)霸君”自主研發(fā)的智能教育機(jī)器人“Aidam”首次公開亮相,通過現(xiàn)場直播的方式,與六名高考狀元同臺競技今年全國卷文科數(shù)學(xué)試題,完成包括客觀題和主觀題在內(nèi)的整張?jiān)嚲?,并按照評分標(biāo)準(zhǔn)得出最終成績。
不過,出人意料的是,這一次AI并沒有全面碾壓人類。閱卷結(jié)果顯示,三組高考狀元分別得分為146分,140分,119分,而Aidam為134分,總分為150分。
在成都,“國家隊(duì)”的成績表現(xiàn)也不是很理想。由國家863計(jì)劃 “超腦計(jì)劃”牽頭研制的“高考機(jī)器人”,成都準(zhǔn)星云學(xué)科技有限公司研發(fā)設(shè)計(jì)的數(shù)學(xué)高考機(jī)器人AI-MATHS,在斷網(wǎng)斷題庫的環(huán)境下,用時(shí)22分鐘完成當(dāng)天北京卷文科數(shù)學(xué)高考試題。
經(jīng)過現(xiàn)場批閱,成績?yōu)?05分(總分150分)。之后,AI-MATHS再次挑戰(zhàn)解答全國二卷數(shù)學(xué)卷,用時(shí)10分鐘,考了100分(總分150分)。
AI-MATHS是由國家863計(jì)劃 “超腦計(jì)劃”牽頭研制的“高考機(jī)器人”, 該“類人智能”項(xiàng)目于2015年7月21日由國家科技部正式啟動(dòng)。
在學(xué)霸君人機(jī)大戰(zhàn)考試結(jié)束后的對話環(huán)節(jié)中,小組得分為119的2015年新疆理科狀元多力崗表示,對Aidam的成績有點(diǎn)意外,稱“這個(gè)比賽結(jié)果和我們的預(yù)期還是有一定的差距,我們在比賽之后分析了一下,自己在一些細(xì)節(jié)或者在一些計(jì)算方面出了一些問題”。
當(dāng)然,從接近的分?jǐn)?shù)來看,這次Aidam雖然沒有完勝,然而其在10分鐘解題,獲得了134分的成績,也足夠超越一大批考生。
學(xué)霸君首席科學(xué)家陳銳鋒在考試比賽的現(xiàn)場解釋說,Aidam解題主要分為三大步驟:
第一,把試卷題目變成機(jī)器可以理解的形式語言。
第二,在用形式語言完整描述了一系列環(huán)境之后,計(jì)算機(jī)就會在知識網(wǎng)絡(luò)里啟動(dòng)搜索,確認(rèn)題目觸發(fā)了哪些知識點(diǎn),然后進(jìn)行一系列的推理,找出最佳解題路徑。
第三,把解題的過程和答案,從形式語言轉(zhuǎn)化為自然語言,完成解題過程。
而要實(shí)現(xiàn)這些,基礎(chǔ)是龐大的數(shù)據(jù)庫和人工智能領(lǐng)域多年技術(shù)的積累。從學(xué)霸君官方披露的數(shù)據(jù)來看,截至2017年5月,“學(xué)霸君”App已經(jīng)積累超過7000萬學(xué)生用戶,累計(jì)已經(jīng)解決問題100億道,答疑命中率為93%。
那么,為何PK高考狀元選擇的是數(shù)學(xué)學(xué)科?
學(xué)霸君創(chuàng)始人兼CEO張凱磊說,“一千個(gè)人有一千個(gè)哈姆雷特,但是世界上只有一個(gè)勾股定理”。
數(shù)學(xué)、物理等理科類科目是強(qiáng)邏輯鏈路的,考點(diǎn)基本穩(wěn)定,容易判定對錯(cuò)。同時(shí),數(shù)學(xué)試卷中包括簡單的選擇題,也有復(fù)雜的需要解題過程的大題,非常適合測試AI。
別輕易相信AI顛覆人類,做高考題它們還是輸給了中國考生
學(xué)霸君創(chuàng)始人兼 CEO 張凱磊,他本人以高考數(shù)學(xué)和物理滿分成績考入南開大學(xué)數(shù)學(xué)基地班
對于機(jī)器人來說,形式化語言是自動(dòng)解題的一大挑戰(zhàn),而目前數(shù)學(xué)學(xué)科最大的難點(diǎn)在于應(yīng)用題的解題上,期間涉及到一些社會常識和文字性表述等。
在業(yè)內(nèi)人士看來,讓機(jī)器人參加高考,并不是項(xiàng)目的根本目標(biāo),只是其對于人類智能的一種模擬、擴(kuò)展和延伸。目前來說,高考是一種衡量人的知識水平、理解能力、推理能力等相關(guān)智力水平的測試工具,其包含了對題目的理解、知識表現(xiàn)、邏輯推理等方式獲得知識。
在接受多家媒體采訪時(shí),張凱磊表示,“實(shí)現(xiàn)個(gè)性化學(xué)習(xí),大幅度提升學(xué)習(xí)效率和成果是學(xué)霸君研發(fā)智能教育機(jī)器人的初衷”。
張凱磊表示,中學(xué)期間大概有3529個(gè)考點(diǎn)、平均每個(gè)做3-4道題就夠了,寫1萬道題目可以做完,但目前絕大部分學(xué)生面對的練習(xí)題有3萬—4萬,其中3/4的題目是不需要寫的,75%的寶貴時(shí)間都被浪費(fèi)掉了。
學(xué)霸君構(gòu)建于深度神經(jīng)網(wǎng)絡(luò)的句法和語義分析器,在海量題庫中不斷強(qiáng)化和擴(kuò)充訓(xùn)練。在K12中,有大部分的數(shù)學(xué)應(yīng)用題,需要知識圖譜和常識才能解決,學(xué)霸君構(gòu)建的是一個(gè)真實(shí)題目海洋的模擬器,逐步提升其對于真實(shí)世界的接近程度。
基于人工智能的專家系統(tǒng)成就了精準(zhǔn)推理。學(xué)霸君推進(jìn)圖像識別、自然語言理解、深度學(xué)習(xí)等人工智能領(lǐng)域的研究,并整合成為智能教育機(jī)器人。其在現(xiàn)有教育環(huán)境下,使機(jī)器判卷、個(gè)性化指導(dǎo)、個(gè)性化作業(yè)、教案改進(jìn)等變成可能。
盡管如此,陳銳鋒認(rèn)為,即便是刷題,AI也并不能代替老師。因?yàn)?,任何時(shí)候機(jī)器人都沒有辦法代替老師講解。比如說,這道題為什么對,為什么錯(cuò),解題思路為什么這么想不對,為什么那樣想又是對的。但是,AI可以告訴老師說,這個(gè)學(xué)生的哪些知識點(diǎn)有問題,應(yīng)該花更多時(shí)間在哪些知識點(diǎn)訓(xùn)練,而不是浪費(fèi)在其他已經(jīng)掌握的知識上。
值得注意的是,無論是作業(yè)幫、猿輔導(dǎo)還是阿凡題,目前市面上大部分工具屬性偏強(qiáng)的題庫類在線教育產(chǎn)品,一直都沒找到盈利爆發(fā)點(diǎn)。張凱磊也向鈦媒體透露,目前學(xué)霸君暫未實(shí)現(xiàn)盈利,但是已經(jīng)開始實(shí)現(xiàn)了規(guī)?;杖?。
“國家隊(duì)”還將在2019年和2020年參加高考。作為“十二五”863計(jì)劃信息技術(shù)領(lǐng)域“基于大數(shù)據(jù)的類人智能關(guān)鍵技術(shù)與系統(tǒng)”項(xiàng)目的牽頭單位,科大訊飛方面表示,語文、地理、歷史高考機(jī)器人將于2019、2020年參加高考進(jìn)行最后的成果測試。
更多可關(guān)注2898站長資源平臺資訊欄目:http://www.afrimangol.com/news/kjpl/