AI 預測未來? 雖然有曙光,但路還很長
編者按:本文來自微信公眾號“學術(shù)頭條”(ID:SciTouTiao),作者:曹綺桐,36氪經(jīng)授權(quán)發(fā)布。
如果了解一個家庭的經(jīng)濟實力、教育水平、生活環(huán)境等基礎狀況數(shù)據(jù),你能預測未來十年或者二十年的生活樣子嗎?
答案是可想而知的 —— 畢竟復雜的社會網(wǎng)絡、難測的生活經(jīng)歷,以及每個帶有個人主觀性質(zhì)的小小決定,都有可能對未來生活造成不可逆轉(zhuǎn)的方向的改變。
但是,當擁有大量基礎數(shù)據(jù)后,我們或許可以判斷個人在特定生活環(huán)境下怎樣成長或者趨向性做出怎樣的決定,某個事件對于家庭會造成怎樣積極或者消極的影響, 這也許就會讓不可能變成可能。
而 AI 強大的分析數(shù)據(jù)的能力,給這種預測未來的可能帶來了一絲曙光。
如今,科學家們正開始在這一領(lǐng)域的嘗試。
來自普林斯頓大學 (Princeton University) 與弗吉尼亞理工大學 (Virginia Tech) 等多家機構(gòu)的研究人員合作進行的一項大規(guī)模研究,通過建立統(tǒng)計和機器學習模型來預測和衡量美國各地兒童、父母和家庭的生活結(jié)果,這個大規(guī)模的合作項目被稱為 “脆弱的家庭挑戰(zhàn)”。
來自弗吉尼亞理工大學弗拉林生命科學研究所的研究科學家 Brian Goode 是脆弱家庭挑戰(zhàn)中的數(shù)據(jù)和社會科學家之一?!斑@是一項努力,試圖捕捉數(shù)據(jù)和模型中構(gòu)成人類生活結(jié)構(gòu)的復雜性和復雜性。但是,為了更好地推斷預測的不確定性和局限性,必須采取下一步行動,將模型置于如何應用它們的環(huán)境中。這是一個很難解決的問題,我認為脆弱家庭的挑戰(zhàn)表明,我們需要在這一領(lǐng)域提供更多的研究支持,特別是在機器學習對我們?nèi)粘I町a(chǎn)生更大影響的情況下?!盉rian Goode 說道。
Goode 博士
該研究對 1998 年至 2000 年間出生在美國大城市的約 5000 名兒童進行了研究,其中未婚父母所生兒童的樣本數(shù)量過多。這項縱向研究的目的是了解出生在未婚家庭的孩子的生活。
通過收集六次調(diào)查 (孩子出生的時間,然后孩子長到 1、3、5、9、15 歲時),這項研究已經(jīng)收集了數(shù)百萬關(guān)于兒童及其家庭的數(shù)據(jù)點。另一組數(shù)據(jù)將在孩子們 22 歲時被獲取。
在研究人員設計這個項目的時候,15 歲的數(shù)據(jù) (研究人員在論文中稱其為 “保留數(shù)據(jù)”) 還沒有公開。這同時也創(chuàng)造了一個機會,讓其他科學家通過大規(guī)模合作來預測研究對象的生活結(jié)果。
聯(lián)合組織者收到了來自世界各地 68 所大學的 457 份申請,其中包括來自普林斯頓的幾個團隊。利用該項目的家庭數(shù)據(jù),參與者被要求預測 15 歲時六種生活結(jié)果中的一種或多種。其中包括兒童平均績點 (GPA)、孩子毅力、家庭物質(zhì)困難、主要照顧者裁員、主要照顧者參與工作培訓等。
麥克拉納漢是普林斯頓大學和哥倫比亞大學 “脆弱家庭與兒童健康研究”(Fragile Families and Child happiness Study) 的首席研究員。“剛開始的時候,我真的不知道什么是大規(guī)模協(xié)作,但我知道把我們的數(shù)據(jù)介紹給一組新的研究人員是個好主意, 那就是數(shù)據(jù)科學家,” 麥克拉納漢說。
“結(jié)果讓人大開眼界,” 她說,“要么運氣在人們的生活中扮演著重要角色,要么我們作為社會科學家的理論遺漏了一些重要的變量?!?/p>
這項挑戰(zhàn)是基于 “共同任務法”,這是一種在計算機科學中經(jīng)常使用的研究設計,但在社會科學中卻不常用。這種方法釋放了部分但不是全部的數(shù)據(jù),允許人們使用任何他們想要的技術(shù)來確定結(jié)果。目標是準確地預測保留的數(shù)據(jù),不管達到這個目標需要多么復雜的技術(shù)。
研究結(jié)果由 112 名共同作者發(fā)表在《美國國家科學院院刊》(PNAS) 雜志上。結(jié)果表明,即使使用了最先進的建模技術(shù)和包含 4000 多個家庭 1.3 萬個數(shù)據(jù)點的高質(zhì)量數(shù)據(jù)集,最好的人工智能預測模型也不是很準確。因此,社會學家和數(shù)據(jù)科學家對于 AI 預測模型時應謹慎使用,尤其是在刑事司法系統(tǒng)和社會項目中。
弗吉尼亞理工大學的研究小組還在美國社會學協(xié)會 (American Sociological Association) 新出版的開放獲取期刊《社會學》(Socius) 的一期特刊上發(fā)表了研究成果。為了支持這一領(lǐng)域的進一步研究,所有提交的挑戰(zhàn) —— 代碼、預測和敘事解釋 —— 都是公開的。
研究人員表示,結(jié)果向我們表明,我們有很多要學,科學家用來預測大數(shù)據(jù)集結(jié)果的機器學習技術(shù),在預測人們的生活結(jié)果方面可能存在不足。
參考資料:
https://www.eurekalert.org/pub_releases/2020-03/puww-pto032520.php
https://www.eurekalert.org/pub_releases/2020-03/vt-pto032720.php