版權歸原作者所有,如有侵權,請聯(lián)系我們
人工智能會下棋,甚至打敗過世界圍棋冠軍,這已經是老生常談。
別看AI這么厲害,它只是借助了深度學習的方式,通過無數(shù)次的訓練,讓它能夠在面對實際問題時,從訓練數(shù)據(jù)庫中計算尋得最優(yōu)解,這并不代表機器人能夠像人一樣進行自主思考。
7月11日,Deep Mind公司最新的一項關于AI的文章有了突破性進展,研究者運用發(fā)展心理學領域的知識可以讓AI能像人類嬰兒一樣“學會思考”。而此前,最先進的AI系統(tǒng)仍然難以捕捉到日常人類場景中的“常識性”知識,比如指導預測、推理和行動。
可以說,Deep Mind的這項研究,大大推進了人工智能在直覺感知方面的發(fā)展。此后,人工智能真的更像“人”了。
撰文 | 徐詩露
出品:科普中國-星空計劃
圖片來自Deep Mind
早在機器人問世之時,就有許多人想象過:如果機器人能夠像人一樣思考,世界將會變成什么樣子?(相信你腦海中已經浮現(xiàn)出相應的電影場景了)
這個問題已經塵封多年,但是近期的一項發(fā)表在《自然·人類行為》上的研究顯示,人工智能或許擁有了“像嬰兒一樣思考”的能力:能像嬰兒一樣理解直觀物理學。值得一提的是,這是知名人工智能公司Deep Mind科研人員發(fā)表的成果。
論文通訊作者Luis Piloto,此前他在普林斯頓大學學習
Luis Piloto和他的同事做了一個能學習直觀物理學的深度學習系統(tǒng),名為PLATO。PLATO包含的系統(tǒng)受到了嬰兒學習方法相關研究的啟發(fā)。并且,PLATO遵循認為物體在我們周圍物理世界的表示和預測中扮演核心作用的理論。
具體來說,研究者通過給PLATO觀看許多描繪簡單場景的視頻來訓練它,比如球落到地上,球滾到其他物體后面又再次出現(xiàn),很多球之間彈來彈去。訓練之后,PLATO在看到沒有意義的場景(如物體互相穿過卻沒有發(fā)生相互作用)時表現(xiàn)出了像人類嬰兒那樣“驚訝”。
令人驚訝的是,PLATO只觀看了28小時的視頻就獲得了以上學習效果。
我們不禁發(fā)問,直觀物理學是什么,嬰兒是如何理解它的?AI又是如何學到這一點的呢?
嬰兒眼里的直觀物理學是什么?
首先我們來明確一個概念,直觀物理學是什么?我們可以簡單地把它理解為“直覺”或者“常識”。
比如我們在桌子上方丟下一串鑰匙,所有人都知道,鑰匙不會漂浮在半空中,也不會穿過桌面掉到地上,而是會掉落在桌面上。
這就是“直觀物理學”,它是我們了解世界的基礎物理概念,也是思維中“常識”的關鍵組成部分。
在發(fā)展心理學領域中,直觀物理學被分為5個方面的概念:
1. 連續(xù)性:物體不會從一個地方傳送到另一個地方,而是在時間和空間中有一定的連續(xù)路徑;
2. 對象持久性:物體在看不見時不會消失;
3. 固體性:物體不會相互滲透;
4. 不變性:對象的屬性(如形狀)不會更改;
5. 定向慣性:物體運動的路徑與慣性原理一致。
是不是每一個都很好理解?沒錯,這些都是我們容易理解和接受的“常識性”概念。
如果鑰匙的掉落過程違背了我們的常識,比如懸浮在了半空中、或者穿過了桌子、或者是從桌面上duang的一下彈起來老高,甚至是化成了液體,那么事情就會超出我們的預期,變得詭異起來。
面對這種怪異事件,每個人都會感到驚訝。即使是三個月大的嬰兒也是一樣,他們也會對這樣違背直觀物理學的現(xiàn)象表現(xiàn)出驚訝,這種驚訝反應被稱為違反期望(VoE)效應。
至于嬰兒對世界的認識是否和成人一樣,這一點存在一個關于“先天”和“后天”的爭議,許多發(fā)展科學家認為這是“先天”的,也有一些學者更支持從無到有的“后天”理論。
那我們能否設計一個模擬嬰兒思維的程序,通過適當?shù)挠柧?,使AI能夠像嬰兒一樣思考呢?
如何把AI訓練得像嬰兒一樣思考?
為了探究這個爭論不休的“先天”和“后天”問題,Piloto等人利用PLATO仿真系統(tǒng),來測試深度學習系統(tǒng)是否能夠通過學習視覺動畫,來獲得對直觀物理學的理解。
如果“后天”的理論是正確的,那么智力發(fā)展的關鍵就在于通過處理大量經驗和大量數(shù)據(jù)來進行鍛煉。
PLATO仿真系統(tǒng)由兩個模塊組成:前饋感知模塊(左)和循環(huán)動態(tài)預測器模塊(右)組成。前饋感知模塊中,通過編碼器將圖像轉換為一組對象代碼,通過解碼器模塊將對象代碼解碼成對象的圖像。利用重建和原始圖像之間的差異來訓練編碼器和解碼器的參數(shù)。循環(huán)動態(tài)模塊中,動態(tài)模塊通過預先訓練好的解碼器對下一時刻的對象狀態(tài)進行預測。
而這項研究使用的訓練數(shù)據(jù)少到驚人,就讓AI擁有了穩(wěn)定的違反期望效應。在面對超出5個直觀物理學概念的情況時,PLATO仿真系統(tǒng)會顯示出魯棒(即具有穩(wěn)定性)的VoE效應。這可以解釋一些直觀物理學的概念,但是這種效應與嬰兒身上看到的現(xiàn)象并不完全一致。
研究發(fā)現(xiàn),雖然視覺動畫的經驗對智力發(fā)展有很重要的貢獻,但不足以解釋我們在嬰兒身上看到的現(xiàn)象。
也就是說,智力發(fā)展并非全部依靠于“后天”的經驗和數(shù)據(jù)。要形成完整的智力,還需要一些先天的認知,這項研究在“先天”派和“后天”派之間建立了一個有趣的中間立場。
當視頻在直觀物理學上變得不可能時,AI表現(xiàn)出的驚訝會顯著增加。
此外,PLATO仿真系統(tǒng)可以將符合直觀物理學的期望,歸納為一組與訓練中不相同的對象和事件。其次,盡管只是接受了相對較少的視覺動畫訓練,這個仿真系統(tǒng)也能夠成功地演示學習,在針對嬰兒研究中也有相似的特征。
可以看到,將仿真建模的工作和發(fā)展心理學中的關鍵問題融合起來,研究人員得到了意想不到的效果和結論。
目前,研究團隊正在將違反期望效應的研究擴展到神經生理學領域,這可能為后續(xù)的研究開辟新的可能性,也為AI的發(fā)展提供了更多的可能。
參考資料
1. Can a computer think like a baby? Nature News.
2. Intuitive physics learning in a deep-learning model inspired by developmental psychology.
https://doi.org/10.1038/s41562-022-01394-8.歡迎掃碼關注深i科普!
我們將定期推出
公益、免費、優(yōu)惠的科普活動和科普好物!