版權(quán)歸原作者所有,如有侵權(quán),請(qǐng)聯(lián)系我們
發(fā)散性思維(divergent thinking)被認(rèn)為是創(chuàng)造性思維的核心指標(biāo),是人類創(chuàng)造性的體現(xiàn)。
如果 ChatGPT-4 等大模型具有超過人的發(fā)散性思維,那是不是意味著,這一專屬于智慧生物的獨(dú)特性,也被人工智能(AI)學(xué)會(huì)了?
近日,來自阿肯色大學(xué)的研究團(tuán)隊(duì)在一項(xiàng)工作中發(fā)現(xiàn):ChatGPT-4 在創(chuàng)造性思維測(cè)試中的表現(xiàn),已經(jīng)超越了人類。
相關(guān)研究論文以“The current state of artificial intelligence generative language models is more creative than humans on divergent thinking tasks”為題,已發(fā)表在 Nature 子刊 Scientific Reports 上。
研究團(tuán)隊(duì)表示:“總體而言,即使在控制反應(yīng)的流暢性的情況下,GPT-4 在每項(xiàng)發(fā)散性思維任務(wù)上都比人類更具獨(dú)創(chuàng)性和復(fù)雜性。換句話說,GPT-4 在整個(gè)發(fā)散思維任務(wù)中表現(xiàn)出了更高的創(chuàng)造潛力。”
GPT-4的發(fā)散性思維,真的好過人類?
據(jù)論文描述,研究團(tuán)隊(duì)測(cè)試了 151 名人類參與者和 ChatGPT-4 分別在 Alternative Uses Task、Consequences Task 和 Divergent Associations Task 三個(gè)創(chuàng)造性思維任務(wù)上的表現(xiàn)。
這些任務(wù)旨在評(píng)估個(gè)體的創(chuàng)造性思維能力,其中包括了對(duì)于日常物品的創(chuàng)新用途、對(duì)于假設(shè)情境的可能后果,以及對(duì)于詞語的語義差異的理解。這些標(biāo)準(zhǔn)有助于量化每個(gè)參與者在創(chuàng)造性思維任務(wù)中的表現(xiàn),同時(shí)也為后續(xù)的分析提供了基礎(chǔ)。
Alternative Uses Task(替代用途任務(wù)):這是一個(gè)經(jīng)典的創(chuàng)造力測(cè)試,要求參與者為一個(gè)常見物品想出盡可能多的不同用途。例如,參與者可能會(huì)被要求為一張紙想出多種用途。這個(gè)任務(wù)旨在衡量個(gè)體在生成獨(dú)特和多樣想法方面的能力。
Consequences Task(結(jié)果任務(wù)):在這個(gè)任務(wù)中,參與者被要求想象一個(gè)不尋常的情況或事件,并描述可能發(fā)生的結(jié)果。例如,如果重力突然消失,會(huì)發(fā)生什么?這個(gè)任務(wù)考察的是個(gè)體在邏輯推理和想象力方面的創(chuàng)造力。
Divergent Associations Task(發(fā)散聯(lián)想任務(wù)):這個(gè)任務(wù)要求參與者對(duì)一個(gè)給定的刺激詞(如“云”)提供盡可能多的關(guān)聯(lián)詞或想法。這個(gè)任務(wù)用于評(píng)估個(gè)體的思維靈活性和詞匯關(guān)聯(lián)能力。
測(cè)試結(jié)果顯示,在三個(gè)創(chuàng)造性思維任務(wù)中,ChatGPT-4 明顯優(yōu)于人類參與者。無論是在生成回答的數(shù)量、回答的長(zhǎng)度還是語義差異方面,ChatGPT-4 都表現(xiàn)出了顯著的優(yōu)勢(shì),突顯了其在創(chuàng)造性思維領(lǐng)域的潛力。
圖|在 Alternative Uses Task 中,與人類相比,在給出相同數(shù)量生成答案的機(jī)會(huì)下,GPT-4 更能成功地提出不同的答案,并且表現(xiàn)出更高的原創(chuàng)性,但僅限于特定的提示。(來源:該論文)
圖|在 Consequences Task 中,與人類相比,在相同數(shù)量的機(jī)會(huì)下,GPT-4 能夠更成功地想出更多不同的反應(yīng),并且根據(jù)提示類型也表現(xiàn)出更高的原創(chuàng)性。(來源:該論文)
為了排除其他因素的影響,研究還對(duì)回答流暢性進(jìn)行了控制比較。結(jié)果顯示,即使在控制了回答流暢性的情況下,ChatGPT-4 仍然表現(xiàn)出了更高的創(chuàng)造性潛力,進(jìn)一步證實(shí)了其在創(chuàng)造性思維任務(wù)中的優(yōu)越性。
這一研究結(jié)果引發(fā)了關(guān)于創(chuàng)造性潛力和實(shí)際應(yīng)用的討論。雖然 ChatGPT-4 在創(chuàng)造性思維任務(wù)中表現(xiàn)出了顯著的優(yōu)勢(shì),但研究團(tuán)隊(duì)也指出了其適用性的局限性。
例如,與人類相比,ChatGPT-4 缺乏自主性和實(shí)際經(jīng)驗(yàn),其創(chuàng)造性潛力依賴于人類用戶的指導(dǎo)和輸入。因此,盡管 ChatGPT-4 能夠生成創(chuàng)造性的想法,但其實(shí)際應(yīng)用仍受到限制。
另外,在評(píng)估 ChatGPT-4 的創(chuàng)造性潛力時(shí),還需要考慮其回答的適用性和實(shí)用性。盡管 ChatGPT-4 可以生成大量原創(chuàng)的想法,但這些想法是否適用于實(shí)際情境,以及是否能夠產(chǎn)生有意義的成果,仍然需要進(jìn)一步的研究和驗(yàn)證。
最后,研究團(tuán)隊(duì)還強(qiáng)調(diào)了人類創(chuàng)造力的獨(dú)特性和多樣性。與 ChatGPT-4 相比,人類具有更廣泛的經(jīng)驗(yàn)和情感體驗(yàn),能夠以更靈活和多樣的方式思考和創(chuàng)造。因此,在探討創(chuàng)造性潛力時(shí),不能簡(jiǎn)單地將 ChatGPT-4 的表現(xiàn)與人類相提并論,同時(shí)也需要更全面地考慮其在實(shí)際應(yīng)用中的適用性和局限性。
AI取代人類?還有待觀察
與之前的研究相比,此次研究的測(cè)試結(jié)果揭示了 ChatGPT-4 在多個(gè)創(chuàng)造性思維任務(wù)上的顯著優(yōu)勢(shì),為我們提供了有關(guān)人工智能在創(chuàng)造性思維方面的新認(rèn)識(shí)。
然而,這也引發(fā)了更多問題和未來的探索方向。我們需要深入研究人工智能與人類創(chuàng)造性思維之間的關(guān)系,探討如何更好地利用人工智能來促進(jìn)創(chuàng)新。
未來的研究將致力于開發(fā)更智能、更全面的測(cè)量方法,以更好地理解和評(píng)估創(chuàng)造性思維的各個(gè)方面。隨著人工智能技術(shù)的不斷發(fā)展,我們對(duì)于人類創(chuàng)造力的認(rèn)識(shí)也將不斷深化,為構(gòu)建更具創(chuàng)意和智能的未來奠定堅(jiān)實(shí)基礎(chǔ)。
研究團(tuán)隊(duì)認(rèn)為,這些測(cè)試是否能完美地衡量人類的創(chuàng)造潛能并不是問題的關(guān)鍵。關(guān)鍵在于,大模型正在快速演化,并以前所未有的方式超越人類,它們是否有可能取代人類的創(chuàng)造力還有待觀察。
他們也表示,在未來,人工智能作為靈感工具、作為個(gè)人創(chuàng)造過程的輔助工具或克服固定性(fixedness)的工具,都大有可為。
參考鏈接:
https://www.nature.com/articles/s41598-024-53303-w
https://arkansasresearch.uark.edu/ai-outperforms-humans-in-standardized-tests-of-creative-potential/
歡迎掃碼關(guān)注深i科普!
我們將定期推出
公益、免費(fèi)、優(yōu)惠的科普活動(dòng)和科普好物!