123,123

^{<style id="gncq7"></style>}

微信咨詢

咨詢QQ

咨詢電話

公眾號(hào)

TOP

首頁(yè) > 知識(shí) > 科技前沿

GPT-4創(chuàng)造力有多強(qiáng)？專屬于智慧生物的發(fā)散思維，已超越人類！

來源：學(xué)術(shù)頭條

發(fā)布時(shí)間：2024-03-28

瀏覽次數(shù)：1368

版權(quán)歸原作者所有，如有侵權(quán)，請(qǐng)聯(lián)系我們

發(fā)散性思維（divergent thinking）被認(rèn)為是創(chuàng)造性思維的核心指標(biāo)，是人類創(chuàng)造性的體現(xiàn)。

如果 ChatGPT-4 等大模型具有超過人的發(fā)散性思維，那是不是意味著，這一專屬于智慧生物的獨(dú)特性，也被人工智能（AI）學(xué)會(huì)了？

近日，來自阿肯色大學(xué)的研究團(tuán)隊(duì)在一項(xiàng)工作中發(fā)現(xiàn)：ChatGPT-4 在創(chuàng)造性思維測(cè)試中的表現(xiàn)，已經(jīng)超越了人類。

相關(guān)研究論文以“The current state of artificial intelligence generative language models is more creative than humans on divergent thinking tasks”為題，已發(fā)表在 Nature 子刊 Scientific Reports 上。

研究團(tuán)隊(duì)表示：“總體而言，即使在控制反應(yīng)的流暢性的情況下，GPT-4 在每項(xiàng)發(fā)散性思維任務(wù)上都比人類更具獨(dú)創(chuàng)性和復(fù)雜性。換句話說，GPT-4 在整個(gè)發(fā)散思維任務(wù)中表現(xiàn)出了更高的創(chuàng)造潛力?！?/p>

GPT-4的發(fā)散性思維，真的好過人類？

據(jù)論文描述，研究團(tuán)隊(duì)測(cè)試了 151 名人類參與者和 ChatGPT-4 分別在 Alternative Uses Task、Consequences Task 和 Divergent Associations Task 三個(gè)創(chuàng)造性思維任務(wù)上的表現(xiàn)。

這些任務(wù)旨在評(píng)估個(gè)體的創(chuàng)造性思維能力，其中包括了對(duì)于日常物品的創(chuàng)新用途、對(duì)于假設(shè)情境的可能后果，以及對(duì)于詞語(yǔ)的語(yǔ)義差異的理解。這些標(biāo)準(zhǔn)有助于量化每個(gè)參與者在創(chuàng)造性思維任務(wù)中的表現(xiàn)，同時(shí)也為后續(xù)的分析提供了基礎(chǔ)。

Alternative Uses Task（替代用途任務(wù)）：這是一個(gè)經(jīng)典的創(chuàng)造力測(cè)試，要求參與者為一個(gè)常見物品想出盡可能多的不同用途。例如，參與者可能會(huì)被要求為一張紙想出多種用途。這個(gè)任務(wù)旨在衡量個(gè)體在生成獨(dú)特和多樣想法方面的能力。

Consequences Task（結(jié)果任務(wù)）：在這個(gè)任務(wù)中，參與者被要求想象一個(gè)不尋常的情況或事件，并描述可能發(fā)生的結(jié)果。例如，如果重力突然消失，會(huì)發(fā)生什么？這個(gè)任務(wù)考察的是個(gè)體在邏輯推理和想象力方面的創(chuàng)造力。

Divergent Associations Task（發(fā)散聯(lián)想任務(wù)）：這個(gè)任務(wù)要求參與者對(duì)一個(gè)給定的刺激詞（如“云”）提供盡可能多的關(guān)聯(lián)詞或想法。這個(gè)任務(wù)用于評(píng)估個(gè)體的思維靈活性和詞匯關(guān)聯(lián)能力。

測(cè)試結(jié)果顯示，在三個(gè)創(chuàng)造性思維任務(wù)中，ChatGPT-4 明顯優(yōu)于人類參與者。無論是在生成回答的數(shù)量、回答的長(zhǎng)度還是語(yǔ)義差異方面，ChatGPT-4 都表現(xiàn)出了顯著的優(yōu)勢(shì)，突顯了其在創(chuàng)造性思維領(lǐng)域的潛力。

圖｜在 Alternative Uses Task 中，與人類相比，在給出相同數(shù)量生成答案的機(jī)會(huì)下，GPT-4 更能成功地提出不同的答案，并且表現(xiàn)出更高的原創(chuàng)性，但僅限于特定的提示。（來源：該論文）

圖｜在 Consequences Task 中，與人類相比，在相同數(shù)量的機(jī)會(huì)下，GPT-4 能夠更成功地想出更多不同的反應(yīng)，并且根據(jù)提示類型也表現(xiàn)出更高的原創(chuàng)性。（來源：該論文）

為了排除其他因素的影響，研究還對(duì)回答流暢性進(jìn)行了控制比較。結(jié)果顯示，即使在控制了回答流暢性的情況下，ChatGPT-4 仍然表現(xiàn)出了更高的創(chuàng)造性潛力，進(jìn)一步證實(shí)了其在創(chuàng)造性思維任務(wù)中的優(yōu)越性。

這一研究結(jié)果引發(fā)了關(guān)于創(chuàng)造性潛力和實(shí)際應(yīng)用的討論。雖然 ChatGPT-4 在創(chuàng)造性思維任務(wù)中表現(xiàn)出了顯著的優(yōu)勢(shì)，但研究團(tuán)隊(duì)也指出了其適用性的局限性。

例如，與人類相比，ChatGPT-4 缺乏自主性和實(shí)際經(jīng)驗(yàn)，其創(chuàng)造性潛力依賴于人類用戶的指導(dǎo)和輸入。因此，盡管 ChatGPT-4 能夠生成創(chuàng)造性的想法，但其實(shí)際應(yīng)用仍受到限制。

另外，在評(píng)估 ChatGPT-4 的創(chuàng)造性潛力時(shí)，還需要考慮其回答的適用性和實(shí)用性。盡管 ChatGPT-4 可以生成大量原創(chuàng)的想法，但這些想法是否適用于實(shí)際情境，以及是否能夠產(chǎn)生有意義的成果，仍然需要進(jìn)一步的研究和驗(yàn)證。

最后，研究團(tuán)隊(duì)還強(qiáng)調(diào)了人類創(chuàng)造力的獨(dú)特性和多樣性。與 ChatGPT-4 相比，人類具有更廣泛的經(jīng)驗(yàn)和情感體驗(yàn)，能夠以更靈活和多樣的方式思考和創(chuàng)造。因此，在探討創(chuàng)造性潛力時(shí)，不能簡(jiǎn)單地將 ChatGPT-4 的表現(xiàn)與人類相提并論，同時(shí)也需要更全面地考慮其在實(shí)際應(yīng)用中的適用性和局限性。

AI取代人類？還有待觀察

與之前的研究相比，此次研究的測(cè)試結(jié)果揭示了 ChatGPT-4 在多個(gè)創(chuàng)造性思維任務(wù)上的顯著優(yōu)勢(shì)，為我們提供了有關(guān)人工智能在創(chuàng)造性思維方面的新認(rèn)識(shí)。

然而，這也引發(fā)了更多問題和未來的探索方向。我們需要深入研究人工智能與人類創(chuàng)造性思維之間的關(guān)系，探討如何更好地利用人工智能來促進(jìn)創(chuàng)新。

未來的研究將致力于開發(fā)更智能、更全面的測(cè)量方法，以更好地理解和評(píng)估創(chuàng)造性思維的各個(gè)方面。隨著人工智能技術(shù)的不斷發(fā)展，我們對(duì)于人類創(chuàng)造力的認(rèn)識(shí)也將不斷深化，為構(gòu)建更具創(chuàng)意和智能的未來奠定堅(jiān)實(shí)基礎(chǔ)。

研究團(tuán)隊(duì)認(rèn)為，這些測(cè)試是否能完美地衡量人類的創(chuàng)造潛能并不是問題的關(guān)鍵。關(guān)鍵在于，大模型正在快速演化，并以前所未有的方式超越人類，它們是否有可能取代人類的創(chuàng)造力還有待觀察。

他們也表示，在未來，人工智能作為靈感工具、作為個(gè)人創(chuàng)造過程的輔助工具或克服固定性（fixedness）的工具，都大有可為。

參考鏈接：

https://www.nature.com/articles/s41598-024-53303-w

https://arkansasresearch.uark.edu/ai-outperforms-humans-in-standardized-tests-of-creative-potential/

歡迎掃碼關(guān)注深i科普！

我們將定期推出

公益、免費(fèi)、優(yōu)惠的科普活動(dòng)和科普好物！