123,123

微信咨詢

咨詢QQ

咨詢電話

公眾號

TOP

首頁 > 知識 > 科技前沿

讓AI自發(fā)推理！引發(fā)熱議的“DeepSeek”到底是個啥？

來源：科普中國

發(fā)布時間：2025-02-06

瀏覽次數(shù)：1795

當?shù)貢r間1月27日，納斯達克股指出現(xiàn)3%下跌，原因是中國人工智能公司DeepSeek模型引發(fā)美國投資者關(guān)注。

央視記者在納斯達克交易所現(xiàn)場對納斯達克副主席麥柯奕進行了采訪。麥柯奕表示，他認為，DeepSeek將是人工智能領(lǐng)域革命的重要組成部分。

因受到DeepSeek人工智能模型沖擊，美國芯片巨頭英偉達（NVIDIA）當日股價暴跌約17%，博通公司股價下跌17%，超威半導(dǎo)體公司（AMD）股價下跌6%，微軟股價下跌2%。此外，人工智能領(lǐng)域的衍生品，如電力供應(yīng)商也受到重創(chuàng)。美國聯(lián)合能源公司股價下跌21%，Vistra的股價下跌29%。

版權(quán)圖庫圖片，轉(zhuǎn)載可能引發(fā)版權(quán)糾紛

01 最新開源模型R1引發(fā)關(guān)注

本月，DeepSeek在世界經(jīng)濟論壇2025年年會開幕當天發(fā)布了最新開源模型R1，再次引發(fā)全球關(guān)注。

據(jù)介紹，R1模型在技術(shù)上實現(xiàn)了重要突破——用純深度學(xué)習(xí)方法讓AI自發(fā)涌現(xiàn)出推理能力，在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上，性能比肩OpenAI的o1模型正式版，且訓(xùn)練成本僅為560萬美元，遠低于美國科技巨頭的數(shù)億美元乃至數(shù)十億美元投入。

02 DeepSeek到底是個啥？

DeepSeek是一款由國內(nèi)人工智能公司研發(fā)的大型語言模型，擁有強大的自然語言處理能力，能夠理解并回答問題，還能輔助寫代碼、整理資料和解決復(fù)雜的數(shù)學(xué)問題。

與OpenAI開發(fā)的ChatGPT相比，DeepSeek不僅率先實現(xiàn)了媲美OpenAI-o1模型的效果，還大幅降低了推理模型的成本。其新模型DeepSeek-R1以十分之一的成本達到了GPT-o1級別的表現(xiàn)，引發(fā)海外AI圈的廣泛討論。

北京郵電大學(xué)人工智能學(xué)院人機交互與認知工程實驗室主任劉偉介紹，DeepSeek最大的優(yōu)勢在于算法的改進和優(yōu)化，節(jié)省了算力和數(shù)據(jù)量。以前如果說OpenAI是“大力出奇跡”，如今DeepSeek則是“小力也可以出奇跡”——小的算力用新的方法也能創(chuàng)造奇跡。

03 更大不再等于更聰明

據(jù)深度求索公司官網(wǎng)介紹，DeepSeek-R1在后訓(xùn)練階段大規(guī)模使用了強化學(xué)習(xí)技術(shù)，在僅有很少標注數(shù)據(jù)的情況下極大提升了模型的推理能力，在數(shù)學(xué)、代碼、自然語言推理等任務(wù)上，測評性能與GPT-o1模型正式版接近。

國際投行摩根士丹利表示，“更大（的模型）不再等于更聰明”，DeepSeek通過顯著提高數(shù)據(jù)質(zhì)量和改進模型架構(gòu)，展示了一條與之前大模型不同的高效訓(xùn)練途徑。摩根士丹利說，DeepSeek的模型現(xiàn)在低成本優(yōu)勢突出，與國際知名大模型相比，其成本大約低了一個數(shù)量級。

高盛集團也認為，DeepSeek新模型的成本遠低于現(xiàn)有模型，這意味著開發(fā)利用大模型的門檻降低，互聯(lián)網(wǎng)巨頭將面臨初創(chuàng)公司的潛在競爭。

英國《金融時報》發(fā)表的一篇評論文章指出，DeepSeek挑戰(zhàn)了人工智能產(chǎn)業(yè)在過去一段時間的核心信念，即認為更強大的硬件才是推動人工智能發(fā)展的關(guān)鍵。

版權(quán)圖庫圖片，轉(zhuǎn)載可能引發(fā)版權(quán)糾紛

04 開源：未來的發(fā)展方向？

DeepSeek采用了完全開源策略，不僅降低了用戶的使用門檻，還促進了AI開發(fā)者社區(qū)的協(xié)作生態(tài)。通過開源，DeepSeek吸引了大量開發(fā)者和研究人員的關(guān)注，推動了AI技術(shù)的發(fā)展。英偉達AI科學(xué)家Jim Fan稱贊DeepSeek是“真正開放的前沿研究，賦能所有人”。

當然，開源也面臨著保護知識產(chǎn)權(quán)和開源社區(qū)秩序維護等挑戰(zhàn)。

俞揚表示，開源只是一種商業(yè)模式，即便開源項目也擁有版權(quán)。開源與閉源之爭，實質(zhì)上是不同商業(yè)模式在特定場景和時代背景下的有效性對比。

DeepSeek的成功被一些人視為中國技術(shù)理想主義的體現(xiàn)，甚至被外國人比喻為神秘的東方力量。

但從整個AI大模型產(chǎn)業(yè)來看，DeepSeek的成功或許代表了一種全新的發(fā)展方向——通過算法優(yōu)化而非單純依賴算力和數(shù)據(jù)量來提升模型性能。這一方向也為AI大模型產(chǎn)業(yè)的發(fā)展提供了新的思路。

歡迎掃碼關(guān)注深i科普！

我們將定期推出

公益、免費、優(yōu)惠的科普活動和科普好物！