讓AI自發(fā)推理!引發(fā)熱議的“DeepSeek”到底是個啥?
來源:科普中國
發(fā)布時間:2025-02-06
瀏覽次數:765

當地時間1月27日,納斯達克股指出現3%下跌,原因是中國人工智能公司DeepSeek模型引發(fā)美國投資者關注。

央視記者在納斯達克交易所現場對納斯達克副主席麥柯奕進行了采訪。麥柯奕表示,他認為,DeepSeek將是人工智能領域革命的重要組成部分。

因受到DeepSeek人工智能模型沖擊,美國芯片巨頭英偉達(NVIDIA)當日股價暴跌約17%,博通公司股價下跌17%,超威半導體公司(AMD)股價下跌6%,微軟股價下跌2%。此外,人工智能領域的衍生品,如電力供應商也受到重創(chuàng)。美國聯合能源公司股價下跌21%,Vistra的股價下跌29%。

版權圖庫圖片,轉載可能引發(fā)版權糾紛

01 最新開源模型R1引發(fā)關注

本月,DeepSeek在世界經濟論壇2025年年會開幕當天發(fā)布了最新開源模型R1,再次引發(fā)全球關注。

據介紹,R1模型在技術上實現了重要突破——用純深度學習方法讓AI自發(fā)涌現出推理能力,在數學、代碼、自然語言推理等任務上,性能比肩OpenAI的o1模型正式版,且訓練成本僅為560萬美元,遠低于美國科技巨頭的數億美元乃至數十億美元投入。

02 DeepSeek到底是個啥?

DeepSeek是一款由國內人工智能公司研發(fā)的大型語言模型,擁有強大的自然語言處理能力,能夠理解并回答問題,還能輔助寫代碼、整理資料和解決復雜的數學問題。

與OpenAI開發(fā)的ChatGPT相比,DeepSeek不僅率先實現了媲美OpenAI-o1模型的效果,還大幅降低了推理模型的成本。其新模型DeepSeek-R1以十分之一的成本達到了GPT-o1級別的表現,引發(fā)海外AI圈的廣泛討論。

北京郵電大學人工智能學院人機交互與認知工程實驗室主任劉偉介紹,DeepSeek最大的優(yōu)勢在于算法的改進和優(yōu)化,節(jié)省了算力和數據量。以前如果說OpenAI是“大力出奇跡”,如今DeepSeek則是“小力也可以出奇跡”——小的算力用新的方法也能創(chuàng)造奇跡。

03 更大不再等于更聰明

據深度求索公司官網介紹,DeepSeek-R1在后訓練階段大規(guī)模使用了強化學習技術,在僅有很少標注數據的情況下極大提升了模型的推理能力,在數學、代碼、自然語言推理等任務上,測評性能與GPT-o1模型正式版接近。

國際投行摩根士丹利表示,“更大(的模型)不再等于更聰明”,DeepSeek通過顯著提高數據質量和改進模型架構,展示了一條與之前大模型不同的高效訓練途徑。摩根士丹利說,DeepSeek的模型現在低成本優(yōu)勢突出,與國際知名大模型相比,其成本大約低了一個數量級。

高盛集團也認為,DeepSeek新模型的成本遠低于現有模型,這意味著開發(fā)利用大模型的門檻降低,互聯網巨頭將面臨初創(chuàng)公司的潛在競爭。

英國《金融時報》發(fā)表的一篇評論文章指出,DeepSeek挑戰(zhàn)了人工智能產業(yè)在過去一段時間的核心信念,即認為更強大的硬件才是推動人工智能發(fā)展的關鍵。

版權圖庫圖片,轉載可能引發(fā)版權糾紛

04 開源:未來的發(fā)展方向?

DeepSeek采用了完全開源策略,不僅降低了用戶的使用門檻,還促進了AI開發(fā)者社區(qū)的協(xié)作生態(tài)。通過開源,DeepSeek吸引了大量開發(fā)者和研究人員的關注,推動了AI技術的發(fā)展。英偉達AI科學家Jim Fan稱贊DeepSeek是“真正開放的前沿研究,賦能所有人”。

當然,開源也面臨著保護知識產權和開源社區(qū)秩序維護等挑戰(zhàn)。

俞揚表示,開源只是一種商業(yè)模式,即便開源項目也擁有版權。開源與閉源之爭,實質上是不同商業(yè)模式在特定場景和時代背景下的有效性對比。

DeepSeek的成功被一些人視為中國技術理想主義的體現,甚至被外國人比喻為神秘的東方力量。

但從整個AI大模型產業(yè)來看,DeepSeek的成功或許代表了一種全新的發(fā)展方向——通過算法優(yōu)化而非單純依賴算力和數據量來提升模型性能。這一方向也為AI大模型產業(yè)的發(fā)展提供了新的思路。

歡迎掃碼關注深i科普!

我們將定期推出

公益、免費、優(yōu)惠的科普活動和科普好物!




聽說,打賞我的人最后都找到了真愛。
做科普,我們是認真的!
掃描關注深i科普公眾號
加入科普活動群
  • 參加最新科普活動
  • 認識科普小朋友
  • 成為科學小記者