国产精品太长太粗太大视频,日本加勒比不卡高清一区二区三区,日韩av电影一区二区三区四区

DeepSeek崛起 AI經濟模型或將開啟全面重構

來源：21世紀經濟報道作者：趙云帆2025-01-15 09:54

就在DeepSeek（深度求索）發(fā)布V3幾天前，OpenAI首席執(zhí)行官薩姆·奧特曼在一場采訪中，談到了中美在AI領域的競爭。

一方面，奧特曼屢屢強調OpenAI在AI領域的主導性和領先性，同時呼吁在美國完全本土化AI產業(yè)鏈，包括生產芯片、建設足夠多的能源，改變數據中心建設模式，建立非常昂貴且復雜的供應鏈和基礎設施等。

但另一方面，奧特曼卻又話風一轉，聲稱美國應該在AI領域與中國緊密合作。而這一言論，對于封禁中國大陸IP最為激進的OpenAI來說，極具諷刺意味。

曾經宛若AI領域的大神，如今的OpenAI卻因為模型越來越閉塞，而被科技圈戲謔為“CloseAI（關閉AI）”。

幾天之后，來自中國的DeepSeek V3如石破天驚一般問世。在高端芯片禁運的情況下，DeepSeek V3靠著往年囤積的“閹割版”H卡，用區(qū)區(qū)五百萬美元，在驚人的不到三百萬GPU小時里完成了預訓練，獲得了聊天機器人競技場（Chatbot Arena）隨機基準（Benchmark）測試第七、開源模型排名第一的成績。

高效訓練帶來的結果是，DeepSeek-V3幾乎有著媲美Claude 3.5 Sonnet的數學和編程能力，卻能提供后者五十三分之一的使用價格。

幾乎在同時，AI輿論天平開始搖擺——海外互聯網上，GPT5研發(fā)遭遇瓶頸的質疑再度被提及，人們驚嘆“對中國芯片禁運無意義”。

“AI賣鏟人”英偉達的股價也在2025年出現了劇烈的下跌，冥冥之中似乎與DeepSeek-V3的出現有關。

一時間，整個AI產業(yè)的經濟模型，都在DeepSeek-V3的出現后，悄然動搖。

神秘力量崛起

不知從何時開始，AI界開始用“萬卡集群”來描述步入大模型的門檻——DeepSeek-V3出現前，聊天機器人競技場頭部模型企業(yè)掌握的GPU集群清一色在五位數以上，萬卡就像是AI梭哈局里的“驗資證明”。

隨后便是DeepSeek-V3的出現，AI在當前的發(fā)展模型中，突然長出了一個不符合發(fā)展規(guī)律的“奇點”。

所有人都試圖理解，為什么它的預訓練那么快，應用接口價格那么地便宜。許多人都提到了MLA、MoE、FP8三大創(chuàng)新。

然而，除了MLA為DeepSeek公司在V2時期拋出的原創(chuàng)概念，MoE、FP8等技術都并非原生。

比如MoE（集成本地專家）架構——形象的說法是他將全人類的問題進行分類，通過分類來降低每個問題需要激活的參數。MoE的概念最早誕生在1991年，但到2023年才由Mistral AI最先采用。之后，它幾乎成為了所有新版大模型的標配工程，每家的MoE架構都有自己的特色。

FP8更是英偉達早在2022年發(fā)布H卡時就預言過的浮點格式，其理論極限倍速是傳統(tǒng)FP16的兩倍。但具體能提高多少？其實很難，至少在DeepSeek之前，很少有大模型團隊熱衷于通過FP8突破算力瓶頸。

僅從結果來看，DeepSeek的大部分創(chuàng)新都建立在其他先驅的基礎之上，但對創(chuàng)新工程技術應用所達到的程度，卻依然令人匪夷所思。

因此業(yè)內人都有一個共識，DeepSeek強大，來源于其神秘工程團隊。

“他們是一只非常精銳的中國團隊——就他們構建強大語言的能力而言，我會把他們放在Mistral和OpenAI/DeepMind團隊中間位置?！鼻癉eepMind工程師，知名科技博主Aleksa Gordic（亞歷克薩·戈迪奇）在社交媒體上驚嘆。

AI新格局重構

《三體：黑暗森林》中有這樣一個認知，科技的發(fā)展并不是階梯式的，技術爆發(fā)往往以不期而至的方式到來。

在AI這個領域，技術爆炸的時間節(jié)點也非常難以預測。

在DeepSeek-V3發(fā)布前，上一個在業(yè)界公認取得如此多創(chuàng)新的，還是2024年12月Meta發(fā)布的Llama3.1 405B。

而再上一個突破大概發(fā)生在2024年6月份，Anthropic公司推出編程專長大模型?Claude 3.5 Sonnet，再往前就是當年5月份OpenAI推出的ChatGPT4.0。

即便對于中國大模型而言，上一輪出圈的Kimi，與DeepSeek-V3發(fā)布也才隔了不到一年。

與算力、工程能力同步迭代的海外大模型企業(yè)不同，DeepSeek受制于芯片禁運的束縛，以兩個數量級的成本優(yōu)勢，宣告著工程能力的巨大差異，甚至可能導致現有AI經濟模型完全重構……

就在DeepSeek-V3發(fā)布后不久，有人在使用中發(fā)現DeepSeek-V3在一次問答中把自己稱為“ChatGPT”。

這個被稱之為“自我認知錯誤”的“BUG”，其實普遍發(fā)生在許多大模型的推理結果中，顯示著當今時代數據污染的普遍存在，以及大模型之間互相借鑒越來越頻繁。

而不管是開源的DeepSeek，還是閉源的OpenAI，AI數據與工程技術的互相借鑒，幾乎是不可能被封鎖的。

有些魔幻現實的是，由于DeepSeek-V3完全地開源，在可以預見的，甚至幾乎確定不會太久的未來，DeepSeek-V3的巨大優(yōu)勢，必然會被后來的效仿者、創(chuàng)新者所抹平，超越。

但既然選擇了開源，就代表了DeepSeek完全接受這一點，并認為自己還能做出更好的。

2023年，DeepSeek實際控制人梁文鋒在接受采訪時也表達了類似觀點：

“無論大廠，還是創(chuàng)業(yè)公司，都很難在短時間內建立起碾壓對手的技術優(yōu)勢。因為有OpenAI指路，又都基于公開論文和代碼……從長期看，大模型應用門檻會越來越低，初創(chuàng)公司在未來20年任何時候下場，也都有機會?！?/p>

創(chuàng)新驅動力

既然AI企業(yè)無法通過閉源獲得優(yōu)勢，那么唯一值得信賴的便是團隊本身了。

回顧梁文鋒的采訪，其大量的談話落在了團隊建設上，鼓勵創(chuàng)新上。著眼能力，淡化履歷，看中好奇心驅動。

“很多人會以為這里邊有一個不為人知的商業(yè)邏輯，但其實，主要是好奇心驅動。”梁文鋒在采訪中表示。

經典的企業(yè)管理認為，好的制度能讓企業(yè)自行運轉，不論崗位上是誰，都能像螺釘一樣各司其職。

而梁文鋒卻認為，由幻方量化積累的資本和算力底蘊，可以讓DeepSeek暫時忘卻商業(yè)化，并保持企業(yè)純粹的創(chuàng)新文化。

寄托的AGI發(fā)展的人類大計，最后仍要取決于微觀引領者的企業(yè)文化和團隊建設，這一巨大的反差背后，卻頗有返璞歸真的意味。

幾乎就在12月份之前，GPT5遲遲無法落地的消息，讓許多AI從業(yè)者存在這樣一個認知：“AI工程能力似乎已經接近了瓶頸。而面對越來越難清洗的數據和芯片、電力的制約，AGI已經撞上了南墻。”

就像早在十九世紀就有人說，“物理學的大廈已經完成了，后人只要做修繕裝飾的工作”。

但DeepSeek顯然打破了瓶頸認知，并告訴我們，即便是從工程能力迭代的角度，AI能力的瓶頸，仍然遠遠沒有到來。

“我們希望更多人，哪怕一個小App都可以低成本去用上大模型，而不是技術只掌握在一部分人和公司手中，形成壟斷?！绷何匿h說道。

而若未來真如他所說，唯一能確定的是，算力將不再成為困擾AI時代的瓶頸。包括當下“AI賣水人”經濟模型，可能也會順勢完成重構。

責任編輯：陳勇洲

經濟

機器人

聲明：證券時報力求信息真實、準確，文章提及內容僅供參考，不構成實質性投資建議，據此操作風險自擔

下載“證券時報”官方APP，或關注官方微信公眾號，即可隨時了解股市動態(tài)，洞察政策信息，把握財富機會。

網友評論

登錄后可以發(fā)言

發(fā)送

網友評論僅供其表達個人看法，并不表明證券時報立場

暫無評論

為你推薦

科大訊飛發(fā)布首個基于全國產算力的深度推理大模型X1 星火大模型底座能力再升級

證券時報網葉玲珍 2025-01-15 17:34
知名培訓機構爆雷背后：年收入14億元，涉嫌亂收費！

證券時報網李小平 2025-01-15 17:20
多地政府工作報告透露2024年GDP增速，這兩地表現突出

界面新聞辛圓 2025-01-15 15:39
股票ETF單日資金凈流入超45億元

中國基金報曹雯璟 2025-01-15 15:30
突然，大幅拉升！日本央行，重磅信號！

券商中國陳銘 2025-01-15 17:30
中國銀聯，董事會最新調整！

券商中國李穎超 2025-01-15 16:22

時報熱榜

換一換

熱點視頻

換一換