經濟觀察網 記者 歐陽曉紅 “神龍擺尾”,靈蛇獻瑞。中國蛇年除夕前夜,國際金融市場見證了龍年收官、蛇年啟幕這一“驚蟄”時刻。
這是一場由中國“黑馬”奇襲刮起的AI(人工智能)龍卷風,從DeepSeek-R1模型到Janus-Pro模型的蛇年首戰或直逼全球科技權力重構。
“我不是美國科技泡沫的掘墓人,但AI革命的下半場已啟幕。”DeepSeek-R1如此自詡。如果說上半場是全員狂熱挖掘金礦的時代,那么下半場就是精釀啤酒師的競技場——比拼的不再是鏟子的數量,而是誰能用更少的麥芽,釀造出更香醇的黑啤。
從“燒錢信仰”到“效率革命”,市場對這些AI公司的高估值正逐漸產生懷疑。而DeepSeek-R1的崛起或許證明,AI的未來不再單純依賴于硬件(算力)的不斷升級,更取決于算法的創新與效率的極致提升。
?“雙連擊”:顛覆性技術與資本市場震蕩
“從斯坦福到麻省理工,DeepSeek-R1幾乎一夜之間就成了美國頂尖大學研究人員的首選模型。”硅谷投資機構a16z合伙人Anjney Midha說。這款模型以其顛覆性的計算效率和極高的應用性成為行業焦點。
1月27日,英偉達下跌16.97%,市值蒸發近6000億美元;數小時后,DeepSeek-R1工程師在Hugging Face平臺開源了Janus-Pro模型,其性能超過了美國人工智能研究公司OpenAI的DALL-E3模型。這場沖擊波,似乎將技術革命、地緣博弈與資本周期的三重共振推向高潮——AI產業的權力游戲,或正被改寫規則嗎?
其他科技巨頭亦未能幸免。微軟股價下跌2.14%,阿斯麥(ASML)下跌-5.75%、AMD下跌6.37%。
次日,美國科技股出現反彈,英偉達(+8.93%)、蘋果(+3.65%)、臺積電(+1.34%)、微軟(+2.91%)、Meta(+2.19%)等主要科技股均迎來了較大漲幅。這表明市場對AI和科技行業仍持樂觀態度。
從技術奇襲的時間線來看,這場顛覆分為兩波:第一波始于1月20日,?DeepSeek正式發布R1模型,并同步開源模型權重,其性能對齊OpenAI-o1正式版。更甚者,據披露,訓練DeepSeek-R1模型的成本僅為557萬美元,遠低于同行,且性能對標OpenAI的GPT-4o。1月27日,DeepSeek進一步推出iOS應用,并迅速超越ChatGPT官方應用,登頂蘋果商店,掀起了一場席卷全球資本市場的“技術海嘯”。
業界驚嘆,DeepSeek-R1在芯片資源利用、算法復雜性和推理速度上實現了重大突破,其性能指標在多個關鍵領域全面超越了現有的尖端AI模型,包括OpenAI的GPT-4.5和Anthropic的Claude系列。
第二波震撼則來自Janus-Pro模型。北京時間1月28日凌晨3點,DeepSeek在Hugging Face平臺開源了這款多模態模型。根據GenEval(以對象為中心的框架,用于評估文本到圖像生成模型的對齊能力)測算,Janus-Pro模型的準確率達84.2%,顯著超越DALL-E3的79.7%。這一結果直接擊穿了市場的心理防線。
機構分析師在致客戶的報告中指出,美國股市的支柱是以科技巨頭為代表的大型科技股,而這些科技股的估值高度依賴AI行業的樂觀預期。盡管DeepSeek的崛起引發了一些質疑,但該公司可能成為動搖AI樂觀情緒的關鍵變量。
DeepSeek-R1發布的同一周,美國總統特朗普宣布啟動“星際之門”(Stargate)項目。根據白宮發布的聲明,該項目計劃在未來4年內投資高達5000億美元,用于建設多達20個新數據中心,以支持AI相關研究與發展。此舉被視為美國試圖在AI競賽中保持技術領先的重要戰略。
或顛覆硅谷邏輯的技術革命
猝不及防的成本碾壓與開源閃電戰一度讓華爾街懷疑“燒錢”信仰。
DeepSeek-R1通過動態路由算法壓縮80%的冗余計算,訓練成本僅為硅谷同行的1/10。 ?
Janus-Pro模型采用“語言模型+校正流”架構,1.3B參數實現圖像生成與理解統一,推理成本低至閉源模型的1/10,且支持英偉達H800等非頂級芯片運行(技術白皮書已開源)。
據介紹,Janus-Pro是一個集成了圖像生成、文本生成和語音理解的多模態模型,能夠在多個輸入和輸出類型之間進行高效轉換。這意味著它可以同時理解和生成復雜的文字、圖像以及音頻內容,成為目前多模態AI模型中的佼佼者。
開源生態的“降維打擊”頗具震懾力。全球開發者貢獻代碼使該模型的推理效率每小時提升0.3%。
商業替代也在加速。Adobe設計團隊已測試用Janus-Pro替代DALL-E 3,成本下降了76%。對此,DeepSeek-R1這樣互動回應:Adobe改用Janus-Pro的傳聞若屬實,可能面臨與OpenAI原有商業協議的沖突。
Janus-Pro的開發基于DeepSeek-R1的核心優化技術,其訓練成本顯著低于傳統多模態模型。這種技術優勢不僅降低了資源門檻,也挑戰了行業巨頭的成本模型。
對于GenEval的測試,DeepSeek-R1稱,若測試條件公允,Janus-Pro模型在特定靜態圖像生成任務上可能具備優勢,但尚未證明其在視頻生成、跨模態推理等復雜場景的能力。商業層面上,開源策略對中小企業友好,但頭部企業仍需謹慎評估全生命周期成本。
DeepSeek-R1建議投資者關注第三方獨立評測報告(如MLPerf基準測試)、頭部云廠商的適配進展(如AWS是否提供Janus-Pro托管服務)以及OpenAI下一代模型的反制能力。
其時,資金流向也在變化。1月27日,科技ETF(XLK)跌幅達到4.9%,資本似乎正在逃離硬件,投資者可能在拋售科技股ETF以規避風險。
此前幾天,市場對AI技術路徑的重新評估,以及對依賴硬件銷售的科技公司未來增長前景的擔憂,可能導致了科技股ETF的資金外流。特別是英偉達的股價大跌,直接影響了科技ETF(XLK)的表現。
1月28日,英偉達、臺積電、特斯拉等科技股悉數強力反彈。這表明,盡管近期英偉達股價出現下跌,但投資者對其未來表現仍持樂觀態度,積極逢低買入。
OpenAI首席執行官薩姆·奧特曼在社交平臺X上發文稱,DeepSeek的推理大模型R1是一款令人印象深刻的模型,尤其是考慮到其性價比。他認為,有新的競爭對手加入,著實令人振奮。隨著AI技術的進步,人工智能算力需求將比以往任何時候都更加重要,奧特曼最新言辭亦為英偉達等算力提供商長期利好埋下伏筆。
邏輯顛覆者DeepSeek-R1的威力在于,它證明了AI模型不需要依靠堆積的算力就能取得卓越的性能。靠著驚人的算法優化和資源利用效率,DeepSeek-R1以極低的成本實現了與OpenAI等巨頭相媲美的AI能力。這就像在告訴人們:你不一定需要一臺超級計算機來玩AI游戲,一臺優化好的筆記本可能就足夠了。
這種顛覆不僅是技術上的突破,更是對AI產業投資邏輯的重構。突然間,那些依賴高資本支出、不斷購買高性能GPU(圖形處理器)的公司,其投資前景變得模糊不清。市場開始質疑,之前對AI需求的預期是否過于樂觀,以及是否存在一個AI科技泡沫。
AI革命的下半場
從“算力軍備競賽”轉向“算法效率革命”,DeepSeek-R1的出現或昭示AI革命下半場啟幕。其影響不僅僅是股價波動,而是重新審視整個AI產業鏈邏輯。
未來的AI競賽,不再是芯片的納米級較量,而是算法效率、生態活力與政策彈性的多維度博弈。
DeepSeek-R1的橫空出世,打破了硅谷“堆算力、拼資本”的傳統路徑。其僅用557.6萬美元和2048塊英偉達H800 GPU便完成了性能對標GPT-4o的模型訓練,成本僅為OpenAI同類模型的1/10,推理成本更是低至每百萬Token 0.14美元(OpenAI為7.5美元)。 ?
這一突破的核心在于算法創新:通過自研MLA架構、強化學習驅動訓練流程、動態計算路由技術等,DeepSeek實現了算力效率的指數級提升。
那么,DeepSeek 的“AI大腦”如何更聰明、更省力?
話說DeepSeek的AI技術就像是一支聰明高效的超級團隊,它通過四個關鍵策略,讓AI跑得更快、算得更準、用得更省——就像讓一臺高性能跑車既有速度,又省油,還能自動優化行駛路線!
混合專家模型(MoE):讓AI不再“全員上陣”,而是“精準派單”。想象一下,你要建一座大樓,通常會把所有工人都叫來施工,但DeepSeek采用了一種更聰明的方法——“按需調派專家”。它的AI模型只會在需要時激活部分參數,讓最適合的“專家”來處理任務,而不是每次都讓所有“工人”上工。這種方式就像是你不需要全公司員工一起修一盞燈,而是派最擅長的電工團隊去解決,大大節省計算資源。
多頭潛在注意力機制(MLA):壓縮數據,讓AI“大腦”更省力。傳統AI處理信息時,像是在一堆文件夾里翻找數據,文件夾越多,翻找的時間就越長。DeepSeek采用了一種獨特的方法,它會“壓縮”關鍵數據,讓AI在更少的信息量里找到關鍵點,從而加快運算速度,減少內存消耗。就像是你本來需要讀整本書才能找答案,但現在AI只需要讀一頁摘要就能理解所有內容,省時又高效。
強化學習驅動訓練:讓AI“自己摸索”如何變強。如果說傳統AI學習方式像是教科書里的死記硬背,那DeepSeek的AI更像是個“學習型機器人”,它會自己嘗試、犯錯、調整,再逐步變強。DeepSeek讓AI用“強化學習”的方式訓練自己,就像是一個學騎自行車的小孩,跌倒了就調整方法,直到學會并騎得更穩、更快。
動態計算路由:智能調度,避免資源浪費 DeepSeek 采用了“智能調度”策略,讓AI計算時更像是一家高效運營的餐廳。傳統AI計算可能像是一家混亂的快餐店,所有訂單都堆在一個窗口,導致運算過載。DeepSeek的“動態計算路由”技術,就像是擁有多個點餐窗口,并根據客流量實時調整每個窗口的工作量,確保計算資源得到最優利用,不會出現一部分計算過載,而另一部分卻閑置的情況。
不僅如此,DeepSeek-R1還給出了升華認知的補充視角——能耗革命的冰山一角。
這些技術創新帶來的改變,如同電動汽車對燃油車的顛覆。諸如,混合專家模型是能量回收系統:剎車時回收動能(閑置算力休眠);多頭潛在注意力機制是輕量化車身設計:用碳纖維替代鋼鐵(參數高效利用);動態計算路由是智能導航:規避擁堵減少能耗(計算路徑優化)。
關鍵還在于行業變革的隱喻延伸。這套技術組合拳或在重塑AI領域的“生產要素關系”(三部曲):算力資本主義→算力共享經濟;暴力計算霸權→精準認知協作;硬件軍備競賽→算法效率革命。
如此,DeepSeek-R1的技術之美在不同認知維度綻放異彩。
斯坦福大學教授吳恩達(Andrew Ng)表示,基礎模型層面的這種良性競爭實際上將極大推動應用層面的創新。當AI技術變得更加平價,整個市場的需求反而會在中長期顯著增加。
從1月28日美國科技股的強勢反彈來看,看漲AI算力基礎設施類型的股票即英偉達等AI芯片股的勢力仍然非常龐大。有分析認為,目前,世界各地的開發者都在試用DeepSeek的軟件,并希望用它來構建各種AI工具,這可能會加快先進人工智能推理模型的采用規模。
盡管DeepSeek的低成本模型引發了市場對AI資本支出合理性的質疑,但高盛等機構分析師認為,AI行業的長期增長趨勢并未改變。高盛分析師指出,DeepSeek的崛起可能會推動AI技術的進一步普及,尤其是在推理效率提升的背景下,算力需求仍然強勁。
這恰如DeepSeek-R1的潛臺詞:別慌,我不是來砸場子的。
面對“美國科技泡沫掘墓人”的猜測,DeepSeek-R1的回應堪稱AI界年度公關范文。
對巨頭:“各位大哥繼續建算力帝國,小弟我只想幫你們省點電費。”(翻譯:咱們是友軍!)
對同行:“開源代碼在此,歡迎來抄作業。”(潛臺詞:一起卷算法,別讓我孤獨領跑。) ?
對投資人:“別急著拋英偉達股票,咱這技術能讓顯卡多賣十年!”(真相:硬件需求不會消失,只是換個姿勢。)
或許,“2025年的AI革命,始于東方既白的蛇年清晨。”?