經濟觀察網 記者 鄒永勤 春節前后全球最熱門的話題非DeepSeek莫屬。
DeepSeek的全稱為杭州深度求索人工智能基礎技術研究有限公司,由幻方量化基金的聯合創始人梁文峰于2023年7月創立,一直專注于大語言模型(LLM)及其相關技術的深度研發。
公開信息顯示,DeepSeek于2025年1月20日正式發布R1模型,并同步開源了模型權重。由于該模型的性能比肩OpenAI o1正式版,所以備受用戶青睞:1月27日,Deepseek應用登頂蘋果中國地區和美國地區應用商店免費APP下載排行榜,在美區下載榜上超越了ChatGPT。
“橫空出世”的DeepSeek迅速成為全球討論的焦點,上至硅谷AI巨頭,下至A股小散戶,均熱烈參與了該話題的討論,而中美股市相關股票亦因此出現劇烈波動。
在2024年的全國兩會上,全國政協委員、360集團創始人兼董事長周鴻祎便提出了“通用大模型的發展將是國運之爭”的提案。那么,現在他又如何看待這次的“DeepSeek現象”?2025年2月7日,經濟觀察網就此采訪了周鴻祎。?
DeepSeek崛起的真正意義
經濟觀察網:最近,DeepSeek“橫掃”科技圈,成為全球最熱門的話題。你認為,DeepSeek的技術創新與顛覆性究竟體現在哪里呢?
周鴻祎:今年春節期間,DeepSeek憑借極低的訓練推理成本和超高性能,以及徹底開源的R1模型,在短短的一周內橫掃全球,迅速登頂模型下載排行榜和應用下載排行榜第一名。大量的用戶在試用DeepSeek之后,被其實際效果驚艷,并紛紛搭建起自己的DeepSeek優化模型部署,引發了市場對大模型高資本投入模式的質疑,以及對人工智能行業發展路徑的思考。
就技術而言,DeepSeek表現出了兩點優勢。第一,顛覆了推理認知的技術革命,讓AI從鸚鵡學舌進化到自主思考。與傳統大模型填鴨式的死記硬背的監督學習不一樣,DeepSeek通過強化學習的方式讓AI真正開啟了認知革命,在推理上獲得了極大進步,開創了人工智能的新方向。
第二,強化學習策略使得人工智能大模型無效訓練降低了60%,對高強度計算算力的需求下降了40%。據了解,DeepSeek-R1的推理成本僅為OpenAI o1成本的3%到5%,實現了性能與成本的雙重突破,極大地擴展了高性能模型的可普及性,降低了使用門檻,使得更多應用能快速負擔并整合大模型能力,甚至很多C端用戶也可以在電腦和手機上直接使用高性能的大模型,大幅度擴展應用場景。
這意味著,中國正在用更聰明的算法打破大模型發展路徑上堆積顯卡競賽的魔咒,就像當年兩彈一星工程用手工計算出了原子彈的公式一樣,今天我們用數學智慧化解了芯片算力的圍剿。
經濟觀察網:隨著DeepSeek的火爆出圈,有人將其稱之為“國運級別”的科技成果。對此,你怎么看?
周鴻祎:DeepSeek引起了全球轟動,使得我們看到了一個走向AGI(通用人工智能)的新的技術方向,中國迎來了屬于自己的高光時刻。我覺得不要僅僅把目光停留在DeepSeek的技術突破上,它更是給整個人工智能產業帶來了“iPhone時刻”,并對AGI發展帶來了巨大推動。實際上,這才是中國在AI領域真正實現創新和自信的標志。
從開源到低成本開發,從技術普及到科技平權,再到行業引領,DeepSeek的成功讓全世界看到了中國人工智能技術從追趕到比肩的歷史性跨越。它的意義不僅僅在于中國人工智能公司對OpenAI等美國一線大模型公司的一次技術超越,更證明了中國用自己的智慧和獨特的路徑開創了影響全球的技術范式。這也標志著大模型真正迎來了大規模商用的技術拐點。
我一直堅信,只有把大模型拉下神壇,讓大模型能力從“原子彈”變成“茶葉蛋”,才能真正進入百行千業和千家萬戶,進而引發大模型的工業革命。此次DeepSeek的創新,不僅驗證了Transformer(一種基于自注意力機制的神經網絡架構,主要用于處理和生成文本數據)加上強化學習路線的有效性,通過開源模式打破了頭部模型的技術封閉,降低了技術門檻,同時也拆解掉了大模型公司所依賴的資本優勢,大幅度加速了大模型商業化的發展速度,讓更多的企業和開發者能夠以負擔得起的價格用上頂尖模型。
可以說,DeepSeek-R1最大的貢獻就是重新教育了企業用戶和老百姓,讓大家認識到大模型真的可以用了,大模型行業也從一種探索階段進入了創新階段,成為了AI產業的“iPhone”時刻。?
爭議焦點:模型蒸餾與開源技術
經濟觀察網:在DeepSeek火爆全球之時,市場上也存在一些不同的聲音。近日有知名研究團隊更是聲稱,通過蒸餾法以極低成本訓練出了可以媲美DeepSeek-R1的模型。請問,何為蒸餾?你如何看待蒸餾行為?
周鴻祎:模型蒸餾是人工智能訓練中普遍采用的一種方法,就是把大語言模型中的能力和知識遷移到更小模型的技術,目的在于構造資源高效和性能優異的小模型。
蒸餾就像是教學,打個比喻,老師為了快速提高學生成績,將畢生所學的題目整理成冊讓學生學習,里面不僅有題目和答案,還有老師的做題思路和備選解題方法。所以學生在學習時不僅可以學會題目和答案,還可以學會老師的解題思路,能夠在此基礎上舉一反三,這個過程就叫做蒸餾。所以蒸餾并不是偷竊數據,更像人工智能之間的教學和互相學習,美國做大模型也會用蒸餾技術來加強自己模型的能力。
OpenAI聲稱DeepSeek偷竊了其思維鏈數據是一個謊言。眾所周知,OpenAI o1是一個強推理模型,作為一個閉源公司,OpenAI的推理過程不對外輸出。這也是為什么DeepSeek要走出一套自己的方法,在不需要任何人工數據的情況下,完全靠機器自己的強化學習擁有了強大的思維能力,在人工智能上趟出一條新路。所以在思維鏈能力方面,DeepSeek走的技術路線和OpenAI完全不一樣,談不上去蒸餾OpenAI的數據。??
經濟觀察網:由于閉源模型的性能往往優于開源模型,所以OpenAI等巨頭均采用閉源模式,但這次DeepSeek卻通過開源模式給業界帶來了巨大的震撼。在你看來,此次DeepSeek的“開源革命”,能否引發AI巨頭對商業模式的重新考量?
周鴻祎:長期以來,開源模型一直在追趕閉源模型,但總是差一點火候。然而這一次DeepSeek作為開源模型趕上了所有的閉源模型,一下就將企業和個人的需求創造出來了。所以大模型行業競爭的焦點,很快就從如何造模型轉向了如何高效用模型,勢必會開啟一場廣泛的應用創新浪潮。
此次DeepSeek-R1不僅開放了所有的權重參數,還公開了詳盡的技術報告,相當于DeepSeek把自己的知識分享給了整個人工智能產業和全人類,不僅開源模型使用,而且鼓勵全球開發者的社區共同參與貢獻代碼和數據。目前在大模型生態社區,Hugging Face平臺上已經有幾百個基于DeepSeek派生出來的衍生模型,這些由世界各地開發的模型正在適應各種特定場景的探索需求,這也是開源的魅力。
可以說,DeepSeek徹底踐行了開源精神,與OpenAI等走向閉源的公司形成鮮明對比。OpenAI雖然創立初衷很美好,卻在商業化浪潮中背離初心,而DeepSeek堅守技術共享,讓全球開發者受益,吸引眾多開發者投身其開源生態,有望重塑全球AI產業格局,使AI發展重心向開源轉移,邁向普惠、平等的新階段。
呼吁:拋棄門戶之見、共同支持DeepSeek
經濟觀察網:開源模型由于其開放性和可擴展性,似乎面臨著更多的安全威脅,實際上,近期DeepSeek也頻頻受到網絡攻擊。在你看來,站在安全的角度來看,該如何解決開源模型的這個痛點?
周鴻祎:隨著AI深度融入生活,技術的穩定性和韌性將會成為關鍵要素。去年發生的微軟藍屏事件證明了如果所有的互聯網數據都必須通過某一家公司的數據中心,一旦這家數據中心的服務中斷必將導致全球停擺。如果AI普及之后,影響還將進一步放大,從家庭機器人到智能網聯車,當AI全面滲透線上線下生活時,人們對技術服務的依賴將急劇加深,任何服務的中斷都會變得難以忍受。因此,構建深度的技術安全韌性,將成為避免未來人類社會癱瘓的最佳方案。在構建AI深度融入社會的數字未來時,開源技術就成了我們實現安全轉型的最重要資產。
開源的優勢不僅在于分攤訓練成本,還可以自己調制可控性、所有權和隱私保護。當AI深度嵌入社會時,開源的根本價值將體現在系統韌性上,這也是實現算力分布式部署本地化運行的最有效途徑。當每個人在家里都能部署起自己能跑大模型硬件的時候,就構成了一個巨大的算力的分布網絡,甚至每個節點上都可以跑著一臺本地化的、不同應用方向的大模型。
前不久DeepSeek的線上服務遭受了IP地址來自美國的大規模DDOS攻擊,這反映了美國對DeepSeek崛起的擔憂,并試圖通過多種手段限制其發展。美國之所以針對DeepSeek祭出一系列強硬手段,并非僅因為DeepSeek技術領先、導致美股波動,以及沖擊OpenAI業務等因素,更是因為其開源系統能力強大,遠超OpenAI等在美國占據主流的閉源系統,此舉或將動搖美國的人工智能基礎設施。一旦美國的開發人員、技術人員和公司都開始大規模選擇使用DeepSeek開源系統,那么整個AI的發展重心就會轉移到以DeepSeek為核心的生態建設上。
在這個歷史時刻,我呼吁國內的同行應當“拋棄門戶之見”,共同支持DeepSeek。對此,360也推出了一系列相應的支持措施。一方面,我們愿無償為DeepSeek提供全方位安全保護。同時,360推出的納米AI搜索不僅可以使用DeepSeek模型,還專門接入高速專線,集成了DeepSeek蒸餾的快速模型,同時上線“滿血版DeepSeek模型”,一起為用戶提供最好的AI體驗。