国产精品自拍亚洲-国产精品自拍一区-国产精品自拍在线-国产精品自拍在线观看-亚洲爆爽-亚洲不卡一区二区三区在线

硅基流動讓DeepSeek模型在國產芯片上跑起來

錢玉娟2025-02-15 13:44

經濟觀察網 記者 錢玉娟 2月14日,大模型云服務商硅基流動(SilliconFlow)宣布聯合北京昇騰人工智能計算中心,全面支持基于昇騰算力的DeepSeek系列模型的私有化集群部署。

此前,硅基流動大模型云服務平臺SiliconCloud首發上線了基于昇騰算力的滿血版DeepSeek R1/V3模型,率先走通了在國產芯片部署DeepSeek模型的路徑。

時間倒回至春節假期的2月1日,華為云宣布聯合硅基流動推出基于昇騰云服務的DeepSeek R1/V3推理服務。彼時,華為云、硅基流動的官方公眾號相隔一分鐘官宣,標題均突出“首發”二字,內文用“連日攻堅”概括了團隊的努力。?

首發

硅基流動創始人袁進輝曾總結,硅基流動的技術核心是提供一個推理引擎,主要向企業提供高性能LLM推理和訓練解決方案,幫助企業高效地部署AI應用。DeepSeek?V3是震驚全球科技圈的開源、推理大模型,硅基流動與之適配提供服務尤其對口。

在DeepSeek V3大模型發布前,DeepSeek創始人梁文鋒就曾問袁進輝,硅基流動要不要部署?彼時,梁文鋒甚至給出了建議:最少20臺H800(英偉達GPU芯片),80臺最好,10臺也可以,就是有點慢。

袁進輝算了一筆賬:一個月80臺服務器的凈花費就得五六百萬,“還不一定能用滿,風險太大了”。他沒有下注。

看到DeepSeek創造一個又一個奇跡,袁進輝焦急且苦于沒有充沛的算力資源,直到一位同事突發奇想,“國產卡多,用國產卡吧”。

硅基流動向華為云主動提出了合作想法。

華為采用自研的達芬奇架構,開發了昇騰910和昇騰310兩款AI處理器芯片,而華為云又上線了昇騰AI云服務,至今約一年半時間,面向企業提供一鍵接入獲取AI算力的服務。

華為昇騰AI云服務有一個“百模千態”專區,其中除了華為自家的盤古大模型外,還能適配業界主流的上百個開源大模型,從而支撐企業和開發者更快速地創建自己的大模型應用。

開源的DeepSeek何其火爆,接入想法讓硅基流動和華為云一拍即合。華為云負責調配算力資源,硅基流動負責讓模型在GPU上可以運行并具備問答能力,同時確保模型運行穩定、不損失精度,且運行速度盡可能快。

2025年春節,硅基流動團隊和華為云各業務團隊幾乎無休,DeepSeek團隊也在全程提供了很多經驗。

2月1日凌晨1點多,距離官宣基于華為昇騰的DeepSeek R1/V3推理服務上線還有10個多小時,硅基流動的一位高管發了一條朋友圈:平臺接入了DeepSeek系列模型,且API服務價格與DeepSeek官網同價。

2月1日當天,“硅基流動”的微信指數從過去的幾乎為0環比飆升了8831.35%。當時,硅基流動是DeepSeek官方之外,第一個提供基于國產芯片的671B滿血模型MaaS云服務的平臺。

趁著熱度,硅基流動也發布了一波招聘計劃,其中開放的視覺生成推理引擎工程師、異構硬件適配工程師、交付研發工程師等全職崗位有15個,還有與生成式AI相關的算法、平臺前端、平臺后端等方向的實習工程師職位8個。?

API服務競爭暗涌

“要考慮并發,以及后續并發是否有限制。”一位與華為云合作接入DeepSeek-R1的AI應用廠商負責人稱,這是所有要接入的平臺企業或者應用產品都會考慮的事情,背后的難題主要由華為云方面在解決。

布局DeepSeek API服務,不只是騰訊、阿里、百度等巨頭爭搶的生意,不少模型創新企業也參與其中。

提供模型云服務的供應商雖多,但上述硅基流動高管看到,已經有模型測試相關人士給用戶提供了一些判斷的依據,比如供應商提供的是否為原版的671B參數規模?供應商提供服務的上下文窗口(語言模型在進行預測或生成文本時,所考慮的前一個詞元即Token或文本片段的大小范圍)大小是否為正常的64K+?最后還有AI輔助編程請求的通過情況,供應商對AI模型技術的應用是否受TPM(設備管理,一般在10W臺以上)的限制。

陳天楚在浙江大學ARClab負責大模型相關研究,他看到,接入DeepSeek的各個云廠商,面向的客戶、官宣的成本控制和定價計劃有區別。例如,有的廠商提供滿血版,有的則是量化壓縮版,還有提供蒸餾后的小模型。

陳天楚認為,除了提供標準化的模型API服務外,云廠商間的較量主要集中在能否提供個性化服務。像硅基流動就在上線671B的DeepSeek V3/R1旗艦模型后,又上線了6款DeepSeek R1蒸餾版模型,其中的8B、7B、1.5B模型免費,企業或個人用戶、開發者使用模型或基于模型開發AI應用時,能直接調用硅基流動的SiliconCloud平臺上的API,簡單易用。

截至2月13日,有來自模型測試人士的結果反饋,在提供DeepSeek API服務的主流供應商中,和華為云深度合作的硅基流動,其AI服務響應的推理、生成以及平均速度,不僅優于承載壓力過大的DeepSeek官方,更與騰訊云、阿里云等廠商拉開了距離。

“+DeepSeek”效果待定

得益于春節假期的突擊作戰,年后上班第一天(2月5日),華為推出了基于原生鴻蒙操作系統的小藝助手App,既接入了DeepSeek模型推理能力,還在“智能體”選項中上架了DeepSeek-R1的Beta版。

短短5天后,華為智能手機純血鴻蒙版小藝App的DeepSeek-R1智能體升級為正式版,新增“聯網搜索”功能,知識庫變得更豐富,時效性也更強。

2月13日,記者在廣州一家華為手機線下銷售門店體驗。所有更新為純血鴻蒙系統的手機上,小藝從過去在系統內可被喚醒的智慧語音助手服務,變成一個獨立的應用產品。進入小藝App,便可以與“她”問答對話,也能在第三方智能體中直接點擊DeepSeek-R1,進入深度思考對話,不用下載第三方App。

華為擁有自研的盤古AI大模型,小藝就是通過盤古大模型訓練出來的。純血鴻蒙中的小藝,在成為一個獨立應用后,其使用界面中有突出DeepSeek的方面。

記者看到,門店銷售人員手中的參考資料上,除了有“怎么說”“怎么做”來體驗小藝,還有盤古大模型區別普通數據模型的一些對比,會強調盤古大模型擁有扎根中文的獨特優勢。對DeepSeek,材料并未提及。

上述AI應用廠商負責人在接受經濟觀察網記者采訪時,給出了產品接入DeepSeek模型能力后關鍵指標的變化。

“大模型幻覺變少,任務成功率變高。”該負責人透露,其團隊在用DeepSeek的模型執行某項任務時,失敗率基本為0。接入這一明星大模型后,模型幻覺有所減少,但他指出,大模型幻覺作為共性問題,仍有待解決。

其實,該負責人所在的AI企業也有巨額投入創新自研的通用大模型以及針對行業應用的專屬大模型。他告訴記者,目前業內集體涌向DeepSeek,普遍做法并非是用DeepSeek系列模型與自身現有模型融合,而是用DeepSeek的模型來開拓新的應用場景。

這位負責人與陳天楚有共識,DeepSeek是推理模型,實效性并非其的優勢,但卻可以通過模型云服務商等AI基礎設施賦能。

一位平臺高管跟很多主流大模型廠商討論過智能體在各個硬件終端上打通的問題,在她看來,這也是DeepSeek未來技術落地以及當前業內“+DeepSeek”風潮后的發展方向,“每個硬件都可能成為智能體的入口,通過執行人類的任務來訓練專屬個人的智能體”。

為什么是硅基流動

硅基流動創始人袁進輝是一名連續創業者,他在2017年成立的一流科技(OneFlow),在國內2023年涌起AI大模型風潮后,估值一度超數億美元。

同年,美團聯合創始人王慧文創業了大模型公司光年之外,他提出通過并購OneFlow的方式,邀請袁進輝加入光年之外成為聯合創始人。光年之外后被美團收購,袁進輝在2023年8月宣布回歸到AI基礎設施領域繼續創業,創立了硅基流動。

硅基即芯片,而流動有軟件之意,這一名稱也與袁進輝此前創立的一流科技形成呼應,讓芯片的算力在軟件基礎上跑起來。

加速AGI普惠人類,是硅基流動官方公眾號上的簡介,袁進輝不止一次在公開場合表示,其目標是為廣大的開發者提供基于AI模型進行應用創新的關鍵“鏟子”,讓開發者實現Token自由。

硅基流動去年年中推出SiliconCloud后,不僅日均調用量超千億Token,針對多個主流模型的服務還提出了永久免費。

“面向C端用戶的大模型App,以后都全面免費了。”袁進輝2月14日表示,國內模型廠商很難對C端用戶收取訂閱費,多是廠商自己負擔算力成本。

在袁進輝看來,模型廠商只有獲取用戶后才有辦法去變現。

數據顯示,DeepSeek的應用訪問使用量正呈現指數級上升,成為目前最快突破3000萬日活躍用戶量的應用程序。


TMT新聞部記者
長期關注并報道TMT領域的重大事件,時刻保持新聞敏感,發現前沿趨勢。擅長企業模式、人物專訪及行業深度報道。
重要新聞線索可聯系qianyujuan@eeo.com.cn
微信號:EstherQ138279