經濟觀察網 記者 牛鈺 2025年開年,一場由國產大模型DeepSeek(深度求索)驅動的技術浪潮席卷證券業。
自春節以來,各個社交平臺開始頻繁出現“只能開一個證券賬戶,會選哪家證券公司”“如何宣傳新客理財”等使用DeepSeek生成的問答,背后則是券商從業人員使用AI(人工智能)大模型生成宣傳文案的嘗試。
近一周,DeepSeek更是成為券商競相部署的“標配”。截至2月13日,已有國泰君安、中金財富、廣發證券、興業證券、國元證券、國金證券、華福證券等近二十家券商宣布接入DeepSeek-R1或V3模型。
接入之后能做什么?目前來看,各家券商都在探索“AI+”的應用場景,比如在內部進行賦能提效,在用戶端已經推出了智能助手、數智虛擬人等應用,能覆蓋投研、營銷、客服、合規風控等方面。
2月10日,廣發證券在機構客戶綜合服務平臺“廣發智匯”正式上線DeepSeek客戶服務模塊。該服務可以讓機構客戶可以便捷地調用DeepSeek服務,并根據自身個性化需求進行應用定制和包裝,從而大幅降低獨立部署大模型所需的硬件和人力成本。
在密集接入DeepSeek的券業新聞背后,有不少券業人員表達了被AI代替的焦慮,亦有從業人員感嘆高效的文本數據分析給工作帶來便捷。
一位華北券商人士表示,自2022年以來,AI大模型就已在內部開放供員工使用,對提升工作效率有幫助。不過他認為,近幾年行業內面向投資者的智能客服、智能助手等應用推陳出新,接入DeepSeek只是豐富了大模型的資源,目前還沒有感受到什么變革。
另一位華南券商的技術部門管理層人士也認為,目前證券業使用人工智能更偏向場景賦能中智能與數據融合的可行性,還需關注未來多維度智慧與數據的深度融合與賦能,在符合行業監管的要求下,具體的應用形式還可能進一步拓展。
在擁抱人工智能和技術發展的大趨勢下,DeepSeek模型成了一次發展的契機,證券行業正在對“AI重構金融業態”進行前瞻布局。
技術普惠給中小券商帶來新機遇
券商火速“擁抱”DeepSeek的背后,是DeepSeek的開源免費策略和算力成本優勢。
“DeepSeek作為開源AI大模型,其模型可免費獲取,賦予開發者充分的自由,包括使用、修改及商業化應用,無需額外授權許可。”廣發證券相關負責人表示,該模型沿用了Transformer架構(深度學習模型),并且依托社區貢獻的推理框架能輕松實現部署,這樣可以能夠充分利用現有的通用算力資源,無需額外的硬件升級。
多家中小型券商搶先接入DeepSeek以期“彎道超車”。比如華福證券通過部署DeepSeek-R1和V3,聚焦營銷方案制定與客戶陪伴。國元證券在深度整合公開的開源大模型后,于2月11日推出了AI小元(數智人),智能融合3D數字人技術與語音合成系統,支持7×24小時實時生成投研觀點解讀、市場熱點追蹤等高價值內容。東興證券于2月9日推出了“智多興”智能平臺,實現了員工問答的精準。
不過,上述智慧平臺、數字人已經不是證券行業最新的技術。2023年6月,恒生電子宣布發布金融智能助手光子、全新升級的智能投研平臺WarrenQ和金融行業大模型LightGPT。2023年8月,九方財富推出業內首款證券投資數字人產品。2024年1月,同花順發布業內首個金融對話大模型。2024年3月,國泰君安推出業內首家千億參數多模態證券垂類大模型——君弘靈犀大模型,已能做到智能投顧問答和投研內容生產等工作。
實際上,證券業在信息技術投資方面已然形成“強者恒強”的格局。中國證券業協會披露的數據顯示,2020年至2022年,各證券公司進一步加大信息技術資金投入,證券行業信息技術資金總投入從239.93億元增長至377. 65億元。不過在這個過程中,總投入排名居前的證券公司投入集中度在持續提高。
以“低成本+高性能+高開放度”為優勢的Deepseek能為中小券商節約更多的研發、算力成本,有利于預算有限的中小券商也能享受到先進AI技術帶來的紅利,從而推動整個行業的數智化發展。
東莞證券運維技術中心負責人表示,當前,中小券商在推進人工智能建設過程中遭遇了諸多難點堵點,尤為突出的是資源有限、技術能力薄弱等問題。金融科技的價值最終需在業務中得以體現,中小券商應結合自身優勢,聚焦細分市場與特色服務,如特定行業、區域或客戶群體,通過綜合運用協同、融資、投資、科技等多方面能力,提供更具個性化和專業化的服務。
證券行業AI 變革的想象空間
除了成本低這一優勢,Deepseek在某些領域的測試表現優異,能讓證券業AI發展更進一步。從券商的實踐經驗來看,智能客服一直是券商應用AI的傳統場景,24小時的智能助手能提高客戶互動率。
在投研領域,可以利用DeepSeek利用模型實時監測輿情與市場動態,結合產業鏈圖譜分析,快速識別潛在投資機會與風險。在投行業務中,通過DeepSeek-R1的理解能力,可自動解析招股書、盡調報告等復雜文檔,實現財務數據校驗、合規風險提示的秒級響應。
恒生科技的實測數據顯示,在金融高密度數據處理場景中,基于DeepSeek獨創的MoE(混合專家)架構,投顧場景的投顧建議生成、安撫話術、基金實體識別等任務上平均F1分數(模型精確度)提升5%,客戶需求解析速度較以往大模型加快3倍,賬戶運營知識庫檢索、托管/資管合同要素抽取、投行底稿審核等場景的F1提升5%至7%以上。
恒生電子首席科學家白碩表示,根據實測數據,在金融高密度數據處理場景中,DeepSeek新架構展現出更好效果、更小算力、更深思考的突破性優勢。因此,通過部署各種體量的蒸餾模型,金融機構能用更小的算力支出,得到與過去數倍甚至數十倍算力支撐下的大參數體量模型能力相當的AI基礎模型服務。
對于“蒸餾”,白碩對經濟觀察網解釋稱,就相當于是一個AI模型(稱為“學生模型”)向另一個AI模型(稱為“教師模型”)學習,把后者的能力以知識密集的方式追加到前者當中的過程。一般來說,學生模型的參數體量比較小,經過蒸餾后,知識密度更高,性能也比冷啟動時有較大幅度的提升。
白碩表示,做DeepSeek的本地部署時,有所謂“滿血版”(571B)和“蒸餾版”(14B和32B等)。蒸餾版的體量較小,適合低配算力的本地部署,但經過“蒸餾”,其能力總體上雖比滿血版弱,但比以往千億以下的其他模型的能力都要強。其已經做了很多測試,驗證了這個結論。如果再做進一步的適配性優化,挖掘出更適合DeepSeek的優化路徑,相信性能還會有進一步的提升。
從當前來看,接入DeepSeek大模型的私有化部署與業務適配仍需時間,多數機構目前仍處于“試點探索”階段,尚且走在對未來的應用落地的想象之路上。
但使用DeepSeek也有一定的風險。匯生國際資本總裁黃立沖指出,Deepseek的MoE架構中不涉及的垂直領域專業能力差,模型幻覺率高容易出現假新聞,并且其冷啟動能力差,即模型首次接收到一個未經過訓練或很少出現的新提示詞時,無法生成高質量或相關性的響應。
東莞證券運維技術中心負責人表示,在合規規范方面,圍繞投資者服務應用的數據隱私和內容安全等需重點關注,包括通過線上大模型與本地小模型的融合應用,以及數據匿名化處理、可信執行環境等技術手段,嚴格保障數據安全,控制數據流動風險,以滿足證券行業對極高容錯率要求,同時增強信息關聯性和精確度。