国产精品自拍亚洲-国产精品自拍一区-国产精品自拍在线-国产精品自拍在线观看-亚洲爆爽-亚洲不卡一区二区三区在线

階躍星辰與吉利聯合開源 打造系列多模態大模型

2025-02-18 15:44


2025 年 2 月 18 日,階躍星辰和吉利汽車集團聯合宣布,將雙方合作的階躍兩款Step 系列多模態大模型向全球開發者開源。其中,包含目前全球范圍內參數量最大、性能最好的開源視頻生成模型階躍Step-Video-T2V,以及行業內首款產品級開源語音交互大模型階躍Step-Audio。即日起可在躍問APP內體驗。

階躍星辰是吉利汽車集團的科技生態戰略合作伙伴。在兩款大模型的研發過程中,雙方展開了深度合作,在算力算法、場景訓練等領域優勢互補,顯著增強了多模態大模型的性能表現。此次聯合開源的行動,旨在促進大模型技術的共享與創新,推動人工智能的普惠發展。

吉利汽車集團CEO淦家閱表示:“吉利致力成為智能汽車AI科技的引領者和普及者,早在2021年,吉利就圍繞芯片、軟件操作系統、數據和衛星網搭建了端到端的自研體系和生態聯盟,構建了完善的‘智能吉利科技生態網’,驅動用戶在智能駕駛、智能座艙上的體驗不斷進化。目前,吉利全棧自研的星睿AI大模型已經與階躍Step-Video-T2V、Step-Audio等大模型完成了深度融合,將為用戶帶來更智能、更高階的座艙交互與智駕出行體驗,推動AI科技在智能汽車領域的普及。”

據了解,這也是階躍星辰首次開源其 Step 系列基座模型。階躍星辰創始人、CEO 姜大昕博士表示:“階躍星辰一直以實現 AGI 為目標堅持研發基座大模型。我們深知 AGI 的實現離不開全球開發者的共同努力,開源的初心,一方面是希望跟大家分享最新技術成果,為開源社區貢獻一份力量;另一方面,我們相信多模態模型是實現 AGI 的必經之路,但目前尚處于早期階段,期待與社區開發者集思廣益,共同拓展模型技術邊界,并推動產業落地。”

 階躍Step-Video-T2V:性能領跑全球開源視頻生成大模型

階躍Step-Video-T2V 是目前全球范圍內參數量最大、性能最好的開源視頻生成大模型。階躍Step-Video-T2V 模型的參數量達到 300 億,可以直接生成 204 幀、540P 分辨率的高質量視頻,這意味著能確保生成的視頻內容具有極高的信息密度和強大的一致性。

 從生成效果來看,階躍Step-Video-T2V 在復雜運動、美感人物、視覺想象力、基礎文字生成、原生中英雙語輸入和鏡頭語言等方面具備強大的生成能力,且語義理解和指令遵循能力突出,能夠高效助力視頻創作者實現精準創意呈現。用戶可以在躍問網頁端(https://yuewen.cn/videos)和躍問 App 上體驗階躍Step-Video-T2V 的視頻生成能力 。

 為了對開源視頻生成模型的性能進行全面評測,階躍星辰還發布并開源了針對文生視頻質量評測的新基準數據集 Step-Video-T2V-Eval。該測試集包含 128 條源于真實用戶的中文評測問題,旨在評估生成視頻在運動、風景、動物、組合概念、超現實、人物、3D 動畫、電影攝影等 11 個內容類別上質量。

Step-Video-T2V-Eval評測結果

評測結果顯示,階躍Step-Video-T2V 的模型性能在指令遵循、運動平滑性、物理合理性、美感度等方面的表現,均顯著超過市面上既有的效果最佳的開源視頻模型。

據了解,目前在躍問網頁端(https://yuewen.cn/videos)和躍問 App 上,都可以體驗 階躍Step-Video-T2V 的視頻生成能力 。

階躍Step-Audio:業內首款產品級開源語音交互模型

階躍Step-Audio 是行業內首個產品級的開源語音交互模型,能夠根據不同的場景需求生成情緒、方言、語種、歌聲和個性化風格的表達,能和用戶自然地高質量對話。模型生成的語音具有超自然、高情商等特征,同時也能實現高質量的音色復刻并進行角色扮演,滿足影視娛樂、社交、游戲等行業場景下應用需求。

在 LlaMA Question、Web Questions 等 5 大主流公開測試集中,階躍Step-Audio 模型性能均超過了行業內同類型開源模型,位列第一。階躍Step-Audio 在 HSK-6(漢語水平考試六級)評測中的表現尤為突出,是最懂中國話的開源語音交互大模型。

StepEval-Audio-360基準測試

此外,由于目前行業內語音對話測試集相對缺失,階躍星辰自建并開源了多維度評估體系 StepEval-Audio-360 基準測試,從角色扮演、邏輯推理、生成控制、文字游戲、創作能力、指令控制等 9 項基礎能力的維度對開源語音模型進行全面測評。通過人工橫評后的結果顯示,階躍Step-Audio的模型能力十分均衡,且在各個維度上均超過了此前市面上效果最佳的開源語音模型。


版權與免責:以上作品(包括文、圖、音視頻)版權歸發布者【階躍星辰】所有。本App為發布者提供信息發布平臺服務,不代表經觀的觀點和構成投資等建議