2024年,是AI技術(shù)飛速發(fā)展的一年,AI從單一任務(wù)向多模態(tài)、多任務(wù)實(shí)現(xiàn)了跨越,大模型市場從拼參數(shù)的“百模大戰(zhàn)”到了拼落地、拼應(yīng)用的新階段。AI應(yīng)用在多個(gè)行業(yè)逐步深化,大模型則推動(dòng)了傳統(tǒng)產(chǎn)業(yè)變革,為新質(zhì)生產(chǎn)力賦能,對各行各業(yè)都產(chǎn)生了深遠(yuǎn)的影響。隨著中國人工智能的飛速發(fā)展,AI已經(jīng)變成了我們生活里的一部分。
2024年,對MiniMax公司而言是充滿挑戰(zhàn)與收獲的一年。我們堅(jiān)持技術(shù)創(chuàng)新,在文本、圖像、語音&音樂、視頻等多個(gè)模態(tài)的模型算法發(fā)力,力求實(shí)現(xiàn)技術(shù)突破,加快實(shí)現(xiàn)通用人工智能的步伐。在文本模型上,我們在上半年就推出了國內(nèi)首個(gè)上線商用的MoE架構(gòu)、包含萬億參數(shù)的大語言模型abab 6.5。在多模態(tài)領(lǐng)域,MiniMax語音大模型speech-01已經(jīng)實(shí)現(xiàn)了世界Top 2大規(guī)模商用,同時(shí)推出了國內(nèi)首個(gè)可以對標(biāo)OpenAI的Realtime API服務(wù),提升了端到端實(shí)時(shí)多模態(tài)處理能力。去年下半年,MiniMax推出的視頻模型video-01在國際多個(gè)權(quán)威榜單評測得分領(lǐng)先,受到超過200個(gè)國家和地區(qū)創(chuàng)作者的好評。
回望過去一年,我們走過彎路,也總結(jié)了很多經(jīng)驗(yàn)。我們發(fā)現(xiàn),AI時(shí)代不能套用上一代移動(dòng)互聯(lián)網(wǎng)產(chǎn)品方法論來思考新產(chǎn)品。AI大模型和產(chǎn)品的真實(shí)關(guān)系是更好的模型可以導(dǎo)向更好的應(yīng)用,但更好的應(yīng)用和更多用戶并不會(huì)導(dǎo)向更好的模型。也正因把技術(shù)迭代設(shè)立為了核心目標(biāo),我們才成為了中國大模型公司中,為數(shù)不多的能不依賴于推廣,以好技術(shù)為替代來驅(qū)動(dòng)好產(chǎn)品,并在全球收獲相對還不錯(cuò)的口碑的公司,這是我們2024年的幸運(yùn)。
2025年是AI行業(yè)發(fā)展的關(guān)鍵一年,也是AI Agent大放異彩的時(shí)代。新的一年,加速技術(shù)迭代仍是MiniMax最重要的目標(biāo)。新年伊始,我們接連發(fā)布了提供主體參考功能的視頻模型S2V、新一代開源模型MiniMax-01,以及在多語種表現(xiàn)優(yōu)異的語音模型T2A-01-HD。選擇對MiniMax-01開源,一是因?yàn)槲覀冋J(rèn)為這有可能啟發(fā)更多長上下文的研究和應(yīng)用,從而更快促進(jìn)Agent時(shí)代的到來,二是開源也能促使我們努力做更多創(chuàng)新,更高質(zhì)量地開展后續(xù)的模型研發(fā)工作。
長上下文能力與多模態(tài)處理能力的提升,是AI Agent為各行業(yè)帶來更為豐富、高效、智能的解決方案的必要條件?,F(xiàn)在,我們邁出了建立復(fù)雜Agent基礎(chǔ)能力的第一步。在機(jī)遇和挑戰(zhàn)并存的未來,MiniMax會(huì)繼續(xù)堅(jiān)持技術(shù)驅(qū)動(dòng),把每一步做扎實(shí),才能推動(dòng)AI技術(shù)在更多領(lǐng)域的落地,為AGI的更快到來盡全力。(經(jīng)濟(jì)觀察報(bào) 記者 任曉寧)