百川智能是一家研發(fā)通用人工智能并提供相關(guān)服務(wù)的中國公司,核心業(yè)務(wù)是打造基礎(chǔ)大模型及顛覆性上層應(yīng)用。由原搜狗公司創(chuàng)始人王小川于2023年4月10日創(chuàng)立。公司核心團隊由MIT、Google、微軟等知名科技公司的AI頂尖人才組成。目前已完成A輪融資,總?cè)谫Y金額約50億元人民幣,并將以200億估值開啟B輪融資。成立以來,百川智能接連發(fā)布Baichuan-7B/13B,Baichuan2-7B/13B四款開源可免費商用大模型及Baichuan-53B、Baichuan2-53B、Baichuan2-192K、Baichuan2 Turbo、鵬城-百川·腦海33B、Baichuan-NPC、Baichuan 3、Baichuan 4等十款閉源大模型。
2024年5月22日,百川智能發(fā)布最新一代基座大模型Baichuan 4,并推出成立之后的首款AI助手“百小應(yīng)”。Baichuan 4相較Baichuan 3 在各項能力上均有極大提升,其中通用能力提升超過10%,數(shù)學和代碼能力分別提升14%和9%,當時在國內(nèi)權(quán)威大模型評測機構(gòu)SuperCLUE的評測中,模型能力國內(nèi)第一。此外,Baichun 4還具備行業(yè)領(lǐng)先的多模態(tài)能力,在各大評測基準上表現(xiàn)優(yōu)異,領(lǐng)先Gemini Pro、Claude3-sonnet等多模態(tài)模型。
Baichuan 4能在較短的時間內(nèi)取得突破,源于其在訓練過程中引入了諸多業(yè)界領(lǐng)先的技術(shù)段,同時突破RLHF和RLAIF融合的RLxF強化學習對齊技術(shù),大幅提升模型的指令遵循等能力。
在Baichuan 4強大能力的基礎(chǔ)上,百川智能將搜索技術(shù)與大模型深度融合,推出懂搜索、會提問的AI助手“百小應(yīng)”。百小應(yīng)不僅可以隨時回答用戶提出的各種問題,速讀文件、整理資料、輔助創(chuàng)作等,還具備多輪搜索、定向搜索等搜索能力,能更精準地理解用戶需求,為用戶提供專業(yè)、豐富的知識和資源。此外還會在用戶問題的基礎(chǔ)上通過一系列提問來幫助用戶明確自身需求,給出更精準的答案。除了強大的搜索和提問功能以外,用戶還能在百小應(yīng)中上傳PDF、word文檔,或者直接輸入網(wǎng)頁鏈接(URL),閱讀并分析書籍、報告、學術(shù)論文等長篇內(nèi)容,僅用一分鐘便能讀完上市公司財報。在Baichuan 4多模態(tài)能力的支持下,用戶在提問的同時還可以同步上傳圖片,對圖片內(nèi)容進行解讀,或者將圖片作為補充材料,獲取更精準的回答;并且,它還支持用戶通過語音的方式進行交互。
Baichuan 4能在較短的時間內(nèi)取得突破,源于其在訓練過程中引入了諸多業(yè)界領(lǐng)先的技術(shù)段,同時突破RLHF和RLAIF融合的RLxF強化學習對齊技術(shù),大幅提升模型的指令遵循等能力。百川智能認為,不同于信息時代工具屬性的產(chǎn)品,大模型創(chuàng)造的是新物種,讓AI從工具變?yōu)榛锇椤km然受限于模型能力,當下的AI應(yīng)用還無法完全做到如同人一樣,能夠使用工具、會思考、有情感等,但隨著模型能力的持續(xù)提升,相關(guān)應(yīng)用一定會逐步具備完整能力。
孫小茜/文