国产精品自拍亚洲-国产精品自拍一区-国产精品自拍在线-国产精品自拍在线观看-亚洲爆爽-亚洲不卡一区二区三区在线

昆侖芯三代萬(wàn)卡集群點(diǎn)亮,為國(guó)內(nèi)首個(gè)正式點(diǎn)亮的自研萬(wàn)卡集群

金車(chē)賞2025-02-05 16:47

金車(chē)賞

近日,百度智能云成功點(diǎn)亮昆侖芯三代萬(wàn)卡集群,這也是國(guó)內(nèi)首個(gè)正式點(diǎn)亮的自研萬(wàn)卡集群。百度智能云將進(jìn)一步點(diǎn)亮3萬(wàn)卡集群。

?國(guó)產(chǎn)昆侖芯萬(wàn)卡集群以及未來(lái)三萬(wàn)卡集群的建設(shè),從硬件到軟件,技術(shù)挑戰(zhàn)是全方位的。而24年9月升級(jí)的百度百舸AI異構(gòu)計(jì)算平臺(tái)4.0,圍繞落地大模型全旅程的算力需求,在集群創(chuàng)建、開(kāi)發(fā)實(shí)驗(yàn)、模型訓(xùn)練、模型推理四大方面,能為企業(yè)提供“多、快、穩(wěn)、省”的AI基礎(chǔ)設(shè)施,在萬(wàn)卡集群的建設(shè)中發(fā)揮了至關(guān)重要的作用。

?首先,突破硬件擴(kuò)展性瓶頸,如卡間互聯(lián)的拓?fù)湎拗疲苊馔ㄐ艓挸蔀槠款i;同時(shí),圍繞芯片及集群功耗,基于萬(wàn)卡規(guī)模常規(guī)方案功耗可達(dá)十兆瓦或更高,采用創(chuàng)新性散熱方案,從而解決萬(wàn)卡集群的能效與散熱問(wèn)題;完善模型的分布式訓(xùn)練優(yōu)化,采用高效并行化任務(wù)切分策略,訓(xùn)練主流開(kāi)源模型的集群MFU提升至58%;在提升穩(wěn)定性方面,提供容錯(cuò)與穩(wěn)定性機(jī)制,避免由于單卡故障率隨規(guī)模指數(shù)上升而造成的萬(wàn)卡集群有效性大幅下降,保障有效訓(xùn)練率達(dá)到98%;最后,針對(duì)機(jī)間通信帶寬需求,建設(shè)超大規(guī)模HPN高性能網(wǎng)絡(luò),優(yōu)化拓?fù)浣Y(jié)構(gòu),從而降低通信瓶頸,帶寬有效性達(dá)到90%以上。

同時(shí),昆侖芯作為百度自研的AI芯片,憑借其獨(dú)特的技術(shù)優(yōu)勢(shì),在百舸4.0的能力加持下,在生成式人工智能時(shí)代展現(xiàn)出了巨大的競(jìng)爭(zhēng)力。

未來(lái)一年,將是各種AI原生應(yīng)用爆發(fā)的黃金時(shí)期。自研芯片和萬(wàn)卡集群的建成帶來(lái)了強(qiáng)大的算力支持,同時(shí)有效提升百度和客戶的資源整體利用率,降低大模型訓(xùn)練成本,推動(dòng)了模型降本的趨勢(shì),為整個(gè)行業(yè)提供了新的思路和方向。

隨著國(guó)產(chǎn)大模型的興起,萬(wàn)卡集群已從單純算力供給逐漸向“有效”算力供給過(guò)渡,通過(guò)模型優(yōu)化、并行策略、有效訓(xùn)練率提升、動(dòng)態(tài)資源分配等手段,智能調(diào)度任務(wù),將訓(xùn)練、微調(diào)、推理任務(wù)混合部署,最大化提升集群綜合利用率,降低單位算力成本,從而真正發(fā)揮算力效能。百度智能云將始終陪伴在所有企業(yè)身旁,通過(guò)本次萬(wàn)卡集群點(diǎn)亮和應(yīng)用落地,持續(xù)為企業(yè)提供源源不斷的穩(wěn)定、高效的算力動(dòng)能。


版權(quán)與免責(zé):以上作品(包括文、圖、音視頻)版權(quán)歸發(fā)布者【金車(chē)賞】所有。本App為發(fā)布者提供信息發(fā)布平臺(tái)服務(wù),不代表經(jīng)觀的觀點(diǎn)和構(gòu)成投資等建議

熱新聞