
傳統(tǒng)的AI服務(wù)器通常包含8張算力卡,一臺(tái)服務(wù)器即為一個(gè)節(jié)點(diǎn)。服務(wù)器內(nèi)部的8張算力卡傳輸速度較快,但服務(wù)器與服務(wù)器之間的傳輸速度則慢得多。隨著大模型浪潮的到來(lái),行業(yè)巨頭需要連接成千上萬(wàn)、乃至10萬(wàn)計(jì)的GPU算力卡,這使得互聯(lián)和通信成為行業(yè)發(fā)展的一大難題。
正如華為計(jì)算產(chǎn)品線營(yíng)銷運(yùn)作部部長(zhǎng)張愛(ài)軍在2026新春媒體沙龍上所分享的,當(dāng)前大模型正從單模態(tài)走向全模態(tài)融合,模型上下文長(zhǎng)度、訓(xùn)練數(shù)據(jù)規(guī)模持續(xù)提升,同時(shí)金融等場(chǎng)景對(duì)時(shí)延提出10毫秒以下的嚴(yán)苛要求,傳統(tǒng)算力架構(gòu)已難以適配。
系統(tǒng)工程破解算力互聯(lián)困局
解決這一難題的關(guān)鍵,在于采用高速通信技術(shù)將更多算力卡融合成一個(gè)超節(jié)點(diǎn)。超節(jié)點(diǎn)內(nèi)的所有算力卡可實(shí)現(xiàn)高速互聯(lián)和通信,進(jìn)而大幅提升算力集群的性能。
張愛(ài)軍表示,真正的超節(jié)點(diǎn)必須同時(shí)具備大帶寬、低時(shí)延和內(nèi)存統(tǒng)一編址三大核心要素,若僅通過(guò)PCIe+RoCE協(xié)議互聯(lián),不支持內(nèi)存統(tǒng)一編址,本質(zhì)上仍是傳統(tǒng)服務(wù)器堆疊,并非真正的超節(jié)點(diǎn)。
華為發(fā)布的昇騰384超節(jié)點(diǎn),正是其計(jì)算技術(shù)突破的重要體現(xiàn),該超節(jié)點(diǎn)以384張昇騰算力卡組成,是目前已商用的超節(jié)點(diǎn)中單體規(guī)模最大的產(chǎn)品。依托華為自研靈衢UnifiedBus互聯(lián)協(xié)議,其打破了傳統(tǒng)PCIe互聯(lián)的帶寬和時(shí)延瓶頸,通信帶寬較傳統(tǒng)服務(wù)器架構(gòu)提升10倍,RTT通信時(shí)延從7微秒降至3微秒,降低50%以上,同時(shí)實(shí)現(xiàn)128TB全局內(nèi)存統(tǒng)一編址,讓384張算力卡如同一個(gè)邏輯上的單一設(shè)備協(xié)同工作,真正實(shí)現(xiàn)“計(jì)算不等待通信”。
這樣的計(jì)算技術(shù)重構(gòu),背后涉及基礎(chǔ)軟件、計(jì)算、內(nèi)存、通信、架構(gòu)、調(diào)度、散熱、供電、高速互聯(lián)等多個(gè)領(lǐng)域的協(xié)同研發(fā),每個(gè)領(lǐng)域都需要深厚的技術(shù)積累。
張愛(ài)軍在媒體沙龍上表示,華為能實(shí)現(xiàn)這一突破,得益于過(guò)去幾十年在通信、硬件工程和基礎(chǔ)軟件領(lǐng)域等多領(lǐng)域積淀。華為在光通信領(lǐng)域擁有全球領(lǐng)先的技術(shù)積累,能解決極高速通信中穩(wěn)定性與傳輸距離的矛盾,同時(shí)將液冷散熱、算力調(diào)度等技術(shù)融入超節(jié)點(diǎn)設(shè)計(jì)。
華為通過(guò)系統(tǒng)化創(chuàng)新,在協(xié)議、器件和工程層面實(shí)現(xiàn)了長(zhǎng)期穩(wěn)定運(yùn)行,確保超節(jié)點(diǎn)滿負(fù)載運(yùn)行時(shí)的可靠性,進(jìn)一步印證了其計(jì)算技術(shù)的硬實(shí)力。
從商用落地來(lái)看,華為昇騰384超節(jié)點(diǎn)(Atlas 900 A3 SuperPoD)自上市以來(lái),已累計(jì)部署超過(guò)數(shù)百套,涵蓋互聯(lián)網(wǎng)、電信、制造等多個(gè)行業(yè),讓計(jì)算技術(shù)真正賦能產(chǎn)業(yè)發(fā)展。
構(gòu)建開源生態(tài),共建產(chǎn)業(yè)協(xié)同
算力平臺(tái)的“能用”和“易用”分屬兩個(gè)不同維度的問(wèn)題,而開源則是打通“易用”壁壘、讓計(jì)算技術(shù)廣泛落地的關(guān)鍵。
想要讓先進(jìn)的計(jì)算技術(shù)真正服務(wù)于開發(fā)者和產(chǎn)業(yè),還需要華為在生態(tài)上提供更加全面的開源支持。
華為計(jì)算開源業(yè)務(wù)總經(jīng)理李永樂(lè)在媒體沙龍上提到,全球許多AI開發(fā)者習(xí)慣使用PyTorch、TensorFlow框架,生態(tài)兼容性是計(jì)算技術(shù)落地的核心,而開源正是破解這一難題的重要路徑。對(duì)此,華為早已提前布局應(yīng)對(duì),將開源作為核心戰(zhàn)略,推動(dòng)計(jì)算技術(shù)與開源生態(tài)深度融合。
李永樂(lè)詳細(xì)介紹了開源生態(tài)構(gòu)建的具體舉措:昇騰的異構(gòu)計(jì)算架構(gòu)CANN從誕生之日起,就支持包括PyTorch、TensorFlow在內(nèi)的主流開源框架,且已于2025年8月全面開源開放,開發(fā)者無(wú)需修改核心代碼,就能將原有模型遷移至相關(guān)計(jì)算平臺(tái)運(yùn)行,大幅降低了開發(fā)者的適配成本。
同時(shí),歐拉(openEuler)操作系統(tǒng)也已發(fā)布面向超節(jié)點(diǎn)的創(chuàng)新版本,成為業(yè)界首個(gè)開源的超節(jié)點(diǎn)操作系統(tǒng),為計(jì)算技術(shù)的開源落地提供了全方位支撐。
截至2026年1月,華為已發(fā)展380萬(wàn)+鯤鵬開發(fā)者、400萬(wàn)+昇騰開發(fā)者,聯(lián)合9800+ISV伙伴打造了超過(guò)2萬(wàn)個(gè)解決方案,形成了完善的開源生態(tài)體系,讓計(jì)算技術(shù)通過(guò)開源實(shí)現(xiàn)更廣泛的賦能。
值得注意的是,華為在計(jì)算技術(shù)突破的同時(shí),并未將核心技術(shù)封閉起來(lái),而是選擇全面開源,與產(chǎn)業(yè)鏈伙伴共建協(xié)同生態(tài)。截至媒體沙龍召開時(shí),靈衢協(xié)議已累計(jì)下載近24000份,華為還計(jì)劃成立了靈衢社區(qū),與產(chǎn)業(yè)鏈伙伴共建超節(jié)點(diǎn)生態(tài),助力中國(guó)構(gòu)建完整的超節(jié)點(diǎn)產(chǎn)業(yè)鏈,推動(dòng)計(jì)算技術(shù)與開源生態(tài)雙向賦能、共同發(fā)展。
華為在計(jì)算領(lǐng)域的技術(shù)突破和開源生態(tài)建設(shè),破解了AI算力互聯(lián)難題,為大模型發(fā)展提供了有力算力支撐。未來(lái),華為將持續(xù)推進(jìn)計(jì)算技術(shù)研發(fā)和開源生態(tài)完善,推動(dòng)算力高效流動(dòng),以計(jì)算和開源賦能各行業(yè)數(shù)字化轉(zhuǎn)型,實(shí)現(xiàn)雙向共贏。
