
澎峰科技最新消息,公司自主研發(fā)的PerfXLM+推理框架已基于海光DCU,完成對DeepSeek全系列模型的深度適配與優(yōu)化,AI大模型應(yīng)用效能大幅提升。
PerfXLM+推理框架通過底層架構(gòu)優(yōu)化,全面適配海光DCU算力平臺,為DeepSeek模型提供了高性能支持。針對DeepSeek-R1-Distill系列等模型,框架結(jié)合海光DCU的并行計(jì)算能力,可顯著降低資源消耗,在同等硬件條件下進(jìn)一步提高了推理效率。
另外,海光DCU作為關(guān)鍵“媒介”,采用兼容度最高的GPGPU通用加速計(jì)算架構(gòu),可支撐DeepSeek模型直接運(yùn)行,大幅減少底層適配工作量,技術(shù)團(tuán)隊(duì)僅需聚焦模型精度驗(yàn)證與持續(xù)性能優(yōu)化,即可實(shí)現(xiàn)高效部署。
PerfXLM+推理框架目前已覆蓋自然語言處理、多模態(tài)理解等核心場景,客戶可基于海光DCU集群實(shí)現(xiàn)模型快速迭代與彈性擴(kuò)展,滿足各行各業(yè)的實(shí)時(shí)推理需求。
并且,PerfXLM+推理框架通過模型量化、算子融合等核心技術(shù),正在進(jìn)一步挖掘海光DCU的異構(gòu)計(jì)算潛力,為企業(yè)提供更高質(zhì)量、低成本的AI推理服務(wù)。
隨著“框架+硬件+模型”的全棧能力構(gòu)建完畢,國產(chǎn)廠商或?qū)⒓铀俅蚱破髽I(yè)AI部署門檻。
