DeepSeek公司發(fā)布專為英偉達Hopper GPU打造的大模型加速器FlashMLA

TIME

2025-02-26 11:18

通信世界全媒體

近日，DeepSeek公司正式發(fā)布并開源其最新技術成果FlashMLA。FlashMLA是專為英偉達Hopper架構(gòu)GPU打造的高效多層注意力（Multi-Layer Attention）解碼內(nèi)核，并特別針對變長序列場景進行了優(yōu)化，可顯著提升大模型推理性能。同時，F(xiàn)lashMLA通過對BF16精度的全面支持，以及采用塊大小為64的頁式鍵值緩存系統(tǒng)，實現(xiàn)了更精確的內(nèi)存管理。

在性能表現(xiàn)方面，基于CUDA12.6平臺，F(xiàn)lashMLA在H800SXM5GPU上表現(xiàn)突出：在內(nèi)存受限場景下達到3000GB/s的處理速度，在計算受限場景下則實現(xiàn)580TFLOPS的算力水平。

THE END

免責聲明：本文系轉(zhuǎn)載，版權歸原作者所有；刊載之目的為傳播更多信息，如內(nèi)容不適請及時通知我們。

相關熱點

我國人形機器人自主站立控制技術取得新突破

　　近期，由上海人工智能實驗室、上海交通大學等機構(gòu)共同發(fā)布了一項創(chuàng)新算法技術，該技術能夠使人形機器人從各種狀態(tài)下實現(xiàn)快速、穩(wěn)定地站立。據(jù)上海人工智能實驗室青年...

智能AI

我國科學家制備出可控手性石墨烯卷

　　日前，我國科學家開發(fā)了一種名為“石蠟輔助浸入法”的新技術，成功讓二維材料“卷起來”，制備出具有可控手性的石墨烯卷，為未來量子計算和自旋電子器件的發(fā)展奠定了堅實...

業(yè)界

老司机伊人99久久精品,老司机伊人99久久精品,亚洲精品推荐在线观看av,日本一本2019道国产香蕉,欧美精品一区二区三区卡,好看的日韩影片言情片,伊人亚洲欧美日韩加勒比,国产成av人片在线观性色av,国产最新黄色自拍视频

DeepSeek公司發(fā)布專為英偉達Hopper GPU打造的大模型加速器FlashMLA

相關熱點

最新文章

相關推薦

東京奧運會中國第13金由游泳健將張雨霏斬獲，一天斬獲兩枚金牌

兩名航天員成功出艙航天員劉伯明成功開啟天和核心艙節(jié)點艙出艙艙門

微信顯示“正在輸入”，其實不是在回復消息，背后原因挺“傷人”

關注我們

老司机伊人99久久精品,老司机伊人99久久精品,亚洲精品推荐在线观看av,日本一本2019道国产香蕉,欧美精品一区二区三区卡,好看的日韩影片言情片,伊人亚洲欧美日韩加勒比,国产成av人片在线观性色av,国产最新黄色自拍视频

DeepSeek公司發(fā)布專為英偉達Hopper GPU打造的大模型加速器FlashMLA

相關熱點

最新文章

相關推薦

東京奧運會中國第13金由游泳健將張雨霏斬獲，一天斬獲兩枚金牌

兩名航天員成功出艙 航天員劉伯明成功開啟天和核心艙節(jié)點艙出艙艙門

微信顯示“正在輸入”，其實不是在回復消息，背后原因挺“傷人”

關注我們

兩名航天員成功出艙航天員劉伯明成功開啟天和核心艙節(jié)點艙出艙艙門

微信顯示“正在輸入”，其實不是在回復消息，背后原因挺“傷人”