微軟和英偉達(dá)推出迄今為止訓(xùn)練最大最強(qiáng)的語言模型 MT-NLG

TIME

2021-10-12 08:45

IT之家

IT之家 10 月 12 日消息語言模型（Language Model）簡單來說就是一串詞序列的概率分布，主要作用是為一個長度為 m 的文本確定一個概率分布 P，表示這段文本存在的可能性。

大家之前可能或多或少聽說過 GPT-3，OpenAI 最新的語言模型，堪稱地表最強(qiáng)語言模型，也被認(rèn)為是革命性的人工智能模型。除此之外還有 BERT、Switch Transformer 等重量級產(chǎn)品，而且業(yè)內(nèi)其他企業(yè)也在努力推出自家的模型。

微軟和英偉達(dá)今天宣布了由 DeepSpeed 和 Megatron 驅(qū)動的 Megatron-Turing 自然語言生成模型（MT-NLG），這是迄今為止訓(xùn)練的最大和最強(qiáng)大的解碼語言模型。

IT之家了解到，作為 Turing NLG 17B 和 Megatron-LM 的繼任者，這個模型包括 5300 億個參數(shù)，而且 MT-NLG 的參數(shù)數(shù)量是同類現(xiàn)有最大模型 GPT-3 的 3 倍，并在一系列廣泛的自然語言任務(wù)中展示了無與倫比的準(zhǔn)確性，例如：

完成預(yù)測
　　
閱讀理解
　　
常識推理
　　
自然語言推理
　　
詞義消歧

105 層、基于轉(zhuǎn)換器的 MT-NLG 在零、單和少樣本設(shè)置中改進(jìn)了先前最先進(jìn)的模型，并為兩個模型規(guī)模的大規(guī)模語言模型設(shè)定了新標(biāo)準(zhǔn)和質(zhì)量。

據(jù)悉，模型訓(xùn)練是在基于 NVIDIA DGX SuperPOD 的 Selene 超級計(jì)算機(jī)上以混合精度完成的，該超級計(jì)算機(jī)由 560 個 DGX A100 服務(wù)器提供支持，這些服務(wù)器以完整的胖樹配置與 HDR InfiniBand 聯(lián)網(wǎng)。每個 DGX A100 有 8 個 NVIDIA A100 80GB Tensor Core GPU，通過 NVLink 和 NVSwitch 相互完全連接。微軟 Azure NDv4 云超級計(jì)算機(jī)使用了類似的參考架構(gòu)。

更多內(nèi)容可查看微軟和英偉達(dá)官方說明：

微軟

英偉達(dá)

THE END

免責(zé)聲明：本文系轉(zhuǎn)載，版權(quán)歸原作者所有；刊載之目的為傳播更多信息，如內(nèi)容不適請及時通知我們。

老司机伊人99久久精品,老司机伊人99久久精品,亚洲精品推荐在线观看av,日本一本2019道国产香蕉,欧美精品一区二区三区卡,好看的日韩影片言情片,伊人亚洲欧美日韩加勒比,国产成av人片在线观性色av,国产最新黄色自拍视频

微軟和英偉達(dá)推出迄今為止訓(xùn)練最大最強(qiáng)的語言模型 MT-NLG

相關(guān)熱點(diǎn)

最新文章

相關(guān)推薦

東京奧運(yùn)會中國第13金由游泳健將張雨霏斬獲，一天斬獲兩枚金牌

兩名航天員成功出艙航天員劉伯明成功開啟天和核心艙節(jié)點(diǎn)艙出艙艙門

微信顯示“正在輸入”，其實(shí)不是在回復(fù)消息，背后原因挺“傷人”

關(guān)注我們

老司机伊人99久久精品,老司机伊人99久久精品,亚洲精品推荐在线观看av,日本一本2019道国产香蕉,欧美精品一区二区三区卡,好看的日韩影片言情片,伊人亚洲欧美日韩加勒比,国产成av人片在线观性色av,国产最新黄色自拍视频

微軟和英偉達(dá)推出迄今為止訓(xùn)練最大最強(qiáng)的語言模型 MT-NLG

相關(guān)熱點(diǎn)

最新文章

相關(guān)推薦

東京奧運(yùn)會中國第13金由游泳健將張雨霏斬獲，一天斬獲兩枚金牌

兩名航天員成功出艙 航天員劉伯明成功開啟天和核心艙節(jié)點(diǎn)艙出艙艙門

微信顯示“正在輸入”，其實(shí)不是在回復(fù)消息，背后原因挺“傷人”

關(guān)注我們

東京奧運(yùn)會中國第13金由游泳健將張雨霏斬獲，一天斬獲兩枚金牌

兩名航天員成功出艙航天員劉伯明成功開啟天和核心艙節(jié)點(diǎn)艙出艙艙門

微信顯示“正在輸入”，其實(shí)不是在回復(fù)消息，背后原因挺“傷人”