QQ在線客服

當(dāng)前位置:首頁> 資訊> 科技評論

英偉達(dá)打破實(shí)時對話AI的訓(xùn)練和推理用時記錄

2019-08-14 11:03 來源: 網(wǎng)絡(luò) 瀏覽(832)人   

  據(jù)國外媒體報(bào)道,Nvidia用于開發(fā)和運(yùn)行可理解和響應(yīng)請求的對話式AI的GPU強(qiáng)化平臺,已經(jīng)達(dá)成了一些重要的里程碑,并打破了一些記錄。


英偉達(dá)打破實(shí)時對話AI的訓(xùn)練和推理用時記錄


  這對任何基于其技術(shù)進(jìn)行開發(fā)的人來說意義重大——當(dāng)中包括大大小小的公司,因?yàn)橛ミ_(dá)將很多用于實(shí)現(xiàn)這些進(jìn)步的代碼開源。那些代碼用PyTorch編寫,易于運(yùn)行。

  英偉達(dá)今天宣布的最大成果包括:BERT訓(xùn)練用時打破記錄,進(jìn)入1小時關(guān)口。BERT是世界上最先進(jìn)的人工智能語言模型之一,也被廣泛認(rèn)為是自然語言處理(NLP)標(biāo)桿的先進(jìn)模型。Nvidia的AI平臺僅僅需要53分鐘就能夠完成模型訓(xùn)練,經(jīng)過訓(xùn)練的模型在短短2毫秒多一點(diǎn)的時間里(10毫秒在業(yè)內(nèi)被認(rèn)為是高水平線)就能夠成功地做出推理(即利用通過訓(xùn)練學(xué)習(xí)到的能力得出結(jié)果)——又一個記錄。

  英偉達(dá)的這些突破不僅僅是吹噓的資本——這些進(jìn)步可為任何使用NLP對話式人工智能和GPU硬件的人提供切實(shí)的好處。Nvidia在它的其中一個SuperPOD系統(tǒng)上打破了訓(xùn)練時間記錄,該SuperPOD系統(tǒng)由運(yùn)行1472個V100 GPU的92個Nvidia DGX-2H系統(tǒng)組成;在運(yùn)行Nvidia TensorRT的Nvidia T4 GPU上完成推理過程。Nvidia TensorRT在性能上超出高度優(yōu)化的CPU許多個量級。不過,該公司將公開BERT訓(xùn)練代碼和經(jīng)過TensorRT優(yōu)化的BERT樣本,讓所有人都可以通過GitHub利用。

  除了這些里程碑以外,英偉達(dá)的研究部門還建立并訓(xùn)練了有史以來最大的一個基于“Transformer”的語言模型。這也是BERT的技術(shù)基礎(chǔ)。該定制模型包含的參數(shù)多達(dá)83億個,規(guī)模是當(dāng)前最大的核心BERT模型BERT-Large的24倍。英偉達(dá)將這個模型命名為“Megatron”,它也對外提供了用于訓(xùn)練這個模型的PyTorch代碼,因而其他人能夠自行訓(xùn)練出類似的基于“Transformer”的大型語言模型。


    2898站長資源平臺網(wǎng)站資訊:http://www.afrimangol.com/news/ 


【版權(quán)與免責(zé)聲明】如發(fā)現(xiàn)內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息發(fā)郵件至 kefu@2898.com ,我們將及時溝通與處理。 本站內(nèi)容除了2898站長資源平臺( www.afrimangol.com )原創(chuàng)外,其它均為網(wǎng)友轉(zhuǎn)載內(nèi)容,涉及言論、版權(quán)與本站無關(guān)。