當(dāng)前位置：首頁 > 新聞資訊 > 機(jī)器人知識(shí) > OpenAI發(fā)布了有史以來最強(qiáng)的NLP預(yù)訓(xùn)練模型GPT-3

OpenAI發(fā)布了有史以來最強(qiáng)的NLP預(yù)訓(xùn)練模型GPT-3

來源：AI MOOC人工智能平臺(tái) 編輯：創(chuàng)澤時(shí)間：2020/6/9 主題：其他 [加盟]

2020年5月底OpenAI發(fā)布了有史以來最強(qiáng)的NLP預(yù)訓(xùn)練模型GPT-3，最大的GPT-3模型參數(shù)達(dá)到了1750億個(gè)參數(shù)。論文《Language Models are Few-Shot Learners》長達(dá)74頁已發(fā)布在arXiv。

有網(wǎng)友估算最大的GPT-3模型大小大約有700G，這個(gè)大小即使OpenAI公開模型，我們一般的電腦也無法使用。一般需要使用分布式集群才能把這個(gè)模型跑起來。雖然OpenAI沒有公布論文的花費(fèi)，不過有網(wǎng)友估計(jì)這篇論文大約花費(fèi)了上千萬美元用于模型訓(xùn)練。

如此驚人的模型在模型的設(shè)計(jì)上和訓(xùn)練上有什么特別之處嗎？答案是沒有。作者表示GPT-3的模型架構(gòu)跟GPT-2是一樣的，只是使用了更多的模型參數(shù)。模型訓(xùn)練也跟GPT-2是一樣的，使用預(yù)測(cè)下一個(gè)詞的方式來訓(xùn)練語言模型，只不過GPT-3訓(xùn)練時(shí)使用了更多的數(shù)據(jù)。

既然這樣，那這只怪獸特別之處是什么？GPT-3論文的核心在于下圖：

日韩精品导航,失落十三年,亚洲a∨精品一区二区三区下载,91国内在线

OpenAI發(fā)布了有史以來最強(qiáng)的NLP預(yù)訓(xùn)練模型GPT-3

達(dá)摩院金榕教授113頁P(yáng)PT詳解達(dá)摩院在NLP、語音和CV上的進(jìn)展與應(yīng)用實(shí)踐

重構(gòu)ncnn，騰訊優(yōu)圖開源新一代移動(dòng)端推理框架TNN

知識(shí)圖譜在個(gè)性化推薦領(lǐng)域的研究進(jìn)展及應(yīng)用

基于網(wǎng)格圖特征的琵琶指法自動(dòng)識(shí)別

利用時(shí)序信息提升遮擋行人檢測(cè)準(zhǔn)確度

京東姚霆：推理能力，正是多模態(tài)技術(shù)未來亟需突破的瓶頸

看高清視頻，如何做到不卡頓

基于真實(shí)環(huán)境數(shù)據(jù)集的機(jī)器人操作仿真基準(zhǔn)測(cè)試

億級(jí)視頻內(nèi)容如何實(shí)時(shí)更新

深度解析大規(guī)模參數(shù)語言模型Megatron-BERT

自然語言處理技術(shù)五大技術(shù)進(jìn)展和四大應(yīng)用與產(chǎn)品

自然語言處理技術(shù)發(fā)展趨勢(shì)進(jìn)一步推動(dòng)人工智能從感知智能向認(rèn)知智能的演進(jìn)

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)

智能消毒機(jī)器人

機(jī)器人開發(fā)平臺(tái)

OpenAI發(fā)布了有史以來最強(qiáng)的NLP預(yù)訓(xùn)練模型GPT-3

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)

智能消毒機(jī)器人

機(jī)器人開發(fā)平臺(tái)

服務(wù)機(jī)器人(迎賓、講解、導(dǎo)診...)