《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業(yè)界動態(tài) > 英偉達開源3400億巨獸Nemotron-4 340B

英偉達開源3400億巨獸Nemotron-4 340B

98% 合成數(shù)據(jù)訓出最強開源通用模型,性能對標 GPT-4o
2024-06-17
來源:新智元

剛剛,英偉達全新發(fā)布的開源模型 Nemotron-4 340B,有可能徹底改變訓練 LLM 的方式!從此,或許各行各業(yè)都不再需要昂貴的真實世界數(shù)據(jù)集了。而且,Nemotron-4 340B 直接超越了 Mixtral 8x22B、Claude sonnet、Llama3 70B、Qwen 2,甚至可以和 GPT-4 掰手腕!

就在剛剛,英偉達再一次證明了自己的 AI 創(chuàng)新領域的領導地位。

它全新發(fā)布的 Nemotron-4 340B,是一系列具有開創(chuàng)意義的開源模型,有可能徹底改變訓練 LLM 的合成數(shù)據(jù)生成方式!

0.png

這一突破性進展,標志著 AI 行業(yè)的一個重要里程碑 ——

從此,各行各業(yè)都無需依賴大量昂貴的真實世界數(shù)據(jù)集了,用合成數(shù)據(jù),就可以創(chuàng)建性能強大的特定領域大語言模型!

現(xiàn)在,Nemotron-4 340B 已經取得了輝煌戰(zhàn)績,直接超越了 Mixtral 8x22B、Claude sonnet、Llama3 70B、Qwen 2,甚至可以和 GPT-4 一較高下!

具體來說,Nemotron-4 340B 包括基礎模型 Base、指令模型 Instruct 和獎勵模型 Reward,并構建了一個高質量合成數(shù)據(jù)生成的完整流程。

模型支持 4K 上下文窗口、50 多種自然語言和 40 多種編程語言,訓練數(shù)據(jù)截止到 2023 年 6 月。

訓練數(shù)據(jù)方面,英偉達采用了高達 9 萬億個 token。其中,8 萬億用于預訓練,1 萬億用于繼續(xù)訓練以提高質量。

值得一提的是,指令模型的訓練是在 98% 的合成數(shù)據(jù)上完成的。

0.png

結果顯示,Nemotron-4-340B-Base 在常識推理任務,如 ARC-Challenge、MMLU 和 BigBench Hard 基準測試中,可以和 Llama-3 70B、Mixtral 8x22B 和 Qwen-2 72B 模型媲美。

而 Nemotron-4-340B-Instruct,在指令跟隨和聊天能力方面也超越了相應的指令模型。

Nemotron-4-340B-Reward 在發(fā)表時,在 RewardBench 上實現(xiàn)了最高準確性,甚至超過了 GPT-4o-0513 和 Gemini 1.5 Pro-0514 這樣的專有模型。

0.png

在 BF16 精度下,模型的推理需要 8 塊 H200,或 16 塊 H100 / A100 80GB。如果是在 FP8 精度下,則只需 8 塊 H100。

除此之外,Nemotron-4 340B 還有一個非常顯著的特點 —— 對商用十分友好的許可。

高級深度學習研究工程師 Somshubra Majumdar 對此表示大贊:「是的,你可以用它生成你想要的所有數(shù)據(jù)」

無與倫比的合成數(shù)據(jù)生成

LLM 無法獲得大規(guī)模、多樣化標注數(shù)據(jù)集,怎么破?

Nemotron-4 340B 指令模型,可以幫助開發(fā)者生成合成訓練數(shù)據(jù)。

這些多樣化的合成數(shù)據(jù),模仿了真實世界的數(shù)據(jù)特征,因而數(shù)據(jù)質量明顯提升,從而提升了各領域定制 LLM 的性能和穩(wěn)定性。

而且,為了進一步提高 AI 生成數(shù)據(jù)的質量,開發(fā)者還可以用 Nemotron-4 340B 獎勵模型,來篩選高質量的響應。

它會根據(jù)有用性、正確性、一致性、復雜性和冗長性這 5 個屬性,對響應評分。

另外,研究者可以使用自己的專用數(shù)據(jù),再結合 HelpSteer2 數(shù)據(jù)集,定制 Nemotron-4 340B 基礎模型,以創(chuàng)建自己的指令或獎勵模型。


Magazine.Subscription.jpg

本站內容除特別聲明的原創(chuàng)文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內容無法一一聯(lián)系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 国产女人水真多18毛片18精品| 成人在线免费看| 亚洲综合校园春色| 菠萝蜜视频在线观看| 国产美女高清**毛片| 丝袜女警花被捆绑调教| 有人有看片的资源吗www在线观看| 免费一级e一片在线播放| 荡女安然的yin乱生活| 国产精品免费看香蕉| groupsex娇小紧的5一8| 无码日韩人妻av一区二区三区| 亚洲中文久久精品无码1| 热久久最新视频| 台湾佬在线观看| 鲁不死色原网站| 欧美一级在线视频| 再深点灬舒服灬太大了岳| 麻豆国产在线观看免费| 国产综合成人久久大片91| 一区二区三区免费在线观看| 日本免费色网站| 亚洲专区在线视频| 特级毛片s级全部免费| 四虎影院永久在线| 黄色三级三级免费看| 国产精品无码制服丝袜| 久久国产欧美日韩精品| 欧美高清69hd| 全高清特级毛片| 色老头成人免费视频天天综合| 国产毛多水多高潮高清| 91精品视频免费| 天天综合天天色| 一级美国片免费看| 日产精品1区至六区有限公司| 亚洲av无码片区一区二区三区| 色噜噜狠狠色综合日日| 国产日韩精品在线| 91欧美精品综合在线观看| 女人18毛片水真多免费看|