《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業界動態 > MiniMax推出全球首個開源大規模混合架構的推理模型

MiniMax推出全球首個開源大規模混合架構的推理模型

2025-06-18
來源:IT之家

6 月 17 日消息,MiniMax 稀宇科技宣布將連續五天發布重要更新。今天第一彈是開源首個推理模型 MiniMax-M1。

000.png

根據官方介紹,MiniMax-M1 是世界上第一個開源的大規模混合架構的推理模型。MiniMax 表示:M1 在面向生產力的復雜場景中能力是開源模型中的最好一檔,超過國內的閉源模型,接近海外的最領先模型,同時又有業內最高的性價比。

官方博客還提到,基于兩大技術創新,MiniMax-M1 訓練過程高效得“超出預期”,只用了 3 周時間、512 塊 H800 GPU 就完成強化學習訓練階段,算力租賃成本僅 53.47 萬美元(IT之家注:現匯率約合 384.1 萬元人民幣),相比一開始的預期直接降低了一個數量級。

M1 有一個顯著的優勢是支持目前業內最高的 100 萬上下文的輸入,跟閉源模型里面的 Google Gemini 2.5 Pro 一樣,是 DeepSeek R1 的 8 倍,以及業內最長的 8 萬 Token 的推理輸出。

000.png

這主要得益于我們獨創的以閃電注意力機制為主的混合架構,從而在計算長的上下文輸入以及深度推理的時候顯著高效。例如,在用 8 萬 Token 深度推理的時候,只需要使用 DeepSeek R1 約 30% 的算力。這個特性使得我們在訓練和推理的時候都有很大的算力效率優勢。除此之外,我們提出了更快的強化學習算法 CISPO,通過裁剪重要性采樣權重(而非傳統 token 更新)提升強化學習效率。在 AIME 的實驗中,我們發現這比包括字節近期提出的 DAPO 等強化學習算法收斂性能快了一倍,顯著的優于 DeepSeek 早期使用的 GRPO。

000.png

得益于上述兩個技術創新,我們最終強化訓練過程非常高效,超出預期。實際上整個強化學習階段只用到 512 塊 H800 三周的時間,租賃成本只有 53.47 萬美金。這比一開始的預期少了一個數量級。我們在業內主流的 17 個評測集上詳細評測了 M1,具體的結果如下:

000.png

我們發現在軟件工程、長上下文與工具使用等面向生產力的復雜場景中,我們的模型具備顯著優勢。

MiniMax-M1-40k 和 MiniMax-M1-80k 在 SWE-bench 驗證基準上分別取得 55.6% 和 56.0% 的優異成績,這一成績略遜于 DeepSeek-R1-0528 的 57.6%,但顯著超越其他開源權重模型。

依托其百萬級上下文窗口,M1 系列在長上下文理解任務中表現卓越,不僅全面超越所有開源權重模型,甚至超越 OpenAI o3 和 Claude 4 Opus,全球排名第二,僅以微弱差距落后于 Gemini 2.5 Pro。

在代理工具使用場景(TAU-bench)中,MiniMax-M1-40k 同樣領跑所有開源權重模型,并戰勝 Gemini-2.5 Pro。

值得注意的是,MiniMax-M1-80k 在大多數基準測試中始終優于 MiniMax-M1-40k,這充分驗證了擴展測試時計算資源的有效性。詳細的技術報告,完整的模型權重可以在我們的官方 Hugging Face 和 GitHub 賬號下訪問。vLLM 和 Transformer 兩個開源項目提供了各自的推理部署支持,我們也正在和 SGLang 合作推進部署支持。因為相對高效的訓練和推理算力使用,我們在 MiniMax App 和 Web 上都保持不限量免費使用,并以業內最低的價格在官網提供 API。在 0-32k 的輸入長度的時候,輸入 0.8 元 / 百萬 token,輸出 8 元 / 百萬 token;在 32k-128k 的輸入長度的時候,輸入 1.2 元 / 百萬 token,輸出 16 元 / 百萬 token;在最長的 128k-1M 的輸入長度的時候,輸入 2.4 元 / 百萬 token,輸出 24 元 / 百萬 token。前面兩種模式都比 DeepSeek-R1 性價比更高,后面一種模式 DeepSeek 模型不支持。除了 M1 之外,接下來連續四個工作日,我們還準備了一些更新帶給大家,敬請期待。


Magazine.Subscription.jpg

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 黑色丝袜美腿美女被躁翻了| 中文字幕一区二区三区人妻少妇| a级大胆欧美人体大胆666| 李老汉的性生生活2| 国产在线精品一区二区在线看| va亚洲va日韩不卡在线观看| 日韩欧美一区黑人vs日本人| 四虎国产精品永久免费网址| 1024香蕉视频| 好男人好资源在线影视官网| 久久精品国产免费观看三人同眠| 深夜爽爽动态图无遮无挡| 国产ts最新人妖在线| 午夜伦伦影理论片大片| 夫妇交换性3中文字幕| 久久人午夜亚洲精品无码区| 欧美成人乱妇在线播放| 免费高清a级毛片在线播放| 高跟丝袜美女一级毛片| 国产精品视频永久免费播放| 一二三四视频日本高清| 日本大片免费一级| 亚洲中字慕日产2021| 滴着奶水做着爱中文字幕| 另类重口100页在线播放| 高清毛片aaaaaaaa**| 国产精品美女www爽爽爽视频| 一个人免费观看日本www视频| 日本丰满岳乱妇在线观看| 亚洲va久久久噜噜噜久久狠狠| 激情按摩系列片AAAA| 午夜三级黄色片| 萍萍偷看邻居海员打屁股| 国产日韩中文字幕| 91丨九色丨蝌蚪3p| 女同学下面粉嫩又紧多水| 久久91精品国产91久久小草| 日韩精品一区二区三区中文| 亚洲国产福利精品一区二区| 特黄熟妇丰满人妻无码| 加勒比一本大道香蕉在线视频|