商訊推薦

全球SOTA編程模型MiniMax M2.5上線重新定義Agent2.0時(shí)代

2026-02-13 11:12:43

2026年春節(jié)前夕，MiniMax正式上線新一代文本模型MiniMax M2.5。當(dāng)各家大模型廠商圍繞“春節(jié)檔”展開密集發(fā)布與營銷攻勢(shì)，這款定位為“原生Agent生產(chǎn)級(jí)模型”的產(chǎn)品，正式加入這場被業(yè)界稱為“AI諸神之戰(zhàn)”的競爭。

盡管有著編程、工具調(diào)用、辦公等生產(chǎn)力場景全球SOTA成績，這家在資本市場備受矚目的公司卻想摒棄參數(shù)規(guī)模與模型榜單的簡單比拼，在硅谷科技圈打開另一種敘事：中國大模型重新定義Agent2.0時(shí)代。

10B激活參數(shù)跑出旗艦成績

在編程能力方面，M2.5在權(quán)威榜單SWE-Bench Verified得分80.2%、Multi-SWE-Bench得分51.3%，較上一代顯著提升；在Multi-SWE-Bench等多語言復(fù)雜環(huán)境中超越Opus 4.6，達(dá)到了行業(yè)較好的水平。更重要的是，模型展現(xiàn)出“原生Spec能力”——在編碼前主動(dòng)拆解架構(gòu)與功能規(guī)劃，更接近真實(shí)架構(gòu)師的工作模式。

工具調(diào)用和搜索能力方面，模型能夠自動(dòng)處理復(fù)雜任務(wù)，在BrowseComp、Wide Search等多項(xiàng)Agent任務(wù)中以更低的輪次消耗取得了更優(yōu)的效果，相較于上一代模型表現(xiàn)提升20% ，達(dá)到了行業(yè)頂尖水平。

辦公場景中，在 Word、PPT、Excel 金融建模等 Workspace 高階場景中取得了顯著的能力提升，在測(cè)評(píng)框架GDPval-MM與主流模型的對(duì)比中取得了 59.0%的平均勝率。

極致推理重構(gòu)Agent經(jīng)濟(jì)

性能之外，M2.5的另一核心亮點(diǎn)在于極致的推理速度與成本控制。M2.5-lightning版本支持100 TPS以上輸出速度，是主流模型的2倍左右；輸入價(jià)格約0.3美元/百萬Token，輸出約2.4美元/百萬Token。按每秒輸出100 Token計(jì)算，連續(xù)運(yùn)行一小時(shí)成本約1美元；若按50 Token計(jì)算，成本約0.3美元。

這意味著1萬美元理論上可支持4個(gè)Agent連續(xù)工作一年。MiniMax方面認(rèn)為，當(dāng)性能與成本不再構(gòu)成約束，Agent規(guī)?；渴鸬慕?jīng)濟(jì)模型將發(fā)生根本變化。

獨(dú)創(chuàng)Agent RL支撐高速進(jìn)化

過去108天，MiniMax從M2、M2.1迭代至M2.5，在SWE-Bench Verified成績從69.4提升至80.2，進(jìn)步曲線在同業(yè)中尤為陡峭。團(tuán)隊(duì)將這一躍遷歸因于大規(guī)模Agent強(qiáng)化學(xué)習(xí)（RL Scaling）。

其自研Forge框架通過解耦訓(xùn)練引擎與Agent，實(shí)現(xiàn)對(duì)任意Agent腳手架和工具的泛化優(yōu)化，并通過異步調(diào)度與樹狀合并策略實(shí)現(xiàn)約40倍訓(xùn)練加速。同時(shí)，在算法層面采用CISPO優(yōu)化與過程獎(jiǎng)勵(lì)機(jī)制，緩解長上下文場景中的信用分配問題，并將“任務(wù)真實(shí)耗時(shí)”納入獎(jiǎng)勵(lì)函數(shù)，在效果與響應(yīng)速度之間取得平衡。

M2.5已于2月12日在 MiniMax Agent上線，并于13日全球開源支持本地化部署。不到一天，來自全世界的用戶已經(jīng)在MiniMax Agent上構(gòu)建了1萬多個(gè)專家，且仍在快速增長。

MiniMax表示，希望在持續(xù)提升模型能力的同時(shí)，構(gòu)建一個(gè)可持續(xù)擴(kuò)展的Agent生態(tài)——Agent Universe。當(dāng)模型能力、泛化性和成本都不再是瓶頸，Agent滲透到工作和生活的各個(gè)角落——從編程、辦公到創(chuàng)作、娛樂，大幅促進(jìn) Agentic 應(yīng)用的進(jìn)一步發(fā)展。

責(zé)編方奕奕

特別提醒：如果我們使用了您的圖片，請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

上一篇文章

機(jī)器人板塊低開回升，機(jī)器人ETF易方達(dá)（159530）盤中凈申購近3000萬份

返回每經(jīng)網(wǎng)首頁

下一篇文章

智能駕駛概念再度拉升興民智通漲停

相關(guān)文章