2026-04-22 14:49:01
4月20日深夜,Kimi發(fā)布并開源K2.6模型,在編碼、智能體能力上升級,支持300個子Agent并行。多項測試顯示,K2.6在通用智能體、編程等方向有提升,但部分維度與頭部閉源模型有差距。Kimi正探索長周期、復雜任務能力,K2.6增強了自主化執(zhí)行能力。此外,Kimi估值3個月翻4倍,新一輪融資推進中,AGI行業(yè)競爭格局變化有待觀察。
每經記者|李宇彤 每經編輯|杜宇
月之暗面(Moonshot AI)Kimi再次出招。
4月20日深夜,Kimi發(fā)布并開源Kimi K2.6模型。據(jù)其介紹,該模型具備行業(yè)領先(state-of-the-art)的代碼能力、長程任務執(zhí)行能力與Agent(智能體)集群能力。
K2.6延續(xù)了上一代K2.5的技術路線,在編碼與智能體能力上進一步升級。其Agent集群調度能力實現(xiàn)量級突破,最高可支持300個子Agent并行完成4000個協(xié)作步驟,大幅提升了在復雜長流程任務中的處理效率。
當前,大模型產業(yè)的競爭焦點正從“通用對話能力”轉向長周期、多工具協(xié)同的真實工作流落地,模型的長時間穩(wěn)定工作能力正成為核心賽點。
此前3月,月之暗面創(chuàng)始人楊植麟在2026年中關村論壇年會全體會議上指出,大模型的本質是將能源轉化為智能,規(guī)模化是AI發(fā)展的核心基礎,但規(guī)?;⒎潜┝Χ哑鏊懔εc能源,而是以提升效率為核心。對此,Kimi圍繞三大方向構建規(guī)?;呗裕篢oken(詞元)效率、長上下文、Agent集群,力求在有限資源下實現(xiàn)智能最大化。
從多項權威基準測試結果來看,K2.6在通用智能體、編程、視覺智能三大方向上均有提升。
在博士級難度的“人類最后的考試(Humanity's Last Exam)”全工具測試中,K2.6以54.0%的得分登頂。在評估Agent深度檢索能力的DeepSearchQA測評中,以92.5%的得分領先GPT-5.4、Gemini 3.1 Pro以及Claude Opus 4.6。此外,在BrowseComp、OSWorld-Verified等智能體測評中,Kimi K2.6均展現(xiàn)出行業(yè)前列的成績。
圖片來源:月之暗面官方微信號
但與此同時,K2.6仍在部分維度與頭部閉源模型存在一定差距。SWE-bench多語言測試中,其得分略低于Claude Opus 4.6與Gemini 3.1 Pro。Toolathlon工具調度任務以及MathVision等視覺智能測評中,其表現(xiàn)與GPT-5.4也存在略微差距。
從本次K2.6能力提升的方向來看,其核心價值更多體現(xiàn)在:開源生態(tài)中正演進出能夠勝任長周期、復雜任務的能力。而這一技術方向,也已成為當下國產大模型行業(yè)的共同選擇。
近月來,OpenClaw(俗稱“小龍蝦”)等自主Agent應用快速崛起。區(qū)別于傳統(tǒng)對話式交互,這類場景要求AI跨應用不間斷自主運行,主動完成任務規(guī)劃、代碼執(zhí)行、跨平臺協(xié)同操作,對模型上下文承載、長期記憶連續(xù)性、多步驟推理穩(wěn)定性均提出了更高要求。
針對自主Agent賽道,Kimi K2.6也增強了Agent的自主化執(zhí)行能力,在OpenClaw、Hermes Agent等自動化任務場景表現(xiàn)突出。官方披露,其RL(Reinforcement Learning,強化學習)基礎設施團隊已基于K2.6 Agent實現(xiàn)連續(xù)5天不間斷自主穩(wěn)定運行,充分驗證了長時工作可靠性。
楊植麟曾在發(fā)布K2.5時介紹其Agent集群能力:“在K2.5上,我們從單個Agent進化到了Agent集群,從單個專家進化成了一個專業(yè)團隊?!彼唧w解釋道:K2.5會創(chuàng)建并協(xié)調一大群專項Agent并行工作,這些專項Agent本質上都是K2.5的分身,各自承擔不同的角色和子任務,沒有任何預設規(guī)則,所有的角色分配和任務拆解都是由K2.5現(xiàn)場即時決定。
迭代至K2.6,Agent集群架構完成全面擴容升級:支持調度不同技能特長的Agent進行互補協(xié)作、組合各項能力。架構上擴展至最多300個子Agent并行完成4000個協(xié)作步驟(K2.5為最多100個分身,并行處理1500個步驟),實現(xiàn)了更大規(guī)模的并行化。
代碼能力作為本次迭代核心亮點,本次更新中,長程編碼能力的提升是主要突破:K2.6支持不間斷編碼13小時,完成超過4000行代碼的編寫或修改,覆蓋Rust、Go、Python等編程語言,以及前端、運維、性能優(yōu)化等場景。通過代碼與視覺能力的深度融合,K2.6能夠交付專業(yè)級Web應用。
圖片來源:每經媒資庫
在2026年中關村論壇年會后,楊植麟表達了他對Agent的發(fā)展洞察。他認為,與傳統(tǒng)對話式AI“即時問答”不同,真正受用戶信賴的Agent必須具備長時間持續(xù)工作的能力,能夠承接更復雜的任務。這背后需要突破訓練難度、數(shù)據(jù)積累、上下文承載等多重技術瓶頸。
楊植麟指出,這種能力的突破將帶來生產力的指數(shù)級提升,Agent或將成為生產力的核心載體,其產生的Token(詞元)在一定程度上等價于GDP(國內生產總值),長期甚至可能讓現(xiàn)有GDP實現(xiàn)數(shù)倍增長。
《每日經濟新聞》記者(以下簡稱“每經記者”)注意到,這一技術洞察直接體現(xiàn)在Kimi近期的迭代節(jié)奏中。繼K2.5首次引入Agent集群概念后,Kimi開始在更基礎的架構層面展開探索。
今年3月發(fā)布的技術報告中,團隊對大模型核心結構的殘差連接進行了重新設計,讓每一層可選擇性關注此前各層的輸出。這一改進獲得了美國企業(yè)家馬斯克“令人印象深刻”的評價,以及OpenAI前研究副總裁Jerry Tworek“深度學習2.0要來了”的點評。
此外,楊植麟在中關村論壇年會上預測了大模型訓練的下一階段:“越來越多的研究工作將由AI主導。未來每個研究員將配備海量的Token,由AI自動合成新任務、構建新環(huán)境、定義最優(yōu)獎勵函數(shù),甚至自主探索全新網(wǎng)絡架構。在這一趨勢下,整個AI領域的研發(fā)速度將進一步加快?!?/p>
在技術快速演進的同時,Kimi在資本市場上得到了同步反饋。
市場知情人士此前向每經記者透露,3月14日Kimi估值已攀升至180億美元,3個月內翻了4倍,且新一輪10億美元融資正在推進中。不到3個月完成3輪融資,創(chuàng)下國內大模型連續(xù)融資紀錄,也讓Kimi成為國內估值最快突破百億美元的獨角獸企業(yè)。
估值上升的原因有兩方面。一方面,產品迭代與付費收入出現(xiàn)較快增長:2026年開年以來,K2.5模型、Kimi Claw先后上線并升級,適配多辦公平臺,帶動1月底以來20天收入超過2025年全年;Stripe數(shù)據(jù)顯示,其個人訂閱訂單1月環(huán)比增長8280%,2月再增長123.8%,進入全球榜單前十。另一方面,AGI賽道整體升溫,智譜、MiniMax港股上市后市值的上漲也為行業(yè)頭部玩家提供了估值支撐。
當前,AGI行業(yè)已從參數(shù)競賽轉向技術效率與落地能力的競爭,Agent時代的競爭規(guī)則正在被重新書寫,轉向如何做得更久、更穩(wěn)、更完整。Kimi以技術演進為主線,在這一過程中逐步確立自身定位。而大模型競爭格局是否因此生變,仍有待觀察各廠商后續(xù)的迭代節(jié)奏與生態(tài)建設能力。
封面圖片來源:每經媒資庫
如需轉載請與《每日經濟新聞》報社聯(lián)系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP