要聞

13小時編碼、5天自主運行！Kimi K2.6開源“硬剛”閉源巨頭，長程戰(zhàn)力能否撕開AGI工業(yè)化新賽道？

2026-04-22 14:49:01

4月20日深夜，Kimi發(fā)布并開源K2.6模型，在編碼、智能體能力上升級，支持300個子Agent并行。多項測試顯示，K2.6在通用智能體、編程等方向有提升，但部分維度與頭部閉源模型有差距。Kimi正探索長周期、復雜任務能力，K2.6增強了自主化執(zhí)行能力。此外，Kimi估值3個月翻4倍，新一輪融資推進中，AGI行業(yè)競爭格局變化有待觀察。

每經記者｜李宇彤每經編輯｜杜宇

月之暗面（Moonshot AI）Kimi再次出招。

4月20日深夜，Kimi發(fā)布并開源Kimi K2.6模型。據(jù)其介紹，該模型具備行業(yè)領先（state-of-the-art）的代碼能力、長程任務執(zhí)行能力與Agent（智能體）集群能力。

K2.6延續(xù)了上一代K2.5的技術路線，在編碼與智能體能力上進一步升級。其Agent集群調度能力實現(xiàn)量級突破，最高可支持300個子Agent并行完成4000個協(xié)作步驟，大幅提升了在復雜長流程任務中的處理效率。

當前，大模型產業(yè)的競爭焦點正從“通用對話能力”轉向長周期、多工具協(xié)同的真實工作流落地，模型的長時間穩(wěn)定工作能力正成為核心賽點。

此前3月，月之暗面創(chuàng)始人楊植麟在2026年中關村論壇年會全體會議上指出，大模型的本質是將能源轉化為智能，規(guī)模化是AI發(fā)展的核心基礎，但規(guī)?；⒎潜┝Χ哑鏊懔εc能源，而是以提升效率為核心。對此，Kimi圍繞三大方向構建規(guī)?；呗裕篢oken（詞元）效率、長上下文、Agent集群，力求在有限資源下實現(xiàn)智能最大化。

支持13小時不間斷編碼，5天自主運行，深度檢索能力超越GPT-5.4

從多項權威基準測試結果來看，K2.6在通用智能體、編程、視覺智能三大方向上均有提升。

在博士級難度的“人類最后的考試（Humanity's Last Exam）”全工具測試中，K2.6以54.0%的得分登頂。在評估Agent深度檢索能力的DeepSearchQA測評中，以92.5%的得分領先GPT-5.4、Gemini 3.1 Pro以及Claude Opus 4.6。此外，在BrowseComp、OSWorld-Verified等智能體測評中，Kimi K2.6均展現(xiàn)出行業(yè)前列的成績。

圖片來源：月之暗面官方微信號

但與此同時，K2.6仍在部分維度與頭部閉源模型存在一定差距。SWE-bench多語言測試中，其得分略低于Claude Opus 4.6與Gemini 3.1 Pro。Toolathlon工具調度任務以及MathVision等視覺智能測評中，其表現(xiàn)與GPT-5.4也存在略微差距。

從本次K2.6能力提升的方向來看，其核心價值更多體現(xiàn)在：開源生態(tài)中正演進出能夠勝任長周期、復雜任務的能力。而這一技術方向，也已成為當下國產大模型行業(yè)的共同選擇。

近月來，OpenClaw（俗稱“小龍蝦”）等自主Agent應用快速崛起。區(qū)別于傳統(tǒng)對話式交互，這類場景要求AI跨應用不間斷自主運行，主動完成任務規(guī)劃、代碼執(zhí)行、跨平臺協(xié)同操作，對模型上下文承載、長期記憶連續(xù)性、多步驟推理穩(wěn)定性均提出了更高要求。

針對自主Agent賽道，Kimi K2.6也增強了Agent的自主化執(zhí)行能力，在OpenClaw、Hermes Agent等自動化任務場景表現(xiàn)突出。官方披露，其RL（Reinforcement Learning，強化學習）基礎設施團隊已基于K2.6 Agent實現(xiàn)連續(xù)5天不間斷自主穩(wěn)定運行，充分驗證了長時工作可靠性。

楊植麟曾在發(fā)布K2.5時介紹其Agent集群能力：“在K2.5上，我們從單個Agent進化到了Agent集群，從單個專家進化成了一個專業(yè)團隊?！彼唧w解釋道：K2.5會創(chuàng)建并協(xié)調一大群專項Agent并行工作，這些專項Agent本質上都是K2.5的分身，各自承擔不同的角色和子任務，沒有任何預設規(guī)則，所有的角色分配和任務拆解都是由K2.5現(xiàn)場即時決定。

迭代至K2.6，Agent集群架構完成全面擴容升級：支持調度不同技能特長的Agent進行互補協(xié)作、組合各項能力。架構上擴展至最多300個子Agent并行完成4000個協(xié)作步驟（K2.5為最多100個分身，并行處理1500個步驟），實現(xiàn)了更大規(guī)模的并行化。

代碼能力作為本次迭代核心亮點，本次更新中，長程編碼能力的提升是主要突破：K2.6支持不間斷編碼13小時，完成超過4000行代碼的編寫或修改，覆蓋Rust、Go、Python等編程語言，以及前端、運維、性能優(yōu)化等場景。通過代碼與視覺能力的深度融合，K2.6能夠交付專業(yè)級Web應用。

圖片來源：每經媒資庫

Kimi估值3個月已翻4倍楊植麟能否開辟AGI工業(yè)化新賽道？

在2026年中關村論壇年會后，楊植麟表達了他對Agent的發(fā)展洞察。他認為，與傳統(tǒng)對話式AI“即時問答”不同，真正受用戶信賴的Agent必須具備長時間持續(xù)工作的能力，能夠承接更復雜的任務。這背后需要突破訓練難度、數(shù)據(jù)積累、上下文承載等多重技術瓶頸。

楊植麟指出，這種能力的突破將帶來生產力的指數(shù)級提升，Agent或將成為生產力的核心載體，其產生的Token（詞元）在一定程度上等價于GDP（國內生產總值），長期甚至可能讓現(xiàn)有GDP實現(xiàn)數(shù)倍增長。

《每日經濟新聞》記者（以下簡稱“每經記者”）注意到，這一技術洞察直接體現(xiàn)在Kimi近期的迭代節(jié)奏中。繼K2.5首次引入Agent集群概念后，Kimi開始在更基礎的架構層面展開探索。

今年3月發(fā)布的技術報告中，團隊對大模型核心結構的殘差連接進行了重新設計，讓每一層可選擇性關注此前各層的輸出。這一改進獲得了美國企業(yè)家馬斯克“令人印象深刻”的評價，以及OpenAI前研究副總裁Jerry Tworek“深度學習2.0要來了”的點評。

此外，楊植麟在中關村論壇年會上預測了大模型訓練的下一階段：“越來越多的研究工作將由AI主導。未來每個研究員將配備海量的Token，由AI自動合成新任務、構建新環(huán)境、定義最優(yōu)獎勵函數(shù)，甚至自主探索全新網(wǎng)絡架構。在這一趨勢下，整個AI領域的研發(fā)速度將進一步加快?！?/p>

在技術快速演進的同時，Kimi在資本市場上得到了同步反饋。

市場知情人士此前向每經記者透露，3月14日Kimi估值已攀升至180億美元，3個月內翻了4倍，且新一輪10億美元融資正在推進中。不到3個月完成3輪融資，創(chuàng)下國內大模型連續(xù)融資紀錄，也讓Kimi成為國內估值最快突破百億美元的獨角獸企業(yè)。

估值上升的原因有兩方面。一方面，產品迭代與付費收入出現(xiàn)較快增長：2026年開年以來，K2.5模型、Kimi Claw先后上線并升級，適配多辦公平臺，帶動1月底以來20天收入超過2025年全年；Stripe數(shù)據(jù)顯示，其個人訂閱訂單1月環(huán)比增長8280%，2月再增長123.8%，進入全球榜單前十。另一方面，AGI賽道整體升溫，智譜、MiniMax港股上市后市值的上漲也為行業(yè)頭部玩家提供了估值支撐。

當前，AGI行業(yè)已從參數(shù)競賽轉向技術效率與落地能力的競爭，Agent時代的競爭規(guī)則正在被重新書寫，轉向如何做得更久、更穩(wěn)、更完整。Kimi以技術演進為主線，在這一過程中逐步確立自身定位。而大模型競爭格局是否因此生變，仍有待觀察各廠商后續(xù)的迭代節(jié)奏與生態(tài)建設能力。

封面圖片來源：每經媒資庫

如需轉載請與《每日經濟新聞》報社聯(lián)系。
未經《每日經濟新聞》報社授權，嚴禁轉載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

上一篇文章

對話大眾汽車乘用車品牌CEO施文韜：大眾正在評估中國作為出口基地的可能性

返回每經網(wǎng)首頁

下一篇文章

中國衛(wèi)星一季度凈虧損額同比擴大77% 今日一度跌逾8%