每日經(jīng)濟新聞 2026-05-27 10:24:01
每經(jīng)編輯|段煉
5月27日一早,雷軍在微博宣布,小米MiMo-V2.5系列做了一次大幅度的價格調整,最高降幅達到99%,不再區(qū)分上下文窗口。


小米:MiMo-V2.5系列API永久降價
對價格體系進行永久性翻新
@小米技術表示,過往幾個月,通過MiMo Orbit、百萬億Token創(chuàng)造者激勵計劃等活動,讓更多人有機會體驗MiMo,并解決真實的問題——這是MiMo在規(guī)模化應用道路上的第一步。而現(xiàn)在,隨著底層技術的不斷精進,終于可以做一件更徹底的事——對整個模型價格體系進行一次永久性翻新。
MiMo-V2.5系列API永久降價
相比原始API定價,新定價最高降幅可達99%,且不再區(qū)分上下文窗口長度。

本次調價于北京時間5月27日0:00正式生效,全球同步調整。
Token Plan計費體系優(yōu)化
加量不加價,用量提升至原5-8倍,解鎖更充沛的生產力。示例:在Agent或Code場景下,可用Token數(shù)量為:
計費規(guī)則調整,更加清晰易懂,所見即所得。

此外,無論當前套餐用量如何,所有已訂閱Token Plan且當前仍在有效期的用戶(包括參與百萬億Token創(chuàng)造者激勵計劃并獲得Token Plan的用戶,涵蓋Apache軟件基金會專屬福利用戶)的Credits額度將于北京時間5月27日0點全量重置,并按新計費規(guī)則執(zhí)行。
小米技術表示,本次價格調整背后,離不開團隊在推理系統(tǒng)上的持續(xù)優(yōu)化?;赟GLang HiCache完整支持SWA(Sliding Window Attention),將KV Cache在GPU顯存、CPU內存、SSD等多級存儲之間的數(shù)據(jù)搬運量降低至優(yōu)化前的近1/7,并將可緩存token數(shù)量提升至優(yōu)化前的近5倍,顯著提升了緩存命中率和推理效率。
同時,通過優(yōu)化專家并行方案、輸入長度分桶策略等,進一步提升了集群輸入吞吐能力,從而在保障服務質量的前提下持續(xù)降低單位 token 服務成本。后續(xù)將發(fā)布更加詳細的推理優(yōu)化技術Blog。
雷軍:未來三年
在AI領域投入600億元
值得注意的是,就在5月26日晚,雷軍在微博公布了小米集團一季度業(yè)績:
營收991億元,經(jīng)調整凈利潤61億元,全球月活超7.46億,AIoT平臺連接設備數(shù)超11億。智能電動汽車及AI等創(chuàng)新業(yè)務收入199億元,當季新車交付80856臺,490家汽車銷售門店。
研發(fā)投入90億元,同比增長33.4%,研發(fā)人員總數(shù)26048人,預計全年研發(fā)投入超400億。
Xiaomi MiMo-V2.5-Pro躋身Artificial Analysis榜單綜合智能指數(shù)、Agent指數(shù)全球開源模型并列第一,未來三年在AI領域投入600億元。
(免責聲明:文章內容和數(shù)據(jù)僅供參考,不構成投資建議。投資者據(jù)此操作,風險自擔。)
編輯|段煉 杜波
校對|程鵬
封面圖片:@雷軍

每日經(jīng)濟新聞綜合自@雷軍、@小米技術
如需轉載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關注每日經(jīng)濟新聞APP