2026-02-12 20:34:23
AI大模型正從生成式邁向代理式,騰訊、阿里等廠商紅包大戰(zhàn),催生了對(duì)AI基礎(chǔ)設(shè)施的巨大需求,算力租賃廠商成為贏家。云服務(wù)商優(yōu)刻得宣布全線產(chǎn)品漲價(jià),亞馬遜云科技也上調(diào)價(jià)格。云服務(wù)商人士認(rèn)為,公有云漲價(jià)主因是推理需求爆發(fā)式增長(zhǎng),其中Agent需求是主要增長(zhǎng)因素,算力需求已轉(zhuǎn)變?yōu)橛?xùn)練+推理雙輪驅(qū)動(dòng)。AI推理將呈“云—邊—端協(xié)同”的混合架構(gòu)。
每經(jīng)記者|朱成祥 每經(jīng)編輯|陳旭
當(dāng)下,AI大模型正處于從生成式AI走向代理式AI的關(guān)鍵時(shí)刻。在此背景下,騰訊、阿里等廠商不惜大發(fā)紅包以爭(zhēng)奪用戶。
在大模型廠商紅包大戰(zhàn)尚未分出勝負(fù)之際,算力租賃廠商卻成為當(dāng)下實(shí)實(shí)在在的贏家。正如服飾品牌李維斯的故事那般,最終贏家不是在加州挖金子的礦工,而是賣牛仔褲的李維斯。在這一輪大模型紅包大戰(zhàn)中,算力租賃賺得盆滿缽滿。
近日,云服務(wù)商優(yōu)刻得宣布漲價(jià)。在被問及具體哪些產(chǎn)品漲價(jià)時(shí),優(yōu)刻得相關(guān)工作人員告訴《每日經(jīng)濟(jì)新聞》記者(以下簡(jiǎn)稱每經(jīng)記者),“全線產(chǎn)品(都會(huì)上漲),具體會(huì)根據(jù)客戶資源使用情況給出方案?!?/p>
2015年除夕,微信支付憑借搖一搖搶紅包,迅速爆發(fā)。而這一波,騰訊元寶發(fā)紅包之后,阿里巴巴、百度、字節(jié)跳動(dòng)也紛紛下場(chǎng)。
紅包大戰(zhàn),也使得對(duì)AI基礎(chǔ)設(shè)施的需求大增。
近日,國(guó)內(nèi)云服務(wù)廠商優(yōu)刻得宣布,因全球供應(yīng)鏈波動(dòng)持續(xù)加劇,核心硬件采購(gòu)等基礎(chǔ)設(shè)施成本出現(xiàn)顯著、結(jié)構(gòu)性的上漲,經(jīng)過慎重評(píng)估,公司決定自2026年3月1日起,對(duì)續(xù)簽及新簽用戶的全線產(chǎn)品與服務(wù)進(jìn)行價(jià)格上浮調(diào)整。
漲價(jià)緣由是硬件成本提升,還是推理側(cè)需求過于旺盛而導(dǎo)致供不應(yīng)求??jī)?yōu)刻得上述工作人員回復(fù)稱:“兩方面(原因)都有,主要是硬件成本上升,近期需求也在增加。當(dāng)前的價(jià)格調(diào)整,也是行業(yè)從‘資源出租’向‘能力服務(wù)’轉(zhuǎn)變的體現(xiàn)?!?/p>
不僅僅是國(guó)內(nèi)廠商在漲價(jià)。1月23日,全球云計(jì)算巨頭亞馬遜云科技宣布對(duì)其面向大模型訓(xùn)練的EC2機(jī)器學(xué)習(xí)容量塊實(shí)施約15%的價(jià)格上調(diào),這是AWS(亞馬遜云計(jì)算服務(wù))約20年來首次打破“只降不漲”的定價(jià)傳統(tǒng)。機(jī)器學(xué)習(xí)容量塊是AWS為應(yīng)對(duì)高性能GPU(圖形處理器)等稀缺計(jì)算資源供需失衡所推出的定制化服務(wù)模式,用戶可提前預(yù)訂指定型號(hào)的GPU實(shí)例,確保關(guān)鍵算力資源的穩(wěn)定供給。
開源證券認(rèn)為,AWS作為亞馬遜核心的公有云平臺(tái),此次漲價(jià)一方面再次確認(rèn)了全球AI算力需求端的高景氣度,另一方面從供給角度來看,AI云產(chǎn)業(yè)鏈資源稀缺性或日益凸顯。
對(duì)于公有云漲價(jià),云服務(wù)商派歐云(PPIO)工作人員告訴每經(jīng)記者,主要原因是推理需求的爆發(fā)式增長(zhǎng),其中Agent(智能體)的需求是主要增長(zhǎng)因素;其次推理成本的上漲動(dòng)力還來自服務(wù)質(zhì)量的持續(xù)提高,高SLA(服務(wù)等級(jí)協(xié)議)、低時(shí)延、長(zhǎng)上下文、多模態(tài)等服務(wù)會(huì)產(chǎn)生支付溢價(jià)。
如果說紅包大戰(zhàn)帶來的是用戶人數(shù)增加從而帶來算力需求提升,那么Agent的盛行,對(duì)推理算力需求的提升則更為龐大。
優(yōu)刻得上述工作人員表示:“算力需求已從訓(xùn)練驅(qū)動(dòng)的單一模式,轉(zhuǎn)變?yōu)橛?xùn)練+推理雙輪驅(qū)動(dòng)且推理占比不斷上升的新模式。Agent的實(shí)時(shí)交互、多輪推理、工具調(diào)用與自主規(guī)劃等能力,使得單次任務(wù)所需的推理次數(shù)呈指數(shù)級(jí)上升。”
PPIO工作人員也對(duì)每經(jīng)記者表示:“Agent的廣泛應(yīng)用放大了Token(詞元)的消耗,進(jìn)而推高算力需求,一方面Agent推理上下文逐漸增加到200K以上,另一方面由于計(jì)算復(fù)雜度與上下文長(zhǎng)度是平方關(guān)系,長(zhǎng)上下文對(duì)算力的需求呈指數(shù)級(jí)增長(zhǎng)。據(jù)我們估算,Agent場(chǎng)景下單用戶的Token消耗量是普通Chat的10倍至50倍,此外Agent對(duì)內(nèi)存的需求也在持續(xù)增加,主要體現(xiàn)在Agent工具的數(shù)據(jù)記憶需求?!?/p>
值得注意的是,AI推理不僅有云端,也有邊緣側(cè)、端側(cè)設(shè)備。那么,即時(shí)性的要求是否會(huì)助推邊緣側(cè)、端側(cè)AI推理需求增長(zhǎng)?
對(duì)此,PPIO工作人員表示:“至于邊緣和端側(cè),我認(rèn)為會(huì)增加部署,但會(huì)是“云—邊—端協(xié)同”的混合架構(gòu):實(shí)時(shí)性強(qiáng)、隱私要求高、網(wǎng)絡(luò)不穩(wěn)定的場(chǎng)景會(huì)下沉到端和邊緣,用小模型或本地推理保證響應(yīng);而需要最強(qiáng)通用能力、快速迭代的大模型能力,仍會(huì)集中在云端。關(guān)鍵不在把所有算力搬到端上,而在把任務(wù)鏈路切分得更合理?!?/p>
優(yōu)刻得工作人員也表示:“我們會(huì)根據(jù)客戶的需求來部署我們的產(chǎn)品和資源。根據(jù)不同業(yè)務(wù)場(chǎng)景對(duì)延遲、成本、合規(guī)性的差異化要求,靈活調(diào)度云端、邊緣與端側(cè)算力資源?!?/p>
封面圖片來源:每經(jīng)媒資庫(kù)
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
20cm速遞丨AI硬件端穩(wěn)居行情核心主線,科創(chuàng)芯片ETF國(guó)泰(589100)上一交易日凈流入超3.2億元
英偉達(dá)斥資百億元獲得Groq技術(shù)授權(quán),算力ETF——5G通信ETF(515050)年內(nèi)漲超100%
資金搶籌!同類費(fèi)率最低創(chuàng)業(yè)板人工智能ETF華夏(159381)強(qiáng)勢(shì)翻紅規(guī)模再創(chuàng)新高,近5日吸金超4億元
春節(jié)檔大模型競(jìng)爭(zhēng)火熱,Deepseek行情再起?創(chuàng)業(yè)板人工智能ETF國(guó)泰(159388)漲超2.5%
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP