每日經(jīng)濟新聞 2026-02-12 18:02:42
每經(jīng)編輯|蒙錦濤
2025年,可謂是AI智能體真正興起的一年。而2026年,或?qū)⒊蔀?/span>AI智能體大爆發(fā)的一年。在此背景下,“推理”仿佛成了各大芯片廠商關(guān)注的焦點。英偉達200億美元“收編”Grop,盡顯推理大時代對“效率價值”的重視。
國內(nèi)廠商方面,不少廠商推出推理專用算力芯片,甚至有廠商只專注于推理芯片。近日,這個領(lǐng)域的重磅玩家愛芯元智(0600.HK)登陸港交所,成為“中國邊緣AI芯片第一股”。
推理芯片可分為云端、邊緣側(cè)和端側(cè)三大類,邊緣側(cè)和端側(cè)為推理芯片重要組成部分。而愛芯元智則是國內(nèi)邊緣側(cè)、端側(cè)推理芯片的佼佼者。
在這場推理大時代,誰能提供性能、功耗和成本最優(yōu)解,誰就將掌握下一個時代的鑰匙。而愛芯元智,則已經(jīng)在邊緣、端側(cè)推理領(lǐng)域占據(jù)了領(lǐng)先身位。
推理大時代
雙軌驅(qū)動構(gòu)建技術(shù)護城河
ChatGPT的橫空出世,開啟了人類的大模型時代,也開啟了算力芯片的大爆發(fā)。而隨著AI不斷發(fā)展、迭代,對算力芯片也提出了新的要求。
2025年,智能體和AI Skills成了新的熱點。如果說,大模型是人工智能的大腦,那智能體和AI Skills則給人工智能裝上了手和腳。不僅能夠“生成”,還能真正地幫助人類干活,成為生產(chǎn)力工具。
頭豹研究院認(rèn)為,盡管生成式AI本身已經(jīng)極大地提升了內(nèi)容生成的效率和質(zhì)量,但Agentic AI(代理型AI)作為其更高級的形態(tài),通過引入自主性、目標(biāo)導(dǎo)向和多步驟執(zhí)行能力,在生成式AI的基礎(chǔ)上創(chuàng)造了全新的、更深層次的價值。
而Agentic AI的盛行,讓AI行業(yè)的目光從訓(xùn)練轉(zhuǎn)向推理。如何搭建一個好用的智能體,如何讓人們使用智能體創(chuàng)造價值成為關(guān)鍵。
在此背景下,業(yè)界對AI芯片的需求并非一味地堆疊算力,好用、效率、低延時成為關(guān)鍵。另據(jù)頭豹研究院,依托小型模型能力躍升,執(zhí)行GPT-3.5級別的系統(tǒng)推理成本在2022年11月至2024年10月間驟降280多倍。硬件層面,年化成本降幅達30%,能效年提升率達40%。據(jù)悉,常規(guī)模型API輸出價格已經(jīng)降至10元百萬Tokens以下。甚至,已有廠商喊出百萬Tokens一分錢的口號。
因此,如何在有限的功耗和預(yù)算下釋放大模型的能力,成為決定AI普惠與否的關(guān)鍵瓶頸。面對邊緣終端設(shè)備在性能、功耗與成本上的“不可能三角”難題,愛芯元智通過底層架構(gòu)創(chuàng)新,構(gòu)建了堅實的技術(shù)護城河。
公司的核心競爭力源于其獨特的“雙軌開發(fā)模式”:一方面縱向迭代升級IP核技術(shù),另一方面橫向拓展應(yīng)用領(lǐng)域。這一模式的兩大技術(shù)支柱是公司自主研發(fā)的愛芯通元(AXNeutron)混合精度NPU(神經(jīng)網(wǎng)絡(luò)處理器)和愛芯智眸(AXProton)AI-ISP(人工智能圖像信號處理器)。
愛芯通元混合精度NPU是破解“不可能三角”的關(guān)鍵。傳統(tǒng)GPU方案雖通用,但在功耗和成本上難以適應(yīng)邊緣場景。愛芯元智的NPU采用多線程、異構(gòu)式多核設(shè)計,將內(nèi)存與處理單元緊密集成,并通過兩大機制實現(xiàn)效率躍升:一是優(yōu)化神經(jīng)網(wǎng)絡(luò)計算以減少計算負(fù)荷,二是通過內(nèi)存層次設(shè)計最小化不必要的數(shù)據(jù)傳輸。
邊緣推理另一特性在于,不同應(yīng)用場景下對算力的需求千差萬別。而愛芯元智的優(yōu)勢在于,其NPU能根據(jù)不同的計算需求動態(tài)選擇INT4、INT8、INT16等數(shù)值精度,對內(nèi)存密集型任務(wù)采用低精度,對精度敏感計算則保持高精度,在確保精度的同時顯著提升計算效率。
這一架構(gòu)創(chuàng)新帶來了驚人的能效比,根據(jù)灼識咨詢數(shù)據(jù),該NPU每瓦吞吐量比基于GPU架構(gòu)的傳統(tǒng)解決方案提升高達10倍。這一設(shè)計理念不僅確保穩(wěn)定的低延時表現(xiàn),更能在邊緣設(shè)備的功耗限制下高效運行復(fù)雜AI模型。
深耕邊緣側(cè)、端側(cè)落地
未來空間廣闊
目前,“推理芯片未來增長會大幅快于訓(xùn)練芯片”已成為各方共識。那么,推理芯片賽道內(nèi)部又將如何演繹呢?
根據(jù)愛芯元智招股書,全球AI推理芯片2024年至2030年的年復(fù)合增長率預(yù)計為31.0%。其中,云端推理、邊緣推理和端側(cè)推理年復(fù)合增長率預(yù)計分別為36.3%、42.2%和20.4%??梢钥闯觯磥磉吘壨评戆l(fā)展空間極為廣闊。
至2030年,預(yù)測邊緣推理全球市場規(guī)模為7262億元,端側(cè)推理全球市場規(guī)模為8861億元。兩大市場規(guī)模合計超1.5萬億元。
邊緣AI推理芯片部署于靠近數(shù)據(jù)源的邊緣服務(wù)器、網(wǎng)關(guān)或基站,執(zhí)行實時本地推理,需要在高性能與功效之間保持謹(jǐn)慎平衡,以確保低延遲、數(shù)據(jù)安全及運行穩(wěn)定性。端側(cè)AI推理芯片直接應(yīng)用于終端設(shè)備,例如智能手機等消費電子產(chǎn)品、智能汽車及智能家電等。
愛芯元智深耕視覺AI端側(cè)推理多年。愛芯元智2024年以超900萬顆的出貨量排名前五,市場份額為6.8%。值得注意的是,其在中高端芯片細(xì)分市場以24.1%的份額高居榜首。隨著市場需求日益向中高端芯片傾斜,愛芯元智認(rèn)為其有能力在未來鞏固當(dāng)前的領(lǐng)先地位。
在國內(nèi)邊緣AI市場,雖然當(dāng)下仍處于早期階段,但對數(shù)據(jù)安全和本地化處理日益增長的需求預(yù)計將推動市場快速擴張。據(jù)悉,愛芯元智在這一新興領(lǐng)域出貨量位居第三,2024年出貨量達10萬顆,市場份額為12.2%。
智能汽車芯片方面,截至2025年9月30日,愛芯元智智能汽車SoC累計出貨量已超51萬顆,并獲得多家頭部車企及Tier 1的定點項目。
此外,愛芯元智自研的面向高階智能駕駛應(yīng)用的旗艦芯片產(chǎn)品M97已于近日回片并順利點亮。這顆芯片是公司智能汽車業(yè)務(wù)邁向高端化的核心產(chǎn)品,也是繼M55H、M76H、M57系列之后的全新一代智能汽車芯片,凝結(jié)了公司在芯片設(shè)計和研發(fā)領(lǐng)域的核心創(chuàng)新成果。
值得注意的是,AI芯片的使用不僅需要硬件能力,更考驗軟硬件生態(tài)系統(tǒng)。算力上的領(lǐng)先,可能被競爭對手追趕,但生態(tài)系統(tǒng)的構(gòu)建,將成為AI芯片廠商牢不可破的護城河。
據(jù)悉,通過提供從芯片到軟件工具鏈的完整解決方案,破局云端依賴,深耕邊緣側(cè)、端側(cè)應(yīng)用落地。公司的核心優(yōu)勢在于其提供了一套完整的以芯片為核心的“交鑰匙”方案。其自研的Pulsar2工具鏈,集成了模型轉(zhuǎn)換、量化與編譯等功能,能夠讓開發(fā)者高效地將主流AI模型部署在愛芯元智的SoC上。
展望未來,隨著AI大模型在邊緣側(cè)的應(yīng)用加速落地,以及智能輔助駕駛對合規(guī)與成本的更高要求,愛芯元智憑借其“高智價比”的平臺化能力和AI芯片及配套方案,有望在資本市場的助力下,進一步鞏固其在AI感知與邊緣計算領(lǐng)域的護城河,并在重構(gòu)全球邊緣算力格局的進程中釋放出巨大的長期產(chǎn)業(yè)價值。
(文章內(nèi)容僅供參考,不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險自擔(dān)。)
編輯|蒙錦濤
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP