2026-05-20 20:45:48
每經(jīng)記者|可楊 每經(jīng)編輯|楊翼
當(dāng)越來越多AI(人工智能)公司開始將“世界模型”寫入技術(shù)路線圖,視頻生成行業(yè)正經(jīng)歷新一輪升溫。
5月19日,在接受包括《每日經(jīng)濟(jì)新聞》記者在內(nèi)的媒體記者采訪時(shí),智象未來創(chuàng)始人、CEO(首席執(zhí)行官)梅濤反復(fù)強(qiáng)調(diào),當(dāng)前,行業(yè)距離真正意義上的世界模型還有很長(zhǎng)距離,“到今天為止,我們不會(huì)宣稱智象未來現(xiàn)在是一家世界模型公司。我認(rèn)為,市面上所有模型被稱作世界模型,說實(shí)話還有點(diǎn)早”。
公開資料顯示,智象未來是一家多模態(tài)生成式人工智能公司,成立于2023年,公司創(chuàng)始人、CEO梅濤是加拿大工程院外籍院士、原京東集團(tuán)副總裁。近日,智象未來宣布完成新一輪億元級(jí)融資,深創(chuàng)投、金浦投資等多家機(jī)構(gòu)參與。
在受訪過程中,梅濤圍繞視頻生成、原生全模態(tài)模型、具身智能與AI商業(yè)化等問題,系統(tǒng)談及了他對(duì)行業(yè)技術(shù)路徑、創(chuàng)業(yè)公司機(jī)會(huì)以及AI產(chǎn)業(yè)分層的判斷。
在梅濤看來,多模態(tài)生成技術(shù)遠(yuǎn)未收斂,而AI公司的競(jìng)爭(zhēng),也正在從模型能力轉(zhuǎn)向產(chǎn)品能力與場(chǎng)景化落地。
過去一年,世界模型成為AI行業(yè)高頻詞,但在梅濤看來,行業(yè)對(duì)于這一概念存在明顯誤讀。
“我發(fā)現(xiàn)很多人認(rèn)為世界模型是一個(gè)模型,其實(shí)這跟我們認(rèn)知的世界模型不太一樣。世界模型有不同路徑,將來也不是全世界只有一個(gè)模型,存在很多可能性?!泵窛赋?,真正的世界模型需要同時(shí)具備三類能力:對(duì)物理規(guī)律的理解與建模,對(duì)長(zhǎng)上下文因果關(guān)系的處理,以及與物理世界的多模態(tài)感知交互能力,包括觸覺、關(guān)節(jié)點(diǎn)運(yùn)動(dòng)、三維空間自由度等。“我們必須對(duì)世界模型的定義、世界模型的場(chǎng)景和科學(xué)規(guī)律保持一種敬畏之心?!?/p>
梅濤用一個(gè)具體場(chǎng)景來說明當(dāng)前的差距:讓一個(gè)機(jī)器人走進(jìn)房間,知道主人喜歡喝茶還是咖啡,然后完成取瓶、擰蓋、倒水、送杯這一系列動(dòng)作。“今天的機(jī)器人,離這個(gè)還很遙遠(yuǎn)?!?/p>
安全性,即在真實(shí)場(chǎng)景的穩(wěn)定運(yùn)營,也是梅濤強(qiáng)調(diào)的現(xiàn)實(shí)障礙之一。梅濤認(rèn)為,機(jī)器人如果在工廠或家里運(yùn)作,目前需要很強(qiáng)的安全保障。如果安全性不是百分之百,就像自動(dòng)駕駛一樣,“進(jìn)家里怎么保證人身安全、怎么保證不損壞貴重物品,還需要相當(dāng)長(zhǎng)的時(shí)間”。
對(duì)于通往世界模型的路徑,梅濤的判斷是,目前世界模型的架構(gòu)尚不明朗,未來可能并非只有一家公司來承擔(dān),不同公司會(huì)在各自的垂直場(chǎng)景中做出相對(duì)通用但實(shí)際上高度專用化的模型,“會(huì)開車的,會(huì)撿東西的,會(huì)跑步的機(jī)器人,應(yīng)該都是非常垂直的模型”。
“將來通往世界模型的路上,每個(gè)公司說自己是世界模型,我也能接受。但每個(gè)人不會(huì)做特別通用的事情?!泵窛a(bǔ)充道。
對(duì)于具身智能領(lǐng)域與視頻模型的關(guān)系,梅濤曾公開表示,“很多具身智能公司低估了視頻模型的重要性”。
梅濤指出,當(dāng)前,具身智能公司普遍采用的模型參數(shù)量“大概幾十億,不超過100億”,而這個(gè)量級(jí)遠(yuǎn)不足以支撐復(fù)雜場(chǎng)景下的泛化能力。
“如果真要做到世界模型,你要干很多活,怎么可能是一個(gè)小模型就能搞定?怎么可能采一些數(shù)據(jù)就能做到符合要求?”梅濤認(rèn)為,沒有足夠厚的底座模型,具身智能很難真正實(shí)現(xiàn)泛化。
對(duì)于當(dāng)前的技術(shù)路徑演進(jìn),梅濤認(rèn)為,多模態(tài)生成領(lǐng)域技術(shù)尚未收斂,“這是創(chuàng)業(yè)公司的機(jī)會(huì)。如果技術(shù)完全收斂,統(tǒng)一采用DiT框架,我們也不用做了,因?yàn)楦刹贿^大廠”。
公開資料顯示,DiT架構(gòu),全稱Diffusion Transformer,是一種將Transformer架構(gòu)作為骨干網(wǎng)絡(luò)應(yīng)用于擴(kuò)散模型的生成式人工智能架構(gòu),主要用于圖像和視頻生成任務(wù)。
“算法、數(shù)據(jù)、算力,三個(gè)都重要?!痹诿窛磥恚?dāng)算法框架固定之后,數(shù)據(jù)和算力的重要性才會(huì)上升,競(jìng)爭(zhēng)才會(huì)真正變成資源的比拼。但當(dāng)算法出現(xiàn)新的突破,既有的數(shù)據(jù)積累優(yōu)勢(shì)會(huì)被部分稀釋。這意味著,只要技術(shù)路線尚未確定,就仍然存在以算法創(chuàng)新?lián)Q取相對(duì)優(yōu)勢(shì)的空間。“如果一旦算法和架構(gòu)發(fā)生了變化,或者有新的架構(gòu)與新算法出現(xiàn)后,數(shù)據(jù)的重要性會(huì)有所降低?!?/p>
對(duì)于當(dāng)前視頻生成領(lǐng)域的競(jìng)爭(zhēng)格局,梅濤將其分為三層:擁有流量入口的平臺(tái)型企業(yè);做底層基座大模型的公司;以及大量做Agent(智能體)和行業(yè)應(yīng)用的公司。
梅濤表示,智象未來在第二層和第三層之間布局,既打造特色差異化模型,也開展行業(yè)應(yīng)用,智象未來不與大型模型廠商正面比拼底座模型,該領(lǐng)域投入成本極高?;诋?dāng)前體量,公司選擇聚焦特色領(lǐng)域,例如基于全新一代原生全模態(tài)架構(gòu)Unified Transformer(UiT)打造的圖像生成模型HiDream-O1-Image。其次,在視頻生成領(lǐng)域則做與商業(yè)場(chǎng)景緊密相關(guān)的內(nèi)容,例如商業(yè)營銷、影視創(chuàng)作等垂類場(chǎng)景應(yīng)用的視頻生成模型。
梅濤認(rèn)為,大模型提供的原子能力不等于最終產(chǎn)品體驗(yàn)。用戶,尤其是非開發(fā)者,無法直接調(diào)用模型接口,中間必須存在一個(gè)由API、技能封裝再到智能體構(gòu)成的中間層。
梅濤進(jìn)一步將AI公司的商業(yè)價(jià)值分為三層:最底層是算力價(jià)值(芯片、基建等),中間層是Token(詞元)價(jià)值;“大模型的費(fèi)用,長(zhǎng)線來看一定是水電、一定是基建,價(jià)格會(huì)非常公開、非常透明,也會(huì)越來越便宜;最上層是應(yīng)用落地帶來的商業(yè)價(jià)值,這取決于公司的商業(yè)模式?!泵窛J(rèn)為,創(chuàng)業(yè)公司若只賣平臺(tái)或Token,無法與大廠比拼資源與流量,必須把應(yīng)用層做厚,與客戶共創(chuàng)價(jià)值,才能在競(jìng)爭(zhēng)中建立壁壘。
對(duì)于創(chuàng)業(yè)公司與大廠的競(jìng)爭(zhēng),梅濤表示,大廠不可能覆蓋每個(gè)角落?!艾F(xiàn)在,沒有一家模型公司能夠滿足客戶的所有需求,這是行業(yè)共識(shí)。”
對(duì)于智象未來自身的定位,梅濤表示,公司長(zhǎng)期目標(biāo)是探索并構(gòu)建世界模型,但在當(dāng)下,智象未來更嚴(yán)謹(jǐn)?shù)貙⒆约憾x為一家原生多模態(tài)大模型公司,在邁向世界模型的過程中還是會(huì)先聚焦在圖像、視頻、3D交互這些多模態(tài)數(shù)據(jù)的生成、理解與建模上。
梅濤認(rèn)為,原生多模態(tài)一定會(huì)通往世界模型,但中間還有很長(zhǎng)的路?!笆澜缒P鸵欢ㄓ星逦x,包括其能力邊界、技術(shù)內(nèi)涵和應(yīng)用目標(biāo)。否則,相關(guān)討論容易停留在概念層面,不加定義的話說得不好聽就是‘耍流氓’,難以指向一個(gè)具備統(tǒng)一認(rèn)知和構(gòu)建能力的世界模型。”
封面圖片來源:每經(jīng)媒資庫
如需轉(zhuǎn)載請(qǐng)與《每日經(jīng)濟(jì)新聞》報(bào)社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報(bào)社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請(qǐng)作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
計(jì)量賦能產(chǎn)業(yè)生產(chǎn),四川省核醫(yī)療產(chǎn)業(yè)計(jì)量測(cè)試中心揭牌
瞄準(zhǔn)未來產(chǎn)業(yè),成都落下量子科技產(chǎn)業(yè)版圖關(guān)鍵一子
當(dāng)AI深度重塑經(jīng)濟(jì)增長(zhǎng)模式,我們?nèi)绾胃谩榜{馭”它?
蓉光閃耀,聚愛同行!150余場(chǎng)全國助殘日活動(dòng)開啟成都美好初夏
對(duì)話柏林駐華商務(wù)聯(lián)絡(luò)處首席代表李怡燃:中德經(jīng)貿(mào)合作向好,雙方企業(yè)攜手開發(fā)第三市場(chǎng)將是新趨勢(shì)
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP