每日經濟新聞 2024-09-20 16:43:20
“前期更多出現(xiàn)的是通用大模型,無所不能,但缺乏深度無法滿足具體需求。因為預期缺少回報,市場對通用大模型的投資越來越謹慎,但同時越來越看好在具體領域的發(fā)展,因此,所謂‘下半場’的重心應該在垂直大模型,比如醫(yī)療、教育、交通或者某個制造業(yè)垂類。”
每經記者|楊棄非 每經編輯|楊歡
圖片來源:攝圖網_402624474
短短一年時間,國內大模型從“百模大戰(zhàn)”,到如今被認為格局漸成。而“牌桌”上僅剩“大模型五虎”和互聯(lián)網大廠等少數(shù)“牌手”。越來越多的人開始發(fā)問,有關大模型競爭的“下半場”是否正在逼近?
在9月19日由成都市政府港澳辦主辦的“智匯天府AI啟航”蓉港澳三地交流活動上,電子科技大學(深圳)高等研究院執(zhí)行院長湯志偉在接受《每日經濟新聞》記者采訪時,對此論斷的態(tài)度顯得較為謹慎。在他看來,從技術上講,現(xiàn)有大模型并不夠成熟、且仍在快速發(fā)展,相關技術還需要不斷創(chuàng)新,難論“下半場”的出現(xiàn)。
但反觀應用層面,一些改變確實正在發(fā)生。“前期更多出現(xiàn)的是通用大模型,無所不能,但缺乏深度無法滿足具體需求。因為預期缺少回報,市場對通用大模型的投資越來越謹慎,但同時越來越看好在具體領域的發(fā)展,因此,所謂‘下半場’的重心應該在垂直大模型,比如醫(yī)療、教育、交通或者某個制造業(yè)垂類。”而在他看來,這也將是我國在大模型領域能夠快速產生價值的重要方向。
自ChatGPT3.5問世以來,國產大模型層出不窮,有人統(tǒng)計,至少有300余個國產大模型已對外發(fā)布。但從話題度上看,似乎尚未出現(xiàn)絕對超越ChatGPT的國產大模型。
湯志偉指出,在通用大模型領域,美國優(yōu)勢較為明顯,我國還處于跟隨和學習階段。但在垂直大模型領域,因為我國場景更加豐富,有助于對大模型進行垂直場景訓練,更好地促進大模型的性能評估和部署落地。
他格外強調“實體經濟”的價值。“大模型最終目的是要為大家解決實際問題,它不僅要能推動經濟轉型,還要能帶來收益。因此,應用場景對于大模型來說十分重要。因為我國非常強調實體經濟和數(shù)字經濟的深度融合發(fā)展,且實體經濟是我國的強項,因此,在這一點上,我國擁有其他國家難以比擬的優(yōu)勢。”
向垂直大模型深入,也有助于解決企業(yè)智能化改造過程中面臨的成本問題。
湯志偉特別提到了去年國內的“百模大戰(zhàn)”。在他看來,通用大模型領域,主要仍需靠世界級的頂尖龍頭企業(yè)進行突破,并向外開源共享。
而對于大部分面向行業(yè)細分應用場景的小型公司來說,無須重走高成本研發(fā)的道路,更多資源可以投向訓練垂直大模型,使其能符合企業(yè)獨特的發(fā)展需要。從這個意義上說,不同企業(yè)能開發(fā)出大量的行業(yè)垂直大模型。這一思路能降低企業(yè)使用大模型的成本,政府也應出臺相應政策鼓勵這類行業(yè)垂直大模型的開發(fā)。
垂直大模型的發(fā)展還將推動國內大模型行業(yè)形成新的格局。在當天活動上,來自港澳的專家均提到對于推進與成都在人工智能領域的科研和產業(yè)合作的期望,大模型也是雙方關注的焦點。
如湯志偉所說,基于超算中心的平臺優(yōu)勢,成都算力水平在全國名列前茅,而成都萬億級電子信息產業(yè)中,不少環(huán)節(jié)與人工智能發(fā)展緊密相關,多所高校也為當?shù)胤e累了大量電子信息領域的人才。更重要的一點是,不同于港澳金融服務業(yè)的比較優(yōu)勢,成都在發(fā)展實體經濟上明顯更勝一籌,雙方合作可以推動大模型的快速發(fā)展。
但同時,大模型發(fā)展也面臨多重掣肘。
無論是通用大模型還是垂直大模型,都需要強大算力支撐。而湯志偉提到,尤其是我國芯片面臨“卡脖子”以后,算力資源的獲得難度進一步增大。目前,國內已經有公司進行科技攻關和市場轉化,提升算力供給能力,但一來其與國外相比差距仍然不小,二來也需要進一步提升芯片性能、降低價格,讓更多實體經濟企業(yè)“用得起、用得上”。
而在聚焦解決芯片“卡脖子”問題的基礎上,他還提醒,要注意整個生態(tài)的完善。
“計算芯片不是孤立的,與之相關的還有相應的軟硬件驅動、軟件開發(fā)框架、操作系統(tǒng)、數(shù)據庫、硬件環(huán)境等關鍵技術。”他指出,目前,我國對各環(huán)節(jié)的突破并不同步,部分器件不匹配當下所需,而各環(huán)節(jié)之間也存在不匹配的問題。因此,即便相關芯片單看性能或許已經接近甚至達到國際一流水平,但生態(tài)缺失導致整體效應和系統(tǒng)效應不足,很多環(huán)節(jié)還是以進口為主。
這還可能造成一種“惡性循環(huán)”。如湯志偉分析,通過數(shù)十年的使用,這些主要依賴進口的環(huán)節(jié)得以創(chuàng)新迭代并實現(xiàn)發(fā)展,相比之下,國產化環(huán)節(jié)則剛起步,同樣需要經歷創(chuàng)新迭代的過程。我們在環(huán)境“倒逼”下可能縮短周期,但無論如何要“先用起來”。
總而言之,軟硬件驅動、軟件開發(fā)框架、操作系統(tǒng)、數(shù)據庫和其他硬件環(huán)節(jié)的突破也應同步推進。而若放在信創(chuàng)產業(yè)下來講,同樣需要一種整體性的思路,“現(xiàn)在是部分局部問題解決了,但只有整體問題解決了,才能算是真正解決問題。”
而當談及國產大模型的迭代時,湯志偉還提到數(shù)據方面的難點。他指出,大量高質量訓練數(shù)據是提升大模型準確性和廣泛適用性的關鍵因素。我們在準備高質量數(shù)據的時候,既要保證數(shù)據本身的準確性,還要考慮數(shù)據的多樣性和代表性。這樣才能更好地消除大模型普遍存在的偏見問題。
在國家“數(shù)據二十條”基礎上,2024年1月,國家數(shù)據局出臺的《“數(shù)據要素×”三年行動計劃(2024—2026年)》明確提出了數(shù)據要素的放大、疊加、倍增作用,以及帶動數(shù)據要素高質量供給、合規(guī)高效流通,這為各行各業(yè)的發(fā)展提供了堅實的數(shù)據政策支持。湯志偉認為,這對于我國數(shù)據規(guī)模和質量的提升均將起到重要作用,也將是推動大模型快速發(fā)展的又一關鍵利好。
如需轉載請與《每日經濟新聞》報社聯(lián)系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP