每日經(jīng)濟(jì)新聞 2025-12-30 20:00:26
一個越來越明顯的共識是,AI產(chǎn)業(yè)正從早期的技術(shù)模型探索,進(jìn)入以“應(yīng)用創(chuàng)新”“產(chǎn)業(yè)深耕”為核心的新階段,深度賦能政務(wù)、醫(yī)療、工業(yè)制造、交通、能源等關(guān)鍵領(lǐng)域,持續(xù)催生新業(yè)態(tài)、新模式。
每經(jīng)記者|劉旭強(qiáng) 每經(jīng)編輯|劉艷美
“個人級推理設(shè)備(AI PC)將從概念走向現(xiàn)實(shí)。”12月30日,第三屆全國先進(jìn)計(jì)算技術(shù)創(chuàng)新大賽在成都舉行,中國工程院院士、清華大學(xué)計(jì)算機(jī)系教授鄭緯民在現(xiàn)場分享中提到,隨著AI大模型向普惠化、低成本方向發(fā)展,部署成本顯著下降,讓邊緣側(cè)、端側(cè)的低成本大模型應(yīng)用從構(gòu)想變成現(xiàn)實(shí)。
沿著這一思路,與會學(xué)界、企業(yè)及機(jī)構(gòu)代表聚焦“成本普惠化”“應(yīng)用垂直化”“產(chǎn)業(yè)生態(tài)化”等方向,探討AI如何與千行百業(yè)深度融合,并推動算力價值轉(zhuǎn)化為現(xiàn)實(shí)生產(chǎn)力。
一個越來越明顯的共識是,AI產(chǎn)業(yè)正從早期的技術(shù)模型探索,進(jìn)入以“應(yīng)用創(chuàng)新”“產(chǎn)業(yè)深耕”為核心的新階段,深度賦能政務(wù)、醫(yī)療、工業(yè)制造、交通、能源等關(guān)鍵領(lǐng)域,持續(xù)催生新業(yè)態(tài)、新模式。

圖片來源:主辦方提供
“現(xiàn)在智算算力需求非常旺盛,租GPU做AI推理,得提前兩個星期排隊(duì)預(yù)約。”鄭緯民表示,曾經(jīng)由“模型訓(xùn)練”主導(dǎo)的算力需求,如今已經(jīng)轉(zhuǎn)向“推理”,簡單說就是AI從“學(xué)習(xí)成長”階段,進(jìn)入了“給人干活”的實(shí)用階段,而這也催生出爆發(fā)式的算力缺口。
要讓AI高效“干活”,選對芯片是關(guān)鍵。相較于CPU,更擅長高效矩陣運(yùn)算和高速數(shù)據(jù)讀寫的GPU脫穎而出。
不過高效的GPU也面臨“煩惱”,其內(nèi)存主要用于存儲兩類數(shù)據(jù),一是訓(xùn)練所得的模型參數(shù),二是推理過程中產(chǎn)生的中間結(jié)果。隨著Kimi等支持?jǐn)?shù)百萬字上下文的模型走紅,AI大模型趨向“數(shù)據(jù)更多、模型更大、上下文更長”,但這也帶來了極高的推理負(fù)載,導(dǎo)致用戶量激增時頻繁宕機(jī)。
鄭緯民以熱門論文的推理需求為例,“十萬個用戶同時查詢,如果每個用戶都單獨(dú)存儲文章原文和推理中間結(jié)果,AI必然不堪重負(fù)。”
鄭緯民提到,業(yè)內(nèi)的破解思路是“公共數(shù)據(jù)共享存儲”,即將重復(fù)出現(xiàn)的公共數(shù)據(jù)和推理中間結(jié)果僅存儲一份,讓所有用戶共用。通過“緩存復(fù)用”“以存換算”大幅減少算力浪費(fèi),從而緩解大模型AI宕機(jī)問題。
鄭緯民透露,該技術(shù)開源后獲得行業(yè)廣泛認(rèn)可,英偉達(dá)、華為、阿里等國內(nèi)外頭部企業(yè)都在采用。
除了存儲問題,公共算力“不夠用”也是一大行業(yè)痛點(diǎn)。
“我經(jīng)常清晨五點(diǎn)半起來用AI查論文,往往問三次就會‘流量超限’。要是等到高峰期,可能問完一個問題,AI就會提示我‘休息一會’。其實(shí)不是我累了,是它忙不過來了。”
鄭緯民拿親身體驗(yàn)舉例,大家常用的DeepSeek大模型,背后是由6000多塊芯片組成、耗資20多億元的“超級芯片”,但即便如此,高峰時段還是扛不住頻繁的用戶查詢需求。
鄭緯民介紹,針對企業(yè)部署本地推理的高成本問題,業(yè)內(nèi)一項(xiàng)解決辦法是“CPU+GPU”協(xié)同的“性價比”方案。具體來說,就是把AI最需要快速運(yùn)算的核心參數(shù)放在GPU里,把占比更高、不那么急的普通參數(shù)放在CPU里。這樣一來,只用一套更低成本的設(shè)備,就能讓大模型“滿血”運(yùn)行。
鄭緯民透露,現(xiàn)在這個方案已經(jīng)被多家大模型企業(yè)采用,相當(dāng)于給企業(yè)提供了“平價解決方案”。
而這兩項(xiàng)技術(shù)創(chuàng)新,正讓AI PC概念加速走向現(xiàn)實(shí)。
“有可能過兩年,在座各位都會用上AI PC。”鄭緯民預(yù)判,就像當(dāng)年計(jì)算機(jī)普及一樣,AI技術(shù)有望從“集群級服務(wù)”向“個人級應(yīng)用”發(fā)展,這也是當(dāng)下AI行業(yè)最值得關(guān)注的趨勢。
如果說前幾年是AI的技術(shù)競賽,今年則是產(chǎn)業(yè)場景中的價值兌現(xiàn)。
政策層面的系統(tǒng)性布局,為這場變革筑牢了根基。國家層面早已按下加速鍵。今年8月,國務(wù)院發(fā)布《關(guān)于深入實(shí)施“人工智能+”行動的意見》,明確提出到2027年,率先實(shí)現(xiàn)人工智能與6大重點(diǎn)領(lǐng)域廣泛深度融合,新一代智能終端、智能體等應(yīng)用普及率超70%。
地方層面的實(shí)踐則讓政策落地生根,以四川為例,四川推進(jìn)人工智能“一號創(chuàng)新工程”,將其納入“15+N”重點(diǎn)產(chǎn)業(yè)鏈,打造國家創(chuàng)新試驗(yàn)區(qū),34個本土垂直大模型落地生根,形成政策與產(chǎn)業(yè)共振的良好生態(tài)。
工信部電子信息司副司長史惠康表示,當(dāng)前,以先進(jìn)計(jì)算為核心驅(qū)動力的科技創(chuàng)新正加速重構(gòu)全球產(chǎn)業(yè)格局,催生出生成式人工智能、具身智能、數(shù)字孿生等前沿應(yīng)用,深刻改變著人們的生產(chǎn)和生活方式,重塑全球創(chuàng)新格局和產(chǎn)業(yè)生態(tài)。
以技術(shù)突破、政策賦能為雙引擎,AI的產(chǎn)業(yè)應(yīng)用快速落地。
以人工智能的重要分支具身智能為例,華為技術(shù)有限公司昇騰計(jì)算業(yè)務(wù)副總經(jīng)理劉偉現(xiàn)場提供了一組數(shù)據(jù):2024年具身領(lǐng)域投融資超過300億美元,是2023年的3倍以上,全年我國機(jī)器人相關(guān)企業(yè)注冊量就超19萬家。同時,海外英偉達(dá)、特斯拉、OpenAI等巨頭加快布局大模型+具身智能,并視為第二增長曲線。到2025年,大模型迅猛發(fā)展,引領(lǐng)AI、智能體、具身智能等產(chǎn)業(yè)爆發(fā),加速AI在行業(yè)核心場景的落地。
若把具身智能視為AI的“四肢”,智能體則是驅(qū)動產(chǎn)業(yè)協(xié)同的“大腦”。
2025年,被普遍認(rèn)為是大模型智能體的“元年”。天府絳溪實(shí)驗(yàn)室先進(jìn)計(jì)算前沿研究中心業(yè)務(wù)支持部副部長李昕表示,隨著人工智能從“大模型”邁向“大應(yīng)用”,多智能體協(xié)同技術(shù)正在打破單一應(yīng)用的局限,“智能體經(jīng)濟(jì)”已然成型。AI浪潮下,多智能體協(xié)同完成生產(chǎn)調(diào)度、質(zhì)量檢測、設(shè)備維護(hù)的全流程,在智慧城市里聯(lián)動交通、安防、政務(wù)系統(tǒng)高效運(yùn)轉(zhuǎn),釋放規(guī)?;闹悄軆r值。
隨著算力產(chǎn)業(yè)指數(shù)級增長、技術(shù)持續(xù)突破、生態(tài)協(xié)同開放態(tài)勢,AI普惠已不是抽象概念,而是通過“To B+To C”雙輪驅(qū)動,深度融入醫(yī)療、公安、金融、政務(wù)等社會運(yùn)轉(zhuǎn)的方方面面。
如需轉(zhuǎn)載請與《每日經(jīng)濟(jì)新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟(jì)新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟(jì)新聞APP