新聞資訊 NEWS
“今天,AI第一次不靠人類點(diǎn)擊,就獨(dú)立完成了一首R(shí)ap并同步生成MV。“7月26日下午,上海世博中心主論壇,階躍星辰CEO姜大昕按下啟動(dòng)鍵后,Agent在40秒內(nèi)寫(xiě)完歌詞、匹配鼓點(diǎn)并推送至大屏。臺(tái)下掌聲響起,不是因?yàn)楦柙~押韻,而是因?yàn)檫@意味著大模型從“對(duì)話”躍遷到“執(zhí)行”——2025世界人工智能大會(huì)(WAIC 2025)用一整天的議程,把“Agent”確立為年度關(guān)鍵詞。
如果把2023年的大模型比作會(huì)說(shuō)話的百科全書(shū),2025年的Agent就是拿著工具箱、能進(jìn)辦公室的“超級(jí)員工”。在階躍星辰的展臺(tái),終端Agent接入Mac Studio,調(diào)用本地GPU云主機(jī)(8×A100 80G顯存,峰值算力5 PFLOPS)實(shí)時(shí)推理,把用戶哼出的三小節(jié)旋律擴(kuò)展成完整編曲;MiniMax則在隔壁展廳演示“全棧通用智能體”,對(duì)著一段“幫我做一款記賬App”的自然語(yǔ)言需求,Agent自動(dòng)完成需求拆解、代碼生成、單元測(cè)試、Docker鏡像打包,全程耗時(shí)11分27秒——這背后是一套“思維鏈-行動(dòng)鏈”雙循環(huán)架構(gòu):大模型先輸出任務(wù)圖(planning),再調(diào)用沙箱里的代碼解釋器、瀏覽器、數(shù)據(jù)庫(kù)工具依次執(zhí)行(acting),失敗即回溯重試,直至通過(guò)CI/CD流水線。MiniMax技術(shù)副總裁曾國(guó)洋在媒體群訪中解釋:“我們把工具的API schema當(dāng)作'外語(yǔ)'教給模型,讓它學(xué)會(huì)像程序員一樣閱讀文檔、寫(xiě)調(diào)用。”
行業(yè)級(jí)Agent的落地更早也更重。螞蟻數(shù)科聯(lián)合意言科技首發(fā)的“金融合規(guī)Agent”已在三家股份行試運(yùn)行:讀取新監(jiān)管條文后,Agent在2小時(shí)內(nèi)遍歷銀行全部存量產(chǎn)品合約,標(biāo)出143處潛在違規(guī)條款并給出修訂模板,準(zhǔn)確率達(dá)96.4%(來(lái)源:螞蟻數(shù)科《2025Q2金融Agent評(píng)估報(bào)告》,2025-07-15)。工業(yè)場(chǎng)景里,某頭部汽車(chē)廠把產(chǎn)線質(zhì)檢Agent部署在邊緣GPU云主機(jī)(NVIDIA L40 48G顯存×4),Agent通過(guò)視覺(jué)-語(yǔ)言模型實(shí)時(shí)解析工人語(yǔ)音指令“檢查車(chē)門(mén)縫隙”,自動(dòng)調(diào)取3D相機(jī)點(diǎn)云,將誤差大于0.2毫米的部件打上紅框,單件檢測(cè)時(shí)間從45秒壓縮到3秒。
算力是Agent“自主”的前提。WAIC發(fā)布的《中國(guó)AI算力發(fā)展指數(shù)》顯示,2025年上半年國(guó)內(nèi)GPU云主機(jī)租賃量同比增長(zhǎng)312%,其中65%用于Agent推理與微調(diào)(國(guó)家信息中心&IDC,2025-07)。階躍星辰工程負(fù)責(zé)人透露,其音樂(lè)Agent單次創(chuàng)作需并行跑通歌詞、旋律、混音三條擴(kuò)散模型,顯存峰值占用74 GB,“如果按一年前的H800卡,用戶得等三分鐘;現(xiàn)在A100×8的云集群把延遲壓到12秒,體驗(yàn)才像'實(shí)時(shí)'?!?/span>
技術(shù)原理上,Agent的核心是“大模型+工具調(diào)用+記憶系統(tǒng)”。MiniMax在模型側(cè)引入“混合專家-工具路由”機(jī)制:每一層Transformer中插入輕量級(jí)門(mén)控網(wǎng)絡(luò),決定當(dāng)前token是否需要調(diào)用外部工具,從而把工具API的調(diào)用延遲從230 ms降到41 ms。記憶系統(tǒng)則借鑒了操作系統(tǒng)分頁(yè)思想,把長(zhǎng)期記憶(用戶歷史、行業(yè)知識(shí))分頁(yè)存儲(chǔ)在分布式KV數(shù)據(jù)庫(kù),短期記憶(當(dāng)前任務(wù)上下文)留在GPU顯存,換頁(yè)由模型自主觸發(fā),避免顯存溢出。姜大昕比喻:“Agent的內(nèi)存管理就像程序員手動(dòng)開(kāi)換,只是現(xiàn)在由模型自己決定何時(shí)換入換出?!?/span>
走出世博中心,夜幕下的上海依舊車(chē)流如織。只是此刻,一部分紅綠燈的配時(shí)決策已由交通Agent接管;而在看不見(jiàn)的云端,更多Agent正排隊(duì)領(lǐng)取下一塊GPU——它們不再等待人類提問(wèn),而是在尋找下一個(gè)需要被解決的問(wèn)題。