【環(huán)球時(shí)報(bào)報(bào)道 記者 馬俊】編者的話:盡管各種人工智能(AI)已經(jīng)進(jìn)入日常生活,但對(duì)于大部分人來(lái)說(shuō),總感覺(jué)AI在實(shí)際應(yīng)用中“說(shuō)得多做得少”科技。如今,這種情況正在出現(xiàn)變化。今年2月6日,國(guó)內(nèi)AI智能體“千問(wèn)”正式上線“春節(jié)30億免單”活動(dòng),其間用戶可以直接向“千問(wèn)”發(fā)出指令,讓其幫忙點(diǎn)奶茶,該活動(dòng)的持續(xù)火爆,甚至導(dǎo)致服務(wù)器一度崩潰。同時(shí),國(guó)外開(kāi)源本地AI智能體OpenClaw因其功能強(qiáng)大而迅速走紅。這些能主動(dòng)幫人類做事的AI智能體,正是業(yè)內(nèi)當(dāng)前討論最火爆的“端側(cè)智能體”。但將越來(lái)越多的實(shí)際工作交由這些AI智能體來(lái)完成,到底是否靠譜、存在什么樣的潛在風(fēng)險(xiǎn)?環(huán)球時(shí)報(bào)研究院近日舉行“環(huán)球前沿科技論壇之AI治理系列·AI端側(cè)研討會(huì)”,邀請(qǐng)多名業(yè)內(nèi)權(quán)威專家,就此話題展開(kāi)專題討論。
兩條技術(shù)路線各有利弊
智能體是能夠感知環(huán)境、自主規(guī)劃、決策并執(zhí)行任務(wù)的AI應(yīng)用系統(tǒng),2025年被業(yè)內(nèi)視為“AI智能體元年”科技。環(huán)球時(shí)報(bào)研究院輿情監(jiān)測(cè)團(tuán)隊(duì)對(duì)外媒與國(guó)外社交媒體2024年1月-2026年1月關(guān)于智能體報(bào)道的熱度進(jìn)行了輿情監(jiān)測(cè),其間外媒與國(guó)外社交媒體對(duì)智能體的關(guān)注度呈現(xiàn)出總體走高的態(tài)勢(shì)。
所謂“端側(cè)智能體”,是指搭載在終端設(shè)備(如手機(jī)、電腦、IoT設(shè)備等)上能夠獨(dú)立完成推理、決策、任務(wù)執(zhí)行的智能體科技。中國(guó)信息通信研究院人工智能研究所副所長(zhǎng)巫彤寧表示,智能體被視為人工智能從感知理解(會(huì)說(shuō)話)向主動(dòng)服務(wù)(會(huì)做事)演進(jìn)的關(guān)鍵形態(tài)。
上海交通大學(xué)人工智能學(xué)院副教授、無(wú)問(wèn)芯穹聯(lián)合創(chuàng)始人兼首席科學(xué)家戴國(guó)浩在研討會(huì)上介紹說(shuō),AI的終極目標(biāo)是服務(wù)于物理世界中的人科技。因此智能必須通過(guò)我們身邊的終端設(shè)備(如手機(jī)、汽車、機(jī)器人)來(lái)實(shí)現(xiàn),這就是“端側(cè)智能”。在端側(cè)如何構(gòu)建人機(jī)交互與處理的“語(yǔ)言”,衍生出不同技術(shù)路線。
據(jù)專家介紹,第一種是GUI(圖形用戶界面)路線,靠視覺(jué)識(shí)別讀取屏幕信息后進(jìn)行“模擬操作”科技。戴國(guó)浩形容,“這好比另有一人通過(guò)觀察界面來(lái)操作用戶設(shè)備,它將物理世界的信息——如視覺(jué)、聽(tīng)覺(jué)等——轉(zhuǎn)化為AI可理解的表達(dá)方式”。GUI的優(yōu)勢(shì)在于,無(wú)需與第三方應(yīng)用逐一適配,具備較強(qiáng)的短期落地能力。在產(chǎn)品落地時(shí),GUI路線也發(fā)展出兩種思路,一是憑借系統(tǒng)級(jí)權(quán)限實(shí)現(xiàn)多方互聯(lián),但如果不受限制地獲取并使用底層權(quán)限,則可能帶來(lái)隱私與安全問(wèn)題;二是在瀏覽器等沙盒環(huán)境中運(yùn)行,其風(fēng)險(xiǎn)相對(duì)可控。
第二種是協(xié)議授權(quán)路線,通過(guò)標(biāo)準(zhǔn)化接口與目標(biāo)App交互,目前已成為行業(yè)的主流選擇,包括API(應(yīng)用程序接口)等科技。這種路線的優(yōu)勢(shì)在于能夠基于現(xiàn)有技術(shù)范式進(jìn)行拓展,但需要建立一套獨(dú)立于人類語(yǔ)言的機(jī)器表達(dá)體系,而這依賴于強(qiáng)大的行業(yè)生態(tài)支持。
展開(kāi)全文
在端側(cè)智能體發(fā)展的兩種技術(shù)路線取舍上,中國(guó)與美國(guó)采取了不同的做法科技。巫彤寧介紹說(shuō),當(dāng)前,我國(guó)產(chǎn)業(yè)界普遍采取GUI模擬與API授權(quán)“雙軌并行”的發(fā)展策略,力求在創(chuàng)新速度與系統(tǒng)安全之間實(shí)現(xiàn)動(dòng)態(tài)平衡。相比之下,美國(guó)主流企業(yè)在手機(jī)端較少采用GUI模擬路線。這一差異主要源于其技術(shù)生態(tài)與制度環(huán)境的獨(dú)特性。
巫彤寧認(rèn)為,技術(shù)路線的選擇本質(zhì)上是生態(tài)結(jié)構(gòu)、制度約束與市場(chǎng)需求共同作用的結(jié)果科技。單一技術(shù)路徑難以全面支撐中國(guó)智能體生態(tài)的長(zhǎng)期演進(jìn)。GUI路徑具備部署靈活、適配廣泛的優(yōu)勢(shì),尤其適用于接口開(kāi)放不足、生態(tài)碎片化的場(chǎng)景;API授權(quán)路徑則在安全性、可解釋性與責(zé)任追溯方面更具優(yōu)勢(shì),是構(gòu)建可信協(xié)作體系的重要基礎(chǔ)。
戴國(guó)浩表示,當(dāng)前的核心問(wèn)題是如何將兩者結(jié)合,這需要技術(shù)邏輯上的創(chuàng)新與行業(yè)共識(shí)的共建,這也是端側(cè)智能體發(fā)展的關(guān)鍵方向科技。
手機(jī)智能助手火爆出圈
有專家認(rèn)為,以國(guó)內(nèi)一款采用GUI路線的手機(jī)助手為代表的端側(cè)智能體發(fā)展路線,確實(shí)顯著改變了智能手機(jī)的應(yīng)用交互范式,大幅縮短了從模型能力到用戶價(jià)值的轉(zhuǎn)化鏈路科技。因?yàn)镚UI路線的手機(jī)助手可實(shí)現(xiàn)在一句話指令下,跨應(yīng)用調(diào)用服務(wù),幫助用戶點(diǎn)外賣、訂機(jī)票、比價(jià)購(gòu)物等。
北京師范大學(xué)法學(xué)院博士生導(dǎo)師、中國(guó)互聯(lián)網(wǎng)協(xié)會(huì)研究中心副主任吳沈括在研討會(huì)上表示,GUI路線具有一定積極因子,目前存在爭(zhēng)議的是,在實(shí)現(xiàn)數(shù)據(jù)處理的過(guò)程中,各個(gè)相關(guān)方之間的權(quán)屬邊界以及權(quán)義分配,都需要結(jié)合實(shí)際的場(chǎng)景作出具體的分析,目前各主體可能對(duì)未來(lái)要承擔(dān)的責(zé)任的認(rèn)知是有限的科技。
上海交通大學(xué)人工智能學(xué)院副教授、無(wú)問(wèn)芯穹聯(lián)合創(chuàng)始人兼首席科學(xué)家戴國(guó)浩認(rèn)為,從創(chuàng)新角度看,國(guó)內(nèi)采用GUI路線的手機(jī)助手在理論、技術(shù)層面的創(chuàng)新有限,但在產(chǎn)品層面確實(shí)改變了用戶使用手機(jī)的方式科技。
中國(guó)信息通信研究院人工智能研究所副所長(zhǎng)巫彤寧表示,其價(jià)值在于快速驗(yàn)證用戶需求、降低應(yīng)用門檻、提升交互效率,但其長(zhǎng)期可持續(xù)性,仍取決于能否在安全可控、權(quán)限合規(guī)、行為可審計(jì)的前提下,構(gòu)建可監(jiān)管、可追溯、可互認(rèn)的技術(shù)機(jī)制科技。
也有專家在研討會(huì)上對(duì)于采用GUI路線的手機(jī)助手可能通過(guò)獲取高敏系統(tǒng)級(jí)權(quán)限,未經(jīng)授權(quán)侵入第三方應(yīng)用、讀取屏幕信息、模擬用戶點(diǎn)擊的方式,表示擔(dān)憂科技。
對(duì)外經(jīng)濟(jì)貿(mào)易大學(xué)法學(xué)院教授、數(shù)字經(jīng)濟(jì)與法律創(chuàng)新研究中心主任許可表示,GUI路線并非彎道超車的有效路徑科技。此類手機(jī)助手可能帶來(lái)多重風(fēng)險(xiǎn)。一是用戶權(quán)益風(fēng)險(xiǎn)?!敖^大部分用戶都不知道自己具體授權(quán)了AI智能體什么權(quán)限,也不知道這些授權(quán)會(huì)帶來(lái)什么后果?!?/p>
二是涉及第三方的個(gè)人信息和隱私保護(hù)問(wèn)題科技?!袄绾团笥蚜奶斓倪^(guò)程中,讓手機(jī)助手推薦一個(gè)晚上吃飯的地方,它必然要通過(guò)上下文查看所有的聊天內(nèi)容,才能推測(cè)出準(zhǔn)確的意圖。但在此過(guò)程中,原本僅限于兩人知道的、朋友相關(guān)的個(gè)人信息就被手機(jī)助手獲取了。如果說(shuō)聊天記錄、工作信息可以看,那么朋友圈、群組信息呢?這些都可以通過(guò)單方用戶的同意,而變成智能體可以全面獲取的內(nèi)容嗎?”
三是數(shù)據(jù)安全和網(wǎng)絡(luò)安全的問(wèn)題科技?!爱?dāng)AI智能體超越了傳統(tǒng)的權(quán)限,進(jìn)入高控制權(quán)限時(shí),我們就沒(méi)辦法真正進(jìn)行安全防控和辨別黑客攻擊了。再考慮到未來(lái)智能體不只在智能手機(jī)層面,它會(huì)在所有智能客戶端和設(shè)備里,這種風(fēng)險(xiǎn)就更需要關(guān)注?!?/p>
端側(cè)智能體未來(lái)發(fā)展方向也是本次研討會(huì)上專家討論的重點(diǎn)科技。中國(guó)科學(xué)院大學(xué)教授、中國(guó)國(guó)家創(chuàng)新與發(fā)展戰(zhàn)略研究會(huì)副會(huì)長(zhǎng)呂本富認(rèn)為,“從商業(yè)角度看,以前是從功能機(jī)發(fā)展到以App(平臺(tái))為主的智能手機(jī),未來(lái)又進(jìn)化到一個(gè)AI直接完成各種功能(穿透不同App),效率提升很多,確實(shí)是一場(chǎng)革命。隨著人類社會(huì)智能化的深入,可能一個(gè)手機(jī)上有30個(gè)主要的App,但最常用的是5個(gè)左右,只用一個(gè)界面調(diào)度所有功能的趨勢(shì)是存在的”。
但對(duì)于端側(cè)智能體的未來(lái),專家普遍認(rèn)為,現(xiàn)在討論哪條路線更優(yōu)還為時(shí)過(guò)早,端側(cè)智能體仍然處于發(fā)展過(guò)程中,無(wú)論GUI還是API,可能都只是中間狀態(tài)科技。戴國(guó)浩表示,一條技術(shù)路線被輕易驗(yàn)證可行,往往也意味著它很容易在短期內(nèi)被復(fù)制和超越?!八蚤L(zhǎng)期來(lái)看還是要更重視原始的技術(shù)創(chuàng)新,比如芯片、操作系統(tǒng)、大模型能力迭代,只有在這些核心領(lǐng)域不斷迭代,才能長(zhǎng)期發(fā)展創(chuàng)新?!?/p>
此外,專家指出,端側(cè)的概念也會(huì)持續(xù)擴(kuò)展科技。吳沈括強(qiáng)調(diào),手機(jī)助手是不是最終的解決方案和業(yè)務(wù)形態(tài),尚無(wú)定數(shù)。未來(lái)的終端不見(jiàn)得是智能手機(jī),也可以是手環(huán)、眼鏡或者其他表現(xiàn)形態(tài)的終端類型。
AI治理面臨新挑戰(zhàn)
中國(guó)信息通信研究院政策與經(jīng)濟(jì)研究所副所長(zhǎng)李強(qiáng)治在研討會(huì)上表示,智能體是“人工智能+”落地的非常關(guān)鍵的節(jié)點(diǎn)或載體形式,智能體是代理式人工智能,這種人工智能沒(méi)有自主意識(shí),還是執(zhí)行人的決策,國(guó)內(nèi)外很火爆的這些智能體還是人類給它們一個(gè)意圖,它們通過(guò)自己的能力,執(zhí)行決策邏輯,最后一步步實(shí)施科技。因此到智能體這個(gè)階段時(shí),其實(shí)是“人工智能+”與千行百業(yè)深度融合的關(guān)口,原來(lái)人工智能的各種潛在風(fēng)險(xiǎn)、理論上的風(fēng)險(xiǎn)如今可能變成了現(xiàn)實(shí)風(fēng)險(xiǎn)?!凹词故巧墒饺斯ぶ悄?,我們有時(shí)候把它當(dāng)成生產(chǎn)工具,但當(dāng)你跟它聊天時(shí)就會(huì)發(fā)現(xiàn),很多時(shí)候分辨不出來(lái)對(duì)方是人還是機(jī)器。人工智能在交互時(shí)所表現(xiàn)出來(lái)的情感與情緒方面的活躍能力,實(shí)際上遠(yuǎn)超我們以往對(duì)AI的認(rèn)知?!?/p>
中國(guó)科學(xué)院大學(xué)教授、中國(guó)國(guó)家創(chuàng)新與發(fā)展戰(zhàn)略研究會(huì)副會(huì)長(zhǎng)呂本富表示,AI治理其實(shí)就是權(quán)限讓渡科技。讓人工智能幫助決策,就需要明確人的哪些權(quán)限能讓渡,哪些不能讓渡。其實(shí)主要是看行業(yè)應(yīng)用場(chǎng)景的容錯(cuò)率。例如一些行業(yè)中,AI給出的答案準(zhǔn)確率有80%就可以用,比如讓AI推薦一部電影,準(zhǔn)確率差點(diǎn)也無(wú)所謂。但很多行業(yè)要求準(zhǔn)確率到99%,甚至99.9%,比如法律、金融、保險(xiǎn)、醫(yī)療健康等,連1%的容錯(cuò)率都沒(méi)有。因此AI治理的第一個(gè)問(wèn)題就是需要確認(rèn)不同行業(yè)的容錯(cuò)率。第二個(gè)問(wèn)題就是鴻溝問(wèn)題。過(guò)去我們說(shuō)數(shù)字鴻溝,現(xiàn)在人工智能也會(huì)產(chǎn)生鴻溝,不同的人群使用AI的能力不一樣,本身就帶來(lái)了財(cái)富的重新分配問(wèn)題。第三個(gè)問(wèn)題是人工智能閉環(huán)帶來(lái)的新風(fēng)險(xiǎn)。在人類將部分決策權(quán)讓渡以后,比如現(xiàn)在讓AI生成AI,整個(gè)決策鏈中間沒(méi)有人的參與了,這種閉環(huán)帶來(lái)的新風(fēng)險(xiǎn),跟過(guò)去數(shù)字經(jīng)濟(jì)時(shí)代的其他風(fēng)險(xiǎn)有很大區(qū)別。
中國(guó)信息通信研究院人工智能研究所副所長(zhǎng)巫彤寧也認(rèn)為,從長(zhǎng)遠(yuǎn)來(lái)看,有利于中國(guó)智能體持續(xù)發(fā)展與能力積累的技術(shù)組合,應(yīng)是以“場(chǎng)景適配、分層解耦、安全可控”為核心理念的融合架構(gòu)科技。也就是說(shuō),在終端側(cè)保留對(duì)多樣化接入方式的兼容性,滿足不同應(yīng)用環(huán)境的現(xiàn)實(shí)需求;在系統(tǒng)層推動(dòng)權(quán)限管理、行為審計(jì)與風(fēng)險(xiǎn)識(shí)別的統(tǒng)一機(jī)制建設(shè);在生態(tài)層加快API接口標(biāo)準(zhǔn)化進(jìn)程,提升跨主體協(xié)作效率。這種多層次、彈性化技術(shù)體系,既能包容當(dāng)前多元并存的發(fā)展?fàn)顟B(tài),也為未來(lái)向高階智能協(xié)作演進(jìn)預(yù)留空間。
專家建議統(tǒng)籌推進(jìn)安全評(píng)估與標(biāo)準(zhǔn)互操作雙軌機(jī)制:一方面加快完善圖形用戶界面智能體安全評(píng)測(cè)體系,強(qiáng)化端側(cè)運(yùn)行時(shí)管控科技。另一方面深化智能體通信協(xié)議國(guó)家標(biāo)準(zhǔn)研制,推動(dòng)操作系統(tǒng)、終端廠商與應(yīng)用開(kāi)發(fā)者共建輕量級(jí)、可擴(kuò)展的智能體支持層,推動(dòng)雙重授權(quán)、多重授權(quán)落地,為智能體高質(zhì)量發(fā)展提供技術(shù)底座與制度保障。