
從“Chat”到“Act”:AutoGLM 如何引領(lǐng) AI 智能設(shè)備新范式?

智譜AI率先推出了 AutoGLM,試圖打造一款能夠理解、規(guī)劃、執(zhí)行,并最終實(shí)現(xiàn)“無人駕駛”操作系統(tǒng)的 AI Agent。
近年來,人工智能領(lǐng)域風(fēng)起云涌,而大模型技術(shù)的崛起無疑是其中最耀眼的“明星”。它不僅重新定義了人機(jī)交互的方式,更在各行各業(yè)掀起了一場顛覆性的革命。然而,當(dāng)下的 AI 應(yīng)用大多停留在“聊天機(jī)器人”的階段,人們期待著 AI 能夠更進(jìn)一步,從“Chat”走向“Act”,真正成為解決實(shí)際問題、提升效率的得力助手。
面對這一需求和挑戰(zhàn),智譜AI率先推出了 AutoGLM,試圖打造一款能夠理解、規(guī)劃、執(zhí)行,并最終實(shí)現(xiàn)“無人駕駛”操作系統(tǒng)的 AI Agent。 然而,通往未來的道路并非一帆風(fēng)順,AutoGLM 的出現(xiàn)也引發(fā)了人們的諸多疑問:它究竟強(qiáng)大到什么程度?能否真正解放人們的雙手?又將如何改變我們的生活和工作方式?
從簡單操作到復(fù)雜任務(wù):AutoGLM 不斷進(jìn)化
起初,AutoGLM 只能完成一些簡單的手機(jī)操作,例如點(diǎn)外賣、發(fā)朋友圈、領(lǐng)紅包等。然而,在不斷的迭代升級中,它展現(xiàn)出了驚人的學(xué)習(xí)能力和執(zhí)行力。如今,AutoGLM 已經(jīng)能夠挑戰(zhàn)更加復(fù)雜的任務(wù)。
可以實(shí)現(xiàn)超長任務(wù)。能在無需人為干預(yù)的情況下自主執(zhí)行超過 50 步的操作,例如自動完成一份復(fù)雜的采購清單。
AutoGLM 實(shí)現(xiàn)了跨 App 操作。AutoGLM打破了應(yīng)用之間的壁壘,能根據(jù)用戶的指令在不同 App 間自由切換,例如一邊瀏覽商品信息,一邊自動打開購物 App 下單。
理解能力不斷提升,避免了繁瑣的指令,可對用戶的短指令進(jìn)行理解。AutoGLM不再需要冗長的指令描述,只需簡單幾個字,就能理解用戶的意圖,例如用戶只要說出“點(diǎn)咖啡”,就能自動完成咖啡預(yù)訂的所有步驟。用戶不必記住冗長的咖啡的具體品名,他會根據(jù)用戶以往的習(xí)慣進(jìn)行自助選擇。
還可以采用“隨便模式”。即在用戶沒有明確指示的情況下,根據(jù)用戶的意圖主動做出決策,可以據(jù)用戶的口味偏好推薦咖啡。按智譜 CEO 張鵬的說法,這就是一個“盲盒模式”能讓用戶能感受到不一樣的“新奇體驗(yàn)”。
這些功能的實(shí)現(xiàn),得益于 AutoGLM 在泛化能力、思維鏈能力上的突破。它能夠?qū)⒂脩舻闹噶畈鸾獬梢幌盗懈?xì)化的步驟,并調(diào)用不同的應(yīng)用程序來完成,真正實(shí)現(xiàn)了從“被動執(zhí)行”到“主動思考”的轉(zhuǎn)變。
從手機(jī)到電腦:GLM-PC 開啟“無人駕駛”新時代
除了手機(jī)端的 AutoGLM,智譜AI 還推出了面向 PC 端的 GLM-PC,試圖打造一款能夠“像人一樣操作電腦”的 AI Agent。目前,GLM-PC 已經(jīng)能夠?qū)崿F(xiàn):
會議替身: 自動預(yù)定會議、發(fā)送會議紀(jì)要。
文檔處理: 下載、發(fā)送、理解和總結(jié)文檔。
網(wǎng)頁搜索與總結(jié): 在指定平臺搜索關(guān)鍵詞,并對搜索結(jié)果進(jìn)行閱讀和總結(jié)。
遠(yuǎn)程和定時操作: 通過手機(jī)遠(yuǎn)程控制電腦,或設(shè)定定時任務(wù)。
隱形屏幕: 在用戶工作時,在后臺執(zhí)行任務(wù),不占用屏幕資源。
GLM-PC 的出現(xiàn)意味著 AI Agent 不再局限于移動端,而是開始向更加復(fù)雜、應(yīng)用場景更加豐富的 PC 端拓展。雖然現(xiàn)階段 GLM-PC 的功能還比較有限,需要用戶輸入非常精準(zhǔn)的指令,但它所展現(xiàn)出的潛力無疑是巨大的。
從 L1 到 L5:AI Agent 發(fā)展之路任重道遠(yuǎn)
Agent將迎來高速發(fā)展期。Gartner預(yù)測,到2028年,至少15%的日常工作決策將通過人工智能代理自主完成(這一比例在2024年尚為0%)這依賴于強(qiáng)大的大模型能力。為此智譜AI將大模型能力的演進(jìn)劃分為五個階段:
L1 語言能力: 能夠理解和生成自然語言。
L2 邏輯能力: 能夠進(jìn)行邏輯推理和問題求解。
L3 使用工具的能力: 能夠使用各種工具完成任務(wù)。
L4 自我學(xué)習(xí)能力: 能夠自主學(xué)習(xí)和改進(jìn)自身的能力。
L5 探究科學(xué)規(guī)律: 能夠像科學(xué)家一樣探索未知領(lǐng)域。
張鵬介紹道,目前大模型在 L1 和 L2 階段已經(jīng)取得了顯著進(jìn)展,但在 L3 工具使用能力方面還處于早期階段。AutoGLM 和 GLM-PC 的出現(xiàn),正是為了推動 AI Agent 在 L3 階段的快速發(fā)展,最終實(shí)現(xiàn) L4 自我學(xué)習(xí)能力的突破。
AutoGLM 和 GLM-PC 的出現(xiàn),意味著 AI 不再僅僅是冷冰冰的代碼,而開始擁有了“手”和“眼”,能夠像人一樣與現(xiàn)實(shí)世界進(jìn)行交互。這不僅將徹底改變?nèi)藱C(jī)交互的方式,更將催生出全新的應(yīng)用場景和商業(yè)模式。
智譜不僅要讓AI的能力局限在手機(jī)和電腦,還會將他擴(kuò)展到不同的領(lǐng)域:手機(jī)+AI 會成為人們隨時隨地的個人智能助理,PC+AI 將會成為企業(yè)和個人的全新生產(chǎn)力工具,汽車+AI 將會讓汽車變?yōu)槿藗兊闹悄艿谌羁臻g。
而這些不僅僅是智譜的暢想,現(xiàn)在有很多場景都已落地。在AI與手機(jī)的結(jié)合中,榮耀手機(jī)的很多典型應(yīng)用已結(jié)合了智譜GLM大模型。榮耀 AI 技術(shù)總監(jiān)王作建表示,智譜GLM模型已在YoYo助理、榮耀筆記、榮耀文檔產(chǎn)品中規(guī)模上線,給用戶帶來了全新體驗(yàn)。
華碩 AIPC 智能生態(tài)負(fù)責(zé)人鐘懷圣對華碩與智譜的合作充滿了更多期望,他表示,將和智譜共同打造云端一體的AIPC智能助手。在內(nèi)容提煉、軟件控制、AI創(chuàng)作、個人知識庫、AI聊天、硬件體驗(yàn)等場景不斷發(fā)掘AI的創(chuàng)新能力。不僅如此,智譜不斷在不斷擴(kuò)大著自己的朋友圈,從小鵬汽車到高通、英特爾、以及眾多賦能2B、2G的合作伙伴……
正如張鵬所說:“我們期待著 AI 不再局限于語言交互,而是能夠做更多的事情。”
在不久的將來,各種 AI 原生設(shè)備將如雨后春筍般涌現(xiàn),一個由 AI Agent 驅(qū)動的智能時代即將到來。 在這個過程中,智譜AI 將繼續(xù)深耕大模型技術(shù),與合作伙伴攜手共進(jìn),共同推動 AI Agent 技術(shù)的進(jìn)步和應(yīng)用落地,為人類創(chuàng)造更加美好的未來。
本文章選自《數(shù)字化轉(zhuǎn)型方略》雜志,閱讀更多雜志內(nèi)容,請掃描下方二維碼
