圖片來源:視覺中國
藍鯨新聞3月31日訊(記者 朱俊熹)3月31日,大模型獨角獸智譜AI在中關村論壇上正式發布全新智能體“AutoGLM沉思”。據智譜介紹,該智能體具備深度研究能力(Deep Research),同時還能實現實際操作(Operator),推動AI Agent進入“邊想邊干”的階段。
智能體一直是國內外AI公司競相押注的方向。本月初,中國初創企業Monica發布智能體產品Manus,稱其為“全球首款通用Agent”,引發科技行業熱議。OpenAI也于2月推出deep research(深度研究)功能,通過智能體對復雜任務進行多步驟研究,在數十分鐘內做到人類需要數小時才能完成的工作。
智譜CEO張鵬在中關村論壇的演講中表示,“智譜很早在布局AI Agent,甚至早過海外的OpenAI和Anthropic。”自去年10月起,智譜陸續推出能模擬人類操作手機、計算機等電子設備的智能體,支持跨應用操作,一句話讓AI幫忙發微信紅包或下單采購外賣。
據智譜介紹,最新的AutoGLM沉思是國內首個正式開放給所有用戶的deep research類智能體功能。除deep research能力外,AutoGLM沉思還具備實際操作能力,能夠主動行動。智譜稱,這一能力的實現依賴于三個關鍵特性:一是深度思考,模擬人類在面對復雜問題時的推理與決策過程;二是感知世界,像人一樣獲取并理解環境信息;三是工具使用,像人一樣調用和操作工具,完成復雜任務。
“此次發布的是preview版本,核心是以research類場景為主。在未來的兩周時間之內,我們將進一步擴展更多的agent場景和執行的能力。”張鵬介紹稱。
在實測中,藍鯨新聞向AutoGLM沉思測試版提出這樣的Prompt:我最近在研究AI Coding(AI編程)領域,幫我整理一份行業報告,要包含國內外主流的AI Coding工具。
AutoGLM沉思會先對用戶的請求進行拆解,再逐步執行研究計劃。該智能體的操作過程貼近人類的行為方式,會跳轉打開Cursor、Windsurf等AI編程工具的官網。瀏覽網頁并收集相關信息,整合到最終生成的研究報告中。
圖片來源:AutoGLM沉思實測
藍鯨新聞發現,AutoGLM沉思通過瀏覽器插件的方式實現對網頁的調用。如果用戶此前未登陸相關官網,智能體在執行任務時會受阻,需要用戶介入,等待手動確認。或者它也會主動調整搜索策略,轉向其他信源來獲取詳細信息。
圖片來源:AutoGLM沉思實測
相較而言,當通過Manus執行同一任務時,雖然Manus也會主動瀏覽不同AI編程工具的官網,但僅體現在對步驟的簡要描述中,不會像AutoGLM沉思一樣彈出瀏覽器頁面。
圖片來源:Manus截圖
通過模擬人類瀏覽網頁的方式,智譜的智能體AutoGLM沉思能夠突破各平臺間的“信息壁壘”。以制定一項旅游計劃的任務為例,Manus等產品參考的是互聯網上能被抓取到的公開信息,而AutoGLM沉思可以觸達更多相對封閉的內容生態,包括小紅書筆記、知乎、嗶哩嗶哩視頻等,提供更優質的信息來源。
圖片來源:AutoGLM沉思實測
從用戶體驗來看,Manus運行在獨立虛擬機中,執行任務時可以關閉其頁面,不影響它在后臺繼續保持工作。當用戶提出任務請求后,Manus會補充提問以進一步確認需求細節。用戶也可以隨時發送信息,對任務進行修改、補充或要求停止。
圖片來源:Manus截圖
而智譜的AutoGLM沉思在任務進行過程中,不支持對任務進行修改或開啟新對話,否則會直接終止任務進程。AutoGLM沉思跳轉打開的瀏覽器頁面雖然可以小窗化,但必須全程保持在線,且用戶難以直觀判斷任務的進度條。智譜表示,之后計劃推出“虛擬機”版本,進一步增強AI Agent的實際落地能力。
圖片來源:Manus任務進度
智譜稱,AutoGLM沉思向用戶免費、不限量地開放體驗。OpenAI的deep research功能需要用戶每月至少付費20美元。Manus也在3月28日公布了其收費方案:Manus Starter每月收費39美元,獲得3900積分;Manus Pro每月收費199美元,獲得19900積分。
積分是Manus使用的標準計量單位,任務越復雜或越耗時,所需積分越多。以藍鯨新聞實測的任務為例,生成一份關于AI編程的行業報告需要花費23分鐘,消耗456積分。而生成旅游計劃需要17分鐘,消耗197積分。
智譜表示,AutoGLM沉思的背后,融合了新版基座模型GLM-4-Air-0414的通用能力、全新深度思考模型 GLM-Z1-Air的反思能力、沉思模型GLM-Z1-Rumination,以及AutoGLM的自動執行能力。其中核心鏈路的模型和技術,預計將于4月14日正式開源。
新版GLM-Z1-Air在性能表現上可媲美DeepSeek-R1。其推理速度相比R1提升了8倍,成本可以降低至1/30。基于GLM-Z1訓練出的沉思模型GLM-Z1-Rumination,能通過更長的深度思考時間來換取更優的效果,突破了實時聯網搜索、動態工具調用、深度分析和自我驗證。
“相比于傳統的推理模型,我們期待沉思模型引領AI助手進入一個‘高智商’到‘高智商+高自主’的階段。”智譜稱。