免费看国产黄线在线观看,国产女人爽的流水毛片,中国东北老妇姓交视频,亚洲碰碰人人AV熟女天堂

智譜攜“沉思”加入Agent“混戰(zhàn)” 記者實測結(jié)果來了!
原創(chuàng)
2025-04-03 07:28 星期四
科創(chuàng)板日報記者 李明明
①記者在實測中發(fā)現(xiàn),“沉思”在思考過程中不僅速度較快,生成的旅游方案可媲美專業(yè)的旅行規(guī)劃師;
②智譜CEO張鵬表示,AutoGLM更早是應(yīng)用在手機(jī)端,本次“沉思”只不過是把它移到了PC上。

《科創(chuàng)板日報》4月3日訊(記者 李明明)繼與多地國資合作之后,大模型獨角獸智譜又在產(chǎn)品方面迎來新進(jìn)展。

近日,智譜推出具有深度思考和操作執(zhí)行能力的Agent 產(chǎn)品“AutoGLM 沉思”(以下簡稱“沉思”),并已經(jīng)免費上線。據(jù)介紹,“沉思”能查看如知網(wǎng)、小紅書、公眾號、巨潮資訊等不對外開放API的信源,同時具有多模態(tài)理解能力,能夠理解網(wǎng)頁上的圖文信息。

在介紹“沉思”時,智譜CEO張鵬略帶調(diào)侃地表示,“這個Agent不用39美元,免費而且不用邀請碼。”此前,國產(chǎn)智能體Manus曾掀起一股關(guān)于AI Agent的討論熱潮,但因為需要邀請碼發(fā)放有限,絕大部分用戶只能觀望,無法真正體驗。

《科創(chuàng)板日報》記者在實測中發(fā)現(xiàn),“沉思”在思考過程中展現(xiàn)出從理解并拆解問題入手,結(jié)合信息檢索快速構(gòu)建解決方案框架的能力。

記者實測“ 沉思”

《科創(chuàng)板日報》記者使用“ 沉思”實測了七個任務(wù),它均能較好地完成,舉其中三個例子來展示其推理過程。

任務(wù)一:我需要一份 4 月 20-27日從北京出發(fā)的 7 天歐洲行程,預(yù)算為 3 -8萬元,適合我和閨蜜。我們喜歡名勝古跡、隱藏的寶藏和歐洲文化,并需要一個特別的歷史地點推薦。請?zhí)峁┮环菰敿?xì)的旅行手冊,其中包含地圖、景點介紹、必要的外語短語和旅行小貼士,供我們在旅途中參考。

任務(wù)二:月壇附近肯德基外賣推薦。

任務(wù)三:我之前總是被提醒著裝打扮有點學(xué)生氣,現(xiàn)在我準(zhǔn)備進(jìn)入職場,也開始研究穿搭改變自己,順便開個抖音賬號記錄自己改變的過程,做一個養(yǎng)成系博主,第一期標(biāo)題我打算叫《聽勸第1天》,請你幫我寫個視頻腳本。

任務(wù)一讓 Agent 完成高度定制化的旅行方案規(guī)劃,以往都需要專業(yè)的旅行規(guī)劃師才能完成。可以看到,“沉思”迅速打開了相關(guān)購票、預(yù)定酒店的網(wǎng)站并進(jìn)行一系列解析后,給出了一份數(shù)千字的詳細(xì)報告。

任務(wù)二中,“沉思”對月壇附近主要門店位置、門店特色、不同平臺外賣服務(wù)的配送、價格等多維度對比,并生成詳細(xì)表格和報告。

任務(wù)三中,“沉思”不停搜索知乎、新浪、搜狐等眾多網(wǎng)站,并迅速生成抖音視頻腳本,其文采水平和完成度均較高。

總體感受是,“沉思”的執(zhí)行非常迅速,甚至可以打開很多用戶自己的盲區(qū)網(wǎng)站,可以大幅度節(jié)省時間和決策成本。

但亦有一些用戶告訴《科創(chuàng)板日報》記者,比起邊想邊搜,深度思考類模型產(chǎn)品更應(yīng)該實現(xiàn)的功能是邊聊邊想,在思考的每一個節(jié)點,用戶都能參與進(jìn)來進(jìn)行交互,并及時糾正模型動作,以防模型進(jìn)行一些不必要甚至是錯誤的思考行為和操作。

智能體的應(yīng)用形態(tài),還將回歸到模型上

而隨著Agent爆發(fā)的持續(xù)迫近,有關(guān)Agent的實現(xiàn)方式和最終形態(tài),也成為當(dāng)前AI從業(yè)者的爭論焦點。此前,Pleias的聯(lián)合創(chuàng)始人Alexander Doria曾提到,未來AI智能體的發(fā)展方向是模型本身,而不是工作流,并列舉了Manus的例子,認(rèn)為其提示驅(qū)動無法完成復(fù)雜的任務(wù)。

張鵬對《科創(chuàng)板日報》記者表示,其觀點與Alexander Doria基本一致?!拔磥淼男聭?yīng)用形態(tài),尤其是智能體的應(yīng)用形態(tài),還是會回歸到模型上。這也是我們一直所倡導(dǎo)的模型即場景的概念,未來很多的應(yīng)用會以模型為核心,包上一個很淺的或者很薄的產(chǎn)品化、應(yīng)用性的殼就會變成一個產(chǎn)品。模型能力一旦提升,產(chǎn)品能力就會得到提升,這是很典型的新應(yīng)用范式的變化?!?/p>

“但是,當(dāng)下AGI之路剛剛開始,模型的能力還無法達(dá)到完全類比人的水平,模型能力有限,需工程化解決實際應(yīng)用問題。永遠(yuǎn)是模型進(jìn),工程退。其技術(shù)越先進(jìn),需要工程化的事情越簡單。所以,終極的目標(biāo)是當(dāng)造出一個像人一樣聰明的腦子之后,工程上的事情就比較少,只需要給它裝上手和眼睛就可以像人一樣完成很多工作,這也是AGI的終極目標(biāo)?!?張鵬說。

另有大模型企業(yè)人士告訴《科創(chuàng)板日報》記者,Manus更傾向于以AI技術(shù)優(yōu)化具體場景中的流程與體驗,而非聚焦于底層技術(shù)突破?!叭欢?,Manus本身未能形成有效的產(chǎn)品壁壘,后續(xù)大量開源版本Manus的出現(xiàn),讓其稀有性被打破,‘沉思’的出現(xiàn)就是一個例子?!?/p>

目前來說,Agent要達(dá)到可用,需要打通一些公域和私域之間的數(shù)據(jù)壁壘,以及打通不同平臺之間的壁壘。

比如,Manus此前短暫爆火,但隨后在復(fù)雜任務(wù)中的表現(xiàn)屢出狀況。有實測案例顯示,解析文件時,Manus對非標(biāo)準(zhǔn)格式的兼容性較差,部分?jǐn)?shù)據(jù)直接丟失;網(wǎng)頁爬取環(huán)節(jié)頻繁遭遇驗證碼攔截,任務(wù)中斷。

提到解決辦法,張鵬告訴《科創(chuàng)板日報》記者,公司在公開演示 “沉思”時選擇了大眾易理解的通用場景。但針對專業(yè)領(lǐng)域、企業(yè)用戶或存在特定限制條件的用戶,智譜已構(gòu)建了一套功能化的解決方案。這套方案將通過公司未來的 MaaS 平臺(模型即服務(wù))及智能體開發(fā)平臺進(jìn)行沉淀,開發(fā)者和企業(yè)用戶可基于這兩大基礎(chǔ)平臺便捷調(diào)用資源,實現(xiàn)快速適配與功能擴(kuò)展。張鵬特別強(qiáng)調(diào),這些均屬于產(chǎn)品層面的優(yōu)化,而非模型層面的問題。

“比如說登錄網(wǎng)盤等這些額外的操作,本質(zhì)上還是智能體聰明程度不如人類,如果其可以通過圖靈測試,能力與人類非常接近了,那現(xiàn)在的封禁和攔截策略也很難做的到。”

他進(jìn)一步解釋,通用Agent不能有短板,包括文本、思考、操作、環(huán)境感知和理解的能力、調(diào)用工具、反復(fù)嘗試的能力等,都不能有明顯的短板。一旦有明顯短板存在,就會導(dǎo)致應(yīng)用成功率急劇下降。

“我們始終堅持為所有模型注入語言多模態(tài)能力,源于對人類認(rèn)知本質(zhì)的理解。"”張鵬指出,人類作為具備綜合認(rèn)知能力的生命體,其智能評判體系具有整體性特征。當(dāng)公眾審視 AI 系統(tǒng)時,往往不會局限于單一維度的能力對比,而是通過多模態(tài)交互體驗形成整體認(rèn)知。即使某模型在邏輯推理、自然語言生成等單項指標(biāo)上超越人類,但若多模態(tài)交互能力存在短板,仍會被感知為 "智能缺陷"。這一現(xiàn)象揭示出,技術(shù)研發(fā)者不應(yīng)簡單歸咎于外部環(huán)境,而需從模型架構(gòu)層面重新審視技術(shù)演進(jìn)路徑。

隨著Agent能力的不斷演進(jìn),未來其在硬件端的入口也會更加豐富,包括機(jī)器人、眼鏡等設(shè)備都將成為新的接入點。而這又帶來了新的問題:調(diào)用這些入口還面臨哪些挑戰(zhàn)?

張鵬對此表示,AutoGLM更早是應(yīng)用在手機(jī)端,本次“沉思”只不過是把它移到了PC上。而其他智能硬件,比如眼鏡、車載以及平板等端側(cè)亦類似,都可以接入?!暗抢锩娲_實有一些問題,比如,不同類型的設(shè)備,最終的交互方式不一樣,比如說眼鏡不可能有鍵盤,就要用語音交互,語音就引入了全新的模態(tài)。”

“所以,當(dāng)前階段,接入Agent遠(yuǎn)非簡單地‘插入芯片、接入現(xiàn)成的SDK’那么容易,這種'即插即用'的便捷性仍是未來愿景,當(dāng)下還無法實現(xiàn)。”

收藏
73.41W
我要評論
圖片
歡迎您發(fā)表有價值的評論,發(fā)布廣告和不和諧的評論都將會被刪除,您的賬號將禁止評論。
發(fā)表評論
要聞
股市
關(guān)聯(lián)話題
5.13W 人關(guān)注
8912 人關(guān)注
6573 人關(guān)注