2025-07-18 07:29:24
北京時間7月18日凌晨,OpenAI發(fā)布ChatGPT智能體,能自主思考和行動,融合Operator交互、Deep Research信息搜集及ChatGPT對話能力,可完成超復(fù)雜任務(wù)。它能進行財務(wù)研究、制作幻燈片、規(guī)劃行程等,甚至能處理入門級投資銀行分析師的工作。ChatGPT智能體通過虛擬計算機處理任務(wù),配備多種網(wǎng)絡(luò)工具。OpenAI強調(diào)AI輔助人類工作,暫不涉足炒股。
每經(jīng)編輯|杜宇
北京時間7月18日凌晨,美國科技公司OpenAI臨時舉行直播活動,發(fā)布通用人工智能代理ChatGPT智能體。
ChatGPT Agent具備自主思考和行動的能力,能夠主動從其技能庫中選擇合適的工具,包括Operator、 Deep Research和ChatGPT來完成各種超復(fù)雜任務(wù)。
簡單描述,這是一個融合Operator智能體網(wǎng)頁交互能力、“深入研究”(Deep Research)功能的互聯(lián)網(wǎng)信息搜集能力,以及ChatGPT對話能力的統(tǒng)一智能體。ChatGPT不再只是問答機器人,還能通過“內(nèi)置計算機”代表用戶完成復(fù)雜的多步驟任務(wù)。
圖片來源:直播視頻
OpenAI介紹稱,ChatGPT智能體能夠通過互聯(lián)網(wǎng)搜索或API獲取數(shù)據(jù),進行深入的財務(wù)研究、制作精美的幻燈片,或者預(yù)定活動或規(guī)劃行程。
特別值得注意的是,在內(nèi)部基準(zhǔn)測試中ChatGPT智能體展現(xiàn)能夠處理入門級投資銀行分析師(1-3年工作經(jīng)驗)任務(wù)的能力,例如為財富500強公司構(gòu)建符合準(zhǔn)則的財務(wù)報表模型,或為私有化交易構(gòu)建杠桿收購模型。
ChatGPT智能體的產(chǎn)品經(jīng)理Neel Ajjarapu表示:“這個模型實際上非常適合處理新人入行第一年或第二年財務(wù)分析類型的工作。這些任務(wù)過去可能需要一個人熬夜完成,尤其是在深夜被老板臨時叫去處理的時候。”
在演示中,OpenAI給出的案例是根據(jù)結(jié)婚請柬上的日期、地點和著裝要求,搜索合適的男裝和鞋子,并推薦禮物。
經(jīng)過10分鐘的努力,ChatGPT智能體如期完成了搜索工作,并列出了所有推薦的商品,并附上推薦理由和鏈接。
在另一個案例中,ChatGPT智能體被要求根據(jù)美國職業(yè)棒球大聯(lián)盟賽程,規(guī)劃一條在2025賽季常規(guī)賽期間,走遍全美30座大聯(lián)盟棒球隊的觀賽路線,推薦酒店住宿,最后以電子表格的形式呈現(xiàn)并生成一張可視化路線圖。
用戶可以要求 ChatGPT Agent分析三個競爭對手并制作幻燈片演示文稿等請求。ChatGPT會智能地瀏覽網(wǎng)站、選擇日期、篩選結(jié)果、運行代碼,甚至自動生成經(jīng)過潤色的幻燈片演示文稿或電子表格。
也就是說你只需要一個提示,ChatGPT Agent就會幫你完成所有工作等待結(jié)果就好。
技術(shù)架構(gòu)方面,ChatGPT Agent通過其虛擬計算機處理任務(wù),能夠流暢地在推理與執(zhí)行之間切換。在面對復(fù)雜任務(wù)時,不僅能夠進行邏輯推理,還能夠?qū)嶋H執(zhí)行任務(wù),從而獨立完成復(fù)雜的多步驟任務(wù)。
例如,當(dāng)用戶要求 ChatGPT Agent“查看我的日歷,并根據(jù)最新動態(tài)簡要匯報即將舉行的客戶會議”時,能夠理解任務(wù)需求,主動從日歷應(yīng)用中獲取信息,并整理出簡潔的匯報內(nèi)容。
ChatGPT Agent另一個重要功能模塊是其多工具集成能力,將 Operator 的網(wǎng)站交互能力、Deep Research的信息整合能力以及 ChatGPT的深度對話能力融合在一起,形成統(tǒng)一的智能體系統(tǒng)。
此外,ChatGPT Agent還配備了多種網(wǎng)絡(luò)工具,包括可視化瀏覽器、文本瀏覽器和直接API 訪問權(quán)限。
OpenAI會試圖回避有關(guān)“搶微軟PowerPoint、Excel生意”的說法,僅表示AI可以幫助人類生成初稿,然后再使用微軟或其他公司的辦公軟件進行編輯。核心意義在于能減少人們制作演示文稿和分析所需的工作量,例如將數(shù)小時或數(shù)天縮短至30分鐘。
對于全球股民高度關(guān)注的問題:能否讓ChatGPT智能體自己拿著錢去炒股。OpenAI表示這類操作暫時受到限制,主要考量是避免AI出錯導(dǎo)致高額損失。同時ChatGPT智能體在執(zhí)行敏感或重要操作(例如發(fā)送郵件、購買商品、提交個人數(shù)據(jù))時,會明確征求用戶授權(quán)。用戶在使用ChatGPT智能體訪問金融網(wǎng)站時,將不能離開當(dāng)前標(biāo)簽頁,否則工具會停止運作。
在安全性方面,ChatGPT 智能體的設(shè)計也充分考慮了用戶的安全需求。在執(zhí)行涉及敏感或重要操作前,ChatGPT會明確征得用戶的授權(quán),確保用戶始終掌握控制權(quán)。此外,ChatGPT 智能體還具備主動監(jiān)督和風(fēng)險緩解功能,能夠主動拒絕高風(fēng)險任務(wù),例如,金融交易或敏感法律互動。
根據(jù)OpenAI公布的測試數(shù)據(jù)顯示,ChatGPT Agent 在多項測試中表現(xiàn)優(yōu)異。在 “人類終極考試” 中,單次嘗試通過率達(dá)41.6%,取得新SOTA成績,采用并行策略時分?jǐn)?shù)提升至44.4;在“前沿數(shù)學(xué)”基準(zhǔn)中,準(zhǔn)確率達(dá)27.4%,大幅超越以往模型。
在BrowseComp基準(zhǔn)中以68.9% 的成績創(chuàng)SOTA,比深度研究高17.4 %;在WebArena中表現(xiàn)優(yōu)于由o3驅(qū)動的CUA。
每日經(jīng)濟新聞綜合OpenAI官網(wǎng)、公開資料
如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴(yán)禁轉(zhuǎn)載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關(guān)注每日經(jīng)濟新聞APP