
OpenAI正试图打破聊天机器人文本框的束缚,让AI扩展到您设备的每个角落。该公司于本周四正式宣布推出ChatGPT Agent,这是其进军日益增长的“代理AI”领域的重磅产品,旨在让AI模型能自主为用户执行特定任务。
什么是ChatGPT Agent?
根据官方介绍,ChatGPT Agent使用一个虚拟计算机环境来从头到尾处理用户的复杂请求。用户只需下达一个指令,例如:
- “查看我的日历,并根据最新新闻向我简要介绍即将到来的客户会议。”
- “规划并购买为四人制作日式早餐的食材。”
- “分析三个竞争对手并创建一份幻灯片演示。”
随后,ChatGPT Agent便会独立行动,在无需额外输入的情况下,自主浏览网站、打开应用程序并执行指定任务。
据报道,该工具基于一个为该项目专门开发的全新模型,它整合了OpenAI早前推出的Operator(用于导航浏览器)和Deep Research(用于多步骤研究分析)两大工具的能力,并接受了在浏览器和终端之间跳转等复杂任务的训练。
早期上手体验:强大、缓慢且复杂
根据The Verge和Wired等媒体的早期上手评测,外界对该代理的初步印象有些复杂:
优点:
- 强大的多步骤处理能力: 它似乎很擅长处理需要多个步骤才能完成的操作。
- 过程可追溯: Wired特别强调了其“重播”功能,该功能可以让用户回放AI为理解和完成任务所采取的每一步,增加了透明度。
缺点:
- 速度极其缓慢: 这是所有早期评测共同指出的最大问题。它并非为人类坐在一旁观看其工作而设计。Wired提到,一个为OpenAI研究负责人订购纸杯蛋糕的任务花费了一个小时。
- 价值体现于“解放双手”: 尽管耗时漫长,但该负责人表示这仍然节省了时间,因为她“不想自己做”。这表明Agent的当前价值在于处理那些可以“挂机”的、非紧急的繁琐任务。
行业趋势与可用性
“代理AI”是当前AI领域的热门话题,通常被定位为某些任务的人类替代品。但这条路并非一帆风順,例如Klarna公司就曾因AI代理的工作质量问题,在短暂尝试后重新启用了人工客服。
可用性方面:
- ChatGPT Agent将面向订阅ChatGPT Pro、Plus或Team计划的用户开放,通过选择“代理模式”来访问。
- Enterprise和Education用户将在今年夏天晚些时候获得访问权限。
ChatGPT Agent的发布,无疑是向通用人工智能助理迈出的重要一步,它展示了AI从“对话”走向“行动”的巨大潜力。然而,从早期的评测来看,其缓慢的执行速度表明该技术仍处于非常初级的阶段。它更像是一个未来的预演,而非一个能立即提升日常工作效率的成熟工具。
未经允许不得转载:主机格调 » ChatGPT Agent首发评测:功能强大但速度缓慢,它值得期待吗?
主机格调



