消息称谷歌将推出“Project Jarvis”:可实现网页任务自动化
GoodNav 于 10 月 27 日报道,依据 The Information 的消息,谷歌计划在 12 月展示其大型模型“Project Jarvis”的预览。知情人士表示,此项目将协助用户完成“进行研究、购买商品或预订机票”等各种任务。
据报道,“Jarvis”将由未来版本的谷歌 Gemini 驱动,并特别优化用于 Chrome 浏览器。这一工具旨在通过截取屏幕截图、解析内容,自动点击按钮或输入文本,以帮助用户“自动化日常的网页操作”。目前,该工具在执行各项操作时存在几秒钟的延迟。
值得注意的是,所有主要 AI 公司目前都在开发类似功能的模型。微软的 Copilot Vision 可以与用户应用于正在浏览的网页进行互动;苹果的 Apple Intelligence 预计将在明年具备跨多个应用程序的屏幕识别功能;Anthropic 刚发布的 Claude 测试版已经可以在计算机上进行操作;OpenAI 也在开发类似的功能。
报道指出,谷歌展示“Jarvis”的计划可能会有所调整,预计会先向少量测试者发布,以帮助公司修复可能存在的 Bug。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...