73
AI资讯

Rabbit 基于网络的“大型动作模型”代理将于 10 月 1 日登陆 r1

收录于合集


Rabbit r1 是2024 年初的必备小工具,但当公司的扩张承诺未能兑现时,它的光环很快就消失了。首席执行官 Jesse Lyu 承认“第一天,我们把期望定得太高了”,但他也表示,下周设备的更新将最终让备受吹捧的 Large Action Model 在网络上免费。


尽管怀疑论者可能(有理由)认为这为时已晚,或又一次改变了目标,但 Rabbit 为网络和移动应用构建平台无关代理的愿望仍然具有根本价值(尽管仍然主要是理论上的)。


在接受 TechCrunch 采访时,Lyu 表示,过去六个月里,R1 经历了一系列的发布、错误修复、响应时间的缩短和小功能的添加。尽管 R1 进行了 16 次无线更新,但它仍然只能与 LLM 交互或访问七种特定服务之一,例如 Uber 和 Spotify。


“这是 LAM 的第一个版本,它通过从数据工作者那里收集的记录进行训练,但它不是通用的——它只连接到那些服务,”他说。目前,它是否是他们所说的 LAM 还只是理论上的;无论模型是什么,它都没有提供 Rabbit 在首次亮相时详细介绍的功能。


基于网络的通用代理


但是 Rabbit 已经准备好发布 LAM 的第一个通用版本,也就是说它不针对任何应用程序或界面,正如 Lyu 向我演示的那样。


这个版本是一个基于网络的代理,可以推理出完成任何普通任务的步骤,比如购买音乐会门票、注册网站,甚至玩在线游戏。“我们的目标非常明确:到九月底,你的 r1 将突然做更多的事情。它应该支持你在网站上能做的任何事,”Lyu 说。(该公司后来提供了更新的最终日期,即 10 月 1 日。)


给定一个任务,它首先将该任务分解为几个步骤,然后通过分析它在屏幕上看到的内容开始执行这些步骤:按钮、字段、图像,无论其位置或外观如何。然后,它根据对网站运作方式的一般了解,与适当的元素进行交互。


我要求它(通过远程操作它的 Lyu)为电影节注册一个新网站。它每隔几秒钟执行一次操作,在 Google 上搜索域名注册商,选择一个(我认为是赞助的),将电影节放入域名框中,然后从出现的选项列表中选择“filmfestival2023.com”,价格为 14 美元。严格来说,我没有给它任何限制,例如“2025 年”或“恐怖电影节”之类的。


同样,当 Lyu 要求它搜索并购买 R1 时,它很快就找到了 eBay,那里有几十辆 R1 在售。对于用户来说,这也许是个好结果,但对于向媒体介绍的公司创始人来说,这可不是什么好事!他一笑置之,又重复了一遍,并补充说只能从官方网站购买。代理成功了。


接下来,他让模型玩 Dictionary.com 的每日单词游戏。这需要一点时间(模型找到了一个出路,那就是只要点击“结束游戏”,它就能快速结束游戏),但它做到了。


但是它使用哪种浏览器呢?Lyu 说,云端的浏览器很新很干净,但他们正在开发本地版本,比如 Chrome 扩展程序,这意味着您可以使用现有会话,而不必登录您的服务。


为此,由于用户对让任何公司完全访问其凭证持谨慎态度(这是可以理解的,也是正确的),因此代理并未配备这些凭证。Lyu 建议,将来可以私下调用一个包含您的凭证的封闭小型语言模型来执行登录。这似乎是一个悬而未决的问题,考虑到该领域的新性,这在某种程度上是可以预料的。


来自 Rabbit 网站的应用程序内部 UI 分析示例。图片来源:兔子


仍在学习


演示向我展示了几件事。首先,如果我们对该公司及其开发人员抱有怀疑态度,认为这不是精心设计的骗局(有些人认为是这样),它确实是一个可以正常工作的通用网络代理。这即使不是第一次,也肯定是第一个可以轻松让消费者使用的代理。


“有些公司从事垂直业务,比如 Excel 或法律文件,但我相信这是首批面向消费者的通用代理之一,”Lyu 说道。“我们的想法是,任何可以通过网站实现的事情都可以说出来。我们将首先为网站提供通用代理,然后为应用程序提供通用代理。”


其次,这表明及时工程仍然非常必要。你如何表达请求很容易成为成功与失败的区别,而这很可能不是普通消费者能够容忍的。


Lyu 提醒说,这只是一个“游乐场版本”,绝不是最终版本,尽管它是一个功能齐全的通用网络代理,但仍可以在许多方面进行改进。例如,他说,“该模型足够智能,可以进行规划,但还不够智能,无法跳过步骤。”它不会“学习”用户不喜欢在 eBay 上购买电子产品,也不会学习搜索后应该向下滚动以避开赞助结果墙。


目前还不会收集用户数据来改进模型。吕将此归因于这样一个事实:对于这样的系统,基本上没有评估方法,因此很难定量地说是否取得了改进。不过,“教学模式”也即将推出,这样你就可以向它展示如何完成特定类型的任务。


有趣的是,该公司还在开发一款桌面代理,可以与文字处理器、音乐播放器以及浏览器等应用程序进行交互。这仍处于早期阶段,但正在发挥作用。“你甚至不需要输入目的地,它只是尝试使用计算机。只要有界面,它就可以控制它。”


第三,仍然没有“杀手级应用”,至少没有明显的应用。这个代理令人印象深刻,但我个人不太会用它,不幸的是,我每天坐在浏览器前八个小时。几乎可以肯定有一些很棒的应用程序,但没有一个能像机器人吸尘器那样让基于浏览器的自动机的实用性变得如此明显。


为什么不再次使用应用程序呢?


我对整个 Rabbit 商业模式提出了普遍的反对意见,本质上就是“这可能是一个应用程序”。


吕先生显然已经听过这种批评很多次了,并且对自己的回答很有信心。


“如果你算一下,就会发现这毫无意义,”他说。“是的,从技术上讲这是可以实现的,但从第一天起,你就会惹恼苹果和谷歌。他们永远不会让这个产品比 Siri 或 Gemini 更好。就像苹果的智能不可能更好地控制谷歌的东西,反之亦然。而且他们拿走了 30% 的收入!如果我们一开始就开发一个应用程序,我们就永远不会有这样的势头。”


使用中的兔子 r1。手模:华盛顿邮报的 Chris Velazco。图片来源: Devin Coldewey / TechCrunch


Rabbit 的基本理念是,第三方人工智能或设备可以访问和操作你的所有其他服务,并且像你一样从外部操作。“跨平台的通用代理系统”,Lyu 称之为。“我们将控制每个 UI,网站是一个好的开始。然后我们将进入 Windows、MacOS 和手机。”


说到这:“我们从未说过我们永远不会制造手机。”这难道不是与他们最初提出的更小、更简单的设备的想法相悖吗?也许是,也许不是。


与此同时,他们正在努力兑现今年早些时候做出的承诺。本周某个时候,当 OTA 更新发布时,所有 R1 用户都可以使用新型号。届时也将发布如何调用它的说明。Lyu 用他特有的轻描淡写提醒期待的用户。


“我们设定的期望是正确的。它并不完美,”他说。“它只是人类迄今为止取得的最好成绩。”

75083
收录于合集
文章来源于网络,如有侵权请联系本站删除
二手好课
更多>>
次卡|低价转S舞蹈舞蹈卡
舞蹈课
¥7000
年卡|游泳健身
游泳健身
¥2100
年卡|银行课程转让
银行笔试课程
¥2000
次卡|转让编程课
编程课
¥2000
次卡|音乐大师课
声乐课和主持课
¥6000
年卡|转小说推文视频的课程,包括生成视频的永久会员的软件
新媒体视频课程
¥300
次卡|半价转让70节小班课
小班课
¥2800
年卡|长春top star舞蹈课
爵士舞和街舞
¥2490
年卡|由于本人工作原因,没有精力学习
注册会计师
¥2000
年卡|扇贝编程Python
编程
¥1200