“AI 实习生”颠覆手机系统?rabbit 创始人:现有生态将遭系统性重构

4 月 3日,rabbit 发布 AI 原生操作平台 rabbit OS intern 。该系统拥有自主的通用 agent 机制,能够基于用户输入的 prompts 进行推理、规划、协调及代码级任务执行,从而构建多样化项目。当前其跨领域任务完成能力展示出实习生水平的人类智能。

同日, rabbit 创始人 Jesse Lyu 接受了 This Week in Startups podcast 的直播访谈,采访中谈到了他对 AI 软硬件的看法, rabbit OS intern 的特点和对 agent 技术的看法:
Jason Calacanis
Jesse 你好,我很欣赏你。你的公司之前发布了 rabbit 这款产品,并很成功地获得了业界的广泛关注。 rabbit r1 的发布可谓恰逢其时。
当时整个科技界对 LLMs 的热情达到顶峰,硬件创新产品备受瞩目。在你推出这款设备的时候, Humane AI Pin 等可穿戴智能硬件已经进入市场并引发关注,当时也有新闻报道 Sam Altman 计划与Jony Ive合作开发AI手机并为此进行融资,行业普遍认为“ AI 硬件”将开启巨大机遇。
但正如过往的技术 Gartner 曲线,往往人们会经历从一开始的兴奋到过高期望再到失望的心理变化过程,甚至出现怀疑和绝望,直到行业恢复冷静重新走向成熟期。
我相信你一定听说过 Gartner 曲线,那请问你们公司现在处在这条曲线上的哪个状态,你们会自我怀疑么?作为新品类的前沿科技创业者,你作为创始人如何带领团队应对市场预期波动?
Jesse Lyu
我记得一年之前就在我们的产品准备交付时,我们见过一次。首先,我想强调的是,任何实际做过硬件产品的团队,都会完全认同 Gartner 曲线所描述的几个阶段。对硬件产品来说,发布时间点的选择很值得玩味。当初我们决定打造这款橙色小智能盒子的核心原因不是否定手机的价值,而是我们认识到 LLM 这项技术极具颠覆性和创新性,随着会带来一系列系统性变革。因此我从未设想新技术理论能完全适配所有创新突破,因为当下所有的apps都运行在现有的技术框架下。今天用户使用的多数服务都被封闭在旧有的生态体系中,新的模型,比如 agent ,在一开始还很难和已有的生态进行交互。这意味着需要实现基础架构的根本性重构。因此我们清楚地意识到:要充分发挥 agent 的技术潜力,就必须建立专属平台。这和单纯想开发一款新手机或智能眼镜的路径在本质上是不同的。正是基于这种技术认知,我们才将这款设备定位为前沿技术的承载平台。
不过确实如此,我同意你说的。但我认为最初我们没有刻意过度市场营销。如果你还记得当时的细节的话,我们甚至没有参加 CES 的官方活动。我们当时是在酒店的一个临时场地录制的产品Keynote。
Jason Calacanis
是的,你应该当时都没有想到 CES 官方会将你们的产品评为当届展会上的最佳产品,并跻身各类年度最佳产品榜单。在那个时间点,你们精准的把握了行业时机一炮而红,很多投资人和合作方纷至沓来。但渐渐地, AI 硬件的第一波浪潮褪去。 Humane 关停公司业务,那些智能挂件产品也逐渐淡出公众视野。类似的,同期发布的 Apple Vision Pro 也曾引发狂热追捧,如今同样归于沉寂。我们回到原点来聊一聊你做这款产品的初心。作为创始人面对 Gartner 曲线的起伏,你是如何调整情绪,并鼓舞团队始终向着目标奋进?
Jesse Lyu
我对自己的定位是行业老兵。作为连续创业者,这不是我第一次创业。在二十岁出头时,我就经历过完整的创业周期。如今重走创业路,我已经做了充分的心理建设。但必须承认,人们对 AI 硬件产品的期待远超预期。某种意义上,我们被迫学习如何成为舆论焦点中的“科技明星”。我记得某位名人说过,大学应该开设课程教授如何应对突如起来的巨大关注,毕竟大多数人很难适应。
但我时刻提醒自己和团队,我们真正需要专注的是我们的产品,不断完善产品才能给用户提供最好的产品和用户体验,这是用户真正关注的。现在有时用户对我们的产品有过高的期待,他们希望如同想象中的场景一样使用产品,但现在理想与现实的鸿沟始终存在,目前的 AI 技术尚不能完全实现用户 的期待。
我们作为一家公司,在这些点上非常专注,一直在完善我们的产品体验。过去 12 个月我们完成 30 多次固件升级(OTA),这种迭代强度代表了我们的态度。
Alex Wihelm
你指的是对已经交付的 r1 设备进行软件更新对么?我记得,你们首批交付 r1 的产品时就售罄,之后多个批次都没有留下存货。2024年度 r1 设备的实际销售量有多少?
Jesse Lyu
目前我们的总交付设备已经超过 10 万台。目前有少量存货,在 Best Buy 和 Amazon 官方渠道销售。
Alex Wihelm
Jesse,其实我真正关注的是你们今天新发布的公告。你们发布了 rabbit OS( r1 硬件的软件操作系统)的更新版本 intern ,同时展示了一些 agent 交互的新场景。我稍后会在屏幕上同步展示。我的问题非常简单,这是否意味着你们公司在AI战略上逐渐从硬件向软件转移?
Jesse Lyu
关于硬件迭代节奏,我们确实尚未公开讨论过。但我希望在这个问题上保持高度透明。我相信这是你们一定关心的问题。实际上,我们并没有预期每一代的产品周期会在 10~12 个月之间。这个迭代周期已经和手机类似,比如每 10 个月 iPhone 和 Pixel 系列都会发布新品。我们对硬件产品迭代周期的预期并不是这样。
我认为我们依然处于早期阶段, r1 这款硬件产品对我们的意义在于能成为运行我们开发新系统的平台,这是完全区别于传统生态的系统。实现这一目标,需要在后端和云端都做出很多改变,这也是一开始我们决定自己开发新系统的原因。过去一年我们的战略重心是打造跨平台通用 agent 技术,并将其深度整合至全新的 rabbit OS系统。技术底座一旦成型,将释放多形态设备的开发潜力。事实上,我们已经有了很多研发原型可以在今年晚些时候发布。
Jason Calacanis
你个人最喜欢的硬件设备是什么,最好是很疯狂很酷的。
Jesse Lyu
回答这个问题之前我首先需要声明并不代表我们一定会研发这个形态的硬件产品。但是我真的很喜欢Sony的初代机器狗Aibo。但它和波士顿动力的产品形态和应用场景都不太一样。我始终对初代索尼Aibo情有独钟,它承载着我童年的记忆。
Alex Wihelm
是的,运用今天的 LLM 技术,你可以直接向机器犬下达指令:“到后院去巡逻,拍摄并记录你发现的野生动物”。以及“巡视整个家,实时上报区域内垃圾分布的情况” 等任务。我在家里的院子里就需要经常整理各种各样的垃圾,因为德州的风很大。试想一下,如果机器狗能告诉我哪里有垃圾或者哪里会出现土狼,那真的很酷。
Jesse Lyu
完全同意。亚马逊的 Alexa,本质上就是能在家庭环境中自主移动的智能终端。但真正让深度关注这个形态设计的核心逻辑在于:未来 AI 需具备物理操作能力——例如自主控制电灯开关或调节温控设备。尽管当下众多企业聚焦人形机器人研发,但从我的童年记忆和情感联结出发,我更倾向非人形设计。我们已经看到了很多原型设计。但有趣的是,在 agent 技术生态中,硬件实现周期很多时候反而比软件系统开发更快。
在硬件的角度,我不觉得今年会是关键的突破之年,可能是 2026 年,但我相信到 2027 年我们将迎来真正意义上的AI 手机革命——从芯片架构、技术内核到用户界面与操作系统全面重构,从而取代目前的应用市场生态。
Alex Wihelm
Jesse我想再明确一下,我的问题是硬件业务是否依然是你们的核心,听上去答案是否定的,对于你们已经售出的 10 万台 r1 设备依然提供软件更新支持。但目前你们并未对第二代硬件产品承诺任何具体时间表。但是有可能在未来的某一个时间点,会对硬件形态进行迭代,甚至可能是完全不同的形态。目前在软件测的工作,并不会改变公司在硬件端的战略愿景。此举仅为扩大软件生态开放度,与硬件核心战略并不冲突。我这样理解对么?
Jesse Lyu
完全正确。这次推出的功能是现有硬件用户所使用的操作系统,我们现正逐步向非硬件用户开放访问权限。
Jason Calacanis
我个人很希望有人能在智能手环上有新的设计和突破。我不确定你们有没有听说过例如存在一种可赠予伴侣或子女的特殊手环,它通过按压发送信号传递心意。轻触即可发送消息或震动提醒,实现情感表达。这类产品很适合情侣,也有很多厂商在研发和生产。我一直有一种想法,《星球大战》中机器人腕带式计算机的设计理念——集成物理按键实现即时通讯——正被现代智能穿戴设备借鉴。 我非常期待出现兼具美学设计与高交互性的智能手环。
我需要一款环绕前臂的可穿戴设备,并且能与我的衣服结合。这个产品可以搭载 r1 或者 r1 的操作系统,通过使用能学习我的使用偏好。如果有突发新闻,标题会通过这个设备推送给我,但我希望AI能帮我核实真实性并进行总结归纳。于此同时我能通过这个设备看到我 DoorDash 订单和 Uber 叫车的状态。
Jesse Lyu
是的,我很快补充一点:人们总是喜欢幻想在科幻电影中出现的场景。许多从未涉足硬件领域的人可能不会意识到,真正的瓶颈始终是电池技术。你可以在一个手套中集成很多传感器,但是电池的形态始终是一个阻碍。过去几十年消费级电池技术未实现飞跃性突破,电池和传感器始终是阻碍人们打造新设备形态的核心障碍之一。
Jason Calacanis
是的,但衣服的好处之一是它有口袋(便于硬件设备携带)。这非常有趣。当我在滑雪屋度假时,发现一件维修暖通空调工人留下的工装夹克。我意识到这是某家管道公司员工的外套,他们当时在更换暖气设备。但当我试图确认物主身份时,伸手摸到口袋里有个手机,就通过这个找到了信息。
我看到过一种夹克在里面被加入了大容量的电池,并能实现加热功能。然后我就想,如果你只生活在美国,你就不明白深圳、秋叶原和其他这些地方的硬件正在发生什么。20年前深圳基础设施还很简单,但现在已经非常发达,和我早年去的时候完全不一样。那里的硬件发展令人难以置信。
Jesse Lyu
是的。眼镜是另外一种有趣的硬件形态(当然这并不代表我们会做这个形态)。但显然如你所知,Meta 已经销售了很多 AI 眼镜,此外还有苹果在内的众多厂商在 VR 和 AR 眼镜方向努力研发。我对眼镜有过非常直接的看法,因为,大概 6 年前我做了 LASIK 手术,但在此之前我戴眼镜。如果你戴眼镜,这意味着你必须或你不得不每天大约8小时佩戴它们。
因此佩戴体验至关重要。因此我们内部设计团队在讨论时半开玩笑的说,如果我们要做一个眼镜形态的 rabbit 产品,我们想做类似漫画龙珠战斗力探测器的东西,而不是一个你必须真正感觉舒适的真正镜框,也许只是一个小小的屏幕,但他能作为信息中枢。我们团队在研发中有很多这样的讨论,但我觉得,我们必须在非常有限的资源下注重研发对我们重要的产品。
Alex Wihelm
好。到这里我希望多聊聊 rabbit 最新发布的 OS intern 。我一打开这个界面,首先感受到的是一种熟悉的感觉,这很像我们在 OpenAI 和 Google 的 AI 产品中看到的。所以我很好奇 rabbit 的目标到底是什么。这是你们对目前市场上AI agent 浪潮的一种回应么?
因为我很关注房地产市场,所以在采访之前,我用你们的产品生成了一份关于罗德岛的报告。过程中有一些反复,但最终给我生成了一份报告,我可以下载并继续浏览。很有意思。Jesse 帮我们介绍一下你的新产品吧。
Jesse Lyu
好。我在这里演示一下。这款产品的初衷与我们的公司使命一致。我们的使命是尝试构建跨平台的通用 agent 。这意味着我们理想的 agent 不仅能操作网站,还能直接操作应用程序,包括电脑上的应用和手机上的 apps,实现跨终端。我们从去年以来观察到的技术发展是模型在推理、规划以及代码级执行方面都越来越强。因此,如果将这三者链接在一起,就能让所有这些用例成为现实。
我可以展示一下我刚刚运行的 prompt。在之前 20 分钟的等候时间里,我对系统说“我马上要参加 Jason 的播客节目,聊一些我们最近发布的 agent 产品。能不能帮我准备一个详细的要点,并做成一个交互式网页应用”。
当使用我们的产品 intern 时,你可以把它当成具备类似人类实习生水平的能力 agent 。你不指望它成为顶尖科学家,或者达到年薪百万美元的明星工程师的能力。它就是一个 intern 的能力水平。
但这个产品令人兴奋的地方在于他在每个领域都能达到 intern 的水平。它不仅仅局限在编程领域。也不仅仅只能在房地产领域做研究。我们的产品与OpenAI、Gemini 这类产品最大的不同在于,他是一款端到端直接面对消费者的产品。所以如果你想要它做一个网站,它真的会生成一个网站。如果你想让它做一个PowerPoint,它就会生成PowerPoint。
举个例子,我非常喜欢 OpenAI、Google 和 Perplexity这三个平台。我在所有这些不同平台上都试了同样的 prompt。OpenAI GPT4o 的表现不错,做出了一个实际的网站,但内容基本就是生成的 HTML 代码和一些基本信息。我在 Gemini 2.5 Pro 上也做了尝试,它生成了一个 markdown 摘要,挺不错的,但是无法直接创建网页应用。我又在 Perplexity 上尝试,它给了些示例外部代码,打开后发现基本上就是个模板。
我们的 rabbit OS intern 有趣的地方在于:当你输入 prompt 后, rabbit OS intern 会有一个 master agent ,就像虚拟CEO一样说:"嘿大家集合一下,咱们来构建这个任务"。这个 master agent 会为其他 agent 制定完整的行动计划。
然后你会看到任务开始启动,本质上就是一群 agent 按照总体规划协作执行。所有任务自动分配给不同 agent 。你可以点击侧边栏查看后端的动态。总之这些 agent 协同工作得非常好。有的 agent 负责研究,有的开始建网站。
整个任务花了 18 分钟完成,速度还不错。现在你得到了所有这些生成的文件,可以下载。和 GPT4o 的效果对比,我们系统完成任务的质量更好。
Jason Calacanis
明白。如果有托管服务商,你完全直接可以把网站真正部署到互联网上。
Jesse Lyu
对,这部分是清晰明了的。但我需要强调的是生成内容的相关性。回想一下我的 prompt 是:"我要参加这个播客,需要准备手册"。我们得到的信息都是都高度相关的。它甚至自动创建了"自查清单"板块,写着:"检查这些,确保上节目前准备好所有材料"。我们的 agent 还做了一些这个播客受众情况的分析,总之所有内容都精准匹配。
Jason Calacanis
这些信息都很有趣。好奇这些信息和结论都是哪来的。
Jesse Lyu
其实就是整合了现有网络上的公开数据,所有公开资料。
Jason Calacanis
我在想是不是有人写了描述我主持风格的网页之类的?挺想看看数据来源引用。这功能真厉害。
Jesse Lyu
这里还有自动生成的问答环节和媒体应对建议。能明显看出这个 agent 真正理解并执行了人类特有的格式要求。这里还自动为我生成了“产品概述部分” 以备你们问到我们产品细节,我可以随时参考。但关键是要意识到我们正处在 agent 技术革命的拐点。我敢断言,所有产品很快都会具备这类AI能力。
Jason Calacanis
这本质上是一个实时运作的 AI agent 在替你完成任务。关键问题在于:结果质量如何?实际效用有多大?比如让它分析我的采访风格并做预演。如果人类完成类似的任务,我觉得他们得反复观看我和 Alex 的访谈录像,整理文字记录,耗时数小时。而 AI 可能从网络抓取了相关数据,甚至能持续进化。
Jesse Lyu
不仅如此,这个系统能创造出超乎预期的结果。比如多数 prompt 应用于非常专业严肃的场景,但我仅用一条指令就构建了一个 8/18 位音乐音序器。结果完全可运行的小型编曲工具,通过交互就能生成音乐片段。
对了,现在 rabbitOS intern 已经向所有人开放免费试用,只需要注册一个 rabbithole 账号,就能体验。r1 用户目前每天可以体验 9 次,非 r1 用户可以体验 3 次。国内电脑可以直接访问:https://hole.rabbit.tech/
精准增长:冷启动→品牌扩张全周期策略,匹配 Product-channel fit;
本土化实战:美/英/澳/加/欧洲,赋能AI科技品牌全球突围;
✦ 精选内容 ✦