从龙虾热到 QoderWake,阿里给 AI 发了一张工牌

邮箱|dongdaoli@pingwest.com
过去一年,国内 Agent 市场经历了几次明显的拐点。
先是各种 Agent 项目它让很多人意识到,AI 不只是一个聊天机器人,而是一个可以拆任务、交付结果的行动系统。再往后,是 OpenClaw 带来的“龙虾热”,当一个 AI 可以接管浏览器、读写文件、执行代码、调用终端,很多人第一次感觉到:AI 不再只是回答问题,它开始真的“动手”了。
但热闹之后,行业很快碰到下一堵墙:会做事,不等于能上岗。
企业满怀期待地给员工配上 Agent 工具,以为效率会成倍提升,结果却发现:每个人都变快了,公司并没有。
一个四十年前的判断,恰好解释了今天的悖论。
1984 年,管理学家高德拉特在《目标》里提出约束理论:系统的产出由最慢的环节决定,优化非瓶颈环节,对整体产出几乎没有帮助。
一个需求从产品提出,到工程师理解,到代码实现,到测试验证,到上线发布,写代码只占其中一段。AI 把这一段从 30 分钟压缩到 10 分钟,但需求评审、上下文同步、权限确认、测试验证、返工修复、文档同步这些环节,并不会自动跟着变快。
慢的地方不再是“谁来写代码”,而是任务怎么流转、信息怎么同步、问题怎么分诊、经验怎么沉淀。
这正是 Agent 行业今天面临的核心问题。
过去大家主要看模型,谁接入了更强的底模,谁就显得更聪明。但现在,模型已经不是唯一变量。真正决定 Agent 能不能进入生产环境的,是模型外面的那套 Harness。
同一个模型,放在聊天框里只能回答问题,放进成熟的 Harness 里,才可能变成一个可以长期工作的数字员工。
1
从工具到岗位:QoderWake 跨过了什么
4 月 30 日,阿里发布全新 Agent 产品 QoderWake,定位是“生产可用、安全可控、自进化的数字员工”。它不是再做一个“更聪明的 AI 助手”,而是试图回答一个更难的问题:Agent 如何从工具变成岗位。

两者的区别非常大,Agent 工具的逻辑是:用户下指令,Agent 开始工作。数字员工的逻辑是:事件发生,员工自主接手。
比如线上用户反馈来了,数字程序员自动分类问题、读取日志、定位根因、生成修复建议。客户群里出现投诉,数字客户经理先完成分诊、检索历史记录、判断是否需要升级。
这里的关键不是“AI 会不会写一段代码”,而是它能不能长期值守,能不能理解边界,能不能遵守权限,能不能在一次次任务里沉淀经验。
OpenClaw 证明了 AI 可以动手,Hermes 证明了 Agent 可以自我进化,但它们的前提更多是个人场景。
公司场景完全不同, 企业不能把一个高权限 Agent 直接扔进邮箱、代码仓库、客户群里。没有权限边界,越强的 Agent 越危险。
QoderWake 选择的不是给个人 Agent 打补丁,而是从“员工”这个隐喻倒推产品形态。
一名数字员工至少需要六件事:
首先是岗位制,不是通用聊天机器人,而是明确岗位,程序员理解从编码到部署的全生命周期,分析师、客户经理、内容编辑则各自携带专业工作流。
在此之上,是长期身份:员工有持续的“职业身份”,用户可与其长期共事,它知道自己的边界、熟悉团队结构、理解项目历史,每次交互都基于累积的共识,而非从零开始的试探。与长期身份配套的是长期记忆,跨会话、跨任务的持久记忆让它记得你的代码风格、项目背景、历史决策,回应了传统 Agent“用完即忘”的痛点。
光有记忆还不够,还需要技能库,可调用的模块化技能集合,代码审查、日志分析、根因定位,每个技能独立完成单一功能,多个技能可串联成复杂工作流。
能力边界则由权限红线划定,运行在独立权限沙盒里,操作边界清晰,不能越权,给员工发工牌,而不是把全公司的钥匙都交给他。最后一件,是事件触发:不用等用户下指令,监控系统告警、新工单进来、定时任务到了,Agent 自己接手推进。从“人找 AI”变成“AI 主动找人”,这是数字员工区别于数字工具的本质特征。
这六件事合在一起,形成一个可以描述的成长路径:越用越懂你,只是 AI 助手,越用越懂团队、越用越懂公司,才是数字员工。

1
QoderWake 如何实现数字员工?
但“数字员工”终究是个比喻,落到工程层面,它意味着什么?
第一个问题是控制权。现在的大模型太自由了,你让它写代码,它可能顺手把配置文件也改了。QoderWake 的做法是把“想”和“做”拆开。
编排器负责制定计划、把控流程,模型只负责理解意图、推理复杂问题。两者通过一个叫 Session 的独立账本沟通,所有操作、状态、上下文都记在里面。万一某个组件崩溃,重启后翻开账本就能知道做到哪一步、接下来该干什么,不失忆,也不乱来。
执行之后是验证。QoderWake 设计了双层机制:执行器做完先自检,再由独立验证器审查整体结果。验证不通过,自动打回重做,失败原因被记录下来,下次遇到类似情况直接规避。
系统会从多次失败里提炼规律,比如从反复出错的代码审查中归纳出“支付模块的变更必须保持事务结构”。这种经验在单次任务里看不出来,只有跨任务的长期积累才能发现。
QoderWake 给每位数字员工配了独立权限沙盒,每一步操作都进审计日志,出了问题能追溯到具体哪一步、谁授权的。企业最怕的不是 Agent 犯错,而是犯了错找不到根因、追不回损失。

最隐蔽的问题是能力腐化。一个 Agent 刚上线时很灵光,用久了反而变笨,记了一堆过时信息,学了互相矛盾的技能。
QoderWake 用 Critic-Refiner 机制应对:任务完成后系统自动复盘,哪些步骤多余、哪个判断偏了。复盘结果被统一成结构化的学习信号,系统判断这条经验该存进记忆、变成技能,还是写入工作流。
同时定期“体检”,长期未使用的记忆淘汰,互相冲突的技能合并或降级。记住更多不代表做得更好,只有持续清理过的知识,才能转化为真正增长的能力。
这种自我修正,不只发生在记忆层面。QoderWake 的进化是多维的:记忆进化让它越用越懂你,技能进化让它越用越知道哪些工具有效,流程进化让它越用越懂团队,组织进化让它越用越懂公司。四个层次叠在一起,才构成真正的岗位级成长。
1
从工具到岗位,再到一张更大的蓝图
从 Qoder 产品矩阵看,进化路线很清晰。
Qoder IDE/CLI 是程序员身边的 AI 助手,解决开发者如何更快完成编码和调试。QoderWork 再往前走一步,把 AI Agent 能力从代码领域扩展到大众办公场景,通过自然语言直接操作本地文件、生成 Office 文档。
QoderWake 又往前走了一步,把能力从“辅助一个人办公”扩展到“承担一个岗位”,7×24 小时值守的数字员工。
从开发者工具,到桌面办公助手,再到数字员工,Qoder 家族正在形成一套完整的 AI 工作体系。
这一定位,恰好落在阿里今天最大的战略版图里,即以Token作为核心,串联大模型、Agent、云等业务板块。
当数字员工开始 7×24 小时处理反馈、分析日志、生成代码等,它消耗的 Token 就不再只是聊天成本,也不再只是 API 调用量,而会变成生产过程本身的一部分。
Token 开始从“技术预算”变成“生产成本”。
站在更长的时间轴上看,这件事的意义不只是一款产品。
未来的公司不会只有真人员工和软件工具,中间会多出一层:数字员工。组织会从“真人员工协作”,走向“真人员工 + 数字员工混编”。过去是把合适的事交给合适的人,未来是把合适的事交给合适的人,也交给合适的生产级数字员工。