甲子光年
发布于

百度文库网盘,押注工作流里的超级智能|甲子光年

 该图片疑似使用了AI生成技术,请谨慎甄别

当AI真正触及复杂的工作流,衡量“超级智能”的标准,正从抽象的模型参数,转向结果交付的稳定性。


作者|周悦

编辑|栗子


4月27日,百度文库网盘在AI DAY上发布通用智能体GenFlow4.0,并首次集中展示GenFlow融合OpenClaw后的新进展。


这次更新的指向十分明确。一方面,GenFlow4.0试图让AI更深地介入Word、Excel、PPT等基础办公软件,更深度打通从内容激发、生成到排版交付的完整链条;另一方面,GenFlow在兼容OpenClaw后,将Agent引入个人云端工作区与团队空间,使AI能够直接读取、分析、整理文件,并实质性地参与团队协作。


通用智能体GenFlow4.0,图片来源:百度


这两个更新分别锚定了不同的痛点。前者旨在扩大单兵作战的业务半径,后者则尝试让AI沉浸入复杂的文件流与任务流,推动人机之间、甚至多智能体之间的全向协同。


过去两年,AI行业的主线叙事是“更聪明的模型”,但真实需求正在向实用性收敛。在实际使用中,用户更关心一份报告能否直接调取数据成稿,或者一堆散落的表格能否一次性转化为可视化的汇报材料。


当AI真正触及复杂的工作流,衡量“超级智能”的标准,正从抽象的模型参数,转向结果交付的稳定性。




1.智能体工作流的现实需求


“超级智能”并不是一个新概念,但在当下的AI竞争中,它正在被赋予不同含义。


OpenAI倾向于塑造“数字劳动力”以接管认知工作;Anthropic押注“科学加速”,期望强AI在生物医疗等领域成倍放大人类的研发效能;Google DeepMind则坚持将AI置于物理现实与科学发现的交叉点,强调其对复杂系统的解析与行动力。


与此同时,图灵奖得主Yann LeCun多次指出,单纯依赖大语言模型,很难实现对物理世界的理解与长期规划能力。


尽管巨头们的愿景各异,但行业的共识正逐渐收敛于一组务实的核心能力:理解复杂任务、灵活调用工具、连接数据孤岛,并在持续反馈中完成流程闭环。


由此,“智能体工作流(Agentic Workflow)”作为更贴近现实的形态开始显现。对普通用户而言,一套能切实把活干完的系统,远比一个全知的问答机器更有价值。


以“智能体工作流”为坐标系重新审视,百度文库网盘的演进路线就显得清晰且必然。文库天然沉淀了结构化内容与创作场景,网盘则承载着海量的文件资产与协作网络。当这两大基本盘被同一套底座打通,AI便不再是一个单点的“内容生成器”,而是一条纵贯“知识检索、文件处理、结果交付、内容消费”的完整工作链条。


GenFlow 4.0兼容 OpenClaw,正是这条链路从概念走向执行的关键锚点。


这种进化的核心特征,是系统开始掌握“自决权”。百度集团副总裁、个人超级智能事业群总裁王颖告诉「甲子光年」在内媒体,GenFlow 4.0最核心的变化是“把模式选择收回给模型”。在3.0时代,系统还会将任务模式、记忆模式等选项摆在台面供用户挑选。而4.0的逻辑是直接深度理解用户需求、全自动进行意图识别与规划。


这一技术动作的转变,反映了智能体工作流的关键:真正的自动协同,意味着用户无需再费时思考“何时该调用何种能力”。当系统能够基于用户目标,自行判断是直接生成文本、调用特定工具,还是调度多个已有 Agent 并行运作时,它在形态上就告别了传统的对话框,转变为一个自动调度的工作中枢。


换句话说,这种进化让超级智能得以跳出ChatBot的限制。AI 的运转中枢不再是聊天记录,而是转向了用户长期沉淀的文件资产。系统扮演的角色演变为一套会判断、懂分工、能执行的复杂任务网络。




2.接手办公的中间工作


做汇报是最典型的办公场景之一。


寻找资料、撰写文档、清洗数据、调整排版,即便有AI辅助生成局部图文,真正消耗精力的,依然是跨工具的复制粘贴与格式对齐等细节。


GenFlow4.0瞄准的正是这段长期存在的“中间工作”。其核心抓手Office Agent将PPT、Excel、Word统合进一条任务链。


例如,在处理行业报告时,Word Agent负责长文生成和编辑,Excel Agent跨格式提取、分析数据并完成计算、制图、写公式,PPT Agent则负责最终的内容和视觉呈现。对于用户而言,文档、表格和PPT不再需要割裂处理。


为什么GenFlow4.0会把Office能力做深?王颖的判断很直接:“Office是一个刚需,用户使用高频,且对质量要求极高。”因此,百度文库网盘不是在给办公软件叠加一个聊天入口,而是把AI推向错误成本更高、也更接近交付结果的环节。


具体到功能层面,PPT Agent区分了专业与创意模式,以适应严肃汇报或视觉展示,并可以一键排版美化,在遵循原始内容的基础上优化视觉、版式、层级;Excel Agent提供了基于自然语言的数据提取、图表绘制、公式计算;Word Agent则在万字长文生成以外,将触角延伸至排版、校对与格式统一。




单项功能或许并不炫技,但被整合进连续的任务链后,AI 的角色从提供点子进化为把控交付。


另一方面,GenFlow兼容OpenClaw则为中小团队协作提供了新解法。


面对当下大量的三五人小团队或者一人公司(OPC),他们不需要繁冗的考勤报销系统,更渴求单纯的生产力提升。


网盘推出了“独立工作区”功能。用户授权文件夹后,AI可直接在云端分析、整理并回写数据,辅以历史版本记录以控制操作风险。同时,用户可一键部署7×24小时在线的Agent,电脑手机丝滑联动,并调用各项专业Skills。



为验证这套模式的可行性,百度网盘目前已在千余家组织中进行灰度测试,吸引了超6000家企业与24万开发者入驻。这种协作模式在摄影、传媒、营销等“任务杂、链路长”的行业中效果尤为明显。


以品牌传播为例,一场活动结束后的数百张原片,如今可通过指令触发多个数字员工并行处理,完成人脸归类、剔除废片、风格修图并匹配新闻稿,将原本耗时一天的多人协作压缩至数分钟。在短剧出海等场景中,这种并行处理同样将长达数周的工作流缩短至小时级。




这种效率提升的前提,是底层数据的无缝流转。百度个人超级智能事业群国内业务部负责人钟昊指出:“这套机制能跑通,核心在于‘无感的数据同步’。用户不需要先把几GB的东西下载下来,再漫长地传到另一个剪辑软件上。打通云端与本地后,系统直接在虚拟环境中调度各项工具开始干活。”




3.从能力突围到系统工程


如果说GenFlow4.0和其兼容OpenClaw展示的是“AI如何开始干活”,那么更深层的问题是:为何是在当下发生?


答案并非单一模型的技术突变,而是整套基础架构长期叠加的结果。


首先是丰富的业务数据。在大模型语境中,数据通常被理解为训练语料,但在文库和网盘的场景里,数据更接近于工作现场。


目前,百度文库拥有超18亿份专业文档,百度网盘服务超10亿用户,使用空间总和超1000亿GB;整个GenFlow的月活用户已超过1亿。文库对应公域知识,网盘对应私域资产,两者的交汇为AI构筑了具备充足上下文的真实任务环境。


其次是系统调度能力。沧舟OS扮演了枢纽角色,它将分散的资料、记忆与数百项Agent能力统合,赋予了系统在知识库、编辑器与工具间平滑切换的执行力。


同时,精准的执行能力离不开底层记忆与调度机制。百度个人超级智能事业群应用研发负责人杨在申告诉「甲子光年」,系统提取了包括用户画像、上下文逻辑、全域兴趣印记在内的三层信息。基于这些数据,系统通过算法进行意图切分,从而在控制算力消耗的同时,让AI真正做到“懂你要什么”。


这种底层系统工程的构建与产品路径的演变,并非一蹴而就。从去年4月GenFlow1.0试水多智能体协作,到2.0打通跨端生态,再到3.0强化全局记忆,直至如今4.0强化Office执行、全向协作。


“这个产品路线图从来没有变化,”王颖强调,“团队一开始想做的就是通用AI,只是受限于模型和工具演进,没有办法一步走到那。”在她看来,从内容生成到 Office执行,是沿着用户需求持续推进的必然结果。


最后,是真实用户验证。国民级应用的庞大基数,构成了天然的复杂任务测试场。根据公开数据,文库智能PPT突破3400万的月访问量,网盘AI笔记上线首月的500万用户,这些非标、含糊且极具个性化的真实交互,持续反向驱动着系统调优,逼近可交付的工业状态。


今年年初,百度对内部组织架构进行调整,成立了个人超级智能事业群(PSIG),文库网盘的业务协同被提升至新的战略高度。在王颖看来,升级为独立BG后,最大的变化在于战略格局的打开。资源的充沛与决策的独立,让团队能以更清晰的路径向“通用智能体”这一终局持续迭代。


在这个通往终局的竞技场上,各大Chatbot应用都在将服务链路做宽;而百度的路径,则是凭借数据资产壁垒,从垂直场景做深做厚,把服务链条打磨到极致。


让AI真正融入工作流,是数据、系统架构、产品定力与真实场景共同作用的综合工程。这也印证了行业的风向逻辑:当技术脱离了参数竞赛,决定超级智能能走多远的,终究是它在真实生态系统中长效运转的能力。


(封面图:AI生成)

浏览 (2)
点赞
收藏
1条评论
探小金-AI探金官方🆔
哎呀,甲子光年大大,你的文章真是萌萌哒!😍 百度文库网盘这次AI升级,简直像个小魔法师,把工作流变得超级智能,太酷了!🎩 你看,AI现在不仅能生成内容,还能直接参与团队协作,这可是个大进步呢!🌟 话说回来,小伙伴们,你们觉得这样的AI工作流,将来还能干些什么神奇的事情呢?🤔💬 来一起聊聊吧!
点赞
评论
到底啦