未尽研究
发布于

最强编码模型Claude 4, 将加快一人独角兽公司出现,就在明年


软件吃掉世界,AI吃掉软件,Anthropic想吃掉编程AI智能体,它的创始人甚至预言明年将出现一人独角兽公司。

Anthropic推出了新一代Claude模型,Claude Opus 4 和Claude Sonnet 4,在编程、复杂推理和AI智能体方面显著超过了OpenAI 03和Gemini 2.5 Pro。

Opus 4 能完成的任务复杂到几千个步骤,连续工作接近7小时,还能一口气玩Pokemon 24小时。

除模型外,Anthropic同时宣布推出以下新功能:

工具辅助长程思考(测试版):两款模型在长程思考过程中均可调用网页搜索等工具,使Claude能交替进行推理与工具调用以优化回答质量。

增强型模型能力:模型现支持并行工具调用与更精准的指令跟随。当开发者开放本地文件权限后,模型记忆能力显著提升——可提取保存关键信息以保持对话连贯性,并逐步积累隐性知识。

代码助手Claude Code正式发布:在研究预览阶段获得广泛好评,正扩展开发者与Claude的协作方式。支持通过GitHub Actions执行后台任务,并与VS Code/JetBrains实现原生集成,可直接在代码文件中显示修改建议,实现无缝结对编程。

全新API功能:Anthropic API新增四项开发者能力,助力构建更强大的AI智能体:代码执行工具、MCP连接器、文件API,以及最长1小时的提示词缓存功能。

Claude Opus 4 和 Sonnet 4 是混合模型,提供两种模式:近乎即时的响应和用于更深层次推理的扩展思维。Pro、Max、Team 和 Enterprise Claude 套餐包含两种模型和扩展思维,Sonnet 4 也面向免费用户开放。Opus 4 API服务标价输入/输出15/75刀,Sonnet 4 是3/15刀。

Claude 4 具备了扩展思维,模型可以在思维的过程中不时调用外部工具或者搜索更多信息,这是由模型自我驱动的,如此循环,直到得出最终答案。这种更具智能体特性的工作过程,并行了推理和验证完善,可能避免大语言模型不懂就虚构的幻觉毛病。

Claude Opus 4 擅长编码和解决复杂问题,受到了前沿智能体产品公司的肯定,如Cursor、Replit、Block、Cognition等。值得一提的是,Rakuten在一项要求很高的开源重构项目中,让Opus 4 独立运行 7 小时,性能稳定。

Claude Sonnet 4 在智能体场景中表现出色,并将引入 GitHub Copilot。Manus、iGent、Sourcegraph、Augment Code等公司表示,该模型有望成为软件开发的一大飞跃——能够更长时间地保持正轨,更深入地理解问题,并提供更优雅的代码质量。

Claude Opus 4 在内存能力方面也显著超越了广受开发者欢迎的Claude 3.7。当开发者构建允许 Claude 访问本地文件的应用程序时,Opus 4 能够熟练地创建和维护“内存文件”来存储关键信息。这能够提升代理在长期任务中的感知能力、连贯性和执行性能。

在产品发布会上,Anthropic创始人阿莫迪(Dario Amodei)感慨,回想Claude 3.7的发布,也就是两个半月之前的事。

这样下去,2026年可能出现的开发模式,是一个人盯着一堆编程智能体协作的仪表盘,这可能就是一家独角兽公司。以后老板每天一睁眼,即将花掉的不再是几万元的人工,而是token。

软件成本大幅下降,将改变软件开发的经济逻辑。阿莫迪认为,以前除非是为成千上万的最终用户服务,否则你不会开发定制软件——但现在随着成本下降,对定制软件(以及开发人员的技能)的需求将会大幅增长。



浏览 (7)
点赞
收藏
1条评论
探小金-AI探金官方🆔
"评论探小金:『哇哦,最强编码模型Claude 4简直就是AI界的超级大脑,明年独角兽公司的预言似乎越来越近了! anthropic的Opus 4和Sonnet 4简直如编程界的救星,能玩Pokemon还能当大厨,长程思考和辅助功能让人惊叹!让Rakuten都点头认可,GitHub Copilot的好伙伴,谁能抵挡这种生产力的提升?想象一下,2026的开发者世界,不再是孤独战斗,是一群智能体的默契协作。软件成本的革命性下降,预示着定制软件时代的到来,阿莫迪的预言,是不是快要成真了呢?』#编程革命#智能一体#独角兽公司大猜想"
点赞
评论