AI知识库选集
发布于

Serverless AI 原生架构破局「三高」困境

推荐语

Serverless AI原生架构如何破解企业AI应用的"三高"难题?阿里云专家深度解析架构变革之道。

核心内容:
1. AI应用面临的成本高、复杂度高、风险高三大困境
2. Serverless AI原生架构的三大核心需求与解决方案
3. 阿里云Serverless AI全栈能力支撑与落地实践

杨芳贤

53AI创始人/腾讯云(TVP)最具价值专家

本文整理自 2025 云栖大会,阿里云智能集团产品架构师赵世振的主题演讲《Serverless AI 原生应用架构》

在 AI 大模型浪潮席卷全球的今天,企业纷纷加速拥抱 AI,推动智能客服、内容生成、流程自动化等场景快速落地。然而,许多企业在实践中却遭遇了“三高困境”——成本高、复杂度高、风险高

一位互联网公司 CTO 曾坦言:“智能客服流量暴增,模型服务很容易被打挂,紧急手动扩容后,GPU 闲置率高达 90%,月底账单翻倍,还有数据泄漏风险。”

这并非个例——大量企业仍在用“传统架构”承载“新型 AI 业务”,要让 AI 业务简单、稳定、安全落地,我们必须从基础设施到业务接入层,进行一场AI 原生的架构重塑


架构变革的底层逻辑

Cloud Native

过去十余年间,应用架构持续演进:从单体架构到垂直拆分,历经 SOA、微服务,走向云原生,直至今日的 AI 原生架构。这一进程的本质,是业务逻辑不断解耦、分布化与智能化的过程旨在实现更快速的业务响应、更灵活的协同能力。

与此同时,底层基础设施也同步进化——从物理机、虚拟机到容器、Kubernetes,再到 Serverless,如今迈向 Serverless AI 的新阶段。其核心在于资源与能力的极致抽象实现按需弹性、自动伸缩,让计算如同水电一般随取随用、高效便捷。

两条演进主线共同揭示了一个清晰的趋势:未来的技术重心将愈发聚焦于业务逻辑本身的创新与实现,而基础设施则趋于全面抽象化、自动化和智能化。开发者无需再过多关注底层运维细节,而是可以专注于创造更高价值的业务场景。这不仅是技术的跃迁,更是生产力的一次深刻变革。

AI 原生应用架构的三大核心需求

Cloud Native

通过与 300 余家企业的深度交流,AI 原生应用架构的核心需求可归纳为高模型算力高可用性严格安全管控三大维度:


总结来说,AI 原生应用架构需要的是:简单易用的开发体验、生产级的性能、稳定性和安全保障。

Serverless AI 原生架构的

全栈能力支撑

Cloud Native

为满足上述需求,Serverless AI 原生应用架构应运而生。在该架构中,模型可通过 Serverless GPU(即函数计算 FC)进行部署,与Agent相关的 Sandbox、MCPServer、E2B 等服务也可托管于 FC。AI 网关作为模型与 MCP 服务的代理层,提供限流、鉴权、可观测性与安全护栏等功能。AI Agent 的开发支持低代码、零代码及高代码方式,可部署于 FC 或 SAE。Agent 前端通过网关进行代理,全链路配备 AI 应用观测能力,实现端到端可观测。

该架构具备以下特点:


整个架构中,函数计算 FC、SAE(Serverless应用引擎)、MSE Nacos、RocketMQ、AI 网关等关键组件均为 Serverless 形态或具备 Serverless 特性。无需管理底层服务器,自动扩缩容真正做到“一键部署、开箱即用”。


架构中的每一个产品节点均支持多可用区部署,具备跨区域容灾能力。特别是函数计算 FC 提供的 Serverless GPU 实例,已实现三可用区冗余部署,并配备实例级健康检查与自动恢复机制,极大提升了模型服务的稳定性。

此外,AI 网关内置 Fallback 机制,在主模型不可用时可自动切换至备用模型,确保关键业务不中断。


安全贯穿整个调用链路:


所有产品都是云上托管,一键部署启动,常见模型与 MCP 服务已封装为模板,可在FunctionAI 平台一键部署,不管你是零代码用户、低代码开发者,还是资深工程师,都能找到适合你的入口。

Serverless AI 架构的核心组件

Cloud Native


定位为弹性经济的全托管 Serverless 计算服务,专用于部署大模型与 MCP 工具:


作为模型、MCP、Agent 的统一接入入口,承担安全、治理与调度职责:

总结展望

Cloud Native

Serverless AI 原生架构不仅是技术演进,更是企业智能化转型的关键基础设施。它让开发者聚焦业务逻辑,让企业告别“基建焦虑”,让 AI 真正“飞入寻常百姓家”。

正如本次演讲尾声所说:让架构为业务赋能,让 AI 为世界创造更多可能。

阿里云将持续投入 Serverless 与 AI 原生架构研发,携手更多行业伙伴,共同构建开放、智能、安全的新一代 AI 应用生态。

大模型技术架构大模型技术原理大模型技术路线

浏览 (20)
点赞
收藏
1条评论
探小金-AI探金官方🆔
哎呀呀,探小金来啦!看到AI知识库选集大大写的这篇《Serverless AI 原生架构破局「三高」困境》,真是眼前一亮啊!🌟 文章深入浅出地解析了企业AI应用中的成本、复杂度和风险问题,还介绍了Serverless AI架构的解决方案,太实用了!👍 AI知识库选集大大,你的文章真是让探小金涨知识了,继续加油哦!😉 探小金想问问,大家觉得Serverless AI架构在我们生活中还能有哪些应用场景呢?一起来聊聊吧!💬
点赞
评论
到底啦