Milvus+最强大模型Gemini 3 Pro怎么搭RAG?(含免费教程)
推荐语
Gemini 3 Pro震撼发布,多模态与推理能力全面领先,教你如何用它搭建企业级RAG系统。
核心内容:
1. Gemini 3 Pro的核心能力与实测表现
2. 如何结合Milvus搭建RAG系统
3. 免费教程与落地应用案例

杨芳贤
53AI创始人/腾讯云(TVP)最具价值专家

最大的亮点或许是Google Antigravity

就在昨天晚上,Gemini 3 Pro 正式发布了。
作为迄今为止最强推理,最强多模态理解,以及最强智能体和vibe coding的模型,Gemini 3 Pro只发了一篇博客,就掀翻了Hacker News, Reddit等平台讨论区,就连OpenAI CEO奥特曼,也亲自发推祝贺

是的,用了这么多最字,但并不违反广告法。
因为,这是Gemini 3 Pro 的综合表现:
除 在解决真实 GitHub 问题(SWE-Bench Verified)榜单表现略逊于 GPT-5.1和CLaude Sonnet 4.5之外,Gemini 3 Pro 在其余核心评测中全面领先 :
学术推理(Humanity's Last Exam):无工具 37.5%(工具加持达 45.8%),远超第二名 26.5%;
数学竞赛(MathArena Apex):23.4% 的得分,对手均不足 2%;
屏幕理解(ScreenSpot-Pro):72.7% 的准确率,大幅领先竞品最高 36.2%;
长程任务(Vending-Bench 2):平均净值 5478.16 美元,是第二名的 1.4 倍。

那么实际体验如何?如何将其落地企业知识库?本文将一一解读。
Gemini 3 Pro 此次重点更新的能力主要有四方面:
多模态与推理:在抽象推理(ARC-AGI-2)、跨模态理解(MMMU-Pro)、视频知识获取(Video-MMMU)等场景表现断层领先,深度思考模式(Deep Think)可进一步提升复杂任务准确率。
编程与生成能力:支持一句话生成交互式 SVG、网页、3D 模型、游戏(如《我的世界》复刻、台球游戏)甚至类 Windows Web OS,前端开发效率极高,还能精准复刻网页设计或根据截图转代码。
Agent与工具调用:授权后可调动谷歌设备数据,完成行程规划、租车预订等长程任务(Vending-Bench 2 项目表现顶尖),支持终端编码、工具使用等专业场景。
生成式UI创新:未来将推出动态交互界面,替代传统 “一问一答” 模式,如生成可交互的旅行规划方案。
基于以上能力创新,以下是我们对Gemini 3 Pro 实测的几个案例
案例一:多模态理解能力(不论用户上传的是文字,视频,还是代码都能够清晰理解)
我们上传一个Zilliz在Youtube的视频,它能够在40秒左右完成阅读和理解,速度惊人


在官方测试中,上传各种不同语言手写的食谱,都其能够成功翻译成一本可共享的家庭食谱
案例二:在零样本(zero-shot)生成。
Gemini 3 Pro 能够处理各种复杂的提示词和命令,从而渲染出更加丰富和具有交互性的的Web UI.
我们用Gemini 3 Pro 编写了一个完美的80年代复古未来主义美学的3D飞行射击游戏,可以看到霓虹紫色网格地面配合赛博朋克风格的飞船和光效,视觉效果相当惊艳。
案例三:复杂任务规划
Gemini 3 Pro的负责任务规划能力也优于其他模型,可以看到,它就像一位AI行政秘书,能自动将杂乱的邮件按项目归类并预先起草好处理方案(如回复、建任务、归档),我们只需点击全部确认即可一键清空收件箱
02
安装或升级pymilvus、google-generativeai、requests、tqdm这 4 个库到最新版本
登录 Google AI Studio 平台获取API KEY(地址:https://aistudio.google.com/api-keys)
(2)数据准备
以Milvus文档 2.4.x 中的常见问题解答页面作为我们 RAG 系统中的私有知识库.
下载该压缩文件,并将文档解压至“milvus_docs”文件夹中。
从“milvus_docs/en/faq”文件夹中加载所有的 Markdown 文件。对于每个文档,我们只是简单地用“# ”将文件中的内容隔开,这样就能大致将 Markdown 文件中每个主要部分的内容分离开来。
(3)LLM和Embedding模型准备
我们将使用 gemini-3-pro-preview 作为LLM, text-embedding-004作为embedding模型
回复:
I am Gemini, a large language model built by Google.
生成一个测试向量,并打印其维度以及前几个元素。
768
[0.013588584, -0.004361838, -0.08481652, -0.039724775, 0.04723794, -0.0051557426, 0.026071774, 0.045514572, -0.016867816, 0.039378334]
关于MilvusClient的参数设置:
将URI设置为本地文件(例如./milvus.db)是最便捷的方法,因为它会自动使用Milvus Lite将所有数据存储在该文件中。
如果你有大规模数据,可以在Docker或Kubernetes上搭建性能更强的Milvus服务器。在这种情况下,请使用服务器的URI(例如http://localhost:19530)作为你的URI。
如果你想使用Zilliz Cloud(Milvus的全托管云服务),请调整URI和令牌,它们分别对应Zilliz Cloud中的公共端点(Public Endpoint)和API密钥(Api key)。
检查集合是否存在,如果存在的话就删除重建
创建一个具有指定参数的新集合。
如果未指定任何字段信息,Milvus将自动创建一个默认的ID字段作为主键,以及一个向量字段用于存储向量数据。一个预留的JSON字段用于存储未在schema中定义的字段及其值。
插入集合
逐行遍历文本,创建嵌入向量,然后将数据插入Milvus。
下面是一个新的字段text,它是集合中的一个未定义的字段。 它将自动创建一个对应的text字段(实际上它底层是由保留的JSON动态字段实现的 ,你不用关心其底层实现。)
输出结果示例:
我们来问一个关于Milvus的常见问题。
在集合中搜索该问题,并返回top 3最相关的问题
结果按照距离从近到远排序返回
使用大型语言模型(LLM)构建检索增强生成(RAG)响应
将检索到的文档转换为字符串格式。
为大语言模型提供系统提示(system prompt)和用户提示(user prompt)。这个提示是通过从Milvus检索到的文档生成的。
使用gemini-3-pro-preview模型和提示词生成回复
从输出结果可以看到,gemini 3 Pro 能够条理清晰地返回结果
友情提示
目前Gemini 3 Pro不向免费用户提供(详情:https://ai.google.dev/gemini-api/docs/rate-limits#tier-1)


但是我们可以通过OpenRouter进行调用(https://openrouter.ai/google/gemini-3-pro-preview/api)
具体用法参考下面
这次与旗舰模型Gemini 3 Pro同步推出的,还有Google Antigravity(反重力)平台,作为一个AI编程平台,它可以自主访问我们的编辑器、终端、甚至内置浏览器;能力边界上,也从过去的执行具体指令、单次调用升级为自主任务导向型开发。
更直白一点说,之前,我们只能让AI编程软件写一段代码,然后自己校验、合并;但是借助Google Antigravity,我们可以直接告诉AI,我要写一个宠物互动游戏,它就可以自动把这个任务进行一步步分解,执行,并且自动打开浏览器进行校验。整个过程,甚至还会学习你的个人风格,来进行持续的迭代优化。
当然,调度数据库,搭配MCP能力,读取你的Milvus数据库内容,自己搞一个知识库,长期来看,也不是不可能。
这个在我个人看来,其实比模型发布本身的意义要更重大,毕竟,它都能按照产品经理的抽象描述做任务拆解了,那开发者现在转产品,还来得及吗?
作者介绍

王舒虹
ZillizSocial Media Advocate

大模型技术大模型技术原理大模型技术架构