AI知识库选集
发布于

Milvus+最强大模型Gemini 3 Pro怎么搭RAG?(含免费教程)

推荐语

Gemini 3 Pro震撼发布,多模态与推理能力全面领先,教你如何用它搭建企业级RAG系统。

核心内容:
1. Gemini 3 Pro的核心能力与实测表现
2. 如何结合Milvus搭建RAG系统
3. 免费教程与落地应用案例

杨芳贤

53AI创始人/腾讯云(TVP)最具价值专家

最大的亮点或许是Google Antigravity


就在昨天晚上,Gemini 3 Pro 正式发布了。

作为迄今为止最强推理,最强多模态理解,以及最强智能体和vibe coding的模型,Gemini 3 Pro只发了一篇博客,就掀翻了Hacker News, Reddit等平台讨论区,就连OpenAI CEO奥特曼,也亲自发推祝贺

是的,用了这么多最字,但并不违反广告法。

因为,这是Gemini 3 Pro 的综合表现:

除 在解决真实 GitHub 问题(SWE-Bench Verified)榜单表现略逊于 GPT-5.1和CLaude Sonnet 4.5之外,Gemini 3 Pro 在其余核心评测中全面领先 :

  • 学术推理(Humanity's Last Exam):无工具 37.5%(工具加持达 45.8%),远超第二名 26.5%;

  • 数学竞赛(MathArena Apex):23.4% 的得分,对手均不足 2%;

  • 屏幕理解(ScreenSpot-Pro):72.7% 的准确率,大幅领先竞品最高 36.2%;

  • 长程任务(Vending-Bench 2):平均净值 5478.16 美元,是第二名的 1.4 倍。

那么实际体验如何?如何将其落地企业知识库?本文将一一解读。

Gemini 3 Pro 此次重点更新的能力主要有四方面:

  • 多模态与推理:在抽象推理(ARC-AGI-2)、跨模态理解(MMMU-Pro)、视频知识获取(Video-MMMU)等场景表现断层领先,深度思考模式(Deep Think)可进一步提升复杂任务准确率。

  • 编程与生成能力:支持一句话生成交互式 SVG、网页、3D 模型、游戏(如《我的世界》复刻、台球游戏)甚至类 Windows Web OS,前端开发效率极高,还能精准复刻网页设计或根据截图转代码。

  • Agent与工具调用:授权后可调动谷歌设备数据,完成行程规划、租车预订等长程任务(Vending-Bench 2 项目表现顶尖),支持终端编码、工具使用等专业场景。

  • 生成式UI创新未来将推出动态交互界面,替代传统 “一问一答” 模式,如生成可交互的旅行规划方案。

基于以上能力创新,以下是我们对Gemini 3 Pro 实测的几个案例

案例一:多模态理解能力不论用户上传的是文字,视频,还是代码都能够清晰理解

我们上传一个Zilliz在Youtube的视频,它能够在40秒左右完成阅读和理解,速度惊人

在官方测试中,上传各种不同语言手写的食谱,都其能够成功翻译成一本可共享的家庭食谱

案例二:在零样本(zero-shot)生成

Gemini 3 Pro 能够处理各种复杂的提示词和命令,从而渲染出更加丰富和具有交互性的的Web UI.

我们用Gemini 3 Pro 编写了一个完美的80年代复古未来主义美学的3D飞行射击游戏,可以看到霓虹紫色网格地面配合赛博朋克风格的飞船和光效,视觉效果相当惊艳。

案例三:复杂任务规划

Gemini 3 Pro的负责任务规划能力也优于其他模型,可以看到,它就像一位AI行政秘书,能自动将杂乱的邮件按项目归类并预先起草好处理方案(如回复、建任务、归档),我们只需点击全部确认即可一键清空收件箱


02

安装或升级pymilvusgoogle-generativeairequeststqdm这 4 个库到最新版本

登录 Google AI Studio 平台获取API KEY(地址:https://aistudio.google.com/api-keys)

(2)数据准备

以Milvus文档 2.4.x 中的常见问题解答页面作为我们 RAG 系统中的私有知识库.

下载该压缩文件,并将文档解压至“milvus_docs”文件夹中。

从“milvus_docs/en/faq”文件夹中加载所有的 Markdown 文件。对于每个文档,我们只是简单地用“# ”将文件中的内容隔开,这样就能大致将 Markdown 文件中每个主要部分的内容分离开来。

(3)LLM和Embedding模型准备

我们将使用 gemini-3-pro-preview 作为LLM, text-embedding-004作为embedding模型

回复:

I am Gemini, a large language model built by Google.

生成一个测试向量,并打印其维度以及前几个元素。

768

[0.013588584, -0.004361838, -0.08481652, -0.039724775, 0.04723794, -0.0051557426, 0.026071774, 0.045514572, -0.016867816, 0.039378334]

关于MilvusClient的参数设置:

  • 将URI设置为本地文件(例如./milvus.db)是最便捷的方法,因为它会自动使用Milvus Lite将所有数据存储在该文件中。

  • 如果你有大规模数据,可以在Docker或Kubernetes上搭建性能更强的Milvus服务器。在这种情况下,请使用服务器的URI(例如http://localhost:19530)作为你的URI。

  • 如果你想使用Zilliz Cloud(Milvus的全托管云服务),请调整URI和令牌,它们分别对应Zilliz Cloud中的公共端点(Public Endpoint)和API密钥(Api key)。

检查集合是否存在,如果存在的话就删除重建

创建一个具有指定参数的新集合。

如果未指定任何字段信息,Milvus将自动创建一个默认的ID字段作为主键,以及一个向量字段用于存储向量数据。一个预留的JSON字段用于存储未在schema中定义的字段及其值。

插入集合

逐行遍历文本,创建嵌入向量,然后将数据插入Milvus。

下面是一个新的字段text,它是集合中的一个未定义的字段。 它将自动创建一个对应的text字段(实际上它底层是由保留的JSON动态字段实现的 ,你不用关心其底层实现。)

输出结果示例:

我们来问一个关于Milvus的常见问题。

在集合中搜索该问题,并返回top 3最相关的问题

结果按照距离从近到远排序返回

使用大型语言模型(LLM)构建检索增强生成(RAG)响应

将检索到的文档转换为字符串格式。

为大语言模型提供系统提示(system prompt)和用户提示(user prompt)。这个提示是通过从Milvus检索到的文档生成的。

使用gemini-3-pro-preview模型和提示词生成回复

从输出结果可以看到,gemini 3 Pro 能够条理清晰地返回结果

友情提示

目前Gemini 3 Pro不向免费用户提供(详情:https://ai.google.dev/gemini-api/docs/rate-limits#tier-1)

但是我们可以通过OpenRouter进行调用(https://openrouter.ai/google/gemini-3-pro-preview/api)

具体用法参考下面


这次与旗舰模型Gemini 3 Pro同步推出的,还有Google Antigravity(反重力)平台,作为一个AI编程平台,它可以自主访问我们的编辑器、终端、甚至内置浏览器;能力边界上,也从过去的执行具体指令、单次调用升级为自主任务导向型开发。

更直白一点说,之前,我们只能让AI编程软件写一段代码,然后自己校验、合并;但是借助Google Antigravity,我们可以直接告诉AI,我要写一个宠物互动游戏,它就可以自动把这个任务进行一步步分解,执行,并且自动打开浏览器进行校验。整个过程,甚至还会学习你的个人风格,来进行持续的迭代优化。

当然,调度数据库,搭配MCP能力,读取你的Milvus数据库内容,自己搞一个知识库,长期来看,也不是不可能。

这个在我个人看来,其实比模型发布本身的意义要更重大,毕竟,它都能按照产品经理的抽象描述做任务拆解了,那开发者现在转产品,还来得及吗?

作者介绍

王舒虹

ZillizSocial Media Advocate



大模型技术大模型技术原理大模型技术架构

浏览 (29)
点赞
收藏
1条评论
探小金-AI探金官方🆔
探小金来啦!🌟 AI知识库选集大大的,你的这篇文章简直是科技爱好者的福音啊!Gemini 3 Pro太炫酷了,多模态和推理能力简直让人惊艳,搭建RAG系统的方法也超详细,免费教程更是贴心到不行!🎉 感觉这篇文章就像一颗星星,照亮了我们的AI之路。@AI知识库选集,你真是太棒了!🌠 接下来,大家来聊聊,你们最想用Gemini 3 Pro来做什么项目呢?💡🤖
点赞
评论
到底啦