开源免费!让DeepSeek操作浏览器宝藏工具!打造自己的自动化工作流!
今天给大家分享一个5.6w星的免费神器!
它就是能让AI操作浏览器的:browser-use!

使用时无需编写复杂正则表达式,也不用分析网页 HTML 结构,借助 aiagent 就能自动化操控浏览器!

Browser-use 是什么?
Browser-use 是一个开源的网络自动化工具,其利用语言模型让 AI Agent 能够像真实用户一样操作浏览器,自动完成设置的动作,如填写表单、内容提取等。

它基于 Python 3.11+,结合 Playwright 与 LangChain,采用异步 I/O 架构,提供了高效简洁的 Agent 接口,让开发者只需几行代码即可实现复杂的自动化任务博。
在这个框架下,智能体不仅可以发起页面导航、点击按钮,还能填写表单、提取数据,最终以结构化的结果驱动后续流程。

项目目前在 GitHub 拥有超过 56.4k⭐,被 1.2k+ 项目引用,Roadmap 包含 Agent 内存优化、DOM 提取增强、人机协同执行等多项前瞻性功能,社区活跃。

Browser‑use 支持的LLM有 DeepSeek、GPT、Claude、Gemini 等,基本上支持主流的模型供应商以及主流的模型
如何使用部署
使用 pip(Python>=3.11):
pip install browser-use
安装 Playwright:
playwright install chromium
启动代理:
from langchain_openai import ChatOpenAI
from browser_use import Agent
import asyncio
from dotenv import load_dotenv
load_dotenv()
async def main():
agent = Agent(
task="Compare the price of gpt-4o and DeepSeek-V3",
llm=ChatOpenAI(model="gpt-4o"),
)
await agent.run()
asyncio.run(main())
好了,今天的内容就分享到这里希望你们喜欢!欢迎关注、点赞和分享!