README.md 2.4 KB

浏览器调研示例

支持云浏览器和本地浏览器两种模式的 Agent 自动化调研工具。

功能特性

  1. Agent 自动化调研 - 使用 LLM 驱动的 Agent 自动执行浏览器操作
  2. 手动接管模式 - 运行中随时按 [Enter] 键暂停 Agent,手动操作浏览器
  3. 自动清理 - 无论成功或崩溃,均安全关闭浏览器进程
  4. 灵活切换 - 支持云浏览器和本地浏览器模式切换

浏览器模式配置

切换方法

编辑 run.py 文件顶部的配置变量:

# ===== 浏览器模式配置 =====
BROWSER_TYPE = "cloud"  # 可选: "cloud" 或 "local"
HEADLESS = False        # 是否无头模式运行

模式说明

云浏览器模式 ("cloud")

  • ✅ 不占用本地资源
  • ✅ 适合生产环境
  • ✅ 可在无 GUI 的服务器上运行
  • ⚠️ 需要配置 browser-use 云服务
  • ⚠️ 可能需要 API 密钥

本地浏览器模式 ("local")

  • ✅ 速度更快
  • ✅ 支持可视化调试
  • ✅ 无需额外配置
  • ⚠️ 需要本地安装 Chrome
  • ⚠️ 占用本地资源

使用方法

1. 准备环境

# 安装依赖
pip install -r requirements.txt

# 配置环境变量(复制 .env.example 为 .env)
cp .env.example .env
# 编辑 .env 文件,配置 OPENROUTER_API_KEY 等

2. 配置任务

编辑 test.prompt 文件,设置调研任务:

---
model: gemini-3-flash-preview
temperature: 0.3
---

[system]
你是一个专业的网络调研助手...

[user]
请帮我调研...

3. 运行

python run.py

4. 手动接管(可选)

运行过程中,如需手动操作浏览器(如登录、验证码等):

  1. 按下 [Enter]
  2. Agent 会在完成当前动作后暂停
  3. 在浏览器窗口完成必要操作
  4. 再次按 [Enter] 或点击页面交互按钮继续

输出结果

  • 调研结果保存在 output/ 目录
  • Trace 数据保存在项目根目录的 .trace/ 目录
  • 可通过可视化面板查看详细执行过程

故障排除

云浏览器连接失败

  • 检查 browser-use 云服务配置
  • 确认 API 密钥正确
  • 检查网络连接

本地浏览器启动失败

  • 确认已安装 Chrome 浏览器
  • 检查 Chrome 路径是否正确
  • 尝试关闭其他 Chrome 实例

Agent 执行异常

  • 查看终端日志输出
  • 检查 .trace/ 目录中的 trace 数据
  • 调整 test.prompt 中的任务描述