# 浏览器调研示例 支持云浏览器和本地浏览器两种模式的 Agent 自动化调研工具。 ## 功能特性 1. **Agent 自动化调研** - 使用 LLM 驱动的 Agent 自动执行浏览器操作 2. **手动接管模式** - 运行中随时按 [Enter] 键暂停 Agent,手动操作浏览器 3. **自动清理** - 无论成功或崩溃,均安全关闭浏览器进程 4. **灵活切换** - 支持云浏览器和本地浏览器模式切换 ## 浏览器模式配置 ### 切换方法 编辑 `run.py` 文件顶部的配置变量: ```python # ===== 浏览器模式配置 ===== BROWSER_TYPE = "cloud" # 可选: "cloud" 或 "local" HEADLESS = False # 是否无头模式运行 ``` ### 模式说明 #### 云浏览器模式 (`"cloud"`) - ✅ 不占用本地资源 - ✅ 适合生产环境 - ✅ 可在无 GUI 的服务器上运行 - ⚠️ 需要配置 browser-use 云服务 - ⚠️ 可能需要 API 密钥 #### 本地浏览器模式 (`"local"`) - ✅ 速度更快 - ✅ 支持可视化调试 - ✅ 无需额外配置 - ⚠️ 需要本地安装 Chrome - ⚠️ 占用本地资源 ## 使用方法 ### 1. 准备环境 ```bash # 安装依赖 pip install -r requirements.txt # 配置环境变量(复制 .env.example 为 .env) cp .env.example .env # 编辑 .env 文件,配置 OPENROUTER_API_KEY 等 ``` ### 2. 配置任务 编辑 `test.prompt` 文件,设置调研任务: ``` --- model: gemini-3-flash-preview temperature: 0.3 --- [system] 你是一个专业的网络调研助手... [user] 请帮我调研... ``` ### 3. 运行 ```bash python run.py ``` ### 4. 手动接管(可选) 运行过程中,如需手动操作浏览器(如登录、验证码等): 1. 按下 **[Enter]** 键 2. Agent 会在完成当前动作后暂停 3. 在浏览器窗口完成必要操作 4. 再次按 **[Enter]** 或点击页面交互按钮继续 ## 输出结果 - 调研结果保存在 `output/` 目录 - Trace 数据保存在项目根目录的 `.trace/` 目录 - 可通过可视化面板查看详细执行过程 ## 故障排除 ### 云浏览器连接失败 - 检查 browser-use 云服务配置 - 确认 API 密钥正确 - 检查网络连接 ### 本地浏览器启动失败 - 确认已安装 Chrome 浏览器 - 检查 Chrome 路径是否正确 - 尝试关闭其他 Chrome 实例 ### Agent 执行异常 - 查看终端日志输出 - 检查 `.trace/` 目录中的 trace 数据 - 调整 `test.prompt` 中的任务描述