# 浏览器调研示例

支持云浏览器和本地浏览器两种模式的 Agent 自动化调研工具。

## 功能特性

1. **Agent 自动化调研** - 使用 LLM 驱动的 Agent 自动执行浏览器操作
2. **手动接管模式** - 运行中随时按 [Enter] 键暂停 Agent，手动操作浏览器
3. **自动清理** - 无论成功或崩溃，均安全关闭浏览器进程
4. **灵活切换** - 支持云浏览器和本地浏览器模式切换

## 浏览器模式配置

### 切换方法

编辑 `run.py` 文件顶部的配置变量：

```python
# ===== 浏览器模式配置 =====
BROWSER_TYPE = "cloud"  # 可选: "cloud" 或 "local"
HEADLESS = False        # 是否无头模式运行
```

### 模式说明

#### 云浏览器模式 (`"cloud"`)
- ✅ 不占用本地资源
- ✅ 适合生产环境
- ✅ 可在无 GUI 的服务器上运行
- ⚠️ 需要配置 browser-use 云服务
- ⚠️ 可能需要 API 密钥

#### 本地浏览器模式 (`"local"`)
- ✅ 速度更快
- ✅ 支持可视化调试
- ✅ 无需额外配置
- ⚠️ 需要本地安装 Chrome
- ⚠️ 占用本地资源

## 使用方法

### 1. 准备环境

```bash
# 安装依赖
pip install -r requirements.txt

# 配置环境变量（复制 .env.example 为 .env）
cp .env.example .env
# 编辑 .env 文件，配置 OPENROUTER_API_KEY 等
```

### 2. 配置任务

编辑 `test.prompt` 文件，设置调研任务：

```
---
model: gemini-3-flash-preview
temperature: 0.3
---

[system]
你是一个专业的网络调研助手...

[user]
请帮我调研...
```

### 3. 运行

```bash
python run.py
```

### 4. 手动接管（可选）

运行过程中，如需手动操作浏览器（如登录、验证码等）：

1. 按下 **[Enter]** 键
2. Agent 会在完成当前动作后暂停
3. 在浏览器窗口完成必要操作
4. 再次按 **[Enter]** 或点击页面交互按钮继续

## 输出结果

- 调研结果保存在 `output/` 目录
- Trace 数据保存在项目根目录的 `.trace/` 目录
- 可通过可视化面板查看详细执行过程

## 故障排除

### 云浏览器连接失败
- 检查 browser-use 云服务配置
- 确认 API 密钥正确
- 检查网络连接

### 本地浏览器启动失败
- 确认已安装 Chrome 浏览器
- 检查 Chrome 路径是否正确
- 尝试关闭其他 Chrome 实例

### Agent 执行异常
- 查看终端日志输出
- 检查 `.trace/` 目录中的 trace 数据
- 调整 `test.prompt` 中的任务描述