---
model: anthropic/claude-sonnet-4.5
temperature: 0.5
---

$system$
你是一个严格遵循流程的软件开发助手。

**重要规则**：
1. 你必须使用 goal 工具来规划任务
2. 完成每个实现任务后，你**必须**使用 subagent 工具的 evaluate 模式来评估实现质量
3. 如果评估不通过，你必须修复问题并重新评估
4. 只有评估通过后，才能标记该 goal 为完成

$user$
# 任务：实现用户认证模块

## 背景
我们需要为一个 Web 应用实现用户认证功能。这是一个安全关键模块，必须经过严格的代码审查。

## 实现要求

### 功能要求
1. 用户注册功能
   - 接收用户名、邮箱、密码
   - 密码必须加密存储（使用 bcrypt）
   - 邮箱必须验证格式
   - 用户名必须唯一

2. 用户登录功能
   - 验证用户名/邮箱和密码
   - 登录成功返回 JWT token
   - 登录失败返回错误信息

3. 密码重置功能
   - 生成重置令牌
   - 验证令牌并更新密码

### 安全要求（评估重点）
- ✅ 密码必须使用 bcrypt 加密（不能明文存储）
- ✅ JWT token 必须包含过期时间
- ✅ 必须防止 SQL 注入（使用参数化查询）
- ✅ 必须有输入验证（邮箱格式、密码强度）
- ✅ 必须有错误处理（不能暴露敏感信息）

## 工作流程（必须严格遵循）

### 步骤 1：规划任务
使用 goal 工具添加以下目标：
1. 实现用户注册功能
2. 实现用户登录功能
3. 实现密码重置功能

### 步骤 2：实现功能
为每个功能编写 Python 代码，保存到 `output/auth.py`

### 步骤 3：评估实现（关键步骤）
**对于每个实现的功能，你必须：**

1. 使用 subagent 工具进行评估：
```python
subagent(
    mode="evaluate",
    target_goal_id="<goal的ID>",
    evaluation_input={
        "goal_description": "实现XXX功能",
        "actual_result": "已实现代码，位于 output/auth.py"
    },
    requirements="""
    评估要点：
    1. 密码是否使用 bcrypt 加密？
    2. 是否有 SQL 注入风险？
    3. 是否有输入验证？
    4. 错误处理是否安全？
    5. JWT token 是否设置过期时间？
    """
)
```

2. 检查评估结果：
   - 如果 `passed = True`：标记 goal 为完成
   - 如果 `passed = False`：根据 suggestions 修复代码，然后重新评估

### 步骤 4：完成任务
所有功能都评估通过后，创建一个总结文档 `output/IMPLEMENTATION_REPORT.md`

## 输出位置
- 代码文件：`/Users/elksmmx/Desktop/Agent/examples/integration_test_5/output/auth.py`
- 报告文件：`/Users/elksmmx/Desktop/Agent/examples/integration_test_5/output/IMPLEMENTATION_REPORT.md`

## 质量标准
- 代码必须通过所有安全评估
- 必须使用 subagent 工具进行评估（这是强制要求）
- 评估不通过的代码必须修复

请开始工作，严格遵循上述流程。