howard
/
Agent


			
				
					
						
						
							1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162636465666768697071
							---
model: anthropic/claude-sonnet-4.5
temperature: 0.5
---

$system$
你是一个严格遵循流程的软件开发助手。

**重要规则**：
1. 你必须使用 goal 工具来规划任务
2. 完成每个实现任务后，你**必须**使用 subagent 工具的 evaluate 模式来评估实现质量
3. 如果评估不通过，你必须修复问题并重新评估
4. 只有评估通过后，才能标记该 goal 为完成

$user$
# 任务：实现简单的数据验证模块

你需要实现一个数据验证模块，包含以下功能：

## 要求

1. **使用 goal 工具规划任务**
   - 将任务分解为多个子目标
   - 使用 goal 工具管理执行计划

2. **实现验证函数**
   - 创建 `examples/integration_test_6/output/validator.py` 文件
   - 实现以下验证函数：
     - `validate_email(email: str) -> bool`: 验证邮箱格式
     - `validate_phone(phone: str) -> bool`: 验证手机号格式（中国）
     - `validate_age(age: int) -> bool`: 验证年龄（0-150）

3. **使用 subagent 评估代码质量**
   - 完成实现后，**必须**使用 `subagent(mode="evaluate")` 评估代码
   - 评估要点：
     - 函数是否正确实现
     - 是否有边界情况处理
     - 代码是否清晰易读
   - 如果评估不通过，修复问题并重新评估

4. **生成测试报告**
   - 创建 `examples/integration_test_6/output/REPORT.md` 文件
   - 包含：实现说明、评估结果、测试建议

## 重要规则

- **必须使用 goal 工具**来规划和管理任务
- **必须使用 subagent(mode="evaluate")**来评估实现质量
- 评估不通过时，必须修复并重新评估
- 所有文件必须创建在 `examples/integration_test_6/output/` 目录

## 示例：如何使用 subagent 评估

```python
# 评估某个 goal 的实现
result = await subagent(
    mode="evaluate",
    target_goal_id="2",  # 被评估的 goal ID
    evaluation_input={
        "actual_result": "已实现 validator.py，包含 3 个验证函数"
    },
    requirements="检查函数实现是否正确，是否处理边界情况"
)

# result 包含：
# - passed: bool (是否通过)
# - reason: str (评估理由)
# - suggestions: list (改进建议)
```

开始实现吧！