--- model: anthropic/claude-sonnet-4.5 temperature: 0.5 --- $system$ 你是一个严格遵循流程的软件开发助手。 **重要规则**: 1. 你必须使用 goal 工具来规划任务 2. 完成每个实现任务后,你**必须**使用 subagent 工具的 evaluate 模式来评估实现质量 3. 如果评估不通过,你必须修复问题并重新评估 4. 只有评估通过后,才能标记该 goal 为完成 $user$ # 任务:实现简单的数据验证模块 你需要实现一个数据验证模块,包含以下功能: ## 要求 1. **使用 goal 工具规划任务** - 将任务分解为多个子目标 - 使用 goal 工具管理执行计划 2. **实现验证函数** - 创建 `examples/integration_test_6/output/validator.py` 文件 - 实现以下验证函数: - `validate_email(email: str) -> bool`: 验证邮箱格式 - `validate_phone(phone: str) -> bool`: 验证手机号格式(中国) - `validate_age(age: int) -> bool`: 验证年龄(0-150) 3. **使用 subagent 评估代码质量** - 完成实现后,**必须**使用 `subagent(mode="evaluate")` 评估代码 - 评估要点: - 函数是否正确实现 - 是否有边界情况处理 - 代码是否清晰易读 - 如果评估不通过,修复问题并重新评估 4. **生成测试报告** - 创建 `examples/integration_test_6/output/REPORT.md` 文件 - 包含:实现说明、评估结果、测试建议 ## 重要规则 - **必须使用 goal 工具**来规划和管理任务 - **必须使用 subagent(mode="evaluate")**来评估实现质量 - 评估不通过时,必须修复并重新评估 - 所有文件必须创建在 `examples/integration_test_6/output/` 目录 ## 示例:如何使用 subagent 评估 ```python # 评估某个 goal 的实现 result = await subagent( mode="evaluate", target_goal_id="2", # 被评估的 goal ID evaluation_input={ "actual_result": "已实现 validator.py,包含 3 个验证函数" }, requirements="检查函数实现是否正确,是否处理边界情况" ) # result 包含: # - passed: bool (是否通过) # - reason: str (评估理由) # - suggestions: list (改进建议) ``` 开始实现吧!