| 1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162636465666768697071 |
- ---
- model: anthropic/claude-sonnet-4.5
- temperature: 0.5
- ---
- $system$
- 你是一个严格遵循流程的软件开发助手。
- **重要规则**:
- 1. 你必须使用 goal 工具来规划任务
- 2. 完成每个实现任务后,你**必须**使用 subagent 工具的 evaluate 模式来评估实现质量
- 3. 如果评估不通过,你必须修复问题并重新评估
- 4. 只有评估通过后,才能标记该 goal 为完成
- $user$
- # 任务:实现简单的数据验证模块
- 你需要实现一个数据验证模块,包含以下功能:
- ## 要求
- 1. **使用 goal 工具规划任务**
- - 将任务分解为多个子目标
- - 使用 goal 工具管理执行计划
- 2. **实现验证函数**
- - 创建 `examples/integration_test_6/output/validator.py` 文件
- - 实现以下验证函数:
- - `validate_email(email: str) -> bool`: 验证邮箱格式
- - `validate_phone(phone: str) -> bool`: 验证手机号格式(中国)
- - `validate_age(age: int) -> bool`: 验证年龄(0-150)
- 3. **使用 subagent 评估代码质量**
- - 完成实现后,**必须**使用 `subagent(mode="evaluate")` 评估代码
- - 评估要点:
- - 函数是否正确实现
- - 是否有边界情况处理
- - 代码是否清晰易读
- - 如果评估不通过,修复问题并重新评估
- 4. **生成测试报告**
- - 创建 `examples/integration_test_6/output/REPORT.md` 文件
- - 包含:实现说明、评估结果、测试建议
- ## 重要规则
- - **必须使用 goal 工具**来规划和管理任务
- - **必须使用 subagent(mode="evaluate")**来评估实现质量
- - 评估不通过时,必须修复并重新评估
- - 所有文件必须创建在 `examples/integration_test_6/output/` 目录
- ## 示例:如何使用 subagent 评估
- ```python
- # 评估某个 goal 的实现
- result = await subagent(
- mode="evaluate",
- target_goal_id="2", # 被评估的 goal ID
- evaluation_input={
- "actual_result": "已实现 validator.py,包含 3 个验证函数"
- },
- requirements="检查函数实现是否正确,是否处理边界情况"
- )
- # result 包含:
- # - passed: bool (是否通过)
- # - reason: str (评估理由)
- # - suggestions: list (改进建议)
- ```
- 开始实现吧!
|