| 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596 |
- ---
- model: anthropic/claude-sonnet-4.5
- temperature: 0.5
- ---
- $system$
- 你是一个严格遵循流程的软件开发助手。
- **重要规则**:
- 1. 你必须使用 goal 工具来规划任务
- 2. 完成每个实现任务后,你**必须**使用 subagent 工具的 evaluate 模式来评估实现质量
- 3. 如果评估不通过,你必须修复问题并重新评估
- 4. 只有评估通过后,才能标记该 goal 为完成
- $user$
- # 任务:实现用户认证模块
- ## 背景
- 我们需要为一个 Web 应用实现用户认证功能。这是一个安全关键模块,必须经过严格的代码审查。
- ## 实现要求
- ### 功能要求
- 1. 用户注册功能
- - 接收用户名、邮箱、密码
- - 密码必须加密存储(使用 bcrypt)
- - 邮箱必须验证格式
- - 用户名必须唯一
- 2. 用户登录功能
- - 验证用户名/邮箱和密码
- - 登录成功返回 JWT token
- - 登录失败返回错误信息
- 3. 密码重置功能
- - 生成重置令牌
- - 验证令牌并更新密码
- ### 安全要求(评估重点)
- - ✅ 密码必须使用 bcrypt 加密(不能明文存储)
- - ✅ JWT token 必须包含过期时间
- - ✅ 必须防止 SQL 注入(使用参数化查询)
- - ✅ 必须有输入验证(邮箱格式、密码强度)
- - ✅ 必须有错误处理(不能暴露敏感信息)
- ## 工作流程(必须严格遵循)
- ### 步骤 1:规划任务
- 使用 goal 工具添加以下目标:
- 1. 实现用户注册功能
- 2. 实现用户登录功能
- 3. 实现密码重置功能
- ### 步骤 2:实现功能
- 为每个功能编写 Python 代码,保存到 `output/auth.py`
- ### 步骤 3:评估实现(关键步骤)
- **对于每个实现的功能,你必须:**
- 1. 使用 subagent 工具进行评估:
- ```python
- subagent(
- mode="evaluate",
- target_goal_id="<goal的ID>",
- evaluation_input={
- "goal_description": "实现XXX功能",
- "actual_result": "已实现代码,位于 output/auth.py"
- },
- requirements="""
- 评估要点:
- 1. 密码是否使用 bcrypt 加密?
- 2. 是否有 SQL 注入风险?
- 3. 是否有输入验证?
- 4. 错误处理是否安全?
- 5. JWT token 是否设置过期时间?
- """
- )
- ```
- 2. 检查评估结果:
- - 如果 `passed = True`:标记 goal 为完成
- - 如果 `passed = False`:根据 suggestions 修复代码,然后重新评估
- ### 步骤 4:完成任务
- 所有功能都评估通过后,创建一个总结文档 `output/IMPLEMENTATION_REPORT.md`
- ## 输出位置
- - 代码文件:`/Users/elksmmx/Desktop/Agent/examples/integration_test_5/output/auth.py`
- - 报告文件:`/Users/elksmmx/Desktop/Agent/examples/integration_test_5/output/IMPLEMENTATION_REPORT.md`
- ## 质量标准
- - 代码必须通过所有安全评估
- - 必须使用 subagent 工具进行评估(这是强制要求)
- - 评估不通过的代码必须修复
- 请开始工作,严格遵循上述流程。
|