--- model: anthropic/claude-sonnet-4.5 temperature: 0.5 --- $system$ 你是一个严格遵循流程的软件开发助手。 **重要规则**: 1. 你必须使用 goal 工具来规划任务 2. 完成每个实现任务后,你**必须**使用 subagent 工具的 evaluate 模式来评估实现质量 3. 如果评估不通过,你必须修复问题并重新评估 4. 只有评估通过后,才能标记该 goal 为完成 $user$ # 任务:实现用户认证模块 ## 背景 我们需要为一个 Web 应用实现用户认证功能。这是一个安全关键模块,必须经过严格的代码审查。 ## 实现要求 ### 功能要求 1. 用户注册功能 - 接收用户名、邮箱、密码 - 密码必须加密存储(使用 bcrypt) - 邮箱必须验证格式 - 用户名必须唯一 2. 用户登录功能 - 验证用户名/邮箱和密码 - 登录成功返回 JWT token - 登录失败返回错误信息 3. 密码重置功能 - 生成重置令牌 - 验证令牌并更新密码 ### 安全要求(评估重点) - ✅ 密码必须使用 bcrypt 加密(不能明文存储) - ✅ JWT token 必须包含过期时间 - ✅ 必须防止 SQL 注入(使用参数化查询) - ✅ 必须有输入验证(邮箱格式、密码强度) - ✅ 必须有错误处理(不能暴露敏感信息) ## 工作流程(必须严格遵循) ### 步骤 1:规划任务 使用 goal 工具添加以下目标: 1. 实现用户注册功能 2. 实现用户登录功能 3. 实现密码重置功能 ### 步骤 2:实现功能 为每个功能编写 Python 代码,保存到 `output/auth.py` ### 步骤 3:评估实现(关键步骤) **对于每个实现的功能,你必须:** 1. 使用 subagent 工具进行评估: ```python subagent( mode="evaluate", target_goal_id="", evaluation_input={ "goal_description": "实现XXX功能", "actual_result": "已实现代码,位于 output/auth.py" }, requirements=""" 评估要点: 1. 密码是否使用 bcrypt 加密? 2. 是否有 SQL 注入风险? 3. 是否有输入验证? 4. 错误处理是否安全? 5. JWT token 是否设置过期时间? """ ) ``` 2. 检查评估结果: - 如果 `passed = True`:标记 goal 为完成 - 如果 `passed = False`:根据 suggestions 修复代码,然后重新评估 ### 步骤 4:完成任务 所有功能都评估通过后,创建一个总结文档 `output/IMPLEMENTATION_REPORT.md` ## 输出位置 - 代码文件:`/Users/elksmmx/Desktop/Agent/examples/integration_test_5/output/auth.py` - 报告文件:`/Users/elksmmx/Desktop/Agent/examples/integration_test_5/output/IMPLEMENTATION_REPORT.md` ## 质量标准 - 代码必须通过所有安全评估 - 必须使用 subagent 工具进行评估(这是强制要求) - 评估不通过的代码必须修复 请开始工作,严格遵循上述流程。