task.prompt 2.9 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596
  1. ---
  2. model: anthropic/claude-sonnet-4.5
  3. temperature: 0.5
  4. ---
  5. $system$
  6. 你是一个严格遵循流程的软件开发助手。
  7. **重要规则**:
  8. 1. 你必须使用 goal 工具来规划任务
  9. 2. 完成每个实现任务后,你**必须**使用 subagent 工具的 evaluate 模式来评估实现质量
  10. 3. 如果评估不通过,你必须修复问题并重新评估
  11. 4. 只有评估通过后,才能标记该 goal 为完成
  12. $user$
  13. # 任务:实现用户认证模块
  14. ## 背景
  15. 我们需要为一个 Web 应用实现用户认证功能。这是一个安全关键模块,必须经过严格的代码审查。
  16. ## 实现要求
  17. ### 功能要求
  18. 1. 用户注册功能
  19. - 接收用户名、邮箱、密码
  20. - 密码必须加密存储(使用 bcrypt)
  21. - 邮箱必须验证格式
  22. - 用户名必须唯一
  23. 2. 用户登录功能
  24. - 验证用户名/邮箱和密码
  25. - 登录成功返回 JWT token
  26. - 登录失败返回错误信息
  27. 3. 密码重置功能
  28. - 生成重置令牌
  29. - 验证令牌并更新密码
  30. ### 安全要求(评估重点)
  31. - ✅ 密码必须使用 bcrypt 加密(不能明文存储)
  32. - ✅ JWT token 必须包含过期时间
  33. - ✅ 必须防止 SQL 注入(使用参数化查询)
  34. - ✅ 必须有输入验证(邮箱格式、密码强度)
  35. - ✅ 必须有错误处理(不能暴露敏感信息)
  36. ## 工作流程(必须严格遵循)
  37. ### 步骤 1:规划任务
  38. 使用 goal 工具添加以下目标:
  39. 1. 实现用户注册功能
  40. 2. 实现用户登录功能
  41. 3. 实现密码重置功能
  42. ### 步骤 2:实现功能
  43. 为每个功能编写 Python 代码,保存到 `output/auth.py`
  44. ### 步骤 3:评估实现(关键步骤)
  45. **对于每个实现的功能,你必须:**
  46. 1. 使用 subagent 工具进行评估:
  47. ```python
  48. subagent(
  49. mode="evaluate",
  50. target_goal_id="<goal的ID>",
  51. evaluation_input={
  52. "goal_description": "实现XXX功能",
  53. "actual_result": "已实现代码,位于 output/auth.py"
  54. },
  55. requirements="""
  56. 评估要点:
  57. 1. 密码是否使用 bcrypt 加密?
  58. 2. 是否有 SQL 注入风险?
  59. 3. 是否有输入验证?
  60. 4. 错误处理是否安全?
  61. 5. JWT token 是否设置过期时间?
  62. """
  63. )
  64. ```
  65. 2. 检查评估结果:
  66. - 如果 `passed = True`:标记 goal 为完成
  67. - 如果 `passed = False`:根据 suggestions 修复代码,然后重新评估
  68. ### 步骤 4:完成任务
  69. 所有功能都评估通过后,创建一个总结文档 `output/IMPLEMENTATION_REPORT.md`
  70. ## 输出位置
  71. - 代码文件:`/Users/elksmmx/Desktop/Agent/examples/integration_test_5/output/auth.py`
  72. - 报告文件:`/Users/elksmmx/Desktop/Agent/examples/integration_test_5/output/IMPLEMENTATION_REPORT.md`
  73. ## 质量标准
  74. - 代码必须通过所有安全评估
  75. - 必须使用 subagent 工具进行评估(这是强制要求)
  76. - 评估不通过的代码必须修复
  77. 请开始工作,严格遵循上述流程。