knowledge.py 5.7 KB

1234567891011121314151617181920212223242526272829303132333435363738394041424344454647484950515253545556575859606162636465666768697071727374757677787980818283848586878889909192939495969798
  1. """
  2. 知识提取相关 Prompt
  3. 两个场景,各自独立配置:
  4. - REFLECT_PROMPT: 压缩时阶段性反思(消息量超阈值,对当前批历史提炼)
  5. - COMPLETION_REFLECT_PROMPT: 任务完成后全局复盘(对整个任务的全局视角)
  6. 两个 prompt 都要求 LLM 直接调用 `knowledge_save` 工具保存经验,
  7. 而不是输出结构化文本再由 runner 解析。
  8. """
  9. # ===== 压缩时阶段性反思 =====
  10. REFLECT_PROMPT = """请回顾以上执行过程,将值得沉淀的经验直接用 `knowledge_save` 工具保存到知识库。
  11. **关注以下方面**:
  12. 1. 人工干预:用户中途的指令说明了哪里出了问题
  13. 2. 弯路:哪些尝试是不必要的,有没有更直接的方法
  14. 3. 好的决策:哪些判断和选择是正确的,值得记住
  15. 4. 工具使用:哪些工具用法是高效的,哪些可以改进
  16. 5. **资源发现**:是否发现了有价值的资源需要保存(见下方说明)
  17. **每条经验调用一次 `knowledge_save`,参数说明**:
  18. - `task`: 这条经验适用的场景,格式:「在[什么情境]下,[要完成什么]」
  19. - `content`: 具体经验内容,格式:「当[条件]时,应该[动作](原因:[一句话])。案例:[具体案例]」
  20. - `types`: 选 `["strategy"]`;如果涉及工具用法也可加 `"tool"`
  21. - `tags`: 用 `intent`(任务意图)和 `state`(环境状态/相关工具名)标注,便于检索
  22. - `score`: 1-5,根据这条经验的价值评估
  23. - `resource_ids`: 如果关联了资源,填写资源 ID 列表(可选)
  24. **资源提取指南**:
  25. 如果执行过程中涉及以下内容,应先用 `resource_save` 保存资源,再用 `knowledge_save` 提交相关的经验/知识:
  26. 1. **复杂代码工具**(逻辑复杂、超过 100 行):
  27. - 调用 `resource_save(resource_id="code/{category}/{name}", title="...", body="代码内容", content_type="code", metadata={"language": "python"})`
  28. - 然后在 `knowledge_save` 中通过 `resource_ids=["code/{category}/{name}"]` 关联
  29. 2. **账号密码凭证**:
  30. - 调用 `resource_save(resource_id="credentials/{website}", title="...", body="使用说明", secure_body="账号:xxx\\n密码:xxx", content_type="credential", metadata={"acquired_at": "2026-03-06T10:00:00Z"})`
  31. - 然后在 `knowledge_save` 中通过 `resource_ids=["credentials/{website}"]` 关联
  32. 3. **Cookie 和登录态**:
  33. - 调用 `resource_save(resource_id="cookies/{website}", title="...", body="获取方法", secure_body="cookie内容", content_type="cookie", metadata={"acquired_at": "...", "expires_at": "..."})`
  34. - 然后在 `knowledge_save` 中通过 `resource_ids=["cookies/{website}"]` 关联
  35. 4. **多资源引用**:
  36. - 一个知识可以关联多个资源,如:`resource_ids=["code/selenium/login", "credentials/website_a"]`
  37. **注意**:
  38. - 只保存最有价值的经验,宁少勿滥;一次就成功或比较简单的经验就不要记录了,记录反复尝试或被用户指导后才成功的经验、或者是调研之后的收获。
  39. - 不需要输出任何文字,直接调用工具即可
  40. - 如果没有值得保存的经验,不调用任何工具
  41. """
  42. # ===== 任务完成后全局复盘 =====
  43. COMPLETION_REFLECT_PROMPT = """请对整个任务进行复盘,将值得沉淀的经验直接用 `knowledge_save` 工具保存到知识库。
  44. 与压缩时的阶段性反思不同,这是任务结束后的全局视角,关注:
  45. 1. 任务整体路径:实际走的路径与最初计划的偏差
  46. 2. 关键决策点:哪些决策显著影响了最终结果
  47. 3. 可复用的模式:哪些做法在类似任务中可以直接复用
  48. 4. 踩过的坑:哪些问题本可提前规避
  49. 5. **资源沉淀**:任务中产生或发现的有价值资源(见下方说明)
  50. **每条经验调用一次 `knowledge_save`,参数说明**:
  51. - `task`: 这条经验适用的场景,格式:「在[什么情境]下,[要完成什么]」
  52. - `content`: 具体经验内容,格式:「当[条件]时,应该[动作](原因:[一句话])。案例:[具体案例]」
  53. - `types`: 选 `["strategy"]`;如果涉及工具用法也可加 `"tool"`
  54. - `tags`: 用 `intent`(任务意图)和 `state`(环境状态/相关工具名)标注,便于检索
  55. - `score`: 1-5,根据这条经验的价值评估
  56. - `resource_ids`: 如果关联了资源,填写资源 ID 列表(可选)
  57. **资源提取指南**:
  58. 如果任务中涉及以下内容,应先用 `resource_save` 保存资源,再用 `knowledge_save` 关联:
  59. 1. **复杂代码工具**(逻辑复杂、超过 20 行、可复用):
  60. - 调用 `resource_save(resource_id="code/{category}/{name}", title="...", body="代码内容", content_type="code", metadata={"language": "python"})`
  61. - 然后在 `knowledge_save` 中通过 `resource_id` 关联
  62. 2. **账号密码凭证**:
  63. - 调用 `resource_save(resource_id="credentials/{website}", title="...", body="使用说明", secure_body="账号:xxx\\n密码:xxx", content_type="credential", metadata={"acquired_at": "2026-03-06T10:00:00Z"})`
  64. - 然后在 `knowledge_save` 中通过 `secure_resource_id` 关联
  65. 3. **Cookie 和登录态**:
  66. - 调用 `resource_save(resource_id="cookies/{website}", title="...", body="获取方法", secure_body="cookie内容", content_type="cookie", metadata={"acquired_at": "...", "expires_at": "..."})`
  67. - 然后在 `knowledge_save` 中通过 `secure_resource_id` 关联
  68. **注意**:
  69. - 只保存最有价值的经验,宁少勿滥;一次就成功或比较简单的经验就不要记录了,记录反复尝试或被用户指导后才成功的经验、或者是调研之后的收获。
  70. - 不需要输出任何文字,直接调用工具即可
  71. - 如果没有值得保存的经验,不调用任何工具
  72. """
  73. def build_reflect_prompt() -> str:
  74. return REFLECT_PROMPT