hace 1 mes · 13024d5c93
--- a/agent/cli/extraction_review.py
+++ b/agent/cli/extraction_review.py
@@ -0,0 +1,267 @@
 
				+"""
			
 
				+提取审核交互式 CLI
			
 
				+
			
 
				+用途
			
 
				+----
			
 
				+反思侧分支产出的知识条目默认写为 cognition_log: type="extraction_pending"，
			
 
				+不会直接上传到 KnowHub。本 CLI 提供人工审核 + 批量提交入口。
			
 
				+
			
 
				+两种入口（共享同一核心逻辑，见 agent/trace/extraction_review.py）：
			
 
				+- 独立脚本：python -m agent.cli.extraction_review --trace <TRACE_ID> [--list|--review|--commit]
			
 
				+- interactive.py 菜单项 8/9（见 agent/cli/interactive.py）
			
 
				+
			
 
				+用法示例
			
 
				+--------
			
 
				+# 查看当前 trace 的所有未审核条目
			
 
				+python -m agent.cli.extraction_review --trace abc-123 --list
			
 
				+
			
 
				+# 交互式逐条审核
			
 
				+python -m agent.cli.extraction_review --trace abc-123 --review
			
 
				+
			
 
				+# 把已 approved 的条目批量提交到 KnowHub
			
 
				+python -m agent.cli.extraction_review --trace abc-123 --commit
			
 
				+
			
 
				+# 一条龙：review 完直接 commit
			
 
				+python -m agent.cli.extraction_review --trace abc-123
			
 
				+"""
			
 
				+
			
 
				+from __future__ import annotations
			
 
				+
			
 
				+import argparse
			
 
				+import asyncio
			
 
				+import json
			
 
				+import sys
			
 
				+from pathlib import Path
			
 
				+from typing import List, Optional
			
 
				+
			
 
				+from agent.trace.store import FileSystemTraceStore
			
 
				+from agent.trace.extraction_review import (
			
 
				+    PendingExtraction,
			
 
				+    CommitReport,
			
 
				+    list_pending,
			
 
				+    review_one,
			
 
				+    commit_approved,
			
 
				+)
			
 
				+
			
 
				+
			
 
				+# ===== 打印工具 =====
			
 
				+
			
 
				+_SEP = "─" * 60
			
 
				+
			
 
				+
			
 
				+def _format_payload(payload: dict, max_content: int = 400) -> str:
			
 
				+    task = payload.get("task", "")
			
 
				+    content = payload.get("content", "")
			
 
				+    types = payload.get("types", [])
			
 
				+    tags = payload.get("tags", {})
			
 
				+    score = payload.get("score", 0)
			
 
				+    resource_ids = payload.get("resource_ids", [])
			
 
				+
			
 
				+    if len(content) > max_content:
			
 
				+        content = content[:max_content] + "…(truncated)"
			
 
				+
			
 
				+    lines = [
			
 
				+        f"task:  {task}",
			
 
				+        f"types: {types}   score: {score}",
			
 
				+    ]
			
 
				+    if tags:
			
 
				+        lines.append(f"tags:  {tags}")
			
 
				+    if resource_ids:
			
 
				+        lines.append(f"resources: {resource_ids}")
			
 
				+    lines.append("")
			
 
				+    lines.append(content)
			
 
				+    return "\n".join(lines)
			
 
				+
			
 
				+
			
 
				+def _print_pending(p: PendingExtraction, index: int, total: int) -> None:
			
 
				+    state = ""
			
 
				+    if p.committed:
			
 
				+        state = " [已提交]"
			
 
				+    elif p.reviewed:
			
 
				+        state = f" [已审核: {p.decision}]"
			
 
				+    print()
			
 
				+    print(f"[{index}/{total}] {p.extraction_id}{state}")
			
 
				+    print(_SEP)
			
 
				+    print(_format_payload(p.payload))
			
 
				+    print(_SEP)
			
 
				+
			
 
				+
			
 
				+def _print_report(report: CommitReport) -> None:
			
 
				+    print()
			
 
				+    print("=" * 60)
			
 
				+    print("提交结果")
			
 
				+    print("=" * 60)
			
 
				+    print(f"✅ 成功: {len(report.committed)}")
			
 
				+    for eid, kid in zip(report.committed, report.knowledge_ids):
			
 
				+        print(f"   - {eid} → knowledge_id={kid}")
			
 
				+    if report.failed:
			
 
				+        print(f"❌ 失败: {len(report.failed)}")
			
 
				+        for item in report.failed:
			
 
				+            print(f"   - {item['extraction_id']}: {item['error']}")
			
 
				+    if report.skipped:
			
 
				+        print(f"⏭  跳过: {len(report.skipped)}（未 approved 或已提交）")
			
 
				+    print("=" * 60)
			
 
				+
			
 
				+
			
 
				+# ===== 交互式编辑 =====
			
 
				+
			
 
				+def _prompt_edit(payload: dict) -> Optional[dict]:
			
 
				+    """进入交互式文本编辑模式，返回修改后的 payload（None 表示取消）。
			
 
				+
			
 
				+    初版只支持改 task/content/score/tags（最常用字段）。
			
 
				+    """
			
 
				+    print("\n编辑模式（空行回车保留原值）")
			
 
				+    task = input(f"task   [{payload.get('task', '')[:50]}]: ").strip()
			
 
				+    content_default = payload.get("content", "")
			
 
				+    print(f"content 当前:\n{content_default}\n")
			
 
				+    print("输入新 content（单行回车保留原值；多行请在末尾输入 `.` 单独成行结束）：")
			
 
				+    content = _read_multiline_or_keep(content_default)
			
 
				+    score_raw = input(f"score  [{payload.get('score', 3)}]: ").strip()
			
 
				+    tags_raw = input(f"tags JSON  [{json.dumps(payload.get('tags', {}), ensure_ascii=False)}]: ").strip()
			
 
				+
			
 
				+    new_payload = dict(payload)
			
 
				+    if task:
			
 
				+        new_payload["task"] = task
			
 
				+    if content is not None:
			
 
				+        new_payload["content"] = content
			
 
				+    if score_raw:
			
 
				+        try:
			
 
				+            new_payload["score"] = int(score_raw)
			
 
				+        except ValueError:
			
 
				+            print(f"⚠ score 不是整数，保留原值 {payload.get('score', 3)}")
			
 
				+    if tags_raw:
			
 
				+        try:
			
 
				+            new_payload["tags"] = json.loads(tags_raw)
			
 
				+        except json.JSONDecodeError as e:
			
 
				+            print(f"⚠ tags 不是合法 JSON（{e}），保留原值")
			
 
				+
			
 
				+    confirm = input("\n保存修改？[y/N]: ").strip().lower()
			
 
				+    if confirm != "y":
			
 
				+        return None
			
 
				+    return new_payload
			
 
				+
			
 
				+
			
 
				+def _read_multiline_or_keep(default: str) -> Optional[str]:
			
 
				+    """单行输入则直接返回（空行表示保留默认）；
			
 
				+    如果输入 `<<` 则进入多行模式，直到 `.` 单独成行结束。"""
			
 
				+    first = input("> ")
			
 
				+    if not first.strip():
			
 
				+        return None
			
 
				+    if first.strip() != "<<":
			
 
				+        return first
			
 
				+    lines = []
			
 
				+    while True:
			
 
				+        line = input()
			
 
				+        if line.strip() == ".":
			
 
				+            break
			
 
				+        lines.append(line)
			
 
				+    return "\n".join(lines)
			
 
				+
			
 
				+
			
 
				+# ===== 三种命令 =====
			
 
				+
			
 
				+async def cmd_list(store: FileSystemTraceStore, trace_id: str, show_all: bool) -> int:
			
 
				+    pendings = await list_pending(store, trace_id, include_reviewed=show_all)
			
 
				+    if not pendings:
			
 
				+        msg = "没有" + ("任何提取记录" if show_all else "待审核的提取条目")
			
 
				+        print(f"trace {trace_id}: {msg}")
			
 
				+        return 0
			
 
				+    print(f"trace {trace_id}: 共 {len(pendings)} 条{'' if show_all else '待审核'}")
			
 
				+    for i, p in enumerate(pendings, 1):
			
 
				+        _print_pending(p, i, len(pendings))
			
 
				+    return 0
			
 
				+
			
 
				+
			
 
				+async def cmd_review(store: FileSystemTraceStore, trace_id: str) -> int:
			
 
				+    pendings = await list_pending(store, trace_id, include_reviewed=False)
			
 
				+    if not pendings:
			
 
				+        print(f"trace {trace_id}: 没有待审核的提取条目")
			
 
				+        return 0
			
 
				+
			
 
				+    print(f"trace {trace_id}: 开始审核 {len(pendings)} 条")
			
 
				+    for i, p in enumerate(pendings, 1):
			
 
				+        _print_pending(p, i, len(pendings))
			
 
				+        while True:
			
 
				+            choice = input("[a]pprove / [e]dit / [d]iscard / [s]kip / [q]uit: ").strip().lower()
			
 
				+            if choice in ("a", "approve"):
			
 
				+                await review_one(store, trace_id, p.extraction_id, "approve")
			
 
				+                print(f"✓ {p.extraction_id} approved")
			
 
				+                break
			
 
				+            elif choice in ("d", "discard"):
			
 
				+                await review_one(store, trace_id, p.extraction_id, "discard")
			
 
				+                print(f"✗ {p.extraction_id} discarded")
			
 
				+                break
			
 
				+            elif choice in ("s", "skip"):
			
 
				+                print(f"⏭ {p.extraction_id} skipped（保留为 pending）")
			
 
				+                break
			
 
				+            elif choice in ("q", "quit"):
			
 
				+                print("退出审核")
			
 
				+                return 0
			
 
				+            elif choice in ("e", "edit"):
			
 
				+                edited = _prompt_edit(p.payload)
			
 
				+                if edited is None:
			
 
				+                    print("取消编辑，请重选")
			
 
				+                    continue
			
 
				+                await review_one(store, trace_id, p.extraction_id, "edit", edited_payload=edited)
			
 
				+                print(f"✎ {p.extraction_id} edited & approved")
			
 
				+                break
			
 
				+            else:
			
 
				+                print("无效选项，请输入 a/e/d/s/q")
			
 
				+    return 0
			
 
				+
			
 
				+
			
 
				+async def cmd_commit(store: FileSystemTraceStore, trace_id: str) -> int:
			
 
				+    report = await commit_approved(store, trace_id)
			
 
				+    _print_report(report)
			
 
				+    return 0 if not report.failed else 1
			
 
				+
			
 
				+
			
 
				+# ===== argparse 入口 =====
			
 
				+
			
 
				+def build_parser() -> argparse.ArgumentParser:
			
 
				+    p = argparse.ArgumentParser(
			
 
				+        prog="python -m agent.cli.extraction_review",
			
 
				+        description="审核并提交反思侧分支暂存的待审核知识条目。",
			
 
				+    )
			
 
				+    p.add_argument("--trace", required=True, help="Trace ID")
			
 
				+    p.add_argument("--base-path", default=".trace", help="TraceStore 根目录（默认 .trace）")
			
 
				+    group = p.add_mutually_exclusive_group()
			
 
				+    group.add_argument("--list", action="store_true", help="仅列出未审核条目")
			
 
				+    group.add_argument("--list-all", action="store_true", help="列出全部条目（含已审核/已提交）")
			
 
				+    group.add_argument("--review", action="store_true", help="进入交互式审核（不自动 commit）")
			
 
				+    group.add_argument("--commit", action="store_true", help="仅批量提交已 approved 的条目")
			
 
				+    return p
			
 
				+
			
 
				+
			
 
				+async def _main_async(args: argparse.Namespace) -> int:
			
 
				+    if not Path(args.base_path).exists():
			
 
				+        print(f"❌ TraceStore 根目录不存在: {args.base_path}", file=sys.stderr)
			
 
				+        return 2
			
 
				+    store = FileSystemTraceStore(base_path=args.base_path)
			
 
				+
			
 
				+    if args.list or args.list_all:
			
 
				+        return await cmd_list(store, args.trace, show_all=args.list_all)
			
 
				+    if args.review:
			
 
				+        return await cmd_review(store, args.trace)
			
 
				+    if args.commit:
			
 
				+        return await cmd_commit(store, args.trace)
			
 
				+
			
 
				+    # 默认：review 完紧接着 commit
			
 
				+    rc = await cmd_review(store, args.trace)
			
 
				+    if rc != 0:
			
 
				+        return rc
			
 
				+    print()
			
 
				+    confirm = input("现在把已 approved 的条目提交到 KnowHub？[Y/n]: ").strip().lower()
			
 
				+    if confirm in ("", "y", "yes"):
			
 
				+        return await cmd_commit(store, args.trace)
			
 
				+    print("未提交。需要时运行 `--commit` 子命令。")
			
 
				+    return 0
			
 
				+
			
 
				+
			
 
				+def main() -> int:
			
 
				+    args = build_parser().parse_args()
			
 
				+    return asyncio.run(_main_async(args))
			
 
				+
			
 
				+
			
 
				+if __name__ == "__main__":
			
 
				+    sys.exit(main())
			
--- a/agent/cli/interactive.py
+++ b/agent/cli/interactive.py
@@ -177,10 +177,12 @@ class InteractiveController:
 
				         print("  5. 从指定消息续跑")
			
 
				         print("  6. 继续执行")
			
 
				         print("  7. 停止执行")
			
 
				+        print("  8. 审核待提交知识（review pending extractions）")
			
 
				+        print("  9. 提交已审核知识到 KnowHub（commit approved）")
			
 
				         print("=" * 60)
			
 
				 
			
 
				         while True:
			
 
				-            choice = input("请输入选项 (1-7): ").strip()
			
 
				+            choice = input("请输入选项 (1-9): ").strip()
			
 
				 
			
 
				             if choice == "1":
			
 
				                 # 插入干预消息
			
@@ -237,6 +239,18 @@ class InteractiveController:
 
				                 print("\n停止执行...")
			
 
				                 return {"action": "stop"}
			
 
				 
			
 
				+            elif choice == "8":
			
 
				+                # 审核待提交知识（复用 agent/cli/extraction_review.py 的交互式 review）
			
 
				+                from agent.cli.extraction_review import cmd_review
			
 
				+                await cmd_review(self.store, trace_id)
			
 
				+                continue
			
 
				+
			
 
				+            elif choice == "9":
			
 
				+                # 提交已审核知识到 KnowHub
			
 
				+                from agent.cli.extraction_review import cmd_commit
			
 
				+                await cmd_commit(self.store, trace_id)
			
 
				+                continue
			
 
				+
			
 
				             else:
			
 
				                 print("无效选项，请重新输入")
			
 
				 
			
--- a/agent/core/dream.py
+++ b/agent/core/dream.py
@@ -0,0 +1,393 @@
 
				+"""
			
 
				+Dream：记忆反思操作（Phase 3）
			
 
				+
			
 
				+两阶段执行：
			
 
				+    per_trace_reflect    → 为每个有新消息的 trace 生成反思摘要，写 cognition_log
			
 
				+    cross_trace_integrate → 汇总各 trace 的反思摘要 + 当前记忆文件，
			
 
				+                             用 dream_prompt 指导 LLM 更新记忆文件
			
 
				+
			
 
				+对外入口：
			
 
				+    run_dream(store, llm_call, memory_config, trace_filter=None, model=...)
			
 
				+"""
			
 
				+
			
 
				+from __future__ import annotations
			
 
				+
			
 
				+import json
			
 
				+import logging
			
 
				+import re
			
 
				+from dataclasses import dataclass, field
			
 
				+from datetime import datetime
			
 
				+from pathlib import Path
			
 
				+from typing import Any, Awaitable, Callable, Dict, List, Optional, Tuple
			
 
				+
			
 
				+from agent.core.memory import MemoryConfig, load_memory_files, format_memory_injection
			
 
				+from agent.trace.models import Trace
			
 
				+from agent.trace.store import FileSystemTraceStore
			
 
				+
			
 
				+logger = logging.getLogger(__name__)
			
 
				+
			
 
				+
			
 
				+# ===== 默认 prompts =====
			
 
				+
			
 
				+DEFAULT_REFLECT_PROMPT = """你正在回顾一次 Agent 执行中发生的事情，为你自己（作为长期身份）的记忆做反思。
			
 
				+
			
 
				+请综合下面的执行过程和知识使用情况，回答：
			
 
				+1. 这次执行中有什么值得记住的经验？（品味、判断、策略）
			
 
				+2. 哪些知识的评估反映了我的判断需要调整？
			
 
				+3. 用户的反馈（如果有）说明了什么？
			
 
				+
			
 
				+用简洁的第一人称段落写，不要逐条列点，不要重复执行细节 —— 你在沉淀"这对未来的我意味着什么"。
			
 
				+只输出反思内容本身，不要任何其它前缀或 markdown 标题。"""
			
 
				+
			
 
				+
			
 
				+DEFAULT_DREAM_PROMPT = """你正在整理自己的长期记忆。下面是你最近的反思摘要、以及当前各记忆文件的内容。
			
 
				+
			
 
				+请决定哪些文件应该更新、内容怎么改。原则：
			
 
				+- 只更新真正有新见解的文件，没有变化的就不要动
			
 
				+- 在原有内容基础上演进，不是重写；保留仍然有效的旧内容
			
 
				+- 简洁、人类可读的 markdown 格式
			
 
				+- 新增文件必须是 MemoryConfig.files 已声明的路径（否则不会被下次加载）
			
 
				+
			
 
				+**严格按以下 JSON 格式输出，不要任何其它文字**：
			
 
				+
			
 
				+```json
			
 
				+{
			
 
				+  "updates": [
			
 
				+    {"path": "taste.md", "new_content": "完整的新文件内容"},
			
 
				+    {"path": "strategy.md", "new_content": "..."}
			
 
				+  ],
			
 
				+  "reasoning": "你为什么做这些更新（简短）"
			
 
				+}
			
 
				+```
			
 
				+
			
 
				+如果没有任何文件需要更新，输出 `{"updates": [], "reasoning": "..."}`。"""
			
 
				+
			
 
				+
			
 
				+# ===== 数据结构 =====
			
 
				+
			
 
				+@dataclass
			
 
				+class DreamReport:
			
 
				+    per_trace_summaries: Dict[str, str] = field(default_factory=dict)  # {trace_id: summary}
			
 
				+    updated_files: List[str] = field(default_factory=list)             # 实际写入的文件路径
			
 
				+    consumed_reflection_count: int = 0                                  # 本次消化了多少条 reflection
			
 
				+    reasoning: str = ""
			
 
				+    skipped_traces: List[str] = field(default_factory=list)
			
 
				+
			
 
				+
			
 
				+LLMCall = Callable[..., Awaitable[Dict[str, Any]]]
			
 
				+
			
 
				+
			
 
				+# ===== Per-trace 反思 =====
			
 
				+
			
 
				+async def per_trace_reflect(
			
 
				+    store: FileSystemTraceStore,
			
 
				+    llm_call: LLMCall,
			
 
				+    trace_id: str,
			
 
				+    memory_config: MemoryConfig,
			
 
				+    model: str = "gpt-4o-mini",
			
 
				+) -> Optional[str]:
			
 
				+    """为单个 trace 生成反思摘要，写入 cognition_log，更新 reflected_at_sequence。
			
 
				+
			
 
				+    Returns:
			
 
				+        反思摘要字符串；若 trace 没有新消息或 LLM 返回空，返回 None。
			
 
				+    """
			
 
				+    trace = await store.get_trace(trace_id)
			
 
				+    if not trace:
			
 
				+        logger.debug(f"[Dream] trace 不存在: {trace_id}")
			
 
				+        return None
			
 
				+
			
 
				+    start_seq = (trace.reflected_at_sequence or 0) + 1
			
 
				+    end_seq = trace.last_sequence
			
 
				+    if start_seq > end_seq:
			
 
				+        logger.debug(f"[Dream] trace {trace_id} 没有新消息（{start_seq} > {end_seq}）")
			
 
				+        return None
			
 
				+
			
 
				+    all_msgs = await store.get_trace_messages(trace_id)
			
 
				+    new_msgs = [m for m in all_msgs if start_seq <= m.sequence <= end_seq]
			
 
				+    if not new_msgs:
			
 
				+        logger.debug(f"[Dream] trace {trace_id} 范围内无消息")
			
 
				+        return None
			
 
				+
			
 
				+    log = await store.get_cognition_log(trace_id)
			
 
				+    events = log.get("events", log.get("entries", []))
			
 
				+    relevant_events = [
			
 
				+        e for e in events
			
 
				+        if e.get("sequence") is not None
			
 
				+        and start_seq <= e["sequence"] <= end_seq
			
 
				+        and e.get("type") in ("query", "evaluation", "extraction_pending", "extraction_committed")
			
 
				+    ]
			
 
				+
			
 
				+    user_content = _build_reflect_input(new_msgs, relevant_events)
			
 
				+    prompt = memory_config.reflect_prompt or DEFAULT_REFLECT_PROMPT
			
 
				+
			
 
				+    try:
			
 
				+        result = await llm_call(
			
 
				+            messages=[
			
 
				+                {"role": "system", "content": prompt},
			
 
				+                {"role": "user", "content": user_content},
			
 
				+            ],
			
 
				+            model=model,
			
 
				+            tools=None,
			
 
				+            temperature=0.5,
			
 
				+        )
			
 
				+    except Exception as e:
			
 
				+        logger.error(f"[Dream] per_trace_reflect LLM 调用失败 {trace_id}: {e}")
			
 
				+        return None
			
 
				+
			
 
				+    summary = (result.get("content") or "").strip()
			
 
				+    if not summary:
			
 
				+        logger.info(f"[Dream] trace {trace_id} 反思 LLM 返回空，视为无值得记录的内容")
			
 
				+        # 仍然更新 reflected_at_sequence，避免下次重复扫描
			
 
				+        await store.update_trace(trace_id, reflected_at_sequence=end_seq)
			
 
				+        return None
			
 
				+
			
 
				+    await store.append_cognition_event(
			
 
				+        trace_id=trace_id,
			
 
				+        event={
			
 
				+            "type": "reflection",
			
 
				+            "sequence_range": [start_seq, end_seq],
			
 
				+            "summary": summary,
			
 
				+        },
			
 
				+    )
			
 
				+    await store.update_trace(trace_id, reflected_at_sequence=end_seq)
			
 
				+    logger.info(f"[Dream] trace {trace_id} 反思完成，覆盖 sequence {start_seq}-{end_seq}")
			
 
				+    return summary
			
 
				+
			
 
				+
			
 
				+def _build_reflect_input(messages: List[Any], events: List[Dict[str, Any]]) -> str:
			
 
				+    """把消息和事件组织为 LLM 可读的反思输入。"""
			
 
				+    parts: List[str] = ["## 执行过程"]
			
 
				+    for m in messages:
			
 
				+        role = getattr(m, "role", "?")
			
 
				+        desc = getattr(m, "description", "") or ""
			
 
				+        seq = getattr(m, "sequence", "?")
			
 
				+        # 截断，防止单条过长
			
 
				+        parts.append(f"[{seq}] {role}: {desc[:500]}")
			
 
				+
			
 
				+    if events:
			
 
				+        parts.append("\n## 知识使用与提取情况（来自 cognition_log）")
			
 
				+        for e in events:
			
 
				+            etype = e.get("type")
			
 
				+            if etype == "query":
			
 
				+                parts.append(
			
 
				+                    f"- [{e.get('sequence')}] query: {e.get('query', '')[:100]} → "
			
 
				+                    f"source_ids={e.get('source_ids', [])}"
			
 
				+                )
			
 
				+            elif etype == "evaluation":
			
 
				+                parts.append(
			
 
				+                    f"- evaluation: knowledge_id={e.get('knowledge_id')} "
			
 
				+                    f"result={e.get('eval_result')}"
			
 
				+                )
			
 
				+            elif etype == "extraction_pending":
			
 
				+                payload = e.get("payload", {})
			
 
				+                parts.append(
			
 
				+                    f"- extraction_pending ({e.get('extraction_id')}): "
			
 
				+                    f"{payload.get('task', '')[:80]}"
			
 
				+                )
			
 
				+            elif etype == "extraction_committed":
			
 
				+                parts.append(
			
 
				+                    f"- extraction_committed: extraction={e.get('extraction_id')} "
			
 
				+                    f"→ knowledge_id={e.get('knowledge_id')}"
			
 
				+                )
			
 
				+    return "\n".join(parts)
			
 
				+
			
 
				+
			
 
				+# ===== 跨 trace 整合 =====
			
 
				+
			
 
				+async def cross_trace_integrate(
			
 
				+    store: FileSystemTraceStore,
			
 
				+    llm_call: LLMCall,
			
 
				+    memory_config: MemoryConfig,
			
 
				+    trace_filter: Optional[Callable[[Trace], bool]] = None,
			
 
				+    model: str = "gpt-4o",
			
 
				+) -> Tuple[int, List[str], str]:
			
 
				+    """汇总各 trace 未消化的 reflection 事件，用 LLM 更新记忆文件。
			
 
				+
			
 
				+    Args:
			
 
				+        trace_filter: 可选的 trace 过滤函数（例如按 agent_type / owner）；
			
 
				+                      None 表示扫描 TraceStore 下所有 trace。
			
 
				+
			
 
				+    Returns:
			
 
				+        (consumed_reflection_count, updated_file_paths, reasoning)
			
 
				+    """
			
 
				+    all_traces = await store.list_traces(limit=1000)
			
 
				+    if trace_filter:
			
 
				+        all_traces = [t for t in all_traces if trace_filter(t)]
			
 
				+
			
 
				+    # 收集所有未消化的 reflection 事件
			
 
				+    reflections: List[Tuple[str, Dict[str, Any]]] = []  # [(trace_id, event)]
			
 
				+    for t in all_traces:
			
 
				+        log = await store.get_cognition_log(t.trace_id)
			
 
				+        events = log.get("events", log.get("entries", []))
			
 
				+        for e in events:
			
 
				+            if e.get("type") == "reflection" and not e.get("consumed_at"):
			
 
				+                reflections.append((t.trace_id, e))
			
 
				+
			
 
				+    if not reflections:
			
 
				+        logger.info("[Dream] 没有未消化的 reflection 事件")
			
 
				+        return 0, [], ""
			
 
				+
			
 
				+    # 读当前记忆文件
			
 
				+    existing_files = load_memory_files(memory_config)
			
 
				+    existing_by_path = {rel: (purpose, content) for rel, purpose, content in existing_files}
			
 
				+
			
 
				+    user_content = _build_dream_input(reflections, existing_files, memory_config)
			
 
				+    prompt = memory_config.dream_prompt or DEFAULT_DREAM_PROMPT
			
 
				+
			
 
				+    try:
			
 
				+        result = await llm_call(
			
 
				+            messages=[
			
 
				+                {"role": "system", "content": prompt},
			
 
				+                {"role": "user", "content": user_content},
			
 
				+            ],
			
 
				+            model=model,
			
 
				+            tools=None,
			
 
				+            temperature=0.3,
			
 
				+        )
			
 
				+    except Exception as e:
			
 
				+        logger.error(f"[Dream] cross_trace_integrate LLM 调用失败: {e}")
			
 
				+        return 0, [], ""
			
 
				+
			
 
				+    raw = (result.get("content") or "").strip()
			
 
				+    plan = _parse_dream_output(raw)
			
 
				+    if plan is None:
			
 
				+        logger.error(f"[Dream] LLM 输出无法解析为 JSON 计划，原文: {raw[:500]}")
			
 
				+        return 0, [], ""
			
 
				+
			
 
				+    updated_paths: List[str] = []
			
 
				+    base = Path(memory_config.base_path)
			
 
				+
			
 
				+    for update in plan.get("updates", []):
			
 
				+        rel_path = update.get("path", "")
			
 
				+        new_content = update.get("new_content", "")
			
 
				+        if not rel_path:
			
 
				+            continue
			
 
				+        # 安全检查：禁止路径穿越
			
 
				+        target = (base / rel_path).resolve()
			
 
				+        if not str(target).startswith(str(base.resolve())):
			
 
				+            logger.warning(f"[Dream] 拒绝写入 base_path 之外的路径: {rel_path}")
			
 
				+            continue
			
 
				+        target.parent.mkdir(parents=True, exist_ok=True)
			
 
				+        target.write_text(new_content, encoding="utf-8")
			
 
				+        updated_paths.append(rel_path)
			
 
				+        logger.info(f"[Dream] 已更新记忆文件: {rel_path} ({len(new_content)} chars)")
			
 
				+
			
 
				+    # 标记所有参与的 reflection 为已消化
			
 
				+    consumed_at = datetime.now().isoformat()
			
 
				+    for trace_id, event in reflections:
			
 
				+        log = await store.get_cognition_log(trace_id)
			
 
				+        events = log.get("events", log.get("entries", []))
			
 
				+        target_ts = event.get("timestamp")
			
 
				+        for e in events:
			
 
				+            if (
			
 
				+                e.get("type") == "reflection"
			
 
				+                and not e.get("consumed_at")
			
 
				+                and e.get("timestamp") == target_ts
			
 
				+            ):
			
 
				+                e["consumed_at"] = consumed_at
			
 
				+        log_file = store._get_cognition_log_file(trace_id)
			
 
				+        log_file.write_text(json.dumps(log, indent=2, ensure_ascii=False), encoding="utf-8")
			
 
				+
			
 
				+    reasoning = plan.get("reasoning", "")
			
 
				+    return len(reflections), updated_paths, reasoning
			
 
				+
			
 
				+
			
 
				+def _build_dream_input(
			
 
				+    reflections: List[Tuple[str, Dict[str, Any]]],
			
 
				+    existing_files: List[Tuple[str, str, str]],
			
 
				+    memory_config: MemoryConfig,
			
 
				+) -> str:
			
 
				+    """为 dream prompt 准备输入：反思摘要汇总 + 当前记忆文件 + 允许的文件路径。"""
			
 
				+    parts: List[str] = ["## 最近的反思摘要\n"]
			
 
				+    for trace_id, e in reflections:
			
 
				+        seq_range = e.get("sequence_range", [None, None])
			
 
				+        parts.append(
			
 
				+            f"### trace {trace_id} (messages {seq_range[0]}-{seq_range[1]})\n"
			
 
				+            f"{e.get('summary', '')}\n"
			
 
				+        )
			
 
				+
			
 
				+    parts.append("\n## 当前记忆文件\n")
			
 
				+    if existing_files:
			
 
				+        parts.append(format_memory_injection(existing_files))
			
 
				+    else:
			
 
				+        parts.append("（暂无记忆文件）")
			
 
				+
			
 
				+    if memory_config.files:
			
 
				+        parts.append("\n## 允许更新/新增的文件路径\n")
			
 
				+        for key, purpose in memory_config.files.items():
			
 
				+            parts.append(f"- `{key}`" + (f" — {purpose}" if purpose else ""))
			
 
				+
			
 
				+    return "\n".join(parts)
			
 
				+
			
 
				+
			
 
				+def _parse_dream_output(raw: str) -> Optional[Dict[str, Any]]:
			
 
				+    """解析 LLM 的 JSON 计划输出。容忍 ```json ... ``` 包裹。"""
			
 
				+    stripped = raw.strip()
			
 
				+    # 去除 markdown 代码块包裹
			
 
				+    m = re.match(r"^```(?:json)?\s*(.*?)\s*```$", stripped, re.DOTALL)
			
 
				+    if m:
			
 
				+        stripped = m.group(1).strip()
			
 
				+    try:
			
 
				+        data = json.loads(stripped)
			
 
				+    except json.JSONDecodeError:
			
 
				+        return None
			
 
				+    if not isinstance(data, dict) or "updates" not in data:
			
 
				+        return None
			
 
				+    return data
			
 
				+
			
 
				+
			
 
				+# ===== 顶层入口 =====
			
 
				+
			
 
				+async def run_dream(
			
 
				+    store: FileSystemTraceStore,
			
 
				+    llm_call: LLMCall,
			
 
				+    memory_config: MemoryConfig,
			
 
				+    trace_filter: Optional[Callable[[Trace], bool]] = None,
			
 
				+    reflect_model: str = "gpt-4o-mini",
			
 
				+    dream_model: str = "gpt-4o",
			
 
				+) -> DreamReport:
			
 
				+    """执行完整的 dream 流程：per_trace_reflect → cross_trace_integrate。
			
 
				+
			
 
				+    Args:
			
 
				+        trace_filter: 筛选需要反思的 trace（例如按 agent_type 或 owner）；
			
 
				+                      None 表示扫描所有 trace
			
 
				+        reflect_model: per-trace 反思用的模型（轻量模型即可）
			
 
				+        dream_model:   跨 trace 整合用的模型（需要更强推理能力）
			
 
				+    """
			
 
				+    report = DreamReport()
			
 
				+
			
 
				+    if not memory_config.base_path:
			
 
				+        logger.warning("[Dream] memory_config.base_path 未配置，跳过")
			
 
				+        return report
			
 
				+
			
 
				+    # Phase 1: per-trace reflect
			
 
				+    all_traces = await store.list_traces(limit=1000)
			
 
				+    if trace_filter:
			
 
				+        all_traces = [t for t in all_traces if trace_filter(t)]
			
 
				+
			
 
				+    for t in all_traces:
			
 
				+        if (t.reflected_at_sequence or 0) >= t.last_sequence:
			
 
				+            continue
			
 
				+        try:
			
 
				+            summary = await per_trace_reflect(
			
 
				+                store, llm_call, t.trace_id, memory_config, model=reflect_model,
			
 
				+            )
			
 
				+            if summary:
			
 
				+                report.per_trace_summaries[t.trace_id] = summary
			
 
				+        except Exception as e:
			
 
				+            logger.error(f"[Dream] per_trace_reflect 异常 {t.trace_id}: {e}")
			
 
				+            report.skipped_traces.append(t.trace_id)
			
 
				+
			
 
				+    # Phase 2: cross-trace integrate
			
 
				+    try:
			
 
				+        consumed, updated, reasoning = await cross_trace_integrate(
			
 
				+            store, llm_call, memory_config,
			
 
				+            trace_filter=trace_filter, model=dream_model,
			
 
				+        )
			
 
				+        report.consumed_reflection_count = consumed
			
 
				+        report.updated_files = updated
			
 
				+        report.reasoning = reasoning
			
 
				+    except Exception as e:
			
 
				+        logger.error(f"[Dream] cross_trace_integrate 异常: {e}")
			
 
				+
			
 
				+    return report
			
--- a/agent/core/memory.py
+++ b/agent/core/memory.py
@@ -0,0 +1,100 @@
 
				+"""
			
 
				+Memory 系统（Phase 2+）
			
 
				+
			
 
				+详见 agent/docs/memory-plan.md。核心概念：
			
 
				+- Memory：Agent 身份私有的主观记忆，Markdown 文件，人类可读写
			
 
				+- Dream：记忆反思操作（回顾多个 trace 的执行历史，更新记忆文件）
			
 
				+
			
 
				+本模块只提供 MemoryConfig 数据类和记忆文件加载逻辑。
			
 
				+Dream 操作在 agent/core/dream.py（Phase 3）。
			
 
				+"""
			
 
				+
			
 
				+from __future__ import annotations
			
 
				+
			
 
				+import glob as _glob
			
 
				+import logging
			
 
				+from dataclasses import dataclass, field
			
 
				+from pathlib import Path
			
 
				+from typing import Dict, List, Optional, Tuple
			
 
				+
			
 
				+logger = logging.getLogger(__name__)
			
 
				+
			
 
				+
			
 
				+@dataclass
			
 
				+class MemoryConfig:
			
 
				+    """持久化记忆配置（见 agent/docs/memory-plan.md 第五节）"""
			
 
				+
			
 
				+    base_path: str = ""
			
 
				+    # 记忆文件根目录。所有文件路径相对此目录解析。
			
 
				+
			
 
				+    files: Optional[Dict[str, str]] = None
			
 
				+    # {路径模式: 用途说明}
			
 
				+    # key 支持两种形式：
			
 
				+    #   - 直接路径："core/identity.md"
			
 
				+    #   - glob 模式："relationships/*.md"、"journals/2026/**.md"
			
 
				+    # value 是人类可读的用途说明（注入时作为文件分隔标题的一部分）。
			
 
				+    # 框架只负责按 key 解析文件内容；组织结构由配置者决定。
			
 
				+
			
 
				+    dream_prompt: str = ""
			
 
				+    # Dream 跨 trace 整合 prompt；空则使用默认（Phase 3 定义）
			
 
				+
			
 
				+    reflect_prompt: str = ""
			
 
				+    # Per-trace 记忆反思 prompt；空则使用默认（Phase 3 定义）
			
 
				+
			
 
				+
			
 
				+def load_memory_files(config: MemoryConfig) -> List[Tuple[str, str, str]]:
			
 
				+    """按 MemoryConfig.files 的 key 解析磁盘上的记忆文件。
			
 
				+
			
 
				+    Returns:
			
 
				+        List[(relative_path, purpose, content)]，按 files 声明顺序扁平化，
			
 
				+        文件不存在则跳过（记 debug 日志），内容为空也保留（方便人类看到占位）。
			
 
				+    """
			
 
				+    if not config.base_path or not config.files:
			
 
				+        return []
			
 
				+
			
 
				+    base = Path(config.base_path)
			
 
				+    if not base.exists():
			
 
				+        logger.debug(f"[Memory] base_path 不存在: {base}")
			
 
				+        return []
			
 
				+
			
 
				+    results: List[Tuple[str, str, str]] = []
			
 
				+    seen: set[str] = set()  # 去重（多个 glob 可能命中同一个文件）
			
 
				+
			
 
				+    for key, purpose in config.files.items():
			
 
				+        # 展开 glob；直接路径也走 glob（无通配符时返回单条或空）
			
 
				+        pattern = str(base / key)
			
 
				+        matched_paths = sorted(_glob.glob(pattern, recursive=True))
			
 
				+
			
 
				+        if not matched_paths:
			
 
				+            # 直接路径没命中时给个 debug（可能还没写第一版）
			
 
				+            logger.debug(f"[Memory] {key} 没有匹配文件（尚未创建）")
			
 
				+            continue
			
 
				+
			
 
				+        for fs_path in matched_paths:
			
 
				+            rel = str(Path(fs_path).relative_to(base))
			
 
				+            if rel in seen:
			
 
				+                continue
			
 
				+            seen.add(rel)
			
 
				+            try:
			
 
				+                content = Path(fs_path).read_text(encoding="utf-8")
			
 
				+            except Exception as e:
			
 
				+                logger.warning(f"[Memory] 读取失败 {fs_path}: {e}")
			
 
				+                continue
			
 
				+            results.append((rel, purpose, content))
			
 
				+
			
 
				+    return results
			
 
				+
			
 
				+
			
 
				+def format_memory_injection(files: List[Tuple[str, str, str]]) -> str:
			
 
				+    """把加载结果格式化为可注入到上下文的 markdown 段。"""
			
 
				+    if not files:
			
 
				+        return ""
			
 
				+    parts = ["## 你的长期记忆\n\n以下是你作为此 Agent 身份积累的记忆（人类可直接编辑）：\n"]
			
 
				+    for rel, purpose, content in files:
			
 
				+        header = f"### `{rel}`"
			
 
				+        if purpose:
			
 
				+            header += f" — {purpose}"
			
 
				+        parts.append(header)
			
 
				+        parts.append(content.rstrip() or "_（空文件，尚未积累内容）_")
			
 
				+        parts.append("")  # 空行分隔
			
 
				+    return "\n".join(parts).rstrip() + "\n"
			
--- a/agent/core/prompts/knowledge.py
+++ b/agent/core/prompts/knowledge.py
@@ -5,180 +5,110 @@
 
				 - REFLECT_PROMPT:            压缩时阶段性反思（消息量超阈值，对当前批历史提炼）
			
 
				 - COMPLETION_REFLECT_PROMPT: 任务完成后全局复盘（对整个任务的全局视角）
			
 
				 
			
 
				-两个 prompt 都要求 LLM 直接调用 `upload_knowledge` 工具保存经验，
			
 
				-而不是输出结构化文本再由 runner 解析。
			
 
				+两个 prompt 都要求 LLM 直接调用 `knowledge_save_pending` 工具暂存为待审核条目，
			
 
				+每条知识一次调用，不需要输出结构化文本。
			
 
				+
			
 
				+"pending" 语义：条目落到 cognition_log 的 extraction_pending 事件，
			
 
				+等待人工（或 reflect_auto_commit=True 时由框架自动）review + commit 才进入 KnowHub。
			
 
				+详见 agent/docs/memory-plan.md 第三节"提取-审核-提交两阶段"。
			
 
				 """
			
 
				 
			
 
				 # ===== 压缩时阶段性反思 =====
			
 
				 
			
 
				-REFLECT_PROMPT = """请回顾以上执行过程，将值得沉淀的内容直接用 `upload_knowledge` 工具保存到知识库。
			
 
				+REFLECT_PROMPT = """请回顾以上执行过程，将值得沉淀的内容通过 `knowledge_save_pending` 工具逐条暂存（每条知识一次调用）。
			
 
				+
			
 
				+暂存的条目会进入审核队列（不立即入库），等待人工 review 后才会上传到 KnowHub。
			
 
				 
			
 
				 ## 两种保存模式
			
 
				 
			
 
				-### 模式 1：经验反思（experience）
			
 
				+### 模式 1：经验反思（types=["experience"]）
			
 
				 总结执行过程中的经验教训，关注：
			
 
				 1. 人工干预：用户中途的指令说明了哪里出了问题
			
 
				 2. 弯路：哪些尝试是不必要的，有没有更直接的方法
			
 
				 3. 好的决策：哪些判断和选择是正确的，值得记住
			
 
				 4. 工具使用：哪些工具用法是高效的，哪些可以改进
			
 
				 
			
 
				-**格式要求**：
			
 
				-- `主题`: 「在[什么情境]下，[要完成什么]」
			
 
				-- `内容`: 「当[条件]时，应该[动作]（原因：[一句话]）。案例：[具体案例]」
			
 
				-- `类型`: `["experience"]`
			
 
				-- `标签`: `{"intent": "任务意图", "state": "环境状态/工具名"}`
			
 
				-- `评分`: 1-5（只保存最有价值的，宁少勿滥）
			
 
				-
			
 
				-### 模式 2：原始知识上传（tool/strategy/case）
			
 
				-如果执行过程中**调研或发现了新知识**（如工具用法、工作流程、案例），直接上传原始知识：
			
 
				+**参数格式**：
			
 
				+- `task`: 「在[什么情境]下，[要完成什么]」
			
 
				+- `content`: 「当[条件]时，应该[动作]（原因：[一句话]）。案例：[具体案例]」
			
 
				+- `types`: `["experience"]`
			
 
				+- `tags`: `{"intent": "任务意图", "state": "环境状态/工具名"}`
			
 
				+- `score`: 1-5（只保存最有价值的，宁少勿滥）
			
 
				 
			
 
				-**要求**：
			
 
				-- **完整性**：保留原始信息，不要过度总结
			
 
				-- **来源清晰**：在 `resource_ids` 中关联来源资源，或在 `标签` 中标注来源
			
 
				-- **原汁原味**：保持原文档/网页的结构和细节
			
 
				+### 模式 2：原始知识（types=["tool"] / ["strategy"] / ["case"]）
			
 
				+如果执行过程中**调研或发现了新知识**（如工具用法、工作流程、案例），原汁原味暂存：
			
 
				 
			
 
				-**知识类型选择**：
			
 
				 - `["tool"]`：工具知识（单个工具的功能、参数、用法、限制）
			
 
				 - `["strategy"]`：工序知识（多步骤流程、方案、最佳实践）
			
 
				 - `["case"]`：用例知识（真实案例、应用场景、效果数据）
			
 
				 
			
 
				-**格式要求**：
			
 
				-- `主题`: 知识的标题（如「Midjourney 的 --ar 参数用法」）
			
 
				-- `内容`: 原始知识内容（完整、详细、保留结构）
			
 
				-- `类型`: `["tool"]` / `["strategy"]` / `["case"]`
			
 
				-- `标签`: `{"source": "来源网站/文档", "domain": "领域", ...}`
			
 
				+**参数格式**：
			
 
				+- `task`: 知识的标题（如「Midjourney 的 --ar 参数用法」）
			
 
				+- `content`: 原始知识内容（完整、详细、保留结构，不要过度总结）
			
 
				+- `types`: 二选一
			
 
				+- `tags`: `{"source": "来源网站/文档", "domain": "领域", ...}`
			
 
				 - `resource_ids`: 关联的资源 ID（如果保存了原始文档）
			
 
				-- `评分`: 1-5（根据知识的价值和可靠性）
			
 
				-
			
 
				-## 参数说明
			
 
				-
			
 
				-**每条内容调用一次 `upload_knowledge`**：
			
 
				-- `data`: 包含 knowledge/resources/tools 的字典
			
 
				-  - `knowledge`: 知识列表，每个知识包含：
			
 
				-    - `主题`: 标题或场景描述
			
 
				-    - `内容`: 知识正文（经验用总结格式，原始知识保持完整）
			
 
				-    - `类型`: `["experience"]` / `["tool"]` / `["strategy"]` / `["case"]`
			
 
				-    - `标签`: 键值对标签，便于检索
			
 
				-    - `评分`: 1-5
			
 
				-    - `resource_ids`: 关联的资源 ID 列表（可选）
			
 
				-  - `resources`: 资源列表（可选），每个资源包含：
			
 
				-    - `id`: 资源 ID（如 `code/{category}/{name}`）
			
 
				-    - `标题`: 资源标题
			
 
				-    - `内容`: 资源内容
			
 
				-    - `类型`: code/credential/cookie 等
			
 
				-    - `元数据`: 额外信息
			
 
				-  - `tools`: 工具列表（可选）
			
 
				-- `finalize`: False（增量上传，不立即入库）
			
 
				-
			
 
				-**注意**：
			
 
				-- 只保存最有价值的经验，宁少勿滥；一次就成功或比较简单的经验就不要记录了，记录反复尝试或被用户指导后才成功的经验、或者是调研之后的收获。
			
 
				+- `score`: 1-5（根据知识的价值和可靠性）
			
 
				+
			
 
				+## 其他注意事项
			
 
				+
			
 
				+- **一条知识一次 `knowledge_save_pending` 调用**，不要把多条合并
			
 
				+- 只保存最有价值的经验，宁少勿滥；一次就成功或比较简单的经验就不要记录了，记录反复尝试或被用户指导后才成功的经验、或者是调研之后的收获
			
 
				 - 不需要输出任何文字，直接调用工具即可
			
 
				 - 如果没有值得保存的经验，不调用任何工具
			
 
				-- **完成经验保存后立即停止，不要继续执行原有任务**
			
 
				+- **完成经验暂存后立即停止，不要继续执行原有任务**
			
 
				 """
			
 
				 
			
 
				 
			
 
				 # ===== 任务完成后全局复盘 =====
			
 
				 
			
 
				-COMPLETION_REFLECT_PROMPT = """请对整个任务进行复盘，将值得沉淀的内容直接用 `upload_knowledge` 工具保存到知识库。
			
 
				+COMPLETION_REFLECT_PROMPT = """请对整个任务进行复盘，将值得沉淀的内容通过 `knowledge_save_pending` 工具逐条暂存（每条知识一次调用）。
			
 
				+
			
 
				+暂存的条目会进入审核队列（不立即入库），等待人工 review 后才会上传到 KnowHub。
			
 
				 
			
 
				 ## 两种保存模式
			
 
				 
			
 
				-### 模式 1：经验反思（experience）
			
 
				+### 模式 1：经验反思（types=["experience"]）
			
 
				 任务结束后的全局视角，关注：
			
 
				 1. 任务整体路径：实际走的路径与最初计划的偏差
			
 
				 2. 关键决策点：哪些决策显著影响了最终结果
			
 
				 3. 可复用的模式：哪些做法在类似任务中可以直接复用
			
 
				 4. 踩过的坑：哪些问题本可提前规避
			
 
				 
			
 
				-**格式要求**：
			
 
				-- `主题`: 「在[什么情境]下，[要完成什么]」
			
 
				-- `内容`: 「当[条件]时，应该[动作]（原因：[一句话]）。案例：[具体案例]」
			
 
				-- `类型`: `["experience"]`
			
 
				-- `标签`: `{"intent": "任务意图", "state": "环境状态/工具名"}`
			
 
				-- `评分`: 1-5（只保存最有价值的，宁少勿滥）
			
 
				+**参数格式**：
			
 
				+- `task`: 「在[什么情境]下，[要完成什么]」
			
 
				+- `content`: 「当[条件]时，应该[动作]（原因：[一句话]）。案例：[具体案例]」
			
 
				+- `types`: `["experience"]`
			
 
				+- `tags`: `{"intent": "任务意图", "state": "环境状态/工具名"}`
			
 
				+- `score`: 1-5（只保存最有价值的，宁少勿滥）
			
 
				 
			
 
				-### 模式 2：原始知识上传（tool/strategy/case）
			
 
				-如果任务过程中**调研或发现了新知识**，直接上传原始知识：
			
 
				+### 模式 2：原始知识（types=["tool"] / ["strategy"] / ["case"]）
			
 
				+如果任务过程中**调研或发现了新知识**，完整保留结构和细节：
			
 
				 
			
 
				-**要求**：
			
 
				-- **完整性**：保留原始信息的完整结构和细节，不要过度压缩
			
 
				-- **来源清晰**：标注信息来源（URL、文档名、API 响应等）
			
 
				-- **原汁原味**：保持原始数据格式（如 API 参数列表、配置示例、步骤说明等）
			
 
				-
			
 
				-**知识类型选择**：
			
 
				 - `["tool"]`：工具知识（工具的功能、参数、用法、限制、版本信息）
			
 
				 - `["strategy"]`：工序知识（完整的多步骤流程、方案、最佳实践）
			
 
				 - `["case"]`：用例知识（真实案例、应用场景、效果数据、对比结果）
			
 
				 
			
 
				-**格式要求**：
			
 
				-- `主题`: 知识的标题
			
 
				-- `内容`: 原始知识内容（完整详细）
			
 
				-- `类型`: `["tool"]` / `["strategy"]` / `["case"]`
			
 
				-- `标签`: `{"source": "来源", "domain": "领域", ...}`
			
 
				+**参数格式**：
			
 
				+- `task`: 知识的标题
			
 
				+- `content`: 原始知识内容（完整详细，不要过度压缩）
			
 
				+- `types`: 三选一
			
 
				+- `tags`: `{"source": "来源", "domain": "领域", ...}`
			
 
				 - `resource_ids`: 关联的资源 ID
			
 
				-- `评分`: 1-5
			
 
				-
			
 
				-## 参数说明
			
 
				-
			
 
				-**每条内容调用一次 `upload_knowledge`**：
			
 
				-- `data`: 包含 tools/resources/knowledge 的字典
			
 
				-  - `knowledge`: 知识列表，每个知识包含：
			
 
				-    - `主题`: 这条经验适用的场景，格式：「在[什么情境]下，[要完成什么]」
			
 
				-    - `内容`: 具体经验内容，格式：「当[条件]时，应该[动作]（原因：[一句话]）。案例：[具体案例]」
			
 
				-    - `类型`: 知识类型，选择以下之一：
			
 
				-      - `["experience"]`: 执行经验（Agent 反思总结，应该/避免做什么）
			
 
				-      - `["strategy"]`: 工序知识（多步骤流程、方案）
			
 
				-      - `["tool"]`: 工具知识（单个工具的功能、用法）
			
 
				-      - `["case"]`: 用例知识（真实案例、应用场景）
			
 
				-    - `标签`: 用 `intent`（任务意图）和 `state`（环境状态/相关工具名）标注，便于检索
			
 
				-    - `评分`: 1-5，根据这条经验的价值评估
			
 
				-    - `resource_ids`: 关联的资源 ID 列表（可选，如果这条知识引用了某个资源）
			
 
				-  - `resources`: 资源列表（可选）
			
 
				-  - `tools`: 工具列表（可选）
			
 
				-- `finalize`: False（增量上传，不立即入库）
			
 
				-
			
 
				-**资源提取指南**：
			
 
				-如果任务中涉及以下内容，应在 `data` 中包含 `resources` 字段：
			
 
				-
			
 
				-1. **复杂代码工具**（逻辑复杂、超过 20 行、可复用）：
			
 
				-   ```python
			
 
				-   {
			
 
				-     "id": "code/{category}/{name}",
			
 
				-     "标题": "...",
			
 
				-     "内容": "代码内容",
			
 
				-     "类型": "code",
			
 
				-     "元数据": {"language": "python"}
			
 
				-   }
			
 
				-   ```
			
 
				-
			
 
				-2. **账号密码凭证**：
			
 
				-   ```python
			
 
				-   {
			
 
				-     "id": "credentials/{website}",
			
 
				-     "标题": "...",
			
 
				-     "内容": "使用说明和凭证",
			
 
				-     "类型": "credential",
			
 
				-     "元数据": {"acquired_at": "2026-03-06T10:00:00Z"}
			
 
				-   }
			
 
				-   ```
			
 
				-
			
 
				-3. **Cookie 和登录态**：
			
 
				-   ```python
			
 
				-   {
			
 
				-     "id": "cookies/{website}",
			
 
				-     "标题": "...",
			
 
				-     "内容": "获取方法和cookie内容",
			
 
				-     "类型": "cookie",
			
 
				-     "元数据": {"acquired_at": "...", "expires_at": "..."}
			
 
				-   }
			
 
				-   ```
			
 
				-
			
 
				-**注意**：
			
 
				-- 只保存最有价值的经验，宁少勿滥；一次就成功或比较简单的经验就不要记录了，记录反复尝试或被用户指导后才成功的经验、或者是调研之后的收获。
			
 
				+- `score`: 1-5
			
 
				+
			
 
				+## 关于资源（resource）
			
 
				+
			
 
				+如果过程中产出了可复用的代码/凭证/Cookie 等资源，先用 `resource_save` 工具保存，
			
 
				+再在 `knowledge_save_pending` 的 `resource_ids` 字段中关联资源 ID。
			
 
				+
			
 
				+## 其他注意事项
			
 
				+
			
 
				+- **一条知识一次 `knowledge_save_pending` 调用**，不要把多条合并
			
 
				+- 只保存最有价值的经验，宁少勿滥
			
 
				 - 不需要输出任何文字，直接调用工具即可
			
 
				 - 如果没有值得保存的经验，不调用任何工具
			
 
				-- **完成经验保存后立即停止，不要继续执行原有任务**
			
 
				+- **完成经验暂存后立即停止，不要继续执行原有任务**
			
 
				 """
			
 
				 
			
 
				 
			
--- a/agent/core/runner.py
+++ b/agent/core/runner.py
@@ -37,6 +37,7 @@ from agent.skill.models import Skill
 
				 from agent.skill.skill_loader import load_skills_from_dir
			
 
				 from agent.tools import ToolRegistry, get_tool_registry
			
 
				 from agent.tools.builtin.knowledge import KnowledgeConfig
			
 
				+from agent.core.memory import MemoryConfig
			
 
				 from agent.core.prompts import (
			
 
				     DEFAULT_SYSTEM_PREFIX,
			
 
				     TRUNCATION_HINT,
			
@@ -141,6 +142,9 @@ class RunConfig:
 
				     enable_research_flow: bool = True  # 是否启用自动研究流程（知识检索→经验检索→调研→计划）
			
 
				     # --- 知识管理配置 ---
			
 
				     knowledge: KnowledgeConfig = field(default_factory=KnowledgeConfig)
			
 
				+    # --- Memory 配置（见 agent/docs/memory-plan.md） ---
			
 
				+    # None = 默认 Agent（无长期记忆）；赋值 MemoryConfig 使该 Agent 成为 memory-bearing Agent
			
 
				+    memory: Optional["MemoryConfig"] = None
			
 
				 
			
 
				 
			
 
				     # BUILTIN_TOOLS 硬编码列表已移除（2026-04）。
			
@@ -219,12 +223,45 @@ class AgentRunner:
 
				         # key: 图片内容的 hash, value: {"downscaled": ..., "description": ...}
			
 
				         self._image_opt_cache: Dict[str, Dict[str, Any]] = {}
			
 
				 
			
 
				+        # 当前 run 的 MemoryConfig（由 run() 根据 RunConfig.memory 设置）
			
 
				+        # dream 工具从 context.runner 读取此字段，判断是否 memory-bearing
			
 
				+        self._current_memory_config: Optional[MemoryConfig] = None
			
 
				+
			
 
				     # ===== 核心公开方法 =====
			
 
				 
			
 
				     def get_context_usage(self, trace_id: str) -> Optional[ContextUsage]:
			
 
				         """获取指定 trace 的 context 使用情况"""
			
 
				         return self._context_usage.get(trace_id)
			
 
				 
			
 
				+    async def dream(
			
 
				+        self,
			
 
				+        memory_config: MemoryConfig,
			
 
				+        trace_filter: Optional[Callable[["Trace"], bool]] = None,
			
 
				+        reflect_model: str = "gpt-4o-mini",
			
 
				+        dream_model: str = "gpt-4o",
			
 
				+    ) -> "DreamReport":
			
 
				+        """执行 dream（整理长期记忆）——外部调度入口。
			
 
				+
			
 
				+        Agent 主动调用走 dream 工具；外部调度（定时器、CLI）走这个方法。
			
 
				+
			
 
				+        Args:
			
 
				+            memory_config: 记忆配置
			
 
				+            trace_filter: 可选 trace 过滤（按 agent_type/owner 等）
			
 
				+            reflect_model: per-trace 反思模型
			
 
				+            dream_model: 跨 trace 整合模型
			
 
				+        """
			
 
				+        from agent.core.dream import run_dream
			
 
				+        if not self.trace_store or not self.llm_call:
			
 
				+            raise RuntimeError("dream 需要 trace_store 和 llm_call 均已配置")
			
 
				+        return await run_dream(
			
 
				+            store=self.trace_store,
			
 
				+            llm_call=self.llm_call,
			
 
				+            memory_config=memory_config,
			
 
				+            trace_filter=trace_filter,
			
 
				+            reflect_model=reflect_model,
			
 
				+            dream_model=dream_model,
			
 
				+        )
			
 
				+
			
 
				     async def run(
			
 
				         self,
			
 
				         messages: List[Dict],
			
@@ -253,6 +290,9 @@ class AgentRunner:
 
				         config = config or RunConfig()
			
 
				         trace = None
			
 
				 
			
 
				+        # Memory 模式开关（dream 工具会读取此字段）
			
 
				+        self._current_memory_config = config.memory
			
 
				+
			
 
				         try:
			
 
				             # Phase 1: PREPARE TRACE
			
 
				             trace, goal_tree, sequence = await self._prepare_trace(messages, config)
			
@@ -1172,7 +1212,11 @@ class AgentRunner:
 
				 
			
 
				                 # 追加侧分支 prompt
			
 
				                 if branch_type == "reflection":
			
 
				-                    prompt = config.knowledge.get_reflect_prompt()
			
 
				+                    # 完成场景用全局复盘 prompt，压缩场景用阶段性反思 prompt
			
 
				+                    if break_after_side_branch:
			
 
				+                        prompt = config.knowledge.get_completion_reflect_prompt()
			
 
				+                    else:
			
 
				+                        prompt = config.knowledge.get_reflect_prompt()
			
 
				                 elif branch_type == "knowledge_eval":
			
 
				                     prompt = await self._build_knowledge_eval_prompt(trace_id, goal_tree)
			
 
				                 else:  # compression
			
@@ -1489,6 +1533,27 @@ class AgentRunner:
 
				                     # === 反思侧分支退出（超时 + 正常完成统一处理）===
			
 
				                     self.log.info("反思侧分支退出")
			
 
				 
			
 
				+                    # auto-commit hook：默认 pending 要等人工 review，
			
 
				+                    # 但 reflect_auto_commit=True 时视作全部 approved，直接批量 upload。
			
 
				+                    if (
			
 
				+                        self.trace_store
			
 
				+                        and getattr(config.knowledge, "reflect_auto_commit", False)
			
 
				+                    ):
			
 
				+                        try:
			
 
				+                            from agent.trace.extraction_review import auto_commit_branch
			
 
				+                            report = await auto_commit_branch(
			
 
				+                                self.trace_store,
			
 
				+                                trace_id,
			
 
				+                                side_branch_ctx.branch_id,
			
 
				+                            )
			
 
				+                            if report.committed or report.failed:
			
 
				+                                self.log.info(
			
 
				+                                    f"[auto-commit] committed={len(report.committed)} "
			
 
				+                                    f"failed={len(report.failed)} skipped={len(report.skipped)}"
			
 
				+                                )
			
 
				+                        except Exception as e:
			
 
				+                            self.log.error(f"[auto-commit] 反思分支自动提交失败: {e}")
			
 
				+
			
 
				                     # 恢复主路径
			
 
				                     if self.trace_store:
			
 
				                         main_path_messages = await self.trace_store.get_main_path_messages(
			
@@ -2843,6 +2908,20 @@ class AgentRunner:
 
				             if skills_text:
			
 
				                 system_prompt += f"\n\n## Skills\n{skills_text}"
			
 
				 
			
 
				+        # Memory 注入（memory-bearing Agent）——在 system prompt 末尾追加
			
 
				+        # 初版选择 system prompt 追加（见 agent/docs/memory-plan.md 待定问题 1）。
			
 
				+        # 好处：run 启动一次性注入、所有后续轮次都能看到、与 skills 注入方式一致。
			
 
				+        # 代价：若记忆文件很大会持续占 prompt tokens —— 待观察后决定是否切换方案。
			
 
				+        if config.memory:
			
 
				+            try:
			
 
				+                from agent.core.memory import load_memory_files, format_memory_injection
			
 
				+                files = load_memory_files(config.memory)
			
 
				+                memory_text = format_memory_injection(files)
			
 
				+                if memory_text:
			
 
				+                    system_prompt += f"\n\n{memory_text}"
			
 
				+            except Exception as e:
			
 
				+                self.log.warning(f"[Memory] 加载记忆失败，跳过注入: {e}")
			
 
				+
			
 
				         return system_prompt
			
 
				 
			
 
				     async def _generate_task_name(self, messages: List[Dict]) -> str:
			
--- a/agent/docs/memory.md
+++ b/agent/docs/memory.md
@@ -1,6 +1,8 @@
 
				-# Memory 系统与元思考机制设计
			
 
				+# Memory 系统与元思考机制
			
 
				 
			
 
				-> 状态：设计讨论中，未实现
			
 
				+> 状态：已实现（2026-04）。本文档同时承担**设计理由**和**使用规范**。
			
 
				+> 入口、工具、API 清单见文末"十、实现与入口"。
			
 
				+> 一~九节解释"为什么这么做"，改动前请先读懂论证。
			
 
				 
			
 
				 ---
			
 
				 
			
@@ -119,9 +121,38 @@ trace 结束只意味着 Agent 行动完一个轮次。后续可能发生：
 
				 
			
 
				 如果 trace 一结束就做记忆反思，这些后续信息会被忽略。记忆反思的价值在于**综合一段时间的经历**，不是记录每次行动的即时感受。
			
 
				 
			
 
				-### 但知识提取仍然在压缩/完成时做
			
 
				+### 但知识提取仍然在压缩/完成时做（采用"提取-审核-提交"两阶段）
			
 
				 
			
 
				-这不矛盾。知识提取保存的是**客观知识**（工具用法、调研结果），这些不会因为后续反馈而失效。而且压缩会删除历史，如果不在压缩前提取，知识就永久丢失了。
			
 
				+知识提取必须在压缩/完成时做，因为压缩会删除历史，不在压缩前提取，知识就永久丢失。
			
 
				+
			
 
				+但"立即 upload 到 KnowHub"这一步并不需要立即做。所谓"客观知识"也可能被后续推翻：
			
 
				+
			
 
				+- 工具用法可能被后续 trace 发现是错的（例如某个参数其实有副作用）
			
 
				+- 调研结论可能被用户反馈推翻
			
 
				+- 一次 trace 的"成功经验"在更长窗口看可能是反模式
			
 
				+
			
 
				+如果 reflection 直接 upload 到 KnowHub，错误知识会立刻污染全局检索，影响所有 Agent。
			
 
				+
			
 
				+**两阶段方案**：
			
 
				+
			
 
				+```
			
 
				+Step 1: extract（自动，压缩前/任务结束）
			
 
				+  Reflection 侧分支提取知识 → 写 cognition_log: type="extraction_pending"
			
 
				+  不调用 upload_knowledge（信息保全已完成）
			
 
				+
			
 
				+Step 2: review（人工，CLI 里逐条决策）
			
 
				+  approve / edit / discard → 写 cognition_log: type="extraction_reviewed"
			
 
				+
			
 
				+Step 3: commit（人工触发，批量上传）
			
 
				+  把 reviewed=approved 的批量 upload_knowledge
			
 
				+  写 cognition_log: type="extraction_committed"
			
 
				+```
			
 
				+
			
 
				+review 和 commit 分开的理由：review 是逐条语义判断（要不要、内容对不对），commit 是机械批量动作。两者分离允许用户分批 review、最后一次 commit；也允许撤回 review 决策。
			
 
				+
			
 
				+**默认行为**：所有 Agent（包括默认 Agent 和 memory-bearing Agent）`reflect_auto_commit` 默认关闭，pending 提取必须人工 review + commit 才会进 KnowHub。如需自动直通（保留旧行为），手动在 `KnowledgeConfig` 里打开 `reflect_auto_commit=True`。
			
 
				+
			
 
				+这与"信息保全 vs 全局发布解耦"的原则一致 —— 压缩前必须做的是**保全**（写本地 cognition_log），**发布**到 KnowHub 可以延迟到有人确认时。
			
 
				 
			
 
				 ---
			
 
				 
			
@@ -267,6 +298,25 @@ reflected_at_sequence: Optional[int] = None    # 上次记忆反思的 sequence
 
				 memory: Optional[MemoryConfig] = None
			
 
				 ```
			
 
				 
			
 
				+**4. KnowledgeConfig 扩展**
			
 
				+
			
 
				+`agent/core/runner.py:KnowledgeConfig`（或对应类）新增字段：
			
 
				+
			
 
				+```python
			
 
				+reflect_auto_commit: bool = False
			
 
				+# False（默认，所有 Agent）: reflection 只写 cognition_log: type="extraction_pending"
			
 
				+#                          人工通过 CLI review + commit 才进 KnowHub
			
 
				+# True（手动开启）         : reflection 直接 upload_knowledge，保留旧的"提取即上传"行为
			
 
				+```
			
 
				+
			
 
				+**5. Reflection 侧分支行为变更**
			
 
				+
			
 
				+当前 reflection 的 prompt 直接指导 LLM 调用 `upload_knowledge`。需要改为：
			
 
				+- `reflect_auto_commit=False` 时：prompt 指导 LLM 调用新的 `record_pending_extraction` 工具（仅写 cognition_log）
			
 
				+- `reflect_auto_commit=True` 时：保持当前行为
			
 
				+
			
 
				+或者更简洁的实现：reflection 始终调用 `record_pending_extraction`，由侧分支结束后的 hook 根据 `reflect_auto_commit` 决定是否立即调用 `commit_approved`（视为全部 approved）。这避免了 prompt 分叉。
			
 
				+
			
 
				 ### 新增的部分
			
 
				 
			
 
				 **1. MemoryConfig**
			
@@ -277,14 +327,17 @@ class MemoryConfig:
 
				     """持久化记忆配置"""
			
 
				 
			
 
				     base_path: str = ""                          # 记忆文件目录
			
 
				-    files: Optional[Dict[str, str]] = None       # {文件名: 用途说明}
			
 
				+    files: Optional[Dict[str, str]] = None       # {路径: 用途说明}
			
 
				+    # key 是相对 base_path 的路径，支持嵌套（如 "core/identity.md"）或 glob
			
 
				+    # （如 "relationships/*.md"）。框架只负责按 key 读文件内容注入上下文，
			
 
				+    # 组织结构由配置者决定。
			
 
				     dream_prompt: str = ""                       # Dream 整合 prompt（空用默认）
			
 
				     reflect_prompt: str = ""                     # Per-trace 反思 prompt（空用默认）
			
 
				 ```
			
 
				 
			
 
				 **2. Run 启动时记忆加载**
			
 
				 
			
 
				-Memory-bearing Agent 的 run 启动时，框架读取 `base_path` 下所有 `files` 中声明的文件，注入上下文。
			
 
				+Memory-bearing Agent 的 run 启动时，框架按 `files` 的 key 依次解析（直接路径或 glob 匹配），读取命中的文件内容以字符串形式注入上下文。Agent 可用 write_file 新增文件；只要新文件的路径匹配某条 key（直接路径或 glob），下次 run 启动时自动加载。
			
 
				 
			
 
				 **3. Dream 操作**
			
 
				 
			
@@ -301,6 +354,61 @@ async def dream() -> ToolResult:
 
				 
			
 
				 也可以作为 `AgentRunner` 的方法暴露，供外部调度直接调用。
			
 
				 
			
 
				+**4. 提取审核 CLI 流程**
			
 
				+
			
 
				+为支持"提取-审核-提交"两阶段（见第三节），新增 `agent/cli/extraction_review.py` 模块。**不是 Agent 工具**（Agent 不应自我审核），是 CLI 内部模块 + 独立可执行脚本：
			
 
				+
			
 
				+```python
			
 
				+# agent/cli/extraction_review.py
			
 
				+
			
 
				+async def list_pending(trace_id: str) -> list[PendingExtraction]:
			
 
				+    """读 cognition_log，返回 type=extraction_pending 且未 reviewed 的条目"""
			
 
				+
			
 
				+async def review_one(
			
 
				+    trace_id: str,
			
 
				+    extraction_id: str,
			
 
				+    decision: Literal["approve", "edit", "discard"],
			
 
				+    edited_content: Optional[str] = None,
			
 
				+) -> None:
			
 
				+    """写 reviewed 事件到 cognition_log"""
			
 
				+
			
 
				+async def commit_approved(trace_id: str) -> CommitReport:
			
 
				+    """批量上传 approved 条目到 KnowHub，写 committed 事件"""
			
 
				+```
			
 
				+
			
 
				+可独立调用：
			
 
				+
			
 
				+```bash
			
 
				+python -m agent.cli.extraction_review --trace XXX --list
			
 
				+python -m agent.cli.extraction_review --trace XXX --commit
			
 
				+```
			
 
				+
			
 
				+**集成到现有交互式 CLI**（`agent/cli/interactive.py:174` 的菜单）扩展两项：
			
 
				+
			
 
				+```
			
 
				+  1. 插入干预消息并继续
			
 
				+  2. 触发经验总结（reflect）         ← 现有
			
 
				+  ...
			
 
				+  8. 审核待提交知识（review）        ← 新增
			
 
				+  9. 提交已审核知识到 KnowHub        ← 新增
			
 
				+```
			
 
				+
			
 
				+`8` 进入交互式 review 循环：
			
 
				+
			
 
				+```
			
 
				+[1/3] tool 经验
			
 
				+─────────────────────
			
 
				+nanobanana 工具的 strength 参数 < 0.3 时会丢失原图轮廓...
			
 
				+─────────────────────
			
 
				+[a]pprove / [e]dit / [d]iscard / [s]kip / [q]uit:
			
 
				+```
			
 
				+
			
 
				+`9` 显示 approved 列表 + 用户最终确认 → 调 `commit_approved`，输出 commit 报告（成功/失败条数、KnowHub 返回的 ID）。
			
 
				+
			
 
				+**实现注意**：
			
 
				+- 现有 `perform_reflection`（`interactive.py:269`）走 HTTP API（`/api/traces/{trace_id}/reflect`）。新流程同样应该走 API 端点（如 `POST /api/traces/{trace_id}/extractions/{id}/review`、`POST /api/traces/{trace_id}/extractions/commit`），让未来 Web UI 能复用同一套审核流，而不是 CLI 直接读写 cognition_log 文件。
			
 
				+- "edit" 分支允许用户直接修改 LLM 生成的 markdown 内容；初版只支持改正文文本，后续可扩展到改类型/metadata。
			
 
				+
			
 
				 ---
			
 
				 
			
 
				 ## 六、完整的元思考数据流
			
@@ -314,13 +422,19 @@ Agent 执行任务（Trace）
 
				   │
			
 
				   ├─ 压缩触发 →
			
 
				   │   队列: [reflection, knowledge_eval, compression]
			
 
				-  │   reflection: 提取客观知识 → upload → KnowHub + cognition_log: type="extraction"
			
 
				+  │   reflection: 提取客观知识 → cognition_log: type="extraction_pending"
			
 
				+  │                            （默认不直接 upload，等人工 review）
			
 
				   │   knowledge_eval: 评估各 source → cognition_log: type="evaluation"
			
 
				   │   compression: 压缩上下文
			
 
				   │
			
 
				   ├─ 任务完成 →
			
 
				   │   knowledge_eval（如有 pending）→ cognition_log: type="evaluation"
			
 
				-  │   reflection → upload → KnowHub + cognition_log: type="extraction"
			
 
				+  │   reflection → cognition_log: type="extraction_pending"
			
 
				+  │
			
 
				+  ├─ 人工审核（CLI 触发，可发生在任意时刻）→
			
 
				+  │   逐条 approve/edit/discard → cognition_log: type="extraction_reviewed"
			
 
				+  │   批量 commit → upload_knowledge → KnowHub
			
 
				+  │                + cognition_log: type="extraction_committed"
			
 
				   │
			
 
				   └─ Trace 状态更新（新消息使 reflected_at_sequence 落后）
			
 
				 
			
@@ -359,36 +473,40 @@ Trace 结束后:
 
				 
			
 
				 ## 七、记忆模型全景
			
 
				 
			
 
				+Memory 和 Knowledge 是**两条平行的线**，而不是抽象层级。区分维度是"主观 vs 客观"和"私有 vs 共享"。Memory 不会"升级"成 Knowledge，反过来也不会。
			
 
				+
			
 
				 ```
			
 
				-┌─────────────────────────────────────────────────────────────┐
			
 
				-│ Layer 3: Skills（技能库）                                     │
			
 
				-│ - Markdown 文件，领域知识和能力描述                            │
			
 
				-└─────────────────────────────────────────────────────────────┘
			
 
				-                              ▲
			
 
				-                              │ 归纳
			
 
				-┌─────────────────────────────────────────────────────────────┐
			
 
				-│ Layer 2: Knowledge（知识库）— 全局共享                         │
			
 
				-│ - KnowHub 数据库，客观知识 + 向量索引                         │
			
 
				-│ - 来源：reflection 侧分支提取                                │
			
 
				-│ - 质量信号：knowledge_eval 评估结果                           │
			
 
				-└─────────────────────────────────────────────────────────────┘
			
 
				-                              ▲
			
 
				-                              │ 提取（reflection）/ 评估（knowledge_eval）
			
 
				-┌─────────────────────────────────────────────────────────────┐
			
 
				-│ Layer 1.5: Memory（个人记忆）— Agent 身份私有                  │
			
 
				-│ - Markdown 文件，主观记忆（偏好/策略/反思）                    │
			
 
				-│ - 来源：dream 操作（per-trace 反思 + 跨 trace 整合）          │
			
 
				-│ - 人类可直接编辑                                              │
			
 
				-└─────────────────────────────────────────────────────────────┘
			
 
				-                              ▲
			
 
				-                              │ dream 反思
			
 
				-┌─────────────────────────────────────────────────────────────┐
			
 
				-│ Layer 1: Trace（任务状态）                                    │
			
 
				-│ - 当前任务的工作记忆                                          │
			
 
				-│ - Messages + Goals + cognition_log                           │
			
 
				-└─────────────────────────────────────────────────────────────┘
			
 
				+                    ┌─────────────────────────────┐
			
 
				+                    │ Trace（任务状态 / 工作记忆）  │
			
 
				+                    │ Messages + Goals             │
			
 
				+                    │ + cognition_log              │
			
 
				+                    └──────────┬──────────────────┘
			
 
				+                               │
			
 
				+              dream 反思       │      reflection 提取（→ pending）
			
 
				+              （延迟、可选）    │      knowledge_eval 评估
			
 
				+                               │      （即时、必做）
			
 
				+                  ┌────────────┴───────────┐
			
 
				+                  ▼                        ▼
			
 
				+        ┌──────────────────┐     ┌──────────────────────┐
			
 
				+        │ Memory           │     │ Knowledge            │
			
 
				+        │ Agent 身份私有    │     │ KnowHub 全局共享      │
			
 
				+        ├──────────────────┤     ├──────────────────────┤
			
 
				+        │ 主观 / 偏好 / 策略 │     │ 客观 / 工具 / 调研    │
			
 
				+        │ Markdown 文件     │     │ DB + 向量索引         │
			
 
				+        │ 人类可直接编辑     │     │ 经 review 才入库      │
			
 
				+        │ 来源: dream       │     │ 来源: reflection      │
			
 
				+        └────────┬─────────┘     └──────────┬───────────┘
			
 
				+                 │                          │
			
 
				+                 └────注入下次 run──────────┘
			
 
				 ```
			
 
				 
			
 
				+**两条线的交互**（不是层级关系，是同源 + 互相参考）：
			
 
				+
			
 
				+- 都源自同一个 Trace（cognition_log 是共同的事件流）
			
 
				+- dream 在生成记忆摘要时可以参考 cognition_log 中的 evaluation 趋势（来自 Knowledge 这条线）
			
 
				+- reflection 也可以参考 Memory 来判断"这条经验我已经记过了"
			
 
				+- 但二者的**读者不同**：Memory 只服务于同一身份的未来 run；Knowledge 服务于所有 Agent
			
 
				+
			
 
				 ---
			
 
				 
			
 
				 ## 八、两类 Agent
			
@@ -401,16 +519,102 @@ Trace 结束后:
 
				 | Dream | ❌ | ✅ 可调用 dream 工具 |
			
 
				 | Run 启动加载记忆 | ❌ | ✅ 自动注入 |
			
 
				 
			
 
				-默认行为不变。Memory 是 opt-in 的增量能力。
			
 
				+Memory 是 opt-in 的增量能力。但**知识提取的提交行为变了**：默认 Agent 也不再自动 upload 到 KnowHub，必须通过 CLI 人工 review + commit；如需保留旧的"提取即上传"行为，手动设置 `KnowledgeConfig.reflect_auto_commit=True`。
			
 
				 
			
 
				 ---
			
 
				 
			
 
				-## 九、待定问题
			
 
				+## 九、开放与已决问题
			
 
				+
			
 
				+`[DECIDED]` 已有落地结论；`[OPEN]` 尚未决定，等真实运行数据再定。
			
 
				+
			
 
				+1. `[DECIDED]` **记忆注入方式** → system prompt 末尾追加。见 `runner.py:_build_system_prompt` 里调 `format_memory_injection`。代价：若记忆文件很大，每轮 LLM 调用都带 —— 暂时接受，等实际观察到膨胀再换方案。
			
 
				+2. `[OPEN]` **并发写冲突**：多个 Agent run 同时写同一个记忆文件怎么办？文件锁？还是 dream 统一写、其他 run 只读？当前没做并发保护，假设 dream 是单一写入方。
			
 
				+3. `[OPEN]` **记忆膨胀**：记忆文件越来越长怎么办？`DEFAULT_DREAM_PROMPT` 已写"在原有基础上演进不要重写"，但是否真能控制住要看实际使用。
			
 
				+4. `[OPEN]` **Per-trace 反思的成本控制**：很短的 trace 不值得反思。当前 `per_trace_reflect` 无下限阈值，所有 `reflected_at_sequence < last_sequence` 的 trace 都会反思。
			
 
				+5. `[OPEN]` **Knowledge eval 结果回传 KnowHub**：仍然只存本地 cognition_log。
			
 
				+6. `[DECIDED]` **Dream 中评估趋势的呈现方式** → LLM 直接读 cognition_log 原始事件。见 `dream.py:_build_reflect_input`，把 query / evaluation / extraction_pending / extraction_committed 事件摘要化后一并塞给 LLM，不做预计算统计。
			
 
				+7. `[DECIDED]` **Dream 操作的实现形式** → 两者都提供。Agent 主动调用走 `dream` 工具（`agent/tools/builtin/memory.py`，`memory` 组），外部调度走 `AgentRunner.dream()` 方法。
			
 
				+8. `[OPEN]` **未 review 的 pending 提取何时清理**：目前没有 TTL，pending 无限期累积。等观察积压速度再定（例如 30 天未 review 自动 discard / 归档）。
			
 
				+9. `[OPEN]` **review 的"edit"分支允许多深**：初版只支持改 markdown 字段（task/content/score/tags）。改 type 或 metadata 目前需 discard 重写。
			
 
				+10. `[OPEN]` **批量 review 的辅助能力**：当前逐条看。未做批量 approve / 相似条目去重 / LLM 预筛。
			
 
				+11. `[OPEN]` **Dream 的 JSON 解析脆弱性**：`cross_trace_integrate` 依赖 LLM 严格输出 `{updates:[...]}` JSON（见 `dream.py:_parse_dream_output`）。真实 LLM 可能偶尔加前言、用不同键名。首次线上运行需监控 parse 失败率，必要时加重试 + 更严格 prompt。
			
 
				+
			
 
				+---
			
 
				+
			
 
				+## 十、实现与入口
			
 
				+
			
 
				+2026-04 落地清单，供看代码时快速定位。
			
 
				+
			
 
				+### 10.1 数据层
			
 
				+
			
 
				+| 改动 | 位置 |
			
 
				+|---|---|
			
 
				+| Trace 新字段 `reflected_at_sequence` | `agent/trace/models.py:Trace` |
			
 
				+| cognition_log 事件 schema（含新增的 extraction_pending/reviewed/committed + reflection） | `agent/trace/store.py:append_cognition_event` docstring |
			
 
				+
			
 
				+### 10.2 提取-审核-提交两阶段
			
 
				+
			
 
				+| 职责 | 位置 |
			
 
				+|---|---|
			
 
				+| LLM 暂存用工具（core 组默认可见） | `agent/tools/builtin/knowledge.py:knowledge_save_pending` |
			
 
				+| 反思 prompts（已改为调 `knowledge_save_pending`） | `agent/core/prompts/knowledge.py` |
			
 
				+| Auto-commit 开关（默认 False） | `KnowledgeConfig.reflect_auto_commit` |
			
 
				+| 反思侧分支退出时的 auto-commit hook | `agent/core/runner.py` 反射分支退出分支内 |
			
 
				+| 核心逻辑（list_pending / review_one / commit_approved / auto_commit_branch） | `agent/trace/extraction_review.py` |
			
 
				+| **独立 CLI 入口** | `python -m agent.cli.extraction_review --trace <ID> [--list/--list-all/--review/--commit]` |
			
 
				+| **交互式菜单入口** | `agent/cli/interactive.py` 菜单项 8（review）/ 9（commit） |
			
 
				+| **HTTP API 入口** | `GET /api/traces/{tid}/extractions`、`POST .../extractions/{eid}/review`、`POST .../extractions/commit`（见 `agent/trace/run_api.py`） |
			
 
				+
			
 
				+三种入口共享同一个核心模块 `agent/trace/extraction_review.py`。
			
 
				+
			
 
				+### 10.3 Memory + Dream
			
 
				+
			
 
				+| 职责 | 位置 |
			
 
				+|---|---|
			
 
				+| MemoryConfig 定义 | `agent/core/memory.py:MemoryConfig` |
			
 
				+| 记忆文件加载（支持 glob + 去重） | `agent/core/memory.py:load_memory_files` |
			
 
				+| 记忆注入格式 | `agent/core/memory.py:format_memory_injection` |
			
 
				+| 注入到 system prompt | `agent/core/runner.py:_build_system_prompt`（memory 段落在 skills 段之后） |
			
 
				+| Dream per-trace 反思 | `agent/core/dream.py:per_trace_reflect` |
			
 
				+| Dream 跨 trace 整合 | `agent/core/dream.py:cross_trace_integrate` |
			
 
				+| Dream 顶层入口 | `agent/core/dream.py:run_dream` |
			
 
				+| **Agent 工具入口（memory 组）** | `agent/tools/builtin/memory.py:dream` |
			
 
				+| **外部调度入口** | `AgentRunner.dream(memory_config, trace_filter=..., reflect_model=..., dream_model=...)` |
			
 
				+| 默认 prompts | `dream.py:DEFAULT_REFLECT_PROMPT` / `DEFAULT_DREAM_PROMPT`（可通过 `MemoryConfig.reflect_prompt`/`dream_prompt` 覆盖） |
			
 
				+
			
 
				+### 10.4 启用方式
			
 
				+
			
 
				+默认 Agent 不启用 memory，但**提取审核仍然生效**（pending 不自动上传 KnowHub）。
			
 
				+
			
 
				+要让某个 example 直接上传（恢复旧行为）：
			
 
				+```python
			
 
				+RunConfig(knowledge=KnowledgeConfig(reflect_auto_commit=True))
			
 
				+```
			
 
				+
			
 
				+要让一个 Agent 变成 memory-bearing：
			
 
				+```python
			
 
				+from agent.core.memory import MemoryConfig
			
 
				+
			
 
				+RunConfig(
			
 
				+    memory=MemoryConfig(
			
 
				+        base_path="/path/to/agent_memory",
			
 
				+        files={
			
 
				+            "taste.md": "品味偏好",
			
 
				+            "strategy.md": "当前策略",
			
 
				+            "journals/*.md": "执行日记",
			
 
				+        },
			
 
				+    ),
			
 
				+    tool_groups=["core", "memory"],   # memory 组暴露 dream 工具
			
 
				+)
			
 
				+```
			
 
				+
			
 
				+然后周期性（或 Agent 主动调用 `dream` 工具）触发：
			
 
				+```python
			
 
				+await runner.dream(memory_config=rc.memory)
			
 
				+```
			
 
				+
			
 
				+### 10.5 已知 rough edges
			
 
				 
			
 
				-1. **记忆注入方式**：system prompt 追加 vs 首条消息前插入 vs 作为工具结果注入？需要实验对比效果。
			
 
				-2. **并发写冲突**：多个 Agent run 同时写同一个记忆文件怎么办？文件锁？还是 dream 统一写、其他 run 只读？
			
 
				-3. **记忆膨胀**：记忆文件越来越长怎么办？dream prompt 应该包含精简逻辑，但需要观察实际效果。
			
 
				-4. **Per-trace 反思的成本控制**：很短的 trace 不值得反思。阈值由框架设定（消息数/token数）还是让 dream 过程自己判断？
			
 
				-5. **Knowledge eval 结果回传 KnowHub**：是否应该自动同步？自动回传可能影响其他 Agent 的检索。
			
 
				-6. **Dream 中 knowledge_log 趋势的呈现方式**：在 dream prompt 中注入预计算的统计 vs 让 LLM 自己读原始 log？
			
 
				-7. **Dream 操作的实现形式**：作为 Agent 工具（`dream()`）vs AgentRunner 方法 vs 两者都提供？
			
 
				+- 实施过程发现旧的 `upload_knowledge` 引用是悬空的（仓内无实现），未清理 `examples/*/prompt` 里的残留引用
			
 
				+- Dream 两次 LLM 调用（reflect + integrate）默认模型写死 `gpt-4o-mini` / `gpt-4o`，未接入 RunConfig 的 utility_llm_call
			
 
				+- `trace_filter` 没提供按 `agent_type` / `owner` 过滤的便捷函数，调用方传 lambda
			
--- a/agent/tools/builtin/__init__.py
+++ b/agent/tools/builtin/__init__.py
@@ -17,7 +17,9 @@ from agent.tools.builtin.bash import bash_command
 
				 from agent.tools.builtin.skill import skill, list_skills
			
 
				 from agent.tools.builtin.subagent import agent, evaluate
			
 
				 # sandbox 工具已废弃（2026-04）；search.py / crawler.py 已重构为 content/ 工具族（2026-04）
			
 
				-from agent.tools.builtin.knowledge import(knowledge_search,knowledge_save,knowledge_list,knowledge_update,knowledge_batch_update,knowledge_slim)
			
 
				+from agent.tools.builtin.knowledge import(knowledge_search,knowledge_save,knowledge_save_pending,knowledge_list,knowledge_update,knowledge_batch_update,knowledge_slim)
			
 
				+# Memory / Dream（见 agent/docs/memory-plan.md）
			
 
				+from agent.tools.builtin.memory import dream
			
 
				 # 知识上传/查询已统一到 agent 工具：
			
 
				 #   agent(agent_type="remote_librarian", task=...)         # 查询
			
 
				 #   agent(agent_type="remote_librarian_ingest", task=...)  # 上传（异步）
			
@@ -78,4 +80,7 @@ __all__ = [
 
				     "import_content",
			
 
				     # Goal 管理
			
 
				     "goal",
			
 
				+    # Memory & Knowledge 提取审核
			
 
				+    "knowledge_save_pending",  # 反思侧分支暂存（core 组默认可见）
			
 
				+    "dream",                    # memory-bearing Agent 整理长期记忆（memory 组）
			
 
				 ]
			
--- a/agent/tools/builtin/knowledge.py
+++ b/agent/tools/builtin/knowledge.py
@@ -8,6 +8,7 @@ import os
 
				 import json
			
 
				 import logging
			
 
				 import subprocess
			
 
				+import uuid
			
 
				 import httpx
			
 
				 from dataclasses import dataclass
			
 
				 from typing import List, Dict, Optional, Any
			
@@ -34,6 +35,12 @@ class KnowledgeConfig:
 
				     enable_completion_extraction: bool = True      # 是否在运行完成后提取知识
			
 
				     completion_reflect_prompt: str = ""            # 自定义复盘 prompt；空则使用默认，见 agent/core/prompts/knowledge.py:COMPLETION_REFLECT_PROMPT
			
 
				 
			
 
				+    # 提取-审核-提交两阶段开关（见 agent/docs/memory-plan.md 第三节）
			
 
				+    reflect_auto_commit: bool = False
			
 
				+    # False（默认）: reflection 仅写 cognition_log: type="extraction_pending"，
			
 
				+    #               人工通过 CLI（agent/cli/extraction_review.py）review + commit 才进 KnowHub
			
 
				+    # True         : reflection 直接 upload_knowledge（旧行为），适合无人值守的 example
			
 
				+
			
 
				     # 知识注入（agent切换当前工作的goal时，自动注入相关知识）
			
 
				     enable_injection: bool = True          # 是否在 focus goal 时自动注入相关知识
			
 
				 
			
@@ -274,6 +281,114 @@ async def knowledge_save(
 
				         )
			
 
				 
			
 
				 
			
 
				+@tool(groups=["core"], hidden_params=["context"])
			
 
				+async def knowledge_save_pending(
			
 
				+    task: str,
			
 
				+    content: str,
			
 
				+    types: List[str],
			
 
				+    tags: Optional[Dict[str, str]] = None,
			
 
				+    scopes: Optional[List[str]] = None,
			
 
				+    owner: Optional[str] = None,
			
 
				+    resource_ids: Optional[List[str]] = None,
			
 
				+    source_name: str = "",
			
 
				+    source_category: str = "exp",
			
 
				+    urls: Optional[List[str]] = None,
			
 
				+    agent_id: str = "research_agent",
			
 
				+    submitted_by: str = "",
			
 
				+    score: int = 3,
			
 
				+    capability_ids: Optional[List[str]] = None,
			
 
				+    tool_ids: Optional[List[str]] = None,
			
 
				+    context: Optional[ToolContext] = None,
			
 
				+) -> ToolResult:
			
 
				+    """
			
 
				+    暂存一条待审核的知识提取（不直接写入 KnowHub）。
			
 
				+
			
 
				+    写入 cognition_log: type="extraction_pending"，等待人工通过 CLI
			
 
				+    （agent/cli/extraction_review.py）review + commit 才会进入 KnowHub。
			
 
				+    参数与 knowledge_save 对齐，review 通过后字段透传给 knowledge_save。
			
 
				+
			
 
				+    Args:
			
 
				+        task: 任务描述（在什么情景下 + 要完成什么目标）
			
 
				+        content: 核心内容
			
 
				+        types: 知识类型 ["experience"] / ["tool"] / ["strategy"] / ["case"]
			
 
				+        tags: 业务标签
			
 
				+        scopes: 可见范围（默认 ["org:cybertogether"]，commit 时应用）
			
 
				+        owner: 所有者（commit 时应用）
			
 
				+        resource_ids: 关联的资源 ID
			
 
				+        source_name: 来源名称
			
 
				+        source_category: 来源类别（paper/exp/skill/book）
			
 
				+        urls: 参考来源链接
			
 
				+        agent_id: 执行此调研的 agent ID
			
 
				+        submitted_by: 提交者
			
 
				+        score: 初始评分 1-5
			
 
				+        capability_ids: 关联的能力 ID
			
 
				+        tool_ids: 关联的工具 ID
			
 
				+
			
 
				+    Returns:
			
 
				+        暂存结果（含 extraction_id，用于后续 review/commit）
			
 
				+    """
			
 
				+    try:
			
 
				+        store = context.get("store") if context else None
			
 
				+        trace_id = context.get("trace_id") if context else None
			
 
				+        sequence = context.get("sequence") if context else None
			
 
				+        goal_id = context.get("goal_id") if context else None
			
 
				+        side_branch = context.get("side_branch") if context else None
			
 
				+
			
 
				+        if not store or not trace_id:
			
 
				+            return ToolResult(
			
 
				+                title="❌ 暂存失败",
			
 
				+                output="缺少 store 或 trace_id，无法写入 cognition_log",
			
 
				+                error="missing trace context"
			
 
				+            )
			
 
				+
			
 
				+        extraction_id = f"pending-{uuid.uuid4().hex[:12]}"
			
 
				+
			
 
				+        payload = {
			
 
				+            "task": task,
			
 
				+            "content": content,
			
 
				+            "types": types,
			
 
				+            "tags": tags or {},
			
 
				+            "scopes": scopes,
			
 
				+            "owner": owner,
			
 
				+            "resource_ids": resource_ids or [],
			
 
				+            "source_name": source_name,
			
 
				+            "source_category": source_category,
			
 
				+            "urls": urls or [],
			
 
				+            "agent_id": agent_id,
			
 
				+            "submitted_by": submitted_by,
			
 
				+            "score": score,
			
 
				+            "capability_ids": capability_ids or [],
			
 
				+            "tool_ids": tool_ids or [],
			
 
				+        }
			
 
				+
			
 
				+        await store.append_cognition_event(
			
 
				+            trace_id=trace_id,
			
 
				+            event={
			
 
				+                "type": "extraction_pending",
			
 
				+                "extraction_id": extraction_id,
			
 
				+                "sequence": sequence,
			
 
				+                "goal_id": goal_id,
			
 
				+                "branch_id": side_branch.get("branch_id") if side_branch else None,
			
 
				+                "payload": payload,
			
 
				+            }
			
 
				+        )
			
 
				+
			
 
				+        return ToolResult(
			
 
				+            title="✅ 已暂存待审核",
			
 
				+            output=f"Extraction ID: {extraction_id}\n主题: {task[:80]}\n类型: {types}\n评分: {score}\n\n等待人工 review + commit 才会进入 KnowHub。",
			
 
				+            long_term_memory=f"暂存知识提取: {extraction_id} - {task[:50]}",
			
 
				+            metadata={"extraction_id": extraction_id}
			
 
				+        )
			
 
				+
			
 
				+    except Exception as e:
			
 
				+        logger.error(f"暂存待审核知识失败: {e}")
			
 
				+        return ToolResult(
			
 
				+            title="❌ 暂存失败",
			
 
				+            output=f"错误: {str(e)}",
			
 
				+            error=str(e)
			
 
				+        )
			
 
				+
			
 
				+
			
 
				 @tool(groups=["knowledge_internal"], hidden_params=["context"])
			
 
				 async def knowledge_update(
			
 
				     knowledge_id: str,
			
--- a/agent/tools/builtin/memory.py
+++ b/agent/tools/builtin/memory.py
@@ -0,0 +1,96 @@
 
				+"""
			
 
				+Memory 相关工具 —— 目前只包含 dream 操作（见 agent/docs/memory-plan.md 第四节）。
			
 
				+
			
 
				+dream 整理 Agent 身份的长期记忆：回顾最近 trace 的执行历史，
			
 
				+逐个 trace 做反思，再跨 trace 整合写回记忆文件。
			
 
				+
			
 
				+设计要点：
			
 
				+- 需要 config.memory（MemoryConfig）才可用；否则报错。
			
 
				+- 不是 knowledge_save_pending 那样每 trace 都要用的日常工具 ——
			
 
				+  所以放在独立 group "memory"，通过 tool_groups 显式开启。
			
 
				+"""
			
 
				+
			
 
				+from __future__ import annotations
			
 
				+
			
 
				+import logging
			
 
				+from typing import Optional
			
 
				+
			
 
				+from agent.tools import tool, ToolResult, ToolContext
			
 
				+
			
 
				+logger = logging.getLogger(__name__)
			
 
				+
			
 
				+
			
 
				+@tool(groups=["memory"], hidden_params=["context"])
			
 
				+async def dream(
			
 
				+    reflect_model: str = "",
			
 
				+    dream_model: str = "",
			
 
				+    context: Optional[ToolContext] = None,
			
 
				+) -> ToolResult:
			
 
				+    """整理长期记忆。回顾最近的执行历史，更新记忆文件。
			
 
				+
			
 
				+    本工具做两件事：
			
 
				+        1. per-trace 反思：扫描未反思的 trace，为每个生成反思摘要
			
 
				+        2. 跨 trace 整合：汇总未消化的反思 + 当前记忆，让 LLM 更新记忆文件
			
 
				+
			
 
				+    需要 RunConfig.memory（MemoryConfig）才可调用。
			
 
				+
			
 
				+    Args:
			
 
				+        reflect_model: per-trace 反思用的模型（空则默认 gpt-4o-mini）
			
 
				+        dream_model:   跨 trace 整合用的模型（空则默认 gpt-4o）
			
 
				+    """
			
 
				+    runner = context.get("runner") if context else None
			
 
				+    if runner is None:
			
 
				+        return ToolResult(
			
 
				+            title="❌ dream 不可用",
			
 
				+            output="缺少 runner（需要从 AgentRunner 上下文调用）",
			
 
				+            error="runner not in context",
			
 
				+        )
			
 
				+
			
 
				+    memory_config = getattr(runner, "_current_memory_config", None)
			
 
				+    if memory_config is None:
			
 
				+        return ToolResult(
			
 
				+            title="❌ dream 不可用",
			
 
				+            output="当前 Agent 未配置 MemoryConfig，不是 memory-bearing Agent",
			
 
				+            error="memory not configured",
			
 
				+        )
			
 
				+
			
 
				+    if not runner.trace_store or not runner.llm_call:
			
 
				+        return ToolResult(
			
 
				+            title="❌ dream 不可用",
			
 
				+            output="runner 缺少 trace_store 或 llm_call",
			
 
				+            error="runner dependencies missing",
			
 
				+        )
			
 
				+
			
 
				+    from agent.core.dream import run_dream
			
 
				+    report = await run_dream(
			
 
				+        store=runner.trace_store,
			
 
				+        llm_call=runner.llm_call,
			
 
				+        memory_config=memory_config,
			
 
				+        reflect_model=reflect_model or "gpt-4o-mini",
			
 
				+        dream_model=dream_model or "gpt-4o",
			
 
				+    )
			
 
				+
			
 
				+    lines = []
			
 
				+    lines.append(f"per-trace 反思: {len(report.per_trace_summaries)} 条")
			
 
				+    if report.skipped_traces:
			
 
				+        lines.append(f"跳过: {len(report.skipped_traces)} 条 trace（日志详见 logger）")
			
 
				+    lines.append(f"消化 reflection: {report.consumed_reflection_count} 条")
			
 
				+    lines.append(f"更新记忆文件: {len(report.updated_files)} 个")
			
 
				+    for p in report.updated_files:
			
 
				+        lines.append(f"  - {p}")
			
 
				+    if report.reasoning:
			
 
				+        lines.append(f"\n整合理由: {report.reasoning}")
			
 
				+
			
 
				+    output = "\n".join(lines)
			
 
				+    return ToolResult(
			
 
				+        title="🧠 dream 完成",
			
 
				+        output=output,
			
 
				+        long_term_memory=f"dream: reflected={len(report.per_trace_summaries)}, "
			
 
				+                         f"consumed={report.consumed_reflection_count}, "
			
 
				+                         f"files_updated={len(report.updated_files)}",
			
 
				+        metadata={
			
 
				+            "per_trace_count": len(report.per_trace_summaries),
			
 
				+            "consumed": report.consumed_reflection_count,
			
 
				+            "updated_files": report.updated_files,
			
 
				+        },
			
 
				+    )
			
--- a/agent/trace/extraction_review.py
+++ b/agent/trace/extraction_review.py
@@ -0,0 +1,234 @@
 
				+"""
			
 
				+提取审核工具库（Phase 1.2+）
			
 
				+
			
 
				+共享核心逻辑给三个入口复用：
			
 
				+- agent/cli/extraction_review.py  —— 独立 CLI 入口
			
 
				+- agent/cli/interactive.py        —— 交互式会话菜单
			
 
				+- agent/trace/run_api.py          —— HTTP API 端点
			
 
				+
			
 
				+职责划分：
			
 
				+- 本模块：从 cognition_log 读 pending、生成 review 事件、批量调 knowledge_save 并写 committed 事件
			
 
				+- 上游（runner）：反思侧分支退出时，若 reflect_auto_commit=True 则调 auto_commit_branch
			
 
				+"""
			
 
				+
			
 
				+from __future__ import annotations
			
 
				+
			
 
				+from dataclasses import dataclass, field
			
 
				+from typing import Any, Dict, List, Literal, Optional
			
 
				+
			
 
				+from agent.trace.store import FileSystemTraceStore
			
 
				+
			
 
				+ReviewDecision = Literal["approve", "edit", "discard"]
			
 
				+
			
 
				+
			
 
				+@dataclass
			
 
				+class PendingExtraction:
			
 
				+    """一条待审核的提取条目（从 cognition_log 还原）"""
			
 
				+    extraction_id: str
			
 
				+    sequence: Optional[int]
			
 
				+    goal_id: Optional[str]
			
 
				+    branch_id: Optional[str]
			
 
				+    payload: Dict[str, Any]
			
 
				+    reviewed: bool = False
			
 
				+    decision: Optional[ReviewDecision] = None
			
 
				+    committed: bool = False
			
 
				+
			
 
				+
			
 
				+@dataclass
			
 
				+class CommitReport:
			
 
				+    """批量 commit 的结果"""
			
 
				+    committed: List[str] = field(default_factory=list)     # 成功的 extraction_id 列表
			
 
				+    knowledge_ids: List[str] = field(default_factory=list) # KnowHub 返回的新增 ID
			
 
				+    failed: List[Dict[str, str]] = field(default_factory=list)  # [{extraction_id, error}]
			
 
				+    skipped: List[str] = field(default_factory=list)       # 不是 approved 或已 committed
			
 
				+
			
 
				+
			
 
				+async def list_pending(
			
 
				+    store: FileSystemTraceStore,
			
 
				+    trace_id: str,
			
 
				+    branch_id: Optional[str] = None,
			
 
				+    include_reviewed: bool = False,
			
 
				+) -> List[PendingExtraction]:
			
 
				+    """列出 trace 下的 pending 提取条目。
			
 
				+
			
 
				+    Args:
			
 
				+        branch_id: 若指定，仅返回此反思分支产出的 pending（用于 auto_commit_branch）
			
 
				+        include_reviewed: 是否包含已 reviewed 的条目（默认只返回未 reviewed）
			
 
				+
			
 
				+    Returns:
			
 
				+        按 pending 出现顺序排列的条目列表
			
 
				+    """
			
 
				+    log = await store.get_cognition_log(trace_id)
			
 
				+    events = log.get("events", log.get("entries", []))
			
 
				+
			
 
				+    reviewed_index: Dict[str, ReviewDecision] = {}
			
 
				+    committed_ids: set[str] = set()
			
 
				+    for e in events:
			
 
				+        if e.get("type") == "extraction_reviewed":
			
 
				+            eid = e.get("extraction_id")
			
 
				+            if eid:
			
 
				+                reviewed_index[eid] = e.get("decision")
			
 
				+        elif e.get("type") == "extraction_committed":
			
 
				+            eid = e.get("extraction_id")
			
 
				+            if eid:
			
 
				+                committed_ids.add(eid)
			
 
				+
			
 
				+    pendings: List[PendingExtraction] = []
			
 
				+    for e in events:
			
 
				+        if e.get("type") != "extraction_pending":
			
 
				+            continue
			
 
				+        eid = e.get("extraction_id")
			
 
				+        if not eid:
			
 
				+            continue
			
 
				+        if branch_id is not None and e.get("branch_id") != branch_id:
			
 
				+            continue
			
 
				+        reviewed = eid in reviewed_index
			
 
				+        if reviewed and not include_reviewed:
			
 
				+            continue
			
 
				+        pendings.append(
			
 
				+            PendingExtraction(
			
 
				+                extraction_id=eid,
			
 
				+                sequence=e.get("sequence"),
			
 
				+                goal_id=e.get("goal_id"),
			
 
				+                branch_id=e.get("branch_id"),
			
 
				+                payload=e.get("payload", {}),
			
 
				+                reviewed=reviewed,
			
 
				+                decision=reviewed_index.get(eid),
			
 
				+                committed=eid in committed_ids,
			
 
				+            )
			
 
				+        )
			
 
				+    return pendings
			
 
				+
			
 
				+
			
 
				+async def review_one(
			
 
				+    store: FileSystemTraceStore,
			
 
				+    trace_id: str,
			
 
				+    extraction_id: str,
			
 
				+    decision: ReviewDecision,
			
 
				+    edited_payload: Optional[Dict[str, Any]] = None,
			
 
				+) -> None:
			
 
				+    """对某条 pending 生成 review 事件。
			
 
				+
			
 
				+    - approve: 保留原 payload，标记为可 commit
			
 
				+    - edit:    用 edited_payload 覆盖原 payload（仅本事件内），标记为可 commit
			
 
				+    - discard: 丢弃，不会被 commit
			
 
				+    """
			
 
				+    event: Dict[str, Any] = {
			
 
				+        "type": "extraction_reviewed",
			
 
				+        "extraction_id": extraction_id,
			
 
				+        "decision": decision,
			
 
				+    }
			
 
				+    if decision == "edit" and edited_payload is not None:
			
 
				+        event["edited_payload"] = edited_payload
			
 
				+    await store.append_cognition_event(trace_id=trace_id, event=event)
			
 
				+
			
 
				+
			
 
				+def _resolve_effective_payload(
			
 
				+    pending: PendingExtraction,
			
 
				+    review_events: List[Dict[str, Any]],
			
 
				+) -> Dict[str, Any]:
			
 
				+    """合并原 payload 与最后一次 edit 的 payload。"""
			
 
				+    for e in reversed(review_events):
			
 
				+        if (
			
 
				+            e.get("extraction_id") == pending.extraction_id
			
 
				+            and e.get("decision") == "edit"
			
 
				+            and isinstance(e.get("edited_payload"), dict)
			
 
				+        ):
			
 
				+            return e["edited_payload"]
			
 
				+    return pending.payload
			
 
				+
			
 
				+
			
 
				+async def commit_approved(
			
 
				+    store: FileSystemTraceStore,
			
 
				+    trace_id: str,
			
 
				+    branch_id: Optional[str] = None,
			
 
				+) -> CommitReport:
			
 
				+    """把已 approved/edited 但未 committed 的条目批量调 knowledge_save 上传。
			
 
				+
			
 
				+    Args:
			
 
				+        branch_id: 若指定，只处理此分支的条目（auto_commit_branch 用）
			
 
				+    """
			
 
				+    from agent.tools.builtin.knowledge import knowledge_save
			
 
				+
			
 
				+    log = await store.get_cognition_log(trace_id)
			
 
				+    events = log.get("events", log.get("entries", []))
			
 
				+    review_events = [e for e in events if e.get("type") == "extraction_reviewed"]
			
 
				+
			
 
				+    all_pendings = await list_pending(
			
 
				+        store, trace_id, branch_id=branch_id, include_reviewed=True
			
 
				+    )
			
 
				+
			
 
				+    report = CommitReport()
			
 
				+
			
 
				+    for p in all_pendings:
			
 
				+        if p.committed:
			
 
				+            report.skipped.append(p.extraction_id)
			
 
				+            continue
			
 
				+        if p.decision not in ("approve", "edit"):
			
 
				+            report.skipped.append(p.extraction_id)
			
 
				+            continue
			
 
				+
			
 
				+        payload = _resolve_effective_payload(p, review_events)
			
 
				+
			
 
				+        try:
			
 
				+            result = await knowledge_save(
			
 
				+                task=payload.get("task", ""),
			
 
				+                content=payload.get("content", ""),
			
 
				+                types=payload.get("types", []),
			
 
				+                tags=payload.get("tags"),
			
 
				+                scopes=payload.get("scopes"),
			
 
				+                owner=payload.get("owner"),
			
 
				+                resource_ids=payload.get("resource_ids"),
			
 
				+                source_name=payload.get("source_name", ""),
			
 
				+                source_category=payload.get("source_category", "exp"),
			
 
				+                urls=payload.get("urls"),
			
 
				+                agent_id=payload.get("agent_id", "research_agent"),
			
 
				+                submitted_by=payload.get("submitted_by", ""),
			
 
				+                score=payload.get("score", 3),
			
 
				+                capability_ids=payload.get("capability_ids"),
			
 
				+                tool_ids=payload.get("tool_ids"),
			
 
				+            )
			
 
				+            knowledge_id = (result.metadata or {}).get("knowledge_id", "unknown")
			
 
				+            if result.error:
			
 
				+                raise RuntimeError(result.error)
			
 
				+
			
 
				+            await store.append_cognition_event(
			
 
				+                trace_id=trace_id,
			
 
				+                event={
			
 
				+                    "type": "extraction_committed",
			
 
				+                    "extraction_id": p.extraction_id,
			
 
				+                    "knowledge_id": knowledge_id,
			
 
				+                },
			
 
				+            )
			
 
				+            report.committed.append(p.extraction_id)
			
 
				+            report.knowledge_ids.append(knowledge_id)
			
 
				+
			
 
				+        except Exception as e:
			
 
				+            report.failed.append({
			
 
				+                "extraction_id": p.extraction_id,
			
 
				+                "error": str(e),
			
 
				+            })
			
 
				+
			
 
				+    return report
			
 
				+
			
 
				+
			
 
				+async def auto_commit_branch(
			
 
				+    store: FileSystemTraceStore,
			
 
				+    trace_id: str,
			
 
				+    branch_id: str,
			
 
				+) -> CommitReport:
			
 
				+    """反思侧分支退出时的自动提交（reflect_auto_commit=True 路径）。
			
 
				+
			
 
				+    视同全部 approved：对此分支所有未 reviewed 的 pending 先 auto-approve，
			
 
				+    然后调用 commit_approved。
			
 
				+    """
			
 
				+    pendings = await list_pending(store, trace_id, branch_id=branch_id)
			
 
				+    for p in pendings:
			
 
				+        if not p.reviewed:
			
 
				+            await review_one(
			
 
				+                store=store,
			
 
				+                trace_id=trace_id,
			
 
				+                extraction_id=p.extraction_id,
			
 
				+                decision="approve",
			
 
				+            )
			
 
				+    return await commit_approved(store, trace_id, branch_id=branch_id)
			
--- a/agent/trace/models.py
+++ b/agent/trace/models.py
@@ -79,6 +79,11 @@ class Trace:
 
				     # 当前焦点 goal
			
 
				     current_goal_id: Optional[str] = None
			
 
				 
			
 
				+    # Memory 系统 - 记忆反思的进度追踪（见 agent/docs/memory-plan.md 第四节）
			
 
				+    # dream 操作扫描 reflected_at_sequence < latest_sequence 的 trace 做反思；
			
 
				+    # None 表示该 trace 从未被记忆反思处理过。
			
 
				+    reflected_at_sequence: Optional[int] = None
			
 
				+
			
 
				     # 结果
			
 
				     result_summary: Optional[str] = None     # 执行结果摘要
			
 
				     error_message: Optional[str] = None      # 错误信息
			
@@ -145,6 +150,7 @@ class Trace:
 
				             "llm_params": self.llm_params,
			
 
				             "context": self.context,
			
 
				             "current_goal_id": self.current_goal_id,
			
 
				+            "reflected_at_sequence": self.reflected_at_sequence,
			
 
				             "result_summary": self.result_summary,
			
 
				             "error_message": self.error_message,
			
 
				             "created_at": self.created_at.isoformat() if self.created_at else None,
			
--- a/agent/trace/run_api.py
+++ b/agent/trace/run_api.py
@@ -114,6 +114,49 @@ class CompactResponse(BaseModel):
 
				     message: str = ""
			
 
				 
			
 
				 
			
 
				+# ===== 提取审核（见 agent/docs/memory-plan.md 第三节） =====
			
 
				+
			
 
				+class PendingExtractionModel(BaseModel):
			
 
				+    extraction_id: str
			
 
				+    sequence: Optional[int] = None
			
 
				+    goal_id: Optional[str] = None
			
 
				+    branch_id: Optional[str] = None
			
 
				+    payload: Dict[str, Any]
			
 
				+    reviewed: bool = False
			
 
				+    decision: Optional[str] = None
			
 
				+    committed: bool = False
			
 
				+
			
 
				+
			
 
				+class ListExtractionsResponse(BaseModel):
			
 
				+    trace_id: str
			
 
				+    count: int
			
 
				+    items: List[PendingExtractionModel]
			
 
				+
			
 
				+
			
 
				+class ReviewRequest(BaseModel):
			
 
				+    decision: str = Field(..., description="approve / edit / discard")
			
 
				+    edited_payload: Optional[Dict[str, Any]] = Field(
			
 
				+        None, description="decision=edit 时必填；只对本次 review 生效"
			
 
				+    )
			
 
				+
			
 
				+
			
 
				+class ReviewResponse(BaseModel):
			
 
				+    trace_id: str
			
 
				+    extraction_id: str
			
 
				+    decision: str
			
 
				+
			
 
				+
			
 
				+class CommitResponse(BaseModel):
			
 
				+    trace_id: str
			
 
				+    committed_count: int
			
 
				+    failed_count: int
			
 
				+    skipped_count: int
			
 
				+    committed: List[str]
			
 
				+    knowledge_ids: List[str]
			
 
				+    failed: List[Dict[str, str]]
			
 
				+    skipped: List[str]
			
 
				+
			
 
				+
			
 
				 # ===== 后台执行 =====
			
 
				 
			
 
				 _running_tasks: Dict[str, asyncio.Task] = {}
			
@@ -507,6 +550,90 @@ async def reflect_trace(trace_id: str, req: ReflectRequest):
 
				     )
			
 
				 
			
 
				 
			
 
				+@router.get("/{trace_id}/extractions", response_model=ListExtractionsResponse)
			
 
				+async def list_extractions(trace_id: str, include_reviewed: bool = False):
			
 
				+    """列出 trace 的待审核提取条目。"""
			
 
				+    runner = _get_runner()
			
 
				+    if not runner.trace_store:
			
 
				+        raise HTTPException(status_code=503, detail="TraceStore not configured")
			
 
				+
			
 
				+    from agent.trace.extraction_review import list_pending
			
 
				+    pendings = await list_pending(
			
 
				+        runner.trace_store, trace_id, include_reviewed=include_reviewed
			
 
				+    )
			
 
				+    return ListExtractionsResponse(
			
 
				+        trace_id=trace_id,
			
 
				+        count=len(pendings),
			
 
				+        items=[
			
 
				+            PendingExtractionModel(
			
 
				+                extraction_id=p.extraction_id,
			
 
				+                sequence=p.sequence,
			
 
				+                goal_id=p.goal_id,
			
 
				+                branch_id=p.branch_id,
			
 
				+                payload=p.payload,
			
 
				+                reviewed=p.reviewed,
			
 
				+                decision=p.decision,
			
 
				+                committed=p.committed,
			
 
				+            )
			
 
				+            for p in pendings
			
 
				+        ],
			
 
				+    )
			
 
				+
			
 
				+
			
 
				+@router.post(
			
 
				+    "/{trace_id}/extractions/{extraction_id}/review",
			
 
				+    response_model=ReviewResponse,
			
 
				+)
			
 
				+async def review_extraction(trace_id: str, extraction_id: str, req: ReviewRequest):
			
 
				+    """对单条 pending 提交 review 决策（approve/edit/discard）。"""
			
 
				+    runner = _get_runner()
			
 
				+    if not runner.trace_store:
			
 
				+        raise HTTPException(status_code=503, detail="TraceStore not configured")
			
 
				+
			
 
				+    if req.decision not in ("approve", "edit", "discard"):
			
 
				+        raise HTTPException(
			
 
				+            status_code=400,
			
 
				+            detail=f"decision must be approve/edit/discard, got {req.decision}",
			
 
				+        )
			
 
				+    if req.decision == "edit" and not req.edited_payload:
			
 
				+        raise HTTPException(
			
 
				+            status_code=400, detail="decision=edit 必须提供 edited_payload"
			
 
				+        )
			
 
				+
			
 
				+    from agent.trace.extraction_review import review_one
			
 
				+    await review_one(
			
 
				+        runner.trace_store,
			
 
				+        trace_id,
			
 
				+        extraction_id,
			
 
				+        req.decision,  # type: ignore[arg-type]
			
 
				+        edited_payload=req.edited_payload,
			
 
				+    )
			
 
				+    return ReviewResponse(
			
 
				+        trace_id=trace_id, extraction_id=extraction_id, decision=req.decision
			
 
				+    )
			
 
				+
			
 
				+
			
 
				+@router.post("/{trace_id}/extractions/commit", response_model=CommitResponse)
			
 
				+async def commit_extractions(trace_id: str):
			
 
				+    """批量把已 approved/edited 的条目上传到 KnowHub。"""
			
 
				+    runner = _get_runner()
			
 
				+    if not runner.trace_store:
			
 
				+        raise HTTPException(status_code=503, detail="TraceStore not configured")
			
 
				+
			
 
				+    from agent.trace.extraction_review import commit_approved
			
 
				+    report = await commit_approved(runner.trace_store, trace_id)
			
 
				+    return CommitResponse(
			
 
				+        trace_id=trace_id,
			
 
				+        committed_count=len(report.committed),
			
 
				+        failed_count=len(report.failed),
			
 
				+        skipped_count=len(report.skipped),
			
 
				+        committed=report.committed,
			
 
				+        knowledge_ids=report.knowledge_ids,
			
 
				+        failed=report.failed,
			
 
				+        skipped=report.skipped,
			
 
				+    )
			
 
				+
			
 
				+
			
 
				 @router.post("/{trace_id}/compact", response_model=CompactResponse)
			
 
				 async def compact_trace(trace_id: str):
			
 
				     """
			
--- a/agent/trace/store.py
+++ b/agent/trace/store.py
@@ -805,7 +805,37 @@ class FileSystemTraceStore:
 
				         trace_id: str,
			
 
				         event: Dict[str, Any],
			
 
				     ) -> None:
			
 
				-        """追加认知事件（query/evaluation/extraction/reflection）"""
			
 
				+        """追加认知事件到 cognition_log.json。
			
 
				+
			
 
				+        所有事件共有字段：
			
 
				+            type: str         事件类型（见下表）
			
 
				+            timestamp: str    ISO 格式时间戳（框架自动写入）
			
 
				+
			
 
				+        已定义的事件类型及典型字段：
			
 
				+
			
 
				+            type="query" — 知识注入查询（goal focus 时触发）
			
 
				+                sequence, goal_id, query, response, source_ids, sources
			
 
				+
			
 
				+            type="evaluation" — 知识评估（Goal 完成/压缩前/任务结束触发）
			
 
				+                knowledge_id, eval_result{relevance, utility, notes}, trigger_event
			
 
				+
			
 
				+            type="extraction_pending" — 反思侧分支暂存的待审核提取（Phase 1.2+）
			
 
				+                extraction_id, sequence, goal_id, branch_id, payload
			
 
				+                (payload 字段与 knowledge_save 参数一一对应)
			
 
				+
			
 
				+            type="extraction_reviewed" — 人工审核决策（CLI / HTTP API 写入）
			
 
				+                extraction_id, decision("approve"/"edit"/"discard"), edited_payload?
			
 
				+
			
 
				+            type="extraction_committed" — 已上传到 KnowHub
			
 
				+                extraction_id, knowledge_id
			
 
				+
			
 
				+            type="reflection" — Dream 的 per-trace 反思摘要（Phase 2.4 / 3.1）
			
 
				+                sequence_range: [start, end]    本次反思覆盖的消息区间
			
 
				+                summary: str                    LLM 生成的反思摘要
			
 
				+                consumed_at: 可选, ISO 时间戳   当跨 trace 整合已消化此反思时写入
			
 
				+
			
 
				+        其他字段可按需附加，不做强校验（演进友好）。
			
 
				+        """
			
 
				         log = await self.get_cognition_log(trace_id)
			
 
				         if "events" not in log:
			
 
				             log["events"] = log.pop("entries", [])