hai 1 mes · fb9aed12bb
--- a/agent/core/runner.py
+++ b/agent/core/runner.py
@@ -67,8 +67,8 @@ class ContextUsage:
 
															 @dataclass
														
 
															 class SideBranchContext:
														
 
															-    """侧分支上下文（压缩/反思）"""
														
 
															-    type: Literal["compression", "reflection"]
														
 
															+    """侧分支上下文（压缩/反思/知识评估）"""
														
 
															+    type: Literal["compression", "reflection", "knowledge_eval"]
														
 
															     branch_id: str
														
 
															     start_head_seq: int          # 侧分支起点的 head_seq
														
 
															     start_sequence: int          # 侧分支第一条消息的 sequence
														
@@ -783,6 +783,28 @@ class AgentRunner:
 
															         if not needs_compression:
														
 
															             return history, head_seq, sequence, False
														
 
															+        # 检查是否有待评估知识（压缩前必须先评估）
														
 
															+        if self.trace_store and not config.force_side_branch:
														
 
															+            pending = await self.trace_store.get_pending_knowledge_entries(trace_id)
														
 
															+            if pending:
														
 
															+                # 设置侧分支队列：反思 → 知识评估 → 压缩
														
 
															+                # 反思放在前面，确保反思期间完成的 goal 产生的新知识也能在压缩前被评估
														
 
															+                if config.knowledge.enable_extraction:
														
 
															+                    config.force_side_branch = ["reflection", "knowledge_eval", "compression"]
														
 
															+                else:
														
 
															+                    config.force_side_branch = ["knowledge_eval", "compression"]
														
 
															+
														
 
															+                # 在 trace.context 中设置触发事件
														
 
															+                trace = await self.trace_store.get_trace(trace_id)
														
 
															+                if trace:
														
 
															+                    if not trace.context:
														
 
															+                        trace.context = {}
														
 
															+                    trace.context["knowledge_eval_trigger"] = "compression"
														
 
															+                    await self.trace_store.update_trace(trace_id, context=trace.context)
														
 
															+
														
 
															+                logger.info(f"[Knowledge Eval] 压缩前触发知识评估，待评估: {len(pending)} 条")
														
 
															+                return history, head_seq, sequence, True
														
 
															+
														
 
															         # 知识提取：在任何压缩发生前，用完整 history 做反思（进入反思侧分支）
														
 
															         if config.knowledge.enable_extraction and not config.force_side_branch:
														
 
															             # 设置侧分支队列：先反思，再压缩
														
@@ -846,6 +868,74 @@ class AgentRunner:
 
															         return history, head_seq, sequence, False
														
 
															+    async def _build_knowledge_eval_prompt(
														
 
															+        self,
														
 
															+        trace_id: str,
														
 
															+        goal_tree: Optional[GoalTree]
														
 
															+    ) -> str:
														
 
															+        """构建知识评估 prompt"""
														
 
															+        if not self.trace_store:
														
 
															+            return ""
														
 
															+
														
 
															+        pending = await self.trace_store.get_pending_knowledge_entries(trace_id)
														
 
															+        if not pending:
														
 
															+            return ""
														
 
															+
														
 
															+        # 获取mission
														
 
															+        trace = await self.trace_store.get_trace(trace_id)
														
 
															+        mission = trace.task if trace else "未知任务"
														
 
															+
														
 
															+        # 获取当前Goal
														
 
															+        current_goal = goal_tree.find(goal_tree.current_id) if goal_tree and goal_tree.current_id else None
														
 
															+        goal_desc = current_goal.description if current_goal else "无当前目标"
														
 
															+
														
 
															+        # 构建知识列表
														
 
															+        knowledge_list = []
														
 
															+        for idx, entry in enumerate(pending, 1):
														
 
															+            knowledge_list.append(
														
 
															+                f"### 知识 {idx}: {entry['knowledge_id']}\n"
														
 
															+                f"- task: {entry['task']}\n"
														
 
															+                f"- content: {entry['content']}\n"
														
 
															+                f"- 注入于: sequence {entry['injected_at_sequence']}, goal {entry['goal_id']}"
														
 
															+            )
														
 
															+
														
 
															+        prompt = f"""你是知识评估助手。请评估以下知识在本次任务执行中的实际效果。
														
 
															+
														
 
															+## 当前任务（Mission）
														
 
															+{mission}
														
 
															+
														
 
															+## 当前 Goal
														
 
															+{goal_desc}
														
 
															+
														
 
															+## 待评估知识列表
														
 
															+{chr(10).join(knowledge_list)}
														
 
															+
														
 
															+## 评估维度
														
 
															+1. **helpfulness**: 知识内容是否对完成任务有实质帮助？
														
 
															+2. **relevance**: 执行过程中是否体现了该知识的内容？
														
 
															+
														
 
															+## 评估分类
														
 
															+- irrelevant: task与当前任务无关
														
 
															+- unused: 相关但未使用
														
 
															+- helpful: 有帮助
														
 
															+- harmful: 有负面作用
														
 
															+- neutral: 无明显作用
														
 
															+
														
 
															+## 输出格式
														
 
															+请直接输出评估结果，使用JSON格式：
														
 
															+
														
 
															+{{
														
 
															+  "evaluations": [
														
 
															+    {{
														
 
															+      "knowledge_id": "knowledge-xxx",
														
 
															+      "eval_status": "helpful",
														
 
															+      "reason": "1-2句评估理由"
														
 
															+    }}
														
 
															+  ]
														
 
															+}}
														
 
															+"""
														
 
															+        return prompt
														
 
															+
														
 
															     async def _single_turn_compress(
														
 
															         self,
														
 
															         trace_id: str,
														
@@ -1052,6 +1142,17 @@ class AgentRunner:
 
															                         yield trace_obj
														
 
															                 return
														
 
															+            # 检查Goal完成触发的知识评估
														
 
															+            if not side_branch_ctx and self.trace_store:
														
 
															+                trace = await self.trace_store.get_trace(trace_id)
														
 
															+                if trace and trace.context and trace.context.get("pending_knowledge_eval"):
														
 
															+                    # 清除标志
														
 
															+                    trace.context.pop("pending_knowledge_eval", None)
														
 
															+                    await self.trace_store.update_trace(trace_id, context=trace.context)
														
 
															+                    # 设置侧分支队列
														
 
															+                    config.force_side_branch = ["knowledge_eval"]
														
 
															+                    logger.info("[Knowledge Eval] 检测到Goal完成触发，进入知识评估侧分支")
														
 
															+
														
 
															             # Context 管理（仅主路径）
														
 
															             needs_enter_side_branch = False
														
 
															             if not side_branch_ctx:
														
@@ -1071,9 +1172,15 @@ class AgentRunner:
 
															             # 进入侧分支
														
 
															             if needs_enter_side_branch and not side_branch_ctx:
														
 
															+                # 刷新 trace，获取 _manage_context_usage 可能写入 DB 的 knowledge_eval_trigger
														
 
															+                if self.trace_store:
														
 
															+                    fresh = await self.trace_store.get_trace(trace_id)
														
 
															+                    if fresh:
														
 
															+                        trace = fresh
														
 
															                 # 从队列中取出第一个侧分支类型
														
 
															+                branch_type: Literal["compression", "reflection", "knowledge_eval"]
														
 
															                 if config.force_side_branch and isinstance(config.force_side_branch, list) and len(config.force_side_branch) > 0:
														
 
															-                    branch_type = config.force_side_branch.pop(0)
														
 
															+                    branch_type = config.force_side_branch.pop(0)  # type: ignore
														
 
															                     logger.info(f"从队列取出侧分支: {branch_type}, 剩余队列: {config.force_side_branch}")
														
 
															                 elif config.knowledge.enable_extraction:
														
 
															                     # 兼容旧的单值模式（如果 force_side_branch 是字符串）
														
@@ -1096,6 +1203,9 @@ class AgentRunner:
 
															                 # 持久化侧分支状态
														
 
															                 if self.trace_store:
														
 
															+                    # 获取触发事件（如果是 knowledge_eval 分支）
														
 
															+                    trigger_event = trace.context.get("knowledge_eval_trigger", "unknown") if branch_type == "knowledge_eval" else None
														
 
															+
														
 
															                     trace.context["active_side_branch"] = {
														
 
															                         "type": side_branch_ctx.type,
														
 
															                         "branch_id": side_branch_ctx.branch_id,
														
@@ -1105,6 +1215,13 @@ class AgentRunner:
 
															                         "max_turns": side_branch_ctx.max_turns,
														
 
															                         "started_at": datetime.now().isoformat(),
														
 
															                     }
														
 
															+
														
 
															+                    # 如果是 knowledge_eval 分支，添加 trigger_event
														
 
															+                    if trigger_event:
														
 
															+                        trace.context["active_side_branch"]["trigger_event"] = trigger_event
														
 
															+                        # 清除触发事件标记
														
 
															+                        trace.context.pop("knowledge_eval_trigger", None)
														
 
															+
														
 
															                     await self.trace_store.update_trace(
														
 
															                         trace_id,
														
 
															                         context=trace.context
														
@@ -1113,6 +1230,8 @@ class AgentRunner:
 
															                 # 追加侧分支 prompt
														
 
															                 if branch_type == "reflection":
														
 
															                     prompt = config.knowledge.get_reflect_prompt()
														
 
															+                elif branch_type == "knowledge_eval":
														
 
															+                    prompt = await self._build_knowledge_eval_prompt(trace_id, goal_tree)
														
 
															                 else:  # compression
														
 
															                     from agent.trace.compaction import build_compression_prompt
														
 
															                     prompt = build_compression_prompt(goal_tree)
														
@@ -1249,6 +1368,48 @@ class AgentRunner:
 
															                     cache_read_tokens=cache_read_tokens or 0,
														
 
															                 )
														
 
															+            # 知识评估侧分支：即时检测并写入评估结果
														
 
															+            if side_branch_ctx and side_branch_ctx.type == "knowledge_eval":
														
 
															+                text = response_content if isinstance(response_content, str) else ""
														
 
															+                eval_results = None
														
 
															+
														
 
															+                try:
														
 
															+                    eval_results = json.loads(text.strip())
														
 
															+                    if "evaluations" not in eval_results:
														
 
															+                        eval_results = None
														
 
															+                except json.JSONDecodeError:
														
 
															+                    import re
														
 
															+                    json_match = re.search(r'```json\s*(\{.*?\})\s*```', text, re.DOTALL)
														
 
															+                    if json_match:
														
 
															+                        try:
														
 
															+                            eval_results = json.loads(json_match.group(1))
														
 
															+                        except json.JSONDecodeError:
														
 
															+                            pass
														
 
															+
														
 
															+                    if not eval_results:
														
 
															+                        json_match = re.search(r'\{[^{]*"evaluations"[^}]*\[[^\]]*\][^}]*\}', text, re.DOTALL)
														
 
															+                        if json_match:
														
 
															+                            try:
														
 
															+                                eval_results = json.loads(json_match.group(0))
														
 
															+                            except json.JSONDecodeError:
														
 
															+                                pass
														
 
															+
														
 
															+                if eval_results and self.trace_store:
														
 
															+                    current_trace = await self.trace_store.get_trace(trace_id)
														
 
															+                    trigger_event = current_trace.context.get("active_side_branch", {}).get("trigger_event", "unknown")
														
 
															+
														
 
															+                    for eval_item in eval_results.get("evaluations", []):
														
 
															+                        await self.trace_store.update_knowledge_evaluation(
														
 
															+                            trace_id=trace_id,
														
 
															+                            knowledge_id=eval_item["knowledge_id"],
														
 
															+                            eval_result={
														
 
															+                                "eval_status": eval_item["eval_status"],
														
 
															+                                "reason": eval_item.get("reason", "")
														
 
															+                            },
														
 
															+                            trigger_event=trigger_event
														
 
															+                        )
														
 
															+                    logger.info(f"[Knowledge Eval] 已写入 {len(eval_results.get('evaluations', []))} 条评估结果")
														
 
															+
														
 
															             # 如果在侧分支，记录到 assistant_msg（已持久化，不需要额外维护）
														
 
															             yield assistant_msg
														
@@ -1386,6 +1547,30 @@ class AgentRunner:
 
															                     side_branch_ctx = None
														
 
															                     continue
														
 
															+                elif should_exit and side_branch_ctx.type == "knowledge_eval":
														
 
															+                    # === 知识评估侧分支退出 ===
														
 
															+                    logger.info("知识评估侧分支退出")
														
 
															+
														
 
															+                    # 恢复主路径
														
 
															+                    if self.trace_store:
														
 
															+                        main_path_messages = await self.trace_store.get_main_path_messages(
														
 
															+                            trace_id, side_branch_ctx.start_head_seq
														
 
															+                        )
														
 
															+                        history = [m.to_llm_dict() for m in main_path_messages]
														
 
															+                        head_seq = side_branch_ctx.start_head_seq
														
 
															+
														
 
															+                    # 清理
														
 
															+                    trace.context.pop("active_side_branch", None)
														
 
															+                    if not config.force_side_branch or len(config.force_side_branch) == 0:
														
 
															+                        config.force_side_branch = None
														
 
															+                        logger.info("知识评估完成，队列为空")
														
 
															+                    if self.trace_store:
														
 
															+                        await self.trace_store.update_trace(
														
 
															+                            trace_id, context=trace.context, head_sequence=head_seq,
														
 
															+                        )
														
 
															+                    side_branch_ctx = None
														
 
															+                    continue
														
 
															+
														
 
															             # 处理工具调用
														
 
															             # 截断兜底：finish_reason == "length" 说明响应被 max_tokens 截断，
														
 
															             # tool call 参数很可能不完整，不应执行，改为提示模型分批操作
														
@@ -1451,6 +1636,13 @@ class AgentRunner:
 
															                     args_display = args_str[:100] + "..." if len(args_str) > 100 else args_str
														
 
															                     logger.info(f"[Tool Call] {tool_name}({args_display})")
														
 
															+                    # 获取trigger_event（如果在knowledge_eval侧分支中）
														
 
															+                    trigger_event_for_tool = None
														
 
															+                    if side_branch_ctx and side_branch_ctx.type == "knowledge_eval" and self.trace_store:
														
 
															+                        current_trace = await self.trace_store.get_trace(trace_id)
														
 
															+                        if current_trace:
														
 
															+                            trigger_event_for_tool = current_trace.context.get("active_side_branch", {}).get("trigger_event", "unknown")
														
 
															+
														
 
															                     tool_result = await self.tools.execute(
														
 
															                         tool_name,
														
 
															                         tool_args,
														
@@ -1462,12 +1654,14 @@ class AgentRunner:
 
															                             "runner": self,
														
 
															                             "goal_tree": goal_tree,
														
 
															                             "knowledge_config": config.knowledge,
														
 
															+                            "sequence": sequence,  # 添加sequence用于知识注入记录
														
 
															                             # 新增：侧分支信息
														
 
															                             "side_branch": {
														
 
															                                 "type": side_branch_ctx.type,
														
 
															                                 "branch_id": side_branch_ctx.branch_id,
														
 
															                                 "is_side_branch": True,
														
 
															                                 "max_turns": side_branch_ctx.max_turns,
														
 
															+                                "trigger_event": trigger_event_for_tool,
														
 
															                             } if side_branch_ctx else None,
														
 
															                         },
														
 
															                     )
														
@@ -1609,7 +1803,20 @@ class AgentRunner:
 
															             # 无工具调用
														
 
															             # 如果在侧分支中，已经在上面处理过了（不会走到这里）
														
 
															-            # 主路径无工具调用 → 任务完成，检查是否需要完成后反思
														
 
															+            # 主路径无工具调用 → 任务完成，检查是否需要完成后反思或知识评估
														
 
															+
														
 
															+            # 检查是否有待评估的知识
														
 
															+            if not side_branch_ctx and self.trace_store:
														
 
															+                pending = await self.trace_store.get_pending_knowledge_entries(trace_id)
														
 
															+                if pending:
														
 
															+                    logger.info(f"任务即将结束，但仍有 {len(pending)} 条知识未评估，强制触发评估")
														
 
															+                    config.force_side_branch = ["knowledge_eval"]
														
 
															+                    trace = await self.trace_store.get_trace(trace_id)
														
 
															+                    if trace:
														
 
															+                        trace.context["knowledge_eval_trigger"] = "task_completion"
														
 
															+                        await self.trace_store.update_trace(trace_id, context=trace.context)
														
 
															+                    continue
														
 
															+
														
 
															             if not side_branch_ctx and config.knowledge.enable_completion_extraction and not break_after_side_branch:
														
 
															                 config.force_side_branch = ["reflection"]
														
 
															                 break_after_side_branch = True
														
--- a/agent/trace/goal_tool.py
+++ b/agent/trace/goal_tool.py
@@ -24,6 +24,7 @@ async def inject_knowledge_for_goal(
 
															     store: Optional["TraceStore"] = None,
														
 
															     trace_id: Optional[str] = None,
														
 
															     knowledge_config: Optional[dict] = None,
														
 
															+    sequence: Optional[int] = None,
														
 
															 ) -> Optional[str]:
														
 
															     """
														
 
															     为指定 goal 注入相关知识。
														
@@ -34,6 +35,7 @@ async def inject_knowledge_for_goal(
 
															         store: TraceStore（用于持久化）
														
 
															         trace_id: Trace ID
														
 
															         knowledge_config: 知识管理配置（KnowledgeConfig 对象）
														
 
															+        sequence: 当前消息序列号（用于记录注入时机）
														
 
															     Returns:
														
 
															         注入结果描述（如 "📚 已注入 3 条相关知识"），无结果返回 None
														
@@ -74,6 +76,19 @@ async def inject_knowledge_for_goal(
 
															             if store and trace_id:
														
 
															                 await store.update_goal_tree(trace_id, tree)
														
 
															+                # 写入 knowledge_log
														
 
															+                if sequence is not None:
														
 
															+                    for item in goal.knowledge:
														
 
															+                        await store.append_knowledge_entry(
														
 
															+                            trace_id=trace_id,
														
 
															+                            knowledge_id=item.get("id", ""),
														
 
															+                            goal_id=goal.id,
														
 
															+                            injected_at_sequence=sequence,
														
 
															+                            task=item.get("task", ""),
														
 
															+                            content=item.get("content", "")
														
 
															+                        )
														
 
															+                    logger.info(f"[Knowledge Inject] 已记录 {knowledge_count} 条知识到 knowledge_log")
														
 
															+
														
 
															             return f"📚 已注入 {knowledge_count} 条相关知识"
														
 
															         else:
														
 
															             goal.knowledge = []
														
@@ -136,7 +151,8 @@ async def goal(
 
															         done=done,
														
 
															         abandon=abandon,
														
 
															         focus=focus,
														
 
															-        knowledge_config=knowledge_config
														
 
															+        knowledge_config=knowledge_config,
														
 
															+        context=context
														
 
															     )
														
@@ -155,6 +171,7 @@ async def goal_tool(
 
															     abandon: Optional[str] = None,
														
 
															     focus: Optional[str] = None,
														
 
															     knowledge_config: Optional[object] = None,
														
 
															+    context: Optional[dict] = None,
														
 
															 ) -> str:
														
 
															     """
														
 
															     管理执行计划。
														
@@ -213,7 +230,9 @@ async def goal_tool(
 
															         changes.append(f"切换焦点: {display_id}. {goal.description}")
														
 
															         # 自动注入知识
														
 
															-        inject_msg = await inject_knowledge_for_goal(goal, tree, store, trace_id, knowledge_config)
														
 
															+        inject_msg = await inject_knowledge_for_goal(
														
 
															+            goal, tree, store, trace_id, knowledge_config, sequence=context.get("sequence")
														
 
															+        )
														
 
															         if inject_msg:
														
 
															             changes.append(inject_msg)
														
--- a/agent/trace/models.py
+++ b/agent/trace/models.py
@@ -178,7 +178,7 @@ class Message:
 
															     content: Any = None                  # 消息内容（和 LLM API 格式一致）
														
 
															     # 侧分支标记
														
 
															-    branch_type: Optional[Literal["compression", "reflection"]] = None  # 侧分支类型（None = 主路径）
														
 
															+    branch_type: Optional[Literal["compression", "reflection", "knowledge_eval"]] = None  # 侧分支类型（None = 主路径）
														
 
															     branch_id: Optional[str] = None      # 侧分支 ID（同一侧分支的消息共享）
														
 
															     # 元数据
														
@@ -316,7 +316,7 @@ class Message:
 
															         content: Any = None,
														
 
															         tool_call_id: Optional[str] = None,
														
 
															         parent_sequence: Optional[int] = None,
														
 
															-        branch_type: Optional[Literal["compression", "reflection"]] = None,
														
 
															+        branch_type: Optional[Literal["compression", "reflection", "knowledge_eval"]] = None,
														
 
															         branch_id: Optional[str] = None,
														
 
															         prompt_tokens: Optional[int] = None,
														
 
															         completion_tokens: Optional[int] = None,
														
--- a/agent/trace/store.py
+++ b/agent/trace/store.py
@@ -249,6 +249,20 @@ class FileSystemTraceStore:
 
															         })
														
 
															         print(f"[DEBUG] Pushed goal_updated event: goal_id={goal_id}, updates={updates}, affected={len(affected_goals)}")
														
 
															+        # Goal 完成时触发知识评估
														
 
															+        if updates.get("status") in ["completed", "abandoned"]:
														
 
															+            pending = await self.get_pending_knowledge_entries(trace_id)
														
 
															+            if pending:
														
 
															+                # 在trace.context中设置标志，由runner主循环检查
														
 
															+                trace = await self.get_trace(trace_id)
														
 
															+                if trace:
														
 
															+                    if not trace.context:
														
 
															+                        trace.context = {}
														
 
															+                    trace.context["pending_knowledge_eval"] = True
														
 
															+                    trace.context["knowledge_eval_trigger"] = "goal_completion"
														
 
															+                    await self.update_trace(trace_id, context=trace.context)
														
 
															+                    logger.info(f"[Knowledge Eval] Goal {goal_id} 完成，设置评估标志，待评估知识: {len(pending)} 条")
														
 
															+
														
 
															     async def _check_cascade_completion(
														
 
															         self,
														
 
															         trace_id: str,
														
@@ -750,3 +764,78 @@ class FileSystemTraceStore:
 
															             f.write(json.dumps(event, ensure_ascii=False) + '\n')
														
 
															         return event_id
														
 
															+
														
 
															+    # ===== Knowledge Log 管理 =====
														
 
															+
														
 
															+    def _get_knowledge_log_file(self, trace_id: str) -> Path:
														
 
															+        """获取 knowledge_log.json 文件路径"""
														
 
															+        return self._get_trace_dir(trace_id) / "knowledge_log.json"
														
 
															+
														
 
															+    async def get_knowledge_log(self, trace_id: str) -> Dict[str, Any]:
														
 
															+        """读取知识日志"""
														
 
															+        log_file = self._get_knowledge_log_file(trace_id)
														
 
															+        if not log_file.exists():
														
 
															+            return {"trace_id": trace_id, "entries": []}
														
 
															+        return json.loads(log_file.read_text(encoding="utf-8"))
														
 
															+
														
 
															+    async def append_knowledge_entry(
														
 
															+        self,
														
 
															+        trace_id: str,
														
 
															+        knowledge_id: str,
														
 
															+        goal_id: str,
														
 
															+        injected_at_sequence: int,
														
 
															+        task: str,
														
 
															+        content: str
														
 
															+    ) -> None:
														
 
															+        """追加知识注入记录"""
														
 
															+        log = await self.get_knowledge_log(trace_id)
														
 
															+        log["entries"].append({
														
 
															+            "knowledge_id": knowledge_id,
														
 
															+            "goal_id": goal_id,
														
 
															+            "injected_at_sequence": injected_at_sequence,
														
 
															+            "injected_at": datetime.now().isoformat(),
														
 
															+            "task": task,
														
 
															+            "content": content[:500],  # 限制长度
														
 
															+            "eval_result": None,
														
 
															+            "evaluated_at": None,
														
 
															+            "evaluated_at_trigger": None
														
 
															+        })
														
 
															+        log_file = self._get_knowledge_log_file(trace_id)
														
 
															+        log_file.write_text(json.dumps(log, indent=2, ensure_ascii=False), encoding="utf-8")
														
 
															+
														
 
															+    async def update_knowledge_evaluation(
														
 
															+        self,
														
 
															+        trace_id: str,
														
 
															+        knowledge_id: str,
														
 
															+        eval_result: Dict[str, Any],
														
 
															+        trigger_event: str
														
 
															+    ) -> None:
														
 
															+        """更新知识评估结果
														
 
															+
														
 
															+        当同一个knowledge_id在不同goal中被多次注入时，
														
 
															+        优先更新最近一个未评估的条目（按injected_at_sequence倒序）
														
 
															+        """
														
 
															+        log = await self.get_knowledge_log(trace_id)
														
 
															+
														
 
															+        # 找到所有匹配且未评估的条目
														
 
															+        matching_entries = [
														
 
															+            (i, entry) for i, entry in enumerate(log["entries"])
														
 
															+            if entry["knowledge_id"] == knowledge_id and entry["eval_result"] is None
														
 
															+        ]
														
 
															+
														
 
															+        if matching_entries:
														
 
															+            # 按injected_at_sequence倒序排序，取最近的一个
														
 
															+            matching_entries.sort(key=lambda x: x[1]["injected_at_sequence"], reverse=True)
														
 
															+            idx, entry = matching_entries[0]
														
 
															+
														
 
															+            entry["eval_result"] = eval_result
														
 
															+            entry["evaluated_at"] = datetime.now().isoformat()
														
 
															+            entry["evaluated_at_trigger"] = trigger_event
														
 
															+
														
 
															+        log_file = self._get_knowledge_log_file(trace_id)
														
 
															+        log_file.write_text(json.dumps(log, indent=2, ensure_ascii=False), encoding="utf-8")
														
 
															+
														
 
															+    async def get_pending_knowledge_entries(self, trace_id: str) -> List[Dict[str, Any]]:
														
 
															+        """获取所有待评估的知识条目"""
														
 
															+        log = await self.get_knowledge_log(trace_id)
														
 
															+        return [e for e in log["entries"] if e["eval_result"] is None]
														
--- a/knowhub/docs/dedup-design.md
+++ b/knowhub/docs/dedup-design.md
@@ -0,0 +1,392 @@
 
															+# 知识入库前智能去重与关系判断系统 — 设计文档
														
 
															+
														
 
															+## 文档维护规范
														
 
															+
														
 
															+0. **先改文档，再动代码** - 新功能或重大修改需先完成文档更新、并完成审阅后，再进行代码实现；除非改动较小、不被文档涵盖
														
 
															+1. **文档分层，链接代码** - 重要或复杂设计可以另有详细文档；关键实现需标注代码文件路径；格式：`module/file.py:function_name`
														
 
															+2. **简洁快照，日志分离** - 只记录最重要的、与代码准确对应的或者明确的已完成的设计的信息，避免推测、建议、决策历史、修改日志、大量代码；决策依据或修改日志若有必要，可在 `knowhub/docs/decisions.md` 另行记录
														
 
															+
														
 
															+---
														
 
															+
														
 
															+## 可行性结论
														
 
															+
														
 
															+**整体可行，无阻塞性问题。**
														
 
															+
														
 
															+---
														
 
															+
														
 
															+## 一、去重流程
														
 
															+
														
 
															+```
														
 
															+新知识进入 (status=pending)
														
 
															+         │
														
 
															+         ▼
														
 
															+[Step 1] 复用已存储的 embedding（入队时已生成，不重复调用）
														
 
															+         │
														
 
															+         ▼
														
 
															+[Step 2] 向量召回 top-10 相似知识
														
 
															+         filter: status == "approved" or status == "checked"
														
 
															+         │
														
 
															+         ▼
														
 
															+[Step 2.5] 相似度预过滤（阈值 0.75）
														
 
															+         过滤掉 COSINE score < 0.75 的候选
														
 
															+         无候选 → 直接 approved
														
 
															+         │
														
 
															+         ▼
														
 
															+[Step 3] LLM 关系判断（见第五节 Prompt）
														
 
															+         LLM 自主判断关系类型和 final_decision
														
 
															+         │
														
 
															+    ┌────┴──────────────────────────────────┐
														
 
															+    ▼                                       ▼
														
 
															+final_decision=rejected              final_decision=approved
														
 
															+旧知识 helpful+1（记录到 history）    双向写入 relationships
														
 
															+                                     更新关系缓存表
														
 
															+```
														
 
															+
														
 
															+---
														
 
															+
														
 
															+## 二、同 task 下多条知识的处理策略
														
 
															+
														
 
															+只拒绝 `duplicate` 和 `subset`，其他关系两条都保留，并**双向写入**关系标注。引入**关系缓存表**管理关系复杂度。
														
 
															+
														
 
															+---
														
 
															+
														
 
															+## 三、关系类型定义与保存方式
														
 
															+
														
 
															+### 关系类型
														
 
															+
														
 
															+关系类型是**开放的**，LLM 可以根据实际情况提出新的关系类型，并自行判断对应的处理动作（approved/rejected）。
														
 
															+
														
 
															+| type | 含义                                       | 处理动作 |
														
 
															+|---|------------------------------------------|---|
														
 
															+| `duplicate` | task 和 content 语义完全相同                    | 新知识 **rejected**，旧知识 helpful+1 |
														
 
															+| `subset` | task语义一致，新知识信息被旧知识完全覆盖                   | 新知识 **rejected** |
														
 
															+| `superset` | task语义一致，新知识比旧知识更全面                      | 两条都 **approved** |
														
 
															+| `conflict` | 同一 task 下结论矛盾                            | 两条都 **approved** |
														
 
															+| `complement` | 同一 task 的不同角度，互补                         | 两条都 **approved** |
														
 
															+| `none` | task 语义不同，或无实质关系（**task 不同时必须判定为 none**） | 新知识直接 **approved**，不写入关系 |
														
 
															+| *(LLM 自定义)* | LLM 发现的其他关系类型                            | 由 LLM 自行判断 |
														
 
															+
														
 
															+### 关系的方向性与双向标注
														
 
															+
														
 
															+所有关系都是**有向的**，且**双向写入**：两条知识的 `relationships` 字段都会记录对方，但各自记录的是**从自己出发的出边**。
														
 
															+
														
 
															+以 A superset B 为例：
														
 
															+- A 的 relationships 追加：`{type: "superset", target: "B"}` （A 包含 B）
														
 
															+- B 的 relationships 追加：`{type: "subset", target: "A"}` （B 被 A 包含）
														
 
															+
														
 
															+以 A conflict B 为例：
														
 
															+- A 的 relationships 追加：`{type: "conflict", target: "B"}`
														
 
															+- B 的 relationships 追加：`{type: "conflict", target: "A"}`
														
 
															+
														
 
															+### 写入规则
														
 
															+
														
 
															+- `final_decision = "rejected"`：新知识 status=rejected，**不写入任何 relationships**；遍历 relations，对所有 type 为 `duplicate` 或 `subset` 的旧知识 helpful+1，记录到 helpful_history
														
 
															+- `final_decision = "approved"`：新知识 status=approved；遍历 relations，对所有 type 不是 `none` 的关系双向写入 relationships，同时更新关系缓存表
														
 
															+- `none`：不写入 relationships，不更新缓存表
														
 
															+
														
 
															+### 关系缓存表
														
 
															+
														
 
															+实现位置：`knowhub/server.py:RelationCache`
														
 
															+
														
 
															+独立于知识条目存储，结构如下：
														
 
															+
														
 
															+```json
														
 
															+{
														
 
															+  "conflict":    ["knowledge-A", "knowledge-B", "knowledge-C"],
														
 
															+  "superset":    ["knowledge-D", "knowledge-E"],
														
 
															+  "complement":  ["knowledge-F", "knowledge-G"],
														
 
															+  "custom_type": ["knowledge-I"]
														
 
															+}
														
 
															+```
														
 
															+
														
 
															+每个关系类型对应一个列表，记录**所有参与该关系的知识 ID**（不区分方向）。LLM 提出新关系类型时，自动在缓存表中新增对应字段。
														
 
															+
														
 
															+---
														
 
															+
														
 
															+## 四、更新后的知识条目数据结构
														
 
															+
														
 
															+### 新增 2 个字段
														
 
															+
														
 
															+| 字段 | 类型 | 默认值 | 说明 |
														
 
															+|---|---|---|---|
														
 
															+| `status` | VARCHAR(20) | `"pending"` | 入库状态：pending / processing / approved / checked / rejected |
														
 
															+| `relationships` | JSON | `[]` | 与其他知识的关系列表 |
														
 
															+
														
 
															+### status 字段语义
														
 
															+
														
 
															+| 值 | 含义 | 可被检索 |
														
 
															+|---|---|---|
														
 
															+| `pending` | 刚入队，等待处理 | 否 |
														
 
															+| `processing` | 正在处理（防并发乐观锁） | 否 |
														
 
															+| `approved` | 已通过去重，正式入库 | 是 |
														
 
															+| `checked` | 经人类审核确认 | 是 |
														
 
															+| `rejected` | 被判定为重复，已丢弃 | 否 |
														
 
															+
														
 
															+### relationships 字段结构
														
 
															+
														
 
															+每条记录代表一条**出边**（从当前知识出发的关系）：
														
 
															+
														
 
															+```json
														
 
															+[
														
 
															+  {
														
 
															+    "type": "superset",
														
 
															+    "target": "knowledge-20260305-a1b2"
														
 
															+  }
														
 
															+]
														
 
															+```
														
 
															+
														
 
															+### helpful_history / harmful_history 格式
														
 
															+
														
 
															+实现位置：`knowhub/server.py:KnowledgeProcessor._apply_decision`
														
 
															+
														
 
															+```json
														
 
															+{
														
 
															+  "helpful_history": [
														
 
															+    {
														
 
															+      "source": "dedup",
														
 
															+      "related_id": "knowledge-20260317-new-xxxx",
														
 
															+      "relation_type": "duplicate",
														
 
															+      "timestamp": 1710000000
														
 
															+    }
														
 
															+  ]
														
 
															+}
														
 
															+```
														
 
															+
														
 
															+- `source: "dedup"`：标识这条反馈来自去重流程
														
 
															+- `related_id`：触发这次反馈的新知识 ID（被 rejected 的那条）
														
 
															+- `relation_type`：触发反馈的关系类型
														
 
															+
														
 
															+### 完整知识条目结构
														
 
															+
														
 
															+```json
														
 
															+{
														
 
															+  "id": "knowledge-20260317-143022-a1b2",
														
 
															+  "embedding": [...],
														
 
															+  "message_id": "",
														
 
															+  "task": "...",
														
 
															+  "content": "...",
														
 
															+  "types": ["strategy"],
														
 
															+  "tags": {},
														
 
															+  "tag_keys": [],
														
 
															+  "scopes": ["org:cybertogether"],
														
 
															+  "owner": "agent:runner",
														
 
															+  "resource_ids": [],
														
 
															+  "source": {},
														
 
															+  "eval": {
														
 
															+    "score": 3,
														
 
															+    "helpful": 1,
														
 
															+    "harmful": 0,
														
 
															+    "confidence": 0.7,
														
 
															+    "helpful_history": [],
														
 
															+    "harmful_history": []
														
 
															+  },
														
 
															+  "created_at": 1710000000,
														
 
															+  "updated_at": 1710000000,
														
 
															+  "status": "pending",
														
 
															+  "relationships": []
														
 
															+}
														
 
															+```
														
 
															+
														
 
															+---
														
 
															+
														
 
															+## 五、LLM 关系判断 Prompt
														
 
															+
														
 
															+实现位置：`knowhub/server.py:KnowledgeProcessor._llm_judge_relations`
														
 
															+
														
 
															+```python
														
 
															+DEDUP_RELATION_PROMPT = """你是知识库管理专家。请判断【新知识】与【相似知识列表】中每条知识的关系。
														
 
															+
														
 
															+【新知识】
														
 
															+Task: {new_task}
														
 
															+Content: {new_content}
														
 
															+
														
 
															+【相似知识列表】（向量召回 top-10，按相似度排序）
														
 
															+{existing_list}
														
 
															+格式: [序号] ID: xxx | Task: xxx | Content: xxx
														
 
															+
														
 
															+【已知关系类型参考】
														
 
															+- duplicate: task 和 content 语义完全相同，无新增信息
														
 
															+- subset: task语义一致，新知识的content信息完全被某条已有知识覆盖
														
 
															+- superset: task语义一致，新知识包含某条已有知识的全部信息，且有额外内容
														
 
															+- conflict: 同一 task 下给出相互矛盾的结论
														
 
															+- complement: 描述同一 task 的不同方面，互补
														
 
															+- none: task 语义不同，或无实质关系（task 不同时必须判定为 none，只有 task 语义一致才可能存在其他关系）
														
 
															+
														
 
															+**重要**：如果以上类型无法准确描述关系，你可以自定义新的关系类型（英文小写下划线命名），并自行判断新知识应该 approved 还是 rejected。
														
 
															+
														
 
															+【输出格式】（严格 JSON，不要其他内容）
														
 
															+{{
														
 
															+  "final_decision": "approved",
														
 
															+  "relations": [
														
 
															+    {{
														
 
															+      "old_id": "knowledge-xxx",
														
 
															+      "type": "superset",
														
 
															+      "reverse_type": "subset"
														
 
															+    }}
														
 
															+  ]
														
 
															+}}
														
 
															+
														
 
															+"""
														
 
															+```
														
 
															+
														
 
															+### LLM 输出字段的处理逻辑
														
 
															+
														
 
															+实现位置：`knowhub/server.py:KnowledgeProcessor._apply_decision`
														
 
															+
														
 
															+**final_decision**: "approved" 或 "rejected"
														
 
															+- 用途：设置新知识的 status 字段
														
 
															+- 只要 relations 中有任意一条 type 为 duplicate 或 subset，LLM 应输出 rejected
														
 
															+
														
 
															+**relations**: 关系列表
														
 
															+- **old_id**: 旧知识 ID
														
 
															+  - 用途：定位需要更新的旧知识记录
														
 
															+- **type**: 从新知识指向旧知识的关系类型
														
 
															+  - 如果 final_decision="rejected"：仅对 type="duplicate" 或 type="subset" 的旧知识 eval.helpful +1，写入 helpful_history；其余关系忽略
														
 
															+  - 如果 final_decision="approved" 且 type 不是 "none"：新知识的 relationships 追加 `{"type": type, "target": old_id}`，同时更新关系缓存表
														
 
															+- **reverse_type**: 从旧知识指向新知识的反向关系类型
														
 
															+  - 仅在 final_decision="approved" 且 reverse_type 不是 "none" 时：旧知识的 relationships 追加 `{"type": reverse_type, "target": new_id}`
														
 
															+
														
 
															+---
														
 
															+
														
 
															+## 六、异步处理架构
														
 
															+
														
 
															+### 整体架构
														
 
															+
														
 
															+```
														
 
															+POST /api/knowledge
														
 
															+  → 生成 embedding
														
 
															+  → 插入 Milvus (status=pending)
														
 
															+  → 立即返回 {"status": "pending", "knowledge_id": "..."}
														
 
															+  → background_tasks.add_task(processor.process_pending)  ← 非阻塞触发
														
 
															+
														
 
															+KnowledgeProcessor（后台处理器）
														
 
															+  → 查询所有 status=pending 的知识（每批50条）
														
 
															+  → 逐条处理：pending → processing → approved/rejected
														
 
															+  → asyncio.Lock 防止并发
														
 
															+
														
 
															+定时兜底（每60秒）
														
 
															+  → asyncio.create_task(_periodic_processor())
														
 
															+  → 检测超时的 processing 条目（>5分钟）并回滚到 pending
														
 
															+```
														
 
															+
														
 
															+### 错误处理策略
														
 
															+
														
 
															+| 场景 | 处理方式 |
														
 
															+|---|---|
														
 
															+| LLM 调用失败 | 重试 2 次，仍失败则 status=approved（宁可放行，不丢数据） |
														
 
															+| LLM 输出无法解析 | 同上，fallback 到 approved |
														
 
															+| 处理超时（>5分钟） | 定时任务检测 processing 状态并回滚到 pending |
														
 
															+| 并发写入相同知识 | processing 状态作为乐观锁，第二个处理器跳过 |
														
 
															+| task 语义不相关（score < 0.75） | 预过滤直接排除，不进入 LLM 判断，视为 none |
														
 
															+
														
 
															+---
														
 
															+
														
 
															+## 七、API 接口设计
														
 
															+
														
 
															+### 新增/改造接口
														
 
															+
														
 
															+| 接口 | 变化 |
														
 
															+|---|---|
														
 
															+| `POST /api/knowledge` | 插入 status=pending，触发后台任务，立即返回 pending 状态 |
														
 
															+| `POST /api/extract` | 批量插入时每条 status=pending，插入后触发后台任务 |
														
 
															+| `POST /api/knowledge/slim` | 重建知识时显式传入 status=approved，跳过去重（已精炼知识） |
														
 
															+| `GET /api/knowledge` | 追加 `status in ["approved", "checked"]` 过滤 |
														
 
															+| `GET /api/knowledge/search` | 追加 `status in ["approved", "checked"]` 过滤 |
														
 
															+| `POST /api/knowledge/migrate` | **新增**：手动触发 schema 迁移（中转 collection 模式），返回迁移条数 |
														
 
															+| `GET /api/knowledge/pending` | **新增**：查询待处理队列 |
														
 
															+| `POST /api/knowledge/process` | **新增**：手动触发处理，`force=true` 可回滚卡死的 processing 条目 |
														
 
															+| `GET /api/knowledge/status/{id}` | **新增**：查询单条知识的处理状态和关系 |
														
 
															+
														
 
															+### POST /api/knowledge 响应变化
														
 
															+
														
 
															+```json
														
 
															+{
														
 
															+  "status": "pending",
														
 
															+  "knowledge_id": "knowledge-20260317-143022-a1b2",
														
 
															+  "message": "知识已入队，正在处理去重..."
														
 
															+}
														
 
															+```
														
 
															+
														
 
															+### 迁移脚本处理
														
 
															+
														
 
															+`migrate_knowledge.py`：历史数据迁移，迁移的是已存在的知识，插入时显式传入 `status="approved"`，`relationships=[]`，跳过去重流程。
														
 
															+
														
 
															+---
														
 
															+
														
 
															+## 八、Milvus 关系筛选可行性
														
 
															+
														
 
															+### 可行的查询
														
 
															+
														
 
															+```python
														
 
															+# status 过滤（高效，建议加 Trie 索引）
														
 
															+'status == "approved"'
														
 
															+'status == "pending" or status == "processing"'
														
 
															+
														
 
															+# relationships 非空（Milvus 2.3+ JSON 查询）
														
 
															+'json_length(relationships) > 0'
														
 
															+```
														
 
															+
														
 
															+### 关系查询方案
														
 
															+
														
 
															+**正向查询**（从知识 A 查询它的所有关系）：直接读取 A 的 `relationships` 字段，O(1)。
														
 
															+
														
 
															+**反向查询**（查询"哪些知识与 A 有 conflict 关系"）：通过**关系缓存表**实现，无需全表扫描。
														
 
															+
														
 
															+**复杂查询**（查询"所有存在 conflict 关系的知识对"）：直接读取关系缓存表的 `conflict` 字段。
														
 
															+
														
 
															+### 性能评估
														
 
															+
														
 
															+| 查询类型 | 方案 | 性能 |
														
 
															+|---|---|---|
														
 
															+| status 过滤 | Milvus Trie 索引 | 极快 |
														
 
															+| 向量召回 + status 过滤 | HNSW + 标量过滤 | 快（现有机制） |
														
 
															+| relationships 正向读取 | 直接读 JSON 字段 | O(1) |
														
 
															+| relationships 反向/复杂查询 | 关系缓存表 | O(1) |
														
 
															+
														
 
															+---
														
 
															+
														
 
															+## 九、实现步骤与文件清单
														
 
															+
														
 
															+### 关键文件修改清单
														
 
															+
														
 
															+| 文件 | 修改内容 |
														
 
															+| --- | --- |
														
 
															+| `knowhub/vector_store.py` | 新增 status/relationships 字段；更新所有 output_fields；为 status 添加 Trie 索引 |
														
 
															+| `knowhub/server.py` | 新增 `KnowledgeProcessor` 类（~200行）；改造 `save_knowledge` / `extract_knowledge_from_messages`；改造 list/search 追加 status 过滤；新增 3 个接口；更新 `KnowledgeIn` 模型；实现关系缓存表管理 |
														
 
															+| `migrate_knowledge.py` | 插入时显式传入 `status="approved"`，`relationships=[]` |
														
 
															+
														
 
															+### 实现阶段
														
 
															+
														
 
															+**Phase 1 — Schema 扩展**（`knowhub/vector_store.py`）
														
 
															+1. 新增 2 个字段：status、relationships
														
 
															+2. 更新 search/query/get_by_id 的 output_fields
														
 
															+3. 为 status 添加 Trie 标量索引
														
 
															+4. 初始化关系缓存表存储
														
 
															+
														
 
															+**Phase 2 — 处理器核心逻辑**（`knowhub/server.py`）
														
 
															+1. 实现 `KnowledgeProcessor` 类
														
 
															+2. 实现 `_llm_judge_relations` 方法（使用上面的 Prompt）
														
 
															+3. 实现 `_apply_decision` 方法（写入 status 和 relationships，同步更新关系缓存表）
														
 
															+4. 在 `lifespan` 中初始化处理器实例 + 启动定时任务
														
 
															+5. 实现关系缓存表的读写接口
														
 
															+
														
 
															+**Phase 3 — API 改造**（`knowhub/server.py`）
														
 
															+1. 改造 `POST /api/knowledge`：status=pending，触发后台任务
														
 
															+2. 改造 `GET /api/knowledge` 和 `GET /api/knowledge/search`：追加 status 过滤
														
 
															+3. 新增 3 个接口：pending / process / status/{id}
														
 
															+
														
 
															+### 数据迁移方案
														
 
															+
														
 
															+Milvus Lite 不支持 ALTER COLLECTION 和 rename_collection，采用**软兼容 + 手动触发迁移接口**策略：
														
 
															+
														
 
															+- **平时（软兼容）**：读取时用 `.get("status", "approved")` / `.get("relationships", []) or []` 兼容旧数据，旧数据被视为 approved，不影响检索和去重逻辑
														
 
															+- **迁移（手动触发 `POST /api/knowledge/migrate`）**：采用"中转 collection"模式（Milvus Lite 不支持 rename）：
														
 
															+  1. 创建 `knowledge_migration`（新 schema）
														
 
															+  2. 从 `knowledge` 逐条读取，补 `status="approved"`, `relationships=[]`，插入 `knowledge_migration`
														
 
															+  3. drop `knowledge`
														
 
															+  4. 创建 `knowledge`（新 schema，空）
														
 
															+  5. 从 `knowledge_migration` 逐条读取，插入 `knowledge`
														
 
															+  6. drop `knowledge_migration`
														
 
															+  7. 更新 `self.collection` 引用
														
 
															+
														
 
															+  实现位置：`knowhub/vector_store.py:MilvusStore.migrate_schema`
														
--- a/knowhub/docs/feedback-timing-design.md
+++ b/knowhub/docs/feedback-timing-design.md
@@ -0,0 +1,269 @@
 
															+# 知识反馈时机设计文档
														
 
															+
														
 
															+## 文档维护规范
														
 
															+
														
 
															+0. **先改文档，再动代码** - 新功能或重大修改需先完成文档更新、并完成审阅后，再进行代码实现；除非改动较小、不被文档涵盖
														
 
															+1. **文档分层，链接代码** - 重要或复杂设计可以另有详细文档；关键实现需标注代码文件路径；格式：`module/file.py:function_name`
														
 
															+2. **简洁快照，日志分离** - 只记录最重要的、与代码准确对应的或者明确的已完成的设计的信息，避免推测、建议、决策历史、修改日志、大量代码；决策依据或修改日志若有必要，可在 `knowhub/docs/decisions.md` 另行记录
														
 
															+
														
 
															+---
														
 
															+
														
 
															+## 背景
														
 
															+
														
 
															+### 现有反馈机制的缺陷
														
 
															+
														
 
															+当前的知识反馈存在以下问题（来自 `feedback-optimization-proposal.md`）：
														
 
															+
														
 
															+- **反馈时机不明确**：没有明确定义何时、由谁来评估知识的有效性
														
 
															+- **缺少使用状态追踪**：知识被注入后，无法知道它是否真的被用到了
														
 
															+- **评估粒度粗糙**：只有 helpful/harmful 计数，缺少"为什么有用/无用"的上下文
														
 
															+
														
 
															+### 设计目标
														
 
															+
														
 
															+1. 记录每条知识的完整生命周期（注入 → 使用 → 评估）
														
 
															+2. 在自然的执行节点（Goal 完成、压缩、任务结束）触发评估，不打断主流程
														
 
															+3. 为后续上报 KnowHub 提供结构化的评估数据
														
 
															+
														
 
															+---
														
 
															+
														
 
															+## 核心概念
														
 
															+
														
 
															+### Knowledge Log（知识注入日志）
														
 
															+
														
 
															+每个 trace 维护一个 `knowledge_log.json`，记录该 trace 中所有被注入的知识及其评估状态。
														
 
															+
														
 
															+**位置**：`.trace/{trace_id}/knowledge_log.json`
														
 
															+
														
 
															+**数据结构**：
														
 
															+
														
 
															+```json
														
 
															+{
														
 
															+  "trace_id": "trace-xxx",
														
 
															+  "entries": [
														
 
															+    {
														
 
															+      "knowledge_id": "knowledge-20260305-a1b2",
														
 
															+      "goal_id": "1",
														
 
															+      "injected_at_sequence": 42,
														
 
															+      "injected_at": "2026-03-20T10:00:00.000000",
														
 
															+      "task": "知识的原始task描述",
														
 
															+      "content": "知识内容摘要（截断至500字符）",
														
 
															+      "eval_result": {
														
 
															+        "eval_status": "helpful",
														
 
															+        "reason": "评估理由"
														
 
															+      },
														
 
															+      "evaluated_at": "2026-03-20T10:05:00.000000",
														
 
															+      "evaluated_at_trigger": "goal_completion"
														
 
															+    }
														
 
															+  ]
														
 
															+}
														
 
															+```
														
 
															+
														
 
															+**字段说明**：
														
 
															+
														
 
															+| 字段 | 类型 | 说明 |
														
 
															+|---|---|---|
														
 
															+| `knowledge_id` | string | KnowHub 中的知识 ID |
														
 
															+| `goal_id` | string | 注入时的 Goal ID（如 `"1"`, `"2.1"`） |
														
 
															+| `injected_at_sequence` | int | 注入时的消息序列号 |
														
 
															+| `injected_at` | datetime | 注入时间（ISO 格式，含毫秒） |
														
 
															+| `task` | string | 知识的原始 task 描述 |
														
 
															+| `content` | string | 知识内容（写入时截断至 500 字符） |
														
 
															+| `eval_result` | object/null | 评估结果对象；未评估时为 `null` |
														
 
															+| `evaluated_at` | datetime/null | 评估时间；未评估时为 `null` |
														
 
															+| `evaluated_at_trigger` | string/null | 触发评估的事件（见下表）；未评估时为 `null` |
														
 
															+
														
 
															+**`evaluated_at_trigger` 可能的值**：
														
 
															+
														
 
															+| 值 | 含义 |
														
 
															+|---|---|
														
 
															+| `"goal_completion"` | 由 Goal 完成（`completed` 或 `abandoned`）触发 |
														
 
															+| `"compression"` | 由上下文压缩触发（压缩前必须先评估） |
														
 
															+| `"task_completion"` | 由任务自然结束触发（主路径无工具调用退出时兜底） |
														
 
															+
														
 
															+> 注意：同一个 `knowledge_id` 可能在不同 Goal 中被多次注入，每次产生独立 entry。评估时优先更新最近注入（`injected_at_sequence` 最大）的未评估条目。
														
 
															+
														
 
															+---
														
 
															+
														
 
															+## 评估触发机制
														
 
															+
														
 
															+### 触发点 1：Goal 完成
														
 
															+
														
 
															+**时机**：Goal status 变为 `completed` 或 `abandoned`
														
 
															+
														
 
															+**触发逻辑**（`agent/trace/store.py:update_goal`）：
														
 
															+
														
 
															+```
														
 
															+Goal 完成
														
 
															+  ↓
														
 
															+查询 knowledge_log 中 eval_result == null 的条目
														
 
															+  ↓
														
 
															+如果有待评估条目
														
 
															+  → 在 trace.context 中设置标志：
														
 
															+      pending_knowledge_eval = true
														
 
															+      knowledge_eval_trigger = "goal_completion"
														
 
															+  ↓
														
 
															+Runner 主循环下一次迭代开头检测到标志（agent/core/runner.py:_agent_loop）
														
 
															+  → 清除标志
														
 
															+  → 将 "knowledge_eval" 加入 force_side_branch 队列
														
 
															+```
														
 
															+
														
 
															+### 触发点 2：压缩（Compression）
														
 
															+
														
 
															+**时机**：上下文 token 数超过阈值，即将执行压缩
														
 
															+
														
 
															+**触发逻辑**（`agent/core/runner.py:_manage_context_usage`）：
														
 
															+
														
 
															+```
														
 
															+压缩条件触发
														
 
															+  ↓
														
 
															+查询 knowledge_log 中 eval_result == null 的条目
														
 
															+  ↓
														
 
															+如果有待评估条目
														
 
															+  → 在 trace.context 中设置：
														
 
															+      knowledge_eval_trigger = "compression"
														
 
															+  → 将侧分支队列设为：
														
 
															+      ["reflection", "knowledge_eval", "compression"]（启用知识提取时）
														
 
															+      ["knowledge_eval", "compression"]（未启用知识提取时）
														
 
															+  → 返回"需要进入侧分支"信号，暂缓压缩
														
 
															+  ↓
														
 
															+依次执行侧分支队列后再压缩
														
 
															+```
														
 
															+
														
 
															+**原因**：压缩会删除消息历史，必须在压缩前完成评估，否则执行上下文永久丢失。
														
 
															+
														
 
															+### 触发点 3：任务结束（兜底）
														
 
															+
														
 
															+**时机**：主路径出现无工具调用的回复，Agent 即将结束任务
														
 
															+
														
 
															+**触发逻辑**（`agent/core/runner.py:_agent_loop`，无工具调用分支）：
														
 
															+
														
 
															+```
														
 
															+主路径无工具调用（任务即将结束）
														
 
															+  ↓
														
 
															+查询 knowledge_log 中 eval_result == null 的条目
														
 
															+  ↓
														
 
															+如果有待评估条目
														
 
															+  → 在 trace.context 中设置：
														
 
															+      knowledge_eval_trigger = "task_completion"
														
 
															+  → 将 ["knowledge_eval"] 加入 force_side_branch 队列
														
 
															+  → continue（不 break，下一轮执行评估侧分支）
														
 
															+  ↓
														
 
															+评估完成后再退出
														
 
															+```
														
 
															+
														
 
															+---
														
 
															+
														
 
															+## 评估分类（eval_status）
														
 
															+
														
 
															+| 状态 | 含义 |
														
 
															+|---|---|
														
 
															+| `irrelevant` | 知识的 task 与当前任务无关 |
														
 
															+| `unused` | 知识与任务相关，但执行过程中没有被使用 |
														
 
															+| `helpful` | 知识对当前任务有实质帮助 |
														
 
															+| `harmful` | 知识对当前任务产生了负面作用 |
														
 
															+| `neutral` | 知识与任务相关但无明显影响 |
														
 
															+
														
 
															+---
														
 
															+
														
 
															+## 侧分支评估流程
														
 
															+
														
 
															+### 侧分支类型
														
 
															+
														
 
															+复用现有 `SideBranchContext` 机制，新增 `"knowledge_eval"` 类型（`agent/trace/models.py:Message.branch_type`）：
														
 
															+
														
 
															+```python
														
 
															+SideBranchContext(
														
 
															+    type="knowledge_eval",
														
 
															+    branch_id=f"knowledge_eval_{uuid.uuid4().hex[:8]}",  # 如 "knowledge_eval_1c5fffaf"
														
 
															+    max_turns=config.side_branch_max_turns               # 默认 5
														
 
															+)
														
 
															+```
														
 
															+
														
 
															+`trigger_event` 记录在 `trace.context["active_side_branch"]["trigger_event"]` 中，侧分支退出后写入 `evaluated_at_trigger`。
														
 
															+
														
 
															+### 评估 Prompt 结构
														
 
															+
														
 
															+完整实现见 `agent/core/runner.py:_build_knowledge_eval_prompt`，结构如下：
														
 
															+
														
 
															+```
														
 
															+你是知识评估助手。请评估以下知识在本次任务执行中的实际效果。
														
 
															+
														
 
															+## 当前任务（Mission）       ← trace.task
														
 
															+## 当前 Goal                ← goal_tree.current 的 description
														
 
															+## 待评估知识列表            ← 所有 eval_result == null 的条目
														
 
															+  - knowledge_id / task / content / injected_at_sequence / goal_id
														
 
															+## 评估维度                  ← helpfulness + relevance
														
 
															+## 评估分类                  ← 5 个 eval_status 选项
														
 
															+## 输出格式                  ← JSON
														
 
															+```
														
 
															+
														
 
															+> Prompt 中**不包含消息历史**。LLM 依据对话上下文中已有的执行过程作出判断。
														
 
															+
														
 
															+### 评估输出格式
														
 
															+
														
 
															+LLM 直接输出 JSON，**无需调用工具**：
														
 
															+
														
 
															+```json
														
 
															+{
														
 
															+  "evaluations": [
														
 
															+    {
														
 
															+      "knowledge_id": "knowledge-20260305-a1b2",
														
 
															+      "eval_status": "helpful",
														
 
															+      "reason": "1-2句评估理由"
														
 
															+    }
														
 
															+  ]
														
 
															+}
														
 
															+```
														
 
															+
														
 
															+### 即时写入机制（`agent/core/runner.py:_agent_loop`）
														
 
															+
														
 
															+每次 LLM 回复后立即尝试解析，三种策略依次降级：整体解析 → ` ```json ` 代码块 → 正则裸对象。
														
 
															+
														
 
															+```
														
 
															+LLM 输出评估 JSON
														
 
															+  ↓
														
 
															+解析成功 → 立即调用 store.update_knowledge_evaluation() 写入每条评估结果
														
 
															+  ↓
														
 
															+侧分支达到退出条件（无工具调用 或 超过 max_turns）→ 恢复主路径
														
 
															+```
														
 
															+
														
 
															+解析失败时记录日志，不中断主流程。
														
 
															+
														
 
															+---
														
 
															+
														
 
															+## 数据流
														
 
															+
														
 
															+```
														
 
															+知识注入（agent/trace/goal_tool.py:inject_knowledge_for_goal）
														
 
															+  ↓
														
 
															+写入 knowledge_log.json（eval_result=null）
														
 
															+  ↓
														
 
															+  ┌─────────────────────────────────────────────┐
														
 
															+  │  触发点 A：Goal 完成（goal_completion）       │
														
 
															+  │  触发点 B：压缩执行前（compression）          │
														
 
															+  │  触发点 C：任务自然结束（task_completion）    │
														
 
															+  └─────────────────────────────────────────────┘
														
 
															+  ↓
														
 
															+Runner 进入 knowledge_eval 侧分支
														
 
															+  ↓
														
 
															+LLM 直接输出 JSON 评估结果（无工具调用）
														
 
															+  ↓
														
 
															+Runner 每轮即时解析并写入 knowledge_log.json
														
 
															+  ↓
														
 
															+侧分支退出 → 恢复主路径
														
 
															+```
														
 
															+
														
 
															+---
														
 
															+
														
 
															+## 与现有系统的集成点
														
 
															+
														
 
															+| 集成位置 | 文件 | 说明 |
														
 
															+|---|---|---|
														
 
															+| 知识注入时写 log | `agent/trace/goal_tool.py:inject_knowledge_for_goal` | `goal(focus=...)` 触发知识搜索后写入 `knowledge_log.json` |
														
 
															+| Goal 完成时设置标志 | `agent/trace/store.py:update_goal` | 设置 `trace.context["pending_knowledge_eval"]` 标志 |
														
 
															+| 主循环检测 Goal 完成标志 | `agent/core/runner.py:_agent_loop` | 每轮迭代开头检测标志，触发 `["knowledge_eval"]` 侧分支 |
														
 
															+| 压缩前触发评估 | `agent/core/runner.py:_manage_context_usage` | 压缩前检查 pending，先评估再压缩 |
														
 
															+| 任务结束兜底 | `agent/core/runner.py:_agent_loop` | 任务退出前检查 pending，强制触发评估 |
														
 
															+| 侧分支类型扩展 | `agent/trace/models.py:Message.branch_type` | Literal 中包含 `"knowledge_eval"` |
														
 
															+| 即时写入评估结果 | `agent/core/runner.py:_agent_loop` | 存储 assistant 消息后即时解析 JSON 并写入 |
														
 
															+| Log 文件管理 | `agent/trace/store.py` | `append_knowledge_entry` / `update_knowledge_evaluation` / `get_pending_knowledge_entries` |