1 ay önce · df9fd5e597
--- a/README.md
+++ b/README.md
@@ -192,10 +192,10 @@ run_config = RunConfig(
 
				 )
			
 
				 ```
			
 
				 
			
 
				-**参数注入规则**：
			
 
				-- `owner`：隐藏参数，LLM 不可见，框架自动注入
			
 
				-- `tags`：框架默认值 + LLM 传递的值合并
			
 
				-- `scopes`：框架默认值 + LLM 传递的值合并
			
 
				+**参数注入规则**（通过框架 `inject_params` 机制实现，详见 `agent/docs/tools.md`）：
			
 
				+- `owner`：隐藏参数，LLM 不可见，框架自动注入（`mode: default`）
			
 
				+- `tags`：LLM 可追加新 key，框架默认 key 不可被覆盖（`mode: merge`）
			
 
				+- `scopes`：LLM 可追加，与框架默认值合并去重（`mode: merge`）
			
 
				 
			
 
				 ### 知识工具
			
 
				 
			
--- a/agent/core/runner.py
+++ b/agent/core/runner.py
@@ -899,11 +899,10 @@ class AgentRunner:
 
				                         reasons=["系统自动创建：Agent 未显式创建目标"],
			
 
				                         parent_id=None
			
 
				                     )
			
 
				-                    goal_tree.focus(goal_tree.goals[0].id)
			
 
				                     if self.trace_store:
			
 
				                         await self.trace_store.add_goal(trace_id, goal_tree.goals[0])
			
 
				                         await self.trace_store.update_goal_tree(trace_id, goal_tree)
			
 
				-                    logger.info(f"自动创建 root goal: {goal_tree.goals[0].id}")
			
 
				+                    logger.info(f"自动创建 root goal: {goal_tree.goals[0].id}（未自动 focus，等待模型决定）")
			
 
				                 else:
			
 
				                     logger.debug(f"[Auto Root Goal] 检测到 goal 工具调用，跳过自动创建")
			
 
				 
			
@@ -984,27 +983,21 @@ class AgentRunner:
 
				                     elif tool_args is None:
			
 
				                         tool_args = {}
			
 
				 
			
 
				-                    # 注入知识管理工具的默认字段
			
 
				-                    if tool_name == "knowledge_save":
			
 
				-                        tool_args.setdefault("owner", config.knowledge.get_owner(config.agent_id))
			
 
				-                        if config.knowledge.default_tags:
			
 
				-                            existing_tags = tool_args.get("tags") or {}
			
 
				-                            merged_tags = {**config.knowledge.default_tags, **existing_tags}
			
 
				-                            tool_args["tags"] = merged_tags
			
 
				-                        if config.knowledge.default_scopes:
			
 
				-                            existing_scopes = tool_args.get("scopes") or []
			
 
				-                            tool_args["scopes"] = existing_scopes + config.knowledge.default_scopes
			
 
				-                    elif tool_name == "knowledge_search":
			
 
				-                        if config.knowledge.default_search_types and "types" not in tool_args:
			
 
				-                            tool_args["types"] = config.knowledge.default_search_types
			
 
				-                        if config.knowledge.default_search_owner and "owner" not in tool_args:
			
 
				-                            tool_args["owner"] = config.knowledge.default_search_owner
			
 
				-
			
 
				                     # 记录工具调用（INFO 级别，显示参数）
			
 
				                     args_str = json.dumps(tool_args, ensure_ascii=False)
			
 
				                     args_display = args_str[:100] + "..." if len(args_str) > 100 else args_str
			
 
				                     logger.info(f"[Tool Call] {tool_name}({args_display})")
			
 
				 
			
 
				+                    # 构建知识管理注入值
			
 
				+                    inject_values = None
			
 
				+                    if config.knowledge:
			
 
				+                        inject_values = {
			
 
				+                            "owner": config.knowledge.get_owner(config.uid or "agent"),
			
 
				+                            "tags": config.knowledge.default_tags,
			
 
				+                            "scopes": config.knowledge.default_scopes,
			
 
				+                            "types": config.knowledge.default_search_types,
			
 
				+                        }
			
 
				+
			
 
				                     tool_result = await self.tools.execute(
			
 
				                         tool_name,
			
 
				                         tool_args,
			
@@ -1015,7 +1008,9 @@ class AgentRunner:
 
				                             "goal_id": current_goal_id,
			
 
				                             "runner": self,
			
 
				                             "goal_tree": goal_tree,
			
 
				-                        }
			
 
				+                            "knowledge_config": config.knowledge,
			
 
				+                        },
			
 
				+                        inject_values=inject_values,
			
 
				                     )
			
 
				 
			
 
				                     # 如果是 goal 工具，记录执行后的状态
			
@@ -1306,21 +1301,20 @@ class AgentRunner:
 
				                 tool_args.setdefault("source_category", "exp")
			
 
				                 tool_args.setdefault("message_id", trace_id)
			
 
				 
			
 
				-                # 注入知识管理默认字段
			
 
				-                tool_args.setdefault("owner", config.knowledge.get_owner(config.agent_id))
			
 
				-                if config.knowledge.default_tags:
			
 
				-                    existing_tags = tool_args.get("tags") or {}
			
 
				-                    merged_tags = {**config.knowledge.default_tags, **existing_tags}
			
 
				-                    tool_args["tags"] = merged_tags
			
 
				-                if config.knowledge.default_scopes:
			
 
				-                    tool_args.setdefault("scopes", config.knowledge.default_scopes)
			
 
				-
			
 
				                 try:
			
 
				                     await self.tools.execute(
			
 
				                         "knowledge_save",
			
 
				                         tool_args,
			
 
				                         uid=config.uid or "",
			
 
				-                        context={"store": self.trace_store, "trace_id": trace_id},
			
 
				+                        context={
			
 
				+                            "store": self.trace_store,
			
 
				+                            "trace_id": trace_id,
			
 
				+                        },
			
 
				+                        inject_values={
			
 
				+                            "owner": config.knowledge.get_owner(config.uid or "agent"),
			
 
				+                            "tags": config.knowledge.default_tags,
			
 
				+                            "scopes": config.knowledge.default_scopes,
			
 
				+                        } if config.knowledge else None,
			
 
				                     )
			
 
				                     saved_count += 1
			
 
				                 except Exception as e:
			
@@ -1600,8 +1594,8 @@ class AgentRunner:
 
				         if goal_tree and goal_tree.goals:
			
 
				             parts.append(f"## Current Plan\n\n{goal_tree.to_prompt()}")
			
 
				 
			
 
				-            # 检测 focus 在有子节点的父目标上：提醒模型 focus 到具体子目标
			
 
				             if goal_tree.current_id:
			
 
				+                # 检测 focus 在有子节点的父目标上：提醒模型 focus 到具体子目标
			
 
				                 children = goal_tree.get_children(goal_tree.current_id)
			
 
				                 pending_children = [c for c in children if c.status in ("pending", "in_progress")]
			
 
				                 if pending_children:
			
@@ -1612,6 +1606,11 @@ class AgentRunner:
 
				                         f"**提醒**：当前焦点在父目标上，建议用 `goal(focus=\"...\")` "
			
 
				                         f"切换到具体子目标（如 {child_ids}）再执行。"
			
 
				                     )
			
 
				+            else:
			
 
				+                # 无焦点：提醒模型 focus
			
 
				+                parts.append(
			
 
				+                    "**提醒**：当前没有焦点目标。请用 `goal(focus=\"...\")` 选择一个目标开始执行。"
			
 
				+                )
			
 
				 
			
 
				         # Active Collaborators
			
 
				         collaborators = trace.context.get("collaborators", [])
			
--- a/agent/docs/tools.md
+++ b/agent/docs/tools.md
@@ -60,32 +60,49 @@ async def my_tool(arg: str, context: Optional[ToolContext] = None) -> ToolResult
 
				 
			
 
				 1. **业务参数**：LLM 可见，由 LLM 填写（如 `query`, `limit`）
			
 
				 2. **隐藏参数**：LLM 不可见，框架自动注入（如 `context`, `uid`）
			
 
				-3. **注入参数**：LLM 可见但有默认值，框架自动注入默认值（如 `owner`, `tags`）
			
 
				+3. **注入参数**：LLM 可见，框架自动注入默认值或与 LLM 值合并（如 `owner`, `tags`）
			
 
				 
			
 
				 ```python
			
 
				 @tool(
			
 
				-    hidden_params=["context", "uid"],  # 不生成 schema，LLM 看不到
			
 
				-    inject_params={                     # 自动注入默认值
			
 
				-        "owner": lambda ctx: ctx.config.knowledge.get_owner(),
			
 
				-        "tags": lambda ctx, args: {**ctx.config.default_tags, **args.get("tags", {})},
			
 
				+    hidden_params=["context", "owner"],  # 不生成 schema，LLM 看不到
			
 
				+    inject_params={                       # 声明注入规则
			
 
				+        "owner": {"mode": "default", "key": "knowledge_config.owner"},
			
 
				+        "tags":  {"mode": "merge",   "key": "knowledge_config.default_tags"},
			
 
				+        "scopes": {"mode": "merge",  "key": "knowledge_config.default_scopes"},
			
 
				     }
			
 
				 )
			
 
				 async def knowledge_save(
			
 
				     task: str,                          # 业务参数：LLM 填写
			
 
				     content: str,                       # 业务参数：LLM 填写
			
 
				     types: List[str],                   # 业务参数：LLM 填写
			
 
				-    tags: Optional[Dict] = None,        # 注入参数：LLM 可填，框架提供默认值
			
 
				-    owner: Optional[str] = None,        # 注入参数：LLM 可填，框架提供默认值
			
 
				+    tags: Optional[Dict] = None,        # 注入参数：LLM 可填，框架合并默认值
			
 
				+    scopes: Optional[List] = None,      # 注入参数：LLM 可填，框架合并默认值
			
 
				+    owner: Optional[str] = None,        # 隐藏参数：LLM 看不到，框架注入
			
 
				     context: Optional[ToolContext] = None,  # 隐藏参数：LLM 看不到
			
 
				-    uid: str = "",                      # 隐藏参数：LLM 看不到
			
 
				 ) -> ToolResult:
			
 
				     """保存知识到知识库"""
			
 
				     ...
			
 
				 ```
			
 
				 
			
 
				+**inject_params 声明格式**：
			
 
				+
			
 
				+```python
			
 
				+inject_params={
			
 
				+    "param_name": {
			
 
				+        "mode": "default" | "merge",  # 注入模式
			
 
				+        "key": "config_obj.field",    # 从 context 中取值的路径
			
 
				+    }
			
 
				+}
			
 
				+```
			
 
				+
			
 
				+- `mode: "default"`：LLM 未提供时注入框架值
			
 
				+- `mode: "merge"`：框架值与 LLM 值合并。dict 按 key 合并（框架 key 不可被覆盖，LLM 可追加新 key）；list 合并去重
			
 
				+
			
 
				+**值的来源**：通过 `key` 指定从 `context` 中取值的路径（如 `"knowledge_config.default_tags"` 表示 `context["knowledge_config"].default_tags`）。runner 在调用 `execute()` 时将配置对象放入 context，框架根据 key 路径自动取值。
			
 
				+
			
 
				 **注入时机**：
			
 
				 - Schema 生成时：跳过 `hidden_params`，不暴露给 LLM
			
 
				-- 工具执行前：注入 `hidden_params` 和 `inject_params` 的默认值
			
 
				+- 工具执行前：注入 `hidden_params` 和 `inject_params`
			
 
				 
			
 
				 **实现位置**：
			
 
				 - Schema 生成：`agent/tools/schema.py:SchemaGenerator.generate()`
			
@@ -136,18 +153,20 @@ async def search_notes(
 
				 
			
 
				 ```python
			
 
				 @tool(
			
 
				-    hidden_params=["context"],
			
 
				+    hidden_params=["context", "owner"],
			
 
				     inject_params={
			
 
				-        "owner": lambda ctx: ctx.config.knowledge.get_owner(),
			
 
				-        "tags": lambda ctx, args: {**ctx.config.default_tags, **args.get("tags", {})},
			
 
				+        "owner": {"mode": "default", "key": "knowledge_config.owner"},
			
 
				+        "tags":  {"mode": "merge",   "key": "knowledge_config.default_tags"},
			
 
				+        "scopes": {"mode": "merge",  "key": "knowledge_config.default_scopes"},
			
 
				     }
			
 
				 )
			
 
				 async def knowledge_save(
			
 
				     task: str,
			
 
				     content: str,
			
 
				     types: List[str],
			
 
				-    tags: Optional[Dict] = None,  # LLM 可填，框架提供默认值
			
 
				-    owner: Optional[str] = None,  # LLM 可填，框架提供默认值
			
 
				+    tags: Optional[Dict] = None,  # LLM 可填，框架合并默认值
			
 
				+    scopes: Optional[List] = None,  # LLM 可填，框架合并默认值
			
 
				+    owner: Optional[str] = None,  # LLM 看不到，框架注入
			
 
				     context: Optional[ToolContext] = None
			
 
				 ) -> ToolResult:
			
 
				     """
			
@@ -157,19 +176,17 @@ async def knowledge_save(
 
				         task: 任务描述
			
 
				         content: 知识内容
			
 
				         types: 知识类型
			
 
				-        tags: 业务标签（可选，有默认值）
			
 
				-        owner: 所有者（可选，有默认值）
			
 
				+        tags: 业务标签（可选，框架合并默认值）
			
 
				+        scopes: 可见范围（可选，框架合并默认值）
			
 
				     """
			
 
				-    # owner 和 tags 如果 LLM 未提供，框架会注入默认值
			
 
				     ...
			
 
				 ```
			
 
				 
			
 
				 **注入规则**：
			
 
				-- `inject_params` 的 value 可以是：
			
 
				-  - `lambda ctx: ...` - 从 context 计算
			
 
				-  - `lambda ctx, args: ...` - 从 context 和已有参数计算
			
 
				-  - 字符串 - 直接使用该值
			
 
				-- 注入时机：工具执行前，使用 `setdefault` 注入（不覆盖 LLM 提供的值）
			
 
				+- `inject_params` 的 value 是一个 dict，包含：
			
 
				+  - `mode`: `"default"`（LLM 未提供则注入）或 `"merge"`（与 LLM 值合并）
			
 
				+  - `key`: 从 context 中取值的路径（如 `"knowledge_config.default_tags"`）
			
 
				+- 参数同时在 `hidden_params` 中时，LLM 不可见，框架直接注入
			
 
				 
			
 
				 ### 带 UI 元数据
			
 
				 
			
--- a/agent/tools/builtin/knowledge.py
+++ b/agent/tools/builtin/knowledge.py
@@ -16,7 +16,13 @@ logger = logging.getLogger(__name__)
 
				 KNOWHUB_API = os.getenv("KNOWHUB_API", "http://localhost:8000")
			
 
				 
			
 
				 
			
 
				-@tool(hidden_params=["context"])
			
 
				+@tool(
			
 
				+    hidden_params=["context"],
			
 
				+    inject_params={
			
 
				+        "types": {"mode": "default"},
			
 
				+        "owner": {"mode": "default"},
			
 
				+    }
			
 
				+)
			
 
				 async def knowledge_search(
			
 
				     query: str,
			
 
				     top_k: int = 5,
			
@@ -98,12 +104,9 @@ async def knowledge_search(
 
				 @tool(
			
 
				     hidden_params=["context", "owner"],
			
 
				     inject_params={
			
 
				-        "owner": lambda ctx: ctx.get("knowledge_config", {}).get("owner") if ctx else None,
			
 
				-        "tags": lambda ctx, args: {
			
 
				-            **ctx.get("knowledge_config", {}).get("default_tags", {}),
			
 
				-            **(args.get("tags") or {})
			
 
				-        } if ctx else args.get("tags"),
			
 
				-        "scopes": lambda ctx, args: (args.get("scopes") or []) + (ctx.get("knowledge_config", {}).get("default_scopes") or []) if ctx else args.get("scopes"),
			
 
				+        "owner": {"mode": "default"},
			
 
				+        "tags": {"mode": "merge"},
			
 
				+        "scopes": {"mode": "merge"},
			
 
				     }
			
 
				 )
			
 
				 async def knowledge_save(
			
--- a/agent/tools/registry.py
+++ b/agent/tools/registry.py
@@ -229,26 +229,40 @@ class ToolRegistry:
 
				 			if "context" in hidden_params and "context" in sig.parameters:
			
 
				 				kwargs["context"] = context
			
 
				 
			
 
				-			# 注入默认值（inject_params）
			
 
				+			# 注入参数（inject_params）
			
 
				 			inject_params = tool_info.get("inject_params", {})
			
 
				-			for param_name, injector in inject_params.items():
			
 
				-				if param_name in sig.parameters:
			
 
				-					# 如果 LLM 已提供值，不覆盖
			
 
				+			for param_name, rule in inject_params.items():
			
 
				+				if param_name not in sig.parameters:
			
 
				+					continue
			
 
				+
			
 
				+				if not isinstance(rule, dict) or "mode" not in rule:
			
 
				+					# 兼容旧格式：直接值或 callable
			
 
				+					if param_name not in kwargs or kwargs[param_name] is None:
			
 
				+						kwargs[param_name] = rule() if callable(rule) else rule
			
 
				+					continue
			
 
				+
			
 
				+				mode = rule["mode"]
			
 
				+				# 从 inject_values 中获取值
			
 
				+				value = (inject_values or {}).get(param_name)
			
 
				+
			
 
				+				if value is None:
			
 
				+					continue
			
 
				+
			
 
				+				if mode == "default":
			
 
				+					# 默认值模式：LLM 未提供则注入
			
 
				 					if param_name not in kwargs or kwargs[param_name] is None:
			
 
				-						if callable(injector):
			
 
				-							# 检查 injector 的参数数量
			
 
				-							injector_sig = inspect.signature(injector)
			
 
				-							if len(injector_sig.parameters) == 1:
			
 
				-								# lambda ctx: ...
			
 
				-								kwargs[param_name] = injector(context)
			
 
				-							elif len(injector_sig.parameters) == 2:
			
 
				-								# lambda ctx, args: ...
			
 
				-								kwargs[param_name] = injector(context, kwargs)
			
 
				-							else:
			
 
				-								kwargs[param_name] = injector()
			
 
				-						else:
			
 
				-							# 直接使用值
			
 
				-							kwargs[param_name] = injector
			
 
				+						kwargs[param_name] = value
			
 
				+				elif mode == "merge":
			
 
				+					# 合并模式：框架值始终保留，LLM 可追加新内容
			
 
				+					llm_value = kwargs.get(param_name)
			
 
				+					if isinstance(value, dict):
			
 
				+						# dict: LLM 追加新 key，同名 key 以框架值为准
			
 
				+						kwargs[param_name] = {**(llm_value or {}), **value}
			
 
				+					elif isinstance(value, list):
			
 
				+						# list: 合并去重
			
 
				+						kwargs[param_name] = list(set((llm_value or []) + value))
			
 
				+					else:
			
 
				+						kwargs[param_name] = value
			
 
				 
			
 
				 			# 执行函数
			
 
				 			if inspect.iscoroutinefunction(func):
			
--- a/agent/trace/goal_tool.py
+++ b/agent/trace/goal_tool.py
@@ -4,14 +4,87 @@ Goal 工具 - 计划管理
 
				 提供 goal 工具供 LLM 管理执行计划。
			
 
				 """
			
 
				 
			
 
				+import logging
			
 
				 from typing import Optional, List, TYPE_CHECKING
			
 
				 
			
 
				 from agent.tools import tool
			
 
				 
			
 
				 if TYPE_CHECKING:
			
 
				-    from .goal_models import GoalTree
			
 
				+    from .goal_models import GoalTree, Goal
			
 
				     from .protocols import TraceStore
			
 
				 
			
 
				+logger = logging.getLogger(__name__)
			
 
				+
			
 
				+
			
 
				+# ===== 知识注入 =====
			
 
				+
			
 
				+async def inject_knowledge_for_goal(
			
 
				+    goal: "Goal",
			
 
				+    tree: "GoalTree",
			
 
				+    store: Optional["TraceStore"] = None,
			
 
				+    trace_id: Optional[str] = None,
			
 
				+    knowledge_config: Optional[dict] = None,
			
 
				+) -> Optional[str]:
			
 
				+    """
			
 
				+    为指定 goal 注入相关知识。
			
 
				+
			
 
				+    Args:
			
 
				+        goal: 目标对象
			
 
				+        tree: GoalTree
			
 
				+        store: TraceStore（用于持久化）
			
 
				+        trace_id: Trace ID
			
 
				+        knowledge_config: 知识管理配置（KnowledgeConfig 对象）
			
 
				+
			
 
				+    Returns:
			
 
				+        注入结果描述（如 "📚 已注入 3 条相关知识"），无结果返回 None
			
 
				+    """
			
 
				+    # 检查是否启用知识注入
			
 
				+    if knowledge_config and not getattr(knowledge_config, 'enable_injection', True):
			
 
				+        logger.debug(f"[Knowledge Inject] 知识注入已禁用，跳过")
			
 
				+        return None
			
 
				+
			
 
				+    try:
			
 
				+        from agent.tools.builtin.knowledge import knowledge_search
			
 
				+
			
 
				+        logger.info(f"[Knowledge Inject] goal: {goal.id}, query: {goal.description[:80]}")
			
 
				+
			
 
				+        # 从配置中获取搜索参数
			
 
				+        search_types = None
			
 
				+        search_owner = None
			
 
				+        if knowledge_config:
			
 
				+            search_types = getattr(knowledge_config, 'default_search_types', None)
			
 
				+            search_owner = getattr(knowledge_config, 'default_search_owner', None) or None
			
 
				+
			
 
				+        knowledge_result = await knowledge_search(
			
 
				+            query=goal.description,
			
 
				+            top_k=3,
			
 
				+            min_score=3,
			
 
				+            types=search_types,
			
 
				+            owner=search_owner,
			
 
				+            context=None
			
 
				+        )
			
 
				+
			
 
				+        logger.debug(f"[Knowledge Inject] result type: {type(knowledge_result)}, metadata: {getattr(knowledge_result, 'metadata', None)}")
			
 
				+
			
 
				+        if knowledge_result.metadata and knowledge_result.metadata.get("items"):
			
 
				+            goal.knowledge = knowledge_result.metadata["items"]
			
 
				+            knowledge_count = len(goal.knowledge)
			
 
				+            logger.info(f"[Knowledge Inject] 注入 {knowledge_count} 条知识到 goal {goal.id}")
			
 
				+
			
 
				+            if store and trace_id:
			
 
				+                await store.update_goal_tree(trace_id, tree)
			
 
				+
			
 
				+            return f"📚 已注入 {knowledge_count} 条相关知识"
			
 
				+        else:
			
 
				+            goal.knowledge = []
			
 
				+            logger.info(f"[Knowledge Inject] 未找到相关知识")
			
 
				+            return None
			
 
				+
			
 
				+    except Exception as e:
			
 
				+        logger.warning(f"[Knowledge Inject] 知识注入失败: {e}")
			
 
				+        goal.knowledge = []
			
 
				+        return None
			
 
				+
			
 
				 
			
 
				 # ===== LLM 可调用的 goal 工具 =====
			
 
				 
			
@@ -47,9 +120,10 @@ async def goal(
 
				     if tree is None:
			
 
				         return "错误：GoalTree 未初始化"
			
 
				 
			
 
				-    # 从 context 获取 store 和 trace_id
			
 
				+    # 从 context 获取 store、trace_id 和 knowledge_config
			
 
				     store = context.get("store") if context else None
			
 
				     trace_id = context.get("trace_id") if context else None
			
 
				+    knowledge_config = context.get("knowledge_config") if context else None
			
 
				 
			
 
				     return await goal_tool(
			
 
				         tree=tree,
			
@@ -61,7 +135,8 @@ async def goal(
 
				         under=under,
			
 
				         done=done,
			
 
				         abandon=abandon,
			
 
				-        focus=focus
			
 
				+        focus=focus,
			
 
				+        knowledge_config=knowledge_config
			
 
				     )
			
 
				 
			
 
				 
			
@@ -79,6 +154,7 @@ async def goal_tool(
 
				     done: Optional[str] = None,
			
 
				     abandon: Optional[str] = None,
			
 
				     focus: Optional[str] = None,
			
 
				+    knowledge_config: Optional[object] = None,
			
 
				 ) -> str:
			
 
				     """
			
 
				     管理执行计划。
			
@@ -94,6 +170,7 @@ async def goal_tool(
 
				         done: 完成当前目标，值为 summary
			
 
				         abandon: 放弃当前目标，值为原因
			
 
				         focus: 切换焦点到指定 ID
			
 
				+        knowledge_config: 知识管理配置（KnowledgeConfig 对象）
			
 
				 
			
 
				     Returns:
			
 
				         更新后的计划状态文本
			
@@ -136,33 +213,9 @@ async def goal_tool(
 
				         changes.append(f"切换焦点: {display_id}. {goal.description}")
			
 
				 
			
 
				         # 自动注入知识
			
 
				-        try:
			
 
				-            from agent.tools.builtin.knowledge import knowledge_search
			
 
				-
			
 
				-            knowledge_result = await knowledge_search(
			
 
				-                query=goal.description,
			
 
				-                top_k=3,
			
 
				-                min_score=3,
			
 
				-                context=None
			
 
				-            )
			
 
				-
			
 
				-            # 将知识保存到 goal 对象
			
 
				-            if knowledge_result.metadata and knowledge_result.metadata.get("items"):
			
 
				-                goal.knowledge = knowledge_result.metadata["items"]
			
 
				-                knowledge_count = len(goal.knowledge)
			
 
				-                changes.append(f"📚 已注入 {knowledge_count} 条相关知识")
			
 
				-
			
 
				-                # 持久化到 store
			
 
				-                if store and trace_id:
			
 
				-                    await store.update_goal_tree(trace_id, tree)
			
 
				-            else:
			
 
				-                goal.knowledge = []
			
 
				-
			
 
				-        except Exception as e:
			
 
				-            # 知识注入失败不影响 focus 操作
			
 
				-            import logging
			
 
				-            logging.getLogger(__name__).warning(f"知识注入失败: {e}")
			
 
				-            goal.knowledge = []
			
 
				+        inject_msg = await inject_knowledge_for_goal(goal, tree, store, trace_id, knowledge_config)
			
 
				+        if inject_msg:
			
 
				+            changes.append(inject_msg)
			
 
				 
			
 
				     # 3. 处理 abandon（放弃当前目标）
			
 
				     if abandon is not None:
			
@@ -229,12 +282,6 @@ async def goal_tool(
 
				                 for goal in new_goals:
			
 
				                     await store.add_goal(trace_id, goal)
			
 
				 
			
 
				-            # 如果没有焦点且添加了目标，自动 focus 到第一个新目标
			
 
				-            if not tree.current_id and new_goals:
			
 
				-                tree.focus(new_goals[0].id)
			
 
				-                display_id = tree._generate_display_id(new_goals[0])
			
 
				-                changes.append(f"自动切换焦点: {display_id}")
			
 
				-
			
 
				     # 将完整内存树状态（含 current_id）同步到存储，
			
 
				     # 因为 store.add_goal / update_goal 各自从磁盘加载，不包含 focus 等内存变更
			
 
				     if store and trace_id and changes:
			
--- a/knowhub/docs/decisions.md
+++ b/knowhub/docs/decisions.md
@@ -196,3 +196,184 @@ Server 零 LLM 成本。
 
				 - 合并内容层的工程收益小于耦合成本
			
 
				 
			
 
				 **决策**：两个项目独立推进。唯一预留的接口：两边使用相同的 content hash 方案（sha256），未来如果整合，内容去重天然可行。等 KnowHub 验证"集体记忆"方向后再讨论整合。
			
 
				+
			
 
				+---
			
 
				+
			
 
				+## 13. 向量检索：Milvus Lite 单一存储架构
			
 
				+
			
 
				+**日期**：2026-03-09
			
 
				+
			
 
				+**背景**：现有检索方案使用 LLM 语义路由（gemini-2.0-flash-001），从所有知识中挑选候选。存在以下问题：
			
 
				+- 每次检索都需要调用 LLM，成本和延迟较高
			
 
				+- 无法利用向量相似度进行精确的语义匹配
			
 
				+- 难以支持大规模知识库（需要将所有知识元数据传给 LLM）
			
 
				+
			
 
				+**方案对比**：
			
 
				+
			
 
				+| 方案 | 部署复杂度 | 性能 | 功能完整性 | 迁移成本 |
			
 
				+|------|-----------|------|-----------|---------|
			
 
				+| sqlite-vec | 低（单文件） | 中 | 基础向量检索 | 低 |
			
 
				+| **Milvus Lite** | **低（pip install）** | **高** | **完整（标量过滤+向量检索）** | **中** |
			
 
				+| Qdrant | 中（需 Docker） | 高 | 完整 | 低 |
			
 
				+| 完整 Milvus | 高（多组件） | 极高 | 完整 | 高 |
			
 
				+
			
 
				+**决策**：采用 Milvus Lite 单一存储架构
			
 
				+
			
 
				+**为什么不用 SQLite + Milvus Lite 双存储？**
			
 
				+- Milvus Lite 支持标量字段存储，可以存储所有知识数据
			
 
				+- 维护两个数据库增加同步复杂度和一致性风险
			
 
				+- Milvus Lite 数据也是本地文件存储，备份和迁移同样简单
			
 
				+- 单一存储简化架构，降低维护成本
			
 
				+
			
 
				+**架构设计**：
			
 
				+
			
 
				+```
			
 
				+┌─────────────────────────────────────────────────────┐
			
 
				+│                   KnowHub Server                     │
			
 
				+├─────────────────────────────────────────────────────┤
			
 
				+│                                                      │
			
 
				+│              ┌─────────────────────┐                │
			
 
				+│              │   Milvus Lite       │                │
			
 
				+│              │   (单一存储)         │                │
			
 
				+│              ├─────────────────────┤                │
			
 
				+│              │ knowledge 集合       │                │
			
 
				+│              │ ├─ id (PK)          │                │
			
 
				+│              │ ├─ embedding (向量)  │                │
			
 
				+│              │ ├─ task             │                │
			
 
				+│              │ ├─ content          │                │
			
 
				+│              │ ├─ types (JSON)     │                │
			
 
				+│              │ ├─ tags (JSON)      │                │
			
 
				+│              │ ├─ scopes (JSON)    │                │
			
 
				+│              │ ├─ owner            │                │
			
 
				+│              │ ├─ resource_ids     │                │
			
 
				+│              │ ├─ source (JSON)    │                │
			
 
				+│              │ ├─ eval (JSON)      │                │
			
 
				+│              │ ├─ created_at       │                │
			
 
				+│              │ └─ updated_at       │                │
			
 
				+│              └─────────────────────┘                │
			
 
				+│                                                      │
			
 
				+│              向量索引：HNSW (COSINE)                  │
			
 
				+│              参数：M=16, efConstruction=200          │
			
 
				+│                                                      │
			
 
				+│  ┌──────────────────────────────────────────────┐  │
			
 
				+│  │           检索流程                            │  │
			
 
				+│  ├──────────────────────────────────────────────┤  │
			
 
				+│  │ 1. 向量召回：Milvus 检索 top 3*k 候选        │  │
			
 
				+│  │ 2. LLM 精排：Gemini 对候选重新排序           │  │
			
 
				+│  │ 3. Fallback：LLM 失败时直接返回向量 top k    │  │
			
 
				+│  └──────────────────────────────────────────────┘  │
			
 
				+└─────────────────────────────────────────────────────┘
			
 
				+```
			
 
				+
			
 
				+**检索流程**（向量召回 + LLM 精排）：
			
 
				+
			
 
				+```python
			
 
				+async def knowledge_search(query: str, filters: dict, top_k: int = 5):
			
 
				+    # 1. 生成查询向量
			
 
				+    query_embedding = await get_embedding(query)
			
 
				+
			
 
				+    # 2. 向量召回（快速、便宜）
			
 
				+    candidates = await milvus_store.search(
			
 
				+        embedding=query_embedding,
			
 
				+        filters=filters,  # types, owner, scopes
			
 
				+        limit=top_k * 3   # 召回 3*k 个候选
			
 
				+    )
			
 
				+
			
 
				+    # 3. LLM 精排（准确、贵）
			
 
				+    try:
			
 
				+        ranked = await llm_rerank(
			
 
				+            query=query,
			
 
				+            candidates=candidates,
			
 
				+            top_k=top_k
			
 
				+        )
			
 
				+        return ranked
			
 
				+    except Exception as e:
			
 
				+        # 4. Fallback：LLM 失败时直接返回向量 top k
			
 
				+        logger.warning(f"LLM rerank failed: {e}, fallback to vector top-k")
			
 
				+        return candidates[:top_k]
			
 
				+
			
 
				+async def llm_rerank(query: str, candidates: List[dict], top_k: int):
			
 
				+    """使用 LLM 对候选进行精排"""
			
 
				+    # 构造 prompt
			
 
				+    candidates_text = "\n".join([
			
 
				+        f"[{i+1}] ID: {c['id']}\nTask: {c['task']}\nContent: {c['content'][:200]}..."
			
 
				+        for i, c in enumerate(candidates)
			
 
				+    ])
			
 
				+
			
 
				+    prompt = f"""你是知识检索专家。根据用户查询，从候选知识中选出最相关的 {top_k} 条。
			
 
				+
			
 
				+用户查询："{query}"
			
 
				+
			
 
				+候选知识：
			
 
				+{candidates_text}
			
 
				+
			
 
				+请输出最相关的 {top_k} 个知识 ID，按相关性从高到低排序，用逗号分隔。
			
 
				+只输出 ID，不要其他内容。"""
			
 
				+
			
 
				+    response = await openrouter_llm_call(
			
 
				+        messages=[{"role": "user", "content": prompt}],
			
 
				+        model="google/gemini-2.5-flash-lite"
			
 
				+    )
			
 
				+
			
 
				+    # 解析 LLM 输出
			
 
				+    selected_ids = parse_ids(response["content"])
			
 
				+
			
 
				+    # 按 LLM 排序返回
			
 
				+    id_to_candidate = {c["id"]: c for c in candidates}
			
 
				+    return [id_to_candidate[id] for id in selected_ids if id in id_to_candidate]
			
 
				+```
			
 
				+
			
 
				+**Embedding 模型选择**：
			
 
				+
			
 
				+优先级：
			
 
				+1. **OpenAI text-embedding-3-small**（推荐）
			
 
				+   - 1536 维，性能好，成本低（$0.02/1M tokens）
			
 
				+   - 支持中英文
			
 
				+2. **本地模型**（备选）
			
 
				+   - paraphrase-multilingual-MiniLM-L12-v2
			
 
				+   - 零成本，但需要本地计算资源
			
 
				+
			
 
				+**成本分析**：
			
 
				+
			
 
				+假设 1000 条知识，每条平均 200 tokens：
			
 
				+
			
 
				+| 操作 | 旧方案（纯 LLM 路由） | 新方案（向量召回 + LLM 精排） |
			
 
				+|------|---------------------|---------------------------|
			
 
				+| 每次检索 | 200k tokens → $0.04 | 召回：0 成本<br>精排：3k tokens → $0.0006 |
			
 
				+| 1000 次检索 | $40 | $0.60 |
			
 
				+| 节省 | - | **98.5%** |
			
 
				+
			
 
				+**迁移路径**：
			
 
				+
			
 
				+阶段 1：实现 Milvus Lite 存储（2-3 周）
			
 
				+- 从 SQLite 迁移数据到 Milvus Lite
			
 
				+- 实现向量召回 + LLM 精排
			
 
				+- 保留旧 API 兼容性
			
 
				+
			
 
				+阶段 2：效果评估（1-2 个月）
			
 
				+- 对比新旧方案的准确率和成本
			
 
				+- 收集用户反馈
			
 
				+- 调优召回倍数（3*k）和精排策略
			
 
				+
			
 
				+阶段 3：可能的演进方向
			
 
				+- 方向 A：优化精排 prompt，提升准确率
			
 
				+- 方向 B：引入混合检索（向量 + 关键词）
			
 
				+- 方向 C：升级到完整 Milvus（如果数据量暴增）
			
 
				+
			
 
				+**实现位置**：
			
 
				+- Milvus 封装：`knowhub/vector_store.py`
			
 
				+- Embedding 生成：`knowhub/embeddings.py`
			
 
				+- 检索逻辑：`knowhub/server.py:knowledge_search`
			
 
				+- LLM 精排：`knowhub/server.py:llm_rerank`
			
 
				+
			
 
				+**优势**：
			
 
				+1. 单一存储，架构简单
			
 
				+2. 向量召回快速且便宜
			
 
				+3. LLM 精排保证准确性
			
 
				+4. Fallback 机制保证可用性
			
 
				+5. 成本降低 98.5%
			
 
				+
			
 
				+**权衡**：
			
 
				+1. 从 SQLite 迁移需要一次性工作
			
 
				+2. Milvus Lite 的标量查询不如 SQL 灵活（但够用）
			
 
				+3. 存储空间增加（向量数据）
			
--- a/knowhub/docs/knowledge-management.md
+++ b/knowhub/docs/knowledge-management.md
@@ -24,6 +24,43 @@ Agent                           KnowHub Server
 
				 └── resource 资源引用        →   GET /api/resource/{id}
			
 
				 ```
			
 
				 
			
 
				+### 存储架构
			
 
				+
			
 
				+KnowHub 采用 Milvus Lite 单一存储架构（详见 `knowhub/docs/decisions.md#13`）：
			
 
				+
			
 
				+```
			
 
				+┌─────────────────────────────────────────────────────┐
			
 
				+│                   KnowHub Server                     │
			
 
				+├─────────────────────────────────────────────────────┤
			
 
				+│                                                      │
			
 
				+│              ┌─────────────────────┐                │
			
 
				+│              │   Milvus Lite       │                │
			
 
				+│              │   (单一存储)         │                │
			
 
				+│              ├─────────────────────┤                │
			
 
				+│              │ knowledge 集合       │                │
			
 
				+│              │ - id                │                │
			
 
				+│              │ - embedding (向量)   │                │
			
 
				+│              │ - task/content      │                │
			
 
				+│              │ - types/tags/scopes │                │
			
 
				+│              │ - owner/eval/source │                │
			
 
				+│              │ - resource_ids      │                │
			
 
				+│              └─────────────────────┘                │
			
 
				+│                                                      │
			
 
				+│  检索流程：向量召回 → LLM 精排 → 返回 top k          │
			
 
				+└─────────────────────────────────────────────────────┘
			
 
				+```
			
 
				+
			
 
				+**Milvus Lite**：
			
 
				+- 存储完整知识数据（所有字段）+ 向量
			
 
				+- 提供高效的语义向量检索
			
 
				+- 支持标量字段过滤和查询
			
 
				+- 本地文件存储，部署简单
			
 
				+
			
 
				+实现位置：
			
 
				+- Milvus 封装：`knowhub/vector_store.py`
			
 
				+- Embedding 生成：`knowhub/embeddings.py`
			
 
				+- 检索逻辑：`knowhub/server.py:knowledge_search`
			
 
				+
			
 
				 ---
			
 
				 
			
 
				 ## 知识结构
			
@@ -415,25 +452,34 @@ return ToolResult(
 
				 
			
 
				 ### `GET /api/knowledge/search`
			
 
				 
			
 
				-检索知识。核心逻辑在 Server 实现。
			
 
				+检索知识。使用向量召回 + LLM 精排策略。
			
 
				 
			
 
				 **参数**：
			
 
				 - `q`: 查询文本
			
 
				 - `top_k`: 返回数量（默认 5）
			
 
				 - `min_score`: 最低评分过滤（默认 3）
			
 
				 - `types`: 按类型过滤（可选，逗号分隔）
			
 
				+- `owner`: 按所有者过滤（可选）
			
 
				 
			
 
				-**检索流程**（两阶段，Server 端实现）：
			
 
				+**检索流程**：
			
 
				 
			
 
				-1. **语义路由**：使用 LLM（gemini-2.0-flash-001）从所有知识中挑选 2*k 个语义相关的候选
			
 
				-   - 输入：query + 知识元数据（id, types, task 前 100 字符）
			
 
				-   - 输出：候选知识 ID 列表
			
 
				+1. **向量召回**（快速、便宜）
			
 
				+   - 生成查询向量（使用 OpenAI text-embedding-3-small 或本地模型）
			
 
				+   - Milvus Lite 检索语义相似的知识，召回 `top_k * 3` 个候选
			
 
				+   - 支持标量过滤（types、owner、scopes、min_score）
			
 
				 
			
 
				-2. **质量精排**：根据评分和反馈计算质量分，筛选最终的 k 个
			
 
				-   - 质量分公式：`quality_score = score + helpful - (harmful * 2.0)`
			
 
				-   - 过滤：`score < min_score` 或 `quality_score < 0` 的知识被剔除
			
 
				+2. **LLM 精排**（准确、贵）
			
 
				+   - 使用 LLM（gemini-2.5-flash-lite）对候选重新排序
			
 
				+   - 根据查询意图和知识内容，选出最相关的 `top_k` 条
			
 
				+   - 输出按相关性从高到低排序
			
 
				 
			
 
				-实现位置：`knowhub/server.py:knowledge_search`
			
 
				+3. **Fallback**（保证可用性）
			
 
				+   - 如果 LLM 精排失败或超时，直接返回向量召回的 `top_k` 结果
			
 
				+   - 保证检索始终可用
			
 
				+
			
 
				+实现位置：
			
 
				+- `knowhub/server.py:knowledge_search` - 主检索逻辑
			
 
				+- `knowhub/server.py:llm_rerank` - LLM 精排
			
 
				 
			
 
				 **响应**：
			
 
				 
			
@@ -451,11 +497,11 @@ return ToolResult(
 
				         "helpful": 2,
			
 
				         "harmful": 0,
			
 
				         "confidence": 0.9
			
 
				-      },
			
 
				-      "quality_score": 5.0
			
 
				+      }
			
 
				     }
			
 
				   ],
			
 
				-  "count": 3
			
 
				+  "count": 3,
			
 
				+  "reranked": true
			
 
				 }
			
 
				 ```
			
 
				 
			
--- a/knowhub/embeddings.py
+++ b/knowhub/embeddings.py
@@ -0,0 +1,87 @@
 
				+"""
			
 
				+Embedding 生成模块
			
 
				+
			
 
				+使用 OpenRouter 的 openai/text-embedding-3-small 模型生成向量。
			
 
				+支持单条和批量处理。
			
 
				+"""
			
 
				+
			
 
				+import os
			
 
				+import asyncio
			
 
				+from typing import List, Union
			
 
				+import httpx
			
 
				+
			
 
				+OPENROUTER_API_KEY = os.getenv("OPENROUTER_API_KEY")
			
 
				+OPENROUTER_BASE_URL = "https://openrouter.ai/api/v1"
			
 
				+EMBEDDING_MODEL = "openai/text-embedding-3-small"
			
 
				+EMBEDDING_DIM = 1536
			
 
				+
			
 
				+
			
 
				+async def get_embedding(text: str) -> List[float]:
			
 
				+    """
			
 
				+    生成单条文本的向量
			
 
				+
			
 
				+    Args:
			
 
				+        text: 输入文本
			
 
				+
			
 
				+    Returns:
			
 
				+        1536 维向量
			
 
				+    """
			
 
				+    embeddings = await get_embeddings_batch([text])
			
 
				+    return embeddings[0]
			
 
				+
			
 
				+
			
 
				+async def get_embeddings_batch(texts: List[str], batch_size: int = 100) -> List[List[float]]:
			
 
				+    """
			
 
				+    批量生成文本向量
			
 
				+
			
 
				+    Args:
			
 
				+        texts: 文本列表
			
 
				+        batch_size: 每批处理数量（OpenAI 限制 2048）
			
 
				+
			
 
				+    Returns:
			
 
				+        向量列表
			
 
				+    """
			
 
				+    if not texts:
			
 
				+        return []
			
 
				+
			
 
				+    # 分批处理
			
 
				+    all_embeddings = []
			
 
				+    for i in range(0, len(texts), batch_size):
			
 
				+        batch = texts[i:i + batch_size]
			
 
				+        embeddings = await _call_embedding_api(batch)
			
 
				+        all_embeddings.extend(embeddings)
			
 
				+
			
 
				+    return all_embeddings
			
 
				+
			
 
				+
			
 
				+async def _call_embedding_api(texts: List[str]) -> List[List[float]]:
			
 
				+    """
			
 
				+    调用 OpenRouter embedding API
			
 
				+
			
 
				+    Args:
			
 
				+        texts: 文本列表（单批）
			
 
				+
			
 
				+    Returns:
			
 
				+        向量列表
			
 
				+    """
			
 
				+    if not OPENROUTER_API_KEY:
			
 
				+        raise ValueError("OPENROUTER_API_KEY not set in environment")
			
 
				+
			
 
				+    async with httpx.AsyncClient(timeout=30.0) as client:
			
 
				+        response = await client.post(
			
 
				+            f"{OPENROUTER_BASE_URL}/embeddings",
			
 
				+            headers={
			
 
				+                "Authorization": f"Bearer {OPENROUTER_API_KEY}",
			
 
				+                "Content-Type": "application/json",
			
 
				+            },
			
 
				+            json={
			
 
				+                "model": EMBEDDING_MODEL,
			
 
				+                "input": texts,
			
 
				+            }
			
 
				+        )
			
 
				+        response.raise_for_status()
			
 
				+        data = response.json()
			
 
				+
			
 
				+        # 按 index 排序（API 可能乱序返回）
			
 
				+        embeddings_data = sorted(data["data"], key=lambda x: x["index"])
			
 
				+        return [item["embedding"] for item in embeddings_data]
			
--- a/knowhub/requirements.txt
+++ b/knowhub/requirements.txt
@@ -1,3 +1,8 @@
 
				 fastapi
			
 
				 uvicorn[standard]
			
 
				 pydantic
			
 
				+pymilvus
			
 
				+milvus
			
 
				+httpx
			
 
				+cryptography
			
 
				+python-dotenv
			
--- a/knowhub/server.py
+++ b/knowhub/server.py
@@ -2,7 +2,7 @@
 
				 KnowHub Server
			
 
				 
			
 
				 Agent 工具使用经验的共享平台。
			
 
				-FastAPI + SQLite，单文件部署。
			
 
				+FastAPI + Milvus Lite（知识）+ SQLite（资源），单文件部署。
			
 
				 """
			
 
				 
			
 
				 import os
			
@@ -11,6 +11,8 @@ import json
 
				 import sqlite3
			
 
				 import asyncio
			
 
				 import base64
			
 
				+import time
			
 
				+import uuid
			
 
				 from contextlib import asynccontextmanager
			
 
				 from datetime import datetime, timezone
			
 
				 from typing import Optional
			
@@ -31,6 +33,10 @@ load_dotenv(Path(__file__).parent.parent / ".env")
 
				 
			
 
				 from agent.llm.openrouter import openrouter_llm_call
			
 
				 
			
 
				+# 导入向量存储和 embedding
			
 
				+from knowhub.vector_store import MilvusStore
			
 
				+from knowhub.embeddings import get_embedding, get_embeddings_batch
			
 
				+
			
 
				 BRAND_NAME    = os.getenv("BRAND_NAME", "KnowHub")
			
 
				 BRAND_API_ENV = os.getenv("BRAND_API_ENV", "KNOWHUB_API")
			
 
				 BRAND_DB      = os.getenv("BRAND_DB", "knowhub.db")
			
@@ -45,6 +51,10 @@ if ORG_KEYS_RAW:
 
				             ORG_KEYS[org.strip()] = key_b64.strip()
			
 
				 
			
 
				 DB_PATH = Path(__file__).parent / BRAND_DB
			
 
				+MILVUS_DATA_DIR = Path(__file__).parent / "milvus_data"
			
 
				+
			
 
				+# 全局 Milvus 存储实例
			
 
				+milvus_store: Optional[MilvusStore] = None
			
 
				 
			
 
				 # --- 数据库 ---
			
 
				 
			
@@ -127,6 +137,7 @@ def decrypt_content(resource_id: str, encrypted_text: str, provided_key: Optiona
 
				 
			
 
				 
			
 
				 def init_db():
			
 
				+    """初始化 SQLite（仅用于 resources）"""
			
 
				     conn = get_db()
			
 
				     conn.execute("""
			
 
				         CREATE TABLE IF NOT EXISTS experiences (
			
@@ -160,28 +171,6 @@ def init_db():
 
				         )
			
 
				     """)
			
 
				 
			
 
				-    conn.execute("""
			
 
				-        CREATE TABLE IF NOT EXISTS knowledge (
			
 
				-            id            TEXT PRIMARY KEY,
			
 
				-            message_id    TEXT DEFAULT '',
			
 
				-            types         TEXT NOT NULL,              -- JSON array: ["strategy", "tool"]
			
 
				-            task          TEXT NOT NULL,
			
 
				-            tags          TEXT DEFAULT '{}',          -- JSON object: {"category": "...", "domain": "..."}
			
 
				-            scopes        TEXT DEFAULT '["org:cybertogether"]',  -- JSON array
			
 
				-            owner         TEXT DEFAULT '',
			
 
				-            content       TEXT NOT NULL,
			
 
				-            resource_ids  TEXT DEFAULT '[]',          -- JSON array: ["code/selenium/login", "credentials/website"]
			
 
				-            source        TEXT DEFAULT '{}',          -- JSON object: {name, category, urls, agent_id, submitted_by, timestamp}
			
 
				-            eval          TEXT DEFAULT '{}',          -- JSON object: {score, helpful, harmful, confidence, histories}
			
 
				-            created_at    TEXT NOT NULL,
			
 
				-            updated_at    TEXT DEFAULT ''
			
 
				-        )
			
 
				-    """)
			
 
				-    conn.execute("CREATE INDEX IF NOT EXISTS idx_knowledge_types ON knowledge(types)")
			
 
				-    conn.execute("CREATE INDEX IF NOT EXISTS idx_knowledge_task ON knowledge(task)")
			
 
				-    conn.execute("CREATE INDEX IF NOT EXISTS idx_knowledge_owner ON knowledge(owner)")
			
 
				-    conn.execute("CREATE INDEX IF NOT EXISTS idx_knowledge_scopes ON knowledge(scopes)")
			
 
				-
			
 
				     conn.commit()
			
 
				     conn.close()
			
 
				 
			
@@ -294,9 +283,18 @@ class ResourceOut(BaseModel):
 
				 
			
 
				 @asynccontextmanager
			
 
				 async def lifespan(app: FastAPI):
			
 
				+    global milvus_store
			
 
				+
			
 
				+    # 初始化 SQLite（resources）
			
 
				     init_db()
			
 
				+
			
 
				+    # 初始化 Milvus Lite（knowledge）
			
 
				+    milvus_store = MilvusStore(data_dir=str(MILVUS_DATA_DIR))
			
 
				+
			
 
				     yield
			
 
				 
			
 
				+    # 清理（Milvus Lite 会自动处理）
			
 
				+
			
 
				 
			
 
				 app = FastAPI(title=BRAND_NAME, lifespan=lifespan)
			
 
				 
			
@@ -498,181 +496,58 @@ def list_resources(
 
				 
			
 
				 # ===== Knowledge API =====
			
 
				 
			
 
				-# 两阶段检索逻辑
			
 
				-async def _route_knowledge_by_llm(query_text: str, metadata_list: list[dict], k: int = 5) -> list[str]:
			
 
				+async def _llm_rerank(query: str, candidates: list[dict], top_k: int) -> list[str]:
			
 
				     """
			
 
				-    第一阶段：语义路由。
			
 
				-    让 LLM 挑选出 2*k 个语义相关的 ID。
			
 
				+    使用 LLM 对候选知识进行精排
			
 
				+
			
 
				+    Args:
			
 
				+        query: 查询文本
			
 
				+        candidates: 候选知识列表
			
 
				+        top_k: 返回数量
			
 
				+
			
 
				+    Returns:
			
 
				+        排序后的知识 ID 列表
			
 
				     """
			
 
				-    if not metadata_list:
			
 
				+    if not candidates:
			
 
				         return []
			
 
				 
			
 
				-    routing_k = k * 2
			
 
				+    # 构造 prompt
			
 
				+    candidates_text = "\n".join([
			
 
				+        f"[{i+1}] ID: {c['id']}\nTask: {c['task']}\nContent: {c['content'][:200]}..."
			
 
				+        for i, c in enumerate(candidates)
			
 
				+    ])
			
 
				 
			
 
				-    routing_data = [
			
 
				-        {
			
 
				-            "id": m["id"],
			
 
				-            "types": m["types"],
			
 
				-            "task": m["task"][:100]
			
 
				-        } for m in metadata_list
			
 
				-    ]
			
 
				+    prompt = f"""你是知识检索专家。根据用户查询，从候选知识中选出最相关的 {top_k} 条。
			
 
				 
			
 
				-    prompt = f"""
			
 
				-你是一个知识检索专家。根据用户的当前任务需求，从下列原子知识元数据中挑选出最相关的最多 {routing_k} 个知识 ID。
			
 
				-任务需求："{query_text}"
			
 
				+用户查询："{query}"
			
 
				 
			
 
				-可选知识列表：
			
 
				-{json.dumps(routing_data, ensure_ascii=False, indent=1)}
			
 
				+候选知识：
			
 
				+{candidates_text}
			
 
				 
			
 
				-请直接输出 ID 列表，用逗号分隔（例如: knowledge-20260302-001, research-20260302-002）。若无相关项请输出 "None"。
			
 
				-"""
			
 
				+请输出最相关的 {top_k} 个知识 ID，按相关性从高到低排序，用逗号分隔。
			
 
				+只输出 ID，不要其他内容。"""
			
 
				 
			
 
				     try:
			
 
				-        print(f"\n[Step 1: 知识语义路由] 任务: '{query_text}' | 候选总数: {len(metadata_list)} | 目标提取数: {routing_k}")
			
 
				-
			
 
				         response = await openrouter_llm_call(
			
 
				             messages=[{"role": "user", "content": prompt}],
			
 
				             model="google/gemini-2.5-flash-lite"
			
 
				         )
			
 
				 
			
 
				         content = response.get("content", "").strip()
			
 
				-        selected_ids = [idx.strip() for idx in re.split(r'[,\s]+', content) if idx.strip().startswith(("knowledge-", "research-"))]
			
 
				+        # 解析 ID 列表
			
 
				+        selected_ids = [
			
 
				+            idx.strip()
			
 
				+            for idx in re.split(r'[,\s]+', content)
			
 
				+            if idx.strip().startswith(("knowledge-", "research-"))
			
 
				+        ]
			
 
				+
			
 
				+        return selected_ids[:top_k]
			
 
				 
			
 
				-        print(f"[Step 1: 知识语义路由] LLM 初选 ID ({len(selected_ids)}个): {selected_ids}")
			
 
				-        return selected_ids
			
 
				     except Exception as e:
			
 
				-        print(f"LLM 知识路由失败: {e}")
			
 
				+        print(f"[LLM Rerank] 失败: {e}")
			
 
				         return []
			
 
				 
			
 
				 
			
 
				-async def _search_knowledge_two_stage(
			
 
				-    query_text: str,
			
 
				-    top_k: int = 5,
			
 
				-    min_score: int = 3,
			
 
				-    types_filter: Optional[list[str]] = None,
			
 
				-    owner_filter: Optional[str] = None,
			
 
				-    conn: sqlite3.Connection = None
			
 
				-) -> list[dict]:
			
 
				-    """
			
 
				-    两阶段检索：语义路由 + 质量精排
			
 
				-    """
			
 
				-    if conn is None:
			
 
				-        conn = get_db()
			
 
				-        should_close = True
			
 
				-    else:
			
 
				-        should_close = False
			
 
				-
			
 
				-    try:
			
 
				-        # 阶段 1: 解析所有知识
			
 
				-        query = "SELECT * FROM knowledge"
			
 
				-        rows = conn.execute(query).fetchall()
			
 
				-
			
 
				-        if not rows:
			
 
				-            return []
			
 
				-
			
 
				-        content_map = {}
			
 
				-        metadata_list = []
			
 
				-
			
 
				-        for row in rows:
			
 
				-            kid = row["id"]
			
 
				-            types = json.loads(row["types"])
			
 
				-
			
 
				-            # 标签过滤
			
 
				-            if types_filter:
			
 
				-                if not any(t in types for t in types_filter):
			
 
				-                    continue
			
 
				-
			
 
				-            # owner 过滤
			
 
				-            if owner_filter and row["owner"] != owner_filter:
			
 
				-                continue
			
 
				-
			
 
				-            task = row["task"]
			
 
				-            content_text = row["content"]
			
 
				-            eval_data = json.loads(row["eval"])
			
 
				-            source = json.loads(row["source"])
			
 
				-
			
 
				-            meta_item = {
			
 
				-                "id": kid,
			
 
				-                "types": types,
			
 
				-                "task": task,
			
 
				-                "score": eval_data.get("score", 3),
			
 
				-                "helpful": eval_data.get("helpful", 0),
			
 
				-                "harmful": eval_data.get("harmful", 0),
			
 
				-            }
			
 
				-            metadata_list.append(meta_item)
			
 
				-            content_map[kid] = {
			
 
				-                "task": task,
			
 
				-                "content": content_text,
			
 
				-                "types": types,
			
 
				-                "tags": json.loads(row["tags"]),
			
 
				-                "scopes": json.loads(row["scopes"]),
			
 
				-                "owner": row["owner"],
			
 
				-                "score": meta_item["score"],
			
 
				-                "helpful": meta_item["helpful"],
			
 
				-                "harmful": meta_item["harmful"],
			
 
				-                "message_id": row["message_id"],
			
 
				-                "source": source,
			
 
				-                "eval": eval_data,
			
 
				-                "created_at": row["created_at"],
			
 
				-                "updated_at": row["updated_at"]
			
 
				-            }
			
 
				-
			
 
				-        if not metadata_list:
			
 
				-            return []
			
 
				-
			
 
				-        # 阶段 2: 语义路由 (取 2*k)
			
 
				-        candidate_ids = await _route_knowledge_by_llm(query_text, metadata_list, k=top_k)
			
 
				-
			
 
				-        # 阶段 3: 质量精排
			
 
				-        print(f"[Step 2: 知识质量精排] 正在根据评分和反馈进行打分...")
			
 
				-        scored_items = []
			
 
				-
			
 
				-        for kid in candidate_ids:
			
 
				-            if kid in content_map:
			
 
				-                item = content_map[kid]
			
 
				-                score = item["score"]
			
 
				-                helpful = item["helpful"]
			
 
				-                harmful = item["harmful"]
			
 
				-
			
 
				-                # 计算综合分：基础分 + helpful - harmful*2
			
 
				-                quality_score = score + helpful - (harmful * 2.0)
			
 
				-
			
 
				-                # 过滤门槛
			
 
				-                if score < min_score or quality_score < 0:
			
 
				-                    print(f"  - 剔除低质量知识: {kid} (Score: {score}, Helpful: {helpful}, Harmful: {harmful})")
			
 
				-                    continue
			
 
				-
			
 
				-                scored_items.append({
			
 
				-                    "id": kid,
			
 
				-                    "message_id": item["message_id"],
			
 
				-                    "types": item["types"],
			
 
				-                    "task": item["task"],
			
 
				-                    "tags": item["tags"],
			
 
				-                    "scopes": item["scopes"],
			
 
				-                    "owner": item["owner"],
			
 
				-                    "content": item["content"],
			
 
				-                    "source": item["source"],
			
 
				-                    "eval": item["eval"],
			
 
				-                    "quality_score": quality_score,
			
 
				-                    "created_at": item["created_at"],
			
 
				-                    "updated_at": item["updated_at"]
			
 
				-                })
			
 
				-
			
 
				-        # 按照质量分排序
			
 
				-        final_sorted = sorted(scored_items, key=lambda x: x["quality_score"], reverse=True)
			
 
				-
			
 
				-        # 截取最终的 top_k
			
 
				-        result = final_sorted[:top_k]
			
 
				-
			
 
				-        print(f"[Step 2: 知识质量精排] 最终选定知识: {[it['id'] for it in result]}")
			
 
				-        print(f"[Knowledge System] 检索结束。\n")
			
 
				-        return result
			
 
				-
			
 
				-    finally:
			
 
				-        if should_close:
			
 
				-            conn.close()
			
 
				-
			
 
				-
			
 
				 @app.get("/api/knowledge/search")
			
 
				 async def search_knowledge_api(
			
 
				     q: str = Query(..., description="查询文本"),
			
@@ -681,37 +556,64 @@ async def search_knowledge_api(
 
				     types: Optional[str] = None,
			
 
				     owner: Optional[str] = None
			
 
				 ):
			
 
				-    """检索知识（两阶段：语义路由 + 质量精排）"""
			
 
				-    conn = get_db()
			
 
				+    """检索知识（向量召回 + LLM 精排）"""
			
 
				     try:
			
 
				-        types_filter = types.split(",") if types else None
			
 
				-
			
 
				-        results = await _search_knowledge_two_stage(
			
 
				-            query_text=q,
			
 
				-            top_k=top_k,
			
 
				-            min_score=min_score,
			
 
				-            types_filter=types_filter,
			
 
				-            owner_filter=owner,
			
 
				-            conn=conn
			
 
				+        # 1. 生成查询向量
			
 
				+        query_embedding = await get_embedding(q)
			
 
				+
			
 
				+        # 2. 构建过滤表达式
			
 
				+        filters = []
			
 
				+        if types:
			
 
				+            type_list = [t.strip() for t in types.split(',') if t.strip()]
			
 
				+            for t in type_list:
			
 
				+                filters.append(f'JSON_CONTAINS(types, "{t}")')
			
 
				+        if owner:
			
 
				+            filters.append(f'owner == "{owner}"')
			
 
				+
			
 
				+        # 添加 min_score 过滤
			
 
				+        filters.append(f'JSON_EXTRACT(eval, "$.score") >= {min_score}')
			
 
				+
			
 
				+        filter_expr = ' and '.join(filters) if filters else None
			
 
				+
			
 
				+        # 3. 向量召回（3*k 个候选）
			
 
				+        recall_limit = top_k * 3
			
 
				+        candidates = milvus_store.search(
			
 
				+            query_embedding=query_embedding,
			
 
				+            filters=filter_expr,
			
 
				+            limit=recall_limit
			
 
				         )
			
 
				 
			
 
				-        return {"results": results, "count": len(results)}
			
 
				-    finally:
			
 
				-        conn.close()
			
 
				+        if not candidates:
			
 
				+            return {"results": [], "count": 0, "reranked": False}
			
 
				+
			
 
				+        # 4. LLM 精排
			
 
				+        reranked_ids = await _llm_rerank(q, candidates, top_k)
			
 
				+
			
 
				+        if reranked_ids:
			
 
				+            # 按 LLM 排序返回
			
 
				+            id_to_candidate = {c["id"]: c for c in candidates}
			
 
				+            results = [id_to_candidate[id] for id in reranked_ids if id in id_to_candidate]
			
 
				+            return {"results": results, "count": len(results), "reranked": True}
			
 
				+        else:
			
 
				+            # Fallback：直接返回向量召回的 top k
			
 
				+            print(f"[Knowledge Search] LLM 精排失败，fallback 到向量 top-{top_k}")
			
 
				+            return {"results": candidates[:top_k], "count": len(candidates[:top_k]), "reranked": False}
			
 
				+
			
 
				+    except Exception as e:
			
 
				+        print(f"[Knowledge Search] 错误: {e}")
			
 
				+        raise HTTPException(status_code=500, detail=str(e))
			
 
				 
			
 
				 
			
 
				 @app.post("/api/knowledge", status_code=201)
			
 
				-def save_knowledge(knowledge: KnowledgeIn):
			
 
				+async def save_knowledge(knowledge: KnowledgeIn):
			
 
				     """保存新知识"""
			
 
				-    import uuid
			
 
				-    conn = get_db()
			
 
				     try:
			
 
				         # 生成 ID
			
 
				         timestamp = datetime.now().strftime('%Y%m%d-%H%M%S')
			
 
				         random_suffix = uuid.uuid4().hex[:4]
			
 
				         knowledge_id = f"knowledge-{timestamp}-{random_suffix}"
			
 
				 
			
 
				-        now = datetime.now(timezone.utc).isoformat()
			
 
				+        now = int(time.time())
			
 
				 
			
 
				         # 设置默认值
			
 
				         owner = knowledge.owner or f"agent:{knowledge.source.get('agent_id', 'unknown')}"
			
@@ -723,7 +625,7 @@ def save_knowledge(knowledge: KnowledgeIn):
 
				             "urls": knowledge.source.get("urls", []),
			
 
				             "agent_id": knowledge.source.get("agent_id", "unknown"),
			
 
				             "submitted_by": knowledge.source.get("submitted_by", ""),
			
 
				-            "timestamp": now,
			
 
				+            "timestamp": datetime.now(timezone.utc).isoformat(),
			
 
				             "message_id": knowledge.message_id
			
 
				         }
			
 
				 
			
@@ -737,31 +639,33 @@ def save_knowledge(knowledge: KnowledgeIn):
 
				             "harmful_history": []
			
 
				         }
			
 
				 
			
 
				-        conn.execute(
			
 
				-            """INSERT INTO knowledge
			
 
				-            (id, message_id, types, task, tags, scopes, owner, content,
			
 
				-             resource_ids, source, eval, created_at, updated_at)
			
 
				-            VALUES (?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?)""",
			
 
				-            (
			
 
				-                knowledge_id,
			
 
				-                knowledge.message_id,
			
 
				-                json.dumps(knowledge.types),
			
 
				-                knowledge.task,
			
 
				-                json.dumps(knowledge.tags),
			
 
				-                json.dumps(knowledge.scopes),
			
 
				-                owner,
			
 
				-                knowledge.content,
			
 
				-                json.dumps(knowledge.resource_ids),
			
 
				-                json.dumps(source),
			
 
				-                json.dumps(eval_data),
			
 
				-                now,
			
 
				-                now,
			
 
				-            ),
			
 
				-        )
			
 
				-        conn.commit()
			
 
				+        # 生成向量
			
 
				+        text = f"{knowledge.task}\n{knowledge.content}"
			
 
				+        embedding = await get_embedding(text)
			
 
				+
			
 
				+        # 插入 Milvus
			
 
				+        milvus_store.insert({
			
 
				+            "id": knowledge_id,
			
 
				+            "embedding": embedding,
			
 
				+            "message_id": knowledge.message_id,
			
 
				+            "task": knowledge.task,
			
 
				+            "content": knowledge.content,
			
 
				+            "types": knowledge.types,
			
 
				+            "tags": knowledge.tags,
			
 
				+            "scopes": knowledge.scopes,
			
 
				+            "owner": owner,
			
 
				+            "resource_ids": knowledge.resource_ids,
			
 
				+            "source": source,
			
 
				+            "eval": eval_data,
			
 
				+            "created_at": now,
			
 
				+            "updated_at": now,
			
 
				+        })
			
 
				+
			
 
				         return {"status": "ok", "knowledge_id": knowledge_id}
			
 
				-    finally:
			
 
				-        conn.close()
			
 
				+
			
 
				+    except Exception as e:
			
 
				+        print(f"[Save Knowledge] 错误: {e}")
			
 
				+        raise HTTPException(status_code=500, detail=str(e))
			
 
				 
			
 
				 
			
 
				 @app.get("/api/knowledge")
			
@@ -773,112 +677,78 @@ def list_knowledge(
 
				     tags: Optional[str] = None
			
 
				 ):
			
 
				     """列出知识（支持后端筛选）"""
			
 
				-    conn = get_db()
			
 
				     try:
			
 
				-        query = "SELECT * FROM knowledge"
			
 
				-        params = []
			
 
				-        conditions = []
			
 
				+        # 构建过滤表达式
			
 
				+        filters = []
			
 
				 
			
 
				         # types 支持多个，用 AND 连接（交集：必须同时包含所有选中的type）
			
 
				         if types:
			
 
				             type_list = [t.strip() for t in types.split(',') if t.strip()]
			
 
				-            if type_list:
			
 
				-                for t in type_list:
			
 
				-                    conditions.append("types LIKE ?")
			
 
				-                    params.append(f"%{t}%")
			
 
				+            for t in type_list:
			
 
				+                filters.append(f'JSON_CONTAINS(types, "{t}")')
			
 
				 
			
 
				         if scopes:
			
 
				-            conditions.append("scopes LIKE ?")
			
 
				-            params.append(f"%{scopes}%")
			
 
				+            filters.append(f'JSON_CONTAINS(scopes, "{scopes}")')
			
 
				 
			
 
				         if owner:
			
 
				-            conditions.append("owner LIKE ?")
			
 
				-            params.append(f"%{owner}%")
			
 
				+            filters.append(f'owner like "%{owner}%"')
			
 
				 
			
 
				         # tags 支持多个，用 AND 连接（交集：必须同时包含所有选中的tag）
			
 
				         if tags:
			
 
				             tag_list = [t.strip() for t in tags.split(',') if t.strip()]
			
 
				-            if tag_list:
			
 
				-                for t in tag_list:
			
 
				-                    conditions.append("tags LIKE ?")
			
 
				-                    params.append(f"%{t}%")
			
 
				-
			
 
				-        if conditions:
			
 
				-            query += " WHERE " + " AND ".join(conditions)
			
 
				+            for t in tag_list:
			
 
				+                filters.append(f'JSON_CONTAINS_ANY(tags, ["{t}"])')
			
 
				 
			
 
				-        query += " ORDER BY created_at DESC LIMIT ?"
			
 
				-        params.append(limit)
			
 
				+        # 如果没有过滤条件，查询所有
			
 
				+        filter_expr = ' and '.join(filters) if filters else 'id != ""'
			
 
				 
			
 
				-        rows = conn.execute(query, params).fetchall()
			
 
				-
			
 
				-        results = []
			
 
				-        for row in rows:
			
 
				-            results.append({
			
 
				-                "id": row["id"],
			
 
				-                "message_id": row["message_id"],
			
 
				-                "types": json.loads(row["types"]),
			
 
				-                "task": row["task"],
			
 
				-                "tags": json.loads(row["tags"]),
			
 
				-                "scopes": json.loads(row["scopes"]),
			
 
				-                "owner": row["owner"],
			
 
				-                "content": row["content"],
			
 
				-                "source": json.loads(row["source"]),
			
 
				-                "eval": json.loads(row["eval"]),
			
 
				-                "created_at": row["created_at"],
			
 
				-                "updated_at": row["updated_at"]
			
 
				-            })
			
 
				+        # 查询 Milvus
			
 
				+        results = milvus_store.query(filter_expr, limit=limit)
			
 
				 
			
 
				         return {"results": results, "count": len(results)}
			
 
				-    finally:
			
 
				-        conn.close()
			
 
				+
			
 
				+    except Exception as e:
			
 
				+        print(f"[List Knowledge] 错误: {e}")
			
 
				+        raise HTTPException(status_code=500, detail=str(e))
			
 
				 
			
 
				 
			
 
				 @app.get("/api/knowledge/meta/tags")
			
 
				 def get_all_tags():
			
 
				     """获取所有已有的 tags"""
			
 
				-    conn = get_db()
			
 
				     try:
			
 
				-        rows = conn.execute("SELECT tags FROM knowledge").fetchall()
			
 
				+        # 查询所有知识
			
 
				+        results = milvus_store.query('id != ""', limit=10000)
			
 
				+
			
 
				         all_tags = set()
			
 
				-        for row in rows:
			
 
				-            tags_dict = json.loads(row["tags"])
			
 
				-            for key in tags_dict.keys():
			
 
				-                all_tags.add(key)
			
 
				+        for item in results:
			
 
				+            tags_dict = item.get("tags", {})
			
 
				+            if isinstance(tags_dict, dict):
			
 
				+                for key in tags_dict.keys():
			
 
				+                    all_tags.add(key)
			
 
				+
			
 
				         return {"tags": sorted(list(all_tags))}
			
 
				-    finally:
			
 
				-        conn.close()
			
 
				+
			
 
				+    except Exception as e:
			
 
				+        print(f"[Get Tags] 错误: {e}")
			
 
				+        raise HTTPException(status_code=500, detail=str(e))
			
 
				 
			
 
				 
			
 
				 @app.get("/api/knowledge/{knowledge_id}")
			
 
				 def get_knowledge(knowledge_id: str):
			
 
				     """获取单条知识"""
			
 
				-    conn = get_db()
			
 
				     try:
			
 
				-        row = conn.execute(
			
 
				-            "SELECT * FROM knowledge WHERE id = ?",
			
 
				-            (knowledge_id,)
			
 
				-        ).fetchone()
			
 
				+        result = milvus_store.get_by_id(knowledge_id)
			
 
				 
			
 
				-        if not row:
			
 
				+        if not result:
			
 
				             raise HTTPException(status_code=404, detail=f"Knowledge not found: {knowledge_id}")
			
 
				 
			
 
				-        return {
			
 
				-            "id": row["id"],
			
 
				-            "message_id": row["message_id"],
			
 
				-            "types": json.loads(row["types"]),
			
 
				-            "task": row["task"],
			
 
				-            "tags": json.loads(row["tags"]),
			
 
				-            "scopes": json.loads(row["scopes"]),
			
 
				-            "owner": row["owner"],
			
 
				-            "content": row["content"],
			
 
				-            "resource_ids": json.loads(row["resource_ids"]),
			
 
				-            "source": json.loads(row["source"]),
			
 
				-            "eval": json.loads(row["eval"]),
			
 
				-            "created_at": row["created_at"],
			
 
				-            "updated_at": row["updated_at"]
			
 
				-        }
			
 
				-    finally:
			
 
				-        conn.close()
			
 
				+        return result
			
 
				+
			
 
				+    except HTTPException:
			
 
				+        raise
			
 
				+    except Exception as e:
			
 
				+        print(f"[Get Knowledge] 错误: {e}")
			
 
				+        raise HTTPException(status_code=500, detail=str(e))
			
 
				 
			
 
				 
			
 
				 async def _evolve_knowledge_with_llm(old_content: str, feedback: str) -> str:
			
@@ -914,14 +784,13 @@ async def _evolve_knowledge_with_llm(old_content: str, feedback: str) -> str:
 
				 @app.put("/api/knowledge/{knowledge_id}")
			
 
				 async def update_knowledge(knowledge_id: str, update: KnowledgeUpdateIn):
			
 
				     """更新知识评估，支持知识进化"""
			
 
				-    conn = get_db()
			
 
				     try:
			
 
				-        row = conn.execute("SELECT * FROM knowledge WHERE id = ?", (knowledge_id,)).fetchone()
			
 
				-        if not row:
			
 
				+        # 获取现有知识
			
 
				+        existing = milvus_store.get_by_id(knowledge_id)
			
 
				+        if not existing:
			
 
				             raise HTTPException(status_code=404, detail=f"Knowledge not found: {knowledge_id}")
			
 
				 
			
 
				-        now = datetime.now(timezone.utc).isoformat()
			
 
				-        eval_data = json.loads(row["eval"])
			
 
				+        eval_data = existing.get("eval", {})
			
 
				 
			
 
				         # 更新评分
			
 
				         if update.update_score is not None:
			
@@ -942,69 +811,91 @@ async def update_knowledge(knowledge_id: str, update: KnowledgeUpdateIn):
 
				             eval_data["harmful_history"].append(update.add_harmful_case)
			
 
				 
			
 
				         # 知识进化
			
 
				-        content = row["content"]
			
 
				+        content = existing["content"]
			
 
				+        need_reembed = False
			
 
				+
			
 
				         if update.evolve_feedback:
			
 
				             content = await _evolve_knowledge_with_llm(content, update.evolve_feedback)
			
 
				             eval_data["helpful"] = eval_data.get("helpful", 0) + 1
			
 
				+            need_reembed = True
			
 
				 
			
 
				-        # 更新数据库
			
 
				-        conn.execute(
			
 
				-            "UPDATE knowledge SET content = ?, eval = ?, updated_at = ? WHERE id = ?",
			
 
				-            (content, json.dumps(eval_data, ensure_ascii=False), now, knowledge_id)
			
 
				-        )
			
 
				-        conn.commit()
			
 
				+        # 准备更新数据
			
 
				+        updates = {
			
 
				+            "content": content,
			
 
				+            "eval": eval_data,
			
 
				+        }
			
 
				+
			
 
				+        # 如果内容变化，重新生成向量
			
 
				+        if need_reembed:
			
 
				+            text = f"{existing['task']}\n{content}"
			
 
				+            embedding = await get_embedding(text)
			
 
				+            updates["embedding"] = embedding
			
 
				+
			
 
				+        # 更新 Milvus
			
 
				+        milvus_store.update(knowledge_id, updates)
			
 
				 
			
 
				         return {"status": "ok", "knowledge_id": knowledge_id}
			
 
				-    finally:
			
 
				-        conn.close()
			
 
				+
			
 
				+    except HTTPException:
			
 
				+        raise
			
 
				+    except Exception as e:
			
 
				+        print(f"[Update Knowledge] 错误: {e}")
			
 
				+        raise HTTPException(status_code=500, detail=str(e))
			
 
				 
			
 
				 
			
 
				 @app.patch("/api/knowledge/{knowledge_id}")
			
 
				-def patch_knowledge(knowledge_id: str, patch: KnowledgePatchIn):
			
 
				+async def patch_knowledge(knowledge_id: str, patch: KnowledgePatchIn):
			
 
				     """直接编辑知识字段"""
			
 
				-    conn = get_db()
			
 
				     try:
			
 
				-        row = conn.execute("SELECT * FROM knowledge WHERE id = ?", (knowledge_id,)).fetchone()
			
 
				-        if not row:
			
 
				+        # 获取现有知识
			
 
				+        existing = milvus_store.get_by_id(knowledge_id)
			
 
				+        if not existing:
			
 
				             raise HTTPException(status_code=404, detail=f"Knowledge not found: {knowledge_id}")
			
 
				 
			
 
				-        updates = []
			
 
				-        params = []
			
 
				+        updates = {}
			
 
				+        need_reembed = False
			
 
				 
			
 
				         if patch.task is not None:
			
 
				-            updates.append("task = ?")
			
 
				-            params.append(patch.task)
			
 
				+            updates["task"] = patch.task
			
 
				+            need_reembed = True
			
 
				+
			
 
				         if patch.content is not None:
			
 
				-            updates.append("content = ?")
			
 
				-            params.append(patch.content)
			
 
				+            updates["content"] = patch.content
			
 
				+            need_reembed = True
			
 
				+
			
 
				         if patch.types is not None:
			
 
				-            updates.append("types = ?")
			
 
				-            params.append(json.dumps(patch.types, ensure_ascii=False))
			
 
				+            updates["types"] = patch.types
			
 
				+
			
 
				         if patch.tags is not None:
			
 
				-            updates.append("tags = ?")
			
 
				-            params.append(json.dumps(patch.tags, ensure_ascii=False))
			
 
				+            updates["tags"] = patch.tags
			
 
				+
			
 
				         if patch.scopes is not None:
			
 
				-            updates.append("scopes = ?")
			
 
				-            params.append(json.dumps(patch.scopes, ensure_ascii=False))
			
 
				+            updates["scopes"] = patch.scopes
			
 
				+
			
 
				         if patch.owner is not None:
			
 
				-            updates.append("owner = ?")
			
 
				-            params.append(patch.owner)
			
 
				+            updates["owner"] = patch.owner
			
 
				 
			
 
				         if not updates:
			
 
				             return {"status": "ok", "knowledge_id": knowledge_id}
			
 
				 
			
 
				-        now = datetime.now(timezone.utc).isoformat()
			
 
				-        updates.append("updated_at = ?")
			
 
				-        params.append(now)
			
 
				-        params.append(knowledge_id)
			
 
				+        # 如果 task 或 content 变化，重新生成向量
			
 
				+        if need_reembed:
			
 
				+            task = updates.get("task", existing["task"])
			
 
				+            content = updates.get("content", existing["content"])
			
 
				+            text = f"{task}\n{content}"
			
 
				+            embedding = await get_embedding(text)
			
 
				+            updates["embedding"] = embedding
			
 
				 
			
 
				-        query = f"UPDATE knowledge SET {', '.join(updates)} WHERE id = ?"
			
 
				-        conn.execute(query, params)
			
 
				-        conn.commit()
			
 
				+        # 更新 Milvus
			
 
				+        milvus_store.update(knowledge_id, updates)
			
 
				 
			
 
				         return {"status": "ok", "knowledge_id": knowledge_id}
			
 
				-    finally:
			
 
				-        conn.close()
			
 
				+
			
 
				+    except HTTPException:
			
 
				+        raise
			
 
				+    except Exception as e:
			
 
				+        print(f"[Patch Knowledge] 错误: {e}")
			
 
				+        raise HTTPException(status_code=500, detail=str(e))
			
 
				 
			
 
				 
			
 
				 @app.post("/api/knowledge/batch_update")
			
@@ -1013,7 +904,6 @@ async def batch_update_knowledge(batch: KnowledgeBatchUpdateIn):
 
				     if not batch.feedback_list:
			
 
				         return {"status": "ok", "updated": 0}
			
 
				 
			
 
				-    conn = get_db()
			
 
				     try:
			
 
				         # 先处理无需进化的，收集需要进化的
			
 
				         evolution_tasks = []   # [(knowledge_id, old_content, feedback, eval_data)]
			
@@ -1027,67 +917,72 @@ async def batch_update_knowledge(batch: KnowledgeBatchUpdateIn):
 
				             if not knowledge_id:
			
 
				                 continue
			
 
				 
			
 
				-            row = conn.execute("SELECT * FROM knowledge WHERE id = ?", (knowledge_id,)).fetchone()
			
 
				-            if not row:
			
 
				+            existing = milvus_store.get_by_id(knowledge_id)
			
 
				+            if not existing:
			
 
				                 continue
			
 
				 
			
 
				-            eval_data = json.loads(row["eval"])
			
 
				+            eval_data = existing.get("eval", {})
			
 
				 
			
 
				             if is_effective and feedback:
			
 
				-                evolution_tasks.append((knowledge_id, row["content"], feedback, eval_data))
			
 
				+                evolution_tasks.append((knowledge_id, existing["content"], feedback, eval_data, existing["task"]))
			
 
				             else:
			
 
				                 simple_updates.append((knowledge_id, is_effective, eval_data))
			
 
				 
			
 
				         # 执行简单更新
			
 
				-        now = datetime.now(timezone.utc).isoformat()
			
 
				         for knowledge_id, is_effective, eval_data in simple_updates:
			
 
				             if is_effective:
			
 
				                 eval_data["helpful"] = eval_data.get("helpful", 0) + 1
			
 
				             else:
			
 
				                 eval_data["harmful"] = eval_data.get("harmful", 0) + 1
			
 
				 
			
 
				-            conn.execute(
			
 
				-                "UPDATE knowledge SET eval = ?, updated_at = ? WHERE id = ?",
			
 
				-                (json.dumps(eval_data, ensure_ascii=False), now, knowledge_id)
			
 
				-            )
			
 
				+            milvus_store.update(knowledge_id, {"eval": eval_data})
			
 
				 
			
 
				         # 并发执行知识进化
			
 
				         if evolution_tasks:
			
 
				             print(f"🧬 并发处理 {len(evolution_tasks)} 条知识进化...")
			
 
				             evolved_results = await asyncio.gather(
			
 
				-                *[_evolve_knowledge_with_llm(old, fb) for _, old, fb, _ in evolution_tasks]
			
 
				+                *[_evolve_knowledge_with_llm(old, fb) for _, old, fb, _, _ in evolution_tasks]
			
 
				             )
			
 
				-            for (knowledge_id, _, _, eval_data), evolved_content in zip(evolution_tasks, evolved_results):
			
 
				+
			
 
				+            for (knowledge_id, _, _, eval_data, task), evolved_content in zip(evolution_tasks, evolved_results):
			
 
				                 eval_data["helpful"] = eval_data.get("helpful", 0) + 1
			
 
				-                conn.execute(
			
 
				-                    "UPDATE knowledge SET content = ?, eval = ?, updated_at = ? WHERE id = ?",
			
 
				-                    (evolved_content, json.dumps(eval_data, ensure_ascii=False), now, knowledge_id)
			
 
				-                )
			
 
				 
			
 
				-        conn.commit()
			
 
				+                # 重新生成向量
			
 
				+                text = f"{task}\n{evolved_content}"
			
 
				+                embedding = await get_embedding(text)
			
 
				+
			
 
				+                milvus_store.update(knowledge_id, {
			
 
				+                    "content": evolved_content,
			
 
				+                    "eval": eval_data,
			
 
				+                    "embedding": embedding
			
 
				+                })
			
 
				+
			
 
				         return {"status": "ok", "updated": len(simple_updates) + len(evolution_tasks)}
			
 
				-    finally:
			
 
				-        conn.close()
			
 
				+
			
 
				+    except Exception as e:
			
 
				+        print(f"[Batch Update] 错误: {e}")
			
 
				+        raise HTTPException(status_code=500, detail=str(e))
			
 
				 
			
 
				 
			
 
				 @app.post("/api/knowledge/slim")
			
 
				 async def slim_knowledge(model: str = "google/gemini-2.5-flash-lite"):
			
 
				     """知识库瘦身：合并语义相似知识"""
			
 
				-    conn = get_db()
			
 
				     try:
			
 
				-        rows = conn.execute("SELECT * FROM knowledge").fetchall()
			
 
				-        if len(rows) < 2:
			
 
				-            return {"status": "ok", "message": f"知识库仅有 {len(rows)} 条，无需瘦身"}
			
 
				+        # 获取所有知识
			
 
				+        all_knowledge = milvus_store.query('id != ""', limit=10000)
			
 
				+
			
 
				+        if len(all_knowledge) < 2:
			
 
				+            return {"status": "ok", "message": f"知识库仅有 {len(all_knowledge)} 条，无需瘦身"}
			
 
				 
			
 
				         # 构造发给大模型的内容
			
 
				         entries_text = ""
			
 
				-        for row in rows:
			
 
				-            eval_data = json.loads(row["eval"])
			
 
				-            types = json.loads(row["types"])
			
 
				-            entries_text += f"[ID: {row['id']}] [Types: {','.join(types)}] "
			
 
				+        for item in all_knowledge:
			
 
				+            eval_data = item.get("eval", {})
			
 
				+            types = item.get("types", [])
			
 
				+            entries_text += f"[ID: {item['id']}] [Types: {','.join(types)}] "
			
 
				             entries_text += f"[Helpful: {eval_data.get('helpful', 0)}, Harmful: {eval_data.get('harmful', 0)}] [Score: {eval_data.get('score', 3)}]\n"
			
 
				-            entries_text += f"Task: {row['task']}\n"
			
 
				-            entries_text += f"Content: {row['content'][:200]}...\n\n"
			
 
				+            entries_text += f"Task: {item['task']}\n"
			
 
				+            entries_text += f"Content: {item['content'][:200]}...\n\n"
			
 
				 
			
 
				         prompt = f"""你是一个 AI Agent 知识库管理员。以下是当前知识库的全部条目，请执行瘦身操作：
			
 
				 
			
@@ -1115,7 +1010,7 @@ REPORT: 原有 X 条，合并后 Y 条，精简了 Z 条。
 
				 
			
 
				 禁止输出任何开场白或解释。"""
			
 
				 
			
 
				-        print(f"\n[知识瘦身] 正在调用 {model} 分析 {len(rows)} 条知识...")
			
 
				+        print(f"\n[知识瘦身] 正在调用 {model} 分析 {len(all_knowledge)} 条知识...")
			
 
				         response = await openrouter_llm_call(
			
 
				             messages=[{"role": "user", "content": prompt}],
			
 
				             model=model
			
@@ -1189,10 +1084,20 @@ REPORT: 原有 X 条，合并后 Y 条，精简了 Z 条。
 
				         if not new_entries:
			
 
				             raise HTTPException(status_code=500, detail="解析大模型输出失败")
			
 
				 
			
 
				-        # 原子化写回
			
 
				-        now = datetime.now(timezone.utc).isoformat()
			
 
				-        conn.execute("DELETE FROM knowledge")
			
 
				-        for e in new_entries:
			
 
				+        # 生成向量并重建知识库
			
 
				+        print(f"[知识瘦身] 正在为 {len(new_entries)} 条知识生成向量...")
			
 
				+
			
 
				+        # 批量生成向量
			
 
				+        texts = [f"{e['task']}\n{e['content']}" for e in new_entries]
			
 
				+        embeddings = await get_embeddings_batch(texts)
			
 
				+
			
 
				+        # 清空并重建
			
 
				+        now = int(time.time())
			
 
				+        milvus_store.drop_collection()
			
 
				+        milvus_store._init_collection()
			
 
				+
			
 
				+        knowledge_list = []
			
 
				+        for e, embedding in zip(new_entries, embeddings):
			
 
				             eval_data = {
			
 
				                 "score": e["score"],
			
 
				                 "helpful": e["helpful"],
			
@@ -1207,37 +1112,39 @@ REPORT: 原有 X 条，合并后 Y 条，精简了 Z 条。
 
				                 "urls": [],
			
 
				                 "agent_id": "slim",
			
 
				                 "submitted_by": "system",
			
 
				-                "timestamp": now
			
 
				+                "timestamp": datetime.now(timezone.utc).isoformat()
			
 
				             }
			
 
				-            conn.execute(
			
 
				-                """INSERT INTO knowledge
			
 
				-                (id, message_id, types, task, tags, scopes, owner, content, source, eval, created_at, updated_at)
			
 
				-                VALUES (?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?)""",
			
 
				-                (
			
 
				-                    e["id"],
			
 
				-                    "",
			
 
				-                    json.dumps(e["types"]),
			
 
				-                    e["task"],
			
 
				-                    json.dumps({}),
			
 
				-                    json.dumps(["org:cybertogether"]),
			
 
				-                    "agent:slim",
			
 
				-                    e["content"],
			
 
				-                    json.dumps(source, ensure_ascii=False),
			
 
				-                    json.dumps(eval_data, ensure_ascii=False),
			
 
				-                    now,
			
 
				-                    now
			
 
				-                )
			
 
				-            )
			
 
				-        conn.commit()
			
 
				+            knowledge_list.append({
			
 
				+                "id": e["id"],
			
 
				+                "embedding": embedding,
			
 
				+                "message_id": "",
			
 
				+                "task": e["task"],
			
 
				+                "content": e["content"],
			
 
				+                "types": e["types"],
			
 
				+                "tags": {},
			
 
				+                "scopes": ["org:cybertogether"],
			
 
				+                "owner": "agent:slim",
			
 
				+                "resource_ids": [],
			
 
				+                "source": source,
			
 
				+                "eval": eval_data,
			
 
				+                "created_at": now,
			
 
				+                "updated_at": now
			
 
				+            })
			
 
				 
			
 
				-        result_msg = f"瘦身完成：{len(rows)} → {len(new_entries)} 条知识"
			
 
				+        milvus_store.insert_batch(knowledge_list)
			
 
				+
			
 
				+        result_msg = f"瘦身完成：{len(all_knowledge)} → {len(new_entries)} 条知识"
			
 
				         if report_line:
			
 
				             result_msg += f"\n{report_line}"
			
 
				         print(f"[知识瘦身] {result_msg}")
			
 
				 
			
 
				-        return {"status": "ok", "before": len(rows), "after": len(new_entries), "report": report_line}
			
 
				-    finally:
			
 
				-        conn.close()
			
 
				+        return {"status": "ok", "before": len(all_knowledge), "after": len(new_entries), "report": report_line}
			
 
				+
			
 
				+    except HTTPException:
			
 
				+        raise
			
 
				+    except Exception as e:
			
 
				+        print(f"[Slim Knowledge] 错误: {e}")
			
 
				+        raise HTTPException(status_code=500, detail=str(e))
			
 
				 
			
 
				 
			
 
				 @app.post("/api/extract")
			
@@ -1321,81 +1228,81 @@ async def extract_knowledge_from_messages(extract_req: MessageExtractIn):
 
				         if not isinstance(extracted_knowledge, list):
			
 
				             raise ValueError("LLM output is not a list")
			
 
				 
			
 
				+        if not extracted_knowledge:
			
 
				+            return {"status": "ok", "extracted_count": 0, "knowledge_ids": []}
			
 
				+
			
 
				+        # 批量生成向量
			
 
				+        texts = [f"{item.get('task', '')}\n{item.get('content', '')}" for item in extracted_knowledge]
			
 
				+        embeddings = await get_embeddings_batch(texts)
			
 
				+
			
 
				         # 保存提取的知识
			
 
				-        conn = get_db()
			
 
				         knowledge_ids = []
			
 
				-        now = datetime.now(timezone.utc).isoformat()
			
 
				+        now = int(time.time())
			
 
				+        knowledge_list = []
			
 
				 
			
 
				-        try:
			
 
				-            for item in extracted_knowledge:
			
 
				-                task = item.get("task", "")
			
 
				-                knowledge_content = item.get("content", "")
			
 
				-                types = item.get("types", ["strategy"])
			
 
				-                score = item.get("score", 3)
			
 
				-
			
 
				-                if not task or not knowledge_content:
			
 
				-                    continue
			
 
				-
			
 
				-                # 生成 ID
			
 
				-                import uuid
			
 
				-                timestamp = datetime.now().strftime('%Y%m%d-%H%M%S')
			
 
				-                random_suffix = uuid.uuid4().hex[:4]
			
 
				-                knowledge_id = f"knowledge-{timestamp}-{random_suffix}"
			
 
				-
			
 
				-                # 准备数据
			
 
				-                source = {
			
 
				-                    "name": "message_extraction",
			
 
				-                    "category": "exp",
			
 
				-                    "urls": [],
			
 
				-                    "agent_id": extract_req.agent_id,
			
 
				-                    "submitted_by": extract_req.submitted_by,
			
 
				-                    "timestamp": now,
			
 
				-                    "session_key": extract_req.session_key
			
 
				-                }
			
 
				+        for item, embedding in zip(extracted_knowledge, embeddings):
			
 
				+            task = item.get("task", "")
			
 
				+            knowledge_content = item.get("content", "")
			
 
				+            types = item.get("types", ["strategy"])
			
 
				+            score = item.get("score", 3)
			
 
				 
			
 
				-                eval_data = {
			
 
				-                    "score": score,
			
 
				-                    "helpful": 1,
			
 
				-                    "harmful": 0,
			
 
				-                    "confidence": 0.7,
			
 
				-                    "helpful_history": [],
			
 
				-                    "harmful_history": []
			
 
				-                }
			
 
				+            if not task or not knowledge_content:
			
 
				+                continue
			
 
				+
			
 
				+            # 生成 ID
			
 
				+            timestamp = datetime.now().strftime('%Y%m%d-%H%M%S')
			
 
				+            random_suffix = uuid.uuid4().hex[:4]
			
 
				+            knowledge_id = f"knowledge-{timestamp}-{random_suffix}"
			
 
				+
			
 
				+            # 准备数据
			
 
				+            source = {
			
 
				+                "name": "message_extraction",
			
 
				+                "category": "exp",
			
 
				+                "urls": [],
			
 
				+                "agent_id": extract_req.agent_id,
			
 
				+                "submitted_by": extract_req.submitted_by,
			
 
				+                "timestamp": datetime.now(timezone.utc).isoformat(),
			
 
				+                "session_key": extract_req.session_key
			
 
				+            }
			
 
				 
			
 
				-                # 插入数据库
			
 
				-                conn.execute(
			
 
				-                    """INSERT INTO knowledge
			
 
				-                    (id, message_id, types, task, tags, scopes, owner, content,
			
 
				-                     source, eval, created_at, updated_at)
			
 
				-                    VALUES (?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?)""",
			
 
				-                    (
			
 
				-                        knowledge_id,
			
 
				-                        "",
			
 
				-                        json.dumps(types),
			
 
				-                        task,
			
 
				-                        json.dumps({}),
			
 
				-                        json.dumps(["org:cybertogether"]),
			
 
				-                        extract_req.submitted_by,
			
 
				-                        knowledge_content,
			
 
				-                        json.dumps(source, ensure_ascii=False),
			
 
				-                        json.dumps(eval_data, ensure_ascii=False),
			
 
				-                        now,
			
 
				-                        now,
			
 
				-                    ),
			
 
				-                )
			
 
				-                knowledge_ids.append(knowledge_id)
			
 
				-
			
 
				-            conn.commit()
			
 
				-            print(f"[Extract] 成功提取并保存 {len(knowledge_ids)} 条知识")
			
 
				-
			
 
				-            return {
			
 
				-                "status": "ok",
			
 
				-                "extracted_count": len(knowledge_ids),
			
 
				-                "knowledge_ids": knowledge_ids
			
 
				+            eval_data = {
			
 
				+                "score": score,
			
 
				+                "helpful": 1,
			
 
				+                "harmful": 0,
			
 
				+                "confidence": 0.7,
			
 
				+                "helpful_history": [],
			
 
				+                "harmful_history": []
			
 
				             }
			
 
				 
			
 
				-        finally:
			
 
				-            conn.close()
			
 
				+            knowledge_list.append({
			
 
				+                "id": knowledge_id,
			
 
				+                "embedding": embedding,
			
 
				+                "message_id": "",
			
 
				+                "task": task,
			
 
				+                "content": knowledge_content,
			
 
				+                "types": types,
			
 
				+                "tags": {},
			
 
				+                "scopes": ["org:cybertogether"],
			
 
				+                "owner": extract_req.submitted_by,
			
 
				+                "resource_ids": [],
			
 
				+                "source": source,
			
 
				+                "eval": eval_data,
			
 
				+                "created_at": now,
			
 
				+                "updated_at": now,
			
 
				+            })
			
 
				+            knowledge_ids.append(knowledge_id)
			
 
				+
			
 
				+        # 批量插入
			
 
				+        if knowledge_list:
			
 
				+            milvus_store.insert_batch(knowledge_list)
			
 
				+
			
 
				+        print(f"[Extract] 成功提取并保存 {len(knowledge_ids)} 条知识")
			
 
				+
			
 
				+        return {
			
 
				+            "status": "ok",
			
 
				+            "extracted_count": len(knowledge_ids),
			
 
				+            "knowledge_ids": knowledge_ids
			
 
				+        }
			
 
				 
			
 
				     except json.JSONDecodeError as e:
			
 
				         print(f"[Extract] JSON 解析失败: {e}")
			
--- a/knowhub/vector_store.py
+++ b/knowhub/vector_store.py
@@ -0,0 +1,213 @@
 
				+"""
			
 
				+Milvus Lite 存储封装
			
 
				+
			
 
				+单一存储架构，存储完整知识数据 + 向量。
			
 
				+"""
			
 
				+
			
 
				+from milvus import default_server
			
 
				+from pymilvus import (
			
 
				+    connections, Collection, FieldSchema,
			
 
				+    CollectionSchema, DataType, utility
			
 
				+)
			
 
				+from typing import List, Dict, Optional
			
 
				+import json
			
 
				+import time
			
 
				+
			
 
				+
			
 
				+class MilvusStore:
			
 
				+    def __init__(self, data_dir: str = "./milvus_data"):
			
 
				+        """
			
 
				+        初始化 Milvus Lite 存储
			
 
				+
			
 
				+        Args:
			
 
				+            data_dir: 数据存储目录
			
 
				+        """
			
 
				+        # 启动内嵌服务器
			
 
				+        default_server.set_base_dir(data_dir)
			
 
				+        default_server.start()
			
 
				+
			
 
				+        # 连接
			
 
				+        connections.connect(
			
 
				+            host='127.0.0.1',
			
 
				+            port=default_server.listen_port
			
 
				+        )
			
 
				+
			
 
				+        self._init_collection()
			
 
				+
			
 
				+    def _init_collection(self):
			
 
				+        """初始化 collection"""
			
 
				+        collection_name = "knowledge"
			
 
				+
			
 
				+        if utility.has_collection(collection_name):
			
 
				+            self.collection = Collection(collection_name)
			
 
				+        else:
			
 
				+            # 定义 schema
			
 
				+            fields = [
			
 
				+                FieldSchema(name="id", dtype=DataType.VARCHAR,
			
 
				+                           max_length=100, is_primary=True),
			
 
				+                FieldSchema(name="embedding", dtype=DataType.FLOAT_VECTOR,
			
 
				+                           dim=1536),
			
 
				+                FieldSchema(name="message_id", dtype=DataType.VARCHAR,
			
 
				+                           max_length=100),
			
 
				+                FieldSchema(name="task", dtype=DataType.VARCHAR,
			
 
				+                           max_length=2000),
			
 
				+                FieldSchema(name="content", dtype=DataType.VARCHAR,
			
 
				+                           max_length=50000),
			
 
				+                FieldSchema(name="types", dtype=DataType.JSON),
			
 
				+                FieldSchema(name="tags", dtype=DataType.JSON),
			
 
				+                FieldSchema(name="scopes", dtype=DataType.JSON),
			
 
				+                FieldSchema(name="owner", dtype=DataType.VARCHAR,
			
 
				+                           max_length=200),
			
 
				+                FieldSchema(name="resource_ids", dtype=DataType.JSON),
			
 
				+                FieldSchema(name="source", dtype=DataType.JSON),
			
 
				+                FieldSchema(name="eval", dtype=DataType.JSON),
			
 
				+                FieldSchema(name="created_at", dtype=DataType.INT64),
			
 
				+                FieldSchema(name="updated_at", dtype=DataType.INT64),
			
 
				+            ]
			
 
				+
			
 
				+            schema = CollectionSchema(fields, description="KnowHub Knowledge")
			
 
				+            self.collection = Collection(collection_name, schema)
			
 
				+
			
 
				+            # 创建向量索引
			
 
				+            index_params = {
			
 
				+                "metric_type": "COSINE",
			
 
				+                "index_type": "HNSW",
			
 
				+                "params": {"M": 16, "efConstruction": 200}
			
 
				+            }
			
 
				+            self.collection.create_index("embedding", index_params)
			
 
				+
			
 
				+        self.collection.load()
			
 
				+
			
 
				+    def insert(self, knowledge: Dict):
			
 
				+        """
			
 
				+        插入单条知识
			
 
				+
			
 
				+        Args:
			
 
				+            knowledge: 知识数据（包含 embedding）
			
 
				+        """
			
 
				+        self.collection.insert([knowledge])
			
 
				+        self.collection.flush()
			
 
				+
			
 
				+    def insert_batch(self, knowledge_list: List[Dict]):
			
 
				+        """
			
 
				+        批量插入知识
			
 
				+
			
 
				+        Args:
			
 
				+            knowledge_list: 知识列表
			
 
				+        """
			
 
				+        if not knowledge_list:
			
 
				+            return
			
 
				+        self.collection.insert(knowledge_list)
			
 
				+        self.collection.flush()
			
 
				+
			
 
				+    def search(self,
			
 
				+               query_embedding: List[float],
			
 
				+               filters: Optional[str] = None,
			
 
				+               limit: int = 10) -> List[Dict]:
			
 
				+        """
			
 
				+        向量检索 + 标量过滤
			
 
				+
			
 
				+        Args:
			
 
				+            query_embedding: 查询向量
			
 
				+            filters: 过滤表达式（如: 'owner == "agent"'）
			
 
				+            limit: 返回数量
			
 
				+
			
 
				+        Returns:
			
 
				+            知识列表
			
 
				+        """
			
 
				+        search_params = {"metric_type": "COSINE", "params": {"ef": 100}}
			
 
				+
			
 
				+        results = self.collection.search(
			
 
				+            data=[query_embedding],
			
 
				+            anns_field="embedding",
			
 
				+            param=search_params,
			
 
				+            limit=limit,
			
 
				+            expr=filters,
			
 
				+            output_fields=["id", "message_id", "task", "content", "types",
			
 
				+                          "tags", "scopes", "owner", "resource_ids",
			
 
				+                          "source", "eval", "created_at", "updated_at"]
			
 
				+        )
			
 
				+
			
 
				+        if not results or not results[0]:
			
 
				+            return []
			
 
				+
			
 
				+        return [hit.entity.to_dict() for hit in results[0]]
			
 
				+
			
 
				+    def query(self, filters: str, limit: int = 100) -> List[Dict]:
			
 
				+        """
			
 
				+        纯标量查询（不使用向量）
			
 
				+
			
 
				+        Args:
			
 
				+            filters: 过滤表达式
			
 
				+            limit: 返回数量
			
 
				+
			
 
				+        Returns:
			
 
				+            知识列表
			
 
				+        """
			
 
				+        results = self.collection.query(
			
 
				+            expr=filters,
			
 
				+            output_fields=["id", "message_id", "task", "content", "types",
			
 
				+                          "tags", "scopes", "owner", "resource_ids",
			
 
				+                          "source", "eval", "created_at", "updated_at"],
			
 
				+            limit=limit
			
 
				+        )
			
 
				+        return results
			
 
				+
			
 
				+    def get_by_id(self, knowledge_id: str) -> Optional[Dict]:
			
 
				+        """
			
 
				+        根据 ID 获取知识
			
 
				+
			
 
				+        Args:
			
 
				+            knowledge_id: 知识 ID
			
 
				+
			
 
				+        Returns:
			
 
				+            知识数据，不存在返回 None
			
 
				+        """
			
 
				+        results = self.collection.query(
			
 
				+            expr=f'id == "{knowledge_id}"',
			
 
				+            output_fields=["id", "message_id", "task", "content", "types",
			
 
				+                          "tags", "scopes", "owner", "resource_ids",
			
 
				+                          "source", "eval", "created_at", "updated_at"]
			
 
				+        )
			
 
				+        return results[0] if results else None
			
 
				+
			
 
				+    def update(self, knowledge_id: str, updates: Dict):
			
 
				+        """
			
 
				+        更新知识（先删除再插入）
			
 
				+
			
 
				+        Args:
			
 
				+            knowledge_id: 知识 ID
			
 
				+            updates: 更新字段
			
 
				+        """
			
 
				+        # 1. 查询现有数据
			
 
				+        existing = self.get_by_id(knowledge_id)
			
 
				+        if not existing:
			
 
				+            raise ValueError(f"Knowledge not found: {knowledge_id}")
			
 
				+
			
 
				+        # 2. 合并更新
			
 
				+        existing.update(updates)
			
 
				+        existing["updated_at"] = int(time.time())
			
 
				+
			
 
				+        # 3. 删除旧数据
			
 
				+        self.delete(knowledge_id)
			
 
				+
			
 
				+        # 4. 插入新数据
			
 
				+        self.insert(existing)
			
 
				+
			
 
				+    def delete(self, knowledge_id: str):
			
 
				+        """
			
 
				+        删除知识
			
 
				+
			
 
				+        Args:
			
 
				+            knowledge_id: 知识 ID
			
 
				+        """
			
 
				+        self.collection.delete(f'id == "{knowledge_id}"')
			
 
				+        self.collection.flush()
			
 
				+
			
 
				+    def count(self) -> int:
			
 
				+        """返回知识总数"""
			
 
				+        return self.collection.num_entities
			
 
				+
			
 
				+    def drop_collection(self):
			
 
				+        """删除 collection（危险操作）"""
			
 
				+        utility.drop_collection("knowledge")
			
--- a/test_vector_search.py
+++ b/test_vector_search.py
@@ -0,0 +1,120 @@
 
				+"""
			
 
				+测试 Milvus Lite 向量检索实现
			
 
				+
			
 
				+运行前确保：
			
 
				+1. pip install -r knowhub/requirements.txt
			
 
				+2. 设置环境变量 OPENROUTER_API_KEY
			
 
				+"""
			
 
				+
			
 
				+import asyncio
			
 
				+import sys
			
 
				+from pathlib import Path
			
 
				+
			
 
				+# 添加项目路径
			
 
				+sys.path.insert(0, str(Path(__file__).parent))
			
 
				+
			
 
				+from knowhub.vector_store import MilvusStore
			
 
				+from knowhub.embeddings import get_embedding, get_embeddings_batch
			
 
				+
			
 
				+
			
 
				+async def test_basic():
			
 
				+    """测试基本功能"""
			
 
				+    print("=" * 60)
			
 
				+    print("测试 1: 初始化 Milvus Lite")
			
 
				+    print("=" * 60)
			
 
				+
			
 
				+    store = MilvusStore(data_dir="./test_milvus_data")
			
 
				+    print(f"✓ Milvus Lite 初始化成功")
			
 
				+    print(f"  当前知识数量: {store.count()}")
			
 
				+
			
 
				+    print("\n" + "=" * 60)
			
 
				+    print("测试 2: 生成 Embedding")
			
 
				+    print("=" * 60)
			
 
				+
			
 
				+    text = "如何使用 Python 读取 PDF 文件"
			
 
				+    embedding = await get_embedding(text)
			
 
				+    print(f"✓ 单条 embedding 生成成功")
			
 
				+    print(f"  文本: {text}")
			
 
				+    print(f"  向量维度: {len(embedding)}")
			
 
				+
			
 
				+    texts = ["测试文本1", "测试文本2", "测试文本3"]
			
 
				+    embeddings = await get_embeddings_batch(texts)
			
 
				+    print(f"✓ 批量 embedding 生成成功")
			
 
				+    print(f"  文本数量: {len(texts)}")
			
 
				+    print(f"  向量数量: {len(embeddings)}")
			
 
				+
			
 
				+    print("\n" + "=" * 60)
			
 
				+    print("测试 3: 插入知识")
			
 
				+    print("=" * 60)
			
 
				+
			
 
				+    import time
			
 
				+    knowledge = {
			
 
				+        "id": "test-001",
			
 
				+        "embedding": embedding,
			
 
				+        "message_id": "",
			
 
				+        "task": "读取 PDF 文件",
			
 
				+        "content": "使用 pymupdf 库可以高效读取 PDF 文件内容",
			
 
				+        "types": ["tool"],
			
 
				+        "tags": {"category": "file_processing"},
			
 
				+        "scopes": ["org:test"],
			
 
				+        "owner": "test_user",
			
 
				+        "resource_ids": [],
			
 
				+        "source": {"name": "test"},
			
 
				+        "eval": {"score": 4, "helpful": 0, "harmful": 0},
			
 
				+        "created_at": int(time.time()),
			
 
				+        "updated_at": int(time.time()),
			
 
				+    }
			
 
				+
			
 
				+    store.insert(knowledge)
			
 
				+    print(f"✓ 知识插入成功")
			
 
				+    print(f"  ID: {knowledge['id']}")
			
 
				+    print(f"  当前知识数量: {store.count()}")
			
 
				+
			
 
				+    print("\n" + "=" * 60)
			
 
				+    print("测试 4: 查询知识")
			
 
				+    print("=" * 60)
			
 
				+
			
 
				+    result = store.get_by_id("test-001")
			
 
				+    print(f"✓ 按 ID 查询成功")
			
 
				+    print(f"  Task: {result['task']}")
			
 
				+    print(f"  Content: {result['content']}")
			
 
				+
			
 
				+    print("\n" + "=" * 60)
			
 
				+    print("测试 5: 向量检索")
			
 
				+    print("=" * 60)
			
 
				+
			
 
				+    query_text = "怎么处理 PDF"
			
 
				+    query_embedding = await get_embedding(query_text)
			
 
				+    results = store.search(query_embedding, limit=5)
			
 
				+    print(f"✓ 向量检索成功")
			
 
				+    print(f"  查询: {query_text}")
			
 
				+    print(f"  结果数量: {len(results)}")
			
 
				+    if results:
			
 
				+        print(f"  Top 1: {results[0]['task']}")
			
 
				+
			
 
				+    print("\n" + "=" * 60)
			
 
				+    print("测试 6: 更新知识")
			
 
				+    print("=" * 60)
			
 
				+
			
 
				+    store.update("test-001", {"content": "使用 pymupdf 库（推荐）或 PyPDF2 库读取 PDF"})
			
 
				+    updated = store.get_by_id("test-001")
			
 
				+    print(f"✓ 知识更新成功")
			
 
				+    print(f"  新内容: {updated['content']}")
			
 
				+
			
 
				+    print("\n" + "=" * 60)
			
 
				+    print("测试 7: 删除知识")
			
 
				+    print("=" * 60)
			
 
				+
			
 
				+    store.delete("test-001")
			
 
				+    deleted = store.get_by_id("test-001")
			
 
				+    print(f"✓ 知识删除成功")
			
 
				+    print(f"  删除后查询结果: {deleted}")
			
 
				+    print(f"  当前知识数量: {store.count()}")
			
 
				+
			
 
				+    print("\n" + "=" * 60)
			
 
				+    print("所有测试通过！")
			
 
				+    print("=" * 60)
			
 
				+
			
 
				+
			
 
				+if __name__ == "__main__":
			
 
				+    asyncio.run(test_basic())