há 1 semana atrás · 4d2bbd0162
--- a/applications/async_task/__init__.py
+++ b/applications/async_task/__init__.py
@@ -3,6 +3,7 @@ from .chunk_task import ChunkBooksTask
 
				 from .delete_task import DeleteTask
			
 
				 from .auto_rechunk_task import AutoRechunkTask
			
 
				 from .build_graph import BuildGraph
			
 
				+from .record_pattern import RecordPattern
			
 
				 
			
 
				 
			
 
				 __all__ = [
			
@@ -11,4 +12,5 @@ __all__ = [
 
				     "AutoRechunkTask",
			
 
				     "BuildGraph",
			
 
				     "ChunkBooksTask",
			
 
				+    "RecordPattern",
			
 
				 ]
			
--- a/applications/async_task/aggregate_pattern.py
+++ b/applications/async_task/aggregate_pattern.py
@@ -0,0 +1,307 @@
 
				+import json
			
 
				+from typing import List, Optional, Dict, Any
			
 
				+import uuid
			
 
				+
			
 
				+from applications.config import (
			
 
				+    ES_HOSTS,
			
 
				+    ELASTIC_SEARCH_INDEX,
			
 
				+    ES_PASSWORD,
			
 
				+    MILVUS_CONFIG,
			
 
				+    DEFAULT_MODEL
			
 
				+)
			
 
				+from applications.resource import init_resource_manager
			
 
				+from applications.utils.milvus import async_insert_chunk, async_update_embedding
			
 
				+from applications.api import get_basic_embedding, fetch_deepseek_completion
			
 
				+
			
 
				+
			
 
				+# 初始化资源管理器
			
 
				+resource_manager = init_resource_manager(
			
 
				+    es_hosts=ES_HOSTS,
			
 
				+    es_index=ELASTIC_SEARCH_INDEX,
			
 
				+    es_password=ES_PASSWORD,
			
 
				+    milvus_config=MILVUS_CONFIG,
			
 
				+)
			
 
				+
			
 
				+def hits_to_json(hits):
			
 
				+    if not hits:
			
 
				+        return []
			
 
				+
			
 
				+    special_keys = {"entities", "concepts", "questions", "keywords"}
			
 
				+    return [
			
 
				+        {
			
 
				+            "pk": hit.id,
			
 
				+            "score": hit.distance,
			
 
				+            **{
			
 
				+                key: list(value) if key in special_keys else value
			
 
				+                for key, value in (hit.get("entity", {}) or {}).items()
			
 
				+            },
			
 
				+        }
			
 
				+        for hit in hits[0] if hit.distance > 0.8
			
 
				+    ]
			
 
				+
			
 
				+def format_json_file(json_obj):
			
 
				+    output_string = ""
			
 
				+    for key in json_obj:
			
 
				+        value = json_obj[key]
			
 
				+        output_string += f"{key}: {value}\n"
			
 
				+    return output_string
			
 
				+
			
 
				+class AggregatePattern:
			
 
				+    def __init__(self, resource):
			
 
				+        self.mysql_client = resource.mysql_client
			
 
				+        self.milvus_client = resource.milvus_client
			
 
				+
			
 
				+    async def get_task(self):
			
 
				+        query = """
			
 
				+            SELECT t1.id, dim_name, name, t1.description, t1.detail, 
			
 
				+                   t2.output_type, t2.content,t2.constrains
			
 
				+            FROM modes t1 JOIN outputs t2 ON t1.output_id = t2.output_id
			
 
				+            WHERE standardization_status = 0
			
 
				+            LIMIT 5;
			
 
				+        """
			
 
				+        response = await self.mysql_client.async_fetch(query=query)
			
 
				+        return response
			
 
				+
			
 
				+    async def base_vector_search(
			
 
				+        self,
			
 
				+        query_vec: List[float],
			
 
				+        anns_field: str = "mode_vector",
			
 
				+        limit: int = 5,
			
 
				+        expr: Optional[str] = None,
			
 
				+        search_params: Optional[Dict[str, Any]] = None,
			
 
				+    ):
			
 
				+        if search_params is None:
			
 
				+            search_params = {"metric_type": "COSINE", "params": {"ef": 64}}
			
 
				+
			
 
				+        response = await asyncio.to_thread(
			
 
				+            self.milvus_client.search,
			
 
				+            data=[query_vec],
			
 
				+            anns_field=anns_field,
			
 
				+            param=search_params,
			
 
				+            limit=limit,
			
 
				+            expr=expr,
			
 
				+            output_fields=["id", "mode_id"],
			
 
				+        )
			
 
				+        print(response)
			
 
				+        return {"results": hits_to_json(response)[:10]}
			
 
				+
			
 
				+    @staticmethod
			
 
				+    async def get_result_by_llm(task):
			
 
				+        output_type = task['output_type']
			
 
				+        content = task['content']
			
 
				+        constrains = task['constrains']
			
 
				+        detail = task['detail']
			
 
				+        mode_name = task['name']
			
 
				+        dim = task['dim_name']
			
 
				+        decr = task['description']
			
 
				+        constrains_string = ""
			
 
				+        for item in json.loads(constrains):
			
 
				+            constrains_string += format_json_file(item) + "\n"
			
 
				+        prompt = f"""
			
 
				+请基于以下输入信息，总结出一套可复用的知识模式。
			
 
				+
			
 
				+## 输入信息
			
 
				+**知识维度**：{dim}
			
 
				+**模式名称**：{mode_name}
			
 
				+**模式描述**：{decr}
			
 
				+**模式详情**：{format_json_file(json.loads(detail)['不变的'])}
			
 
				+**产出类型**：{output_type}
			
 
				+**产出内容**：{format_json_file(json.loads(content))}
			
 
				+**产出格式约束**：{constrains_string}
			
 
				+
			
 
				+## 输出要求
			
 
				+请按照以下结构输出JSON格式的结果：
			
 
				+
			
 
				+1. **模式名称**：直接使用输入中的模式名称或基于其提炼
			
 
				+2. **简要描述**：用1-2句话概括模式的核心价值和适用场景
			
 
				+3. **所有知识的总结**：详细阐述以下方面：
			
 
				+   - 灵感来源：模式的创意起点和驱动因素
			
 
				+   - 内容结构：固定的内容组织形式和要素
			
 
				+   - 写作方法：具体的创作技巧和表达方式
			
 
				+   - 核心逻辑：模式运作的基本原则和策略
			
 
				+   - 产出模板：可复用的内容框架和变量说明
			
 
				+   - 应用场景：模式的适用领域和使用价值
			
 
				+
			
 
				+请确保总结全面、结构清晰，直接基于输入信息进行提炼，不要添加额外信息。
			
 
				+
			
 
				+## 输出格式
			
 
				+{{
			
 
				+    "name": "模式名称",
			
 
				+    "description": "简要描述",
			
 
				+    "details": "详细的知识总结，包含灵感来源、内容结构、写作方法、核心逻辑、产出模板、应用场景等完整要素"
			
 
				+}}
			
 
				+        """
			
 
				+        response = await fetch_deepseek_completion(
			
 
				+            prompt=prompt,
			
 
				+            model="DeepSeek-R1",
			
 
				+            output_type="json"
			
 
				+        )
			
 
				+        return response
			
 
				+
			
 
				+    async def merge_as_new_result(self, most_related_mode_id, new_result, pk_id, mode_id):
			
 
				+        # 查询出结果
			
 
				+        fetch_query = f"""select name, description, result from standard_mode where standard_id = %s"""
			
 
				+        response = await self.mysql_client.async_fetch(
			
 
				+            query=fetch_query, params=(most_related_mode_id,)
			
 
				+        )
			
 
				+        if not response:
			
 
				+            return
			
 
				+        else:
			
 
				+            old_result = response[0]
			
 
				+            merge_prompt = f"""
			
 
				+## 任务说明
			
 
				+您需要将一个新的模式知识与标准模式进行知识融合，创建一个综合性的知识模式。
			
 
				+
			
 
				+## 融合要求
			
 
				+1. **名称融合**：基于标准模式名称和新的模式知识名称，创建一个新的、有意义的名称，体现两者的所有特征
			
 
				+2. **描述融合**：合并标准模式描述和新的模式知识描述，创建一个全面综合的描述，体现两者的所有特征
			
 
				+3. **知识总结融合**：整合标准模式总结和新的模式知识，确保包含所有相关信息，按照以下结构组织：
			
 
				+   - 灵感来源
			
 
				+   - 内容结构
			
 
				+   - 写作方法
			
 
				+   - 核心逻辑
			
 
				+   - 产出模板
			
 
				+   - 应用场景
			
 
				+
			
 
				+## 输入信息
			
 
				+**标准模式名称**：{old_result['name']}
			
 
				+**标准模式描述**：{old_result['description']}
			
 
				+**标准模式总结**：{old_result['result']}
			
 
				+
			
 
				+**新的模式知识名称**：{new_result['name']}
			
 
				+**新的模式知识描述**：{new_result['description']}
			
 
				+**新的模式知识**：{new_result['details']}
			
 
				+
			
 
				+## 输出要求
			
 
				+请严格按照以下JSON格式输出，无需考虑输出长度，不要丢失信息。
			
 
				+
			
 
				+## 输出格式
			
 
				+{{
			
 
				+    "name": "融合后的模式名称,保留所有信息",
			
 
				+    "description": "融合后的综合描述,保留所有信息",
			
 
				+    "details": "融合后的详细知识总结，保留所有信息，必须包含以下完整要素：灵感来源、内容结构、写作方法、核心逻辑、产出模板、应用场景"
			
 
				+}}
			
 
				+
			
 
				+请确保融合后的知识模式包含两个模式的所有信息。输出前请校验，合并后的知识模式是否涵盖输入二者的所有元素，如果有缺失，请补全
			
 
				+ Please think step by step.
			
 
				+"""
			
 
				+            print(merge_prompt)
			
 
				+            response = await fetch_deepseek_completion(
			
 
				+                prompt=merge_prompt,
			
 
				+                model="DeepSeek-R1",
			
 
				+                output_type="json"
			
 
				+            )
			
 
				+            print(json.dumps(response, ensure_ascii=False, indent=4))
			
 
				+
			
 
				+            update_query1 = """
			
 
				+                           UPDATE modes
			
 
				+                           SET standardization_status = %s, \
			
 
				+                               standard_mode_id       = %s, \
			
 
				+                               result                 = %s \
			
 
				+                           WHERE id = %s; \
			
 
				+                           """
			
 
				+            await self.mysql_client.async_save(
			
 
				+                query=update_query1, params=(
			
 
				+                    2,
			
 
				+                    most_related_mode_id,
			
 
				+                    new_result['details'],
			
 
				+                    mode_id
			
 
				+                )
			
 
				+            )
			
 
				+
			
 
				+            update_query2 = """
			
 
				+                update standard_mode
			
 
				+                set name = %s,
			
 
				+                    description = %s,
			
 
				+                    result = %s
			
 
				+                where standard_id = %s
			
 
				+            """
			
 
				+            await self.mysql_client.async_save(
			
 
				+                query=update_query2, params=(
			
 
				+                    response['name'],
			
 
				+                    response['description'],
			
 
				+                    response['details'],
			
 
				+                    most_related_mode_id
			
 
				+                )
			
 
				+            )
			
 
				+            # 更新 milvus
			
 
				+            text = f"模式名称：{response['name']}，模式描述：{response['description']}"
			
 
				+            embedding = await get_basic_embedding(text, DEFAULT_MODEL)
			
 
				+            data = {
			
 
				+                "id": pk_id,
			
 
				+                "mode_id": most_related_mode_id,
			
 
				+                "mode_vector": embedding,
			
 
				+            }
			
 
				+            await async_update_embedding(self.milvus_client, data)
			
 
				+
			
 
				+
			
 
				+    async def save_to_mysql_and_milvus(self, task, result):
			
 
				+        standard_id = f"standard-{str(uuid.uuid4())}"
			
 
				+        query = """
			
 
				+            INSERT INTO standard_mode (standard_id, name, description, result) VALUES 
			
 
				+                (%s, %s, %s, %s);
			
 
				+        """
			
 
				+        await self.mysql_client.async_save(
			
 
				+            query=query, params=(
			
 
				+                standard_id,
			
 
				+                result['name'],
			
 
				+                result['description'],
			
 
				+                result['details']
			
 
				+            )
			
 
				+        )
			
 
				+        text = f"维度：{task['dim_name']}，模式名称：{result['name']}，模式描述：{result['description']}"
			
 
				+        embedding = await get_basic_embedding(text, DEFAULT_MODEL)
			
 
				+        data = {
			
 
				+            "mode_id": standard_id,
			
 
				+            "mode_vector": embedding,
			
 
				+        }
			
 
				+        await async_insert_chunk(self.milvus_client, data)
			
 
				+
			
 
				+        update_query = """
			
 
				+            UPDATE modes 
			
 
				+            SET standardization_status = %s, standard_mode_id = %s, result = %s WHERE id = %s;
			
 
				+        """
			
 
				+        await self.mysql_client.async_save(
			
 
				+            query=update_query, params=(
			
 
				+                2,
			
 
				+                standard_id,
			
 
				+                result['details'],
			
 
				+                task['id']
			
 
				+            )
			
 
				+        )
			
 
				+
			
 
				+    async def deal(self):
			
 
				+        tasks = await self.get_task()
			
 
				+        if not tasks:
			
 
				+            return
			
 
				+        else:
			
 
				+            for task in tasks:
			
 
				+                text = f"维度：{task['dim_name']}，模式名称：{task['name']}，模式描述：{task['description']}"
			
 
				+                print(text)
			
 
				+                embedding = await get_basic_embedding(text, DEFAULT_MODEL)
			
 
				+                response = await self.base_vector_search(query_vec=embedding)
			
 
				+                results = response['results']
			
 
				+                if not results:
			
 
				+                    # set as new
			
 
				+                    print("set as new standard mode")
			
 
				+                    response = await self.get_result_by_llm(task)
			
 
				+                    print(json.dumps(response, ensure_ascii=False, indent=4))
			
 
				+                    await self.save_to_mysql_and_milvus(task, response)
			
 
				+                else:
			
 
				+                    most_related_mode_id = results[0]['mode_id']
			
 
				+                    pk_id = results[0]['id']
			
 
				+                    response = await self.get_result_by_llm(task)
			
 
				+                    print("new result")
			
 
				+                    print(json.dumps(response, ensure_ascii=False, indent=4))
			
 
				+                    await self.merge_as_new_result(most_related_mode_id, response, pk_id, task['id'])
			
 
				+
			
 
				+
			
 
				+async def run_aggregate_pattern():
			
 
				+    await resource_manager.startup()
			
 
				+    aggregate_pattern = AggregatePattern(resource_manager)
			
 
				+    await aggregate_pattern.deal()
			
 
				+    await resource_manager.shutdown()
			
 
				+
			
 
				+if __name__ == "__main__":
			
 
				+    import asyncio
			
 
				+    asyncio.run(run_aggregate_pattern())
			
--- a/applications/async_task/record_pattern.py
+++ b/applications/async_task/record_pattern.py
@@ -0,0 +1,206 @@
 
				+import json
			
 
				+import traceback
			
 
				+import uuid
			
 
				+import logging
			
 
				+from typing import Dict, List, Tuple, Optional
			
 
				+from dataclasses import dataclass
			
 
				+from applications.utils.mysql import Patterns
			
 
				+
			
 
				+# 配置日志
			
 
				+logger = logging.getLogger(__name__)
			
 
				+
			
 
				+
			
 
				+@dataclass
			
 
				+class ModeData:
			
 
				+    """模式数据类"""
			
 
				+
			
 
				+    id: str
			
 
				+    name: str
			
 
				+    percentage: str
			
 
				+    description: str
			
 
				+    detail: str
			
 
				+    output_id: str
			
 
				+    dimension_name: str
			
 
				+
			
 
				+
			
 
				+@dataclass
			
 
				+class OutputData:
			
 
				+    """产物数据类"""
			
 
				+
			
 
				+    id: str
			
 
				+    type: str
			
 
				+    description: str
			
 
				+    content: str
			
 
				+    constraints: str
			
 
				+
			
 
				+
			
 
				+class RecordPattern:
			
 
				+    def __init__(self, resource):
			
 
				+        self.pattern_manager = Patterns(resource.mysql_client)
			
 
				+        self.milvus_client = resource.milvus_client
			
 
				+
			
 
				+    async def record_mode(self, mode: ModeData) -> bool:
			
 
				+        """记录模式数据"""
			
 
				+        try:
			
 
				+            mode_tuple = (
			
 
				+                mode.id,
			
 
				+                mode.name,
			
 
				+                mode.percentage,
			
 
				+                mode.description,
			
 
				+                json.dumps(mode.detail, ensure_ascii=False),
			
 
				+                mode.output_id,
			
 
				+                mode.dimension_name,
			
 
				+            )
			
 
				+            result = await self.pattern_manager.insert_modes([mode_tuple])
			
 
				+            logger.info(f"成功记录模式: {mode.name}")
			
 
				+            return bool(result)
			
 
				+        except Exception as e:
			
 
				+            logger.error(f"记录模式失败: {mode.name}, 错误: {e}")
			
 
				+            print(traceback.format_exc())
			
 
				+            return False
			
 
				+
			
 
				+    async def record_output(self, output: OutputData) -> bool:
			
 
				+        """记录产物数据"""
			
 
				+        try:
			
 
				+            output_tuple = (
			
 
				+                output.id,
			
 
				+                output.type,
			
 
				+                output.description,
			
 
				+                output.content,
			
 
				+                output.constraints,
			
 
				+            )
			
 
				+            result = await self.pattern_manager.insert_outputs([output_tuple])
			
 
				+            logger.info(f"成功记录产物: {output.type}")
			
 
				+            return bool(result)
			
 
				+        except Exception as e:
			
 
				+            logger.error(f"记录产物失败: {output.type}, 错误: {e}")
			
 
				+            return False
			
 
				+
			
 
				+    @staticmethod
			
 
				+    def _validate_pattern_data(pattern: Dict) -> bool:
			
 
				+        """验证模式数据格式"""
			
 
				+        required_keys = ["维度模式分析"]
			
 
				+        if not all(key in pattern for key in required_keys):
			
 
				+            logger.error(f"模式数据缺少必要字段: {required_keys}")
			
 
				+            return False
			
 
				+
			
 
				+        dims = pattern["维度模式分析"]
			
 
				+        if not isinstance(dims, list):
			
 
				+            logger.error("维度模式分析必须是列表类型")
			
 
				+            return False
			
 
				+
			
 
				+        for dim in dims:
			
 
				+            if not all(key in dim for key in ["维度名称", "模式列表"]):
			
 
				+                logger.error("维度数据缺少必要字段")
			
 
				+                return False
			
 
				+
			
 
				+            for method in dim["模式列表"]:
			
 
				+                required_method_keys = [
			
 
				+                    "模式命名",
			
 
				+                    "模式占比",
			
 
				+                    "模式说明",
			
 
				+                    "分析详情",
			
 
				+                    "可复用产物",
			
 
				+                ]
			
 
				+                if not all(key in method for key in required_method_keys):
			
 
				+                    logger.error(f"模式数据缺少必要字段: {required_method_keys}")
			
 
				+                    return False
			
 
				+
			
 
				+                output = method["可复用产物"]
			
 
				+                required_output_keys = ["产物类型", "产物描述", "产物内容", "变量约束"]
			
 
				+                if not all(key in output for key in required_output_keys):
			
 
				+                    logger.error(f"产物数据缺少必要字段: {required_output_keys}")
			
 
				+                    return False
			
 
				+
			
 
				+        return True
			
 
				+
			
 
				+    @staticmethod
			
 
				+    def _extract_mode_data(method: Dict, dim_name: str) -> Optional[ModeData]:
			
 
				+        """提取模式数据"""
			
 
				+        try:
			
 
				+            mode_id = f"mode-{uuid.uuid4()}"
			
 
				+            output_id = f"output-{uuid.uuid4()}"
			
 
				+
			
 
				+            return ModeData(
			
 
				+                id=mode_id,
			
 
				+                name=method.get("模式命名", ""),
			
 
				+                percentage=method.get("模式占比", ""),
			
 
				+                description=method.get("模式说明", ""),
			
 
				+                detail=method.get("分析详情", ""),
			
 
				+                output_id=output_id,
			
 
				+                dimension_name=dim_name,
			
 
				+            )
			
 
				+        except Exception as e:
			
 
				+            logger.error(f"提取模式数据失败: {e}")
			
 
				+            return None
			
 
				+
			
 
				+    @staticmethod
			
 
				+    def _extract_output_data(output: Dict, output_id: str) -> Optional[OutputData]:
			
 
				+        """提取产物数据"""
			
 
				+        try:
			
 
				+            return OutputData(
			
 
				+                id=output_id,
			
 
				+                type=output.get("产物类型", ""),
			
 
				+                description=output.get("产物描述", ""),
			
 
				+                content=json.dumps(output.get("产物内容", {}), ensure_ascii=False),
			
 
				+                constraints=json.dumps(output.get("变量约束", {}), ensure_ascii=False),
			
 
				+            )
			
 
				+        except Exception as e:
			
 
				+            logger.error(f"提取产物数据失败: {e}")
			
 
				+            return None
			
 
				+
			
 
				+    async def deal(self, pattern: Dict) -> bool:
			
 
				+        """
			
 
				+        处理模式数据
			
 
				+
			
 
				+        Args:
			
 
				+            pattern: 模式数据字典
			
 
				+
			
 
				+        Returns:
			
 
				+            bool: 处理是否成功
			
 
				+        """
			
 
				+        # 验证数据格式
			
 
				+        if not self._validate_pattern_data(pattern):
			
 
				+            logger.error("模式数据格式验证失败")
			
 
				+            return False
			
 
				+
			
 
				+        dims = pattern["维度模式分析"]
			
 
				+        success_count = 0
			
 
				+        total_count = 0
			
 
				+
			
 
				+        for dim in dims:
			
 
				+            dim_name = dim["维度名称"]
			
 
				+
			
 
				+            for method in dim["模式列表"]:
			
 
				+                total_count += 1
			
 
				+
			
 
				+                # 提取模式数据
			
 
				+                mode_data = self._extract_mode_data(method, dim_name)
			
 
				+                if not mode_data:
			
 
				+                    logger.error(f"提取模式数据失败: {dim_name}")
			
 
				+                    continue
			
 
				+
			
 
				+                # 提取产物数据
			
 
				+                output = method["可复用产物"]
			
 
				+                output_data = self._extract_output_data(output, mode_data.output_id)
			
 
				+                print(output_data)
			
 
				+                if not output_data:
			
 
				+                    logger.error(f"提取产物数据失败: {mode_data.name}")
			
 
				+                    continue
			
 
				+
			
 
				+                # 记录数据
			
 
				+                mode_success = await self.record_mode(mode_data)
			
 
				+                output_success = await self.record_output(output_data)
			
 
				+
			
 
				+                if mode_success and output_success:
			
 
				+                    success_count += 1
			
 
				+                    logger.info(f"成功处理模式: {mode_data.name}")
			
 
				+                else:
			
 
				+                    logger.error(f"处理模式失败: {mode_data.name}")
			
 
				+
			
 
				+        success_rate = (success_count / total_count) * 100 if total_count > 0 else 0
			
 
				+        logger.info(
			
 
				+            f"模式处理完成: 成功 {success_count}/{total_count} ({success_rate:.1f}%)"
			
 
				+        )
			
 
				+
			
 
				+        return success_count > 0
			
--- a/applications/resource/resource_manager.py
+++ b/applications/resource/resource_manager.py
@@ -3,7 +3,7 @@ from neo4j import AsyncGraphDatabase, AsyncDriver
 
				 
			
 
				 from applications.config import NEO4j_CONFIG
			
 
				 from applications.utils.mysql import DatabaseManager
			
 
				-from applications.utils.milvus.field import fields
			
 
				+from applications.utils.milvus.field import fields, mode_fields
			
 
				 from applications.utils.elastic_search import AsyncElasticSearchClient
			
 
				 
			
 
				 
			
@@ -23,9 +23,9 @@ class ResourceManager:
 
				         connections.connect("default", **self.milvus_config)
			
 
				 
			
 
				         schema = CollectionSchema(
			
 
				-            fields, description="Chunk multi-vector embeddings with metadata"
			
 
				+            mode_fields, description="标准模式向量空间"
			
 
				         )
			
 
				-        self.milvus_client = Collection(name="chunk_multi_embeddings_v2", schema=schema)
			
 
				+        self.milvus_client = Collection(name="standard_mode_embeddings", schema=schema)
			
 
				 
			
 
				         # create index
			
 
				         vector_index_params = {
			
@@ -33,20 +33,20 @@ class ResourceManager:
 
				             "metric_type": "COSINE",
			
 
				             "params": {"M": 16, "efConstruction": 200},
			
 
				         }
			
 
				-        self.milvus_client.create_index("vector_text", vector_index_params)
			
 
				-        self.milvus_client.create_index("vector_summary", vector_index_params)
			
 
				-        self.milvus_client.create_index("vector_questions", vector_index_params)
			
 
				+        self.milvus_client.create_index("mode_vector", vector_index_params)
			
 
				         self.milvus_client.load()
			
 
				 
			
 
				+
			
 
				+
			
 
				     async def startup(self):
			
 
				         # 初始化 Elasticsearch
			
 
				-        self.es_client = AsyncElasticSearchClient(
			
 
				-            index_name=self.es_index, hosts=self.es_hosts, password=self.es_password
			
 
				-        )
			
 
				-        if await self.es_client.es.ping():
			
 
				-            print("✅ Elasticsearch connected")
			
 
				-        else:
			
 
				-            print("❌ Elasticsearch connection failed")
			
 
				+        # self.es_client = AsyncElasticSearchClient(
			
 
				+        #     index_name=self.es_index, hosts=self.es_hosts, password=self.es_password
			
 
				+        # )
			
 
				+        # if await self.es_client.es.ping():
			
 
				+        #     print("✅ Elasticsearch connected")
			
 
				+        # else:
			
 
				+        #     print("❌ Elasticsearch connection failed")
			
 
				 
			
 
				         # 初始化 MySQL
			
 
				         self.mysql_client = DatabaseManager()
			
@@ -57,10 +57,10 @@ class ResourceManager:
 
				         await self.load_milvus()
			
 
				         print("✅ Milvus loaded")
			
 
				 
			
 
				-        uri: str = NEO4j_CONFIG["url"]
			
 
				-        auth: tuple = NEO4j_CONFIG["user"], NEO4j_CONFIG["password"]
			
 
				-        self.graph_client = AsyncGraphDatabase.driver(uri=uri, auth=auth)
			
 
				-        print("✅ NEO4j loaded")
			
 
				+        # uri: str = NEO4j_CONFIG["url"]
			
 
				+        # auth: tuple = NEO4j_CONFIG["user"], NEO4j_CONFIG["password"]
			
 
				+        # self.graph_client = AsyncGraphDatabase.driver(uri=uri, auth=auth)
			
 
				+        # print("✅ NEO4j loaded")
			
 
				 
			
 
				     async def shutdown(self):
			
 
				         # 关闭 Elasticsearch
			
@@ -77,8 +77,8 @@ class ResourceManager:
 
				             await self.mysql_client.close_pools()
			
 
				             print("Mysql closed")
			
 
				 
			
 
				-        await self.graph_client.close()
			
 
				-        print("Graph closed")
			
 
				+        # await self.graph_client.close()
			
 
				+        # print("Graph closed")
			
 
				 
			
 
				 
			
 
				 _resource_manager: ResourceManager | None = None
			
--- a/applications/utils/milvus/__init__.py
+++ b/applications/utils/milvus/__init__.py
@@ -1,9 +1,11 @@
 
				 from .functions import async_insert_chunk, async_delete_chunk
			
 
				+from .functions import async_update_embedding
			
 
				 from .search import MilvusSearch
			
 
				 
			
 
				 
			
 
				 __all__ = [
			
 
				     "async_insert_chunk",
			
 
				     "async_delete_chunk",
			
 
				+    "async_update_embedding",
			
 
				     "MilvusSearch",
			
 
				 ]
			
--- a/applications/utils/milvus/field.py
+++ b/applications/utils/milvus/field.py
@@ -36,5 +36,26 @@ fields = [
 
				     ),
			
 
				 ]
			
 
				 
			
 
				+# pattern fields
			
 
				+mode_fields = [
			
 
				+    FieldSchema(
			
 
				+        name="id",
			
 
				+        dtype=DataType.INT64,
			
 
				+        is_primary=True,
			
 
				+        auto_id=True,
			
 
				+        description="自增id",
			
 
				+    ),
			
 
				+    # 文档 id 字段
			
 
				+    FieldSchema(
			
 
				+        name="mode_id", dtype=DataType.VARCHAR, max_length=64, description="模式id"
			
 
				+    ),
			
 
				+    FieldSchema(
			
 
				+            name="mode_vector",
			
 
				+            dtype=DataType.FLOAT_VECTOR,
			
 
				+            dim=2560,
			
 
				+            description="chunk文本 embedding",
			
 
				+        ),
			
 
				+]
			
 
				+
			
 
				 
			
 
				-__all__ = ["fields"]
			
 
				+__all__ = ["fields", "mode_fields"]
			
--- a/applications/utils/milvus/functions.py
+++ b/applications/utils/milvus/functions.py
@@ -13,6 +13,30 @@ async def async_insert_chunk(collection: pymilvus.Collection, data: Dict) -> Lis
 
				     result = await asyncio.to_thread(collection.insert, [data])
			
 
				     return result.primary_keys
			
 
				 
			
 
				+async def async_update_embedding(collection: pymilvus.Collection, data: Dict, flush: bool = True) -> List[int]:
			
 
				+
			
 
				+    """
			
 
				+    Update entities by ids from a Milvus collection asynchronously.
			
 
				+    :param collection: Milvus Collection object
			
 
				+    :param data: Dictionary of fields to update, with keys as field names and values as new values
			
 
				+    :param flush: Whether to flush the collection after update
			
 
				+    :return: List of primary key ids that were updated
			
 
				+    """
			
 
				+    result = await asyncio.to_thread(
			
 
				+        collection.upsert,
			
 
				+        data=data
			
 
				+    )
			
 
				+
			
 
				+    if flush:
			
 
				+        await asyncio.to_thread(collection.flush)
			
 
				+
			
 
				+    # Prefer server-returned PKs; fallback to input pk
			
 
				+    try:
			
 
				+        print("update successful")
			
 
				+        return list(result.primary_keys)
			
 
				+    except Exception:
			
 
				+        return [data['id']]
			
 
				+
			
 
				 
			
 
				 async def async_delete_chunk(
			
 
				     collection: pymilvus.Collection, ids: List[int]
			
--- a/applications/utils/mysql/__init__.py
+++ b/applications/utils/mysql/__init__.py
@@ -3,6 +3,7 @@ from .pool import DatabaseManager
 
				 from .mapper import Dataset, ChatResult
			
 
				 from .content_chunks import ContentChunks
			
 
				 from .contents import Contents
			
 
				+from .patterns import Patterns
			
 
				 
			
 
				 
			
 
				 __all__ = [
			
@@ -12,4 +13,5 @@ __all__ = [
 
				     "Dataset",
			
 
				     "ChatResult",
			
 
				     "Books",
			
 
				+    "Patterns",
			
 
				 ]
			
--- a/applications/utils/mysql/patterns.py
+++ b/applications/utils/mysql/patterns.py
@@ -0,0 +1,90 @@
 
				+from .base import BaseMySQLClient
			
 
				+
			
 
				+
			
 
				+class Patterns(BaseMySQLClient):
			
 
				+    """
			
 
				+    模式管理类，继承自基础MySQL客户端
			
 
				+    用于处理维度、模式和产物的数据库操作
			
 
				+    """
			
 
				+
			
 
				+    async def insert_dimensions(self, dimensions):
			
 
				+        """
			
 
				+        批量插入维度数据到数据库
			
 
				+
			
 
				+        Args:
			
 
				+            dimensions: 维度数据列表，每个元素包含(dim_name, dim_description, level)
			
 
				+                        - dim_name: 维度名称
			
 
				+                        - dim_description: 维度描述
			
 
				+                        - level: 维度层级
			
 
				+
			
 
				+        Returns:
			
 
				+            awaitable: 异步数据库操作结果
			
 
				+        """
			
 
				+        query = """
			
 
				+            INSERT IGNORE INTO dimensions (dim_name, dim_description, level)
			
 
				+                VALUES (%s, %s, %s);
			
 
				+        """
			
 
				+        return await self.pool.async_save(query=query, params=dimensions, batch=True)
			
 
				+
			
 
				+    async def update_dimension_status(self, dimension_id, ori_status, new_status):
			
 
				+        """
			
 
				+        更新维度状态
			
 
				+
			
 
				+        Args:
			
 
				+            dimension_id: 维度ID
			
 
				+            ori_status: 原始状态（用于条件检查）
			
 
				+            new_status: 新状态
			
 
				+
			
 
				+        Returns:
			
 
				+            awaitable: 异步数据库操作结果
			
 
				+        """
			
 
				+        query = """
			
 
				+            UPDATE dimensions SET status = %s WHERE id = %s AND status = %s;
			
 
				+        """
			
 
				+        return await self.pool.async_save(
			
 
				+            query=query, params=(new_status, dimension_id, ori_status)
			
 
				+        )
			
 
				+
			
 
				+    async def insert_modes(self, modes):
			
 
				+        """
			
 
				+        批量插入模式数据到数据库
			
 
				+
			
 
				+        Args:
			
 
				+            modes: 模式数据列表，每个元素包含(mode_id, name, mode_percentage, description, detail, output_id, dim_name)
			
 
				+                   - mode_id: 模式ID
			
 
				+                   - name: 模式名称
			
 
				+                   - mode_percentage: 模式占比
			
 
				+                   - description: 模式描述
			
 
				+                   - detail: 模式详情
			
 
				+                   - output_id: 关联的产物ID
			
 
				+                   - dim_name: 所属维度名称
			
 
				+
			
 
				+        Returns:
			
 
				+            awaitable: 异步数据库操作结果
			
 
				+        """
			
 
				+        query = """
			
 
				+            INSERT IGNORE INTO modes (mode_id, name, mode_percentage, description, detail, output_id, dim_name)
			
 
				+                VALUES (%s, %s, %s, %s, %s, %s, %s);
			
 
				+        """
			
 
				+        return await self.pool.async_save(query=query, params=modes, batch=True)
			
 
				+
			
 
				+    async def insert_outputs(self, outputs):
			
 
				+        """
			
 
				+        批量插入产物数据到数据库
			
 
				+
			
 
				+        Args:
			
 
				+            outputs: 产物数据列表，每个元素包含(output_id, output_type, description, content, constrains)
			
 
				+                     - output_id: 产物ID
			
 
				+                     - output_type: 产物类型
			
 
				+                     - description: 产物描述
			
 
				+                     - content: 产物内容
			
 
				+                     - constrains: 产物约束条件
			
 
				+
			
 
				+        Returns:
			
 
				+            awaitable: 异步数据库操作结果
			
 
				+        """
			
 
				+        query = """
			
 
				+            INSERT IGNORE INTO outputs (output_id, output_type, description, content, constrains)
			
 
				+                VALUES (%s, %s, %s, %s, %s);
			
 
				+        """
			
 
				+        return await self.pool.async_save(query=query, params=outputs, batch=True)
			
--- a/routes/blueprint.py
+++ b/routes/blueprint.py
@@ -12,6 +12,7 @@ from applications.api import get_basic_embedding
 
				 from applications.api import get_img_embedding
			
 
				 from applications.async_task import AutoRechunkTask, BuildGraph
			
 
				 from applications.async_task import ChunkEmbeddingTask, DeleteTask, ChunkBooksTask
			
 
				+from applications.async_task import RecordPattern
			
 
				 from applications.config import (
			
 
				     DEFAULT_MODEL,
			
 
				     LOCAL_MODEL_CONFIG,
			
@@ -27,6 +28,7 @@ from applications.utils.task.async_task import (
 
				     handle_books,
			
 
				     process_question,
			
 
				     query_search,
			
 
				+
			
 
				 )
			
 
				 
			
 
				 server_bp = Blueprint("api", __name__, url_prefix="/api")
			
@@ -578,3 +580,13 @@ async def process_book():
 
				     asyncio.create_task(handle_books())
			
 
				     # 返回立即响应
			
 
				     return jsonify({"status": "success", "message": "任务已提交后台处理"}), 200
			
 
				+
			
 
				+
			
 
				+@server_bp.route("/record/pattern", methods=["POST"])
			
 
				+async def record_pattern():
			
 
				+    body = await request.get_json()
			
 
				+    pattern = body.get("pattern", {})
			
 
				+    resource = get_resource_manager()
			
 
				+    record_pattern_task = RecordPattern(resource)
			
 
				+    await record_pattern_task.deal(pattern)
			
 
				+    return jsonify({"status_code": 200, "detail": "success", "data": {}})