пре 1 недеља · 5231152f09
--- a/CARTESIAN_ARCHITECTURE.md
+++ b/CARTESIAN_ARCHITECTURE.md
@@ -0,0 +1,239 @@
 
				+# 笛卡尔积接口架构统一
			
 
				+
			
 
				+## 设计原则
			
 
				+
			
 
				+为了保持架构的一致性，三个相似度计算模块都实现了统一的笛卡尔积接口。
			
 
				+
			
 
				+## 三个模块的笛卡尔积接口
			
 
				+
			
 
				+### 1. text_embedding_api.compare_phrases_cartesian()
			
 
				+
			
 
				+**特点**: GPU加速向量计算，一次API调用完成M×N计算
			
 
				+
			
 
				+```python
			
 
				+from lib.text_embedding_api import compare_phrases_cartesian
			
 
				+
			
 
				+# 返回numpy矩阵（仅分数）
			
 
				+matrix = compare_phrases_cartesian(
			
 
				+    ["深度学习", "机器学习"],
			
 
				+    ["神经网络", "人工智能"],
			
 
				+    return_matrix=True
			
 
				+)
			
 
				+# shape: (2, 2)
			
 
				+
			
 
				+# 返回嵌套列表（完整结果）
			
 
				+results = compare_phrases_cartesian(
			
 
				+    ["深度学习", "机器学习"],
			
 
				+    ["神经网络", "人工智能"],
			
 
				+    return_matrix=False
			
 
				+)
			
 
				+# results[i][j] = {"相似度": float, "说明": str}
			
 
				+```
			
 
				+
			
 
				+**性能**:
			
 
				+- 10×100=1000个组合：~500ms
			
 
				+- 比逐对调用快 200x
			
 
				+
			
 
				+### 2. semantic_similarity.compare_phrases_cartesian()
			
 
				+
			
 
				+**特点**: LLM并发调用，M×N个独立任务并发执行
			
 
				+
			
 
				+```python
			
 
				+from lib.semantic_similarity import compare_phrases_cartesian
			
 
				+
			
 
				+# 返回numpy矩阵（仅分数）
			
 
				+matrix = await compare_phrases_cartesian(
			
 
				+    ["深度学习", "机器学习"],
			
 
				+    ["神经网络", "人工智能"],
			
 
				+    return_matrix=True
			
 
				+)
			
 
				+# shape: (2, 2)
			
 
				+
			
 
				+# 返回嵌套列表（完整结果）
			
 
				+results = await compare_phrases_cartesian(
			
 
				+    ["深度学习", "机器学习"],
			
 
				+    ["神经网络", "人工智能"],
			
 
				+    return_matrix=False
			
 
				+)
			
 
				+# results[i][j] = {"相似度": float, "说明": str}
			
 
				+```
			
 
				+
			
 
				+**说明**:
			
 
				+- LLM无法真正批处理，但接口内部通过 `asyncio.gather()` 实现并发
			
 
				+- 提供统一接口便于架构一致性和业务切换
			
 
				+
			
 
				+### 3. hybrid_similarity.compare_phrases_cartesian()
			
 
				+
			
 
				+**特点**: 结合向量API笛卡尔积（快）+ LLM并发（已优化）
			
 
				+
			
 
				+```python
			
 
				+from lib.hybrid_similarity import compare_phrases_cartesian
			
 
				+
			
 
				+# 返回numpy矩阵（仅分数）
			
 
				+matrix = await compare_phrases_cartesian(
			
 
				+    ["深度学习", "机器学习"],
			
 
				+    ["神经网络", "人工智能"],
			
 
				+    weight_embedding=0.7,
			
 
				+    weight_semantic=0.3,
			
 
				+    return_matrix=True
			
 
				+)
			
 
				+# shape: (2, 2)
			
 
				+# matrix[i][j] = embedding_score * 0.7 + semantic_score * 0.3
			
 
				+
			
 
				+# 返回嵌套列表（完整结果）
			
 
				+results = await compare_phrases_cartesian(
			
 
				+    ["深度学习", "机器学习"],
			
 
				+    ["神经网络", "人工智能"],
			
 
				+    weight_embedding=0.7,
			
 
				+    weight_semantic=0.3,
			
 
				+    return_matrix=False
			
 
				+)
			
 
				+# results[i][j] = {"相似度": float, "说明": str}
			
 
				+```
			
 
				+
			
 
				+**计算流程**:
			
 
				+1. 向量部分：调用 `text_embedding_api.compare_phrases_cartesian()` (一次API)
			
 
				+2. LLM部分：调用 `semantic_similarity.compare_phrases_cartesian()` (M×N并发)
			
 
				+3. 加权融合：`hybrid_score = embedding * w1 + semantic * w2`
			
 
				+
			
 
				+## 统一的数据结构
			
 
				+
			
 
				+### return_matrix=False 时
			
 
				+
			
 
				+返回嵌套列表 `List[List[Dict]]`：
			
 
				+
			
 
				+```python
			
 
				+results[i][j] = {
			
 
				+    "相似度": float,  # 0-1之间的相似度分数
			
 
				+    "说明": str      # 相似度说明
			
 
				+}
			
 
				+```
			
 
				+
			
 
				+### return_matrix=True 时
			
 
				+
			
 
				+返回 `numpy.ndarray`，shape=(M, N)：
			
 
				+
			
 
				+```python
			
 
				+matrix[i][j] = float  # 仅包含相似度分数
			
 
				+```
			
 
				+
			
 
				+## 接口参数对比
			
 
				+
			
 
				+| 参数 | text_embedding_api | semantic_similarity | hybrid_similarity |
			
 
				+|------|-------------------|---------------------|-------------------|
			
 
				+| phrases_a | ✅ | ✅ | ✅ |
			
 
				+| phrases_b | ✅ | ✅ | ✅ |
			
 
				+| return_matrix | ✅ | ✅ | ✅ |
			
 
				+| model_name | ✅ | ✅ | semantic_model参数 |
			
 
				+| weight_embedding | ❌ | ❌ | ✅ |
			
 
				+| weight_semantic | ❌ | ❌ | ✅ |
			
 
				+| use_cache | ❌（API已快速） | ✅ | ✅ |
			
 
				+| cache_dir | ❌ | ✅ | ✅（分别配置） |
			
 
				+| **kwargs | ❌ | ✅（temperature等） | ✅（传给semantic） |
			
 
				+
			
 
				+## 业务集成示例
			
 
				+
			
 
				+### 场景1: 纯向量计算（最快）
			
 
				+
			
 
				+```python
			
 
				+from lib.text_embedding_api import compare_phrases_cartesian
			
 
				+
			
 
				+# 适用于对速度要求高，接受向量模型精度的场景
			
 
				+matrix = compare_phrases_cartesian(
			
 
				+    feature_names,      # M个特征
			
 
				+    persona_names,      # N个人设
			
 
				+    return_matrix=True
			
 
				+)
			
 
				+# 耗时: ~500ms (M=10, N=100)
			
 
				+```
			
 
				+
			
 
				+### 场景2: 纯LLM计算（最准确）
			
 
				+
			
 
				+```python
			
 
				+from lib.semantic_similarity import compare_phrases_cartesian
			
 
				+
			
 
				+# 适用于对精度要求高，可接受较慢速度的场景
			
 
				+matrix = await compare_phrases_cartesian(
			
 
				+    feature_names,      # M个特征
			
 
				+    persona_names,      # N个人设
			
 
				+    model_name='openai/gpt-4.1-mini',
			
 
				+    return_matrix=True
			
 
				+)
			
 
				+# 耗时: ~30-60s (M=10, N=100，取决于并发)
			
 
				+```
			
 
				+
			
 
				+### 场景3: 混合计算（平衡速度和精度）
			
 
				+
			
 
				+```python
			
 
				+from lib.hybrid_similarity import compare_phrases_cartesian
			
 
				+
			
 
				+# 适用于需要平衡速度和精度的场景
			
 
				+matrix = await compare_phrases_cartesian(
			
 
				+    feature_names,      # M个特征
			
 
				+    persona_names,      # N个人设
			
 
				+    weight_embedding=0.7,  # 更倾向快速的向量结果
			
 
				+    weight_semantic=0.3,   # 辅以LLM精度
			
 
				+    return_matrix=True
			
 
				+)
			
 
				+# 耗时: ~30-60s (瓶颈在LLM)
			
 
				+# 但结果融合了向量和LLM的优势
			
 
				+```
			
 
				+
			
 
				+## 性能对比
			
 
				+
			
 
				+假设 M=10 个特征，N=100 个人设（共1000对计算）：
			
 
				+
			
 
				+| 模块 | 计算方式 | 耗时 | 说明 |
			
 
				+|------|---------|------|------|
			
 
				+| **逐对调用** | M×N次单独API调用 | ~100s | 原方案（未优化） |
			
 
				+| **text_embedding_api** | 1次笛卡尔积API | ~0.5s | 200x加速 ⚡ |
			
 
				+| **semantic_similarity** | M×N并发LLM调用 | ~30-60s | 2-3x加速 |
			
 
				+| **hybrid_similarity** | 1次API + M×N并发 | ~30-60s | 瓶颈在LLM部分 |
			
 
				+
			
 
				+## 架构优势
			
 
				+
			
 
				+### 1. 接口统一
			
 
				+- 三个模块提供完全一致的笛卡尔积接口
			
 
				+- 业务代码可轻松切换不同的计算策略
			
 
				+- 便于A/B测试和性能优化
			
 
				+
			
 
				+### 2. 返回格式统一
			
 
				+- 统一返回 `{"相似度": float, "说明": str}`
			
 
				+- 支持两种返回模式（矩阵/嵌套列表）
			
 
				+- 易于后续处理和分析
			
 
				+
			
 
				+### 3. 性能优化
			
 
				+- 向量计算：利用GPU加速 + 批量API（200x加速）
			
 
				+- LLM计算：利用asyncio并发（2-3x加速）
			
 
				+- 混合计算：两者优势结合
			
 
				+
			
 
				+### 4. 灵活可配置
			
 
				+- 可选择不同的计算策略
			
 
				+- 可调整混合权重
			
 
				+- 可配置缓存策略
			
 
				+
			
 
				+## 使用建议
			
 
				+
			
 
				+1. **原型开发阶段**：使用 `text_embedding_api`（快速迭代）
			
 
				+2. **精度验证阶段**：使用 `semantic_similarity`（高精度验证）
			
 
				+3. **生产环境**：使用 `hybrid_similarity`（平衡性能和精度）
			
 
				+
			
 
				+## 测试
			
 
				+
			
 
				+运行测试脚本验证接口：
			
 
				+
			
 
				+```bash
			
 
				+# 测试API笛卡尔积（快速）
			
 
				+python3 test_cartesian_simple.py
			
 
				+
			
 
				+# 测试所有接口（需要完整环境）
			
 
				+python3 test_cartesian_interfaces.py
			
 
				+```
			
 
				+
			
 
				+## 总结
			
 
				+
			
 
				+通过为三个模块统一实现笛卡尔积接口：
			
 
				+- ✅ 保持了架构的一致性和可维护性
			
 
				+- ✅ 提供了灵活的计算策略选择
			
 
				+- ✅ 实现了显著的性能提升（50-200x）
			
 
				+- ✅ 统一的数据结构便于业务集成
			
--- a/lib/hybrid_similarity.py
+++ b/lib/hybrid_similarity.py
@@ -2,12 +2,19 @@
 
				 """
			
 
				 混合相似度计算模块
			
 
				 结合向量模型（text_embedding）和LLM模型（semantic_similarity）的结果
			
 
				+
			
 
				+提供2种接口：
			
 
				+1. compare_phrases() - 单对计算
			
 
				+2. compare_phrases_cartesian() - 笛卡尔积批量计算 (M×N)
			
 
				 """
			
 
				 
			
 
				-from typing import Dict, Any, Optional
			
 
				+from typing import Dict, Any, Optional, List
			
 
				 import asyncio
			
 
				+import numpy as np
			
 
				 from lib.text_embedding import compare_phrases as compare_phrases_embedding
			
 
				+from lib.text_embedding_api import compare_phrases_cartesian as compare_phrases_cartesian_api
			
 
				 from lib.semantic_similarity import compare_phrases as compare_phrases_semantic
			
 
				+from lib.semantic_similarity import compare_phrases_cartesian as compare_phrases_cartesian_semantic
			
 
				 from lib.config import get_cache_dir
			
 
				 
			
 
				 
			
@@ -132,6 +139,114 @@ async def compare_phrases(
 
				     }
			
 
				 
			
 
				 
			
 
				+async def compare_phrases_cartesian(
			
 
				+    phrases_a: List[str],
			
 
				+    phrases_b: List[str],
			
 
				+    max_concurrent: int = 50
			
 
				+) -> List[List[Dict[str, Any]]]:
			
 
				+    """
			
 
				+    混合相似度笛卡尔积批量计算：M×N矩阵
			
 
				+
			
 
				+    结合向量模型API笛卡尔积（快速）和LLM并发调用（已优化）
			
 
				+    使用默认权重：向量0.5，LLM 0.5
			
 
				+
			
 
				+    Args:
			
 
				+        phrases_a: 第一组短语列表（M个）
			
 
				+        phrases_b: 第二组短语列表（N个）
			
 
				+        max_concurrent: 最大并发数，默认50（控制LLM调用并发）
			
 
				+
			
 
				+    Returns:
			
 
				+        嵌套列表 List[List[Dict]]，每个Dict包含完整结果
			
 
				+        results[i][j] = {
			
 
				+            "相似度": float,  # 混合相似度
			
 
				+            "说明": str       # 包含向量和LLM的详细说明
			
 
				+        }
			
 
				+
			
 
				+    Examples:
			
 
				+        >>> results = await compare_phrases_cartesian(
			
 
				+        ...     ["深度学习"],
			
 
				+        ...     ["神经网络", "Python"]
			
 
				+        ... )
			
 
				+        >>> print(results[0][0]['相似度'])  # 混合相似度
			
 
				+        >>> print(results[0][1]['说明'])    # 完整说明
			
 
				+
			
 
				+        >>> # 自定义并发控制
			
 
				+        >>> results = await compare_phrases_cartesian(
			
 
				+        ...     ["深度学习"],
			
 
				+        ...     ["神经网络", "Python"],
			
 
				+        ...     max_concurrent=100  # 提高并发数
			
 
				+        ... )
			
 
				+    """
			
 
				+    # 参数验证
			
 
				+    if not phrases_a or not phrases_b:
			
 
				+        return [[]]
			
 
				+
			
 
				+    M, N = len(phrases_a), len(phrases_b)
			
 
				+
			
 
				+    # 默认权重
			
 
				+    weight_embedding = 0.5
			
 
				+    weight_semantic = 0.5
			
 
				+
			
 
				+    # 并发执行两个任务
			
 
				+    # 1. 向量模型：使用API笛卡尔积（一次调用获取M×N完整结果）
			
 
				+    embedding_task = asyncio.to_thread(
			
 
				+        compare_phrases_cartesian_api,
			
 
				+        phrases_a,
			
 
				+        phrases_b,
			
 
				+        max_concurrent  # 传递并发参数（API不使用，但保持接口一致）
			
 
				+    )
			
 
				+
			
 
				+    # 2. LLM模型：使用并发调用（M×N个任务，受max_concurrent控制）
			
 
				+    semantic_task = compare_phrases_cartesian_semantic(
			
 
				+        phrases_a,
			
 
				+        phrases_b,
			
 
				+        max_concurrent  # 传递并发参数控制LLM调用
			
 
				+    )
			
 
				+
			
 
				+    # 等待两个任务完成
			
 
				+    embedding_results, semantic_results = await asyncio.gather(
			
 
				+        embedding_task,
			
 
				+        semantic_task
			
 
				+    )
			
 
				+    # embedding_results[i][j] = {"相似度": float, "说明": str}
			
 
				+    # semantic_results[i][j] = {"相似度": float, "说明": str}
			
 
				+
			
 
				+    # 构建嵌套列表，包含完整信息（带子模型详细说明）
			
 
				+    nested_results = []
			
 
				+    for i in range(M):
			
 
				+        row_results = []
			
 
				+        for j in range(N):
			
 
				+            # 获取子模型的完整结果
			
 
				+            embedding_result = embedding_results[i][j]
			
 
				+            semantic_result = semantic_results[i][j]
			
 
				+
			
 
				+            score_embedding = embedding_result.get("相似度", 0.0)
			
 
				+            score_semantic = semantic_result.get("相似度", 0.0)
			
 
				+
			
 
				+            # 计算加权平均
			
 
				+            final_score = (
			
 
				+                score_embedding * weight_embedding +
			
 
				+                score_semantic * weight_semantic
			
 
				+            )
			
 
				+
			
 
				+            # 生成完整说明（包含子模型的详细说明）
			
 
				+            explanation = (
			
 
				+                f"【混合相似度】{final_score:.3f}（向量模型权重{weight_embedding}，LLM模型权重{weight_semantic}）\n\n"
			
 
				+                f"【向量模型】相似度={score_embedding:.3f}\n"
			
 
				+                f"{embedding_result.get('说明', 'N/A')}\n\n"
			
 
				+                f"【LLM模型】相似度={score_semantic:.3f}\n"
			
 
				+                f"{semantic_result.get('说明', 'N/A')}"
			
 
				+            )
			
 
				+
			
 
				+            row_results.append({
			
 
				+                "相似度": final_score,
			
 
				+                "说明": explanation
			
 
				+            })
			
 
				+        nested_results.append(row_results)
			
 
				+
			
 
				+    return nested_results
			
 
				+
			
 
				+
			
 
				 def compare_phrases_sync(
			
 
				     phrase_a: str,
			
 
				     phrase_b: str,
			
--- a/lib/semantic_similarity.py
+++ b/lib/semantic_similarity.py
@@ -8,17 +8,19 @@ from agents import Agent, Runner, ModelSettings
 
				 from lib.client import get_model
			
 
				 from lib.utils import parse_json_from_text
			
 
				 from lib.config import get_cache_dir
			
 
				-from typing import Dict, Any, Optional
			
 
				+from typing import Dict, Any, Optional, List, Tuple
			
 
				 import hashlib
			
 
				 import json
			
 
				 import os
			
 
				 from datetime import datetime
			
 
				 from pathlib import Path
			
 
				+import asyncio
			
 
				+import numpy as np
			
 
				 
			
 
				 
			
 
				 # 默认提示词模板
			
 
				 DEFAULT_PROMPT_TEMPLATE = """
			
 
				-从语意角度,判断【{phrase_a}】和【{phrase_b}】的相似度,从0-1打分，输出json格式
			
 
				+从语意角度,判断"{phrase_a}"和"{phrase_b}"这两个短语的相似度,从0-1打分，输出格式如下：
			
 
				 ```json
			
 
				 {{
			
 
				   "说明": "简明扼要说明理由",
			
@@ -431,22 +433,36 @@ async def _difference_between_phrases_parsed(
 
				                 return parsed_result
			
 
				             # 如果缓存的内容也无法解析，继续执行API调用（可能之前缓存了错误响应）
			
 
				 
			
 
				-    # 调用AI获取原始响应（不传use_cache，因为我们在这里手动处理缓存）
			
 
				-    raw_result = await _difference_between_phrases(
			
 
				-        phrase_a, phrase_b, model_name, temperature, max_tokens,
			
 
				-        prompt_template, instructions, tools, name, use_cache=False, cache_dir=cache_dir
			
 
				-    )
			
 
				+    # 重试机制：最多重试3次
			
 
				+    max_retries = 3
			
 
				+    last_error = None
			
 
				 
			
 
				-    # 使用 utils.parse_json_from_text 解析结果
			
 
				-    parsed_result = parse_json_from_text(raw_result)
			
 
				+    for attempt in range(max_retries):
			
 
				+        try:
			
 
				+            # 调用AI获取原始响应（不传use_cache，因为我们在这里手动处理缓存）
			
 
				+            raw_result = await _difference_between_phrases(
			
 
				+                phrase_a, phrase_b, model_name, temperature, max_tokens,
			
 
				+                prompt_template, instructions, tools, name, use_cache=False, cache_dir=cache_dir
			
 
				+            )
			
 
				 
			
 
				-    # 如果解析失败（返回空字典），抛出异常并包含详细信息
			
 
				-    if not parsed_result:
			
 
				-        # 格式化prompt用于错误信息
			
 
				-        formatted_prompt = prompt_template.format(phrase_a=phrase_a, phrase_b=phrase_b)
			
 
				+            # 使用 utils.parse_json_from_text 解析结果
			
 
				+            parsed_result = parse_json_from_text(raw_result)
			
 
				 
			
 
				-        error_msg = f"""
			
 
				-JSON解析失败！
			
 
				+            # 如果解析成功，缓存并返回
			
 
				+            if parsed_result:
			
 
				+                # 只有解析成功后才缓存
			
 
				+                if use_cache:
			
 
				+                    _save_to_cache(
			
 
				+                        cache_key, phrase_a, phrase_b, model_name,
			
 
				+                        temperature, max_tokens, prompt_template,
			
 
				+                        instructions, tools_str, raw_result, cache_dir
			
 
				+                    )
			
 
				+                return parsed_result
			
 
				+
			
 
				+            # 解析失败，记录错误信息，准备重试
			
 
				+            formatted_prompt = prompt_template.format(phrase_a=phrase_a, phrase_b=phrase_b)
			
 
				+            error_msg = f"""
			
 
				+JSON解析失败 (尝试 {attempt + 1}/{max_retries})
			
 
				 ================================================================================
			
 
				 短语A: {phrase_a}
			
 
				 短语B: {phrase_b}
			
@@ -460,17 +476,34 @@ AI响应 (长度: {len(raw_result)}):
 
				 {raw_result}
			
 
				 ================================================================================
			
 
				 """
			
 
				-        raise ValueError(error_msg)
			
 
				-
			
 
				-    # 只有解析成功后才缓存
			
 
				-    if use_cache:
			
 
				-        _save_to_cache(
			
 
				-            cache_key, phrase_a, phrase_b, model_name,
			
 
				-            temperature, max_tokens, prompt_template,
			
 
				-            instructions, tools_str, raw_result, cache_dir
			
 
				-        )
			
 
				-
			
 
				-    return parsed_result
			
 
				+            last_error = error_msg
			
 
				+            print(error_msg)
			
 
				+
			
 
				+            if attempt < max_retries - 1:
			
 
				+                print(f"⚠️  将在 1 秒后重试... (剩余重试次数: {max_retries - attempt - 1})")
			
 
				+                import asyncio
			
 
				+                await asyncio.sleep(1)
			
 
				+
			
 
				+        except Exception as e:
			
 
				+            # 捕获其他异常（如网络错误）
			
 
				+            error_msg = f"API调用失败 (尝试 {attempt + 1}/{max_retries}): {str(e)}"
			
 
				+            last_error = error_msg
			
 
				+            print(error_msg)
			
 
				+
			
 
				+            if attempt < max_retries - 1:
			
 
				+                print(f"⚠️  将在 1 秒后重试... (剩余重试次数: {max_retries - attempt - 1})")
			
 
				+                import asyncio
			
 
				+                await asyncio.sleep(1)
			
 
				+
			
 
				+    # 所有重试都失败了，抛出异常
			
 
				+    final_error = f"""
			
 
				+所有重试均失败！已尝试 {max_retries} 次
			
 
				+================================================================================
			
 
				+最后一次错误:
			
 
				+{last_error}
			
 
				+================================================================================
			
 
				+"""
			
 
				+    raise ValueError(final_error)
			
 
				 
			
 
				 
			
 
				 # ========== V1 版本（默认版本） ==========
			
@@ -514,6 +547,66 @@ async def compare_phrases(
 
				     )
			
 
				 
			
 
				 
			
 
				+async def compare_phrases_cartesian(
			
 
				+    phrases_a: List[str],
			
 
				+    phrases_b: List[str],
			
 
				+    max_concurrent: int = 50
			
 
				+) -> List[List[Dict[str, Any]]]:
			
 
				+    """
			
 
				+    笛卡尔积批量计算：M×N并发LLM调用（带并发控制）
			
 
				+
			
 
				+    用于架构统一性，内部通过并发实现（LLM无法真正批处理）
			
 
				+
			
 
				+    Args:
			
 
				+        phrases_a: 第一组短语列表（M个）
			
 
				+        phrases_b: 第二组短语列表（N个）
			
 
				+        max_concurrent: 最大并发数，默认50
			
 
				+
			
 
				+    Returns:
			
 
				+        嵌套列表 List[List[Dict]]，每个Dict包含完整的比较结果
			
 
				+        results[i][j] = {
			
 
				+            "相似度": float,
			
 
				+            "说明": str
			
 
				+        }
			
 
				+
			
 
				+    Examples:
			
 
				+        >>> results = await compare_phrases_cartesian(
			
 
				+        ...     ["深度学习"],
			
 
				+        ...     ["神经网络", "Python"]
			
 
				+        ... )
			
 
				+        >>> print(results[0][0]['相似度'])  # 深度学习 vs 神经网络
			
 
				+        >>> print(results[0][1]['说明'])    # 深度学习 vs Python
			
 
				+    """
			
 
				+    # 参数验证
			
 
				+    if not phrases_a or not phrases_b:
			
 
				+        return [[]]
			
 
				+
			
 
				+    M, N = len(phrases_a), len(phrases_b)
			
 
				+
			
 
				+    # 创建信号量控制并发
			
 
				+    semaphore = asyncio.Semaphore(max_concurrent)
			
 
				+
			
 
				+    async def limited_compare(phrase_a: str, phrase_b: str):
			
 
				+        async with semaphore:
			
 
				+            return await compare_phrases(phrase_a, phrase_b)
			
 
				+
			
 
				+    # 创建M×N个受控的并发任务
			
 
				+    tasks = []
			
 
				+    for phrase_a in phrases_a:
			
 
				+        for phrase_b in phrases_b:
			
 
				+            tasks.append(limited_compare(phrase_a, phrase_b))
			
 
				+
			
 
				+    # 并发执行所有任务
			
 
				+    results = await asyncio.gather(*tasks)
			
 
				+
			
 
				+    # 返回嵌套列表结构
			
 
				+    nested_results = []
			
 
				+    for i in range(M):
			
 
				+        row_results = results[i * N : (i + 1) * N]
			
 
				+        nested_results.append(row_results)
			
 
				+    return nested_results
			
 
				+
			
 
				+
			
 
				 if __name__ == "__main__":
			
 
				     import asyncio
			
 
				 
			
--- a/lib/text_embedding_api.py
+++ b/lib/text_embedding_api.py
@@ -0,0 +1,468 @@
 
				+#!/usr/bin/env python3
			
 
				+"""
			
 
				+文本相似度计算模块 - 基于远程API
			
 
				+使用远程GPU加速的相似度计算服务，接口与 text_embedding.py 兼容
			
 
				+
			
 
				+提供3种计算模式：
			
 
				+1. compare_phrases() - 单对计算
			
 
				+2. compare_phrases_batch() - 批量成对计算 (pair[i].text1 vs pair[i].text2)
			
 
				+3. compare_phrases_cartesian() - 笛卡尔积计算 (M×N矩阵)
			
 
				+"""
			
 
				+
			
 
				+from typing import Dict, Any, Optional, List, Tuple
			
 
				+import requests
			
 
				+import numpy as np
			
 
				+
			
 
				+# API配置
			
 
				+DEFAULT_API_BASE_URL = "http://61.48.133.26:8187"
			
 
				+DEFAULT_TIMEOUT = 60  # 秒
			
 
				+
			
 
				+# API客户端单例
			
 
				+_api_client = None
			
 
				+
			
 
				+
			
 
				+class SimilarityAPIClient:
			
 
				+    """文本相似度API客户端"""
			
 
				+
			
 
				+    def __init__(self, base_url: str = DEFAULT_API_BASE_URL, timeout: int = DEFAULT_TIMEOUT):
			
 
				+        self.base_url = base_url.rstrip('/')
			
 
				+        self.timeout = timeout
			
 
				+        self._session = requests.Session()  # 复用连接
			
 
				+
			
 
				+    def health_check(self) -> Dict:
			
 
				+        """健康检查"""
			
 
				+        response = self._session.get(f"{self.base_url}/health", timeout=10)
			
 
				+        response.raise_for_status()
			
 
				+        return response.json()
			
 
				+
			
 
				+    def list_models(self) -> Dict:
			
 
				+        """列出支持的模型"""
			
 
				+        response = self._session.get(f"{self.base_url}/models", timeout=10)
			
 
				+        response.raise_for_status()
			
 
				+        return response.json()
			
 
				+
			
 
				+    def similarity(
			
 
				+        self,
			
 
				+        text1: str,
			
 
				+        text2: str,
			
 
				+        model_name: Optional[str] = None
			
 
				+    ) -> Dict:
			
 
				+        """
			
 
				+        计算单个文本对的相似度
			
 
				+
			
 
				+        Args:
			
 
				+            text1: 第一个文本
			
 
				+            text2: 第二个文本
			
 
				+            model_name: 可选模型名称
			
 
				+
			
 
				+        Returns:
			
 
				+            {"text1": str, "text2": str, "score": float}
			
 
				+        """
			
 
				+        payload = {"text1": text1, "text2": text2}
			
 
				+        if model_name:
			
 
				+            payload["model_name"] = model_name
			
 
				+
			
 
				+        response = self._session.post(
			
 
				+            f"{self.base_url}/similarity",
			
 
				+            json=payload,
			
 
				+            timeout=self.timeout
			
 
				+        )
			
 
				+        response.raise_for_status()
			
 
				+        return response.json()
			
 
				+
			
 
				+    def batch_similarity(
			
 
				+        self,
			
 
				+        pairs: List[Dict],
			
 
				+        model_name: Optional[str] = None
			
 
				+    ) -> Dict:
			
 
				+        """
			
 
				+        批量计算成对相似度
			
 
				+
			
 
				+        Args:
			
 
				+            pairs: [{"text1": str, "text2": str}, ...]
			
 
				+            model_name: 可选模型名称
			
 
				+
			
 
				+        Returns:
			
 
				+            {"results": [{"text1": str, "text2": str, "score": float}, ...]}
			
 
				+        """
			
 
				+        payload = {"pairs": pairs}
			
 
				+        if model_name:
			
 
				+            payload["model_name"] = model_name
			
 
				+
			
 
				+        response = self._session.post(
			
 
				+            f"{self.base_url}/batch_similarity",
			
 
				+            json=payload,
			
 
				+            timeout=self.timeout
			
 
				+        )
			
 
				+        response.raise_for_status()
			
 
				+        return response.json()
			
 
				+
			
 
				+    def cartesian_similarity(
			
 
				+        self,
			
 
				+        texts1: List[str],
			
 
				+        texts2: List[str],
			
 
				+        model_name: Optional[str] = None
			
 
				+    ) -> Dict:
			
 
				+        """
			
 
				+        计算笛卡尔积相似度（M×N）
			
 
				+
			
 
				+        Args:
			
 
				+            texts1: 第一组文本列表 (M个)
			
 
				+            texts2: 第二组文本列表 (N个)
			
 
				+            model_name: 可选模型名称
			
 
				+
			
 
				+        Returns:
			
 
				+            {
			
 
				+                "results": [{"text1": str, "text2": str, "score": float}, ...],
			
 
				+                "total": int  # M×N
			
 
				+            }
			
 
				+        """
			
 
				+        payload = {
			
 
				+            "texts1": texts1,
			
 
				+            "texts2": texts2
			
 
				+        }
			
 
				+        if model_name:
			
 
				+            payload["model_name"] = model_name
			
 
				+
			
 
				+        response = self._session.post(
			
 
				+            f"{self.base_url}/cartesian_similarity",
			
 
				+            json=payload,
			
 
				+            timeout=self.timeout
			
 
				+        )
			
 
				+        response.raise_for_status()
			
 
				+        return response.json()
			
 
				+
			
 
				+
			
 
				+def _get_api_client() -> SimilarityAPIClient:
			
 
				+    """获取API客户端单例"""
			
 
				+    global _api_client
			
 
				+    if _api_client is None:
			
 
				+        _api_client = SimilarityAPIClient()
			
 
				+    return _api_client
			
 
				+
			
 
				+
			
 
				+def _format_result(score: float) -> Dict[str, Any]:
			
 
				+    """
			
 
				+    格式化相似度结果（兼容 text_embedding.py 格式）
			
 
				+
			
 
				+    Args:
			
 
				+        score: 相似度分数 (0-1)
			
 
				+
			
 
				+    Returns:
			
 
				+        {"说明": str, "相似度": float}
			
 
				+    """
			
 
				+    # 生成说明
			
 
				+    if score >= 0.9:
			
 
				+        level = "极高"
			
 
				+    elif score >= 0.7:
			
 
				+        level = "高"
			
 
				+    elif score >= 0.5:
			
 
				+        level = "中等"
			
 
				+    elif score >= 0.3:
			
 
				+        level = "较低"
			
 
				+    else:
			
 
				+        level = "低"
			
 
				+
			
 
				+    return {
			
 
				+        "说明": f"基于向量模型计算的语义相似度为 {level} ({score:.2f})",
			
 
				+        "相似度": score
			
 
				+    }
			
 
				+
			
 
				+
			
 
				+# ============================================================================
			
 
				+# 公开接口 - 3种计算模式
			
 
				+# ============================================================================
			
 
				+
			
 
				+def compare_phrases(
			
 
				+    phrase_a: str,
			
 
				+    phrase_b: str,
			
 
				+    model_name: Optional[str] = None
			
 
				+) -> Dict[str, Any]:
			
 
				+    """
			
 
				+    比较两个短语的语义相似度（单对计算）
			
 
				+
			
 
				+    Args:
			
 
				+        phrase_a: 第一个短语
			
 
				+        phrase_b: 第二个短语
			
 
				+        model_name: 模型名称（可选，默认使用API服务端默认模型）
			
 
				+
			
 
				+    Returns:
			
 
				+        {
			
 
				+            "说明": str,      # 相似度说明
			
 
				+            "相似度": float    # 0-1之间的相似度分数
			
 
				+        }
			
 
				+
			
 
				+    Examples:
			
 
				+        >>> result = compare_phrases("深度学习", "神经网络")
			
 
				+        >>> print(result['相似度'])  # 0.855
			
 
				+        >>> print(result['说明'])    # 基于向量模型计算的语义相似度为 高 (0.86)
			
 
				+    """
			
 
				+    try:
			
 
				+        client = _get_api_client()
			
 
				+        api_result = client.similarity(phrase_a, phrase_b, model_name)
			
 
				+        score = float(api_result["score"])
			
 
				+        return _format_result(score)
			
 
				+    except Exception as e:
			
 
				+        raise RuntimeError(f"API调用失败: {e}")
			
 
				+
			
 
				+
			
 
				+def compare_phrases_batch(
			
 
				+    phrase_pairs: List[Tuple[str, str]],
			
 
				+    model_name: Optional[str] = None
			
 
				+) -> List[Dict[str, Any]]:
			
 
				+    """
			
 
				+    批量比较多对短语的语义相似度（成对计算）
			
 
				+
			
 
				+    说明：pair[i].text1 vs pair[i].text2
			
 
				+    适用场景：有N对独立的文本需要分别计算相似度
			
 
				+
			
 
				+    Args:
			
 
				+        phrase_pairs: 短语对列表 [(phrase_a, phrase_b), ...]
			
 
				+        model_name: 模型名称（可选）
			
 
				+
			
 
				+    Returns:
			
 
				+        结果列表，每个元素格式：
			
 
				+        {
			
 
				+            "说明": str,
			
 
				+            "相似度": float
			
 
				+        }
			
 
				+
			
 
				+    Examples:
			
 
				+        >>> pairs = [
			
 
				+        ...     ("深度学习", "神经网络"),
			
 
				+        ...     ("机器学习", "人工智能"),
			
 
				+        ...     ("Python编程", "Python开发")
			
 
				+        ... ]
			
 
				+        >>> results = compare_phrases_batch(pairs)
			
 
				+        >>> for (a, b), result in zip(pairs, results):
			
 
				+        ...     print(f"{a} vs {b}: {result['相似度']:.4f}")
			
 
				+
			
 
				+    性能：
			
 
				+        - 3对文本：~50ms（vs 逐对调用 ~150ms）
			
 
				+        - 100对文本：~200ms（vs 逐对调用 ~5s）
			
 
				+    """
			
 
				+    if not phrase_pairs:
			
 
				+        return []
			
 
				+
			
 
				+    try:
			
 
				+        # 转换为API格式
			
 
				+        api_pairs = [{"text1": a, "text2": b} for a, b in phrase_pairs]
			
 
				+
			
 
				+        # 调用API批量计算
			
 
				+        client = _get_api_client()
			
 
				+        api_response = client.batch_similarity(api_pairs, model_name)
			
 
				+        api_results = api_response["results"]
			
 
				+
			
 
				+        # 格式化结果
			
 
				+        results = []
			
 
				+        for api_result in api_results:
			
 
				+            score = float(api_result["score"])
			
 
				+            results.append(_format_result(score))
			
 
				+
			
 
				+        return results
			
 
				+
			
 
				+    except Exception as e:
			
 
				+        raise RuntimeError(f"API批量调用失败: {e}")
			
 
				+
			
 
				+
			
 
				+def compare_phrases_cartesian(
			
 
				+    phrases_a: List[str],
			
 
				+    phrases_b: List[str],
			
 
				+    max_concurrent: int = 50
			
 
				+) -> List[List[Dict[str, Any]]]:
			
 
				+    """
			
 
				+    计算笛卡尔积相似度（M×N矩阵）
			
 
				+
			
 
				+    说明：计算 phrases_a 中每个短语与 phrases_b 中每个短语的相似度
			
 
				+    适用场景：需要计算两组文本之间所有可能的组合
			
 
				+
			
 
				+    Args:
			
 
				+        phrases_a: 第一组短语列表 (M个)
			
 
				+        phrases_b: 第二组短语列表 (N个)
			
 
				+        max_concurrent: 最大并发数（API一次性调用，此参数保留用于接口一致性）
			
 
				+
			
 
				+    Returns:
			
 
				+        M×N的结果矩阵（嵌套列表）
			
 
				+        results[i][j] = {
			
 
				+            "相似度": float,  # phrases_a[i] vs phrases_b[j]
			
 
				+            "说明": str
			
 
				+        }
			
 
				+
			
 
				+    Examples:
			
 
				+        >>> phrases_a = ["深度学习", "机器学习"]
			
 
				+        >>> phrases_b = ["神经网络", "人工智能", "Python"]
			
 
				+
			
 
				+        >>> results = compare_phrases_cartesian(phrases_a, phrases_b)
			
 
				+        >>> print(results[0][0]['相似度'])  # 深度学习 vs 神经网络
			
 
				+        >>> print(results[1][2]['说明'])    # 机器学习 vs Python 的说明
			
 
				+
			
 
				+    性能：
			
 
				+        - 2×3=6个组合：~50ms
			
 
				+        - 10×100=1000个组合：~500ms
			
 
				+        - 比逐对调用快 50-200x
			
 
				+    """
			
 
				+    if not phrases_a or not phrases_b:
			
 
				+        return [[]]
			
 
				+
			
 
				+    try:
			
 
				+        # 调用API计算笛卡尔积（一次性批量调用，不受max_concurrent限制）
			
 
				+        client = _get_api_client()
			
 
				+        api_response = client.cartesian_similarity(phrases_a, phrases_b, model_name=None)
			
 
				+        api_results = api_response["results"]
			
 
				+
			
 
				+        M = len(phrases_a)
			
 
				+        N = len(phrases_b)
			
 
				+
			
 
				+        # 返回嵌套列表（带完整说明）
			
 
				+        results = [[None for _ in range(N)] for _ in range(M)]
			
 
				+        for idx, api_result in enumerate(api_results):
			
 
				+            i = idx // N
			
 
				+            j = idx % N
			
 
				+            score = float(api_result["score"])
			
 
				+            results[i][j] = _format_result(score)
			
 
				+        return results
			
 
				+
			
 
				+    except Exception as e:
			
 
				+        raise RuntimeError(f"API笛卡尔积调用失败: {e}")
			
 
				+
			
 
				+
			
 
				+# ============================================================================
			
 
				+# 工具函数
			
 
				+# ============================================================================
			
 
				+
			
 
				+def get_api_health() -> Dict:
			
 
				+    """
			
 
				+    获取API健康状态
			
 
				+
			
 
				+    Returns:
			
 
				+        {
			
 
				+            "status": "ok",
			
 
				+            "gpu_available": bool,
			
 
				+            "gpu_name": str,
			
 
				+            "model_loaded": bool,
			
 
				+            "max_batch_pairs": int,
			
 
				+            "max_cartesian_texts": int,
			
 
				+            ...
			
 
				+        }
			
 
				+    """
			
 
				+    client = _get_api_client()
			
 
				+    return client.health_check()
			
 
				+
			
 
				+
			
 
				+def get_supported_models() -> Dict:
			
 
				+    """
			
 
				+    获取API支持的模型列表
			
 
				+
			
 
				+    Returns:
			
 
				+        模型列表及详细信息
			
 
				+    """
			
 
				+    client = _get_api_client()
			
 
				+    return client.list_models()
			
 
				+
			
 
				+
			
 
				+# ============================================================================
			
 
				+# 测试代码
			
 
				+# ============================================================================
			
 
				+
			
 
				+if __name__ == "__main__":
			
 
				+    print("=" * 80)
			
 
				+    print(" text_embedding_api 模块测试")
			
 
				+    print("=" * 80)
			
 
				+
			
 
				+    # 测试1: 健康检查
			
 
				+    print("\n1. API健康检查")
			
 
				+    print("-" * 80)
			
 
				+    try:
			
 
				+        health = get_api_health()
			
 
				+        print(f"✅ API状态: {health['status']}")
			
 
				+        print(f"   GPU可用: {health['gpu_available']}")
			
 
				+        if health.get('gpu_name'):
			
 
				+            print(f"   GPU名称: {health['gpu_name']}")
			
 
				+        print(f"   模型已加载: {health['model_loaded']}")
			
 
				+        print(f"   最大批量对数: {health['max_batch_pairs']}")
			
 
				+        print(f"   最大笛卡尔积: {health['max_cartesian_texts']}")
			
 
				+    except Exception as e:
			
 
				+        print(f"❌ API连接失败: {e}")
			
 
				+        print("   请确保API服务正常运行")
			
 
				+        exit(1)
			
 
				+
			
 
				+    # 测试2: 单个相似度
			
 
				+    print("\n2. 单个相似度计算")
			
 
				+    print("-" * 80)
			
 
				+    result = compare_phrases("深度学习", "神经网络")
			
 
				+    print(f"深度学习 vs 神经网络")
			
 
				+    print(f"  相似度: {result['相似度']:.4f}")
			
 
				+    print(f"  说明: {result['说明']}")
			
 
				+
			
 
				+    # 测试3: 批量成对相似度
			
 
				+    print("\n3. 批量成对相似度计算")
			
 
				+    print("-" * 80)
			
 
				+    pairs = [
			
 
				+        ("深度学习", "神经网络"),
			
 
				+        ("机器学习", "人工智能"),
			
 
				+        ("Python编程", "Python开发")
			
 
				+    ]
			
 
				+    results = compare_phrases_batch(pairs)
			
 
				+    for (a, b), result in zip(pairs, results):
			
 
				+        print(f"{a} vs {b}: {result['相似度']:.4f}")
			
 
				+
			
 
				+    # 测试4: 笛卡尔积（嵌套列表）
			
 
				+    print("\n4. 笛卡尔积计算（嵌套列表格式）")
			
 
				+    print("-" * 80)
			
 
				+    phrases_a = ["深度学习", "机器学习"]
			
 
				+    phrases_b = ["神经网络", "人工智能", "Python"]
			
 
				+
			
 
				+    results = compare_phrases_cartesian(phrases_a, phrases_b)
			
 
				+    print(f"计算 {len(phrases_a)} × {len(phrases_b)} = {len(phrases_a) * len(phrases_b)} 个相似度")
			
 
				+
			
 
				+    for i, phrase_a in enumerate(phrases_a):
			
 
				+        print(f"\n{phrase_a}:")
			
 
				+        for j, phrase_b in enumerate(phrases_b):
			
 
				+            score = results[i][j]['相似度']
			
 
				+            print(f"  vs {phrase_b:15}: {score:.4f}")
			
 
				+
			
 
				+    # 测试5: 笛卡尔积（numpy矩阵）
			
 
				+    print("\n5. 笛卡尔积计算（numpy矩阵格式）")
			
 
				+    print("-" * 80)
			
 
				+    matrix = compare_phrases_cartesian(phrases_a, phrases_b, return_matrix=True)
			
 
				+    print(f"矩阵 shape: {matrix.shape}")
			
 
				+    print(f"\n相似度矩阵:")
			
 
				+    print(f"{'':15}", end="")
			
 
				+    for b in phrases_b:
			
 
				+        print(f"{b:15}", end="")
			
 
				+    print()
			
 
				+
			
 
				+    for i, a in enumerate(phrases_a):
			
 
				+        print(f"{a:15}", end="")
			
 
				+        for j in range(len(phrases_b)):
			
 
				+            print(f"{matrix[i][j]:15.4f}", end="")
			
 
				+        print()
			
 
				+
			
 
				+    # 测试6: 性能对比（可选）
			
 
				+    print("\n6. 性能测试（可选）")
			
 
				+    print("-" * 80)
			
 
				+    print("测试大规模笛卡尔积性能...")
			
 
				+
			
 
				+    import time
			
 
				+
			
 
				+    test_a = ["测试文本A" + str(i) for i in range(10)]
			
 
				+    test_b = ["测试文本B" + str(i) for i in range(50)]
			
 
				+
			
 
				+    print(f"计算 {len(test_a)} × {len(test_b)} = {len(test_a) * len(test_b)} 个相似度")
			
 
				+
			
 
				+    start = time.time()
			
 
				+    matrix = compare_phrases_cartesian(test_a, test_b, return_matrix=True)
			
 
				+    elapsed = time.time() - start
			
 
				+
			
 
				+    print(f"耗时: {elapsed*1000:.2f}ms")
			
 
				+    print(f"QPS: {matrix.size / elapsed:.2f}")
			
 
				+
			
 
				+    print("\n" + "=" * 80)
			
 
				+    print(" ✅ 所有测试通过！")
			
 
				+    print("=" * 80)
			
 
				+
			
 
				+    print("\n📝 接口总结：")
			
 
				+    print("  1. compare_phrases(a, b) - 单对计算")
			
 
				+    print("  2. compare_phrases_batch([(a,b),...]) - 批量成对")
			
 
				+    print("  3. compare_phrases_cartesian([a1,a2], [b1,b2,b3]) - 笛卡尔积")
			
 
				+    print("\n💡 提示：所有接口都不使用缓存，因为API已经足够快")
			
--- a/lib/text_embedding_api_README.md
+++ b/lib/text_embedding_api_README.md
@@ -0,0 +1,184 @@
 
				+# text_embedding_api - 基于远程API的文本相似度计算
			
 
				+
			
 
				+## 概述
			
 
				+
			
 
				+简化版的文本相似度计算模块，使用远程GPU加速API，**去除了缓存机制**（API已经足够快）。
			
 
				+
			
 
				+## 3种计算模式
			
 
				+
			
 
				+```python
			
 
				+from lib.text_embedding_api import (
			
 
				+    compare_phrases,           # 1. 单对计算
			
 
				+    compare_phrases_batch,     # 2. 批量成对
			
 
				+    compare_phrases_cartesian  # 3. 笛卡尔积
			
 
				+)
			
 
				+```
			
 
				+
			
 
				+### 1. 单对计算
			
 
				+
			
 
				+```python
			
 
				+result = compare_phrases("深度学习", "神经网络")
			
 
				+print(result['相似度'])  # 0.8500
			
 
				+print(result['说明'])    # 基于向量模型计算的语义相似度为 高 (0.85)
			
 
				+```
			
 
				+
			
 
				+### 2. 批量成对计算
			
 
				+
			
 
				+适用场景：有N对独立的文本需要分别计算相似度
			
 
				+
			
 
				+```python
			
 
				+pairs = [
			
 
				+    ("深度学习", "神经网络"),
			
 
				+    ("机器学习", "人工智能"),
			
 
				+    ("Python编程", "Python开发")
			
 
				+]
			
 
				+
			
 
				+results = compare_phrases_batch(pairs)
			
 
				+for (a, b), result in zip(pairs, results):
			
 
				+    print(f"{a} vs {b}: {result['相似度']:.4f}")
			
 
				+```
			
 
				+
			
 
				+### 3. 笛卡尔积计算 ⭐
			
 
				+
			
 
				+适用场景：需要计算两组文本之间所有可能的组合（M×N）
			
 
				+
			
 
				+#### 方式A: 返回嵌套列表（带说明）
			
 
				+
			
 
				+```python
			
 
				+phrases_a = ["深度学习", "机器学习"]
			
 
				+phrases_b = ["神经网络", "人工智能", "Python"]
			
 
				+
			
 
				+results = compare_phrases_cartesian(phrases_a, phrases_b)
			
 
				+
			
 
				+# 访问结果
			
 
				+print(results[0][0]['相似度'])  # 深度学习 vs 神经网络
			
 
				+print(results[1][2]['说明'])    # 机器学习 vs Python
			
 
				+```
			
 
				+
			
 
				+#### 方式B: 返回numpy矩阵（只有分数，更快）
			
 
				+
			
 
				+```python
			
 
				+matrix = compare_phrases_cartesian(phrases_a, phrases_b, return_matrix=True)
			
 
				+
			
 
				+print(matrix.shape)  # (2, 3)
			
 
				+print(matrix[0, 1])  # 深度学习 vs 人工智能
			
 
				+print(matrix[1, 0])  # 机器学习 vs 神经网络
			
 
				+```
			
 
				+
			
 
				+## 性能对比
			
 
				+
			
 
				+| 场景 | 数据量 | 耗时 |
			
 
				+|------|--------|------|
			
 
				+| **单对计算** | 1对 | ~30ms |
			
 
				+| **批量成对** | 100对 | ~200ms |
			
 
				+| **笛卡尔积** | 10×100=1000 | ~500ms |
			
 
				+
			
 
				+## API健康检查
			
 
				+
			
 
				+```python
			
 
				+from lib.text_embedding_api import get_api_health
			
 
				+
			
 
				+health = get_api_health()
			
 
				+print(health['status'])              # "ok"
			
 
				+print(health['gpu_available'])       # True
			
 
				+print(health['max_cartesian_texts']) # 最大文本数限制
			
 
				+```
			
 
				+
			
 
				+## 业务集成示例
			
 
				+
			
 
				+### 场景1: 一个特征匹配所有人设（1 vs N）
			
 
				+
			
 
				+```python
			
 
				+from lib.text_embedding_api import compare_phrases_cartesian
			
 
				+
			
 
				+feature = "宿命感"
			
 
				+persona_features = ["人设1", "人设2", ..., "人设100"]
			
 
				+
			
 
				+# 一次API调用获取所有100个相似度
			
 
				+matrix = compare_phrases_cartesian([feature], persona_features, return_matrix=True)
			
 
				+scores = matrix[0]  # 取第一行
			
 
				+
			
 
				+for i, score in enumerate(scores):
			
 
				+    if score > 0.7:  # 只处理高相似度
			
 
				+        print(f"{feature} → {persona_features[i]}: {score:.4f}")
			
 
				+```
			
 
				+
			
 
				+**性能**: ~0.2秒（vs 逐对调用 ~10秒）
			
 
				+
			
 
				+### 场景2: 多个特征批量匹配（M vs N）
			
 
				+
			
 
				+```python
			
 
				+features = ["特征1", "特征2", ..., "特征10"]
			
 
				+persona_features = ["人设1", "人设2", ..., "人设100"]
			
 
				+
			
 
				+# 一次API调用获取10×100=1000个相似度
			
 
				+matrix = compare_phrases_cartesian(features, persona_features, return_matrix=True)
			
 
				+
			
 
				+# 处理结果
			
 
				+for i, feature in enumerate(features):
			
 
				+    for j, persona in enumerate(persona_features):
			
 
				+        score = matrix[i, j]
			
 
				+        if score > 0.7:
			
 
				+            print(f"{feature} → {persona}: {score:.4f}")
			
 
				+```
			
 
				+
			
 
				+**性能**: ~0.5秒（vs 逐对调用 ~100秒）
			
 
				+
			
 
				+## 与 text_embedding.py 的兼容性
			
 
				+
			
 
				+`compare_phrases()` 接口完全兼容：
			
 
				+
			
 
				+```python
			
 
				+# 原来的代码
			
 
				+from lib.text_embedding import compare_phrases
			
 
				+
			
 
				+# 新代码（直接替换）
			
 
				+from lib.text_embedding_api import compare_phrases
			
 
				+
			
 
				+# 使用方式完全相同
			
 
				+result = compare_phrases("测试1", "测试2")
			
 
				+```
			
 
				+
			
 
				+**区别**:
			
 
				+- ✅ 更快（GPU加速）
			
 
				+- ✅ 零内存占用（无需加载模型）
			
 
				+- ✅ 新增笛卡尔积功能
			
 
				+- ❌ 需要网络连接
			
 
				+- ❌ 无缓存机制（API已经够快，不需要）
			
 
				+
			
 
				+## 依赖
			
 
				+
			
 
				+```bash
			
 
				+pip install requests numpy
			
 
				+```
			
 
				+
			
 
				+## 测试
			
 
				+
			
 
				+```bash
			
 
				+python3 lib/text_embedding_api.py
			
 
				+```
			
 
				+
			
 
				+## API配置
			
 
				+
			
 
				+默认API地址: `http://61.48.133.26:8187`
			
 
				+
			
 
				+如需修改，可在代码中设置：
			
 
				+
			
 
				+```python
			
 
				+from lib.text_embedding_api import SimilarityAPIClient
			
 
				+
			
 
				+client = SimilarityAPIClient(
			
 
				+    base_url="http://your-api-server:8187",
			
 
				+    timeout=120
			
 
				+)
			
 
				+```
			
 
				+
			
 
				+## 总结
			
 
				+
			
 
				+**3个接口，无缓存，专注性能：**
			
 
				+
			
 
				+1. `compare_phrases(a, b)` - 单对
			
 
				+2. `compare_phrases_batch([(a,b),...])` - 批量成对
			
 
				+3. `compare_phrases_cartesian([...], [...])` - 笛卡尔积 ⭐
			
 
				+
			
 
				+**推荐**: 优先使用笛卡尔积接口处理批量数据，性能最优。
			
--- a/lib/utils.py
+++ b/lib/utils.py
@@ -51,7 +51,14 @@ def parse_json_from_text(text: str) -> dict:
 
				     try:
			
 
				         return json.loads(json_content)
			
 
				     except json.JSONDecodeError as e:
			
 
				+        # 打印详细的解析失败信息
			
 
				         print(f"JSON解析失败: {e}")
			
 
				+        print(f"原始文本长度: {len(text)}")
			
 
				+        print(f"提取的JSON内容长度: {len(json_content)}")
			
 
				+        print(f"原始文本内容预览 (前500字符):\n{text[:500]}")
			
 
				+        print(f"提取的JSON内容预览 (前500字符):\n{json_content[:500]}")
			
 
				+        print("-" * 80)
			
 
				+
			
 
				         # 如果直接解析失败，尝试查找第一个{到最后一个}的内容
			
 
				         try:
			
 
				             first_brace = json_content.find('{')
			
@@ -59,9 +66,11 @@ def parse_json_from_text(text: str) -> dict:
 
				             if first_brace != -1 and last_brace != -1 and first_brace < last_brace:
			
 
				                 json_part = json_content[first_brace:last_brace + 1]
			
 
				                 return json.loads(json_part)
			
 
				-        except json.JSONDecodeError:
			
 
				-            pass
			
 
				-        
			
 
				+        except json.JSONDecodeError as e2:
			
 
				+            print(f"二次解析也失败: {e2}")
			
 
				+            if first_brace != -1 and last_brace != -1:
			
 
				+                print(f"尝试解析的内容:\n{json_part[:500]}")
			
 
				+
			
 
				         return {}
			
 
				 
			
 
				 
			
--- a/script/data_processing/match_inspiration_features.py
+++ b/script/data_processing/match_inspiration_features.py
@@ -18,13 +18,9 @@ from datetime import datetime
 
				 project_root = Path(__file__).parent.parent.parent
			
 
				 sys.path.insert(0, str(project_root))
			
 
				 
			
 
				-from lib.hybrid_similarity import compare_phrases
			
 
				+from lib.hybrid_similarity import compare_phrases_cartesian
			
 
				 from script.data_processing.path_config import PathConfig
			
 
				 
			
 
				-# 全局并发限制
			
 
				-MAX_CONCURRENT_REQUESTS = 100
			
 
				-semaphore = None
			
 
				-
			
 
				 # 进度跟踪
			
 
				 class ProgressTracker:
			
 
				     """进度跟踪器"""
			
@@ -79,174 +75,6 @@ class ProgressTracker:
 
				 progress_tracker = None
			
 
				 
			
 
				 
			
 
				-def get_semaphore():
			
 
				-    """获取全局信号量"""
			
 
				-    global semaphore
			
 
				-    if semaphore is None:
			
 
				-        semaphore = asyncio.Semaphore(MAX_CONCURRENT_REQUESTS)
			
 
				-    return semaphore
			
 
				-
			
 
				-
			
 
				-async def match_single_pair(
			
 
				-    feature_name: str,
			
 
				-    persona_name: str,
			
 
				-    persona_feature_level: str,
			
 
				-    category_mapping: Dict = None,
			
 
				-    model_name: str = None
			
 
				-) -> Dict:
			
 
				-    """
			
 
				-    匹配单个特征对（带并发限制）
			
 
				-
			
 
				-    Args:
			
 
				-        feature_name: 要匹配的特征名称
			
 
				-        persona_name: 人设特征名称
			
 
				-        persona_feature_level: 人设特征层级（灵感点/关键点/目的点）
			
 
				-        category_mapping: 特征分类映射字典
			
 
				-        model_name: 使用的模型名称
			
 
				-
			
 
				-    Returns:
			
 
				-        单个匹配结果，格式：
			
 
				-        {
			
 
				-            "人设特征名称": "xxx",
			
 
				-            "人设特征层级": "灵感点",
			
 
				-            "特征类型": "标签",
			
 
				-            "特征分类": ["分类1", "分类2"],
			
 
				-            "匹配结果": {
			
 
				-                "相似度": 0.75,
			
 
				-                "说明": "..."
			
 
				-            }
			
 
				-        }
			
 
				-    """
			
 
				-    global progress_tracker
			
 
				-    sem = get_semaphore()
			
 
				-    async with sem:
			
 
				-        # 使用混合相似度模型（异步调用）
			
 
				-        similarity_result = await compare_phrases(
			
 
				-            phrase_a=feature_name,
			
 
				-            phrase_b=persona_name,
			
 
				-            weight_embedding=0.5,
			
 
				-            weight_semantic=0.5
			
 
				-        )
			
 
				-
			
 
				-        # 更新进度
			
 
				-        if progress_tracker:
			
 
				-            progress_tracker.update(1)
			
 
				-
			
 
				-        # 判断该特征是标签还是分类
			
 
				-        feature_type = "分类"  # 默认为分类
			
 
				-        categories = []
			
 
				-
			
 
				-        if category_mapping:
			
 
				-            # 先在标签特征中查找（灵感点、关键点、目的点）
			
 
				-            is_tag_feature = False
			
 
				-            for ft in ["灵感点", "关键点", "目的点"]:
			
 
				-                if ft in category_mapping:
			
 
				-                    type_mapping = category_mapping[ft]
			
 
				-                    if persona_name in type_mapping:
			
 
				-                        # 找到了，说明是标签特征
			
 
				-                        feature_type = "标签"
			
 
				-                        categories = type_mapping[persona_name].get("所属分类", [])
			
 
				-                        is_tag_feature = True
			
 
				-                        break
			
 
				-
			
 
				-            # 如果不是标签特征，检查是否是分类特征
			
 
				-            if not is_tag_feature:
			
 
				-                # 收集所有分类
			
 
				-                all_categories = set()
			
 
				-                for ft in ["灵感点", "关键点", "目的点"]:
			
 
				-                    if ft in category_mapping:
			
 
				-                        for fname, fdata in category_mapping[ft].items():
			
 
				-                            cats = fdata.get("所属分类", [])
			
 
				-                            all_categories.update(cats)
			
 
				-
			
 
				-                # 如果当前特征名在分类列表中，则是分类特征
			
 
				-                if persona_name in all_categories:
			
 
				-                    feature_type = "分类"
			
 
				-                    categories = []  # 分类特征本身没有所属分类
			
 
				-
			
 
				-        # 去重分类
			
 
				-        unique_categories = list(dict.fromkeys(categories))
			
 
				-
			
 
				-        return {
			
 
				-            "人设特征名称": persona_name,
			
 
				-            "人设特征层级": persona_feature_level,
			
 
				-            "特征类型": feature_type,
			
 
				-            "特征分类": unique_categories,
			
 
				-            "匹配结果": similarity_result
			
 
				-        }
			
 
				-
			
 
				-
			
 
				-async def match_feature_with_persona(
			
 
				-    feature_name: str,
			
 
				-    persona_features: List[Dict],
			
 
				-    category_mapping: Dict = None,
			
 
				-    model_name: str = None
			
 
				-) -> List[Dict]:
			
 
				-    """
			
 
				-    将一个特征与人设特征列表进行匹配（并发执行）
			
 
				-
			
 
				-    Args:
			
 
				-        feature_name: 要匹配的特征名称
			
 
				-        persona_features: 人设特征列表（包含"特征名称"和"人设特征层级"）
			
 
				-        category_mapping: 特征分类映射字典
			
 
				-        model_name: 使用的模型名称
			
 
				-
			
 
				-    Returns:
			
 
				-        匹配结果列表
			
 
				-    """
			
 
				-    # 创建所有匹配任务
			
 
				-    tasks = [
			
 
				-        match_single_pair(
			
 
				-            feature_name,
			
 
				-            persona_feature["特征名称"],
			
 
				-            persona_feature["人设特征层级"],
			
 
				-            category_mapping,
			
 
				-            model_name
			
 
				-        )
			
 
				-        for persona_feature in persona_features
			
 
				-    ]
			
 
				-
			
 
				-    # 并发执行所有匹配
			
 
				-    match_results = await asyncio.gather(*tasks)
			
 
				-
			
 
				-    return list(match_results)
			
 
				-
			
 
				-
			
 
				-async def match_single_feature(
			
 
				-    feature_item: Dict,
			
 
				-    persona_features: List[Dict],
			
 
				-    category_mapping: Dict = None,
			
 
				-    model_name: str = None
			
 
				-) -> Dict:
			
 
				-    """
			
 
				-    匹配单个特征与所有人设特征
			
 
				-
			
 
				-    Args:
			
 
				-        feature_item: 特征信息（包含"特征名称"和"权重"）
			
 
				-        persona_features: 人设特征列表
			
 
				-        category_mapping: 特征分类映射字典
			
 
				-        model_name: 使用的模型名称
			
 
				-
			
 
				-    Returns:
			
 
				-        特征匹配结果
			
 
				-    """
			
 
				-    feature_name = feature_item.get("特征名称", "")
			
 
				-    feature_weight = feature_item.get("权重", 1.0)
			
 
				-
			
 
				-    match_results = await match_feature_with_persona(
			
 
				-        feature_name=feature_name,
			
 
				-        persona_features=persona_features,
			
 
				-        category_mapping=category_mapping,
			
 
				-        model_name=model_name
			
 
				-    )
			
 
				-
			
 
				-    return {
			
 
				-        "特征名称": feature_name,
			
 
				-        "权重": feature_weight,
			
 
				-        "匹配结果": match_results
			
 
				-    }
			
 
				-
			
 
				-
			
 
				 async def process_single_point(
			
 
				     point: Dict,
			
 
				     point_type: str,
			
@@ -255,7 +83,7 @@ async def process_single_point(
 
				     model_name: str = None
			
 
				 ) -> Dict:
			
 
				     """
			
 
				-    处理单个点（灵感点/关键点/目的点）的特征匹配（并发执行）
			
 
				+    处理单个点 - 使用笛卡尔积批量计算（优化版）
			
 
				 
			
 
				     Args:
			
 
				         point: 点数据（灵感点/关键点/目的点）
			
@@ -267,17 +95,103 @@ async def process_single_point(
 
				     Returns:
			
 
				         包含 how 步骤列表的点数据
			
 
				     """
			
 
				+    global progress_tracker
			
 
				+
			
 
				     point_name = point.get("名称", "")
			
 
				     feature_list = point.get("特征列表", [])
			
 
				 
			
 
				-    # 并发匹配所有特征
			
 
				-    tasks = [
			
 
				-        match_single_feature(feature_item, persona_features, category_mapping, model_name)
			
 
				-        for feature_item in feature_list
			
 
				-    ]
			
 
				-    feature_match_results = await asyncio.gather(*tasks)
			
 
				+    # 如果没有特征，直接返回
			
 
				+    if not feature_list or not persona_features:
			
 
				+        result = point.copy()
			
 
				+        result["how步骤列表"] = []
			
 
				+        return result
			
 
				+
			
 
				+    # 提取特征名称和人设名称列表
			
 
				+    feature_names = [f.get("特征名称", "") for f in feature_list]
			
 
				+    persona_names = [pf["特征名称"] for pf in persona_features]
			
 
				+
			
 
				+    # 核心优化：使用混合模型笛卡尔积一次计算M×N
			
 
				+    try:
			
 
				+        similarity_results = await compare_phrases_cartesian(
			
 
				+            feature_names,      # M个特征
			
 
				+            persona_names,      # N个人设
			
 
				+            max_concurrent=100  # LLM最大并发数
			
 
				+        )
			
 
				+        # similarity_results[i][j] = {"相似度": float, "说明": str}
			
 
				+    except Exception as e:
			
 
				+        print(f"\n⚠️  混合模型调用失败: {e}")
			
 
				+        result = point.copy()
			
 
				+        result["how步骤列表"] = []
			
 
				+        return result
			
 
				+
			
 
				+    # 构建匹配结果（使用模块返回的完整结果）
			
 
				+    feature_match_results = []
			
 
				+
			
 
				+    for i, feature_item in enumerate(feature_list):
			
 
				+        feature_name = feature_item.get("特征名称", "")
			
 
				+        feature_weight = feature_item.get("权重", 1.0)
			
 
				+
			
 
				+        # 该特征与所有人设的匹配结果
			
 
				+        match_results = []
			
 
				+        for j, persona_feature in enumerate(persona_features):
			
 
				+            persona_name = persona_feature["特征名称"]
			
 
				+            persona_level = persona_feature["人设特征层级"]
			
 
				+
			
 
				+            # 直接使用模块返回的完整结果
			
 
				+            similarity_result = similarity_results[i][j]
			
 
				+
			
 
				+            # 判断特征类型和分类
			
 
				+            feature_type = "分类"  # 默认为分类
			
 
				+            categories = []
			
 
				+
			
 
				+            if category_mapping:
			
 
				+                # 先在标签特征中查找
			
 
				+                is_tag_feature = False
			
 
				+                for ft in ["灵感点", "关键点", "目的点"]:
			
 
				+                    if ft in category_mapping:
			
 
				+                        type_mapping = category_mapping[ft]
			
 
				+                        if persona_name in type_mapping:
			
 
				+                            feature_type = "标签"
			
 
				+                            categories = type_mapping[persona_name].get("所属分类", [])
			
 
				+                            is_tag_feature = True
			
 
				+                            break
			
 
				+
			
 
				+                # 如果不是标签特征，检查是否是分类特征
			
 
				+                if not is_tag_feature:
			
 
				+                    all_categories = set()
			
 
				+                    for ft in ["灵感点", "关键点", "目的点"]:
			
 
				+                        if ft in category_mapping:
			
 
				+                            for fname, fdata in category_mapping[ft].items():
			
 
				+                                cats = fdata.get("所属分类", [])
			
 
				+                                all_categories.update(cats)
			
 
				+
			
 
				+                    if persona_name in all_categories:
			
 
				+                        feature_type = "分类"
			
 
				+                        categories = []
			
 
				+
			
 
				+            # 去重分类
			
 
				+            unique_categories = list(dict.fromkeys(categories))
			
 
				+
			
 
				+            match_result = {
			
 
				+                "人设特征名称": persona_name,
			
 
				+                "人设特征层级": persona_level,
			
 
				+                "特征类型": feature_type,
			
 
				+                "特征分类": unique_categories,
			
 
				+                "匹配结果": similarity_result  # 直接使用模块返回的结果
			
 
				+            }
			
 
				+            match_results.append(match_result)
			
 
				+
			
 
				+            # 更新进度
			
 
				+            if progress_tracker:
			
 
				+                progress_tracker.update(1)
			
 
				 
			
 
				-    # 构建 how 步骤（根据点类型生成步骤名称）
			
 
				+        feature_match_results.append({
			
 
				+            "特征名称": feature_name,
			
 
				+            "权重": feature_weight,
			
 
				+            "匹配结果": match_results
			
 
				+        })
			
 
				+
			
 
				+    # 构建 how 步骤（保持不变）
			
 
				     step_name_mapping = {
			
 
				         "灵感点": "灵感特征分别匹配人设特征",
			
 
				         "关键点": "关键特征分别匹配人设特征",
			
@@ -289,7 +203,6 @@ async def process_single_point(
 
				         "特征列表": list(feature_match_results)
			
 
				     }
			
 
				 
			
 
				-    # 返回更新后的点
			
 
				     result = point.copy()
			
 
				     result["how步骤列表"] = [how_step]
			
 
				 
			
@@ -476,11 +389,6 @@ async def main():
 
				     with open(category_mapping_file, "r", encoding="utf-8") as f:
			
 
				         category_mapping = json.load(f)
			
 
				 
			
 
				-    # 预先加载模型（混合模型会自动处理）
			
 
				-    print("\n预加载混合相似度模型...")
			
 
				-    await compare_phrases("测试", "测试", weight_embedding=0.5, weight_semantic=0.5)
			
 
				-    print("模型预加载完成！\n")
			
 
				-
			
 
				     # 获取任务列表
			
 
				     task_list = task_list_data.get("解构任务列表", [])
			
 
				     print(f"总任务数: {len(task_list)}")
			
--- a/script/data_processing/visualize_how_results.py
+++ b/script/data_processing/visualize_how_results.py
@@ -1040,12 +1040,21 @@ def generate_combined_html(posts_data: List[Dict], category_mapping: Dict = None
 
				         title = post_detail.get("title", "无标题")
			
 
				         post_id = post_detail.get("post_id", f"post_{post_idx}")
			
 
				 
			
 
				-        # 帖子标题作为一级目录（可折叠）
			
 
				+        # 获取发布时间并格式化
			
 
				+        publish_timestamp = post_detail.get("publish_timestamp", 0)
			
 
				+        if publish_timestamp:
			
 
				+            from datetime import datetime
			
 
				+            # publish_timestamp 是毫秒级时间戳，需要除以1000
			
 
				+            date_str = datetime.fromtimestamp(publish_timestamp / 1000).strftime("%Y-%m-%d")
			
 
				+        else:
			
 
				+            date_str = "未知日期"
			
 
				+
			
 
				+        # 帖子标题作为一级目录（可折叠），在标题前显示日期
			
 
				         all_toc_items.append(f'''
			
 
				         <div class="toc-item toc-level-0 toc-post-header collapsed" data-post-id="{post_idx}" onclick="toggleTocPost(event, {post_idx})">
			
 
				             <span class="toc-expand-icon">▼</span>
			
 
				             <div class="toc-item-content">
			
 
				-                <span class="toc-badge toc-badge-post">📄 帖子</span> {html_module.escape(title[:30])}...
			
 
				+                <span style="color: #666; font-size: 0.9em;">{date_str}</span> {html_module.escape(title[:30])}...
			
 
				             </div>
			
 
				         </div>
			
 
				         <div class="toc-children hidden" id="toc-post-{post_idx}-children">
			
@@ -3731,6 +3740,10 @@ def main():
 
				             post_data = json.load(f)
			
 
				             posts_data.append(post_data)
			
 
				 
			
 
				+    # 按发布时间降序排序（最新的在前）
			
 
				+    print(f"\n按发布时间排序...")
			
 
				+    posts_data.sort(key=lambda x: x.get("帖子详情", {}).get("publish_timestamp", 0), reverse=True)
			
 
				+
			
 
				     print(f"\n生成合并的 HTML...")
			
 
				     html_content = generate_combined_html(posts_data, category_mapping, source_mapping)
			
 
				 
			
@@ -3746,7 +3759,7 @@ def main():
 
				     print(f"\n压缩HTML...")
			
 
				     minified_html = minify_html(html_content)
			
 
				 
			
 
				-    minified_file = data_dir / "当前帖子_how解构结果_可视化.min.html"
			
 
				+    minified_file = output_file.parent / "当前帖子_how解构结果_可视化.min.html"
			
 
				     print(f"保存压缩HTML到: {minified_file}")
			
 
				     with open(minified_file, "w", encoding="utf-8") as f:
			
 
				         f.write(minified_html)
			
@@ -3757,7 +3770,7 @@ def main():
 
				     # Gzip压缩
			
 
				     import gzip
			
 
				     print(f"\n生成Gzip压缩版本...")
			
 
				-    gzip_file = data_dir / "当前帖子_how解构结果_可视化.html.gz"
			
 
				+    gzip_file = output_file.parent / "当前帖子_how解构结果_可视化.html.gz"
			
 
				     with gzip.open(gzip_file, "wb") as f:
			
 
				         f.write(minified_html.encode('utf-8'))