2 mēneši atpakaļ · c22f839284
--- a/.env
+++ b/.env
@@ -50,3 +50,6 @@ LANGCHAIN_PROJECT=knowledge-agent
 
				 OPENAI_API_KEY=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
			
 
				 TAVILY_API_KEY=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
			
 
				 
			
 
				+FEISHU_APP_ID=cli_a75d795d877d901c
			
 
				+FEISHU_APP_SECRET=nDTqlBmAdKEyPThegK50ZbS4lKsCcYlN
			
 
				+
			
--- a/llm/openrouter.py
+++ b/llm/openrouter.py
@@ -6,7 +6,6 @@ import json
 
				 from typing import Any, Dict, Optional
			
 
				 from enum import Enum
			
 
				 from dotenv import load_dotenv
			
 
				-import google.generativeai as genai
			
 
				 
			
 
				 from openai import OpenAI
			
 
				 
			
--- a/offline/README.md
+++ b/offline/README.md
@@ -0,0 +1,67 @@
 
				+# 飞书表格评估程序
			
 
				+
			
 
				+这个程序用于从飞书表格读取数据，进行一致性评估和打分，然后将结果写回飞书表格。
			
 
				+
			
 
				+## 功能特点
			
 
				+
			
 
				+1. 从飞书表格读取C列(关键词)和G列(结构化结果)数据
			
 
				+2. 使用OpenRouter API进行一致性评估，结果写入H列(一致性结论)和I列(原因)
			
 
				+3. 使用OpenRouter API进行打分评估，结果写入J列(打分结果)和K列(原因)
			
 
				+4. 支持并发处理，提高效率
			
 
				+5. 完善的日志记录和错误处理
			
 
				+6. 自动跳过已处理的行，支持断点续传
			
 
				+
			
 
				+## 环境要求
			
 
				+
			
 
				+- Python 3.7+
			
 
				+- 必要的Python包：aiohttp, pandas, python-dotenv
			
 
				+
			
 
				+## 配置说明
			
 
				+
			
 
				+在项目根目录的`.env`文件中配置以下环境变量：
			
 
				+
			
 
				+```
			
 
				+# 飞书API配置
			
 
				+FEISHU_APP_ID=your_feishu_app_id
			
 
				+FEISHU_APP_SECRET=your_feishu_app_secret
			
 
				+
			
 
				+# OpenRouter API配置
			
 
				+OPENROUTER_API_TOKEN=your_openrouter_api_token
			
 
				+OPENROUTER_BASE_URL=https://openrouter.ai/api/v1
			
 
				+```
			
 
				+
			
 
				+## 使用方法
			
 
				+
			
 
				+1. 确保已安装所有依赖包：
			
 
				+
			
 
				+```bash
			
 
				+pip install -r requirements.txt
			
 
				+```
			
 
				+
			
 
				+2. 配置环境变量
			
 
				+
			
 
				+3. 运行程序：
			
 
				+
			
 
				+```bash
			
 
				+python feishu_evaluation.py
			
 
				+```
			
 
				+
			
 
				+## 程序流程
			
 
				+
			
 
				+1. 程序启动后，首先获取飞书访问令牌
			
 
				+2. 读取飞书表格数据
			
 
				+3. 对每一行数据进行处理：
			
 
				+   - 检查H列和J列是否已有数据，如果有则跳过相应的评估
			
 
				+   - 进行一致性评估并更新H列和I列
			
 
				+   - 进行打分评估并更新J列和K列
			
 
				+4. 所有数据处理完成后，程序结束
			
 
				+
			
 
				+## 日志
			
 
				+
			
 
				+程序运行日志保存在`feishu_evaluation.log`文件中，同时也会在控制台输出。
			
 
				+
			
 
				+## 注意事项
			
 
				+
			
 
				+- 程序默认并发数为10，可以通过修改`MAX_CONCURRENCY`变量调整
			
 
				+- 如果API调用失败，程序会记录错误并继续处理下一行数据
			
 
				+- 程序支持断点续传，已处理的行不会重复处理
			
--- a/offline/feishu_evaluation.py
+++ b/offline/feishu_evaluation.py
@@ -0,0 +1,359 @@
 
				+#!/usr/bin/env python3
			
 
				+# -*- coding: utf-8 -*-
			
 
				+
			
 
				+import os
			
 
				+import json
			
 
				+import requests
			
 
				+from typing import List, Dict, Any, Tuple
			
 
				+from dotenv import load_dotenv
			
 
				+import sys
			
 
				+import time
			
 
				+import logging
			
 
				+import threading
			
 
				+from concurrent.futures import ThreadPoolExecutor
			
 
				+
			
 
				+# 添加项目根目录到系统路径
			
 
				+sys.path.append(os.path.dirname(os.path.dirname(os.path.abspath(__file__))))
			
 
				+
			
 
				+# 导入项目中的openrouter模块
			
 
				+from llm.openrouter import OpenRouterProcessor, OpenRouterModel
			
 
				+
			
 
				+# 配置日志记录
			
 
				+logging.basicConfig(
			
 
				+    level=logging.INFO,
			
 
				+    format='%(asctime)s - %(name)s - %(levelname)s - %(message)s',
			
 
				+    handlers=[
			
 
				+        logging.FileHandler(os.path.join(os.path.dirname(os.path.abspath(__file__)), 'feishu_evaluation.log')),
			
 
				+        logging.StreamHandler()
			
 
				+    ]
			
 
				+)
			
 
				+logger = logging.getLogger(__name__)
			
 
				+
			
 
				+# 加载环境变量
			
 
				+load_dotenv()
			
 
				+
			
 
				+# 检查环境变量
			
 
				+if not os.getenv('FEISHU_APP_ID') or not os.getenv('FEISHU_APP_SECRET') or not os.getenv('OPENROUTER_API_TOKEN'):
			
 
				+    logger.error("缺少必要的环境变量，请检查.env文件")
			
 
				+    sys.exit(1)
			
 
				+
			
 
				+# 飞书API相关配置
			
 
				+APP_ID = os.getenv('FEISHU_APP_ID')
			
 
				+APP_SECRET = os.getenv('FEISHU_APP_SECRET')
			
 
				+SHEET_TOKEN = "ESmNsJ3FWhcfbmtvwlAcvcWMngf"
			
 
				+SHEET_NAME = "Zsag5j"
			
 
				+
			
 
				+# 最大并发数
			
 
				+MAX_CONCURRENCY = 5
			
 
				+
			
 
				+class FeishuAPI:
			
 
				+    """飞书API处理类"""
			
 
				+    
			
 
				+    def __init__(self):
			
 
				+        self.app_id = APP_ID
			
 
				+        self.app_secret = APP_SECRET
			
 
				+        self.base_url = "https://open.feishu.cn/open-apis"
			
 
				+        self.access_token = None
			
 
				+        self.token_expires = 0
			
 
				+        self.lock = threading.Lock()  # 添加线程锁保证线程安全
			
 
				+    
			
 
				+    def get_access_token(self):
			
 
				+        """获取飞书访问令牌"""
			
 
				+        # 使用线程锁确保线程安全
			
 
				+        with self.lock:
			
 
				+            # 如果令牌有效且未过期，直接返回
			
 
				+            if self.access_token and time.time() < self.token_expires:
			
 
				+                return self.access_token
			
 
				+                
			
 
				+            url = f"{self.base_url}/auth/v3/tenant_access_token/internal"
			
 
				+            payload = {
			
 
				+                "app_id": self.app_id,
			
 
				+                "app_secret": self.app_secret
			
 
				+            }
			
 
				+            
			
 
				+            try:
			
 
				+                response = requests.post(url, json=payload)
			
 
				+                result = response.json()
			
 
				+                if result.get("code") == 0:
			
 
				+                    self.access_token = result.get("tenant_access_token")
			
 
				+                    # 设置过期时间（提前5分钟过期）
			
 
				+                    self.token_expires = time.time() + result.get("expire") - 300
			
 
				+                    logger.info("成功获取飞书访问令牌")
			
 
				+                    return self.access_token
			
 
				+                else:
			
 
				+                    error_msg = f"获取飞书访问令牌失败: {result}"
			
 
				+                    logger.error(error_msg)
			
 
				+                    raise Exception(error_msg)
			
 
				+            except Exception as e:
			
 
				+                logger.error(f"获取飞书访问令牌时发生异常: {e}")
			
 
				+                raise
			
 
				+    
			
 
				+    def get_sheet_data(self):
			
 
				+        """获取飞书表格数据"""
			
 
				+        try:
			
 
				+            token = self.get_access_token()
			
 
				+            url = f"{self.base_url}/sheets/v2/spreadsheets/{SHEET_TOKEN}/values/{SHEET_NAME}"
			
 
				+            headers = {"Authorization": f"Bearer {token}"}
			
 
				+            
			
 
				+            logger.info(f"正在获取表格数据: {SHEET_TOKEN}/{SHEET_NAME}")
			
 
				+            response = requests.get(url, headers=headers)
			
 
				+            result = response.json()
			
 
				+            if result.get("code") == 0:
			
 
				+                data = result.get("data", {}).get("valueRange", {}).get("values", [])
			
 
				+                logger.info(f"成功获取表格数据，共 {len(data)} 行")
			
 
				+                return data
			
 
				+            else:
			
 
				+                error_msg = f"获取飞书表格数据失败: {result}"
			
 
				+                logger.error(error_msg)
			
 
				+                raise Exception(error_msg)
			
 
				+        except Exception as e:
			
 
				+            logger.error(f"获取表格数据时发生异常: {e}")
			
 
				+            raise
			
 
				+    
			
 
				+    def update_sheet_cell(self, row_index, col_index, value, max_retries=1, retry_delay=2):
			
 
				+        """更新飞书表格单元格，带重试机制"""
			
 
				+        # 计算单元格范围（例如：'H2'）
			
 
				+        col_letter = chr(ord('A') + col_index)
			
 
				+        range_str = f"{SHEET_NAME}!{col_letter}{row_index + 1}:{col_letter}{row_index + 1}"
			
 
				+        
			
 
				+        for retry in range(max_retries):
			
 
				+            try:
			
 
				+                # 每次重试都重新获取token，以防token过期
			
 
				+                token = self.get_access_token()
			
 
				+                url = f"{self.base_url}/sheets/v2/spreadsheets/{SHEET_TOKEN}/values"
			
 
				+                
			
 
				+                payload = {
			
 
				+                    "valueRange": {
			
 
				+                        "range": range_str,
			
 
				+                        "values": [[value]]
			
 
				+                    }
			
 
				+                }
			
 
				+                
			
 
				+                headers = {"Authorization": f"Bearer {token}"}
			
 
				+                
			
 
				+                logger.debug(f"正在更新单元格: {range_str} (尝试 {retry+1}/{max_retries})")
			
 
				+                response = requests.put(url, headers=headers, json=payload)
			
 
				+                result = response.json()
			
 
				+                
			
 
				+                if result.get("code") == 0:
			
 
				+                    logger.debug(f"成功更新单元格: {range_str}")
			
 
				+                    return True
			
 
				+                elif result.get("code") == 91403 and retry < max_retries - 1:  # Forbidden错误，可能是权限问题
			
 
				+                    logger.warning(f"更新单元格 {range_str} 返回Forbidden错误，将在 {retry_delay} 秒后重试")
			
 
				+                    time.sleep(retry_delay)
			
 
				+                    # 下次重试延迟时间加倍
			
 
				+                    retry_delay *= 2
			
 
				+                else:
			
 
				+                    logger.warning(f"更新单元格 {range_str} 失败: {result}")
			
 
				+                    return False
			
 
				+                    
			
 
				+            except Exception as e:
			
 
				+                if retry < max_retries - 1:
			
 
				+                    logger.warning(f"更新单元格 {range_str} 时发生异常: {e}，将在 {retry_delay} 秒后重试")
			
 
				+                    time.sleep(retry_delay)
			
 
				+                    # 下次重试延迟时间加倍
			
 
				+                    retry_delay *= 2
			
 
				+                else:
			
 
				+                    logger.error(f"更新单元格 {range_str} 时发生异常: {e}，已达到最大重试次数")
			
 
				+                    return False
			
 
				+        
			
 
				+        return False  # 所有重试都失败
			
 
				+
			
 
				+class EvaluationProcessor:
			
 
				+    """评估处理类"""
			
 
				+    
			
 
				+    def __init__(self):
			
 
				+        # 加载评估和打分的prompt
			
 
				+        self.consistency_prompt = self._load_prompt("p1.md")
			
 
				+        self.scoring_prompt = self._load_prompt("p2.md")
			
 
				+        # 初始化OpenRouter处理器
			
 
				+        self.llm_processor = OpenRouterProcessor(OpenRouterModel.GEMINI_25_FLASH)
			
 
				+        
			
 
				+    def _load_prompt(self, filename):
			
 
				+        """加载prompt文件"""
			
 
				+        current_dir = os.path.dirname(os.path.abspath(__file__))
			
 
				+        file_path = os.path.join(current_dir, filename)
			
 
				+        
			
 
				+        with open(file_path, 'r', encoding='utf-8') as file:
			
 
				+            return file.read()
			
 
				+    
			
 
				+    def evaluate_consistency(self, keyword, structured_result):
			
 
				+        """评估一致性"""
			
 
				+        try:
			
 
				+            input_data = {
			
 
				+                "query": keyword,
			
 
				+                "query结果文本": structured_result
			
 
				+            }
			
 
				+            
			
 
				+            logger.info(f"正在进行一致性评估: {keyword[:30]}...")
			
 
				+            # 调用LLM进行一致性评估
			
 
				+            result = self.llm_processor.process(input_data, self.consistency_prompt)
			
 
				+            
			
 
				+            try:
			
 
				+                # 尝试解析JSON结果
			
 
				+                # 处理可能的不完整JSON字符串
			
 
				+                result = result.strip()
			
 
				+                if result.startswith('```json') and '```' in result:
			
 
				+                    # 提取JSON部分
			
 
				+                    json_str = result.split('```json', 1)[1].split('```', 1)[0].strip()
			
 
				+                    json_result = json.loads(json_str)
			
 
				+                else:
			
 
				+                    json_result = json.loads(result)
			
 
				+                    
			
 
				+                consistency = json_result.get("consistency", "")
			
 
				+                reason = json_result.get("reason", [])
			
 
				+                reason_str = "\n".join(reason) if isinstance(reason, list) else str(reason)
			
 
				+                logger.info(f"一致性评估结果: {consistency}")
			
 
				+                return consistency, reason_str
			
 
				+            except json.JSONDecodeError as e:
			
 
				+                # 如果结果不是有效的JSON，尝试修复并重新解析
			
 
				+                logger.warning(f"一致性评估结果解析失败: {result[:200]}... 错误: {e}")
			
 
				+                try:
			
 
				+                    # 尝试从文本中提取JSON部分
			
 
				+                    if '{' in result and '}' in result:
			
 
				+                        json_part = result[result.find('{'):result.rfind('}')+1]
			
 
				+                        json_result = json.loads(json_part)
			
 
				+                        consistency = json_result.get("consistency", "")
			
 
				+                        reason = json_result.get("reason", [])
			
 
				+                        reason_str = "\n".join(reason) if isinstance(reason, list) else str(reason)
			
 
				+                        logger.info(f"修复后解析成功，一致性评估结果: {consistency}")
			
 
				+                        return consistency, reason_str
			
 
				+                except:
			
 
				+                    pass
			
 
				+                return "解析错误", result[:500]  # 限制返回长度
			
 
				+        except Exception as e:
			
 
				+            logger.error(f"一致性评估过程中发生异常: {e}")
			
 
				+            return "评估异常", str(e)
			
 
				+    
			
 
				+    def evaluate_score(self, keyword, structured_result):
			
 
				+        """评估打分"""
			
 
				+        try:
			
 
				+            input_data = {
			
 
				+                "query词": keyword,
			
 
				+                "文本知识": structured_result
			
 
				+            }
			
 
				+            
			
 
				+            logger.info(f"正在进行打分评估: {keyword[:30]}...")
			
 
				+            # 调用LLM进行打分评估
			
 
				+            result = self.llm_processor.process(input_data, self.scoring_prompt)
			
 
				+            
			
 
				+            try:
			
 
				+                # 尝试解析JSON结果
			
 
				+                # 处理可能的不完整JSON字符串
			
 
				+                result = result.strip()
			
 
				+                if result.startswith('```json') and '```' in result:
			
 
				+                    # 提取JSON部分
			
 
				+                    json_str = result.split('```json', 1)[1].split('```', 1)[0].strip()
			
 
				+                    json_result = json.loads(json_str)
			
 
				+                else:
			
 
				+                    json_result = json.loads(result)
			
 
				+                    
			
 
				+                score = json_result.get("分数", "")
			
 
				+                reason = json_result.get("原因", {})
			
 
				+                # 将原因字典转换为字符串
			
 
				+                reason_str = "\n".join([f"{k}: {v}" for k, v in reason.items()])
			
 
				+                logger.info(f"打分评估结果: {score}")
			
 
				+                return score, reason_str
			
 
				+            except json.JSONDecodeError as e:
			
 
				+                # 如果结果不是有效的JSON，尝试修复并重新解析
			
 
				+                logger.warning(f"打分评估结果解析失败: {result[:200]}... 错误: {e}")
			
 
				+                try:
			
 
				+                    # 尝试从文本中提取JSON部分
			
 
				+                    if '{' in result and '}' in result:
			
 
				+                        json_part = result[result.find('{'):result.rfind('}')+1]
			
 
				+                        json_result = json.loads(json_part)
			
 
				+                        score = json_result.get("分数", "")
			
 
				+                        reason = json_result.get("原因", {})
			
 
				+                        reason_str = "\n".join([f"{k}: {v}" for k, v in reason.items()])
			
 
				+                        logger.info(f"修复后解析成功，打分评估结果: {score}")
			
 
				+                        return score, reason_str
			
 
				+                except:
			
 
				+                    pass
			
 
				+                return "解析错误", result[:500]  # 限制返回长度
			
 
				+        except Exception as e:
			
 
				+            logger.error(f"打分评估过程中发生异常: {e}")
			
 
				+            return "评估异常", str(e)
			
 
				+
			
 
				+def process_row(row_index, row_data, feishu_api, evaluator):
			
 
				+    """处理单行数据"""
			
 
				+    try:
			
 
				+        # 获取关键词（C列）和结构化结果（G列）
			
 
				+        keyword = row_data[2] if len(row_data) > 2 else ""
			
 
				+        structured_result = row_data[6] if len(row_data) > 6 else ""
			
 
				+        
			
 
				+        if not keyword or not structured_result:
			
 
				+            logger.warning(f"行 {row_index+1} 数据不完整，跳过处理")
			
 
				+            return
			
 
				+        
			
 
				+        logger.info(f"开始处理行 {row_index+1}: {keyword[:30]}...")
			
 
				+        
			
 
				+        # 检查H列和J列是否已有数据，如果有则跳过处理
			
 
				+        h_value = row_data[7] if len(row_data) > 7 else ""
			
 
				+        j_value = row_data[9] if len(row_data) > 9 else ""
			
 
				+        
			
 
				+        # 评估一致性（如果H列为空）
			
 
				+        if not h_value:
			
 
				+            consistency, consistency_reason = evaluator.evaluate_consistency(keyword, structured_result)
			
 
				+            
			
 
				+            # 更新一致性结果（H列和I列）
			
 
				+            feishu_api.update_sheet_cell(row_index, 7, consistency)  # H列
			
 
				+            feishu_api.update_sheet_cell(row_index, 8, consistency_reason)  # I列
			
 
				+        else:
			
 
				+            logger.info(f"行 {row_index+1} 的一致性评估结果已存在，跳过处理")
			
 
				+        
			
 
				+        # 评估打分（如果J列为空）
			
 
				+        if not j_value:
			
 
				+            score, score_reason = evaluator.evaluate_score(keyword, structured_result)
			
 
				+            
			
 
				+            # 更新打分结果（J列和K列）
			
 
				+            feishu_api.update_sheet_cell(row_index, 9, score)  # J列
			
 
				+            feishu_api.update_sheet_cell(row_index, 10, score_reason)  # K列
			
 
				+        else:
			
 
				+            logger.info(f"行 {row_index+1} 的打分评估结果已存在，跳过处理")
			
 
				+        
			
 
				+        logger.info(f"行 {row_index+1} 处理完成")
			
 
				+        
			
 
				+    except Exception as e:
			
 
				+        logger.error(f"处理行 {row_index+1} 时出错: {e}", exc_info=True)
			
 
				+
			
 
				+def main():
			
 
				+    """主函数"""
			
 
				+    try:
			
 
				+        logger.info("开始执行飞书表格评估程序")
			
 
				+        
			
 
				+        # 初始化飞书API和评估处理器
			
 
				+        feishu_api = FeishuAPI()
			
 
				+        evaluator = EvaluationProcessor()
			
 
				+        
			
 
				+        # 获取表格数据
			
 
				+        sheet_data = feishu_api.get_sheet_data()
			
 
				+        
			
 
				+        if not sheet_data or len(sheet_data) <= 1:  # 考虑表头
			
 
				+            logger.warning("表格数据为空或只有表头")
			
 
				+            return
			
 
				+        
			
 
				+        logger.info(f"共获取到 {len(sheet_data)-1} 行数据（不含表头）")
			
 
				+        
			
 
				+        # 创建线程池
			
 
				+        with ThreadPoolExecutor(max_workers=MAX_CONCURRENCY) as executor:
			
 
				+            # 跳过表头，处理数据行
			
 
				+            futures = []
			
 
				+            for i, row in enumerate(sheet_data[1:], 1):  # 从索引1开始（跳过表头）
			
 
				+                future = executor.submit(process_row, i, row, feishu_api, evaluator)
			
 
				+                futures.append(future)
			
 
				+            
			
 
				+            # 等待所有任务完成
			
 
				+            for future in futures:
			
 
				+                try:
			
 
				+                    future.result()  # 获取任务结果，如果有异常会在这里抛出
			
 
				+                except Exception as e:
			
 
				+                    logger.error(f"任务执行失败: {e}", exc_info=True)
			
 
				+        
			
 
				+        logger.info("所有数据处理完成")
			
 
				+    except Exception as e:
			
 
				+        logger.error(f"程序执行过程中发生异常: {e}", exc_info=True)
			
 
				+        sys.exit(1)
			
 
				+
			
 
				+if __name__ == "__main__":
			
 
				+    # 运行主函数
			
 
				+    main()
			
--- a/offline/p1.md
+++ b/offline/p1.md
@@ -0,0 +1,69 @@
 
				+
			
 
				+# 系统角色与目标
			
 
				+你是一个“内容创作方法论语义评估专家”。  
			
 
				+核心目标：评估用户输入的 query 与 query 对应的文本结果是否具备语义一致性，确保 query 的意图与文本核心语义严格对齐，以便剔除不匹配内容，提高内容评估标准适配性。
			
 
				+query范围限定在**内容创作领域**（如自媒体图文、短视频脚本、广告文案、海报设计等）的 query 与结果文本语义一致性；若文本涉及非内容创作领域（如金融、医疗、电商售后等），直接判定 "一致性": "低"
			
 
				+
			
 
				+评估原则：
			
 
				+1. **意图对齐优先于字面匹配**：避免“字面匹配但语义不符”或“语义一致但字面差异”导致的误判。  
			
 
				+2. **三层评估**：基础匹配 → 深度语义评估 → 业务校验。  
			
 
				+3. 输出结果按 “二级划分” 给出最终一致性判断。
			
 
				+
			
 
				+
			
 
				+## 用户输入信息
			
 
				+- **query**: 用户检索/查询的核心关键词或问题  
			
 
				+- **query结果文本**: 与 query 对应的内容文本或摘要  
			
 
				+
			
 
				+
			
 
				+## 评估方法
			
 
				+
			
 
				+### 1. 基础层：关键词与要素匹配（快速初筛）
			
 
				+操作步骤：
			
 
				+1. 从 query 中提取核心要素：
			
 
				+   - **业务类型**（如“内容创作-自媒体-图文创作”）  
			
 
				+   - **核心需求词**（如“美食图文选题”）  
			
 
				+2. 对比文本的业务标签与核心概念：
			
 
				+   - 文本标签（如“内容创作→自媒体→图文选题策划”）  
			
 
				+   - 核心概念（如“美食图文选题方向”）  
			
 
				+3. 计算要素重叠率：
			
 
				+   - 重叠率 = (query 与文本共有核心要素数) / (query 核心要素总数)
			
 
				+   - 阈值：≥50% → 初步通过；<50% → 判定不一致  
			
 
				+4. 业务适配：
			
 
				+- 对强要素依赖业务严格匹配业务细分类型和核心术语  
			
 
				+
			
 
				+### 2. 深度层：语义相似度与意图匹配（核心评估）
			
 
				+操作步骤：
			
 
				+1. **语义向量匹配**：
			
 
				+- 将 query 与文本（或文本摘要）转为语义向量（BERT/SBERT/ERNIE）  
			
 
				+- 计算余弦相似度  
			
 
				+- 阈值示例：
			
 
				+  - “自媒体创作指南”类 ≥0.75  
			
 
				+  - “广告合规文档”类 ≥0.85  
			
 
				+- 高于阈值 → 进入意图评估；低于阈值 → 判定不一致  
			
 
				+2. **意图识别与对齐**：
			
 
				+- 为 query 与文本标注意图标签体系,如下<举例说明>：
			
 
				+    <举例说明>
			
 
				+  {示例意图：咨询创作方法 | 查询合规要求 | 获取优化建议 | 确认格式规范
			
 
				+  ```
			
 
				+- 比较 query 与文本意图：
			
 
				+  - 一致 → 意图匹配  
			
 
				+  - 不一致 → 判断意图关联性，若文本部分覆盖 query 的意图，则部分一致，否则不一致  }
			
 
				+    </举例说明>
			
 
				+
			
 
				+### 3. 业务层：规则校验与场景适配（最终确认）
			
 
				+操作步骤：
			
 
				+1. **业务术语校验**：确保 query 与文本属于同一创作术语体系  
			
 
				+2. **约束条件匹配**：检查文本是否满足 query 的隐含条件（如“新手友好”、“低门槛”等）  
			
 
				+3. **创作环节适配**：确认文本是否对应 query 的创作环节（如“脚本审核后修改” vs “创作前框架设计”）  
			
 
				+
			
 
				+
			
 
				+## 输出格式（JSON）
			
 
				+
			
 
				+{
			
 
				+"consistency": "高/低",
			
 
				+"reason": [
			
 
				+ "基础层判断：说明要素匹配情况及重叠率",
			
 
				+ "深度层判断：说明语义相似度、意图对齐情况",
			
 
				+ "业务层判断：说明业务术语、约束条件及环节适配情况"
			
 
				+]
			
 
				+}
			
--- a/offline/p2.md
+++ b/offline/p2.md
@@ -0,0 +1,81 @@
 
				+# 角色与目标
			
 
				+你是一个“内容创作 Pattern 评估专家”。  
			
 
				+你的任务是：根据输入的【文本知识】和【query词】，判断该文本是否为一个高质量的 **内容创作 Pattern**。  
			
 
				+注意：你的分析必须严格在“高质量内容 Pattern”这一目标约束下进行，若分析超出目标，也必须回到目标范围内。
			
 
				+
			
 
				+---
			
 
				+
			
 
				+# Pattern 定义与特征
			
 
				+内容 Pattern（内容模式/内容范式）是指在内容创作、传播与消费全链路中，基于用户认知习惯与内容目标形成的、可复用的规律性结构/逻辑框架。  
			
 
				+核心属性：
			
 
				+1. **规律性**：贴合用户信息接收逻辑，具有稳定结构，非随机。  
			
 
				+2. **目的性**：服务于明确内容目标（如知识传递、情感共鸣、传播裂变）。  
			
 
				+3. **可复制性**：提供可套用的框架骨架，允许差异化填充，能让内容小白复用并创作。  
			
 
				+
			
 
				+---
			
 
				+
			
 
				+# 评估方法
			
 
				+请基于以下维度对输入文本进行评估，总分 100 分（可加分至 110 分，若单一维度极其优质，由模型智能判断加分）：  
			
 
				+
			
 
				+1. **规律性 (0–25 分)**  
			
 
				+   - 是否体现规律性的逻辑或结构？  
			
 
				+   - 是否符合用户认知习惯与信息接收偏好？  
			
 
				+
			
 
				+2. **目的性 (0–20 分)**  
			
 
				+   - 是否清晰指向某个创作目标（知识/情感/传播）？  
			
 
				+   - 目标是否与内容呈现方式高度契合？  
			
 
				+
			
 
				+3. **可复制性 (0–20 分)**  
			
 
				+   - 是否提供可落地的框架？  
			
 
				+   - 是否能让内容小白基于此 Pattern 创作？  
			
 
				+
			
 
				+4. **心理学传播机制契合度 (0–15 分)**  
			
 
				+   - 是否利用心理动机、情绪反应、情境因素或个体特征？  
			
 
				+   - 是否能引发用户互动或共鸣？  
			
 
				+
			
 
				+5. **平台算法适配性 (0–10 分)**  
			
 
				+   - 是否考虑用户画像与用户行为？  
			
 
				+   - 是否具备被算法推荐或分发的潜力？  
			
 
				+
			
 
				+6. **可信度与实用价值 (0–10 分)**  
			
 
				+   - 内容逻辑是否可信？  
			
 
				+   - 是否具有实际创作价值？  
			
 
				+
			
 
				+> 额外智能加分机制：若某一维度表现极其优质，可额外加 1–10 分，总分上限 110 分。  
			
 
				+
			
 
				+---
			
 
				+
			
 
				+# 输出要求
			
 
				+输出统一为以下格式（不要表格）：  
			
 
				+{
			
 
				+  "分数": "[xx/100（若有加分，则 xx/110）]"
			
 
				+  "原因": {
			
 
				+    "规律性":"[……]",
			
 
				+    "目的性":"[……]",
			
 
				+    "可复制性":"[……]",
			
 
				+    "心理学传播机制契合度":"[……]",
			
 
				+    "平台算法适配性":"[……]",
			
 
				+    "可信度与实用价值":"[……]",
			
 
				+    "加分说明（如有）":"[……]"
			
 
				+  }
			
 
				+}
			
 
				+
			
 
				+---
			
 
				+
			
 
				+# 输入示例
			
 
				+【query词】：图文策划爆款案例  
			
 
				+【文本知识】：xxxxxxx  
			
 
				+
			
 
				+# 输出示例
			
 
				+{
			
 
				+  "分数": "85/100"
			
 
				+  "原因": {
			
 
				+    "规律性":"结构清晰，呈现对比冲突逻辑，20/25",
			
 
				+    "目的性":"目标明确，强调传播与情感共鸣，18/20",
			
 
				+    "可复制性":"提供了框架，但执行细节略缺，15/20",
			
 
				+    "心理学传播机制契合度":"利用了情绪与从众心理，12/15",
			
 
				+    "平台算法适配性":"部分考虑用户行为，但未结合画像，6/10",
			
 
				+    "可信度与实用价值":"逻辑合理，可落地，9/10",
			
 
				+    "加分说明（如有）":"无"
			
 
				+  }
			
 
				+}