#!/usr/bin/env python
# -*- coding: utf-8 -*-
"""
评估Agent

功能: 从待评估的视频列表中筛选出和原视频最匹配的内容
核心任务: 根据原视频的解构内容，对每个候选视频进行相关性评分和筛选
特征: 使用LLM进行相关性评估，输出评分和是否入选
"""

from typing import Any, Dict, List
import json

from src.components.agents.base import BaseLLMAgent
from src.utils.logger import get_logger
from src.utils.llm_invoker import LLMInvoker

logger = get_logger(__name__)


class EvaluateAgent(BaseLLMAgent):
    """评估Agent - 筛选和原视频最匹配的视频"""

    def __init__(
        self,
        name: str = "evaluate_agent",
        description: str = "评估Agent - 筛选和原视频最匹配的视频",
        model_provider: str = "google_genai",
        temperature: float = 0.3,
        max_tokens: int = 20480
    ):
        """
        初始化评估Agent

        Args:
            name: Agent名称
            description: Agent描述
            model_provider: 模型提供商 ("openai" 或 "google_genai")
            temperature: 生成温度（较低，保持客观性）
            max_tokens: 最大token数
        """
        system_prompt = self._build_system_prompt()
        super().__init__(
            name=name,
            description=description,
            model_provider=model_provider,
            system_prompt=system_prompt,
            temperature=temperature,
            max_tokens=max_tokens
        )

    def _build_system_prompt(self) -> str:
        """构建系统提示词"""
        return """你是内容分析专家，擅长评估视频内容的相关性和匹配度。

# 任务
根据原视频的解构内容（包括标题、灵感点、目的点、关键点、选题理解等），对候选视频列表进行相关性评估和筛选。

# 评估维度
1. **内容主题匹配度**：候选视频的主题是否与原视频的主题一致或相关
2. **切入点相似度**：候选视频的切入角度是否与原视频相似
3. **受众重合度**：候选视频的目标受众是否与原视频重合
4. **表现形式相似度**：候选视频的表现形式（风格、结构等）是否与原视频相似

# 评分标准
- 相关性得分范围：0-100分
- 90-100分：高度相关，主题、切入点、受众、表现形式都高度匹配
- 70-89分：相关，在多个维度上匹配
- 50-69分：中等相关，在某些维度上匹配
- 30-49分：低相关，匹配度较低
- 0-29分：不相关，基本不匹配

# 输出要求
1. 对每个候选视频进行评分（0-100分）
2. 根据评分排序，默认选前50%进入候选
3. 输出结果保持与输入列表相同的顺序和字段，新增两个字段：
   - relevance_score: 相关性得分（0-100）
   - is_selected: 是否入选（true/false）
"""

    def process(self, state: Dict[str, Any], config=None) -> Dict[str, Any]:
        """处理状态 - 评估视频相关性并筛选
        
        Args:
            state: 状态字典，包含：
                - original_video_title: 原视频标题
                - original_video_content: 原视频解构内容（JSON格式）
                - search_result: 待评估的视频列表
                
        Returns:
            更新后的状态，包含：
                - evaluate_result: 评估结果列表（每个视频包含原始字段 + relevance_score + is_selected）
        """
        if not self.is_initialized:
            self.initialize()

        logger.info("开始评估视频相关性")

        try:
            # 从state获取数据
            original_video_title = state.get("original_video_title", "")
            original_video_content = state.get("original_video_content", {})
            search_result = state.get("search_result", [])

            if not search_result:
                logger.warning("待评估的视频列表为空")
                return {
                    "evaluate_result": []
                }

            if not original_video_title and not original_video_content:
                logger.warning("原视频信息为空，无法进行评估")
                return {
                    "evaluate_result": []
                }

            # 构建评估提示词
            prompt = self._build_evaluate_prompt(
                original_video_title,
                original_video_content,
                search_result
            )

            messages = [
                {"role": "system", "content": self.system_prompt},
                {"role": "user", "content": prompt}
            ]

            # 调用LLM进行评估
            result = LLMInvoker.safe_invoke(
                self,
                "视频相关性评估",
                messages,
                fallback={"评估结果": []}
            )

            # 提取评估结果
            evaluate_result = result.get("评估结果", [])
            
            # 如果LLM返回的结果数量与输入不一致，进行修正
            if len(evaluate_result) != len(search_result):
                logger.warning(
                    f"LLM返回结果数量({len(evaluate_result)})与输入数量({len(search_result)})不一致，"
                    "将进行修正"
                )
                evaluate_result = self._fix_evaluate_result(search_result, evaluate_result)

            # 确保每个结果都有relevance_score和is_selected字段
            evaluate_result = self._ensure_evaluate_fields(search_result, evaluate_result)

            # 根据评分排序并标记前50%为入选
            evaluate_result = self._mark_selected_videos(evaluate_result)

            logger.info(f"评估完成，共评估{len(evaluate_result)}个视频")

            return {
                "evaluate_result": evaluate_result
            }

        except Exception as e:
            logger.error(f"视频评估失败: {e}", exc_info=True)
            # 返回原始列表，但添加默认的评分和选择状态
            search_result = state.get("search_result", [])
            return {
                "evaluate_result": [
                    {**video, "relevance_score": 0, "is_selected": False}
                    for video in search_result
                ]
            }

    def _build_evaluate_prompt(
        self,
        original_video_title: str,
        original_video_content: Dict[str, Any],
        search_result: List[Dict[str, Any]]
    ) -> str:
        """构建评估提示词"""
        
        # 格式化原视频内容
        content_str = json.dumps(original_video_content, ensure_ascii=False, indent=2)
        
        # 格式化候选视频列表
        candidates_text = ""
        for i, video in enumerate(search_result, 1):
            video_str = json.dumps(video, ensure_ascii=False, indent=2)
            candidates_text += f"\n## 候选视频 {i}\n{video_str}\n"

        prompt = f"""# 任务：评估视频相关性

## 原视频信息

### 标题
{original_video_title}

### 解构内容
{content_str}

## 候选视频列表
{candidates_text}

## 评估要求

1. **对每个候选视频进行相关性评分**（0-100分）
   - 考虑内容主题匹配度、切入点相似度、受众重合度、表现形式相似度
   - 评分要客观、准确

2. **输出格式要求**
   - 保持与输入列表相同的顺序
   - 保留原始字段不变
   - 新增两个字段：
     - `relevance_score`: 相关性得分（整数，0-100）
     - `is_selected`: 是否入选（布尔值，暂时设为false，后续会根据评分排序后标记前50%）

## 输出格式（JSON）

```json
{{
  "评估结果": [
    {{
      // 保留原始字段...
      "relevance_score": 85,
      "is_selected": false
    }}
  ]
}}
```

**重要**：
- 输出结果的数量必须与输入列表的数量完全一致
- 每个结果必须包含所有原始字段
- 每个结果必须包含relevance_score和is_selected字段
"""

        return prompt

    def _fix_evaluate_result(
        self,
        original_list: List[Dict[str, Any]],
        llm_result: List[Dict[str, Any]]
    ) -> List[Dict[str, Any]]:
        """修正评估结果，确保数量一致"""
        fixed_result = []
        
        # 创建LLM结果的索引（通过某些唯一字段匹配）
        llm_result_map = {}
        for item in llm_result:
            # 尝试通过video_id或其他唯一字段匹配
            video_id = item.get("video_id") or item.get("id") or item.get("videoId")
            if video_id:
                llm_result_map[str(video_id)] = item
        
        # 遍历原始列表，匹配LLM结果
        for i, original in enumerate(original_list):
            video_id = original.get("video_id") or original.get("id") or original.get("videoId")
            if video_id and str(video_id) in llm_result_map:
                # 找到匹配的结果，合并字段
                matched = llm_result_map[str(video_id)]
                fixed_item = {**original, **matched}
                fixed_result.append(fixed_item)
            elif i < len(llm_result):
                # 按索引匹配
                matched = llm_result[i]
                fixed_item = {**original, **matched}
                fixed_result.append(fixed_item)
            else:
                # 没有匹配的结果，使用原始数据并添加默认评分
                fixed_item = {**original, "relevance_score": 0, "is_selected": False}
                fixed_result.append(fixed_item)
        
        return fixed_result

    def _ensure_evaluate_fields(
        self,
        original_list: List[Dict[str, Any]],
        evaluate_result: List[Dict[str, Any]]
    ) -> List[Dict[str, Any]]:
        """确保每个评估结果都有必要的字段"""
        ensured_result = []
        
        for i, original in enumerate(original_list):
            if i < len(evaluate_result):
                item = evaluate_result[i]
                # 合并原始字段和评估字段
                merged_item = {**original}
                
                # 确保有relevance_score
                if "relevance_score" in item:
                    merged_item["relevance_score"] = item["relevance_score"]
                else:
                    merged_item["relevance_score"] = 0
                
                # 确保有is_selected（暂时设为false，后续会重新标记）
                merged_item["is_selected"] = False
                
                ensured_result.append(merged_item)
            else:
                # 如果LLM结果不足，使用原始数据并添加默认值
                ensured_result.append({
                    **original,
                    "relevance_score": 0,
                    "is_selected": False
                })
        
        return ensured_result

    def _mark_selected_videos(self, evaluate_result: List[Dict[str, Any]]) -> List[Dict[str, Any]]:
        """根据评分排序并标记前50%为入选，然后恢复原始顺序"""
        if not evaluate_result:
            return evaluate_result
        
        # 为每个视频添加临时索引，以便后续恢复原始顺序
        indexed_result = [
            {**item, "_original_index": i}
            for i, item in enumerate(evaluate_result)
        ]
        
        # 按评分降序排序
        sorted_result = sorted(
            indexed_result,
            key=lambda x: x.get("relevance_score", 0),
            reverse=True
        )
        
        # 计算前50%的数量（向上取整）
        selected_count = max(1, (len(sorted_result) + 1) // 2)
        
        # 标记前50%为入选
        for i, item in enumerate(sorted_result):
            item["is_selected"] = (i < selected_count)
        
        # 恢复原始顺序
        sorted_result.sort(key=lambda x: x.get("_original_index", len(evaluate_result)))
        
        # 移除临时索引
        for item in sorted_result:
            item.pop("_original_index", None)
        
        return sorted_result

    def _build_messages(self, state: Dict[str, Any]) -> List[Dict[str, Any]]:
        """构建消息 - BaseLLMAgent要求实现（本Agent不使用此方法）"""
        return []

    def _update_state(self, state: Dict[str, Any], response: Any) -> Dict[str, Any]:
        """更新状态 - BaseLLMAgent要求实现（本Agent不使用此方法）"""
        return state