3 ay önce · 5415d06f9b
--- a/examples/content_finder/content_finder.md
+++ b/examples/content_finder/content_finder.md
@@ -15,6 +15,7 @@ $system$
 
				 5. **`think_and_plan` 用于结构化记录**：`think_and_plan` 仍然用于记录计划和关键节点，但它不能替代你在对话中直接输出的思考文本。两者互补，缺一不可。
			
 
				 
			
 
				 ## 可用工具（按目的）
			
 
				+- 获取高赞视频的选题点： `get_video_topic`
			
 
				 - 抖音视频搜索：`douyin_search`
			
 
				 - 抖音作者作品搜索：`douyin_user_videos`
			
 
				 - 数据库作者检索（按搜索词找历史优质作者）：`find_authors_from_db`
			
@@ -36,7 +37,7 @@ $system$
 
				 - 核心指标：分享率、DAU
			
 
				 
			
 
				 ## 执行流程（按顺序，禁止跳步）
			
 
				-1. **需求理解阶段**: 按 `demand_analysis` 执行
			
 
				+1. **需求理解阶段**: 按 `demand_analysis` 执行,输出的内容用于后续的流程
			
 
				 1. **内容寻找和筛选阶段**：按 `content_finding_strategy` 执行
			
 
				 2. **筛选阶段**：按 `content_filtering_strategy` 执行，并且将 `demand_analysis` 的结果（判别目标/关键点/形式规则）用于“需求对齐打分”和淘汰理由生成
			
 
				 3. **优质账号扩展**: 对于筛选阶段获取到用户画像的优质作者，按`high_quality_analysis`执行
			
--- a/examples/content_finder/core.py
+++ b/examples/content_finder/core.py
@@ -53,6 +53,7 @@ from tools import (
 
				     store_results_mysql,
			
 
				     think_and_plan,
			
 
				     find_authors_from_db,
			
 
				+    get_video_topic,
			
 
				 )
			
 
				 
			
 
				 logger = logging.getLogger(__name__)
			
@@ -143,6 +144,7 @@ async def run_agent(
 
				         "create_crawler_plan_by_douyin_content_id",
			
 
				         "create_crawler_plan_by_douyin_account_id",
			
 
				         "think_and_plan",
			
 
				+        "get_video_topic",
			
 
				     ]
			
 
				 
			
 
				     runner = AgentRunner(
			
--- a/examples/content_finder/skills/content_finding_strategy.md
+++ b/examples/content_finder/skills/content_finding_strategy.md
@@ -9,34 +9,30 @@ description: 内容搜索方法论
 
				 
			
 
				 ---
			
 
				 
			
 
				-## 第一步：需求分析与关键词提取
			
 
				+## 第一步：关键词提取
			
 
				 
			
 
				-- 从用户需求中提取核心关键词和扩展关键词，优先使用用户原话
			
 
				-- 按相关性排序：用户明确说的 > 用户暗示的 > 推测的
			
 
				+- 从`需求分析`中提取若干搜索词。
			
 
				 - 确定目标数量 **M**（如"找10条"，则 M = 10）
			
 
				 
			
 
				 ---
			
 
				 
			
 
				 ## 第二步：串行关键词搜索
			
 
				 
			
 
				+### 优先：抖音搜索
			
 
				+**搜索词限制**： 仅搜索第一步中输出的搜索词，严谨联想或者扩展其他词搜索。
			
 
				 **数量控制**：只搜索 **N = M × 2** 条，搜到后立即停止，不超出此限制。
			
 
				+**数据读取规则**：
			
 
				+- 搜索结果从 `metadata.search_results` 获取，**不要解析工具的 output 文本**
			
 
				+- 账号作品从 `metadata.user_videos` 获取
			
 
				+- 数据库作者从 `find_authors_from_db` 的 `metadata.authors` 获取（优先使用其中的 `author_sec_uid`）
			
 
				+**分页策略**：第一次使用默认 cursor（`"0"` 或 `""`），需要更多时使用返回的 cursor 继续获取。
			
 
				 
			
 
				 ### 备选：历史优质作者扩展（备选策略）
			
 
				-
			
 
				 当关键词搜索结果质量不稳定、或需要更贴近目标人群的内容时，可走“作者→作品”的扩展路径：
			
 
				-
			
 
				 - 先调用 `find_authors_from_db(query)`：从数据库历史沉淀中按搜索词找到相关优质作者（返回 `author_sec_uid`）
			
 
				 - 再对 Top 作者调用 `douyin_user_videos(account_id=author_sec_uid)` 拉作品，作为候选池补充
			
 
				-
			
 
				 **仍需遵守数量控制**：作者扩展拿到的作品也计入候选数量，总量不要超过 **N = M × 2**。
			
 
				 
			
 
				-**数据读取规则**：
			
 
				-- 搜索结果从 `metadata.search_results` 获取，**不要解析工具的 output 文本**
			
 
				-- 账号作品从 `metadata.user_videos` 获取
			
 
				-- 数据库作者从 `find_authors_from_db` 的 `metadata.authors` 获取（优先使用其中的 `author_sec_uid`）
			
 
				-
			
 
				-**分页策略**：第一次使用默认 cursor（`"0"` 或 `""`），需要更多时使用返回的 cursor 继续获取。
			
 
				-
			
 
				 ---
			
 
				 
			
 
				 ## 第三步：数据真实性规范（严格遵守）
			
@@ -45,7 +41,6 @@ description: 内容搜索方法论
 
				 
			
 
				 ### 字段完整性要求
			
 
				 - `author.sec_uid`：约 80 字符，必须**逐字符完整复制**，不能截断或修改
			
 
				-  - 格式校验：必须以 `MS4wLjABAAAA` 开头，后跟约 68 个字符
			
 
				 - `aweme_id`、作者名、热度数据必须来自**同一条记录**，不能混用
			
 
				 
			
 
				 ### 正确做法
			
--- a/examples/content_finder/skills/demand_analysis.md
+++ b/examples/content_finder/skills/demand_analysis.md
@@ -35,13 +35,13 @@ description: 需求分析
 
				 
			
 
				 ---
			
 
				 
			
 
				-## 二、双起点策略（case出发 / 特征出发）
			
 
				+## 二、双起点策略（高赞case出发 / 特征出发）
			
 
				 
			
 
				-### A. case出发（优先用于下层特征）
			
 
				+### A. 高赞case出发（优先用于下层特征）
			
 
				 
			
 
				-适用：需求里已有具象表达，或需要从案例中补全搜索词。  
			
 
				+适用：需求里已有具象表达，或需要从案例中补全/完善搜索词。  
			
 
				 动作：
			
 
				-1. 调用**查看当前输入特征关联的 goodcase 视频选题内容**工具
			
 
				+1. 调用**`get_video_topic`**工具
			
 
				 2. 将工具返回的选题点按用途拆分：
			
 
				    - `灵感点` -> 用于构建**搜索词包**（写入寻找清单的候选词）
			
 
				    - `目的点` -> 用于构建**判别目标**（写入判别清单的“该对齐什么”）
			
@@ -50,6 +50,8 @@ description: 需求分析
 
				    - `寻找清单_case`：由 `灵感点` 扩展出的即时搜索词（允许 3-5 个同义/上下位词）
			
 
				    - `判别清单_case`：由 `目的点` + `关键点` 形成的打分点与淘汰条件草案
			
 
				 
			
 
				+注意：高赞视频仅用于根据选题点扩展/判别，不能作为输出
			
 
				+
			
 
				 ### B. 特征出发（优先用于上层特征）
			
 
				 
			
 
				 适用：需求偏抽象，先建立主题覆盖框架。  
			
--- a/examples/content_finder/tools/__init__.py
+++ b/examples/content_finder/tools/__init__.py
@@ -9,6 +9,7 @@ from .store_results_mysql import store_results_mysql
 
				 from .aigc_platform_api import create_crawler_plan_by_douyin_content_id, create_crawler_plan_by_douyin_account_id
			
 
				 from .think_and_plan import think_and_plan
			
 
				 from .find_authors_from_db import find_authors_from_db
			
 
				+from .get_video_topic import get_video_topic
			
 
				 
			
 
				 __all__ = [
			
 
				     "douyin_search",
			
@@ -20,4 +21,5 @@ __all__ = [
 
				     "create_crawler_plan_by_douyin_account_id",
			
 
				     "think_and_plan",
			
 
				     "find_authors_from_db",
			
 
				+    "get_video_topic",
			
 
				 ]
			
--- a/examples/content_finder/tools/aigc_platform_api.py
+++ b/examples/content_finder/tools/aigc_platform_api.py
@@ -16,6 +16,8 @@ from db import update_content_plan_ids
 
				 
			
 
				 logger = logging.getLogger(__name__)
			
 
				 
			
 
				+USE_REAL_API = False
			
 
				+
			
 
				 AIGC_BASE_URL = "https://aigc-api.aiddit.com"
			
 
				 CRAWLER_PLAN_CREATE_URL = f"{AIGC_BASE_URL}/aigc/crawler/plan/save"
			
 
				 GET_PRODUCE_PLAN_DETAIL_BY_ID = f"{AIGC_BASE_URL}/aigc/produce/plan/detail"
			
@@ -230,6 +232,29 @@ async def create_crawler_plan_by_douyin_content_id(
 
				     Note:
			
 
				         - 建议从 metadata.result 获取结构化数据，而非解析 output 文本
			
 
				     """
			
 
				+    # 先临时返回创建成功，不要真实创建
			
 
				+    if USE_REAL_API == False:
			
 
				+        return ToolResult(
			
 
				+            title="根据抖音内容创建爬取计划",
			
 
				+            output="",
			
 
				+            metadata={
			
 
				+                "result": {
			
 
				+                    "crawler_info": {
			
 
				+                        "crawler_plan_id": "1234567890",
			
 
				+                        "crawler_plan_name": "抖音视频直接抓取",
			
 
				+                    },
			
 
				+                    "produce_plan_infos": [
			
 
				+                        {
			
 
				+                            "produce_plan_id": "1234567890",
			
 
				+                            "produce_plan_name": "抖音视频直接抓取",
			
 
				+                            "is_success": "绑定成功",
			
 
				+                            "msg": "成功",
			
 
				+                        }
			
 
				+                    ]
			
 
				+                }
			
 
				+            },
			
 
				+            long_term_memory="Create crawler plan by DouYin Content IDs",
			
 
				+        )
			
 
				     if not trace_id or not isinstance(trace_id, str):
			
 
				         logger.error(f"create_crawler_plan_by_douyin_content_id invalid trace_id: {trace_id}")
			
 
				         return ToolResult(
			
--- a/examples/content_finder/tools/get_video_topic.py
+++ b/examples/content_finder/tools/get_video_topic.py
@@ -0,0 +1,73 @@
 
				+"""
			
 
				+根据特征匹配高赞视频的选题解构信息（占位版）。
			
 
				+
			
 
				+当前阶段没有真实接口：先把“工具签名 + 返回结构”固定，内部临时返回空列表。
			
 
				+后续接入数据源时，只需要填充 metadata.videos 的内容，不改调用方。
			
 
				+"""
			
 
				+
			
 
				+from __future__ import annotations
			
 
				+
			
 
				+from dataclasses import dataclass
			
 
				+from typing import Any, Dict, List, Optional
			
 
				+
			
 
				+from agent.tools import ToolResult, tool
			
 
				+
			
 
				+JsonDict = Dict[str, Any]
			
 
				+
			
 
				+
			
 
				+@dataclass(frozen=True)
			
 
				+class VideoTopicItem:
			
 
				+    """
			
 
				+    单条视频的选题点结构（仅保留三类列表）。
			
 
				+
			
 
				+    - inspiration_points: 灵感点列表
			
 
				+    - goal_points: 目的点列表
			
 
				+    - key_points: 关键点列表
			
 
				+    """
			
 
				+
			
 
				+    inspiration_points: List[str]
			
 
				+    goal_points: List[str]
			
 
				+    key_points: List[str]
			
 
				+
			
 
				+    def to_dict(self) -> JsonDict:
			
 
				+        return {
			
 
				+            "inspiration_points": self.inspiration_points,
			
 
				+            "goal_points": self.goal_points,
			
 
				+            "key_points": self.key_points,
			
 
				+        }
			
 
				+
			
 
				+
			
 
				+def _empty_videos() -> List[JsonDict]:
			
 
				+    # 约定：返回“视频列表”，但当前无接口先返回空。
			
 
				+    return []
			
 
				+
			
 
				+
			
 
				+@tool(description="根据特征匹配高赞视频，并返回每个视频的灵感点/目的点/关键点列表（当前占位返回空）")
			
 
				+async def get_video_topic(
			
 
				+    features: Optional[List[str]] = None,
			
 
				+    limit: int = 20,
			
 
				+) -> ToolResult:
			
 
				+    """
			
 
				+    Args:
			
 
				+        features: 特征/关键词列表（可空）
			
 
				+        limit: 期望返回的最大视频数（当前占位实现不使用）
			
 
				+
			
 
				+    Returns:
			
 
				+        ToolResult:
			
 
				+          - metadata.videos: List[{
			
 
				+              "inspiration_points": [...],
			
 
				+              "goal_points": [...],
			
 
				+              "key_points": [...]
			
 
				+            }]
			
 
				+    """
			
 
				+
			
 
				+    _ = features
			
 
				+    _ = limit
			
 
				+
			
 
				+    videos = _empty_videos()
			
 
				+    return ToolResult(
			
 
				+        title="选题解构（占位）",
			
 
				+        output=f"当前无可用接口，临时返回空视频列表（videos=0）。",
			
 
				+        metadata={"videos": videos, "features": features or [], "limit": limit},
			
 
				+        long_term_memory="Get video topic decomposition (placeholder, empty result).",
			
 
				+    )