1 месяц назад · 0421781f59
--- a/agent/tools/builtin/context.py
+++ b/agent/tools/builtin/context.py
@@ -9,6 +9,7 @@
 
															 框架也会在特定轮次自动调用此工具进行周期性上下文刷新。
														
 
															 """
														
 
															+import os
														
 
															 from agent.tools import tool, ToolResult, ToolContext
														
@@ -52,14 +53,13 @@ async def get_current_context(
 
															             context_content = "暂无计划信息"
														
 
															     # 注入 trace_id 和 trace_dir，供需要写入 trace 目录的工具（如输出 JSON）使用
														
 
															-    trace_dir = ""
														
 
															-    if runner.trace_store and hasattr(runner.trace_store, "base_path"):
														
 
															-        trace_dir = str(runner.trace_store.base_path)
														
 
															+    output_dir = os.getenv("OUTPUT_DIR", ".cache/output")
														
 
															+
														
 
															     extra = [
														
 
															         f"## 当前执行信息",
														
 
															         f"- **trace_id**: `{trace_id or '(未知)'}`",
														
 
															-        f"- **trace_dir**: `{trace_dir or '(未知)'}`",
														
 
															-        f"- **输出路径示例**: `{trace_dir}/{trace_id}/output.json`（若需写入当次 trace 目录）",
														
 
															+        f"- **output_dir**: `{output_dir or '(未知)'}`",
														
 
															+        f"- **输出路径示例**: `{output_dir}/{trace_id}/output.json`（若需写入 output_dir 目录）",
														
 
															     ]
														
 
															     context_content = (context_content or "") + "\n\n" + "\n".join(extra)
														
--- a/api_server.py
+++ b/api_server.py
@@ -56,8 +56,8 @@ app.add_middleware(
 
															 # ===== 初始化存储 =====
														
 
															-# 使用文件系统存储（支持跨进程和持久化）
														
 
															-trace_store = FileSystemTraceStore(base_path=".trace")
														
 
															+# 使用文件系统存储（支持跨进程和持久化）；与示例中 TRACE_DIR 对齐时设环境变量 TRACE_DIR
														
 
															+trace_store = FileSystemTraceStore(base_path=os.getenv("TRACE_DIR", ".trace"))
														
 
															 # 注入到 step_tree 模块
														
 
															 set_api_trace_store(trace_store)
														
--- a/examples/content_finder/.env.example
+++ b/examples/content_finder/.env.example
@@ -26,3 +26,13 @@ SCHEDULE_QUERY_API_TIMEOUT=10.0
 
															 # 并发控制
														
 
															 MAX_CONCURRENT_TASKS=3
														
 
															+
														
 
															+# AIGC 平台配置
														
 
															+AIGC_DEMAND_DOUYIN_CONTENT_PRODUCE_PLAN_ID=your-produce-plan-id
														
 
															+
														
 
															+# MySQL（store_results_mysql、定时任务、AIGC 写库等）
														
 
															+DB_HOST=your-mysql-host
														
 
															+DB_PORT=3306
														
 
															+DB_USER=your_user
														
 
															+DB_PASSWORD=your-password
														
 
															+DB_NAME=your_database
														
--- a/examples/content_finder/README.md
+++ b/examples/content_finder/README.md
@@ -89,6 +89,12 @@ python examples/content_finder/server.py
 
															 | `SCHEDULE_QUERY_API` | 空 | 定时任务外部 API 地址（留空则不启动定时任务） |
														
 
															 | `SCHEDULE_QUERY_API_KEY` | 空 | 定时任务外部 API 认证 Key |
														
 
															 | `SCHEDULE_QUERY_API_TIMEOUT` | `10.0` | 定时任务外部 API 超时（秒） |
														
 
															+| `AIGC_DEMAND_DOUYIN_CONTENT_PRODUCE_PLAN_ID` | `` | 需要将内容绑定的AIGC平台生成计划id |
														
 
															+| `DB_HOST` | 必填（写库/定时任务时） | MySQL 主机 |
														
 
															+| `DB_PORT` | `3306` | MySQL 端口 |
														
 
															+| `DB_USER` | 必填 | MySQL 用户名 |
														
 
															+| `DB_PASSWORD` | 必填 | MySQL 密码 |
														
 
															+| `DB_NAME` | 必填 | 数据库名 |
														
 
															 ## 服务模式 API
														
--- a/examples/content_finder/content_finder.prompt
+++ b/examples/content_finder/content_finder.prompt
@@ -21,8 +21,8 @@ $system$
 
															 ## 核心数据使用策略
														
 
															 ### 工具调用结果数据优先提取原则
														
 
															-- **搜索结果**：从 `metadata.search_results` 获取数据，不要解析 output 文本
														
 
															-- **账号作品**：从 `metadata.user_videos` 获取数据（格式与 search_results 一致）
														
 
															+- **搜索结果**：调用 douyin_search 后，从 metadata.search_results 获取，不要解析 工具的output
														
 
															+- **账号作品**：调用 douyin_user_videos 后，从 metadata.user_videos 获取数据
														
 
															 - **画像判断**：使用 `metadata.has_portrait` 字段（True=有画像，False=无画像）
														
 
															 - **画像数据**：从 `metadata.portrait_data` 获取结构化数据
														
@@ -59,22 +59,26 @@ $system$
 
															 - **工具调用限制**：每次最多并行调用 3 个画像工具
														
 
															 - **画像获取完成标准**：获取画像后立即进入筛选阶段，不要继续搜索新内容
														
 
															+## 数据真实性要求（严格遵守）
														
 
															+**禁止编造数据**：这是最严重的错误，会导致 404 错误和用户体验问题。
														
 
															+
														
 
															 ### 最终结果存储至远程数据库（必须执行）
														
 
															 - 使用 store_results_mysql tool工具进行存储
														
 
															-## 数据真实性要求（严格遵守）
														
 
															-**禁止编造数据**：这是最严重的错误，会导致 404 错误和用户体验问题。
														
 
															+## 最终输出要求
														
 
															+最终输出必须严格遵循 Skills 中「输出结果指南」要求的目录和结构。
														
 
															-## 输出格式要求
														
 
															-最终输出必须严格遵循 Skills 中「输出 JSON Schema」定义的结构与字段名。
														
 
															+## 接入AIGC平台
														
 
															+Skills 中的「AIGC 爬取计划生成」用于将寻找的结果接入AIGC平台。
														
 
															 ## 任务完成要求
														
 
															 - 搜索 M × 2 条内容后，立即停止搜索
														
 
															 - 对所有搜索到的内容获取画像后，立即进入筛选阶段
														
 
															 - 筛选完成后，立即输出完整的推荐结果
														
 
															 - 最终输出必须严格遵循 Skills 中「输出 JSON Schema」,所有的key都必须严格按照schema的约定
														
 
															-- 输出已写入到 %trace_dir% 目录下当次执行的trace_id目录内的output.json文件。
														
 
															+- 输出已写入到 %output_dir% 目录下当次执行的trace_id目录内的output.json文件。
														
 
															 - 输出已经存储到远程数据库中。
														
 
															+- 输出结果已经接入AIGC平台。
														
 
															 - 输出完整的推荐结果后，任务会自动进行反思和知识保存
														
 
															 - 反思完成后，输出简短的完成确认：✅ 任务完成！已为您找到 [数量] 条视频，并保存了执行经验
														
@@ -84,9 +88,9 @@ $system$
 
															 - 不要陷入”一直获取画像”的循环
														
 
															 - 获取足够画像后，立即进入筛选和输出阶段
														
 
															 - 必须输出最终推荐结果，不能在中途停止
														
 
															-- 所有数据必须来自 metadata，禁止编造
														
 
															+- 所有数据必须来自 TOOLS 返回的 metadata，禁止编造
														
 
															 - 最终输出必须严格遵循 Skills 中「输出 JSON Schema」，禁止自创/变体字段名或使用中文 key
														
 
															-- 输出文件的保存地址严格按照要求，在 %trace_dir% 目录下当次执行的trace_id目录内的output.json文件，不能随意放置。
														
 
															+- 输出文件的保存地址严格按照要求，在 %output_dir% 目录下当次执行的trace_id目录内的output.json文件，不能随意放置。
														
 
															 $user$
														
 
															 任务：找10个与「%query%」相关的、老年人感兴趣的视频。
														
--- a/examples/content_finder/core.py
+++ b/examples/content_finder/core.py
@@ -33,13 +33,16 @@ from tools import (
 
															     douyin_user_videos,
														
 
															     get_content_fans_portrait,
														
 
															     get_account_fans_portrait,
														
 
															+    create_crawler_plan_by_douyin_content_id,
														
 
															+    create_crawler_plan_by_douyin_account_id,
														
 
															+    store_results_mysql,
														
 
															 )
														
 
															 logger = logging.getLogger(__name__)
														
 
															 # 默认搜索词
														
 
															-DEFAULT_QUERY = "养生知识"
														
 
															-DEFAULT_DEMAND_ID = 1
														
 
															+DEFAULT_QUERY = "毛泽东1965年深秋预言"
														
 
															+DEFAULT_DEMAND_ID = 2629
														
 
															 async def run_agent(
														
@@ -70,11 +73,11 @@ async def run_agent(
 
															     prompt = SimplePrompt(prompt_path)
														
 
															     # output 目录
														
 
															-    trace_dir = os.getenv("TRACE_DIR", ".cache/traces")
														
 
															+    output_dir = os.getenv("OUTPUT_DIR", ".cache/output")
														
 
															-    # 构建消息（替换 %query%、%trace_dir%、%demand_id%）
														
 
															+    # 构建消息（替换 %query%、%output_dir%、%demand_id%）
														
 
															     demand_id_str = str(demand_id) if demand_id is not None else ""
														
 
															-    messages = prompt.build_messages(query=query, trace_dir=trace_dir, demand_id=demand_id_str)
														
 
															+    messages = prompt.build_messages(query=query, output_dir=output_dir, demand_id=demand_id_str)
														
 
															     # 初始化配置
														
 
															     api_key = os.getenv("OPEN_ROUTER_API_KEY")
														
@@ -86,7 +89,7 @@ async def run_agent(
 
															     temperature = float(prompt.config.get("temperature", 0.3))
														
 
															     max_iterations = int(os.getenv("MAX_ITERATIONS", "30"))
														
 
															     trace_dir = os.getenv("TRACE_DIR", ".cache/traces")
														
 
															-    output_dir = os.getenv("OUTPUT_DIR", ".cache/output")
														
 
															+    
														
 
															     skills_dir = str(Path(__file__).parent / "skills")
														
 
															     Path(trace_dir).mkdir(parents=True, exist_ok=True)
														
@@ -99,6 +102,8 @@ async def run_agent(
 
															         "get_content_fans_portrait",
														
 
															         "get_account_fans_portrait",
														
 
															         "store_results_mysql",
														
 
															+        "create_crawler_plan_by_douyin_content_id",
														
 
															+        "create_crawler_plan_by_douyin_account_id",
														
 
															     ]
														
 
															     runner = AgentRunner(
														
--- a/examples/content_finder/db/__init__.py
+++ b/examples/content_finder/db/__init__.py
@@ -13,7 +13,7 @@ from .schedule import (
 
															     update_task_status,
														
 
															     update_task_on_complete,
														
 
															 )
														
 
															-from .store_results import upsert_good_authors, insert_contents
														
 
															+from .store_results import upsert_good_authors, insert_contents, update_content_plan_ids
														
 
															 __all__ = [
														
 
															     "get_connection",
														
@@ -23,4 +23,5 @@ __all__ = [
 
															     "update_task_on_complete",
														
 
															     "upsert_good_authors",
														
 
															     "insert_contents",
														
 
															+    "update_content_plan_ids",
														
 
															 ]
														
--- a/examples/content_finder/db/connection.py
+++ b/examples/content_finder/db/connection.py
@@ -6,12 +6,19 @@ import pymysql
 
															 def get_connection():
														
 
															-    """获取数据库连接（与 store_results_mysql、schedule 共用配置）"""
														
 
															-    host = os.getenv("DB_HOST", "rm-t4nh1xx6o2a6vj8qu3o.mysql.singapore.rds.aliyuncs.com")
														
 
															+    """获取数据库连接（与 store_results_mysql、schedule 共用配置）
														
 
															+
														
 
															+    请在 examples/content_finder/.env 中配置 DB_HOST / DB_PORT / DB_USER / DB_PASSWORD / DB_NAME。
														
 
															+    """
														
 
															+    host = os.getenv("DB_HOST", "").strip()
														
 
															     port = int(os.getenv("DB_PORT", "3306"))
														
 
															-    user = os.getenv("DB_USER", "content_rw")
														
 
															-    password = os.getenv("DB_PASSWORD", "bC1aH4bA1lB0")
														
 
															-    database = os.getenv("DB_NAME", "content-deconstruction-supply")
														
 
															+    user = os.getenv("DB_USER", "").strip()
														
 
															+    password = os.getenv("DB_PASSWORD", "")
														
 
															+    database = os.getenv("DB_NAME", "").strip()
														
 
															+    if not all([host, user, database]):
														
 
															+        raise ValueError(
														
 
															+            "数据库未配置：请在 examples/content_finder/.env 中设置 DB_HOST、DB_USER、DB_PASSWORD、DB_NAME"
														
 
															+        )
														
 
															     return pymysql.connect(
														
 
															         host=host,
														
--- a/examples/content_finder/db/store_results.py
+++ b/examples/content_finder/db/store_results.py
@@ -3,6 +3,8 @@
 
															 """
														
 
															 from typing import Any, Dict, List, Optional
														
 
															+from .connection import get_connection
														
 
															+
														
 
															 def upsert_good_authors(
														
 
															     conn,
														
@@ -75,12 +77,12 @@ def insert_contents(
 
															     sql = """
														
 
															     INSERT INTO demand_find_content_result (
														
 
															-      trace_id, query, rank_no, video_url, title, author_name, author_link,
														
 
															+      trace_id, query, rank_no, aweme_id, video_url, title, author_name, author_link,
														
 
															       digg_count, comment_count, share_count,
														
 
															       portrait_source, elderly_ratio, elderly_tgi, recommendation_reason,
														
 
															       demand_content_id
														
 
															     ) VALUES (
														
 
															-      %s, %s, %s, %s, %s, %s, %s,
														
 
															+      %s, %s, %s, %s, %s, %s, %s, %s,
														
 
															       %s, %s, %s,
														
 
															       %s, %s, %s, %s,
														
 
															       %s
														
@@ -96,6 +98,7 @@ def insert_contents(
 
															                     trace_id,
														
 
															                     query,
														
 
															                     int(item.get("rank") or item.get("rank_no") or 0),
														
 
															+                    item.get("aweme_id") or "",
														
 
															                     video_url,
														
 
															                     item.get("title") or "",
														
 
															                     item.get("author_nickname") or "",
														
@@ -112,3 +115,51 @@ def insert_contents(
 
															             )
														
 
															             rows += cur.rowcount
														
 
															         return rows
														
 
															+
														
 
															+
														
 
															+def update_content_plan_ids(
														
 
															+    trace_id: str,
														
 
															+    aweme_ids: List[str],
														
 
															+    crawler_plan_id: str = "",
														
 
															+    produce_plan_id: str = "",
														
 
															+) -> int:
														
 
															+    """
														
 
															+    更新 demand_find_content_result 中指定内容的计划字段。
														
 
															+
														
 
															+    约定：
														
 
															+    - 通过 (trace_id, aweme_id) 定位内容行
														
 
															+    - crawler_plan_id / produce_plan_id 可只传其一：仅更新非空字段
														
 
															+    - 至少一个计划 id 非空时才执行 UPDATE
														
 
															+    - 内部自行获取并关闭数据库连接
														
 
															+    """
														
 
															+    if not aweme_ids or not isinstance(aweme_ids, list):
														
 
															+        return 0
														
 
															+    c = (crawler_plan_id or "").strip()
														
 
															+    p = (produce_plan_id or "").strip()
														
 
															+    if not c and not p:
														
 
															+        return 0
														
 
															+
														
 
															+    set_parts: List[str] = []
														
 
															+    params: List[Any] = []
														
 
															+    if c:
														
 
															+        set_parts.append("crawler_plan_id = %s")
														
 
															+        params.append(c)
														
 
															+    if p:
														
 
															+        set_parts.append("produce_plan_id = %s")
														
 
															+        params.append(p)
														
 
															+
														
 
															+    sql = f"""
														
 
															+    UPDATE demand_find_content_result
														
 
															+    SET {", ".join(set_parts)}
														
 
															+    WHERE trace_id = %s AND aweme_id = %s
														
 
															+    """
														
 
															+    conn = get_connection()
														
 
															+    try:
														
 
															+        rows = 0
														
 
															+        with conn.cursor() as cur:
														
 
															+            for aweme_id in aweme_ids:
														
 
															+                cur.execute(sql, (*params, trace_id, aweme_id))
														
 
															+                rows += cur.rowcount
														
 
															+        return rows
														
 
															+    finally:
														
 
															+        conn.close()
														
--- a/examples/content_finder/skills/aigc_platform_plan.md
+++ b/examples/content_finder/skills/aigc_platform_plan.md
@@ -0,0 +1,16 @@
 
															+---
														
 
															+name: aigc_platform_plan
														
 
															+description: AIGC 爬取计划生成
														
 
															+---
														
 
															+
														
 
															+## AIGC 爬取计划生成
														
 
															+
														
 
															+对内容寻找任务产出的视频结果和作者结果进行进一步处理：提取所有视频，调用工具生成爬取计划。
														
 
															+
														
 
															+## 适用场景
														
 
															+- 内容寻找任务执行完成，`output.json` 已生成
														
 
															+- 需要把筛选出的抖音视频批量接入到自有抓取 / 发布平台
														
 
															+
														
 
															+## 行为约定
														
 
															+1. 从内容寻找输出中查看**视频列表**。
														
 
															+2. 如果有视频结果，先调用`get_current_context` 获取 `trace_id`，再调用 `create_crawler_plan_by_douyin_content_id` 创建爬取计划。
														
--- a/examples/content_finder/skills/output_schema.md
+++ b/examples/content_finder/skills/output_schema.md
@@ -1,8 +1,15 @@
 
															-# 输出目录
														
 
															-输出 JSON 写入到当次执行的 trace_id 目录内的 `output.json` 文件。
														
 
															-**获取路径方式**：先调用 `get_current_context` 获取 `trace_id` 和 `trace_dir`，再使用 `write_file` 写入 `{trace_dir}/{trace_id}/output.json`。
														
 
															+---
														
 
															+name: output_schema
														
 
															+description: 输出结果指南
														
 
															+---
														
 
															-# **输出 JSON Schema**
														
 
															+## 输出结果指南
														
 
															+
														
 
															+### 输出目录
														
 
															+输出 JSON 写入到output_dir目录下当次执行的 trace_id 目录内的 `output.json` 文件。
														
 
															+**获取路径方式**：先调用 `get_current_context` 获取 `trace_id` 和 `output_dir`，再使用 `write_file` 写入 `{output_dir}/{trace_id}/output.json`。
														
 
															+
														
 
															+### **输出 JSON Schema**
														
 
															 ```json
														
 
															 {
														
 
															   "trace_id": "<由系统生成的真实 trace_id；如果你不知道就填空字符串，程序会覆盖修正>",
														
@@ -44,18 +51,17 @@
 
															         "source": "content_like | account_fans | none",
														
 
															         "age_50_plus_ratio": null,
														
 
															         "age_50_plus_tgi": null,
														
 
															-        "url": null
														
 
															+        "url": "画像链接"
														
 
															       },
														
 
															       "reason": "<入选理由>"
														
 
															     }
														
 
															   ]
														
 
															 }
														
 
															 ```
														
 
															-
														
 
															-画像链接规则：
														
 
															-- `portrait.source="content_like"` → `portrait.url = https://douhot.douyin.com/video/detail?active_tab=video_fans&video_id={aweme_id}`
														
 
															-- `portrait.source="account_fans"` → `portrait.url = https://douhot.douyin.com/creator/detail?active_tab=creator_fans_portrait&creator_id={author_sec_uid}`
														
 
															-- `portrait.source="none"` → `portrait.url=null`，并且画像字段都为 null
														
 
															+portrait_data内部字段规则说明：
														
 
															+- `portrait_data.source="content_like"` → `portrait.url = https://douhot.douyin.com/video/detail?active_tab=video_fans&video_id={aweme_id}`
														
 
															+- `portrait_data.source="account_fans"` → `portrait.url = https://douhot.douyin.com/creator/detail?active_tab=creator_fans_portrait&creator_id={author_sec_uid}`
														
 
															+- `portrait_data.source="none"` → `portrait_data.url=null`，并且画像字段都为 null
														
 
															 ## JSON 编写规范
														
 
															 - 字符串值中若有双引号 `"`，必须写成 `\"`（反斜杠 + 双引号）
														
--- a/examples/content_finder/tools/__init__.py
+++ b/examples/content_finder/tools/__init__.py
@@ -6,6 +6,7 @@ from .douyin_search import douyin_search
 
															 from .douyin_user_videos import douyin_user_videos
														
 
															 from .hotspot_profile import get_content_fans_portrait, get_account_fans_portrait
														
 
															 from .store_results_mysql import store_results_mysql
														
 
															+from .aigc_platform_api import create_crawler_plan_by_douyin_content_id, create_crawler_plan_by_douyin_account_id
														
 
															 __all__ = [
														
 
															     "douyin_search",
														
@@ -13,4 +14,6 @@ __all__ = [
 
															     "get_content_fans_portrait",
														
 
															     "get_account_fans_portrait",
														
 
															     "store_results_mysql",
														
 
															+    "create_crawler_plan_by_douyin_content_id",
														
 
															+    "create_crawler_plan_by_douyin_account_id",
														
 
															 ]
														
--- a/examples/content_finder/tools/aigc_platform_api.py
+++ b/examples/content_finder/tools/aigc_platform_api.py
@@ -4,12 +4,15 @@ AIGC接口调用
 
															 """
														
 
															 import json
														
 
															 import logging
														
 
															+import os
														
 
															 from datetime import datetime
														
 
															+from pathlib import Path
														
 
															 from typing import List, Dict, Union, Tuple, Any
														
 
															 import requests
														
 
															 from agent import ToolResult, tool
														
 
															+from db import update_content_plan_ids
														
 
															 logger = logging.getLogger(__name__)
														
@@ -21,6 +24,42 @@ DEFAULT_TOKEN = "8bf14f27fc3a486788f3383452422d72"
 
															 DEFAULT_TIMEOUT = 60.0
														
 
															+def _load_output_json(trace_id: str, output_dir: str) -> Dict[str, Any]:
														
 
															+    """Load {output_dir}/{trace_id}/output.json."""
														
 
															+    path = Path(output_dir) / trace_id / "output.json"
														
 
															+    if not path.exists():
														
 
															+        raise FileNotFoundError(f"output.json not found: {path}")
														
 
															+    with path.open("r", encoding="utf-8") as f:
														
 
															+        return json.load(f)
														
 
															+
														
 
															+
														
 
															+def _extract_content_ids(data: Dict[str, Any]) -> List[str]:
														
 
															+    """Extract aweme_id list from output json."""
														
 
															+    contents = data.get("contents") or []
														
 
															+    if not isinstance(contents, list):
														
 
															+        return []
														
 
															+    content_ids: List[str] = []
														
 
															+    for item in contents:
														
 
															+        if not isinstance(item, dict):
														
 
															+            continue
														
 
															+        aweme_id = item.get("aweme_id")
														
 
															+        if aweme_id is None:
														
 
															+            continue
														
 
															+        aweme_id_str = str(aweme_id).strip()
														
 
															+        if aweme_id_str:
														
 
															+            content_ids.append(aweme_id_str)
														
 
															+    return content_ids
														
 
															+
														
 
															+
														
 
															+def _get_produce_plan_ids_from_env() -> List[str]:
														
 
															+    """Read AIGC_DEMAND_DOUYIN_CONTENT_PRODUCE_PLAN_ID from env."""
														
 
															+    raw = os.getenv("AIGC_DEMAND_DOUYIN_CONTENT_PRODUCE_PLAN_ID", "").strip()
														
 
															+    if not raw:
														
 
															+        return []
														
 
															+    # 接口需要 List[str]，因此把 env 字段（字符串）包装成 list。
														
 
															+    return [raw]
														
 
															+
														
 
															+
														
 
															 @tool(description="根据抖音账号ID创建爬取计划")
														
 
															 async def create_crawler_plan_by_douyin_account_id(
														
 
															         account_id: str,
														
@@ -168,14 +207,12 @@ async def create_crawler_plan_by_douyin_account_id(
 
															 @tool(description="根据抖音视频ID创建爬取计划")
														
 
															 async def create_crawler_plan_by_douyin_content_id(
														
 
															-        content_ids: List[str],
														
 
															-        produce_plan_ids: List[str] = []
														
 
															+        trace_id: str,
														
 
															 ) -> ToolResult:
														
 
															     """
														
 
															     根据抖音视频ID创建爬取计划
														
 
															     Args:
														
 
															-        content_ids: 抖音内容ID列表
														
 
															-        produce_plan_ids: 爬取计划要绑定的生成计划ID，默认为空列表
														
 
															+        trace_id: 内容寻找任务 trace_id（用于读取 {output_dir}/{trace_id}/output.json）
														
 
															     Returns:
														
 
															              Returns:
														
 
															          ToolResult: 包含以下内容
														
@@ -193,20 +230,45 @@ async def create_crawler_plan_by_douyin_content_id(
 
															     Note:
														
 
															         - 建议从 metadata.result 获取结构化数据，而非解析 output 文本
														
 
															     """
														
 
															-    if not content_ids or not isinstance(content_ids, list):
														
 
															-        logger.error(f"create_crawler_plan_by_douyin_content_id invalid content_ids. content_ids: {content_ids}")
														
 
															+    if not trace_id or not isinstance(trace_id, str):
														
 
															+        logger.error(f"create_crawler_plan_by_douyin_content_id invalid trace_id: {trace_id}")
														
 
															         return ToolResult(
														
 
															-            title="根据抖音内容ID创建爬取计划失败",
														
 
															+            title="根据抖音内容创建爬取计划失败",
														
 
															+            output="",
														
 
															+            error="trace_id 参数无效: trace_id 必须是非空字符串",
														
 
															+        )
														
 
															+
														
 
															+    output_dir = os.getenv("OUTPUT_DIR", ".cache/output")
														
 
															+    try:
														
 
															+        data = _load_output_json(trace_id=trace_id, output_dir=output_dir)
														
 
															+        content_ids = _extract_content_ids(data)
														
 
															+    except Exception as e:
														
 
															+        msg = f"加载/解析 output.json 失败: {e}"
														
 
															+        logger.error(msg, exc_info=True)
														
 
															+        return ToolResult(
														
 
															+            title="根据抖音内容创建爬取计划失败",
														
 
															             output="",
														
 
															-            error="content_ids 参数无效: content_ids必须是列表"
														
 
															+            error=msg,
														
 
															+        )
														
 
															+
														
 
															+    if not content_ids:
														
 
															+        return ToolResult(
														
 
															+            title="根据抖音内容创建爬取计划失败",
														
 
															+            output="",
														
 
															+            error="未在 output.json.contents 中找到有效 aweme_id",
														
 
															         )
														
 
															     if len(content_ids) > 100:
														
 
															-        logger.error(f"create_crawler_plan_by_douyin_content_id invalid content_ids length. content_ids.length: {len(content_ids)}")
														
 
															+        logger.error(
														
 
															+            "create_crawler_plan_by_douyin_content_id invalid content_ids length. "
														
 
															+            f"content_ids.length: {len(content_ids)}"
														
 
															+        )
														
 
															         return ToolResult(
														
 
															-            title="根据抖音内容ID创建爬取计划失败",
														
 
															+            title="根据抖音内容创建爬取计划失败",
														
 
															             output="",
														
 
															-            error=f"content_ids 长度异常: 期望1~100, 实际{len(content_ids)}"
														
 
															+            error=f"content_ids 长度异常: 期望1~100, 实际{len(content_ids)}",
														
 
															         )
														
 
															+
														
 
															+    produce_plan_ids = _get_produce_plan_ids_from_env()
														
 
															     dt = datetime.now().strftime("%Y%m%d%h%M%s")
														
 
															     crawler_plan_name = f"【内容寻找Agent自动创建】抖音视频直接抓取-{dt}-抖音"
														
 
															     params = {
														
@@ -242,6 +304,10 @@ async def create_crawler_plan_by_douyin_content_id(
 
															         summary_lines.append(f"    抖音视频IDs: {','.join(content_ids)}")
														
 
															         summary_lines.append(f"    爬取计划ID: {crawler_plan_id}")
														
 
															         produce_plan_infos: List[Dict[str, str]] = []
														
 
															+        db_updated_rows = 0
														
 
															+        # 环境里的生成计划 ID（字符串）；与是否执行绑定接口无关，用于写库
														
 
															+        env_produce_plan_id = (produce_plan_ids[0] if produce_plan_ids else "").strip()
														
 
															+
														
 
															         if produce_plan_ids:
														
 
															             input_source_info = {
														
 
															                 "contentType": 1,
														
@@ -260,6 +326,18 @@ async def create_crawler_plan_by_douyin_content_id(
 
															                     summary_lines.append(f"            绑定结果: {'绑定成功' if not produce_plan_info.get('msg') else '绑定失败'}")
														
 
															                     summary_lines.append(f"            信息: {produce_plan_info.get('msg', '成功')}")
														
 
															+        # 爬取计划 id 与生成计划 id 任一存在则写库（不依赖是否已配置 produce_plan_ids 去走绑定）
														
 
															+        if (crawler_plan_id or "").strip() or env_produce_plan_id:
														
 
															+            try:
														
 
															+                db_updated_rows = update_content_plan_ids(
														
 
															+                    trace_id=trace_id,
														
 
															+                    aweme_ids=content_ids,
														
 
															+                    crawler_plan_id=crawler_plan_id or "",
														
 
															+                    produce_plan_id=env_produce_plan_id,
														
 
															+                )
														
 
															+            except Exception as e:
														
 
															+                logger.error(f"update content plan ids failed: {e}", exc_info=True)
														
 
															+
														
 
															         return ToolResult(
														
 
															             title="根据抖音内容ID创建爬取计划",
														
 
															             output="\n".join(summary_lines),
														
@@ -278,7 +356,8 @@ async def create_crawler_plan_by_douyin_content_id(
 
															                         }
														
 
															                         for produce_plan_info in produce_plan_infos
														
 
															                     ]
														
 
															-                }
														
 
															+                },
														
 
															+                "db": {"updated_rows": db_updated_rows},
														
 
															             },
														
 
															             long_term_memory="Create crawler plan by DouYin Content IDs",
														
 
															         )
														
--- a/examples/content_finder/tools/store_results_mysql.py
+++ b/examples/content_finder/tools/store_results_mysql.py
@@ -21,12 +21,12 @@ logger = logging.getLogger(__name__)
 
															 def _load_output(trace_id: str) -> Dict[str, Any]:
														
 
															-    """从 {TRACE_DIR}/{trace_id}/output.json 读取输出数据。"""
														
 
															-    trace_root = Path(os.getenv("TRACE_DIR", ".cache/traces"))
														
 
															-    path = trace_root / trace_id / "output.json"
														
 
															+    """从 {output_dir}/{trace_id}/output.json 读取输出数据。"""
														
 
															+    output_dir = Path(os.getenv("OUTPUT_DIR", ".cache/output"))
														
 
															+    path = output_dir / trace_id / "output.json"
														
 
															     if not path.exists():
														
 
															-        raise FileNotFoundError(f"output.json not found for trace_id={trace_id}: {path}")
														
 
															+        raise FileNotFoundError(f"output.json not found for output_dir={output_dir}: {path}")
														
 
															     with path.open("r", encoding="utf-8") as f:
														
 
															         return json.load(f)