name: content_finding_strategy
需求分析步骤的输出,提取高赞case出发搜索词和特征出发搜索词。搜索词限制: 仅搜索第一步中输出的搜索词,严谨联想或者扩展其他词搜索。 数量控制:只搜索 N = M × 2 条,搜到后立即停止,不超出此限制。 数据读取规则:
metadata.search_results 获取,不要解析工具的 output 文本metadata.user_videos 获取find_authors_from_db 的 metadata.authors 获取(优先使用其中的 author_sec_uid)
分页策略:第一次使用默认 cursor("0" 或 ""),需要更多时使用返回的 cursor 继续获取,最多搜索2页。
兜底策略:douyin_search 失败或无结果时,使用 douyin_search_tikhub。find_authors_from_db(query):用 query 与历史表 content_tags 文字匹配,取匹配度最高的作者(默认最多 3 个,返回 author_sec_uid)douyin_user_videos(account_id=author_sec_uid) 拉作品,作为候选池补充
仍需遵守数量控制:作者扩展拿到的作品也计入候选数量,总量不要超过 N = M × 2。禁止编造数据,所有字段必须来自工具返回的 metadata。
author.sec_uid:约 80 字符,必须逐字符完整复制,不能截断或修改aweme_id、作者名、热度数据必须来自同一条记录,不能混用item = metadata.search_results[0]
aweme_id = item["aweme_id"] # 直接取,不修改
sec_uid = item["author"]["sec_uid"] # 完整复制,约 80 字符
❌ 编造 sec_uid
❌ 截断 sec_uid
❌ 从 output 文本中解析数据
❌ 混用不同记录的字段
违反后果:编造数据会导致 404 错误,严重影响用户体验。
| 错误类型 | 处理策略 |
|---|---|
| HTTP 502/503/504 | 服务暂时不可用,最多重试 1 次,失败则告知用户 |
| HTTP 400/404 | 检查参数格式,调整后重试 |
| Timeout | 重试 1 次,仍超时则告知用户 |
| 网络错误 | 重试 1-2 次,持续失败则告知用户 |
不要切换到其他平台或工具。