内容寻找方法论
核心方法:需求拆解 → 搜索执行 → 结果验证
第一步:拆解用户需求
在搜索前,先理解需求的结构:
主题维度:用户要找什么内容?提取核心关键词。
约束维度:有哪些限制条件?(热度要求、受众特征、时间范围等)
优先级:哪个维度是最重要的?用户明确说的 > 用户暗示的 > 你的默认假设。
第二步:制定搜索策略
关键词选择:
- 优先使用用户原话中的关键词
- 必要时补充同义词或相关词
- 不要替换用户的核心意图
参数设置:
- 根据约束条件设置搜索参数
- 不确定时使用宽松参数,宁可多搜再筛选
搜索数量控制:
- 如果用户要求找 M 条内容,只搜索 N = M × 2 条,不要超过
- 如果第一次搜索返回超过 N 条,只保留前 N 条处理
- 目的:控制 token 消耗,确保筛选后有足够余量
- 示例:用户要10条,只搜索20条候选
分页策略:
- 第一次搜索使用默认 cursor("0" 或 "")
- 如果结果不够,从返回数据中提取 cursor 值继续获取下一页
- 示例:
douyin_search(keyword="...", cursor="返回的cursor值")
迭代策略:
- 第一轮搜索结果不够好时,调整关键词或参数再搜
- 不要在一次失败后就放弃
优质账号扩展:
- 如果发现某个账号的粉丝画像非常符合目标人群(如目标人群占比 > 60% 且 tgi > 120)
- 可以获取该账号的其他作品作为补充:
douyin_user_videos(account_id=author.sec_uid)
- 建议限制数量(如5-10条),避免过度依赖单一账号
- 对扩展作品进行基础筛选(热度、相关性),不需要再次获取画像
分批处理策略:
- 不要一次性处理所有候选内容
- 先处理前 10 条,筛选后如果符合要求的内容 >= M,停止处理
- 如果不足,继续处理下一批 10 条
- 目的:避免一次性调用过多工具导致 token 超限
工具调用建议:
- 每次最多并行调用 3 个画像工具
- 避免一次性调用过多工具导致响应被截断
第三步:验证结果
拿到搜索结果后,对照需求逐一验证:
- 每个结果是否满足用户的核心要求?
- 约束条件是否达标?
- 有无更好的候选?
如果结果不满足要求:调整搜索策略,再次尝试,而不是凑合推荐。
如果工具返回错误:
服务级错误(HTTP 502/503/504):
- 这是服务暂时不可用,不是你的参数问题
- 不要重复尝试相同的调用(最多重试1次即可)
- 不要尝试换关键词(关键词不是问题)
- 直接告知用户"服务暂时不可用,请稍后再试"
- 不要切换到其他平台或工具
参数错误(HTTP 400/404):
- 检查参数格式是否正确
- 检查 ID 是否存在
- 调整参数后重试
网络错误(Timeout/Connection):
关键原则
忠实需求:用户要什么就找什么,不要基于自己的判断替换用户意图。
透明过程:说明为什么选择这些关键词,用了什么筛选逻辑。
承认局限:如果真的找不到符合要求的内容,如实说明,而不是推荐不符合要求的内容。