demand_analysis.md 4.6 KB


name: demand_analysis

description: 需求分析

需求分析方法论

实际输入通常是一串逗号分隔的特征词(例如:"养老,防骗,口播,三段式"

执行步骤

步骤1.先做两阶段特征分层(不要产生新词,仅针对输入特征词做归类

步骤1.1 第一阶段:先区分实质特征和形式特征

  • 实质特征:描述具体实质的特征词
  • 形式特征:描述表现形式的特征词 输出两组:
  • 实质特征: [...]
  • 形式特征: [...]

步骤1.2 第二阶段:仅对步骤1.1得到的实质特征继续细分为

  • 上层特征:宽泛的,不能用于搜索的实质特征
  • 下层特征:具体的,可直接搜索的实质特征,如:退休金被骗套路、高血压晨起注意事项 输出两组:
  • 上层特征: [...]
  • 下层特征: [...]

注意:

  • 上层特征和下层特征都取自“实质特征”列表,属于第二阶段细分结果
  • 上层特征 ∪ 下层特征 = 实质特征
  • 形式特征 不参与“上层/下层”细分

重要:形式特征不参与“上层/下层”分层,它们只进入后续的判别规则(如表达结构、节奏、可分享程度)。

步骤2. 根据步骤1的归类选择策略

根据上述分层结果决定要执行哪些起点策略:

  • 下层特征 非空:必须执行 A. 高赞视频选题点提取(用 get_video_topic 拉“灵感点/目的点/关键点”)
  • 上层特征 非空:执行 B. 特征出发(构建主题树 → 下钻出可执行词)
  • 两者都非空:A + B 都执行,最后合并去重
  • 只有形式词/实质词为空:承认信息不足,只能先按用户原话/补充提问(或用最少假设)生成候选搜索词包;不要编造“高赞case选题点”

A. 高赞视频选题点提取

适用:下层特征 非空必须执行此步骤。
要求:必须基于get_video_topic的metadata.videos内的所有视频的选题点进行,不允许自行联想填充字段。 执行步骤: 步骤1. 输入:使用 下层特征拼成 features(逗号分隔字符串)调用 get_video_topic 步骤2. 将工具返回 metadata.videos 内的选题点进行筛选并填充进输出:

  • 步骤2.1 筛选 对每条内容的灵感点和features进行相关性判别,选出最贴合特征词的3条内容作为最佳选题筛选结果
  • 步骤2.2 选题点提取
    • 先根据步骤2.1的最佳选题筛选结果填充 起点策略.高赞case_灵感点起点策略.高赞case_目的点起点策略.高赞case_关键点 这些字段内容,注意直接使用原词填充。
    • 用步骤2.1的所有最佳选题筛选结果里面的灵感点填充起点策略.高赞case出发搜索词字段,由灵感点扩展出的即时搜索词(允许 3-5 个同义/上下位词)
    • 用步骤2.1的所有最佳选题筛选结果里面的目的点补充筛选方案.目的点对齐规则字段
    • 用步骤2.1的所有最佳选题筛选结果里面的关键点补充筛选方案.关键点打分说明字段

B. 特征出发(仅用于上层特征)

适用:上层特征 非空必须执行此步骤。 动作:

  1. 输入:使用 上层特征 作为主题根
  2. 以上层特征构建主题树(主题 -> 子主题 -> 关键词)
  3. 将树上的子主题/关键词下钻成可执行搜索词(落到能直接丢给 douyin_search 的词)
  4. 结合库内优质作者特征做扩展(可选:find_authors_from_dbdouyin_user_videos
  5. 合并得到 特征出发待寻找账号列表,进入搜索阶段

两条起点可并行,不互斥;最后合并去重。

四、限制

输出必须基于get_video_topic返回的选题信息生成,严谨模型自己联想生成


六、输出模板

{
  "特征归类": {
    "实质特征": [],
    "形式特征": [],
    "下层特征": [],
    "上层特征": []
  },
  "起点策略": {
    "高赞case出发搜索词": [],
    "特征出发待寻找账号列表": [],
    "是否调用高赞case工具": true,
    "高赞case_灵感点": [],
    "高赞case_目的点": [],
    "高赞case_关键点": []
  },
  "筛选方案": {
    "形式规则": [],
    "目的点对齐规则": [],
    "关键点打分说明": [],
    "淘汰规则": []
  }
}

七、质量自检

  • 是否先完成了实质/形式上层/下层双重标注
  • 下层特征是否调用了 get_video_topic选题工具做补全
  • 是否同时考虑了case出发特征出发