requirements.md 3.4 KB

任务1:从内容树节点归纳制作需求

  • 输入:内容树中某个节点的 id(category 或 element)
  • 过程:
    a. 调用搜索 API 获取该节点的局部结构:祖先路径(了解上下文)、同级节点(了解同类)、子孙节点(了解细分)
    b. 结合节点的名称、描述、所属维度(实质/形式/意图),判断哪些节点与图文内容制作直接相关(过滤掉与制 作无关的纯语义/主题类节点)
    c. 对筛选出的重要节点,进一步获取其关联的频繁项集(通过get_frequent_itemsets接口,每次传入一个category_ids;频繁项集中可以看到经常与指定节点在优质内容中共同出现的要素,比如能给“动作姿态”节点扩展到“夸张”“运动”等关联要素,从而能提出更准的需求) d. 对每一组节点,归纳出一个制作能力或工具需求(如"需要能够生成保持角色一致性的人物图像的能力")
  • 输出:若干条结构化的制作需求,每条包含:
    • 需求描述(自然语言)
    • 来源节点 id 列表(支撑这条需求的节点)
    • 相关频繁项集id(若有)
    • 所属维度(实质/形式/意图)
  • 约束:
    • 需求粒度不能太细(不是"生成猫咪"),也不能太粗(不是"生成图像")
    • 同一批输出的需求之间应尽量不重叠


任务2:从制作能力/工具关联内容树节点

  • 输入:一条制作能力或工具知识(包含名称、描述、适用场景)
  • 过程:
    a. 从知识的名称和适用场景中提取关键词,调用搜索 API 在内容树中检索相关节点 b. 对返回的节点按相关度评分,过滤掉低相关节点 c. 对保留的节点,标注关联类型: - 直接关联:该能力/工具直接用于制作包含此节点的内容 - 间接关联:该能力/工具是制作此类内容的前置步骤或辅助手段 d. 将 节点 id - 知识 id - 关联类型 - 置信度 写入映射表
  • 输出:一批映射记录,每条包含:
    • 节点 id + 节点名称
    • 知识 id
    • 关联类型(直接/间接)
    • 置信度(高/中/低)
  • 约束:
    • 低置信度的映射需标记,待后续实验验证后升级或删除
    • 同一个节点可以关联多条知识,需支持后续按置信度排序检索