README.md 3.6 KB

产品方案文档索引

用途:让产品、技术和后续实现人员快速知道该看哪份文档,避免被旧路径和内部黑话带偏。

1. 先读哪几份

顺序 文档 主要回答什么
1 prd/产品方案总表.md Content Agent 要解决什么问题,主流程怎么走
2 prd/V1落地版本.md V1 先做哪些能力,哪些暂不做
3 prd/V1落地版本细化版.md V1 的字段、状态、运行记录和验收口径
4 抖音游走策略/runtime_v1_records_schema.md V1 DB 写入字段准则和本地兼容导出文件怎么保存
5 规则包/抖音规则包V1.md 抖音规则如何判断入池、待复看、待观察和淘汰
6 抖音游走策略/douyin_walk_strategy.v1.json P6/P7 抖音 bounded walk 的当前运行时策略
7 规则包/douyin_rule_packs.v1.json 规则包的机器可读配置

2. 当前主流程

上游需求和来源证据
-> 生成搜索词
-> 抖音搜索或作者作品抓取
-> 形成发现内容和判断证据
-> 规则包输出判断结果
-> 游走策略决定下一步动作
-> 保存运行记录、来源路径和最终结果
-> 复盘哪些搜索词、作者和规则值得保留

3. 统一叫法

V1 的生产事实层是云上 MySQL 的 content_agent_* 表;本地 JSON / JSONL 只作为兼容导出、调试和回放材料。mock 只模拟平台输入,不模拟存储层。

推荐叫法 说明
业务模块 一块相对独立的业务责任,不等于微服务
搜索词(query) 真正拿去平台搜索的词
发现内容 被找回来、等待判断或已经判断过的视频/作品
判断证据包(EvidenceBundle) 规则判断前汇总的视频、作者、画像、互动、风险和来源信息
规则判断结果(RuleDecision) 规则包输出的入池、待复看、待观察、淘汰、扩展或停止结果
下一步动作(WalkAction) 游走策略给出的继续翻页、看作者、看作者作品、扩散 tag 或停止
运行记录(run_context) 一次运行每一步留下的输入、输出、状态和错误
来源路径 结果从哪个需求、seed、搜索词、视频、作者一路走过来
待观察(pending) 暂不进入正式结果,但保留证据和记录,后续复盘

4. 字段阅读规则

真实 JSON 字段、枚举值、文件名和 API 字段不随便改名。第一次看到核心字段时,文档会用括号补一句中文解释,例如:

字段或枚举 中文解释
platform_content_id 平台内容 ID,抖音下等于抖音视频 ID
platform_author_id 抖音作者 ID
run_id 本次运行 ID
policy_run_id 本次策略执行 ID
schema_version JSON 文件结构版本
record_schema_version JSONL 单行结构版本
source_evidence 来源证据
search_query_effect_status 搜索词效果状态
ADD_TO_CONTENT_POOL 入池
KEEP_CONTENT_FOR_REVIEW 待复看
REJECT_CONTENT 淘汰
source_path_records.jsonl 来源记录文件
rule_decisions.jsonl 规则判断结果文件

5. 归档资料

旧版和上下游理解/ 是历史理解和旧系统对照资料。本轮只迁移目录,不重写正文。当前产品和技术实现优先看上面的活跃文档。