用途:让产品、技术和后续实现人员快速知道该看哪份文档,避免被旧路径和内部黑话带偏。
| 顺序 | 文档 | 主要回答什么 |
|---|---|---|
| 1 | prd/产品方案总表.md | Content Agent 要解决什么问题,主流程怎么走 |
| 2 | prd/V1落地版本.md | V1 先做哪些能力,哪些暂不做 |
| 3 | prd/V1落地版本细化版.md | V1 的字段、状态、运行记录和验收口径 |
| 4 | 抖音游走策略/runtime_v1_records_schema.md | V1 DB 写入字段准则和本地兼容导出文件怎么保存 |
| 5 | 规则包/抖音规则包V1.md | 抖音规则如何判断入池、待复看、待观察和淘汰 |
| 6 | 抖音游走策略/douyin_walk_strategy.v1.json | P6/P7 抖音 bounded walk 的当前运行时策略 |
| 7 | 规则包/douyin_rule_packs.v1.json | 规则包的机器可读配置 |
上游需求和来源证据
-> 生成搜索词
-> 抖音搜索或作者作品抓取
-> 形成发现内容和判断证据
-> 规则包输出判断结果
-> 游走策略决定下一步动作
-> 保存运行记录、来源路径和最终结果
-> 复盘哪些搜索词、作者和规则值得保留
V1 的生产事实层是云上 MySQL 的 content_agent_* 表;本地 JSON / JSONL 只作为兼容导出、调试和回放材料。mock 只模拟平台输入,不模拟存储层。
| 推荐叫法 | 说明 |
|---|---|
| 业务模块 | 一块相对独立的业务责任,不等于微服务 |
| 搜索词(query) | 真正拿去平台搜索的词 |
| 发现内容 | 被找回来、等待判断或已经判断过的视频/作品 |
| 判断证据包(EvidenceBundle) | 规则判断前汇总的视频、作者、画像、互动、风险和来源信息 |
| 规则判断结果(RuleDecision) | 规则包输出的入池、待复看、待观察、淘汰、扩展或停止结果 |
| 下一步动作(WalkAction) | 游走策略给出的继续翻页、看作者、看作者作品、扩散 tag 或停止 |
| 运行记录(run_context) | 一次运行每一步留下的输入、输出、状态和错误 |
| 来源路径 | 结果从哪个需求、seed、搜索词、视频、作者一路走过来 |
| 待观察(pending) | 暂不进入正式结果,但保留证据和记录,后续复盘 |
真实 JSON 字段、枚举值、文件名和 API 字段不随便改名。第一次看到核心字段时,文档会用括号补一句中文解释,例如:
| 字段或枚举 | 中文解释 |
|---|---|
platform_content_id |
平台内容 ID,抖音下等于抖音视频 ID |
platform_author_id |
抖音作者 ID |
run_id |
本次运行 ID |
policy_run_id |
本次策略执行 ID |
schema_version |
JSON 文件结构版本 |
record_schema_version |
JSONL 单行结构版本 |
source_evidence |
来源证据 |
search_query_effect_status |
搜索词效果状态 |
ADD_TO_CONTENT_POOL |
入池 |
KEEP_CONTENT_FOR_REVIEW |
待复看 |
REJECT_CONTENT |
淘汰 |
source_path_records.jsonl |
来源记录文件 |
rule_decisions.jsonl |
规则判断结果文件 |
旧版和上下游理解/ 是历史理解和旧系统对照资料。本轮只迁移目录,不重写正文。当前产品和技术实现优先看上面的活跃文档。