|
|
@@ -9,6 +9,57 @@ description: 内容筛选方法论
|
|
|
|
|
|
---
|
|
|
|
|
|
+## 阶段零:需求理解结果驱动的需求对齐打分(先于画像)
|
|
|
+
|
|
|
+在进入“阶段一:基础质量筛选”前,使用 `demand_analysis` 的输出做一次需求对齐打分,目的在于:
|
|
|
+- 先把“明显不满足目的点/灵感点”的内容尽早淘汰,减少无效画像调用
|
|
|
+- 在每条内容的 `reason` 中给出“需求对齐的依据”(来自标题/描述可读信息 + goodcase 选题点)
|
|
|
+
|
|
|
+### 需要使用的 demand_analysis 信息
|
|
|
+
|
|
|
+- `entry_strategy.goodcase_goal_points`:用于判定“是否完成了需求的目的/解决了什么问题”
|
|
|
+- `entry_strategy.goodcase_inspiration_points`:用于判定“是否覆盖了可搜索的灵感点/核心表达方向”
|
|
|
+- `entry_strategy.goodcase_key_points`:用于判定“是否包含关键锚点要素(至少满足多数)”
|
|
|
+- `filter_plan.form_rules`:用于判定“形式表达是否与目标一致(结构/语气/可分享表达)”
|
|
|
+
|
|
|
+> 若 `demand_analysis` 输出为空,或无法从标题/描述落到上述要素,请承认不确定性,不要编造匹配结论。
|
|
|
+
|
|
|
+### 可用信息范围
|
|
|
+
|
|
|
+在未获取画像前,仅允许用以下字段做需求对齐判断:
|
|
|
+- `title`(若有)
|
|
|
+- `desc`(来自 `douyin_search` 的搜索结果)
|
|
|
+- 或候选对象里可见的简介/摘要文本(若检索来源不同,请只用已有字段)
|
|
|
+
|
|
|
+### 需求对齐判定规则(可直接执行)
|
|
|
+
|
|
|
+对每条候选内容,按以下规则给出结论(不需要输出数值):
|
|
|
+
|
|
|
+1. 目的点对齐(Goal Alignment,必须项)
|
|
|
+ - 命中:标题/描述里能看出“在做什么、解决什么、给了什么收益/动作”
|
|
|
+ - 不命中:直接淘汰
|
|
|
+2. 灵感点对齐(Inspiration Alignment,必须项)
|
|
|
+ - 命中:标题/描述里体现了 goodcase 的“可搜索灵感点”核心表达方向(允许同义/上下位)
|
|
|
+ - 不命中:直接淘汰
|
|
|
+3. 关键点命中(Key Point Anchors,加分项)
|
|
|
+ - 命中:进入后续阶段时给更高排序倾向
|
|
|
+ - 部分/缺失:也可进入,但排序会更低(在 `reason` 说明缺少哪些关键锚点要素或不确定点)
|
|
|
+4. 形式规则一致(Form-Rule Fit,低权重加分/可选)
|
|
|
+ - 命中:加分或作为排序 tie-breaker
|
|
|
+ - 不命中:不直接淘汰,但在 `reason` 中标注“不匹配/不确定”
|
|
|
+
|
|
|
+### 需求对齐淘汰/保留阈值
|
|
|
+
|
|
|
+- 若目的点对齐“不命中”,直接淘汰
|
|
|
+- 若灵感点对齐“不命中”,直接淘汰
|
|
|
+- 若关键点“部分/缺失”,允许进入后续阶段,但排序更低(并在 `reason` 写清缺失/不确定点)
|
|
|
+- 若形式规则“不命中/不确定”,允许进入后续阶段,但作为低权重扣分或 tie-breaker
|
|
|
+
|
|
|
+### 在输出 reason 中必须包含的要素
|
|
|
+
|
|
|
+对于进入后续画像阶段的候选,在其 `reason` 中至少写明:
|
|
|
+至少包含四项:命中的 `目的点` 状态;命中的 `灵感点` 状态;`关键点`(命中/部分/缺失)与缺失说明或不确定点;形式规则是命中还是不确定(如无法从标题/描述判断)
|
|
|
+
|
|
|
## 阶段一:基础质量筛选
|
|
|
|
|
|
在获取画像前先快速过滤,减少不必要的 API 调用。
|
|
|
@@ -24,8 +75,6 @@ description: 内容筛选方法论
|
|
|
|
|
|
评估维度:digg_count(点赞)、comment_count(评论)、share_count(分享)
|
|
|
|
|
|
-**相关性评估**:内容描述(desc)是否与需求相关,明显不相关直接过滤。
|
|
|
-
|
|
|
---
|
|
|
|
|
|
## 阶段二:画像匹配筛选
|
|
|
@@ -57,30 +106,19 @@ description: 内容筛选方法论
|
|
|
|
|
|
---
|
|
|
|
|
|
-## 阶段三:优质账号扩展(可选)
|
|
|
-
|
|
|
-### 触发条件
|
|
|
-账号粉丝画像中:目标人群占比 > 60% **且** tgi > 120
|
|
|
-
|
|
|
-### 扩展策略
|
|
|
-1. 调用 `douyin_user_videos(account_id=author.sec_uid)`,获取 5-10 条近期作品
|
|
|
-2. **仅执行阶段一筛选**(热度、相关性),不递归获取画像
|
|
|
-3. 通过筛选的作品加入候选池,标注来源"优质账号扩展"
|
|
|
|
|
|
-### 必须在输出中说明
|
|
|
-- 发现优质账号:说明账号名、目标人群占比、tgi,以及扩展了哪些作品
|
|
|
-- 未发现:说明"未发现符合扩展条件的优质账号(需占比 > 60% 且 tgi > 120)"
|
|
|
|
|
|
---
|
|
|
|
|
|
-## 阶段四:去重与排序
|
|
|
+## 阶段三:去重与排序
|
|
|
|
|
|
**去重**:按 aweme_id 去重,保留第一次出现的版本。
|
|
|
|
|
|
**排序优先级**:
|
|
|
-1. 画像匹配度(目标人群占比 × tgi)
|
|
|
-2. 热度(点赞、评论、分享综合)
|
|
|
-3. 数据来源可靠性(content_like > account_fans > none)
|
|
|
+1. 需求对齐打分
|
|
|
+2. 画像匹配度(目标人群占比 × tgi)
|
|
|
+3. 热度(点赞、评论、分享综合)
|
|
|
+4. 数据来源可靠性(content_like > account_fans > none)
|
|
|
|
|
|
---
|
|
|
|