xueyiming 4 дней назад
Родитель
Сommit
0a2d24c29f
1 измененных файлов с 182 добавлено и 127 удалено
  1. 182 127
      create/prompt/full_workflow.md

+ 182 - 127
create/prompt/full_workflow.md

@@ -9,22 +9,36 @@
 - 输入和输出格式已经明确定义,但**中间过程完全由你自主决定**
 - 充分利用工具系统来辅助分析和生成,提高创作质量和效率
 - 在保证输出格式正确的前提下,你可以采用任何你认为最有效的工作流程
+- **必须完成文件生成验证**:只有在成功生成并验证JSON文件后,任务才能结束。如果文件生成失败或验证不通过,必须修复问题并重新生成,直到所有验证通过。
 
 ## 输入数据 (Input Data)
 
-你的输入数据位于以下路径:
+你的输入数据位于以下路径,需要通过这3个来源生成账号人设信息
 
-- `create/data/{账号名称}/persona/实质.json` - 账号人设的实质特征
-- `create/data/{账号名称}/persona/形式.json` - 账号人设的形式特征
-- `create/data/{账号名称}/persona/意图.json` - 账号人设的意图特征
+### 1. 账号基础信息
+- `data/{账号名称}/persona/account_data.json` - 账号地址信息,包含账号的URL链接
+
+### 2. 历史数据解析
+- `data/{账号名称}/persona/analysis/` - 历史数据解析目录,包含多个JSON文件,每个文件是对单个帖子的详细分析
+  - 每个文件包含帖子的灵感点、实质特征、形式特征等详细解析
+  - 这些文件提供了账号历史内容的深度分析数据
+
+### 3. 解析数据聚合
+- `data/{账号名称}/persona/clustering/意图.json` - 账号人设的意图特征聚合数据
+- `data/{账号名称}/persona/clustering/形式.json` - 账号人设的形式特征聚合数据
+- `data/{账号名称}/persona/clustering/实质.json` - 账号人设的实质特征聚合数据
+  - 这些文件是对历史数据解析结果的聚类和聚合,提供了账号人设的维度化特征
+
+**人设信息生成流程**:
+1. 从 `account_data.json` 获取账号地址,了解账号基本信息
+2. 从 `analysis/` 目录读取历史数据解析,了解账号历史内容的详细特征
+3. 从 `clustering/` 目录读取聚合数据,获取账号人设的维度化特征(意图、形式、实质)
+4. 综合分析这3个来源的数据,生成完整的账号人设信息
 
 **你可以使用任何工具来读取、分析、处理这些数据**,包括但不限于:
 - 文件读取工具
-- 数据分析工具
-- 内容理解工具
-- 灵感提取工具
-- 选题生成工具
-- 其他任何有助于完成任务的工具
+- Search Posts(搜索帖子工具)
+- 浏览器搜索工具
 
 ## 工具使用策略 (Tool Usage Strategy)
 
@@ -39,9 +53,25 @@
 ### 第一阶段:搜索生成灵感 (Inspiration Generation)
 
 **第一步:人设理解与数据加载 (Persona Understanding & Data Loading)**
-* **行动**: 使用工具读取和分析人设数据(`create/data/{账号名称}/persona/实质.json`、`形式.json`、`意图.json`),深入理解账号的核心人设特征。
-* **工具建议**: 文件读取工具、数据分析工具
-* **输出**: 形成对人设的全面理解,包括实质特征、形式特征、意图特征
+* **行动**: 使用工具读取和分析人设数据,通过以下步骤生成完整的账号人设信息:
+  1. **读取账号基础信息**:读取 `data/{账号名称}/persona/account_data.json` 获取账号地址和基本信息,了解账号的基本背景
+  2. **读取历史数据解析**:读取 `data/{账号名称}/persona/analysis/` 目录下的所有历史数据解析文件,深入分析账号历史内容的详细特征,包括:
+     - 每个帖子的灵感点、关键元素
+     - 历史内容的实质特征分布
+     - 历史内容的形式特征表现
+     - 历史内容的创作意图倾向
+  3. **读取聚合数据**:读取 `data/{账号名称}/persona/clustering/意图.json`、`形式.json`、`实质.json` 获取聚合后的维度化特征,包括:
+     - 意图维度的分类结构和元素列表
+     - 形式维度的分类结构和元素列表
+     - 实质维度的分类结构和元素列表
+  4. **生成完整人设信息**:综合分析这3个来源的数据,生成完整的账号人设信息,应包含:
+     - 账号基本信息(从account_data.json获取)
+     - 意图特征(从clustering/意图.json和历史数据中提取)
+     - 形式特征(从clustering/形式.json和历史数据中提取)
+     - 实质特征(从clustering/实质.json和历史数据中提取)
+     - 历史内容特征总结(从analysis/目录中总结)
+* **工具建议**: 文件读取工具、数据分析工具、数据聚合工具、内容理解工具
+* **输出**: 形成对人设的全面理解,包括账号基本信息、历史内容特征、实质特征、形式特征、意图特征等完整人设信息,为后续的灵感搜索和选题生成提供基础
 
 **第二步:灵感搜索与生成 (Inspiration Search & Generation)**
 * **行动**: 基于人设特征,使用工具搜索、提取或生成创作灵感。可以通过以下方式:
@@ -111,150 +141,173 @@
   - 验证 JSON 格式的正确性
   - 检查所有必需字段是否完整
   - 确保数据逻辑一致性
-  - 验证选题支撑的准确性
+  - 验证段落描述的准确性
 * **工具建议**: JSON 验证工具、内容审核工具
 * **输出**: 最终符合规范的创作表 JSON 文件
 
+**第十二步:文件生成与验证(必须完成)**
+* **行动**: 生成JSON文件到指定路径,并执行完整的验证流程:
+  1. 生成文件到 `data/{账号名称}/output/` 目录
+  2. 验证文件存在性(使用文件读取工具)
+  3. 验证 JSON 格式正确性
+  4. 验证字段完整性
+  5. 验证数据一致性
+  6. 验证文件路径和命名
+* **工具建议**: 文件写入工具、文件读取工具、JSON 解析工具
+* **输出**: 验证通过的JSON文件
+* **重要**: **只有在所有验证都通过后,任务才能结束。如果验证失败,必须修复问题并重新验证。**
 
-## 创作表结构要求
-
-最终输出的创作表必须严格按照以下 JSON 结构生成,确保所有字段完整且符合规范:
 
-### 顶层结构
+## 创作表结构要求
 
-```json
-{
-  "内容品类": "字符串,如:时政民生评论、美妆护肤、生活方式等",
-  "段落列表": [ /* 段落数组 */ ]
-}
-```
+最终输出需要生成**1个JSON文件**,文件名格式必须与示例文件保持一致。文件必须严格按照以下 JSON 结构生成,确保所有字段完整且符合规范:
 
-### 段落结构(支持多级嵌套)
+### 输出文件: script_output.json - 段落描述文件
 
-每个段落对象包含以下字段
+文件结构是一个数组,每个元素代表一个段落:
 
 ```json
-{
-  "id": "字符串,段落唯一标识,如:段落1、段落1.1、段落1.1.1",
-  "名称": "字符串,段落简短名称",
-  "内容范围": ["字符串数组,时间范围,如:00:00-01:21"],
-  "推理依据": "字符串,说明为何这样划分段落,包括分镜变化、内容转折、情感变化等",
-  "子项": [ /* 子段落数组,结构与父段落相同,支持递归嵌套 */ ],
-  "主题": "字符串,该段落的核心主题概括",
-  "形式": "字符串,描述视觉呈现形式、拍摄手法、口播风格、字幕样式等",
-  "作用": {
-    "段内作用": "字符串,该段落在整体内容中的内部功能",
-    "段间作用": "字符串,该段落与其他段落之间的连接和过渡作用"
-  },
-  "感受": [
-    {
-      "情绪词": "字符串,如:好奇、期待、惊喜、佩服等,多个情绪用顿号分隔",
-      "推理": "字符串,详细说明为何观众会产生这种情绪,分析心理机制"
-    }
-  ],
-  "描述": "字符串,该段落的完整描述,综合主题、形式、作用、感受等要素",
-  "选题支撑": {
-    "灵感点": [
-      {
-        "点": "字符串,灵感点的具体名称",
-        "体现说明": "字符串,说明该灵感点在本段落中如何体现"
-      }
-    ],
-    "目的点": [
-      {
-        "点": "字符串,目的点的具体名称",
-        "体现说明": "字符串,说明该目的点在本段落中如何体现"
-      }
-    ],
-    "关键点": [
-      {
-        "点": "字符串,关键点的具体名称,如:反讽式叙事、情感共鸣话术、互动引导机制等",
-        "体现说明": "字符串,说明该关键点在本段落中如何体现"
-      }
-    ]
+[
+  {
+    "段落ID": "字符串,段落唯一标识,如:段落1、段落2、段落2.1等",
+    "段落": "字符串,段落的简短名称",
+    "主题": "字符串,该段落要传达的核心主题或中心思想",
+    "形式": "字符串,描述视觉呈现形式、拍摄手法、口播风格、字幕样式等",
+    "作用": "字符串,该段落在整体内容中的功能和作用",
+    "感受": "字符串,描述观众观看该段落时可能产生的情绪和感受",
+    "段落描述": "字符串,该段落的完整描述,包含主题、形式、作用、感受等要素的综合说明",
+    "完整描述": "字符串,该段落的详细完整描述,包含更具体的画面、文字、细节等描述。如果该段落不需要详细描述,可以为空字符串\"\""
   }
-}
+]
 ```
 
-## 字段含义说明
-
-### 顶层字段
+**字段说明**:
 
-- **帖子ID**: 内容的唯一标识符,用于追踪和管理
-- **内容品类**: 内容所属的垂直领域分类,用于内容定位和分发
-- **段落列表**: 视频内容的完整段落结构,按时间顺序组织
+- **段落ID**: 段落的唯一标识符,使用"段落X"、"段落X.Y"等格式,支持多级嵌套(如:段落1、段落2、段落2.1、段落2.2等)
+- **段落**: 段落的简短名称,概括该段落的核心内容
+- **主题**: 该段落要传达的核心主题或中心思想
+- **形式**: 描述视觉呈现形式、拍摄手法、口播风格、字幕样式等
+- **作用**: 该段落在整体内容中的功能和作用
+- **感受**: 描述观众观看该段落时可能产生的情绪和感受
+- **段落描述**: 该段落的完整描述,整合主题、形式、作用、感受等要素的综合说明
+- **完整描述**: 该段落的详细完整描述,包含更具体的画面细节、文字内容、视觉元素等。对于需要详细描述的段落(如包含图片、视频等视觉内容的段落),应提供详细的描述;对于简单段落,可以为空字符串`""`
 
-### 段落核心字段
+**注意**:
+- 数组中的段落应按顺序排列,反映内容的时间顺序或逻辑顺序
+- 支持多级嵌套的段落结构(如段落2包含段落2.1、段落2.2等),每个子段落都应作为独立的数组元素
+- 段落描述应深入细致,不能流于表面
+- 完整描述应尽可能详细,特别是对于包含视觉内容的段落
 
-- **id**: 段落的层级标识,使用"段落X"、"段落X.Y"等格式,支持多级嵌套
-- **名称**: 段落的简短标题,概括该段落的核心内容
-- **内容范围**: 该段落在视频中的时间位置,格式为"HH:MM-SS",支持多个不连续的时间段
-- **推理依据**: 说明段落划分的逻辑依据,包括画面切换、内容转折、情感变化、节奏变化等
 
-### 内容分析字
+#### 段落组织说明
 
-- **主题**: 该段落要传达的核心主题或中心思想
-- **形式**: 描述视频的呈现形式,包括:
-  - 拍摄视角(固定视角、移动镜头、特写等)
-  - 画面内容(人物、场景、道具等)
-  - 口播风格(语气、节奏、语调等)
-  - 字幕样式(颜色、大小、位置等)
-  - 其他视觉元素
-
-- **作用**: 分析段落在整体结构中的功能
-  - **段内作用**: 该段落在自身内容范围内的功能定位
-  - **段间作用**: 该段落如何连接前后段落,实现过渡和转折
-
-- **感受**: 分析观众观看该段落时的情绪反应
-  - **情绪词**: 观众可能产生的主要情绪,如好奇、期待、惊喜、佩服、感动、温暖、振奋、肯定、通透、信服、敬佩、欣慰、崇敬、共鸣、认同、自豪、亲切、热忱、积极、急切、坚定等
-  - **推理**: 深入分析情绪产生的心理机制,说明为何观众会产生这种感受
-
-- **描述**: 该段落的综合性描述,整合主题、形式、作用、感受等所有要素,形成完整的段落说明
-
-### 选题支撑字段
-
-- **选题支撑**: 说明该段落如何支撑和体现选题要素
-  - **灵感点**: 来自选题中的灵感要素,说明该段落如何体现这些灵感
-    - **点**: 灵感点的具体名称
-    - **体现说明**: 详细说明该灵感点在本段落中的具体体现方式
-  - **目的点**: 来自选题中的目的要素,说明该段落如何实现这些目的
-    - **点**: 目的点的具体名称
-    - **体现说明**: 详细说明该目的点在本段落中的具体实现方式
-  - **关键点**: 来自选题中的关键要素,如叙事手法、话术技巧、互动机制等
-    - **点**: 关键点的具体名称,如:反讽式叙事、情感共鸣话术、互动引导机制、正能量价值观、惠民政策清单等
-    - **体现说明**: 详细说明该关键点在本段落中的具体应用方式
-
-### 嵌套结构说明
-
-- **子项**: 段落可以包含子段落,形成多级嵌套结构
-- 子段落的结构与父段落完全相同,包含所有字段
-- 子段落用于更细粒度的内容分析,通常对应更短的时间段或更具体的内容单元
-- 支持多级嵌套,但建议不超过3级,保持结构的清晰性
+- 数组中的段落应按顺序排列,反映内容的时间顺序或逻辑顺序
+- 支持多级嵌套的段落结构(如段落2包含段落2.1、段落2.2等),每个子段落都应作为独立的数组元素
+- 段落描述应深入细致,不能流于表面
+- 完整描述应尽可能详细,特别是对于包含视觉内容的段落
 
 ## 输出要求 (Output Requirements)
 
 ### 输出格式
 
-**最终输出路径**:`create/data/{账号名称}/output/result.json`
+**最终输出路径**:`data/{账号名称}/output/` 目录下生成以下1个JSON文件:
+
+1. **script_output.json** - 段落描述文件,包含所有段落的完整描述和详细描述
+
+**文件名格式要求**:必须严格按照上述文件名格式,不能有任何变化。
 
-**输出格式**:必须严格按照上述 JSON 结构生成,确保所有字段完整且符合规范。
+**输出格式**:文件必须严格按照上述 JSON 结构生成,确保所有字段完整且符合规范。
+
+**⚠️ 重要:文件生成验证是强制要求**
+- 生成文件后,**必须**使用文件读取工具验证文件是否成功创建
+- **必须**验证 JSON 格式正确性
+- **必须**验证字段完整性
+- **必须**验证数据一致性
+- **只有在所有验证都通过后,任务才能结束**
+- 如果验证失败,必须修复问题并重新生成,直到验证通过
+
+### 数据一致性要求
+
+1. **段落ID一致性**: 所有段落的ID必须唯一且符合层级结构(如段落1、段落2、段落2.1等)
+2. **段落顺序一致性**: 数组中的段落应按时间顺序或逻辑顺序排列
+3. **描述完整性**: 每个段落必须包含"段落ID"、"段落"、"主题"、"形式"、"作用"、"感受"、"段落描述"、"完整描述"八个字段
 
 ### 质量要求
 
-1. **完整性**: 所有字段必须填写,不能为空(空数组 `[]` 可以接受)
-2. **准确性**: 时间范围、推理依据必须准确反映视频内容
-3. **深度**: 感受分析、作用分析、选题支撑需要深入细致,不能流于表面
-4. **一致性**: 同一段落内的主题、形式、作用、感受、描述等要素必须逻辑一致
+1. **完整性**: 所有字段必须填写,"完整描述"可以为空字符串`""`(当段落不需要详细描述时)
+2. **准确性**: 段落描述必须准确反映内容
+3. **深度**: 段落描述需要深入细致,不能流于表面,应包含主题、形式、作用、感受等要素
+4. **一致性**: 
+   - 同一段落内的主题、形式、作用、感受等要素必须逻辑一致
+   - 段落之间的连接关系要清晰
 5. **层次性**: 段落划分要合理,体现内容的逻辑结构和节奏变化
-6. **关联性**: 段间作用要清晰说明段落之间的连接关系,选题支撑要准确对应选题要素
+6. **详细性**: 
+   - 对于包含视觉内容的段落,"完整描述"应尽可能详细
+   - 对于简单段落,"完整描述"可以为空字符串`""`
+
+### 输出验证(必须完成)
+
+**重要:在任务完成前,你必须完成以下所有验证步骤,确保文件成功生成后才能结束任务。**
+
+#### 第一步:文件存在性验证(必须)
+
+在生成文件后,**必须**使用文件读取工具验证以下文件是否已成功创建:
+
+1. `data/{账号名称}/output/script_output.json` - 必须存在
+
+**验证方法**:使用文件读取工具尝试读取文件,如果文件不存在或读取失败,必须重新生成。
+
+#### 第二步:JSON 格式验证(必须)
+
+对已生成的文件,**必须**验证:
+- JSON 格式是否正确(可以使用 JSON 解析工具验证)
+- 文件内容不为空
+- 顶层结构是数组格式
+- 数组中的每个元素都是对象
+
+#### 第三步:字段完整性验证(必须)
+
+**必须**检查文件的关键字段是否完整:
+
+- **script_output.json**:检查数组中的每个段落对象是否包含以下字段:
+  - "段落ID":必须存在且为字符串
+  - "段落":必须存在且为字符串
+  - "主题":必须存在且为字符串
+  - "形式":必须存在且为字符串
+  - "作用":必须存在且为字符串
+  - "感受":必须存在且为字符串
+  - "段落描述":必须存在且为字符串
+  - "完整描述":必须存在(可以为空字符串`""`)
+
+#### 第四步:数据一致性验证(必须)
+
+**必须**验证:
+- 所有段落的"段落ID"必须唯一
+- 段落ID格式正确(如:段落1、段落2、段落2.1等)
+- 段落描述不为空("完整描述"可以为空字符串`""`)
+- 段落顺序合理(按时间顺序或逻辑顺序)
+
+#### 第五步:文件路径和命名验证(必须)
+
+**必须**确认:
+- 文件路径正确:`data/{账号名称}/output/`
+- 文件名完全正确:`script_output.json`(不能有任何拼写错误或大小写差异)
+
+#### 完成条件
+
+**只有在以下所有条件都满足时,任务才算完成:**
 
-### 输出验证
+1. ✅ 文件已成功生成并可以读取
+2. ✅ JSON 格式正确
+3. ✅ 所有必需字段都已填写
+4. ✅ 数据一致性验证通过
+5. ✅ 文件路径和命名完全正确
 
-在输出最终结果前,建议你:
-- 使用工具验证 JSON 格式的正确性
-- 检查所有必需字段是否完整
-- 确保数据逻辑一致性
-- 验证文件路径和权限
+**如果任何一项验证失败,必须:**
+- 修复问题
+- 重新生成文件
+- 重新执行验证流程
+- **直到所有验证都通过后才能结束任务**
 
 ## 工作流程自由度 (Workflow Freedom)
 
@@ -263,10 +316,12 @@
 - 你可以并行处理多个步骤,也可以调整步骤顺序
 - 你可以多次迭代优化,直到达到满意的结果
 - 你可以使用任何工具来辅助每个步骤
-- **唯一的要求是:最终输出必须符合上述 JSON 结构要求**
+- **唯一的要求是:最终输出必须生成1个符合上述 JSON 结构要求的文件**
+- **必须完成文件生成验证流程,确保文件成功生成并验证通过后才能结束任务**
 
 **发挥你的创造力**:
 - 尝试不同的分析方法
 - 探索不同的工具组合
 - 优化工作流程效率
 - 提高输出质量
+- 确保段落描述的完整性和准确性