3 месяцев назад · 0a2d24c29f
--- a/create/prompt/full_workflow.md
+++ b/create/prompt/full_workflow.md
@@ -9,22 +9,36 @@
 
				 - 输入和输出格式已经明确定义，但**中间过程完全由你自主决定**
			
 
				 - 充分利用工具系统来辅助分析和生成，提高创作质量和效率
			
 
				 - 在保证输出格式正确的前提下，你可以采用任何你认为最有效的工作流程
			
 
				+- **必须完成文件生成验证**：只有在成功生成并验证JSON文件后，任务才能结束。如果文件生成失败或验证不通过，必须修复问题并重新生成，直到所有验证通过。
			
 
				 
			
 
				 ## 输入数据 (Input Data)
			
 
				 
			
 
				-你的输入数据位于以下路径：
			
 
				+你的输入数据位于以下路径，需要通过这3个来源生成账号人设信息：
			
 
				 
			
 
				-- `create/data/{账号名称}/persona/实质.json` - 账号人设的实质特征
			
 
				-- `create/data/{账号名称}/persona/形式.json` - 账号人设的形式特征
			
 
				-- `create/data/{账号名称}/persona/意图.json` - 账号人设的意图特征
			
 
				+### 1. 账号基础信息
			
 
				+- `data/{账号名称}/persona/account_data.json` - 账号地址信息，包含账号的URL链接
			
 
				+
			
 
				+### 2. 历史数据解析
			
 
				+- `data/{账号名称}/persona/analysis/` - 历史数据解析目录，包含多个JSON文件，每个文件是对单个帖子的详细分析
			
 
				+  - 每个文件包含帖子的灵感点、实质特征、形式特征等详细解析
			
 
				+  - 这些文件提供了账号历史内容的深度分析数据
			
 
				+
			
 
				+### 3. 解析数据聚合
			
 
				+- `data/{账号名称}/persona/clustering/意图.json` - 账号人设的意图特征聚合数据
			
 
				+- `data/{账号名称}/persona/clustering/形式.json` - 账号人设的形式特征聚合数据
			
 
				+- `data/{账号名称}/persona/clustering/实质.json` - 账号人设的实质特征聚合数据
			
 
				+  - 这些文件是对历史数据解析结果的聚类和聚合，提供了账号人设的维度化特征
			
 
				+
			
 
				+**人设信息生成流程**：
			
 
				+1. 从 `account_data.json` 获取账号地址，了解账号基本信息
			
 
				+2. 从 `analysis/` 目录读取历史数据解析，了解账号历史内容的详细特征
			
 
				+3. 从 `clustering/` 目录读取聚合数据，获取账号人设的维度化特征（意图、形式、实质）
			
 
				+4. 综合分析这3个来源的数据，生成完整的账号人设信息
			
 
				 
			
 
				 **你可以使用任何工具来读取、分析、处理这些数据**，包括但不限于：
			
 
				 - 文件读取工具
			
 
				-- 数据分析工具
			
 
				-- 内容理解工具
			
 
				-- 灵感提取工具
			
 
				-- 选题生成工具
			
 
				-- 其他任何有助于完成任务的工具
			
 
				+- Search Posts（搜索帖子工具）
			
 
				+- 浏览器搜索工具
			
 
				 
			
 
				 ## 工具使用策略 (Tool Usage Strategy)
			
 
				 
			
@@ -39,9 +53,25 @@
 
				 ### 第一阶段：搜索生成灵感 (Inspiration Generation)
			
 
				 
			
 
				 **第一步：人设理解与数据加载 (Persona Understanding & Data Loading)**
			
 
				-* **行动**: 使用工具读取和分析人设数据（`create/data/{账号名称}/persona/实质.json`、`形式.json`、`意图.json`），深入理解账号的核心人设特征。
			
 
				-* **工具建议**: 文件读取工具、数据分析工具
			
 
				-* **输出**: 形成对人设的全面理解，包括实质特征、形式特征、意图特征
			
 
				+* **行动**: 使用工具读取和分析人设数据，通过以下步骤生成完整的账号人设信息：
			
 
				+  1. **读取账号基础信息**：读取 `data/{账号名称}/persona/account_data.json` 获取账号地址和基本信息，了解账号的基本背景
			
 
				+  2. **读取历史数据解析**：读取 `data/{账号名称}/persona/analysis/` 目录下的所有历史数据解析文件，深入分析账号历史内容的详细特征，包括：
			
 
				+     - 每个帖子的灵感点、关键元素
			
 
				+     - 历史内容的实质特征分布
			
 
				+     - 历史内容的形式特征表现
			
 
				+     - 历史内容的创作意图倾向
			
 
				+  3. **读取聚合数据**：读取 `data/{账号名称}/persona/clustering/意图.json`、`形式.json`、`实质.json` 获取聚合后的维度化特征，包括：
			
 
				+     - 意图维度的分类结构和元素列表
			
 
				+     - 形式维度的分类结构和元素列表
			
 
				+     - 实质维度的分类结构和元素列表
			
 
				+  4. **生成完整人设信息**：综合分析这3个来源的数据，生成完整的账号人设信息，应包含：
			
 
				+     - 账号基本信息（从account_data.json获取）
			
 
				+     - 意图特征（从clustering/意图.json和历史数据中提取）
			
 
				+     - 形式特征（从clustering/形式.json和历史数据中提取）
			
 
				+     - 实质特征（从clustering/实质.json和历史数据中提取）
			
 
				+     - 历史内容特征总结（从analysis/目录中总结）
			
 
				+* **工具建议**: 文件读取工具、数据分析工具、数据聚合工具、内容理解工具
			
 
				+* **输出**: 形成对人设的全面理解，包括账号基本信息、历史内容特征、实质特征、形式特征、意图特征等完整人设信息，为后续的灵感搜索和选题生成提供基础
			
 
				 
			
 
				 **第二步：灵感搜索与生成 (Inspiration Search & Generation)**
			
 
				 * **行动**: 基于人设特征，使用工具搜索、提取或生成创作灵感。可以通过以下方式：
			
@@ -111,150 +141,173 @@
 
				   - 验证 JSON 格式的正确性
			
 
				   - 检查所有必需字段是否完整
			
 
				   - 确保数据逻辑一致性
			
 
				-  - 验证选题支撑的准确性
			
 
				+  - 验证段落描述的准确性
			
 
				 * **工具建议**: JSON 验证工具、内容审核工具
			
 
				 * **输出**: 最终符合规范的创作表 JSON 文件
			
 
				 
			
 
				+**第十二步：文件生成与验证（必须完成）**
			
 
				+* **行动**: 生成JSON文件到指定路径，并执行完整的验证流程：
			
 
				+  1. 生成文件到 `data/{账号名称}/output/` 目录
			
 
				+  2. 验证文件存在性（使用文件读取工具）
			
 
				+  3. 验证 JSON 格式正确性
			
 
				+  4. 验证字段完整性
			
 
				+  5. 验证数据一致性
			
 
				+  6. 验证文件路径和命名
			
 
				+* **工具建议**: 文件写入工具、文件读取工具、JSON 解析工具
			
 
				+* **输出**: 验证通过的JSON文件
			
 
				+* **重要**: **只有在所有验证都通过后，任务才能结束。如果验证失败，必须修复问题并重新验证。**
			
 
				 
			
 
				-## 创作表结构要求
			
 
				-
			
 
				-最终输出的创作表必须严格按照以下 JSON 结构生成，确保所有字段完整且符合规范：
			
 
				 
			
 
				-### 顶层结构
			
 
				+## 创作表结构要求
			
 
				 
			
 
				-```json
			
 
				-{
			
 
				-  "内容品类": "字符串，如：时政民生评论、美妆护肤、生活方式等",
			
 
				-  "段落列表": [ /* 段落数组 */ ]
			
 
				-}
			
 
				-```
			
 
				+最终输出需要生成**1个JSON文件**，文件名格式必须与示例文件保持一致。文件必须严格按照以下 JSON 结构生成，确保所有字段完整且符合规范：
			
 
				 
			
 
				-### 段落结构（支持多级嵌套）
			
 
				+### 输出文件: script_output.json - 段落描述文件
			
 
				 
			
 
				-每个段落对象包含以下字段：
			
 
				+文件结构是一个数组，每个元素代表一个段落：
			
 
				 
			
 
				 ```json
			
 
				-{
			
 
				-  "id": "字符串，段落唯一标识，如：段落1、段落1.1、段落1.1.1",
			
 
				-  "名称": "字符串，段落简短名称",
			
 
				-  "内容范围": ["字符串数组，时间范围，如：00:00-01:21"],
			
 
				-  "推理依据": "字符串，说明为何这样划分段落，包括分镜变化、内容转折、情感变化等",
			
 
				-  "子项": [ /* 子段落数组，结构与父段落相同，支持递归嵌套 */ ],
			
 
				-  "主题": "字符串，该段落的核心主题概括",
			
 
				-  "形式": "字符串，描述视觉呈现形式、拍摄手法、口播风格、字幕样式等",
			
 
				-  "作用": {
			
 
				-    "段内作用": "字符串，该段落在整体内容中的内部功能",
			
 
				-    "段间作用": "字符串，该段落与其他段落之间的连接和过渡作用"
			
 
				-  },
			
 
				-  "感受": [
			
 
				-    {
			
 
				-      "情绪词": "字符串，如：好奇、期待、惊喜、佩服等，多个情绪用顿号分隔",
			
 
				-      "推理": "字符串，详细说明为何观众会产生这种情绪，分析心理机制"
			
 
				-    }
			
 
				-  ],
			
 
				-  "描述": "字符串，该段落的完整描述，综合主题、形式、作用、感受等要素",
			
 
				-  "选题支撑": {
			
 
				-    "灵感点": [
			
 
				-      {
			
 
				-        "点": "字符串，灵感点的具体名称",
			
 
				-        "体现说明": "字符串，说明该灵感点在本段落中如何体现"
			
 
				-      }
			
 
				-    ],
			
 
				-    "目的点": [
			
 
				-      {
			
 
				-        "点": "字符串，目的点的具体名称",
			
 
				-        "体现说明": "字符串，说明该目的点在本段落中如何体现"
			
 
				-      }
			
 
				-    ],
			
 
				-    "关键点": [
			
 
				-      {
			
 
				-        "点": "字符串，关键点的具体名称，如：反讽式叙事、情感共鸣话术、互动引导机制等",
			
 
				-        "体现说明": "字符串，说明该关键点在本段落中如何体现"
			
 
				-      }
			
 
				-    ]
			
 
				+[
			
 
				+  {
			
 
				+    "段落ID": "字符串，段落唯一标识，如：段落1、段落2、段落2.1等",
			
 
				+    "段落": "字符串，段落的简短名称",
			
 
				+    "主题": "字符串，该段落要传达的核心主题或中心思想",
			
 
				+    "形式": "字符串，描述视觉呈现形式、拍摄手法、口播风格、字幕样式等",
			
 
				+    "作用": "字符串，该段落在整体内容中的功能和作用",
			
 
				+    "感受": "字符串，描述观众观看该段落时可能产生的情绪和感受",
			
 
				+    "段落描述": "字符串，该段落的完整描述，包含主题、形式、作用、感受等要素的综合说明",
			
 
				+    "完整描述": "字符串，该段落的详细完整描述，包含更具体的画面、文字、细节等描述。如果该段落不需要详细描述，可以为空字符串\"\""
			
 
				   }
			
 
				-}
			
 
				+]
			
 
				 ```
			
 
				 
			
 
				-## 字段含义说明
			
 
				-
			
 
				-### 顶层字段
			
 
				+**字段说明**：
			
 
				 
			
 
				-- **帖子ID**: 内容的唯一标识符，用于追踪和管理
			
 
				-- **内容品类**: 内容所属的垂直领域分类，用于内容定位和分发
			
 
				-- **段落列表**: 视频内容的完整段落结构，按时间顺序组织
			
 
				+- **段落ID**: 段落的唯一标识符，使用"段落X"、"段落X.Y"等格式，支持多级嵌套（如：段落1、段落2、段落2.1、段落2.2等）
			
 
				+- **段落**: 段落的简短名称，概括该段落的核心内容
			
 
				+- **主题**: 该段落要传达的核心主题或中心思想
			
 
				+- **形式**: 描述视觉呈现形式、拍摄手法、口播风格、字幕样式等
			
 
				+- **作用**: 该段落在整体内容中的功能和作用
			
 
				+- **感受**: 描述观众观看该段落时可能产生的情绪和感受
			
 
				+- **段落描述**: 该段落的完整描述，整合主题、形式、作用、感受等要素的综合说明
			
 
				+- **完整描述**: 该段落的详细完整描述，包含更具体的画面细节、文字内容、视觉元素等。对于需要详细描述的段落（如包含图片、视频等视觉内容的段落），应提供详细的描述；对于简单段落，可以为空字符串`""`
			
 
				 
			
 
				-### 段落核心字段
			
 
				+**注意**：
			
 
				+- 数组中的段落应按顺序排列，反映内容的时间顺序或逻辑顺序
			
 
				+- 支持多级嵌套的段落结构（如段落2包含段落2.1、段落2.2等），每个子段落都应作为独立的数组元素
			
 
				+- 段落描述应深入细致，不能流于表面
			
 
				+- 完整描述应尽可能详细，特别是对于包含视觉内容的段落
			
 
				 
			
 
				-- **id**: 段落的层级标识，使用"段落X"、"段落X.Y"等格式，支持多级嵌套
			
 
				-- **名称**: 段落的简短标题，概括该段落的核心内容
			
 
				-- **内容范围**: 该段落在视频中的时间位置，格式为"HH:MM-SS"，支持多个不连续的时间段
			
 
				-- **推理依据**: 说明段落划分的逻辑依据，包括画面切换、内容转折、情感变化、节奏变化等
			
 
				 
			
 
				-### 内容分析字段
			
 
				+#### 段落组织说明
			
 
				 
			
 
				-- **主题**: 该段落要传达的核心主题或中心思想
			
 
				-- **形式**: 描述视频的呈现形式，包括：
			
 
				-  - 拍摄视角（固定视角、移动镜头、特写等）
			
 
				-  - 画面内容（人物、场景、道具等）
			
 
				-  - 口播风格（语气、节奏、语调等）
			
 
				-  - 字幕样式（颜色、大小、位置等）
			
 
				-  - 其他视觉元素
			
 
				-
			
 
				-- **作用**: 分析段落在整体结构中的功能
			
 
				-  - **段内作用**: 该段落在自身内容范围内的功能定位
			
 
				-  - **段间作用**: 该段落如何连接前后段落，实现过渡和转折
			
 
				-
			
 
				-- **感受**: 分析观众观看该段落时的情绪反应
			
 
				-  - **情绪词**: 观众可能产生的主要情绪，如好奇、期待、惊喜、佩服、感动、温暖、振奋、肯定、通透、信服、敬佩、欣慰、崇敬、共鸣、认同、自豪、亲切、热忱、积极、急切、坚定等
			
 
				-  - **推理**: 深入分析情绪产生的心理机制，说明为何观众会产生这种感受
			
 
				-
			
 
				-- **描述**: 该段落的综合性描述，整合主题、形式、作用、感受等所有要素，形成完整的段落说明
			
 
				-
			
 
				-### 选题支撑字段
			
 
				-
			
 
				-- **选题支撑**: 说明该段落如何支撑和体现选题要素
			
 
				-  - **灵感点**: 来自选题中的灵感要素，说明该段落如何体现这些灵感
			
 
				-    - **点**: 灵感点的具体名称
			
 
				-    - **体现说明**: 详细说明该灵感点在本段落中的具体体现方式
			
 
				-  - **目的点**: 来自选题中的目的要素，说明该段落如何实现这些目的
			
 
				-    - **点**: 目的点的具体名称
			
 
				-    - **体现说明**: 详细说明该目的点在本段落中的具体实现方式
			
 
				-  - **关键点**: 来自选题中的关键要素，如叙事手法、话术技巧、互动机制等
			
 
				-    - **点**: 关键点的具体名称，如：反讽式叙事、情感共鸣话术、互动引导机制、正能量价值观、惠民政策清单等
			
 
				-    - **体现说明**: 详细说明该关键点在本段落中的具体应用方式
			
 
				-
			
 
				-### 嵌套结构说明
			
 
				-
			
 
				-- **子项**: 段落可以包含子段落，形成多级嵌套结构
			
 
				-- 子段落的结构与父段落完全相同，包含所有字段
			
 
				-- 子段落用于更细粒度的内容分析，通常对应更短的时间段或更具体的内容单元
			
 
				-- 支持多级嵌套，但建议不超过3级，保持结构的清晰性
			
 
				+- 数组中的段落应按顺序排列，反映内容的时间顺序或逻辑顺序
			
 
				+- 支持多级嵌套的段落结构（如段落2包含段落2.1、段落2.2等），每个子段落都应作为独立的数组元素
			
 
				+- 段落描述应深入细致，不能流于表面
			
 
				+- 完整描述应尽可能详细，特别是对于包含视觉内容的段落
			
 
				 
			
 
				 ## 输出要求 (Output Requirements)
			
 
				 
			
 
				 ### 输出格式
			
 
				 
			
 
				-**最终输出路径**：`create/data/{账号名称}/output/result.json`
			
 
				+**最终输出路径**：`data/{账号名称}/output/` 目录下生成以下1个JSON文件：
			
 
				+
			
 
				+1. **script_output.json** - 段落描述文件，包含所有段落的完整描述和详细描述
			
 
				+
			
 
				+**文件名格式要求**：必须严格按照上述文件名格式，不能有任何变化。
			
 
				 
			
 
				-**输出格式**：必须严格按照上述 JSON 结构生成，确保所有字段完整且符合规范。
			
 
				+**输出格式**：文件必须严格按照上述 JSON 结构生成，确保所有字段完整且符合规范。
			
 
				+
			
 
				+**⚠️ 重要：文件生成验证是强制要求**
			
 
				+- 生成文件后，**必须**使用文件读取工具验证文件是否成功创建
			
 
				+- **必须**验证 JSON 格式正确性
			
 
				+- **必须**验证字段完整性
			
 
				+- **必须**验证数据一致性
			
 
				+- **只有在所有验证都通过后，任务才能结束**
			
 
				+- 如果验证失败，必须修复问题并重新生成，直到验证通过
			
 
				+
			
 
				+### 数据一致性要求
			
 
				+
			
 
				+1. **段落ID一致性**: 所有段落的ID必须唯一且符合层级结构（如段落1、段落2、段落2.1等）
			
 
				+2. **段落顺序一致性**: 数组中的段落应按时间顺序或逻辑顺序排列
			
 
				+3. **描述完整性**: 每个段落必须包含"段落ID"、"段落"、"主题"、"形式"、"作用"、"感受"、"段落描述"、"完整描述"八个字段
			
 
				 
			
 
				 ### 质量要求
			
 
				 
			
 
				-1. **完整性**: 所有字段必须填写，不能为空（空数组 `[]` 可以接受）
			
 
				-2. **准确性**: 时间范围、推理依据必须准确反映视频内容
			
 
				-3. **深度**: 感受分析、作用分析、选题支撑需要深入细致，不能流于表面
			
 
				-4. **一致性**: 同一段落内的主题、形式、作用、感受、描述等要素必须逻辑一致
			
 
				+1. **完整性**: 所有字段必须填写，"完整描述"可以为空字符串`""`（当段落不需要详细描述时）
			
 
				+2. **准确性**: 段落描述必须准确反映内容
			
 
				+3. **深度**: 段落描述需要深入细致，不能流于表面，应包含主题、形式、作用、感受等要素
			
 
				+4. **一致性**: 
			
 
				+   - 同一段落内的主题、形式、作用、感受等要素必须逻辑一致
			
 
				+   - 段落之间的连接关系要清晰
			
 
				 5. **层次性**: 段落划分要合理，体现内容的逻辑结构和节奏变化
			
 
				-6. **关联性**: 段间作用要清晰说明段落之间的连接关系，选题支撑要准确对应选题要素
			
 
				+6. **详细性**: 
			
 
				+   - 对于包含视觉内容的段落，"完整描述"应尽可能详细
			
 
				+   - 对于简单段落，"完整描述"可以为空字符串`""`
			
 
				+
			
 
				+### 输出验证（必须完成）
			
 
				+
			
 
				+**重要：在任务完成前，你必须完成以下所有验证步骤，确保文件成功生成后才能结束任务。**
			
 
				+
			
 
				+#### 第一步：文件存在性验证（必须）
			
 
				+
			
 
				+在生成文件后，**必须**使用文件读取工具验证以下文件是否已成功创建：
			
 
				+
			
 
				+1. `data/{账号名称}/output/script_output.json` - 必须存在
			
 
				+
			
 
				+**验证方法**：使用文件读取工具尝试读取文件，如果文件不存在或读取失败，必须重新生成。
			
 
				+
			
 
				+#### 第二步：JSON 格式验证（必须）
			
 
				+
			
 
				+对已生成的文件，**必须**验证：
			
 
				+- JSON 格式是否正确（可以使用 JSON 解析工具验证）
			
 
				+- 文件内容不为空
			
 
				+- 顶层结构是数组格式
			
 
				+- 数组中的每个元素都是对象
			
 
				+
			
 
				+#### 第三步：字段完整性验证（必须）
			
 
				+
			
 
				+**必须**检查文件的关键字段是否完整：
			
 
				+
			
 
				+- **script_output.json**：检查数组中的每个段落对象是否包含以下字段：
			
 
				+  - "段落ID"：必须存在且为字符串
			
 
				+  - "段落"：必须存在且为字符串
			
 
				+  - "主题"：必须存在且为字符串
			
 
				+  - "形式"：必须存在且为字符串
			
 
				+  - "作用"：必须存在且为字符串
			
 
				+  - "感受"：必须存在且为字符串
			
 
				+  - "段落描述"：必须存在且为字符串
			
 
				+  - "完整描述"：必须存在（可以为空字符串`""`）
			
 
				+
			
 
				+#### 第四步：数据一致性验证（必须）
			
 
				+
			
 
				+**必须**验证：
			
 
				+- 所有段落的"段落ID"必须唯一
			
 
				+- 段落ID格式正确（如：段落1、段落2、段落2.1等）
			
 
				+- 段落描述不为空（"完整描述"可以为空字符串`""`）
			
 
				+- 段落顺序合理（按时间顺序或逻辑顺序）
			
 
				+
			
 
				+#### 第五步：文件路径和命名验证（必须）
			
 
				+
			
 
				+**必须**确认：
			
 
				+- 文件路径正确：`data/{账号名称}/output/`
			
 
				+- 文件名完全正确：`script_output.json`（不能有任何拼写错误或大小写差异）
			
 
				+
			
 
				+#### 完成条件
			
 
				+
			
 
				+**只有在以下所有条件都满足时，任务才算完成：**
			
 
				 
			
 
				-### 输出验证
			
 
				+1. ✅ 文件已成功生成并可以读取
			
 
				+2. ✅ JSON 格式正确
			
 
				+3. ✅ 所有必需字段都已填写
			
 
				+4. ✅ 数据一致性验证通过
			
 
				+5. ✅ 文件路径和命名完全正确
			
 
				 
			
 
				-在输出最终结果前，建议你：
			
 
				-- 使用工具验证 JSON 格式的正确性
			
 
				-- 检查所有必需字段是否完整
			
 
				-- 确保数据逻辑一致性
			
 
				-- 验证文件路径和权限
			
 
				+**如果任何一项验证失败，必须：**
			
 
				+- 修复问题
			
 
				+- 重新生成文件
			
 
				+- 重新执行验证流程
			
 
				+- **直到所有验证都通过后才能结束任务**
			
 
				 
			
 
				 ## 工作流程自由度 (Workflow Freedom)
			
 
				 
			
@@ -263,10 +316,12 @@
 
				 - 你可以并行处理多个步骤，也可以调整步骤顺序
			
 
				 - 你可以多次迭代优化，直到达到满意的结果
			
 
				 - 你可以使用任何工具来辅助每个步骤
			
 
				-- **唯一的要求是：最终输出必须符合上述 JSON 结构要求**
			
 
				+- **唯一的要求是：最终输出必须生成1个符合上述 JSON 结构要求的文件**
			
 
				+- **必须完成文件生成验证流程，确保文件成功生成并验证通过后才能结束任务**
			
 
				 
			
 
				 **发挥你的创造力**：
			
 
				 - 尝试不同的分析方法
			
 
				 - 探索不同的工具组合
			
 
				 - 优化工作流程效率
			
 
				 - 提高输出质量
			
 
				+- 确保段落描述的完整性和准确性