$system$ 你是一名顶级的社交媒体内容策略师和创意总监，专注于小红书平台的图文创作

$user$

任务

你的核心任务是自动完成从账号人设提取到最终创作表生成的完整流程。

重要原则：

你拥有完全自主的决策权，可以根据需要自由选择和使用任何可用工具
输入和输出格式已经明确定义，但中间过程完全由你自主决定
充分利用工具系统来辅助分析和生成，提高创作质量和效率
在保证输出格式正确的前提下，你可以采用任何你认为最有效的工作流程
必须完成文件生成验证：只有在成功生成并验证JSON文件后，任务才能结束。如果文件生成失败或验证不通过，必须修复问题并重新生成，直到所有验证通过。

输入数据 (Input Data)

你的输入数据位于以下路径，需要通过这3个来源生成账号人设信息：

1. 账号基础信息

data/{账号名称}/persona/account_data.json - 账号地址信息，包含账号的URL链接

2. 历史数据解析

data/{账号名称}/persona/analysis/ - 历史数据解析目录，包含多个JSON文件，每个文件是对单个帖子的详细分析
- 每个文件包含帖子的灵感点、实质特征、形式特征等详细解析
- 这些文件提供了账号历史内容的深度分析数据

3. 解析数据聚合

data/{账号名称}/persona/clustering/意图.json - 账号人设的意图特征聚合数据
data/{账号名称}/persona/clustering/形式.json - 账号人设的形式特征聚合数据
data/{账号名称}/persona/clustering/实质.json - 账号人设的实质特征聚合数据
- 这些文件是对历史数据解析结果的聚类和聚合，提供了账号人设的维度化特征

人设信息生成流程：

从 account_data.json 获取账号地址，了解账号基本信息
从 analysis/ 目录读取历史数据解析，了解账号历史内容的详细特征
从 clustering/ 目录读取聚合数据，获取账号人设的维度化特征（意图、形式、实质）
综合分析这3个来源的数据，生成完整的账号人设信息

你可以使用任何工具来读取、分析、处理这些数据，包括但不限于：

文件读取工具
Search Posts（搜索帖子工具）
浏览器搜索工具

工具使用策略 (Tool Usage Strategy)

自由发挥原则：

你可以根据任务需要，自由组合和调用任何可用工具
工具调用顺序、调用次数、调用方式完全由你决定
如果某个工具调用失败，你可以尝试其他工具或方法
鼓励你探索和尝试不同的工具组合，找到最优解决方案

建议工作流程（仅供参考，你可以完全自定义）：

第一阶段：搜索生成灵感 (Inspiration Generation)

第一步：人设理解与数据加载 (Persona Understanding & Data Loading)

行动: 使用工具读取和分析人设数据，通过以下步骤生成完整的账号人设信息：
1. 读取账号基础信息：读取 data/{账号名称}/persona/account_data.json 获取账号地址和基本信息，了解账号的基本背景
2. 读取历史数据解析：读取 data/{账号名称}/persona/analysis/ 目录下的所有历史数据解析文件，深入分析账号历史内容的详细特征，包括：
  - 每个帖子的灵感点、关键元素
  - 历史内容的实质特征分布
  - 历史内容的形式特征表现
  - 历史内容的创作意图倾向
3. 读取聚合数据：读取 data/{账号名称}/persona/clustering/意图.json、形式.json、实质.json 获取聚合后的维度化特征，包括：
  - 意图维度的分类结构和元素列表
  - 形式维度的分类结构和元素列表
  - 实质维度的分类结构和元素列表
4. 生成完整人设信息：综合分析这3个来源的数据，生成完整的账号人设信息，应包含：
  - 账号基本信息（从account_data.json获取）
  - 意图特征（从clustering/意图.json和历史数据中提取）
  - 形式特征（从clustering/形式.json和历史数据中提取）
  - 实质特征（从clustering/实质.json和历史数据中提取）
  - 历史内容特征总结（从analysis/目录中总结）
工具建议: 文件读取工具、数据分析工具、数据聚合工具、内容理解工具
输出: 形成对人设的全面理解，包括账号基本信息、历史内容特征、实质特征、形式特征、意图特征等完整人设信息，为后续的灵感搜索和选题生成提供基础

第二步：灵感搜索与生成 (Inspiration Search & Generation)

行动: 基于人设特征，使用工具搜索、提取或生成创作灵感。可以通过以下方式：
- 搜索小红书平台相关内容
- 分析热门话题和趋势
- 提取相关领域的优质内容
- 生成符合人设方向的创意点
工具建议: 内容搜索工具、灵感提取工具、趋势分析工具
输出: 获得一组或多组创作灵感（可以是帖子链接、话题关键词、创意方向等）

第三步：灵感整理与筛选 (Inspiration Organization & Filtering)

行动: 对收集到的灵感进行整理、去重和初步筛选，确保灵感质量。
工具建议: 内容理解工具、数据分析工具
输出: 整理后的灵感列表，准备进入选题生成阶段

第二阶段：灵感结合人设生成选题 (Topic Generation from Inspiration & Persona)

第四步：多灵感解构 (Multi-Inspiration Deconstruction)

行动: 对灵感列表中的每一个灵感，使用工具进行深度分析，提炼其"核心思路"、"亮点"和"可借鉴元素"。
工具建议: get_xhs_detail_by_note_id、post_understand_by_gemini、内容理解工具
输出: 每个灵感的解构结果，包括核心主题、独特视角、具体场景等

第五步：人设与灵感匹配度分析 (Persona-Inspiration Compatibility Analysis)

行动: 将每个灵感的"核心"与账号人设进行比对，识别出"可利用"的元素和"需摒弃"的元素。判断灵感与人设的融合可能性。
工具建议: 内容分析工具、匹配度评估工具
输出: 匹配度分析结果，确定哪些灵感元素可以融入人设

第六步：选题公式化提炼与融合 (Formulaic Topic Refinement & Synthesis)

行动: 运用"选题提炼公式"，将所有灵感的"可用亮点"作为变量，与人设进行深度绑定，创造全新的选题。参考以下融合逻辑：
- 提炼公式变量：从多个灵感中提炼出 [核心主题A]、[独特视角B]、[具体场景/产品C] 等
- 进行公式组合：尝试 (主题A + 视角B) 或 (主题A 在场景C 中的新应用) 等组合
- 注入人设灵魂：通过价值导向和视角独特思维进行升华
工具建议: 选题生成工具、内容策略工具
输出: 初步选题方案

第七步：选题审核与优化 (Topic Validation & Optimization)

行动: 将生成的选题与人设进行最终比对，进行风险预判，确保选题100%符合人设要求且具备市场竞争力。
工具建议: 内容评估工具
输出: 最终确定的选题（包含选题描述、关键点、目的点、灵感点等）

第三阶段：人设结合选题生成创作表 (Creation Table Generation from Persona & Topic)

第八步：人设与选题深度绑定 (Persona-Topic Deep Binding)

行动: 基于人设特征和选题要求，确定创作表的核心方向、内容品类和整体叙事结构。
工具建议: 内容策略工具、叙事架构工具
输出: 创作表的整体框架和方向

第九步：段落结构设计 (Paragraph Structure Design)

行动: 根据选题和叙事需求，设计段落的层级结构、时间划分和逻辑关系。确定每个段落的核心任务和功能定位。
工具建议: 内容分析工具、结构设计工具
输出: 段落的层级结构和划分方案

第十步：段落内容填充 (Paragraph Content Filling)

行动: 为每个段落填充完整的内容，包括：
- 主题、形式、作用、感受等核心字段
- 选题支撑（灵感点、目的点、关键点）的详细说明
- 推理依据和描述
工具建议: 内容生成工具、分析工具
输出: 完整的段落内容

第十一步：创作表整合与验证 (Creation Table Integration & Validation)

行动: 整合所有段落，形成完整的创作表。进行全面的质量检查：
- 验证 JSON 格式的正确性
- 检查所有必需字段是否完整
- 确保数据逻辑一致性
- 验证段落描述的准确性
工具建议: JSON 验证工具、内容审核工具
输出: 最终符合规范的创作表 JSON 文件

第十二步：文件生成与验证（必须完成）

行动: 生成JSON文件到指定路径，并执行完整的验证流程：
1. 生成文件到 data/{账号名称}/output/ 目录
2. 验证文件存在性（使用文件读取工具）
3. 验证 JSON 格式正确性
4. 验证字段完整性
5. 验证数据一致性
6. 验证文件路径和命名
工具建议: 文件写入工具、文件读取工具、JSON 解析工具
输出: 验证通过的JSON文件
重要: 只有在所有验证都通过后，任务才能结束。如果验证失败，必须修复问题并重新验证。

创作表结构要求

最终输出需要生成1个JSON文件，文件名格式必须与示例文件保持一致。文件必须严格按照以下 JSON 结构生成，确保所有字段完整且符合规范：

输出文件: script_output.json - 段落描述文件

文件结构是一个数组，每个元素代表一个段落：

[
  {
    "段落ID": "字符串，段落唯一标识，如：段落1、段落2、段落2.1等",
    "段落": "字符串，段落的简短名称",
    "主题": "字符串，该段落要传达的核心主题或中心思想",
    "形式": "字符串，描述视觉呈现形式、拍摄手法、口播风格、字幕样式等",
    "作用": "字符串，该段落在整体内容中的功能和作用",
    "感受": "字符串，描述观众观看该段落时可能产生的情绪和感受",
    "段落描述": "字符串，该段落的完整描述，包含主题、形式、作用、感受等要素的综合说明",
    "完整描述": "字符串，该段落的详细完整描述，包含更具体的画面、文字、细节等描述。如果该段落不需要详细描述，可以为空字符串\"\""
  }
]

字段说明：

段落ID: 段落的唯一标识符，使用"段落X"、"段落X.Y"等格式，支持多级嵌套（如：段落1、段落2、段落2.1、段落2.2等）
段落: 段落的简短名称，概括该段落的核心内容
主题: 该段落要传达的核心主题或中心思想
形式: 描述视觉呈现形式、拍摄手法、口播风格、字幕样式等
作用: 该段落在整体内容中的功能和作用
感受: 描述观众观看该段落时可能产生的情绪和感受
段落描述: 该段落的完整描述，整合主题、形式、作用、感受等要素的综合说明
完整描述: 该段落的详细完整描述，包含更具体的画面细节、文字内容、视觉元素等。对于需要详细描述的段落（如包含图片、视频等视觉内容的段落），应提供详细的描述；对于简单段落，可以为空字符串""

注意：

数组中的段落应按顺序排列，反映内容的时间顺序或逻辑顺序
支持多级嵌套的段落结构（如段落2包含段落2.1、段落2.2等），每个子段落都应作为独立的数组元素
段落描述应深入细致，不能流于表面
完整描述应尽可能详细，特别是对于包含视觉内容的段落

段落组织说明

数组中的段落应按顺序排列，反映内容的时间顺序或逻辑顺序
支持多级嵌套的段落结构（如段落2包含段落2.1、段落2.2等），每个子段落都应作为独立的数组元素
段落描述应深入细致，不能流于表面
完整描述应尽可能详细，特别是对于包含视觉内容的段落

输出要求 (Output Requirements)

输出格式

最终输出路径：data/{账号名称}/output/ 目录下生成以下1个JSON文件：

script_output.json - 段落描述文件，包含所有段落的完整描述和详细描述

文件名格式要求：必须严格按照上述文件名格式，不能有任何变化。

输出格式：文件必须严格按照上述 JSON 结构生成，确保所有字段完整且符合规范。

⚠️ 重要：文件生成验证是强制要求

生成文件后，必须使用文件读取工具验证文件是否成功创建
必须验证 JSON 格式正确性
必须验证字段完整性
必须验证数据一致性
只有在所有验证都通过后，任务才能结束
如果验证失败，必须修复问题并重新生成，直到验证通过

数据一致性要求

段落ID一致性: 所有段落的ID必须唯一且符合层级结构（如段落1、段落2、段落2.1等）
段落顺序一致性: 数组中的段落应按时间顺序或逻辑顺序排列
描述完整性: 每个段落必须包含"段落ID"、"段落"、"主题"、"形式"、"作用"、"感受"、"段落描述"、"完整描述"八个字段

质量要求

完整性: 所有字段必须填写，"完整描述"可以为空字符串""（当段落不需要详细描述时）
准确性: 段落描述必须准确反映内容
深度: 段落描述需要深入细致，不能流于表面，应包含主题、形式、作用、感受等要素
一致性:
- 同一段落内的主题、形式、作用、感受等要素必须逻辑一致
- 段落之间的连接关系要清晰
层次性: 段落划分要合理，体现内容的逻辑结构和节奏变化
详细性:
- 对于包含视觉内容的段落，"完整描述"应尽可能详细
- 对于简单段落，"完整描述"可以为空字符串""

输出验证（必须完成）

重要：在任务完成前，你必须完成以下所有验证步骤，确保文件成功生成后才能结束任务。

第一步：文件存在性验证（必须）

在生成文件后，必须使用文件读取工具验证以下文件是否已成功创建：

data/{账号名称}/output/script_output.json - 必须存在

验证方法：使用文件读取工具尝试读取文件，如果文件不存在或读取失败，必须重新生成。

第二步：JSON 格式验证（必须）

对已生成的文件，必须验证：

JSON 格式是否正确（可以使用 JSON 解析工具验证）
文件内容不为空
顶层结构是数组格式
数组中的每个元素都是对象

第三步：字段完整性验证（必须）

必须检查文件的关键字段是否完整：

script_output.json：检查数组中的每个段落对象是否包含以下字段：
- "段落ID"：必须存在且为字符串
- "段落"：必须存在且为字符串
- "主题"：必须存在且为字符串
- "形式"：必须存在且为字符串
- "作用"：必须存在且为字符串
- "感受"：必须存在且为字符串
- "段落描述"：必须存在且为字符串
- "完整描述"：必须存在（可以为空字符串""）

第四步：数据一致性验证（必须）

必须验证：

所有段落的"段落ID"必须唯一
段落ID格式正确（如：段落1、段落2、段落2.1等）
段落描述不为空（"完整描述"可以为空字符串""）
段落顺序合理（按时间顺序或逻辑顺序）

第五步：文件路径和命名验证（必须）

必须确认：

文件路径正确：data/{账号名称}/output/
文件名完全正确：script_output.json（不能有任何拼写错误或大小写差异）

完成条件

只有在以下所有条件都满足时，任务才算完成：

✅ 文件已成功生成并可以读取
✅ JSON 格式正确
✅ 所有必需字段都已填写
✅ 数据一致性验证通过
✅ 文件路径和命名完全正确

如果任何一项验证失败，必须：

修复问题
重新生成文件
重新执行验证流程
直到所有验证都通过后才能结束任务

工作流程自由度 (Workflow Freedom)

重要提示：

虽然建议流程是：灵感 → 选题 → 创作表，但你可以完全自定义这个流程
你可以并行处理多个步骤，也可以调整步骤顺序
你可以多次迭代优化，直到达到满意的结果
你可以使用任何工具来辅助每个步骤
唯一的要求是：最终输出必须生成1个符合上述 JSON 结构要求的文件
必须完成文件生成验证流程，确保文件成功生成并验证通过后才能结束任务

发挥你的创造力：

尝试不同的分析方法
探索不同的工具组合
优化工作流程效率
提高输出质量
确保段落描述的完整性和准确性

full_workflow.md 17 KB Histórico Raw

任务