AI叙事生成方法论

来源: AI叙事生成研究综述
调研时间: 2025年
原始链接: https://www.bing.com/search?q=AI+narrative+generation+chain+of+thought+creative+writing+story+planning+LLM

一、AI叙事生成的主要方法

1. Plan-and-Write方法（规划-写作）

核心思路: 先生成故事规划/大纲，再基于规划生成具体内容
优势:
- 允许对生成过程进行引导和多样化控制
- 更符合人类创作流程
- 易于实现交互式调整
应用: LLM故事生成的主流范式之一

2. 两大生成范式

根据ACL Anthology的调研论文，LLM故事生成存在两个主要范式：

直接生成范式

端到端直接产出故事
优点: 简单、流畅
缺点: 难以控制、长篇易崩

结构化生成范式

包含中间规划步骤
优点: 可控性强、逻辑连贯
缺点: 需要更复杂的训练数据

二、思维链(Chain of Thought)在创作中的应用

1. 故事规划层面

将复杂的叙事任务分解为多个思考步骤
先构思情节框架、角色设定、冲突设计等中间环节
再基于这些中间产出生成最终文本

2. 提示工程(Prompt Engineering)

通过精心设计的提示词引导模型展示创作思考过程，可包含：

故事结构规划: 确定整体框架和节拍
角色动机分析: 理解角色行为逻辑
情节逻辑推演: 确保因果关系合理
叙事节奏控制: 调整信息披露速度

3. 思维链示例结构

用户输入: 写一个复仇故事

思维链展开:
1. [结构规划] 采用三幕结构，主角从受害者到复仇者的转变
2. [角色设定] 主角：曾经善良，现在冷酷；反派：表面正义，实则虚伪
3. [冲突设计] 核心冲突：正义与复仇的界限
4. [节拍规划] 
   - 开场：展示主角的幸福生活
   - 催化剂：反派的背叛导致主角失去一切
   - 中点：主角发现反派的更大阴谋
   - 低点：复仇计划失败，陷入绝境
   - 高潮：主角做出道德选择
5. [文本生成] 基于以上规划生成具体场景...

三、如何训练模型学习创作思考过程

1. 数据构建策略

收集包含中间创作步骤的训练数据，不仅要有最终故事，还需要：

大纲/提纲: 章节规划、情节要点
角色档案: 人物设定、关系图谱
情节规划文档: 冲突设计、转折点规划
修订过程记录: 从初稿到终稿的演变

2. 多阶段训练方法

第一阶段：学习基础叙事能力

训练数据: 大量完整故事
目标: 学习语言流畅性、基本叙事模式

第二阶段：学习结构化规划能力

训练数据: 大纲→故事的配对数据
目标: 学习从抽象规划到具体文本的映射

第三阶段：整合规划与写作的端到端训练

训练数据: 包含完整思考过程的数据
目标: 学习像人类作家一样先思考再写作

3. 关键技术要点

引导与多样化(Guiding and Diversifying)

平衡创意多样性与主题一致性
避免生成过于模板化或过于发散

分层生成架构

分别建模宏观结构和微观文本
宏观层: 故事整体框架
中观层: 章节场景规划
微观层: 具体文本生成

反馈循环

让模型能根据已生成内容调整后续规划
实现动态的故事发展

四、核心挑战

保持长篇叙事的连贯性
- 问题: 百万字级别容易出现前后矛盾
- 解决方向: 记忆系统、一致性检查
平衡创意性与可控性
- 问题: 过度控制失去创意，过度自由失去方向
- 解决方向: 分层控制、软约束
学习人类作家的隐性思考过程
- 问题: 很多创作决策是直觉性的
- 解决方向: 逆向工程、专家标注
处理复杂的角色关系和情节伏笔
- 问题: 多线程管理、长期伏笔回收
- 解决方向: 知识图谱、线程追踪

五、实践资源

GitHub资源库: yingpengma/Awesome-Story-Generation
- 包含最新研究论文和数据集
LangChain框架:
- 提供story-writing相关的提示工程模板和工具链

六、关键结论

现代AI叙事生成越来越重视显式建模创作的"思考过程"，通过plan-and-write范式和思维链技术，让模型像人类作家一样先构思再写作，这需要特殊设计的训练数据和多阶段学习策略。

七、对本项目的启示

1. 数据构建方向

核心任务: 将优质故事逆向拆解成"思考步骤"

具体方法:

不仅保留最终文本
逆向推导出作者的规划过程
标注每个场景/章节的设计意图

2. 训练数据格式建议

{
  "story_metadata": {
    "title": "故事标题",
    "genre": "类型",
    "length": "字数"
  },
  "planning_chain": {
    "overall_structure": {
      "mice_type": "主导类型",
      "beat_sheet": "15节拍规划",
      "theme": "核心主题"
    },
    "chapter_planning": [
      {
        "chapter_id": 1,
        "scene_sequel_structure": {
          "goal": "角色目标",
          "conflict": "冲突设计",
          "disaster": "灾难结果",
          "reaction": "情绪反应",
          "dilemma": "困境分析",
          "decision": "决策"
        },
        "web_novel_elements": {
          "hooks": ["钩子类型"],
          "emotion_type": "情绪类型",
          "reversal": "反转设计"
        },
        "reasoning": "为什么这样设计这一章"
      }
    ]
  },
  "final_text": "最终生成的文本"
}

3. 微调策略

优先级1: 结构规划能力

训练模型学习MICE线程管理
训练模型学习15节拍时间控制

优先级2: 场景构建能力

训练模型学习Scene-Sequel循环
训练模型学习钩子和反转设计

优先级3: 端到端整合

训练模型从规划到文本的完整流程
训练模型的动态调整能力

4. 一周内可执行方案

Day 1-2: 选择3-5个优质样本进行深度拆解 Day 3-4: 构建包含思考过程的训练数据 Day 5-6: 微调核心模块（优先结构规划） Day 7: 测试和迭代

05_AI_narrative_generation.md 6.2 KB Trvalý odkaz Historie Surový