05_AI_narrative_generation.md 6.2 KB

AI叙事生成方法论

来源: AI叙事生成研究综述
调研时间: 2025年
原始链接: https://www.bing.com/search?q=AI+narrative+generation+chain+of+thought+creative+writing+story+planning+LLM


一、AI叙事生成的主要方法

1. Plan-and-Write方法(规划-写作)

  • 核心思路: 先生成故事规划/大纲,再基于规划生成具体内容
  • 优势:
    • 允许对生成过程进行引导和多样化控制
    • 更符合人类创作流程
    • 易于实现交互式调整
  • 应用: LLM故事生成的主流范式之一

2. 两大生成范式

根据ACL Anthology的调研论文,LLM故事生成存在两个主要范式:

直接生成范式

  • 端到端直接产出故事
  • 优点: 简单、流畅
  • 缺点: 难以控制、长篇易崩

结构化生成范式

  • 包含中间规划步骤
  • 优点: 可控性强、逻辑连贯
  • 缺点: 需要更复杂的训练数据

二、思维链(Chain of Thought)在创作中的应用

1. 故事规划层面

  • 将复杂的叙事任务分解为多个思考步骤
  • 先构思情节框架、角色设定、冲突设计等中间环节
  • 再基于这些中间产出生成最终文本

2. 提示工程(Prompt Engineering)

通过精心设计的提示词引导模型展示创作思考过程,可包含:

  • 故事结构规划: 确定整体框架和节拍
  • 角色动机分析: 理解角色行为逻辑
  • 情节逻辑推演: 确保因果关系合理
  • 叙事节奏控制: 调整信息披露速度

3. 思维链示例结构

用户输入: 写一个复仇故事

思维链展开:
1. [结构规划] 采用三幕结构,主角从受害者到复仇者的转变
2. [角色设定] 主角:曾经善良,现在冷酷;反派:表面正义,实则虚伪
3. [冲突设计] 核心冲突:正义与复仇的界限
4. [节拍规划] 
   - 开场:展示主角的幸福生活
   - 催化剂:反派的背叛导致主角失去一切
   - 中点:主角发现反派的更大阴谋
   - 低点:复仇计划失败,陷入绝境
   - 高潮:主角做出道德选择
5. [文本生成] 基于以上规划生成具体场景...

三、如何训练模型学习创作思考过程

1. 数据构建策略

收集包含中间创作步骤的训练数据,不仅要有最终故事,还需要:

  • 大纲/提纲: 章节规划、情节要点
  • 角色档案: 人物设定、关系图谱
  • 情节规划文档: 冲突设计、转折点规划
  • 修订过程记录: 从初稿到终稿的演变

2. 多阶段训练方法

第一阶段:学习基础叙事能力

  • 训练数据: 大量完整故事
  • 目标: 学习语言流畅性、基本叙事模式

第二阶段:学习结构化规划能力

  • 训练数据: 大纲→故事的配对数据
  • 目标: 学习从抽象规划到具体文本的映射

第三阶段:整合规划与写作的端到端训练

  • 训练数据: 包含完整思考过程的数据
  • 目标: 学习像人类作家一样先思考再写作

3. 关键技术要点

引导与多样化(Guiding and Diversifying)

  • 平衡创意多样性与主题一致性
  • 避免生成过于模板化或过于发散

分层生成架构

  • 分别建模宏观结构和微观文本
  • 宏观层: 故事整体框架
  • 中观层: 章节场景规划
  • 微观层: 具体文本生成

反馈循环

  • 让模型能根据已生成内容调整后续规划
  • 实现动态的故事发展

四、核心挑战

  1. 保持长篇叙事的连贯性

    • 问题: 百万字级别容易出现前后矛盾
    • 解决方向: 记忆系统、一致性检查
  2. 平衡创意性与可控性

    • 问题: 过度控制失去创意,过度自由失去方向
    • 解决方向: 分层控制、软约束
  3. 学习人类作家的隐性思考过程

    • 问题: 很多创作决策是直觉性的
    • 解决方向: 逆向工程、专家标注
  4. 处理复杂的角色关系和情节伏笔

    • 问题: 多线程管理、长期伏笔回收
    • 解决方向: 知识图谱、线程追踪

五、实践资源

  • GitHub资源库: yingpengma/Awesome-Story-Generation

    • 包含最新研究论文和数据集
  • LangChain框架:

    • 提供story-writing相关的提示工程模板和工具链

六、关键结论

现代AI叙事生成越来越重视显式建模创作的"思考过程",通过plan-and-write范式和思维链技术,让模型像人类作家一样先构思再写作,这需要特殊设计的训练数据和多阶段学习策略。


七、对本项目的启示

1. 数据构建方向

核心任务: 将优质故事逆向拆解成"思考步骤"

具体方法:

  • 不仅保留最终文本
  • 逆向推导出作者的规划过程
  • 标注每个场景/章节的设计意图

2. 训练数据格式建议

{
  "story_metadata": {
    "title": "故事标题",
    "genre": "类型",
    "length": "字数"
  },
  "planning_chain": {
    "overall_structure": {
      "mice_type": "主导类型",
      "beat_sheet": "15节拍规划",
      "theme": "核心主题"
    },
    "chapter_planning": [
      {
        "chapter_id": 1,
        "scene_sequel_structure": {
          "goal": "角色目标",
          "conflict": "冲突设计",
          "disaster": "灾难结果",
          "reaction": "情绪反应",
          "dilemma": "困境分析",
          "decision": "决策"
        },
        "web_novel_elements": {
          "hooks": ["钩子类型"],
          "emotion_type": "情绪类型",
          "reversal": "反转设计"
        },
        "reasoning": "为什么这样设计这一章"
      }
    ]
  },
  "final_text": "最终生成的文本"
}

3. 微调策略

优先级1: 结构规划能力

  • 训练模型学习MICE线程管理
  • 训练模型学习15节拍时间控制

优先级2: 场景构建能力

  • 训练模型学习Scene-Sequel循环
  • 训练模型学习钩子和反转设计

优先级3: 端到端整合

  • 训练模型从规划到文本的完整流程
  • 训练模型的动态调整能力

4. 一周内可执行方案

Day 1-2: 选择3-5个优质样本进行深度拆解 Day 3-4: 构建包含思考过程的训练数据 Day 5-6: 微调核心模块(优先结构规划) Day 7: 测试和迭代