# AI叙事生成方法论

**来源**: AI叙事生成研究综述  
**调研时间**: 2025年  
**原始链接**: https://www.bing.com/search?q=AI+narrative+generation+chain+of+thought+creative+writing+story+planning+LLM

---

## 一、AI叙事生成的主要方法

### 1. Plan-and-Write方法（规划-写作）

- **核心思路**: 先生成故事规划/大纲，再基于规划生成具体内容
- **优势**: 
  - 允许对生成过程进行引导和多样化控制
  - 更符合人类创作流程
  - 易于实现交互式调整
- **应用**: LLM故事生成的主流范式之一

### 2. 两大生成范式

根据ACL Anthology的调研论文，LLM故事生成存在两个主要范式：

#### 直接生成范式
- 端到端直接产出故事
- 优点: 简单、流畅
- 缺点: 难以控制、长篇易崩

#### 结构化生成范式
- 包含中间规划步骤
- 优点: 可控性强、逻辑连贯
- 缺点: 需要更复杂的训练数据

---

## 二、思维链(Chain of Thought)在创作中的应用

### 1. 故事规划层面

- 将复杂的叙事任务分解为多个思考步骤
- 先构思情节框架、角色设定、冲突设计等中间环节
- 再基于这些中间产出生成最终文本

### 2. 提示工程(Prompt Engineering)

通过精心设计的提示词引导模型展示创作思考过程，可包含：

- **故事结构规划**: 确定整体框架和节拍
- **角色动机分析**: 理解角色行为逻辑
- **情节逻辑推演**: 确保因果关系合理
- **叙事节奏控制**: 调整信息披露速度

### 3. 思维链示例结构

```
用户输入: 写一个复仇故事

思维链展开:
1. [结构规划] 采用三幕结构，主角从受害者到复仇者的转变
2. [角色设定] 主角：曾经善良，现在冷酷；反派：表面正义，实则虚伪
3. [冲突设计] 核心冲突：正义与复仇的界限
4. [节拍规划] 
   - 开场：展示主角的幸福生活
   - 催化剂：反派的背叛导致主角失去一切
   - 中点：主角发现反派的更大阴谋
   - 低点：复仇计划失败，陷入绝境
   - 高潮：主角做出道德选择
5. [文本生成] 基于以上规划生成具体场景...
```

---

## 三、如何训练模型学习创作思考过程

### 1. 数据构建策略

收集包含**中间创作步骤**的训练数据，不仅要有最终故事，还需要：

- **大纲/提纲**: 章节规划、情节要点
- **角色档案**: 人物设定、关系图谱
- **情节规划文档**: 冲突设计、转折点规划
- **修订过程记录**: 从初稿到终稿的演变

### 2. 多阶段训练方法

#### 第一阶段：学习基础叙事能力
- 训练数据: 大量完整故事
- 目标: 学习语言流畅性、基本叙事模式

#### 第二阶段：学习结构化规划能力
- 训练数据: 大纲→故事的配对数据
- 目标: 学习从抽象规划到具体文本的映射

#### 第三阶段：整合规划与写作的端到端训练
- 训练数据: 包含完整思考过程的数据
- 目标: 学习像人类作家一样先思考再写作

### 3. 关键技术要点

#### 引导与多样化(Guiding and Diversifying)
- 平衡创意多样性与主题一致性
- 避免生成过于模板化或过于发散

#### 分层生成架构
- 分别建模宏观结构和微观文本
- 宏观层: 故事整体框架
- 中观层: 章节场景规划
- 微观层: 具体文本生成

#### 反馈循环
- 让模型能根据已生成内容调整后续规划
- 实现动态的故事发展

---

## 四、核心挑战

1. **保持长篇叙事的连贯性**
   - 问题: 百万字级别容易出现前后矛盾
   - 解决方向: 记忆系统、一致性检查

2. **平衡创意性与可控性**
   - 问题: 过度控制失去创意，过度自由失去方向
   - 解决方向: 分层控制、软约束

3. **学习人类作家的隐性思考过程**
   - 问题: 很多创作决策是直觉性的
   - 解决方向: 逆向工程、专家标注

4. **处理复杂的角色关系和情节伏笔**
   - 问题: 多线程管理、长期伏笔回收
   - 解决方向: 知识图谱、线程追踪

---

## 五、实践资源

- **GitHub资源库**: yingpengma/Awesome-Story-Generation
  - 包含最新研究论文和数据集
  
- **LangChain框架**: 
  - 提供story-writing相关的提示工程模板和工具链

---

## 六、关键结论

现代AI叙事生成越来越重视显式建模创作的"思考过程"，通过plan-and-write范式和思维链技术，让模型像人类作家一样先构思再写作，这需要特殊设计的训练数据和多阶段学习策略。

---

## 七、对本项目的启示

### 1. 数据构建方向

**核心任务**: 将优质故事逆向拆解成"思考步骤"

**具体方法**:
- 不仅保留最终文本
- 逆向推导出作者的规划过程
- 标注每个场景/章节的设计意图

### 2. 训练数据格式建议

```json
{
  "story_metadata": {
    "title": "故事标题",
    "genre": "类型",
    "length": "字数"
  },
  "planning_chain": {
    "overall_structure": {
      "mice_type": "主导类型",
      "beat_sheet": "15节拍规划",
      "theme": "核心主题"
    },
    "chapter_planning": [
      {
        "chapter_id": 1,
        "scene_sequel_structure": {
          "goal": "角色目标",
          "conflict": "冲突设计",
          "disaster": "灾难结果",
          "reaction": "情绪反应",
          "dilemma": "困境分析",
          "decision": "决策"
        },
        "web_novel_elements": {
          "hooks": ["钩子类型"],
          "emotion_type": "情绪类型",
          "reversal": "反转设计"
        },
        "reasoning": "为什么这样设计这一章"
      }
    ]
  },
  "final_text": "最终生成的文本"
}
```

### 3. 微调策略

#### 优先级1: 结构规划能力
- 训练模型学习MICE线程管理
- 训练模型学习15节拍时间控制

#### 优先级2: 场景构建能力
- 训练模型学习Scene-Sequel循环
- 训练模型学习钩子和反转设计

#### 优先级3: 端到端整合
- 训练模型从规划到文本的完整流程
- 训练模型的动态调整能力

### 4. 一周内可执行方案

**Day 1-2**: 选择3-5个优质样本进行深度拆解
**Day 3-4**: 构建包含思考过程的训练数据
**Day 5-6**: 微调核心模块（优先结构规划）
**Day 7**: 测试和迭代