# AI叙事生成方法论 **来源**: AI叙事生成研究综述 **调研时间**: 2025年 **原始链接**: https://www.bing.com/search?q=AI+narrative+generation+chain+of+thought+creative+writing+story+planning+LLM --- ## 一、AI叙事生成的主要方法 ### 1. Plan-and-Write方法(规划-写作) - **核心思路**: 先生成故事规划/大纲,再基于规划生成具体内容 - **优势**: - 允许对生成过程进行引导和多样化控制 - 更符合人类创作流程 - 易于实现交互式调整 - **应用**: LLM故事生成的主流范式之一 ### 2. 两大生成范式 根据ACL Anthology的调研论文,LLM故事生成存在两个主要范式: #### 直接生成范式 - 端到端直接产出故事 - 优点: 简单、流畅 - 缺点: 难以控制、长篇易崩 #### 结构化生成范式 - 包含中间规划步骤 - 优点: 可控性强、逻辑连贯 - 缺点: 需要更复杂的训练数据 --- ## 二、思维链(Chain of Thought)在创作中的应用 ### 1. 故事规划层面 - 将复杂的叙事任务分解为多个思考步骤 - 先构思情节框架、角色设定、冲突设计等中间环节 - 再基于这些中间产出生成最终文本 ### 2. 提示工程(Prompt Engineering) 通过精心设计的提示词引导模型展示创作思考过程,可包含: - **故事结构规划**: 确定整体框架和节拍 - **角色动机分析**: 理解角色行为逻辑 - **情节逻辑推演**: 确保因果关系合理 - **叙事节奏控制**: 调整信息披露速度 ### 3. 思维链示例结构 ``` 用户输入: 写一个复仇故事 思维链展开: 1. [结构规划] 采用三幕结构,主角从受害者到复仇者的转变 2. [角色设定] 主角:曾经善良,现在冷酷;反派:表面正义,实则虚伪 3. [冲突设计] 核心冲突:正义与复仇的界限 4. [节拍规划] - 开场:展示主角的幸福生活 - 催化剂:反派的背叛导致主角失去一切 - 中点:主角发现反派的更大阴谋 - 低点:复仇计划失败,陷入绝境 - 高潮:主角做出道德选择 5. [文本生成] 基于以上规划生成具体场景... ``` --- ## 三、如何训练模型学习创作思考过程 ### 1. 数据构建策略 收集包含**中间创作步骤**的训练数据,不仅要有最终故事,还需要: - **大纲/提纲**: 章节规划、情节要点 - **角色档案**: 人物设定、关系图谱 - **情节规划文档**: 冲突设计、转折点规划 - **修订过程记录**: 从初稿到终稿的演变 ### 2. 多阶段训练方法 #### 第一阶段:学习基础叙事能力 - 训练数据: 大量完整故事 - 目标: 学习语言流畅性、基本叙事模式 #### 第二阶段:学习结构化规划能力 - 训练数据: 大纲→故事的配对数据 - 目标: 学习从抽象规划到具体文本的映射 #### 第三阶段:整合规划与写作的端到端训练 - 训练数据: 包含完整思考过程的数据 - 目标: 学习像人类作家一样先思考再写作 ### 3. 关键技术要点 #### 引导与多样化(Guiding and Diversifying) - 平衡创意多样性与主题一致性 - 避免生成过于模板化或过于发散 #### 分层生成架构 - 分别建模宏观结构和微观文本 - 宏观层: 故事整体框架 - 中观层: 章节场景规划 - 微观层: 具体文本生成 #### 反馈循环 - 让模型能根据已生成内容调整后续规划 - 实现动态的故事发展 --- ## 四、核心挑战 1. **保持长篇叙事的连贯性** - 问题: 百万字级别容易出现前后矛盾 - 解决方向: 记忆系统、一致性检查 2. **平衡创意性与可控性** - 问题: 过度控制失去创意,过度自由失去方向 - 解决方向: 分层控制、软约束 3. **学习人类作家的隐性思考过程** - 问题: 很多创作决策是直觉性的 - 解决方向: 逆向工程、专家标注 4. **处理复杂的角色关系和情节伏笔** - 问题: 多线程管理、长期伏笔回收 - 解决方向: 知识图谱、线程追踪 --- ## 五、实践资源 - **GitHub资源库**: yingpengma/Awesome-Story-Generation - 包含最新研究论文和数据集 - **LangChain框架**: - 提供story-writing相关的提示工程模板和工具链 --- ## 六、关键结论 现代AI叙事生成越来越重视显式建模创作的"思考过程",通过plan-and-write范式和思维链技术,让模型像人类作家一样先构思再写作,这需要特殊设计的训练数据和多阶段学习策略。 --- ## 七、对本项目的启示 ### 1. 数据构建方向 **核心任务**: 将优质故事逆向拆解成"思考步骤" **具体方法**: - 不仅保留最终文本 - 逆向推导出作者的规划过程 - 标注每个场景/章节的设计意图 ### 2. 训练数据格式建议 ```json { "story_metadata": { "title": "故事标题", "genre": "类型", "length": "字数" }, "planning_chain": { "overall_structure": { "mice_type": "主导类型", "beat_sheet": "15节拍规划", "theme": "核心主题" }, "chapter_planning": [ { "chapter_id": 1, "scene_sequel_structure": { "goal": "角色目标", "conflict": "冲突设计", "disaster": "灾难结果", "reaction": "情绪反应", "dilemma": "困境分析", "decision": "决策" }, "web_novel_elements": { "hooks": ["钩子类型"], "emotion_type": "情绪类型", "reversal": "反转设计" }, "reasoning": "为什么这样设计这一章" } ] }, "final_text": "最终生成的文本" } ``` ### 3. 微调策略 #### 优先级1: 结构规划能力 - 训练模型学习MICE线程管理 - 训练模型学习15节拍时间控制 #### 优先级2: 场景构建能力 - 训练模型学习Scene-Sequel循环 - 训练模型学习钩子和反转设计 #### 优先级3: 端到端整合 - 训练模型从规划到文本的完整流程 - 训练模型的动态调整能力 ### 4. 一周内可执行方案 **Day 1-2**: 选择3-5个优质样本进行深度拆解 **Day 3-4**: 构建包含思考过程的训练数据 **Day 5-6**: 微调核心模块(优先结构规划) **Day 7**: 测试和迭代