jihuaqiang
/
video-comprehension


			
				
					
						
						
							123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106107108109110111112113114115116117118119120121122123124125126127128129130131132133134135136137138139140141142143144145146147148149150151152153154155156157158159160161162163
							# 视频选题与要点理解

VIDEO_TOPIC_ANALYSIS_PROMPT = '''# 任务说明：
你是一位短视频结构化分析专家。请严格按以下要求处理输入视频：

# 分析规范：
1. 使用标准JSON格式输出，遵循以下规则：
   - 所有键名使用英文双引号包裹
   - 字符串值使用中文双引号""
   - 禁止换行符、Markdown符号
   - 数值类目用字符串表示

2. 分析维度：
   │
   ├── 选题（30字）
   │    └── 突出视频核心矛盾点，示例："揭露网红奶茶店卫生隐患"
   │
   ├── 内容大纲（200字）
   │    └── 按「黄金三幕式」结构：
   │        1) 冲突引入（00:00-00:30）
   │        2) 证据展开（00:30-02:00） 
   │        3) 结论冲击（02:00-结尾）
   │
   └── 内容要点
        └── 按吸引力强度排序：
            "1. 现场实拍过期原料特写镜头（00:01:45）
             2. 员工偷拍工作流程（00:03:20）
             3. 专家访谈数据对比（00:04:10）"

# 输出示例：
{
  "选题": "揭秘网红零食代工黑幕",
  "内容大纲": "视频首先展示代工厂合规车间环境（00:00:15-00:01:30），随后突袭检查发现原料过期问题（00:01:45-00:03:20），最后通过员工采访揭露生产日期篡改流程（00:04:10-00:05:50）",
  "内容要点": [
    "1. 车间环境与原料仓库的视觉反差",
    "2. 特写镜头展示虫蛀原料袋（00:02:15）",
    "3. 隐蔽摄像头拍摄的灌装过程（00:04:30）"
  ]
}

请现在开始分析：'''

VIDEO_TEXT_EXTRACTION_PROMPT = '''# 结构化文本提取指令
你是一位专业视频文本转录员，请严格按以下要求处理：

## 输入规范：
视频文件：需分析完整音画内容

## 处理规则：
1. **完整性要求**：
   - 提取所有中文文本（含口播/字幕/图形文字/背景对话）
   - 保留重复内容（如广告slogan重复出现）
   - 时间戳精确到毫秒（例：00:01:23.456）

2. **格式规范**：
   ├── 禁用Markdown符号
   ├── 键名用英文双引号包裹
   ├── 字符串值用中文双引号""
   └── 时间区间格式：HH:MM:SS.msmsms

## 输出示例：
{
  "视频文本内容": [
    {
      "文本序号": "文本1",
      "时间区间": "00:00:01.230 - 00:00:03.780",
      "文本内容": "【开场字幕】揭秘网红产品背后的真相"
    },
    {
      "文本序号": "文本2",
      "时间区间": "00:00:04.500 - 00:00:06.200",
      "文本内容": "旁白：我们随机购买了市面销量Top3的产品"
    }
  ]
}

## 特殊处理：
- 背景模糊文字标注[模糊]
- 重叠文本用「」分隔
- 非中文内容标注[非中文字幕]

立即开始分析：'''

VIDEO_SEGMENT_ANALYSIS_PROMPT = '''# 任务说明：你是一位短视频分析专家。请根据输入视频内容，从整体结构出发，分析视频的分段逻辑与关键时间点。

# 分析要求如下：
一、视频段落分析说明：
请根据视频的**整体含义与情节发展**对视频进行合理分段；每个段落的划分应基于"文本结构变化"、"画面风格/节奏转折"、"场景人物行为的转变"等可感知的逻辑；划分段落时注意合并相似含义、场景、人物行为重复的片段，避免机械过度分段；段落并非镜头单位，且需有明确的"结构性意义"；在正式输出段落数据前，需先提供整体结构与分段策略说明。

二、关键时间点识别：
识别视频中关键性内容或节点的时间点，如：情节反转、高潮、信息核心落点、结构转折等；输出格式必须为标准时间格式，精确到**毫秒**（如 00:01:10.234）。

输出格式要求：
所有内容必须为**中文**；严格按照以下 JSON 格式输出；输出结果中不得遗漏字段，不得使用代词、模糊表达；请明确标注段落序号、时间点序号，保持结构清晰有序；输出 JSON 结构如下：
{
  "视频整体结构与整体分段思路": "string，分析视频整体结构走向与划分段落的原则与策略",
  "段落": [
    {
      "段落序号": "第1段",
      "段落时间轴": "00:00:00.000 - 00:00:30.500",
      "段落类型": "开场介绍 / 情节铺垫 / 高潮段落 / 情绪转折 / 结尾总结 等",
      "段落描述": "string，对该段落发生的事件、出现的人物、画面与内容进行概括描述",
      "段落含义及分段原因": "string，解释该段的结构意义与为何从此处分段"
    }
  ],
  "关键时间点": [
    {
      "时间点序号": "时间点1",
      "精确时间": "00:01:10.234",
      "时间点描述": "string，描述该时间点对应的事件或结构意义"
    }
  ]
}'''

HOOK_EXTRACTION_PROMPT = '''# 任务角色说明：
你是一个面向老年人用户的视频平台智能AI助手，当前任务是基于视频内容，模拟中老年人在观看视频过程中的真实观看心理和信息需求，生成具体、真实、有好奇心驱动的互动问题，并配置相应的钩子话术和出现时间。

# 输入数据结构：
视频选题与要点理解对应内容：{summary}
视频完整文本提取对应内容：{detail}
视频分段与时间点分析：{timeline}

# 任务目标：
你需要基于以上视频分析信息，从中老年用户的观看视角出发，构思他们可能在观看该视频过程中**产生的具体信息需求问题**，并对每个问题进行详细说明。输出应包括以下维度：
1. 需求详细query：清晰、具体、真实的问题，不泛泛而谈，必须与视频选题和视频内容关键点强相关；
2. 需求分类：如 旅游类 / 健康类 / 情感类 / 科普类 / 家庭类 / 技巧类 / 新闻类 / 生活常识类等；
3. 推测出该点需求的原因：从用户的情感、场景、注意力轨迹出发，说明为什么该问题会引起兴趣；
4. 需求钩子话术：在用户观看视频过程中弹出的引导文案，**11字内**，需具有吸引力和点击驱动性；
5. 需求钩子出现时间：该钩子弹出时的时间点，需**精确到秒**，格式为：hh:mm:ss
6. 需求排序序号：请根据"用户兴趣强度"与"视频关键程度"对问题进行排序，按兴趣优先级编号（非时间顺序）

输出格式要求：
- 所有字段都必须有值；
- 输出内容必须为**中文**；
- 时间格式为严格标准格式：hh:mm:ss；
- 输出结果必须为标准 JSON；
- 输出字段中的内容必须使用**双引号**，不能使用单引号；
- 严禁输出与任务无关的内容（如提示语、注释、范例等）；'''

HOOK_EXTRACTION_PROMPT_V2 = '''# 任务角色说明：
你是一个面向老年人用户的视频平台智能AI助手，当前任务是基于视频内容，模拟中老年人在观看视频过程中的真实观看心理和信息需求，生成具体、真实、有好奇心驱动的互动问题，并配置相应的钩子话术和出现时间。

# 输入数据结构：
视频选题与要点理解对应内容：{summary}
视频完整文本提取对应内容：{detail}
视频分段与时间点分析：{timeline}

# 任务目标：
你需要基于以上视频分析信息，从中老年用户的观看视角出发，构思他们可能在观看该视频过程中**产生的具体信息需求问题**，并对每个问题进行详细说明。输出应包括以下维度：
1. 需求详细query：清晰、具体、真实的问题，不泛泛而谈，必须与视频选题强相关；
2. 需求分类：如 旅游类 / 健康类 / 情感类 / 科普类 / 家庭类 / 技巧类 / 新闻类 / 生活常识类等；
3. 推测出该点需求的原因：从用户的情感、场景、注意力轨迹出发，说明为什么该问题会引起兴趣；
4. 需求钩子话术：在用户观看视频过程中弹出的引导文案，**11字内**，需具有吸引力和点击驱动性；
5. 需求钩子出现时间：该钩子弹出时的时间点，需**精确到秒**，格式为：hh:mm:ss
6. 需求排序序号：请根据"用户兴趣强度"与"视频关键程度"对问题进行排序，按兴趣优先级编号（非时间顺序）

输出格式要求：
- 所有字段都必须有值；
- 输出内容必须为**中文**；
- 时间格式为严格标准格式：hh:mm:ss；
- 输出结果必须为标准 JSON；
- 输出字段中的内容必须使用**双引号**，不能使用单引号；
- 严禁输出与任务无关的内容（如提示语、注释、范例等）；'''