Pārlūkot izejas kodu

结构化处理增加字段

jihuaqiang 2 nedēļas atpakaļ
vecāks
revīzija
8fabdc56b8
3 mainītis faili ar 5 papildinājumiem un 4 dzēšanām
  1. 2 2
      prompt/structure.md
  2. 2 1
      tools/agent_tools.py
  3. 1 1
      tools/structure.py

+ 2 - 2
prompt/structure.md

@@ -17,7 +17,7 @@
 1.  **识别主标题:** 使用JSON中的 `title` 字段作为一级标题 (`#`)。
 2.  **处理引言:** 将 `body_text` 的内容作为文章的引言或开场白。如果内容不完整,忠实呈现原文即可。
 3.  **分析并整合核心内容(核心任务):**
-    -   通读 `images_comprehension` 数组中的所有文本,理解其整体内容结构。判断这是“步骤式教程”、“对比清单”还是其他类型。
+    -   通读 `images_comprehension` 和 `videos_comprehension` 数组中的所有文本,理解其整体内容结构。判断这是“步骤式教程”、“对比清单”还是其他类型。
     -   识别出核心的类别或步骤标题(如“第一步”、“喵星人”、“汪星人”等)。
     -   遍历所有输入,将所有相关的信息点(包括其详细描述)归类到相应的主标题之下。确保将分散在多处的内容合并到一起。
     -   对于重复出现的主标题(如“屁股社交”),如果其描述性内容不同,则应作为独立条目保留,以确保信息的完整性。
@@ -27,4 +27,4 @@
 5.  **处理结尾和标签(如果存在):** 如果输入内容包含明确的结尾或 `#话题标签`,则将它们放在文档的末尾。
 
 ## 输入
-用户将提供一个包含 `title`、`body_text` 和 `images_comprehension` 的JSON对象。
+用户将提供一个包含 `title`、`body_text` 和 `images_comprehension`, `videos_comprehension` 的JSON对象。

+ 2 - 1
tools/agent_tools.py

@@ -404,7 +404,8 @@ class StructureTool:
             structure_input = {
                 "title": content_data.get('title', ''),
                 "body_text": content_data.get('content', ''),
-                "images_comprehension": content_data.get('images', [])
+                "images_comprehension": content_data.get('images', []),
+                "videos_comprehension": content_data.get('videos', [])
             }
             
             # 调用结构化处理器

+ 1 - 1
tools/structure.py

@@ -68,7 +68,7 @@ class StructureProcessor:
             prompt = custom_prompt or self.system_prompt
             
             # 构建完整的提示词
-            full_prompt = f"{prompt}\n\n## 输入\n用户将提供一个包含 `title`、`body_text` 和 `images_comprehension` 的JSON对象。\n\n请处理以下内容:\n{content_str}"
+            full_prompt = f"{prompt}\n\n## 输入\n用户将提供一个包含 `title`、`body_text`、`images_comprehension` 和 `videos_comprehension` 的JSON对象。\n\n请处理以下内容:\n{content_str}"
             
             result = self.processor.process(content_str, full_prompt)
             return result