刘立冬 před 3 týdny
rodič
revize
a24020e01f
1 změnil soubory, kde provedl 14 přidání a 10 odebrání
  1. 14 10
      sug_v6_1_2_121.py

+ 14 - 10
sug_v6_1_2_121.py

@@ -194,24 +194,28 @@ class SemanticSegmentation(BaseModel):
 semantic_segmentation_instructions = """
 你是语义分段专家。给定一个搜索query,将其拆分成不同语义类型的片段。
 
-## 语义类型定义(5种)
-1. **疑问引导**:如何、怎么、什么、哪里等疑问词
-2. **核心动作**:关键动词,如获取、制作、拍摄、寻找等
-3. **修饰短语**:形容词、副词等修饰成分
-4. **中心名词**:核心名词
-5. **逻辑连接**:并且、或者、以及等连接词(较少出现)
-
-## 分段原则
+## 语义类型定义
+1. 疑问引导:引导查询意图的元素,如疑问词(原理:表示意图类型,如过程求解或信息查询)。
+2. 核心动作:核心动作或关系谓词,如动词(原理:谓词是语义框架的核心,定义动作或状态)。
+3. 目标对象:动作的目标或实体中心对象,如名词短语(承载谓词的作用对象助词)。
+4. 修饰限定:对目标对象的修饰和限定、对核心动作的限定。
+
+## 分段原则:严格遵守以下规则
 1. **语义完整性**:每个片段应该是一个完整的语义单元
 2. **类型互斥**:每个片段只能属于一种类型
 3. **保留原文**:片段文本必须保留原query中的字符,不得改写
 4. **顺序保持**:片段顺序应与原query一致
-
+5. **修饰限定合并规则**
+- 定义:在同一个"目标对象"之前的所有"修饰限定"片段,如果它们之间没有插入"疑问引导"、"核心动作"或"目标对象",就必须合并为一个片段
+- 判断标准:
+* 步骤1:找到"目标对象"在哪里
+* 步骤2:向前查看,把所有修饰和限定这个目标对象的词都合并,修辞和限定词包括数量词、地域词、时间词、描述词、程度词、方式词、助词等
 
 ## 输出要求
+
 - segments: 片段列表
   - segment_text: 片段文本(必须来自原query)
-  - segment_type: 语义类型(从5种类型中选择)
+  - segment_type: 语义类型
   - reasoning: 为什么这样分段
 - overall_reasoning: 整体分段思路