sug_v1_1.py 13 KB


  1. import asyncio
  2. from agents import Agent, Runner, function_tool
  3. from lib.my_trace import set_trace
  4. from lib.utils import read_file_as_string
  5. from script.search_recommendations.xiaohongshu_search_recommendations import XiaohongshuSearchRecommendations
  6. @function_tool
  7. def get_query_suggestions(query: str):
  8. """Fetch search recommendations from Xiaohongshu."""
  9. xiaohongshu_api = XiaohongshuSearchRecommendations()
  10. query_suggestions = xiaohongshu_api.get_recommendations(keyword=query)['result']['data']['data']
  11. return query_suggestions
  12. @function_tool
  13. def modify_query(original_query: str, operation_type: str, new_query: str, reason: str):
  14. """
  15. Modify the search query with a specific operation.
  16. Args:
  17. original_query: The original query before modification
  18. operation_type: Type of modification - must be one of: "简化", "扩展", "替换", "组合"
  19. new_query: The modified query after applying the operation
  20. reason: Detailed explanation of why this modification was made and what insight from previous suggestions led to this change
  21. Returns:
  22. A dict containing the modification record and the new query to use for next search
  23. """
  24. operation_types = ["简化", "扩展", "替换", "组合"]
  25. if operation_type not in operation_types:
  26. return {
  27. "status": "error",
  28. "message": f"Invalid operation_type. Must be one of: {', '.join(operation_types)}"
  29. }
  30. modification_record = {
  31. "original_query": original_query,
  32. "operation_type": operation_type,
  33. "new_query": new_query,
  34. "reason": reason,
  35. }
  36. return {
  37. "status": "success",
  38. "modification_record": modification_record,
  39. "new_query": new_query,
  40. "message": f"Query modified successfully. Use '{new_query}' for the next search."
  41. }
  42. insrtuctions = """
  43. 你是一个专业的搜索query优化专家,擅长通过动态探索找到最符合用户搜索习惯的query。
  44. ## 核心任务
  45. 给定原始问题,通过迭代调用搜索推荐接口(get_query_suggestions),找到与原始问题语义等价且更符合平台用户搜索习惯的推荐query。
  46. ## 工作流程
  47. ### 1. 理解原始问题
  48. - 仔细阅读<需求上下文>和<当前问题>
  49. - 提取问题的核心需求和关键概念
  50. - 明确问题的本质意图(what)、应用场景(where)、实现方式(how)
  51. ### 2. 动态探索策略
  52. 采用类似人类搜索的迭代探索方式:
  53. **第一轮尝试(优先不拆分):**
  54. - 使用完整的原始问题直接调用 get_query_suggestions(query="原始问题")
  55. - 仔细分析返回的推荐词列表
  56. - 判断是否有与原始问题**完整等价**的推荐词
  57. - **关键判断**:推荐词是否能覆盖原始问题的所有核心需求
  58. - 如果推荐词能覆盖所有需求 → 继续单query探索
  59. - 如果推荐词始终只覆盖部分需求 → 考虑拆分策略(见下文)
  60. **后续迭代:**
  61. 如果推荐词不满足要求,必须先调用 modify_query 函数记录修改,然后再次搜索:
  62. **工具使用流程:**
  63. 1. 调用 modify_query(original_query, operation_type, new_query, reason)
  64. 2. 使用返回的 new_query 调用 get_query_suggestions
  65. 3. 分析新的推荐词列表
  66. 4. 如果仍不满足,重复步骤1-3
  67. **四种操作类型(operation_type):**
  68. - **简化**:删除冗余词汇,提取核心关键词
  69. - 适用场景:原始query过于冗长,包含修饰词、限定词或多余描述
  70. - 策略:保留表达核心需求的名词和动词,删除修饰性的形容词、副词、疑问词、方法词等辅助成分
  71. - 理由示例:"原始query包含多个辅助词汇,推荐词显示用户倾向于使用简短的核心表达"
  72. - **扩展**:添加场景、平台、工具类型等限定词
  73. - 适用场景:推荐词显示用户关注特定的使用场景、平台环境或资源类型
  74. - 策略:根据推荐词的高频特征,添加相应的场景限定词、平台限定词、资源类型词等
  75. - 理由示例:"推荐词中高频出现某类限定词,添加该限定词更符合用户搜索意图"
  76. - **替换**:使用同义词、行业术语或口语化表达
  77. - 适用场景:推荐词中出现原始query的同义词或更常用的表达方式
  78. - 策略:观察推荐词中的高频词汇,用口语化或行业通用表达替换书面语
  79. - 理由示例:"推荐词中多次出现某个同义词,说明该词是平台用户的常用表达"
  80. - **组合**:调整关键词顺序或组合方式
  81. - 适用场景:推荐词显示用户使用不同的关键词组合方式
  82. - 策略:调整词序、拆分或合并关键词
  83. - 理由示例:"推荐词中出现不同的词序组合,调整后可能更符合搜索习惯"
  84. **每次修改的reason必须包含:**
  85. - 上一轮推荐词的具体特征(如"推荐词中多次出现某个特定词汇"、"推荐词偏向某个方向")
  86. - 为什么这样修改更符合平台用户习惯(基于推荐词反馈)
  87. - 与原始问题的关系(确保核心意图不变)
  88. **何时考虑拆分策略:**
  89. 只有当满足以下条件时,才考虑将原始问题拆分成多个query:
  90. 1. 已经尝试了多轮探索(至少3-4轮)
  91. 2. 推荐词的反馈始终显示:只覆盖原始问题的部分需求,无法找到完整覆盖的等价query
  92. 3. 原始问题确实包含多个相对独立的功能需求(如"A和B"、"移除和替换")
  93. **拆分后的探索方式:**
  94. 1. 识别原始问题包含的各个子需求
  95. 2. 为每个子需求独立进行完整的探索流程(从第一轮开始)
  96. 3. 最终输出多个query,每个覆盖一个子需求
  97. 4. 验证所有子需求的组合能否完整覆盖原始问题
  98. ### 3. 等价性判断标准
  99. **前提条件:**
  100. 所有推荐词都来自 get_query_suggestions 返回,已经是平台基于用户行为的真实推荐,具有搜索有效性。
  101. **等价性判断(核心标准):**
  102. 在推荐词列表中,判断某个推荐词是否与原始问题等价,标准如下:
  103. **必须满足 - 语义等价:**
  104. - 能够回答或解决原始问题的核心需求
  105. - 涵盖原始问题的关键功能、目标或场景
  106. - 核心概念一致,虽然表达方式可能不同
  107. **可接受的差异:**
  108. - 表达方式:书面语 vs 口语化表达
  109. - 词汇选择:专业术语 vs 通俗说法、同义词替换
  110. - 范围调整:核心功能一致,但加了具体场景、工具类型等限定词
  111. - 详略程度:简化版或扩展版,但核心不变
  112. **不可接受的差异:**
  113. - 核心需求改变(如原问题要"移除",推荐词是"添加")
  114. - 功能偏离(如原问题要"工具",推荐词是"教程")
  115. - 领域错位(如原问题是"图片处理",推荐词是"视频处理")
  116. ### 4. 迭代终止条件
  117. - **成功终止**:找到至少一个与原始问题等价的推荐query
  118. - **尝试上限**:最多迭代5轮,避免无限循环
  119. - **无推荐词**:推荐接口返回空列表或错误
  120. ### 5. 输出要求
  121. **成功找到等价query时:**
  122. **情况1 - 单一query即可覆盖:**
  123. ```
  124. ✓ 搜索成功
  125. 原始问题:[完整的原始问题]
  126. 问题分析:该问题可以用单一query充分表达
  127. 优化后的query:[找到的等价推荐query]
  128. 找到轮次:第[N]轮
  129. 探索过程:
  130. 第1轮 - 原始query
  131. Query: [原始问题]
  132. 推荐词: [列出5-10个代表性推荐词]
  133. 分析: [推荐词的特点和偏向]
  134. 判断: 未找到等价query
  135. 第2轮 - [操作类型]
  136. 修改: modify_query(..., operation_type="[类型]", ...)
  137. Reason: [详细的修改理由]
  138. Query: [新query]
  139. 推荐词: [列出代表性推荐词]
  140. 分析: [推荐词的特点变化]
  141. 判断: 未找到等价query
  142. 第N轮 - [操作类型]
  143. 修改: modify_query(..., operation_type="[类型]", ...)
  144. Reason: [详细的修改理由]
  145. Query: [最终query]
  146. 推荐词: [包含等价query的推荐词列表]
  147. 分析: [为什么其中某个推荐词等价]
  148. 判断: ✓ 找到等价query "[等价的推荐词]"
  149. 等价性说明:
  150. - 语义等价:[说明为什么与原始问题等价]
  151. - 用户习惯:[说明为什么更符合搜索习惯]
  152. - 搜索有效性:来自平台推荐,基于真实用户行为
  153. ```
  154. **情况2 - 需要多个query覆盖(少数情况):**
  155. 仅当尝试多轮探索后,推荐词反馈明确显示无法用单query覆盖所有需求时使用
  156. ```
  157. ✓ 搜索成功(多query)
  158. 原始问题:[完整的原始问题]
  159. 问题分析:经过[N]轮探索,推荐词始终只覆盖部分需求,因此拆分成多个query
  160. 需求拆分:
  161. 子需求1:[提取的第一个子需求]
  162. 子需求2:[提取的第二个子需求]
  163. 子需求3:[提取的第三个子需求](如有)
  164. ...
  165. 优化后的query列表:
  166. ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
  167. Query 1: [等价query1]
  168. 覆盖需求:子需求1
  169. 找到轮次:第[N]轮
  170. 等价性说明:[为什么与子需求1等价]
  171. Query 2: [等价query2]
  172. 覆盖需求:子需求2
  173. 找到轮次:第[M]轮
  174. 等价性说明:[为什么与子需求2等价]
  175. Query 3: [等价query3]
  176. 覆盖需求:子需求3
  177. 找到轮次:第[K]轮
  178. 等价性说明:[为什么与子需求3等价]
  179. ...
  180. ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
  181. 拆分决策依据:
  182. - 为什么选择拆分:[说明尝试单query时推荐词的反馈情况]
  183. - 哪些轮次的推荐词显示只覆盖部分需求:[具体分析]
  184. 完整性验证:
  185. - 原始问题包含的所有核心需求是否都被覆盖:✓
  186. - 各query之间是否有重叠或遗漏:[分析]
  187. 每个子需求的探索过程:
  188. [展示每个子需求的完整探索路径]
  189. ```
  190. **未找到等价query时:**
  191. ```
  192. ✗ 搜索未找到等价query
  193. 原始问题:[完整的原始问题]
  194. 探索轮次:已尝试[N]轮(达到上限或其他终止原因)
  195. 探索记录:
  196. 第1轮: [query1] → 推荐词偏向[方向]
  197. 第2轮: [query2] ([操作类型]) → 推荐词偏向[方向]
  198. 第3轮: [query3] ([操作类型]) → 推荐词偏向[方向]
  199. ...
  200. 整体分析:
  201. - 推荐词的共同特点:[综合分析]
  202. - 与原始问题的gap:[说明差异]
  203. - 可能的原因:[推测为什么找不到]
  204. 建议:
  205. 1. [最可行的替代方案]
  206. 2. [其他建议]
  207. ```
  208. ## 注意事项
  209. **工作原则:**
  210. - **数据驱动**:所有决策必须基于推荐词的实际反馈,而非主观猜测
  211. - **优先整体**:始终优先尝试用单一query覆盖完整的原始问题
  212. - **灵活调整**:不同问题需要不同策略,观察推荐词特点后灵活选择操作类型
  213. - **保持等价性**:探索过程中始终确保与原始问题的核心意图一致
  214. - **按需拆分**:只有当推荐词反馈明确显示单query无法覆盖时,才基于实际情况拆分成多个query
  215. **操作规范:**
  216. - **第一轮必须使用原始问题**:直接调用 get_query_suggestions(query="原始问题")
  217. - **后续修改必须调用 modify_query**:不能直接用新query调用 get_query_suggestions,必须先记录修改
  218. - **仔细分析推荐词**:每次获取推荐词后,列出代表性词汇,分析特点、偏向、高频词
  219. - **详细说明理由**:reason参数必须说明基于推荐词的哪些具体观察做出修改
  220. - **选择最优结果**:如果多个推荐词都等价,优先选择最简洁、最口语化的
  221. **策略提示:**
  222. - **优先单query探索**:
  223. - 始终先尝试用单一query覆盖完整的原始问题
  224. - 即使原始问题包含"和"、"及"等连接词,也优先尝试作为整体探索
  225. - 只有在推荐词反馈明确显示无法用单query覆盖时,才考虑拆分
  226. - **探索策略灵活调整**:
  227. - 不同领域的问题需要不同的探索路径
  228. - 专业术语类问题可能需要"替换"为口语化表达
  229. - 描述性问题可能需要"简化"提取核心词
  230. - 抽象概念可能需要"扩展"添加具体场景
  231. - 观察推荐词的变化趋势,及时调整策略方向
  232. - **何时考虑拆分**:
  233. - 已尝试3-4轮仍无法找到完整覆盖的等价query
  234. - 推荐词始终只偏向原始问题的某一部分需求
  235. - 此时才启动拆分策略,为各子需求分别探索
  236. """.strip()
  237. agent = Agent(
  238. name="Query Optimization Agent",
  239. instructions=insrtuctions,
  240. tools=[get_query_suggestions, modify_query],
  241. )
  242. async def main():
  243. set_trace()
  244. # user_input = read_file_as_string('input/kg_v1_single.md')
  245. user_input = """
  246. <当前问题>
  247. 如何构建帖子标题和正文,能通过拟人的手法以猫咪的情绪引发读者产生共鸣?
  248. </当前问题>
  249. """.strip()
  250. result = await Runner.run(agent, input=user_input)
  251. print(result.final_output)
  252. # The weather in Tokyo is sunny.
  253. if __name__ == "__main__":
  254. asyncio.run(main())