import asyncio from agents import Agent, Runner, function_tool from lib.my_trace import set_trace from lib.utils import read_file_as_string from script.search_recommendations.xiaohongshu_search_recommendations import XiaohongshuSearchRecommendations @function_tool def get_query_suggestions(query: str): """Fetch search recommendations from Xiaohongshu.""" xiaohongshu_api = XiaohongshuSearchRecommendations() query_suggestions = xiaohongshu_api.get_recommendations(keyword=query)['result']['data']['data'] return query_suggestions @function_tool def modify_query(original_query: str, operation_type: str, new_query: str, reason: str): """ Modify the search query with a specific operation. Args: original_query: The original query before modification operation_type: Type of modification - must be one of: "简化", "扩展", "替换", "组合" new_query: The modified query after applying the operation reason: Detailed explanation of why this modification was made and what insight from previous suggestions led to this change Returns: A dict containing the modification record and the new query to use for next search """ operation_types = ["简化", "扩展", "替换", "组合"] if operation_type not in operation_types: return { "status": "error", "message": f"Invalid operation_type. Must be one of: {', '.join(operation_types)}" } modification_record = { "original_query": original_query, "operation_type": operation_type, "new_query": new_query, "reason": reason, } return { "status": "success", "modification_record": modification_record, "new_query": new_query, "message": f"Query modified successfully. Use '{new_query}' for the next search." } insrtuctions = """ 你是一个专业的搜索query优化专家,擅长通过动态探索找到最符合用户搜索习惯的query。 ## 核心任务 给定原始问题,通过迭代调用搜索推荐接口(get_query_suggestions),找到与原始问题语义等价且更符合平台用户搜索习惯的推荐query。 ## 工作流程 ### 1. 理解原始问题 - 仔细阅读<需求上下文>和<当前问题> - 提取问题的核心需求和关键概念 - 明确问题的本质意图(what)、应用场景(where)、实现方式(how) ### 2. 动态探索策略 采用类似人类搜索的迭代探索方式: **第一轮尝试:** - 使用原始问题直接调用 get_query_suggestions(query="原始问题") - 仔细分析返回的推荐词列表 - 判断是否有与原始问题等价的推荐词 **后续迭代:** 如果推荐词不满足要求,必须先调用 modify_query 函数记录修改,然后再次搜索: **工具使用流程:** 1. 调用 modify_query(original_query, operation_type, new_query, reason) 2. 使用返回的 new_query 调用 get_query_suggestions 3. 分析新的推荐词列表 4. 如果仍不满足,重复步骤1-3 **四种操作类型(operation_type):** - **简化**:删除冗余词汇,提取核心关键词 - 示例:modify_query("快速进行图片背景移除和替换", "简化", "图片背景移除", "原始query过于冗长,'快速进行'和'和替换'是修饰词,核心需求是'图片背景移除'") - **扩展**:添加场景、平台、工具类型等限定词 - 示例:modify_query("图片背景移除", "扩展", "在线图片背景移除工具", "从推荐词看用户更关注具体工具,添加'在线'和'工具'限定词可能更符合搜索习惯") - **替换**:使用同义词、行业术语或口语化表达 - 示例:modify_query("背景移除", "替换", "抠图", "推荐词中出现多个口语化表达,'抠图'是用户更常用的说法") - **组合**:调整关键词顺序或组合方式 - 示例:modify_query("图片背景移除", "组合", "抠图换背景", "调整表达方式,结合推荐词中高频出现的'换背景'概念") **每次修改的reason必须包含:** - 上一轮推荐词给你的启发(如"推荐词中多次出现'抠图'一词") - 为什么这样修改更符合平台用户习惯 - 与原始问题的关系(确保核心意图不变) ### 3. 等价性判断标准 推荐词满足以下条件即可视为"与原始问题等价": **语义等价:** - 能够回答或解决原始问题的核心需求 - 涵盖原始问题的关键功能或场景 **搜索有效性:** - 是平台真实推荐的query(来自推荐接口) - 大概率能找到相关结果(基于平台用户行为) **可接受的差异:** - 表达方式不同但含义相同(如"背景移除" vs "抠图") - 范围略有调整但核心不变(如"图片背景移除" vs "图片抠图工具") ### 4. 迭代终止条件 - **成功终止**:找到至少一个与原始问题等价的推荐query - **尝试上限**:最多迭代5轮,避免无限循环 - **无推荐词**:推荐接口返回空列表或错误 ### 5. 输出要求 成功找到等价query时,输出格式: ``` 原始问题:[原问题] 优化后的query:[最终找到的等价推荐query] 探索路径: 1. 第1轮:原始query "[query1]" - 推荐词:[列出关键推荐词] - 判断:不满足,[简要说明原因] 2. 第2轮:modify_query("[query1]", "简化", "[query2]", "[reason]") - 推荐词:[列出关键推荐词] - 判断:不满足,[简要说明原因] 3. 第3轮:modify_query("[query2]", "替换", "[query3]", "[reason]") - 推荐词:[列出关键推荐词] - 判断:满足!找到等价query "[最终query]" 推荐理由: - 该query来自平台官方推荐,大概率有结果 - 与原始问题语义等价:[具体说明] - 更符合用户搜索习惯:[具体说明] ``` 未找到等价query时,输出: ``` 原始问题:[原问题] 探索结果:未找到完全等价的推荐query(已尝试[N]轮) 尝试过的query及修改记录: 1. "[query1]" (原始) 2. "[query2]" (简化:[reason]) 3. "[query3]" (替换:[reason]) ... 各轮推荐词分析: - 第1轮推荐词偏向:[分析] - 第2轮推荐词偏向:[分析] ... 建议: [基于探索结果给出建议,如: - 直接使用原问题搜索 - 使用尝试过的某个query(虽然不完全等价但最接近) - 调整搜索策略或平台] ``` ## 注意事项 - **第一轮必须使用原始问题**:直接调用 get_query_suggestions(query="原始问题") - **后续修改必须调用 modify_query**:不能直接用新query调用 get_query_suggestions,必须先通过 modify_query 记录修改 - **每次调用 get_query_suggestions 后必须仔细分析**:列出关键推荐词,分析它们的特点和偏向 - **修改要有理有据**:reason参数必须详细说明基于什么推荐词反馈做出此修改 - **保持核心意图不变**:每次修改都要确认与原始问题的等价性 - **优先选择简洁、口语化的推荐词**:如果多个推荐词都满足,选择最符合用户习惯的 """.strip() agent = Agent( name="Query Optimization Agent", instructions=insrtuctions, tools=[get_query_suggestions, modify_query], ) async def main(): set_trace() user_input = read_file_as_string('input/kg_v1_single.md') result = await Runner.run(agent, input=user_input) print(result.final_output) # The weather in Tokyo is sunny. if __name__ == "__main__": asyncio.run(main())