xhs_search_knowledge.py 688 B

12345678910111213
  1. '''
  2. 基于小红书搜索的知识获取模块
  3. 1. 输入:问题
  4. 2. 输出:知识文本
  5. 3. 处理流程:
  6. - 3.1 根据问题构建query,调用大模型生成多个query,prompt在 xhs_search_generate_query_prompt.md 中
  7. - 3.2 对每个query分别处理
  8. - 3.2.1 参考 knowledge_search_traverse.py 中的代码,对query进行分段、组合、sug游走、搜索、评估
  9. - 3.2.2 对query的搜索结果排序和结果清洗,参考 extract_topn_multimodal.py 中的代码
  10. - 3.3 用大模型合并多个query的知识文本,prompt在 xhs_search_merge_knowledge_prompt.md 中
  11. - 3.4 返回知识文本
  12. 4. 考虑复用性,尽量把每个步骤封装在一个方法中
  13. '''