yangxiaohui 55db523523 add 1 неделя назад
..
analysis 9728da6bec feat: 统一缓存路径管理,默认使用 ~/cache 1 неделя назад
data_processing 8b13ebe897 feat: 添加key_points空值检查脚本 1 неделя назад
detail 9728da6bec feat: 统一缓存路径管理,默认使用 ~/cache 1 неделя назад
search 9728da6bec feat: 统一缓存路径管理,默认使用 ~/cache 1 неделя назад
search_recommendations 9728da6bec feat: 统一缓存路径管理,默认使用 ~/cache 1 неделя назад
search_tagwords 9728da6bec feat: 统一缓存路径管理,默认使用 ~/cache 1 неделя назад
.DS_Store fcadbef523 add search 2 недель назад
README.md fcadbef523 add search 2 недель назад
__init__.py fcadbef523 add search 2 недель назад
get_tools_list.py 9728da6bec feat: 统一缓存路径管理,默认使用 ~/cache 1 неделя назад
utils.py 55db523523 add 1 неделя назад

README.md

搜索脚本文档

本目录包含各平台的搜索、推荐词和标签词获取脚本。

目录


获取工具列表 ✅

python script/get_tools_list.py

输出:data/tools_list/tools_list_{时间戳}.json


搜索脚本

1. 通用搜索(Google、Baidu、Bing) ✅

# 使用默认平台Google搜索
python script/search/custom_search.py --keyword "python"

# 指定其他搜索平台
python script/search/custom_search.py --keyword "python" --platform "baidu"

参数:

  • --keyword: 搜索关键词(必填)
  • --platform: 搜索平台,可选值:google/baidu/bing(可选,默认google)
  • --results-dir: 结果保存目录(可选,默认 data/search)

输出:data/search/custom_search/{平台}/{关键词}/{时间戳}.json

2. 抖音内容搜索 ✅

python script/search/douyin_search.py --keyword "美食"

参数:

  • --keyword: 搜索关键词(必填)
  • --results-dir: 结果保存目录(可选,默认 data/search)

输出:data/search/douyin_search/{关键词}/{时间戳}.json

3. 小红书笔记搜索 ✅

python script/search/xiaohongshu_search.py --keyword "旅游"

参数:

  • --keyword: 搜索关键词(必填)
  • --content-type: 内容类型,可选值:不限/视频/图文(可选,默认"不限")
  • --sort-type: 排序方式,可选值:综合/最新/最多点赞/最多评论(可选,默认"综合")
  • --publish-time: 发布时间,可选值:不限/一天内/一周内/半年内(可选,默认"不限")
  • --cursor: 翻页游标(可选,默认为空)
  • --page: 页码标识(可选,默认1)
  • --results-dir: 结果保存目录(可选,默认 data/search)

输出:data/search/xiaohongshu_search/{关键词}/{时间戳}_page{页码}.json

4. AI搜索 ✅

python script/search/ai_search.py --query "什么是Python"

参数:

  • --query: 查询内容(必填)
  • --results-dir: 结果保存目录(可选,默认 data/search)

输出:data/search/ai_search/{查询内容前20字符}/{时间戳}.json


推荐词脚本 ✅

# 抖音推荐词
python script/search_recommendations/douyin_search_recommendations.py --keyword "美食"

# B站推荐词
python script/search_recommendations/bilibili_search_recommendations.py --keyword "游戏"

# 小红书推荐词
python script/search_recommendations/xiaohongshu_search_recommendations.py --keyword "长沙"

参数:

  • --keyword: 搜索关键词(必填)
  • --results-dir: 结果保存目录(可选,默认 data/search_recommendations)

输出:data/search_recommendations/{平台}/{关键词}/{时间戳}.json


标签词脚本

抖音标签词 ✅

python script/search_tagwords/douyin_search_tagword.py --keyword "旅游"

参数:

  • --keyword: 搜索关键词(必填)
  • --results-dir: 结果保存目录(可选,默认 data/search_tagwords)

输出:data/search_tagwords/douyin/{关键词}/tagword_{时间戳}.json

小红书标签词 ❌

python script/search_tagwords/xiaohongshu_search_hashtag.py --keyword "护肤"

参数:

  • --keyword: 搜索关键词(必填)
  • --results-dir: 结果保存目录(可选,默认 data/search_tagwords)

输出:data/search_tagwords/xiaohongshu/{关键词}/hashtag_{时间戳}.json

不可用: 该接口当前返回500错误,服务端暂时不可用