Ingen beskrivning

yangxiaohui 6943c0548a init tools 1 månad sedan
script 6943c0548a init tools 1 månad sedan
.gitignore 6943c0548a init tools 1 månad sedan
README.md 6943c0548a init tools 1 månad sedan

README.md

平台搜索工具集

获取各平台搜索结果、推荐词和标签词的Python脚本。

使用方法

获取工具列表 ✅

python script/get_tools_list.py

输出:data/tools_list/tools_list_{时间戳}.json


搜索脚本

1. 通用搜索(Google、Baidu、Bing) ✅

# 使用默认平台Google搜索
python script/search/custom_search.py --keyword "python"

# 指定其他搜索平台
python script/search/custom_search.py --keyword "python" --platform "baidu"

参数:

  • --keyword: 搜索关键词(必填)
  • --platform: 搜索平台,可选值:google/baidu/bing(可选,默认google)
  • --results-dir: 结果保存目录(可选,默认 data/search)

输出:data/search/custom_search/{平台}/{关键词}/{时间戳}.json

2. 抖音内容搜索 ✅

python script/search/douyin_search.py --keyword "美食"

参数:

  • --keyword: 搜索关键词(必填)
  • --results-dir: 结果保存目录(可选,默认 data/search)

输出:data/search/douyin_search/{关键词}/{时间戳}.json

3. 小红书笔记搜索 ✅

# 使用默认参数(综合排序,不限类型)
python script/search/xiaohongshu_search.py --keyword "旅游"

# 指定筛选条件
python script/search/xiaohongshu_search.py --keyword "旅游" --content-type "视频" --sort-type "最新"

参数:

  • --keyword: 搜索关键词(必填)
  • --content-type: 内容类型,可选值:不限/视频/图文(可选,默认"不限")
  • --sort-type: 排序方式,可选值:综合/最新/最多点赞/最多评论(可选,默认"综合")
  • --publish-time: 发布时间,可选值:不限/一天内/一周内/半年内(可选,默认"不限")
  • --cursor: 翻页游标(可选,默认为空)
  • --page: 页码标识(可选,默认1)
  • --results-dir: 结果保存目录(可选,默认 data/search)

输出:data/search/xiaohongshu_search/{关键词}/{时间戳}_page{页码}.json

4. AI搜索 ✅

python script/search/ai_search.py --query "什么是Python"

参数:

  • --query: 查询内容(必填)
  • --results-dir: 结果保存目录(可选,默认 data/search)

输出:data/search/ai_search/{查询内容前20字符}/{时间戳}.json


推荐词脚本 ✅

# 抖音推荐词(默认关键词:美食)
python script/search_recommendations/douyin_search_recommendations.py

# B站推荐词(默认关键词:游戏)
python script/search_recommendations/bilibili_search_recommendations.py

# 小红书推荐词(默认关键词:长沙)
python script/search_recommendations/xiaohongshu_search_recommendations.py

# 自定义关键词
python script/search_recommendations/douyin_search_recommendations.py --keyword "旅游"

参数:

  • --keyword: 搜索关键词(可选,各平台有默认值)
  • --results-dir: 结果保存目录(可选,默认 data/search_recommendations)

输出:data/search_recommendations/{平台}/{关键词}/{时间戳}.json


标签词脚本

抖音标签词 ✅

# 使用默认关键词(旅游)
python script/search_tagwords/douyin_search_tagword.py

# 自定义关键词
python script/search_tagwords/douyin_search_tagword.py --keyword "美食"

参数:

  • --keyword: 搜索关键词(可选,默认"旅游")
  • --results-dir: 结果保存目录(可选,默认 data/search_tagwords)

输出:data/search_tagwords/douyin/{关键词}/tagword_{时间戳}.json

小红书标签词 ❌

# 使用默认关键词(护肤)
python script/search_tagwords/xiaohongshu_search_hashtag.py

# 自定义关键词
python script/search_tagwords/xiaohongshu_search_hashtag.py --keyword "美妆"

参数:

  • --keyword: 搜索关键词(可选,默认"护肤")
  • --results-dir: 结果保存目录(可选,默认 data/search_tagwords)

输出:data/search_tagwords/xiaohongshu/{关键词}/hashtag_{时间戳}.json

不可用: 该接口当前返回500错误,服务端暂时不可用