README.md 1.0 KB

知乎爬虫

  1. git: https://git.yishihui.com/Server/crawler_zhihu.git
  2. feishu: https://w42nne6hzg.feishu.cn/sheets/shtcnkGPBmGsjaqapgzouuj8MXe

软件架构

  1. python==3.10
  2. Appium_Python_Client==2.6.1
  3. loguru==0.6.0
  4. oss2==2.15.0
  5. psutil==5.9.2
  6. requests==2.27.1
  7. selenium==4.4.3
  8. urllib3==1.26.9

使用说明

  1. cd ./crawler_zhihu
  2. python3 ./main/run_xx.py

需求

2022/11/02

  1. 热榜:
    • 发布时间<180天
    • 视频播放量>3w
  2. 定向榜:
    • 发布时间<30天
    • 视频时长1分钟以上
    • 运行时间:
      • 每个用户主页抓取玩,休眠 1 分钟;
      • 所有用户主页抓取完,休眠 1 小时;
      • 24 小时持续运行。
  3. 增加报警

2022/11/01

  1. 热榜规则:
    • 运行时间: 08:00:00 - 22:59:59
    • 发布时间<30天
    • 视频播放量>1w
    • 视频时长1分钟以上
    • 站内标题=知乎 视频原标题
    • 站内封面图=知乎 视频原封面图
    • 站内承接账号: [20631383, 20631384, 20631385, 20631386, 20631387]