#****************************************************************************************************
#
微信公众号爬虫
#
依赖库文件
loguru==0.6.0
oss2==2.15.0
requests==2.27.1
urllib3==1.26.9
python==3.10
新入口
cd ./crawler_gzh
python3 main/run_gzh.py
#
旧入口:
cd ./crawler
python3 ./crawler_gzh/main/run_gzh_recommend.py
#
#
需求列表
2022/8/17
1.抓取用户主页 2021 年之后发布的视频
2.每个用户每天抓取 10 条
#
1、任务开始时间
每天早上8点-晚上21点
2、抓取规则:
视频时长1分钟以上,20分钟以下
站内标题=公众号 视频原标题
站内封面图=公众号 视频原封面图
3、站内承接:
每日入库100条视频
视频随机分配到5个虚拟账号。uid列表:[20631273, 20631274, 20631275, 20631276, 20631277]
#****************************************************************************************************