|
%!s(int64=2) %!d(string=hai) anos | |
---|---|---|
main | %!s(int64=2) %!d(string=hai) anos | |
.gitignore | %!s(int64=2) %!d(string=hai) anos | |
README.md | %!s(int64=2) %!d(string=hai) anos |
git:https://git.yishihui.com/Server/crawler_gzh.git
飞书:https://w42nne6hzg.feishu.cn/sheets/shtcnexNXnpDLHhARw0QdiwbYuA?
loguru==0.6.0 oss2==2.15.0 requests==2.27.1 urllib3==1.26.9 python==3.10
新入口:
cd ./crawler_gzh
python3 main/run_gzh.py
旧入口:
cd ./crawler
python3 ./crawler_gzh/main/run_gzh_recommend.py
2022/8/17
1.抓取用户主页 2021 年之后发布的视频
2.每个用户每天抓取 10 条
2022/8/4 https://w42nne6hzg.feishu.cn/docx/doxcndwbtMudFHh7r4alaJoykke
1、任务开始时间
每天早上8点-晚上21点
2、抓取规则:
视频时长1分钟以上,20分钟以下
站内标题=公众号 视频原标题
站内封面图=公众号 视频原封面图
3、站内承接:
每日入库100条视频
视频随机分配到5个虚拟账号。uid列表:[20631273, 20631274, 20631275, 20631276, 20631277]