This website works better with JavaScript
Inicio
Explorar
Axuda
Iniciar sesión
Server
/
crawler_benshanzhufu
Seguir
9
Destacar
0
Fork
0
Ficheiros
Incidencias
0
Pull Requests
0
Wiki
本山祝福小程序爬虫
21
Achegas
1
Branches
0
Lanzamentos
Árbore:
00246328d4
Ramas
Etiquetas
master
crawler_bens...
HTTP
SSH
ZIP
TAR.GZ
wangkun
00246328d4
update
%!s(int64=2) %!d(string=hai) anos
main
00246328d4
update
%!s(int64=2) %!d(string=hai) anos
.gitignore
5285c0a11d
first push
%!s(int64=3) %!d(string=hai) anos
README.md
00246328d4
update
%!s(int64=2) %!d(string=hai) anos
README.md
本山祝福小程序爬虫
git:
https://git.yishihui.com/Server/crawler_benshanzhufu.git
feishu:
https://w42nne6hzg.feishu.cn/sheets/shtcnGh2rrsPYM4iVNEBO7OqWrb?sheet=440018
软件架构
ffmpeg==1.4
loguru==0.6.0
oss2==2.15.0
requests==2.27.1
urllib3==1.26.9
python==3.10
使用说明
cd ./crawler_benshanzhufu
python3 main/run_recommend.py
需求
2022/10/25
下载视频时长修改为: >= 40s
2022/7/20 项目重启:
接入飞书文档:
https://w42nne6hzg.feishu.cn/sheets/shtcnGh2rrsPYM4iVNEBO7OqWrb
代码逻辑重构
时长限制>=60s
宽高限制:宽>=高才会下载及上传
标题敏感词限制
2022/7/18
每个账号上发布3条本山祝福视频 [20631262, 20631263, 20631264, 20631265, 20631266, 20631267, 20631268, 20631269, 20631271, 20631272]
2022/4/29
增加敏感词过滤
每天 11 点开始爬取,上限 200 条
上传账号:[20631241, 20631242, 20631244, 20631245, 20631246, 20631247]
2022/4/27
全爬
每天9-12点进行爬取
上传账号:20631241 / 20631242