|
2 năm trước cách đây | |
---|---|---|
common | 2 năm trước cách đây | |
kanyikan | 2 năm trước cách đây | |
main | 2 năm trước cách đây | |
weixinzhishu | 2 năm trước cách đây | |
youtube | 2 năm trước cách đây | |
.DS_Store | 2 năm trước cách đây | |
.gitignore | 2 năm trước cách đây | |
README.MD | 2 năm trước cách đây | |
requirements.txt | 2 năm trước cách đây |
sh ./main/main.sh ${crawler_dir} ${log_type} ${crawler} ${strategy} ${oss_endpoint} ${env} ${machine} ${nohup_dir}
参数说明
${crawler_dir}: 爬虫执行路径,如: ./youtube/youtube_main/run_youtube_follow.py
${log_type}: 日志命名格式,如: follow,则在 youtube/logs/目录下,生成 2023-02-08-follow.log
${crawler}: 哪款爬虫,如: youtube / kanyikan / weixinzhishu
${strategy}: 爬虫策略,如: 定向爬虫策略 / 小时榜爬虫策略 / 热榜爬虫策略
${oss_endpoint}: OSS网关,内网: inner / 外网: out
${env}: 爬虫执行环境,正式环境: prod / 测试环境: dev
${machine}: 爬虫运行机器,阿里云服务器: aliyun / macpro / macair / local
${nohup_dir}: nohup日志存储路径,如: ./youtube/nohup.log
youtube定向榜:
sh ./main/main.sh ./youtube/youtube_main/run_youtube_follow.py --log_type="follow" --crawler="youtube" --strategy="定向爬虫策略" --oss_endpoint="inner" --env="prod" --machine="aliyun" ./youtube/nohup.log