wangkun 3 лет назад
Родитель
Сommit
a7ff796ce9
5 измененных файлов с 26 добавлено и 11 удалено
  1. 11 0
      README.md
  2. 1 1
      main/download_play.py
  3. 1 1
      main/download_sendtime.py
  4. 4 0
      main/get_feeds.py
  5. 9 9
      main/run.py

+ 11 - 0
README.md

@@ -10,6 +10,17 @@ urllib3==1.26.9
 cd ./crawler-kanyikan-Windows
 python3 main/run.py
 
+==========2022/6/16===========
+- 1.凌晨0点-15点      3日内播放大于2万 爬取
+- 2.晚上15点-24点     15万播放爬取
+- 视频发布7日内,播放量大于2万
+- 视频时长40秒以上
+- 分辨率 宽或高大于720  
+- 分享量>0
+- 站内标题=看一看视频原标题 
+- 站内封面图=看一看视频原封面图
+
+
 ==========2022/4/21===========
 - 视频发布7日内,播放量大于1万(当前时间 - 发布时间 <= 7 天)
 - 任务执行规则:

+ 1 - 1
main/download_play.py

@@ -27,7 +27,7 @@ class DownloadPlay:
         """
         if int(play_width) >= 720 or int(play_height) >= 720 or play_width == "0" or play_height == "0":
             if int(play_duration) >= 40:
-                if int(play_play_cnt) >= 150000:
+                if int(play_play_cnt) >= 100000:
                     return True
                 else:
                     return False

+ 1 - 1
main/download_sendtime.py

@@ -137,7 +137,7 @@ class DownloadSendtime:
                         # 删除行或列,可选 ROWS、COLUMNS
                         Feishu.dimension_range("SdCHOM", "ROWS", i + 1, i + 1)
                         return
-                    elif int(v_play_cnt_sendtime) < 10000:
+                    elif int(v_play_cnt_sendtime) < 20000:
                         # 从云文档删除该视频信息:https://w42nne6hzg.feishu.cn/sheets/shtcngRPoDYAi24x52j2nDuHMih?sheet=SdCHOM
                         Common.logger().info("该视频7天播放量:{}<10000 ;不满足下载规则:{}",
                                              int(v_play_cnt_sendtime), download_video_title)

+ 4 - 0
main/get_feeds.py

@@ -203,6 +203,10 @@ def get_feeds():
                             or video_cover == "" \
                             or url == "":
                         Common.logger().info("无效视频")
+
+                    # 基础门槛,播放量>=20000
+                    elif video_play_cnt < 20000:
+                        Common.logger().info("播放量{} < 20000", video_play_cnt)
                     # 过滤敏感词
                     elif any(word if word in video_title else False for word in kanyikan_sensitive_words()) is True:
                         Common.logger().info("视频已中敏感词:{}".format(video_title))

+ 9 - 9
main/run.py

@@ -72,8 +72,8 @@ class Main:
         while True:
             sendtime_now = datetime.datetime.now()
             # 指定时间结束抓取视频
-            if sendtime_now.hour > 9:
-                Common.logger().info("结束抓取3天榜单视频\n")
+            if sendtime_now.hour > 14:
+                Common.logger().info("结束抓取7天榜单视频\n")
                 time.sleep(3)
                 break
             else:
@@ -98,15 +98,15 @@ class Main:
         while True:
             while True:
                 main_now = datetime.datetime.now()
-                if 9 >= main_now.hour >= 0:
-                    Common.logger().info("开始抓取3天榜单视频\n")
+                if 14 >= main_now.hour >= 0:
+                    Common.logger().info("开始抓取7天榜单视频\n")
                     time.sleep(1)
                     cls.download_sendtime_job()
-                elif 19 >= main_now.hour >= 10:
-                    Common.logger().info("开始抓取上升榜视频\n")
-                    time.sleep(1)
-                    cls.download_up_job()
-                elif 24 >= main_now.hour >= 20:
+                # elif 19 >= main_now.hour >= 10:
+                #     Common.logger().info("开始抓取上升榜视频\n")
+                #     time.sleep(1)
+                #     cls.download_up_job()
+                elif 24 >= main_now.hour >= 15:
                     Common.logger().info("开始抓取播放量视频\n")
                     time.sleep(1)
                     cls.download_play_job()