Parcourir la source

修改规则:抓取时间 10 天内

wangkun il y a 2 ans
Parent
commit
a146c2145b
1 fichiers modifiés avec 16 ajouts et 15 suppressions
  1. 16 15
      main/hour_list.py

+ 16 - 15
main/hour_list.py

@@ -64,17 +64,17 @@ class HourList:
         :return: 满足规则,返回 True;反之,返回 False
         """
         # 视频时长
-        if 600 >= int(float(d_duration)) >= 60:
+        if int(float(d_duration)) >= 40:
             # 宽或高
             if int(d_width) >= 0 or int(d_height) >= 0:
                 # 播放量
-                if int(d_play_cnt) >= 5000:
+                if int(d_play_cnt) >= 4000:
                     # 点赞量
                     if int(d_like_cnt) >= 0:
                         # 分享量
                         if int(d_share_cnt) >= 0:
-                            # 发布时间 <= 7
-                            if int(time.time()) - int(d_send_time)/1000 <= 604800:
+                            # 发布时间 <= 10
+                            if int(time.time()) - int(d_send_time)/1000 <= 864000:
                                 return True
                             else:
                                 return False
@@ -805,21 +805,22 @@ class HourList:
                             "logs", "xiaoniangao", "ba0da4", "J" + str(i) + ":" + "J" + str(i))[0]
                         v_send_time = int(time.mktime(time.strptime(v_upload_time, "%Y-%m-%d %H:%M:%S")))
 
-                        # 判断视频 ID 长度,不大于 13 位
-                        if len(str(v_id)) > 13:
-                            Common.logger().info("视频ID长度大于13位:{}", v_id)
-
-                        elif int(time.time()) - int(v_send_time) >= 172800:
-                            Common.logger().info("抓取时间超过 2 天")
+                        # # 判断视频 ID 长度,不大于 13 位
+                        # if len(str(v_id)) > 13:
+                        #     Common.logger().info("视频ID长度大于13位:{}", v_id)
+                        #
+                        # el
+                        if int(time.time()) - int(v_send_time) >= 259200:
+                            Common.logger().info("抓取时间超过 3 天")
                             return
 
                         # 判断视频时长:1-10min
-                        elif int(v_duration) > 600 or int(v_duration) < 60:
-                            Common.logger().info("视频时长不在 1-10分钟 之间")
+                        elif int(v_duration) < 40:
+                            Common.logger().info("视频时长小于 40s")
 
-                        # 过滤带字母的视频ID
-                        elif any(word if word in v_id else False for word in cls.sensitive_videoid_words()) is True:
-                            Common.logger().info("视频ID带字母:{}".format(v_id))
+                        # # 过滤带字母的视频ID
+                        # elif any(word if word in v_id else False for word in cls.sensitive_videoid_words()) is True:
+                        #     Common.logger().info("视频ID带字母:{}".format(v_id))
 
                         # 从云文档中去重:https://w42nne6hzg.feishu.cn/sheets/shtcnYxiyQ1wLklo1W5Kdqc9cGh?sheet=yatRv2
                         elif v_id in [j for i in Feishu.get_values_batch("logs", "xiaoniangao", "yatRv2") for j in i]: