zhangbo před 1 rokem
rodič
revize
3076e80878
2 změnil soubory, kde provedl 10 přidání a 105 odebrání
  1. 5 103
      config.py
  2. 5 2
      region_rule_rank_h_v2.py

+ 5 - 103
config.py

@@ -267,37 +267,13 @@ class BaseConfig(object):
                       'view_type': 'preview', 'merge_func': 2},
             'rule66': {'cal_score_func': 2, 'return_count': 100, 'platform_return_rate': 0.001,
                       'view_type': 'preview'},
-            # # 无回流人群
-            # 'rule5': {'return_count': 100, 'platform_return_rate': 0.001,
-            #           'view_type': 'preview', 'click_score_rate': 0.7},
-            # 'rule7': {'return_count': 100, 'platform_return_rate': 0.001,
-            #           'view_type': 'preview', 'click_score_rate': 0.8},
-            # # 有回流人群
-            # 'rule6': {'return_count': 100, 'platform_return_rate': 0.001,
-            #           'view_type': 'preview', 'back_score_rate': 0.7},
-            # 'rule8': {'return_count': 100, 'platform_return_rate': 0.001,
-            #           'view_type': 'preview', 'back_score_rate': 0.8},
         },
         'data_params': DATA_PARAMS,
         'params_list': [
             {'data': 'data1', 'rule': 'rule3', 'notify_backend': True},
-            # {'data': 'data2', 'rule': 'rule3'},
             {'data': 'data2', 'rule': 'rule4'},
-            # {'data': 'data3', 'rule': 'rule4'},
-            # {'data': 'data4', 'rule': 'rule4'},
-            # {'data': 'data6', 'rule': 'rule4'},
             {'data': 'data7', 'rule': 'rule4'},
-            # {'data': 'data1', 'rule': 'rule5'},
-            # {'data': 'data1', 'rule': 'rule6'},
-            # {'data': 'data8', 'rule': 'rule4'},
-            # {'data': 'data9', 'rule': 'rule4'},
             {'data': 'data10', 'rule': 'rule4'},
-            # {'data': 'data11', 'rule': 'rule4'},
-            # {'data': 'data12', 'rule': 'rule4'},
-            # {'data': 'data13', 'rule': 'rule4'},
-            # # {'data': 'data14', 'rule': 'rule4'},
-            # {'data': 'data1', 'rule': 'rule7'},
-            # {'data': 'data1', 'rule': 'rule8'},
             {'data': 'videos5', 'rule': 'rule4'},  # [内容精选]
             {'data': 'data66', 'rule': 'rule66'},
         ]
@@ -312,45 +288,19 @@ class BaseConfig(object):
         'rule_params': {
             'rule2': {'view_type': 'video-show', 'return_count': 21, 'score_rule': 0,
                       'platform_return_rate': 0.001},
-            # 'rule3': {'view_type': 'preview', 'return_count': 21, 'score_rule': 0,
-            #           'platform_return_rate': 0.001},
             'rule4': {'view_type': 'video-show', 'return_count': 21, 'score_rule': 0,
                       'platform_return_rate': 0.001, 'merge_func': 2},
             'rule5': {'view_type': 'preview', 'return_count': 21, 'score_rule': 0,
                       'platform_return_rate': 0.001, 'merge_func': 2},
             'rule66': {'view_type': 'video-show', 'return_count': 21, 'score_rule': 0,
                       'platform_return_rate': 0.001},
-            # # 无回流人群
-            # 'rule6': {'view_type': 'video-show', 'return_count': 21, 'score_rule': 0,
-            #           'platform_return_rate': 0.001, 'click_score_rate': 0.7},
-            # 'rule8': {'view_type': 'video-show', 'return_count': 21, 'score_rule': 0,
-            #           'platform_return_rate': 0.001, 'click_score_rate': 0.8},
-            # # 有回流人群
-            # 'rule7': {'view_type': 'video-show', 'return_count': 21, 'score_rule': 0,
-            #           'platform_return_rate': 0.001, 'back_score_rate': 0.7},
-            # 'rule9': {'view_type': 'video-show', 'return_count': 21, 'score_rule': 0,
-            #           'platform_return_rate': 0.001, 'back_score_rate': 0.8},
         },
         'data_params': DATA_PARAMS,
         'params_list': [
             {'data': 'data1', 'rule': 'rule2'},
-            # {'data': 'data2', 'rule': 'rule2'},
             {'data': 'data2', 'rule': 'rule4'},
-            # {'data': 'data3', 'rule': 'rule4'},
-            # {'data': 'data4', 'rule': 'rule4'},
-            # {'data': 'data6', 'rule': 'rule4'},
             {'data': 'data7', 'rule': 'rule5'},
-            # {'data': 'data1', 'rule': 'rule6'},
-            # {'data': 'data1', 'rule': 'rule7'},
-            # {'data': 'data8', 'rule': 'rule4'},
-            # {'data': 'data9', 'rule': 'rule4'},
             {'data': 'data10', 'rule': 'rule4'},
-            # {'data': 'data11', 'rule': 'rule4'},
-            # {'data': 'data12', 'rule': 'rule4'},
-            # {'data': 'data13', 'rule': 'rule4'},
-            # {'data': 'data14', 'rule': 'rule4'},
-            # {'data': 'data1', 'rule': 'rule8'},
-            # {'data': 'data1', 'rule': 'rule9'},
             {'data': 'videos5', 'rule': 'rule4'},  # [内容精选]
             {'data': 'data66', 'rule': 'rule66'},
         ]
@@ -362,10 +312,6 @@ class BaseConfig(object):
     # 小时级规则参数
     RULE_PARAMS_H_APP_TYPE = {
         'rule_params': {
-            # score = sharerate * backrate * LOG(lastonehour_return + 1) * K2
-            # sharerate = lastonehour_share / (lastonehour_play + 1000)
-            # backrate = lastonehour_return / (lastonehour_share + 10)
-            # ctr = lastonehour_play / (lastonehour_show + 1000), 对ctr限最大值:K2 = 0.6 if ctr > 0.6 else ctr
             'rule1': {'view_type': 'video-show', 'platform_return_rate': 0.001, 'merge_func': 2},
         },
         'data_params': DATA_PARAMS,
@@ -381,9 +327,6 @@ class BaseConfig(object):
     # 地域分组小时级规则参数
     RULE_PARAMS_REGION_APP_TYPE = {
         'rule_params': {
-            # 'rule2': {'view_type': 'video-show', 'platform_return_rate': 0.001, 'region_24h_rule_key': 'rule2'},
-            # 'rule3': {'view_type': 'video-show-region', 'platform_return_rate': 0.001,
-            #           'region_24h_rule_key': 'rule2', '24h_rule_key': 'rule2'},
             'rule4': {'view_type': 'video-show-region', 'platform_return_rate': 0.001,
                       'region_24h_rule_key': 'rule2', '24h_rule_key': 'rule3'},
             # 涉政视频过滤
@@ -393,8 +336,6 @@ class BaseConfig(object):
             'rule4-2': {'view_type': 'video-show-region', 'platform_return_rate': 0.001,
                         'region_24h_rule_key': 'rule2', '24h_rule_key': 'rule3', 'shield_config': SHIELD_CONFIG2},
 
-            # 'rule6': {'view_type': 'preview', 'platform_return_rate': 0.001,
-            #           'region_24h_rule_key': 'rule3', '24h_rule_key': 'rule2'},
             'rule7': {'view_type': 'video-show-region', 'platform_return_rate': 0.001,
                       'region_24h_rule_key': 'rule4', '24h_rule_key': 'rule4', 'merge_func': 2},
             'rule7-1': {'view_type': 'video-show-region', 'platform_return_rate': 0.001,
@@ -402,21 +343,6 @@ class BaseConfig(object):
                         'political_filter': True},
             'rule8': {'view_type': 'preview', 'platform_return_rate': 0.001,
                       'region_24h_rule_key': 'rule5', '24h_rule_key': 'rule4', 'merge_func': 2},
-            # 'rule9': {'view_type': 'video-show-region', 'platform_return_rate': 0.001,
-            #           'region_24h_rule_key': 'rule2', '24h_rule_key': 'rule3', '30day_rule_key': 'rule1'},
-            # # 无回流人群
-            # 'rule10': {'view_type': 'video-show-region', 'platform_return_rate': 0.001,
-            #            'region_24h_rule_key': 'rule6', '24h_rule_key': 'rule5', 'click_score_rate': 0.7},
-            # 'rule13': {'view_type': 'video-show-region', 'platform_return_rate': 0.001,
-            #            'region_24h_rule_key': 'rule8', '24h_rule_key': 'rule7', 'click_score_rate': 0.8},
-            # # 有回流人群
-            # 'rule11': {'view_type': 'video-show-region', 'platform_return_rate': 0.001,
-            #            'region_24h_rule_key': 'rule7', '24h_rule_key': 'rule6', 'back_score_rate': 0.7},
-            # 'rule14': {'view_type': 'video-show-region', 'platform_return_rate': 0.001,
-            #            'region_24h_rule_key': 'rule9', '24h_rule_key': 'rule8', 'back_score_rate': 0.8},
-            # # 20点地域小时级列表中增加7点-19点地域小时级的优质视频
-            # 'rule12': {'view_type': 'video-show-region', 'platform_return_rate': 0.001,
-            #            'region_24h_rule_key': 'rule2', '24h_rule_key': 'rule3', 'add_videos_in_20h': True},
 
             # 地域小时级列表中增加 前6小时 地域小时级的优质视频
             'rule15': {'view_type': 'video-show-region', 'platform_return_rate': 0.001,
@@ -496,48 +422,24 @@ class BaseConfig(object):
                 'view_type': 'video-show-region', 'platform_return_rate': 0.001,
                 'region_24h_rule_key': 'rule66', '24h_rule_key': 'rule66'
             },
+            'rule68': {
+                'view_type': 'video-show-region', "return_count": 5,
+                'region_24h_rule_key': 'rule66', '24h_rule_key': 'rule66'
+            },
         },
         'data_params': DATA_PARAMS,
         'params_list': [
             {'data': 'data1', 'rule': 'rule4'},  # 095 vlog
             {'data': 'data1', 'rule': 'rule4-1'},  # 095-1
-            # {'data': 'data1', 'rule': 'rule4-2'},  # 262 特殊地域屏蔽危险视频
-            # {'data': 'data2', 'rule': 'rule4'},
             {'data': 'data2', 'rule': 'rule7-1'},  # 121 内容精选
-            # {'data': 'data3', 'rule': 'rule7'},
-            # {'data': 'data4', 'rule': 'rule7'},
-            # {'data': 'data6', 'rule': 'rule7'},
             {'data': 'data7', 'rule': 'rule8'},  # 票圈视频APP 10003.110156
-            # {'data': 'data1', 'rule': 'rule9'},
-            # {'data': 'data1', 'rule': 'rule10'},
-            # {'data': 'data1', 'rule': 'rule11'},
-            # {'data': 'data8', 'rule': 'rule7'},
-            # {'data': 'data9', 'rule': 'rule7'},
             {'data': 'data10', 'rule': 'rule7'},  # 144 票圈视频
-            # {'data': 'data11', 'rule': 'rule7'},
-            # {'data': 'data12', 'rule': 'rule7'},
-            # {'data': 'data13', 'rule': 'rule7'},
-            # {'data': 'data1', 'rule': 'rule12'},
-            # {'data': 'data14', 'rule': 'rule7'},  # 159
-            # {'data': 'data1', 'rule': 'rule13'},  # 161
-            # {'data': 'data1', 'rule': 'rule14'},  # 162
-            # {'data': 'data1', 'rule': 'rule15'},  # 200 vlog
-            # {'data': 'data1', 'rule': 'rule16'},  # 214 vlog
-            # {'data': 'data1', 'rule': 'rule17'},  # 215 vlog
-            # {'data': 'data1', 'rule': 'rule18'},  # 224 vlog
             {'data': 'videos5', 'rule': 'rule7-1'},  # 428 [内容精选]
-            # {'data': 'data1', 'rule': 'rule20'},  # 461 vlog 分值计算公式 增加h-2分享当前小时回流数据、h-3分享当前小时回流数据特征
-            # {'data': 'data1', 'rule': 'rule21'},  # 462 vlog 分值计算公式 增加[h-3,h-2]之间的回流留存特征
-            # {'data': 'data1', 'rule': 'rule22'},  # 463 vlog 分值计算公式 增加h-2分享当前小时回流/h-2分享、h-3分享当前小时回流/h-3分享 特征
-            # {'data': 'data1', 'rule': 'rule23'},  # 465 vlog 回流数据使用 分享限制地域,回流不限制地域 统计数据
-            # {'data': 'data1', 'rule': 'rule24'},  # 466 vlog 分值计算公式 增加[h-3,h-2]之间的回流留存特征 + 回流数据使用 分享限制地域,回流不限制地域 统计数据
-            # {'data': 'data10', 'rule': 'rule25'},  # 500
-            # {'data': 'data10', 'rule': 'rule26'},  # 501
             {'data': 'data10', 'rule': 'rule27'},  # 502
             {'data': 'data10', 'rule': 'rule28'},  # 503
-            # {'data': 'data10', 'rule': 'rule29'},  # 509
             {'data': 'data10', 'rule': 'rule30'},  # 510
             {'data': 'data66', 'rule': 'rule66'}, # 520
+            {'data': 'data66', 'rule': 'rule68'},
         ],
         'params_list_new': [
             # {'data': 'data10', 'rule': 'rule19'},  # 316 票圈视频 + 召回在线去重

+ 5 - 2
region_rule_rank_h_v2.py

@@ -601,8 +601,11 @@ def video_rank(df, now_date, now_h, rule_key, param, region, data_key, rule_rank
     return_count = param.get('return_count', 1)
     score_value = param.get('score_rule', 0)
     platform_return_rate = param.get('platform_return_rate', 0)
-    h_recall_df = df[(df['lastonehour_return'] >= return_count) & (df['score'] >= score_value)
-                     & (df['platform_return_rate'] >= platform_return_rate)]
+    h_recall_df = df[
+                        (df['lastonehour_return'] >= return_count) &
+                        (df['score'] >= score_value) &
+                        (df['platform_return_rate'] >= platform_return_rate)
+                     ]
 
     # videoid重复时,保留分值高
     h_recall_df = h_recall_df.sort_values(by=['score'], ascending=False)