ソースを参照

generate label for mysql

罗俊辉 1 年間 前
コミット
c6530c95ca
1 ファイル変更5 行追加0 行削除
  1. 5 0
      process_data.py

+ 5 - 0
process_data.py

@@ -8,6 +8,7 @@ import json
 import asyncio
 import argparse
 import time
+import numpy as np
 
 from tqdm import tqdm
 import jieba.analyse
@@ -268,6 +269,10 @@ class UserProcess(object):
 
             df.append(temp[1:])
         df = pd.DataFrame(df, columns=self.user_features)
+        df['ros_30'] = np.where(int(df['user_view_30']) != 0, df['user_return_30'] / df['user_share_30'], np.nan)
+        df['rov_30'] = np.where(int(df['user_view_30']) != 0, df['user_return_30'] / df['user_view_30'], np.nan)
+        df['ros_3'] = np.where(int(df['user_view_3']) != 0, df['user_return_3'] / df['user_share_3'], np.nan)
+        df['rov_3'] = np.where(int(df['user_view_3']) != 0, df['user_return_3'] / df['user_view_3'], np.nan)
         df.to_json(des_path, orient='records')