1. 总体
2. 基础数据表
2.1 用户点击分享行为
- loghubods.alg_recsys_user_share_click_event
2.2 视频标签&关键词
- loghubods.video_merge_tag
- loghubods.alg_recsys_profile_user_behavior_video
2.3 微信性别标签
- loghubods.alg_recsys_user_wx_gender
2.4 样本数据
- loghubods.alg_recsys_feature_behavior_profile
3. 生成特征数据
- make_data.sh 生成特征
- stat_freq.sh 统计特征频次
4. 性别模型
4.1 生成训练数据
4.2 生成预测数据
4.3 评估模型
4.4 预测
4.5 结果写入hive