yangxiaohui

yangxiaohui hizo push a feat/exposure-base-d-chain en yangxiaohui/data_analysis

  • 864723cd59 feat(尾号实验): base_v2 补充实验组名称 & 添加 suffix 字段 - 补全 6/e/f 尾号的实验组名称(原先只填了数字) - 用 WM_CONCAT 聚合 suffix 展示每组包含的尾号 - DAU 数据源切回 useractive_log(从 per5min 表切回) Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>

hace 1 semana

yangxiaohui fusionó el pull request yangxiaohui/data_analysis#1

合并

hace 3 semanas

yangxiaohui cerró el pull request yangxiaohui/data_analysis#1

合并

hace 3 semanas

yangxiaohui creado pull request yangxiaohui/data_analysis#1

合并

hace 3 semanas

yangxiaohui hizo push a feat/exposure-base-d-chain en yangxiaohui/data_analysis

  • fb57435447 feat: 添加尾号实验、AB分ab对比、洞察SQL、报表及table_gen测试 - 尾号实验: base/base_v1/base_v2 (str校准 & ros天级更新) - AB效果: 分ab对比SQL+JSON配置、含多跳v2 - 洞察: click top_from_mid、活跃表概况、来源/level_channel/内外部分布 - 报表: 推荐分发报表SQL+JSON - table_gen: 活跃日志表、测试SQL、tmp笔记 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
  • 854ce9da36 feat: 飞书上传增强(filter/limit/cell上限) + AB效果SQL更新D链指标 - fetch_daily: 新增 filter/limit 参数、富文本表头兼容、5M cell 上限保护、 简化写入流程(expand+sequential write 替代 reverse insert) - AB实时效果: 分组改为单码(ab0 而非 ab0,ab1) - AB天级效果含多跳: 添加 D 链指标(d_1~d_3/total_d/total_bcd/total_bcd1)及 lift - rosn品类分析: dt 匹配改为 LIKE 支持月份前缀 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
  • Ver comparación de estos 2 commits »

hace 3 semanas

yangxiaohui hizo push a feat/exposure-base-d-chain en yangxiaohui/data_analysis

  • 9e47761fa5 feat(洞察): 添加 click shareid/rootshareid 来源分布查询 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
  • 478c942e1b feat(洞察): 拆分 depth 分析为独立 SQL,新增 click top 视频查询 - 00_uv情况: 回退为原始两层(topic分组+自点/他点),移除 depth 块 - 02_click_depth分布: 独立文件,按用户 max depth 分桶(0~50逐值,>50归桶),含 uv/cnt/vid 占比 - 03_click_top视频: 视频粒度 top100 by UV,含 title/发布时间/avg_depth/max_depth - 04_click_top视频_by_depth: 视频粒度 top100 by max_depth Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
  • 6b0c6a512d docs(table_gen): 添加 agg_wide 193 字段元数据 JSON Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
  • 8100ce23ab feat(table_gen): agg_wide 对齐 cn_total/dn_total/all 为 uv+pv+exp+ror+rov 五字段结构 - cn_total/dn_total 各补 _pv/_exp,COMMENT 写明加法公式 - all 重构: 删重复 all_rovn,B链改用 bn_uv 对齐 cn/dn 口径,新增 all_pv/all_exp - DDL 188→193,SELECT 同步对齐 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
  • Ver comparación de estos 4 commits »

hace 3 semanas

yangxiaohui hizo push a feat/exposure-base-d-chain en yangxiaohui/data_analysis

  • 3f1b909bf5 docs(table_gen): 添加上游曝光视图表 base_view_20250402 及头部注释 去重逻辑、输出拆分、与 base_20260209 的关系 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
  • bfd273ab51 docs(table_gen): base/agg_wide 补充头部认知注释 - base: 版本历史、数据源、数据流图、CTE 管线、去环策略 - agg_wide: 依赖链、指标分区总览、rov/ror 分母推导表 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
  • d5c761e5b4 feat(table_gen): 添加曝光基础表 20260209 版本 (sharedepth + B/C/D 链 exp/pv/uv/mids) 基于 20260206 重构,新增 sharedepth 维度拆分和多跳 BFS 去环逻辑 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
  • 500a17d4f2 feat(table_gen): agg_wide 补全分享回流漏斗指标,模型 section 标题区分 - 分享 section 扩充为「分享 & 回流漏斗」,新增 4 count + 4 rate 字段 - 模型 section 标题加「模型预估:」前缀,*_real comment 标等价关系 - DDL 与 SELECT 同步,共 188 字段 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
  • Ver comparación de estos 4 commits »

hace 3 semanas

yangxiaohui hizo push a feat/exposure-base-d-chain en yangxiaohui/data_analysis

  • 1a93baf23c chore(table_gen): 更新 drop table 注释格式为 if exists Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>

hace 4 semanas

yangxiaohui hizo push a feat/exposure-base-d-chain en yangxiaohui/data_analysis

  • 118f0cb240 feat(table_gen): 曝光基础表增加 D 链(session内后续曝光传播) d1/d2/d3 字段 新增 6 列 d_1~d_3 及对应 mids,D 链通过同 subsession 内后续曝光的 BFS 去环传播计算,与已有 B/C 多跳列对齐。 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
  • 5241a82f64 feat(fetch_daily): 支持 --hh 参数按小时粒度获取数据,优化飞书上传清理逻辑 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
  • 99634714d2 feat: 添加曝光回流收益 SQL (v1~v4) 及 AB 效果分析任务 - table_gen: 曝光回流 B+C 多跳计算 v1~v3,v4 新增 D 链(session 内后续曝光传播) - table_gen: 曝光基础表建表 SQL - AB效果: 推荐 AB 实时/天级效果、对比对照组、分小时/分seq/含多跳等任务 SQL 及配置 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
  • 1e138b473f feat(table_gen): 优化曝光回流递推输出字段 - 去掉 subsessionid - 添加 vid, uid, mid - JOIN 视频表获取 video_title Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
  • 91930e89a8 feat(table_gen): 添加曝光回流收益递推计算 SQL (优化版 k=3) 优化点: - 去掉 seq,用 ts 直接判断先后顺序 - 级联匹配合并为单次 JOIN + 优先级选择(10轮→2轮) - 递推计算到 k=3 Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>

hace 4 semanas

yangxiaohui hizo push a feature/yxh en algorithm/recommend-model

hace 1 mes

yangxiaohui nueva rama feature/yxh creada en algorithm/recommend-model

hace 1 mes

yangxiaohui hizo push a master en yangxiaohui/data_analysis

  • d8eee722cf feat(rosn/指标分析): 新增分析配置与误差分析 SQL - 删除旧的一级品类 SQL,新增多组 rosn 分析 JSON 配置 - 新增指标分析误差分析 v2 SQL 及对应 JSON 配置 - 更新误差分析 JSON 配置 Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>

hace 1 mes

yangxiaohui hizo push a master en yangxiaohui/data_analysis

  • cf4ecc7db2 fix(fetch_daily): 飞书上传支持空表头自动写入 - 过滤飞书表头中的 None/空字符串 - 表头为空时自动用 CSV 表头写入第一行 Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>

hace 1 mes

yangxiaohui hizo push a master en yangxiaohui/data_analysis

  • a4ce41392d feat(指标分析): 新增 01/02 飞书上传配置 Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>

hace 1 mes

yangxiaohui hizo push a master en yangxiaohui/data_analysis

  • 98d6d24fa3 refactor(指标分析): SELECT 字段按模型阶段重排 从按指标类型分组改为按模型阶段(str/rosn/rovn)分组, 每阶段内部顺序:samples → real → pred → copc → mae → mape → var Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
  • 9adaefdc38 feat(指标分析): rosn 口径对齐回流 + 新增 MAPE/样本数/方差 - rosn COPC 和预测均值限定 is_return_noself=1,与 rosn_real 对齐 - 新增 rosn MAPE(相对误差) - 新增 str_samples/rosn_samples/rovn_samples 样本数 - 02 文件额外包含方差字段 Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
  • 28f965767c feat: 支持多 ODPS 配置切换 fetch_daily.py 新增 --config 参数,lib/odps_module.py 重构为 多配置模式,支持 default 和 piaoquan_api 两套 ODPS 环境。 Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
  • Ver comparación de estos 3 commits »

hace 1 mes

yangxiaohui hizo push a master en yangxiaohui/data_analysis

  • 00ffb1dd30 feat: 新增全量 SQL 分析文件 包含表洞察、rosn分析、rosn校准、线上实验、头部视频模型指标、 低vov高曝光分析等多个任务的 SQL 查询文件。 Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>

hace 1 mes

yangxiaohui hizo push a master en yangxiaohui/data_analysis

  • 967799df45 refactor(feishu): 重构飞书上传功能,支持样式继承 - 读取飞书表头并按其顺序重排CSV数据 - 字段校验:警告不一致但继续执行 - 分批删除旧数据(每批最多5000行) - 通过模板行继承样式,写入后删除模板 - 清理末尾多余空行 Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
  • ac80773c8b feat(fetch_daily): 新增飞书表格上传功能 - 支持 --feishu 参数上传数据到飞书表格 - 支持 --sort 多字段排序(如 dt:desc,name:asc) - 支持 --cols 列映射(筛选/排序/重命名) - 自动推断列类型(int/float/str) - 多级配置文件: {sql名}.json > sql目录/default.json > 根目录/default.json Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
  • Ver comparación de estos 2 commits »

hace 1 mes

yangxiaohui hizo push a master en yangxiaohui/data_analysis

  • 221464602f refactor(rosn分析): 移动 dau_chg/exp_chg 至 exp_pct 后 Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>

hace 1 mes

yangxiaohui hizo push a master en yangxiaohui/data_analysis

  • 389a302efb refactor(rosn分析): 调整 dau_chg/exp_chg 字段位置 将 dau_chg 和 exp_chg 移至 dau, exp 之后,便于对比查看 Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
  • 5a271584e0 feat(rosn分析): 新增实验组 vs 对照组变化率分析 SQL - 02_实验组xTop10一级品类_vs对照组.sql - 02_实验组xTop10二级品类_vs对照组.sql - 02_实验组xTop20视频_vs对照组.sql 使用窗口函数获取对照组基准值,计算各业务指标的变化率 Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
  • 88b872d918 feat: 新增 CSV 合并功能及 rosn 分析任务 - fetch_daily.py: 新增 --merge 参数,支持合并所有日期 CSV 为单文件 - 更新 opengid_base_data 表结构(新增 27 个字段) - 新增 rosn 分析 SQL(实验组 x Top10/20 视频、一级品类) Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
  • Ver comparación de estos 3 commits »

hace 1 mes