yangxiaohui

yangxiaohui запушил(а) feat/exposure-base-d-chain в yangxiaohui/data_analysis

864723cd59 feat(尾号实验): base_v2 补充实验组名称 & 添加 suffix 字段 - 补全 6/e/f 尾号的实验组名称（原先只填了数字） - 用 WM_CONCAT 聚合 suffix 展示每组包含的尾号 - DAU 数据源切回 useractive_log（从 per5min 表切回） Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>

1 неделя назад

yangxiaohui слил пул реквест yangxiaohui/data_analysis#1

合并

3 недель назад

yangxiaohui закрыл запрос на слияние yangxiaohui/data_analysis#1

合并

3 недель назад

yangxiaohui создал запрос на слияние yangxiaohui/data_analysis#1

合并

3 недель назад

yangxiaohui запушил(а) feat/exposure-base-d-chain в yangxiaohui/data_analysis

fb57435447 feat: 添加尾号实验、AB分ab对比、洞察SQL、报表及table_gen测试 - 尾号实验: base/base_v1/base_v2 (str校准 & ros天级更新) - AB效果: 分ab对比SQL+JSON配置、含多跳v2 - 洞察: click top_from_mid、活跃表概况、来源/level_channel/内外部分布 - 报表: 推荐分发报表SQL+JSON - table_gen: 活跃日志表、测试SQL、tmp笔记 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
854ce9da36 feat: 飞书上传增强(filter/limit/cell上限) + AB效果SQL更新D链指标 - fetch_daily: 新增 filter/limit 参数、富文本表头兼容、5M cell 上限保护、简化写入流程(expand+sequential write 替代 reverse insert) - AB实时效果: 分组改为单码(ab0 而非 ab0,ab1) - AB天级效果含多跳: 添加 D 链指标(d_1~d_3/total_d/total_bcd/total_bcd1)及 lift - rosn品类分析: dt 匹配改为 LIKE 支持月份前缀 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
Просмотр сравнение для этих 2 коммитов »

3 недель назад

yangxiaohui запушил(а) feat/exposure-base-d-chain в yangxiaohui/data_analysis

9e47761fa5 feat(洞察): 添加 click shareid/rootshareid 来源分布查询 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
478c942e1b feat(洞察): 拆分 depth 分析为独立 SQL，新增 click top 视频查询 - 00_uv情况: 回退为原始两层(topic分组+自点/他点)，移除 depth 块 - 02_click_depth分布: 独立文件，按用户 max depth 分桶(0~50逐值,>50归桶)，含 uv/cnt/vid 占比 - 03_click_top视频: 视频粒度 top100 by UV，含 title/发布时间/avg_depth/max_depth - 04_click_top视频_by_depth: 视频粒度 top100 by max_depth Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
6b0c6a512d docs(table_gen): 添加 agg_wide 193 字段元数据 JSON Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
8100ce23ab feat(table_gen): agg_wide 对齐 cn_total/dn_total/all 为 uv+pv+exp+ror+rov 五字段结构 - cn_total/dn_total 各补 _pv/_exp，COMMENT 写明加法公式 - all 重构: 删重复 all_rovn，B链改用 bn_uv 对齐 cn/dn 口径，新增 all_pv/all_exp - DDL 188→193，SELECT 同步对齐 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
Просмотр сравнение для этих 4 коммитов »

3 недель назад

yangxiaohui запушил(а) feat/exposure-base-d-chain в yangxiaohui/data_analysis

3f1b909bf5 docs(table_gen): 添加上游曝光视图表 base_view_20250402 及头部注释去重逻辑、输出拆分、与 base_20260209 的关系 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
bfd273ab51 docs(table_gen): base/agg_wide 补充头部认知注释 - base: 版本历史、数据源、数据流图、CTE 管线、去环策略 - agg_wide: 依赖链、指标分区总览、rov/ror 分母推导表 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
d5c761e5b4 feat(table_gen): 添加曝光基础表 20260209 版本 (sharedepth + B/C/D 链 exp/pv/uv/mids) 基于 20260206 重构，新增 sharedepth 维度拆分和多跳 BFS 去环逻辑 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
500a17d4f2 feat(table_gen): agg_wide 补全分享回流漏斗指标，模型 section 标题区分 - 分享 section 扩充为「分享 & 回流漏斗」，新增 4 count + 4 rate 字段 - 模型 section 标题加「模型预估:」前缀，*_real comment 标等价关系 - DDL 与 SELECT 同步，共 188 字段 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
Просмотр сравнение для этих 4 коммитов »

3 недель назад

yangxiaohui запушил(а) feat/exposure-base-d-chain в yangxiaohui/data_analysis

1a93baf23c chore(table_gen): 更新 drop table 注释格式为 if exists Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>

4 недель назад

yangxiaohui запушил(а) feat/exposure-base-d-chain в yangxiaohui/data_analysis

118f0cb240 feat(table_gen): 曝光基础表增加 D 链(session内后续曝光传播) d1/d2/d3 字段新增 6 列 d_1~d_3 及对应 mids，D 链通过同 subsession 内后续曝光的 BFS 去环传播计算，与已有 B/C 多跳列对齐。 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
5241a82f64 feat(fetch_daily): 支持 --hh 参数按小时粒度获取数据，优化飞书上传清理逻辑 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
99634714d2 feat: 添加曝光回流收益 SQL (v1~v4) 及 AB 效果分析任务 - table_gen: 曝光回流 B+C 多跳计算 v1~v3，v4 新增 D 链（session 内后续曝光传播） - table_gen: 曝光基础表建表 SQL - AB效果: 推荐 AB 实时/天级效果、对比对照组、分小时/分seq/含多跳等任务 SQL 及配置 Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
1e138b473f feat(table_gen): 优化曝光回流递推输出字段 - 去掉 subsessionid - 添加 vid, uid, mid - JOIN 视频表获取 video_title Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
91930e89a8 feat(table_gen): 添加曝光回流收益递推计算 SQL (优化版 k=3) 优化点: - 去掉 seq，用 ts 直接判断先后顺序 - 级联匹配合并为单次 JOIN + 优先级选择（10轮→2轮） - 递推计算到 k=3 Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>

4 недель назад

yangxiaohui создал новую ветку feat/exposure-base-d-chain в yangxiaohui/data_analysis

4 недель назад

yangxiaohui запушил(а) feature/yxh в algorithm/recommend-model

43226d949a 增加损失函数修改
02ea98f31c 计算qq图
fc8096bc88 filter
b6aab082aa 行为预测性别
fd6abe5375 特征

1 месяц назад

yangxiaohui создал новую ветку feature/yxh в algorithm/recommend-model

1 месяц назад

yangxiaohui запушил(а) master в yangxiaohui/data_analysis

d8eee722cf feat(rosn/指标分析): 新增分析配置与误差分析 SQL - 删除旧的一级品类 SQL，新增多组 rosn 分析 JSON 配置 - 新增指标分析误差分析 v2 SQL 及对应 JSON 配置 - 更新误差分析 JSON 配置 Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>

1 месяц назад

yangxiaohui запушил(а) master в yangxiaohui/data_analysis

cf4ecc7db2 fix(fetch_daily): 飞书上传支持空表头自动写入 - 过滤飞书表头中的 None/空字符串 - 表头为空时自动用 CSV 表头写入第一行 Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>

1 месяц назад

yangxiaohui запушил(а) master в yangxiaohui/data_analysis

a4ce41392d feat(指标分析): 新增 01/02 飞书上传配置 Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>

1 месяц назад

yangxiaohui запушил(а) master в yangxiaohui/data_analysis

98d6d24fa3 refactor(指标分析): SELECT 字段按模型阶段重排从按指标类型分组改为按模型阶段(str/rosn/rovn)分组，每阶段内部顺序：samples → real → pred → copc → mae → mape → var Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
9adaefdc38 feat(指标分析): rosn 口径对齐回流 + 新增 MAPE/样本数/方差 - rosn COPC 和预测均值限定 is_return_noself=1，与 rosn_real 对齐 - 新增 rosn MAPE（相对误差） - 新增 str_samples/rosn_samples/rovn_samples 样本数 - 02 文件额外包含方差字段 Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
28f965767c feat: 支持多 ODPS 配置切换 fetch_daily.py 新增 --config 参数，lib/odps_module.py 重构为多配置模式，支持 default 和 piaoquan_api 两套 ODPS 环境。 Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
Просмотр сравнение для этих 3 коммитов »

1 месяц назад

yangxiaohui запушил(а) master в yangxiaohui/data_analysis

00ffb1dd30 feat: 新增全量 SQL 分析文件包含表洞察、rosn分析、rosn校准、线上实验、头部视频模型指标、低vov高曝光分析等多个任务的 SQL 查询文件。 Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>

1 месяц назад

yangxiaohui запушил(а) master в yangxiaohui/data_analysis

967799df45 refactor(feishu): 重构飞书上传功能，支持样式继承 - 读取飞书表头并按其顺序重排CSV数据 - 字段校验：警告不一致但继续执行 - 分批删除旧数据（每批最多5000行） - 通过模板行继承样式，写入后删除模板 - 清理末尾多余空行 Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
ac80773c8b feat(fetch_daily): 新增飞书表格上传功能 - 支持 --feishu 参数上传数据到飞书表格 - 支持 --sort 多字段排序（如 dt:desc,name:asc） - 支持 --cols 列映射（筛选/排序/重命名） - 自动推断列类型（int/float/str） - 多级配置文件: {sql名}.json > sql目录/default.json > 根目录/default.json Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
Просмотр сравнение для этих 2 коммитов »

1 месяц назад

yangxiaohui запушил(а) master в yangxiaohui/data_analysis

221464602f refactor(rosn分析): 移动 dau_chg/exp_chg 至 exp_pct 后 Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>

1 месяц назад

yangxiaohui запушил(а) master в yangxiaohui/data_analysis

389a302efb refactor(rosn分析): 调整 dau_chg/exp_chg 字段位置将 dau_chg 和 exp_chg 移至 dau, exp 之后，便于对比查看 Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
5a271584e0 feat(rosn分析): 新增实验组 vs 对照组变化率分析 SQL - 02_实验组xTop10一级品类_vs对照组.sql - 02_实验组xTop10二级品类_vs对照组.sql - 02_实验组xTop20视频_vs对照组.sql 使用窗口函数获取对照组基准值，计算各业务指标的变化率 Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
88b872d918 feat: 新增 CSV 合并功能及 rosn 分析任务 - fetch_daily.py: 新增 --merge 参数，支持合并所有日期 CSV 为单文件 - 更新 opengid_base_data 表结构（新增 27 个字段） - 新增 rosn 分析 SQL（实验组 x Top10/20 视频、一级品类） Co-Authored-By: Claude Opus 4.5 <noreply@anthropic.com>
Просмотр сравнение для этих 3 коммитов »

1 месяц назад