No Description

yangxiaohui 3f1b909bf5 docs(table_gen): 添加上游曝光视图表 base_view_20250402 及头部注释 3 weeks ago
lib f4ce6b107a feat: 添加飞书 SDK 客户端 lib/feishu.py 1 month ago
req 2f8fee0358 chore: 提交未跟踪的分析任务、表结构文档和配置 1 month ago
table_gen 3f1b909bf5 docs(table_gen): 添加上游曝光视图表 base_view_20250402 及头部注释 3 weeks ago
tables 2f8fee0358 chore: 提交未跟踪的分析任务、表结构文档和配置 1 month ago
tasks 99634714d2 feat: 添加曝光回流收益 SQL (v1~v4) 及 AB 效果分析任务 4 weeks ago
tmp 2f8fee0358 chore: 提交未跟踪的分析任务、表结构文档和配置 1 month ago
tmp_sql 00ffb1dd30 feat: 新增全量 SQL 分析文件 1 month ago
.gitignore f4ce6b107a feat: 添加飞书 SDK 客户端 lib/feishu.py 1 month ago
CLAUDE.md d716918d83 docs: 更新 CLAUDE.md 反映新目录结构 1 month ago
README.md b7bf0871ea docs: 新增常用指标说明和人群定义 1 month ago
default.json 2f8fee0358 chore: 提交未跟踪的分析任务、表结构文档和配置 1 month ago
desc_table.py 53b88393a3 添加表结构查看工具 desc_table.py 2 months ago
fetch_daily.py 5241a82f64 feat(fetch_daily): 支持 --hh 参数按小时粒度获取数据,优化飞书上传清理逻辑 4 weeks ago
run_sql.py 27ddc983ff feat(人群品类曝光分析): 新增头部品类分析可视化 2 months ago

README.md

ODPS 数据分析工具

从阿里云 ODPS (MaxCompute) 执行 SQL 并导出结果到 CSV。

脚本说明

脚本 功能
run_sql.py 执行 SQL 文件,导出结果
desc_table.py 查看表结构

安装依赖

pip install pyodps

使用方法

# 基本用法(默认最近 7 天)
python run_sql.py tasks/渠道再分享回流/query.sql

# 指定日期范围
python run_sql.py tasks/渠道再分享回流/query.sql --start 20251222 --end 20260103

# 预览 SQL(不执行)
python run_sql.py tasks/渠道再分享回流/query.sql --dry-run

# 额外变量
python run_sql.py tasks/xxx/query.sql --vars apptype=36

目录结构

tasks/
└── 渠道再分享回流/          # 任务目录(中文表意)
    ├── query.sql           # SQL 文件
    └── output/             # 结果自动保存到这里
        └── 20251229_20260104.csv

新建分析任务

  1. 创建目录:mkdir -p tasks/新任务名
  2. 编写 SQL,日期分区用 ${start}${end} 占位
  3. 运行查询

常用指标说明

字段 含义 计算方式
exp 曝光次数 -
str 分享率 share_cnt / exp
ros 回流分享比 return_n_uv / share_cnt
rovn 回流曝光比 return_n_uv / exp
vov 新曝光系数 new_exposure_cnt / exp

人群定义

人群 定义
内部 rootSourceId 为空,自然流量
外部0层 外部渠道 + 分享深度=0,买量直接触达
外部裂变 外部渠道 + 分享深度>0,买量用户分享后触达