ODPS 数据分析工具
从阿里云 ODPS (MaxCompute) 执行 SQL 并导出结果到 CSV。
脚本说明
| 脚本 |
功能 |
run_sql.py |
执行 SQL 文件,导出结果 |
desc_table.py |
查看表结构 |
安装依赖
pip install pyodps
使用方法
# 基本用法(默认最近 7 天)
python run_sql.py tasks/渠道再分享回流/query.sql
# 指定日期范围
python run_sql.py tasks/渠道再分享回流/query.sql --start 20251222 --end 20260103
# 预览 SQL(不执行)
python run_sql.py tasks/渠道再分享回流/query.sql --dry-run
# 额外变量
python run_sql.py tasks/xxx/query.sql --vars apptype=36
目录结构
tasks/
└── 渠道再分享回流/ # 任务目录(中文表意)
├── query.sql # SQL 文件
└── output/ # 结果自动保存到这里
└── 20251229_20260104.csv
新建分析任务
- 创建目录:
mkdir -p tasks/新任务名
- 编写 SQL,日期分区用
${start} 和 ${end} 占位
- 运行查询
常用指标说明
| 字段 |
含义 |
计算方式 |
| exp |
曝光次数 |
- |
| str |
分享率 |
share_cnt / exp |
| ros |
回流分享比 |
return_n_uv / share_cnt |
| rovn |
回流曝光比 |
return_n_uv / exp |
| vov |
新曝光系数 |
new_exposure_cnt / exp |
人群定义
| 人群 |
定义 |
| 内部 |
rootSourceId 为空,自然流量 |
| 外部0层 |
外部渠道 + 分享深度=0,买量直接触达 |
| 外部裂变 |
外部渠道 + 分享深度>0,买量用户分享后触达 |