3 недель назад · f892acc02b
--- a/examples/auto_put_ad_mini/prompts/system.prompt
+++ b/examples/auto_put_ad_mini/prompts/system.prompt
@@ -76,11 +76,12 @@ Step 3: calculate_roi_metrics     ← 计算ROI（依赖Step 1+2的数据）
 
				     ↓
			
 
				 Step 4: get_ads_for_review        ← 分类（零消耗待关停 / 需评估 / 正常运行）
			
 
				     ↓
			
 
				-Step 5: AI推理决策                 ← 对【待评估（候选）】广告推理
			
 
				-         · 参考 roi_zone 和 fission_vs_tier 字段做**综合判断**
			
 
				-         · ROI 在降价区间时，必须检查裂变率再决定是 bid_down 还是 observe
			
 
				-         · 在**一次 LLM 输出**里为所有候选广告生成完整 JSON 数组（含 ad_id / action / pct / reason / confidence）
			
 
				-         · 注意力管理：按 tier 分组依次评估，同 tier 内共用同一基线
			
 
				+Step 5: AI推理决策                 ← 对【待评估（候选）】广告推理（按 tier 分批）
			
 
				+         · **分批策略**：从 get_ads_for_review 的 tier_batches 中读取分批数据
			
 
				+         · **循环处理**：依次处理每个 tier_batch，为每批广告生成决策 JSON 数组
			
 
				+         · **决策依据**：参考 roi_zone 和 fission_vs_tier 字段做**综合判断**
			
 
				+         · **裂变检查**：ROI 在降价区间时，必须检查裂变率再决定是 bid_down 还是 observe
			
 
				+         · **累积提交**：所有 tier 处理完毕后，合并为完整决策数组，**一次性调用 apply_decisions**
			
 
				     ↓
			
 
				 Step 6: apply_decisions           ← 主 Agent 把第 5 步输出的 JSON 数组整体喂给 apply_decisions
			
 
				     ↓
			
@@ -98,14 +99,26 @@ Step 10: generate_report          ← 生成报告
 
				 - 如果先调用 `calculate_roi_metrics` 而不先 `fetch + merge`，会因缺少最新数据而得到错误结果
			
 
				 - **正确做法**：先 `fetch_creative_data` → 再 `merge_creative_data` → 最后 `calculate_roi_metrics`
			
 
				 
			
 
				-### ⚡ 候选广告评估：一次性全量提交
			
 
				+### ⚡ 候选广告评估：按 tier 分批处理，累积后一次性提交
			
 
				 
			
 
				-**`apply_decisions` 是覆盖式工具，只调一次，必须包含所有候选**——遗漏的会被默认 `hold` 覆盖（已实测 bid_down 被吞 bug）。**宁可 reason 写短，也要全部覆盖**。
			
 
				+**分批流程（Step 5 必须严格遵守）**：
			
 
				 
			
 
				-**reason 写法**对齐范例风格（紧凑、单句、含核心数值即可）：
			
 
				-> "动态 ROI 为 4.42，高于渠道P50 3.48 的 27%；投放 266 天，消耗稳定 21 天；建议扩量。"
			
 
				+1. **读取批次列表**：从 `get_ads_for_review` 结果的 `tier_batches` 中获取所有 tier 批次
			
 
				+2. **循环处理每个 tier**：
			
 
				+   - 读取 `tier_batch["ads"]` 列表（单个 tier 通常 20-40 条，远小于全量 100+）
			
 
				+   - 为该 tier 的所有广告生成决策 JSON 数组（格式见下方）
			
 
				+   - 同 tier 内广告特征相似，共用同一基线，判断更聚焦
			
 
				+   - 将决策数组累积到总列表
			
 
				+3. **一次性提交**：所有 tier 处理完毕后，合并为完整决策数组，**调用一次 apply_decisions**
			
 
				 
			
 
				-**禁止**：多次调 `apply_decisions`（后调吞前调）、`agent(task=...)` 委托子 Agent（拿不回结构化决策）。
			
 
				+**分批收益**：单批输入量降低 60%-80%，减少"lost in the middle"现象，决策质量显著提升。
			
 
				+
			
 
				+**关键约束**：
			
 
				+- ✅ **允许**：分 tier 逐批推理（降低单次输入量，提升质量）
			
 
				+- ✅ **允许**：reason 写短（紧凑、单句、含核心数值）：*"动态 ROI 为 4.42，高于渠道P50 3.48 的 27%；投放 266 天，消耗稳定 21 天；建议扩量。"*
			
 
				+- ❌ **禁止**：多次调 `apply_decisions`（后调吞前调，已实测 bug）
			
 
				+- ❌ **禁止**：`agent(task=...)` 委托子 Agent（拿不回结构化决策）
			
 
				+- ⚠️ **必须**：所有候选全部覆盖（遗漏的会被默认 `hold` 覆盖）
			
 
				 
			
 
				 ### 灵活性与强制规则
			
 
				 
			
@@ -129,25 +142,9 @@ Step 10: generate_report          ← 生成报告
 
				 ```
			
 
				 
			
 
				 **理由编写规范**：
			
 
				-- 自然中文，禁用英文变量名（`pause_line`→"关停线"、`bid_down_line`→"降价线"、`bid_up_line`→"提价线"、`bid_increased_7d`→"7天内已提价"）
			
 
				-- 引用具体数值（ROI/阈值/消耗），用分号连接多个判断
			
 
				+- 理由用自然中文，引用具体数值（ROI/阈值/消耗），用分号连接多个判断
			
 
				 - `confidence` 与数据支撑度一致；`recommended_change_pct` 为小数（+0.05=提5%），单次绝对值 ≤ 0.10
			
 
				 
			
 
				-每条 reason 必须包含 5 个语义元素（ROI 值 / 对比基准 / 偏离% / 辅助信号 / 行动建议），详见 decision-strategy skill §七。
			
 
				-
			
 
				-每条 reason 必须体现多维度综合判断——具体维度和权衡原则见 decision-strategy、posterior-wisdom skill。
			
 
				-
			
 
				-### ⚠️ 降价决策的裂变率检查（必须执行）
			
 
				-
			
 
				-当 roi_zone = "bid_down_zone" 时，**必须检查 fission_vs_tier 再做决策**：
			
 
				-
			
 
				-- fission_vs_tier = "low" → 可以 bid_down（ROI低+裂变低，双低确认）
			
 
				-- fission_vs_tier = "normal" → 改 observe（裂变正常，ROI低可能暂时）
			
 
				-- fission_vs_tier = "high" → 改 observe 或 hold（裂变优秀，有长期价值）
			
 
				-- fission_vs_tier = "unknown" → 改 observe（数据不足不决策）
			
 
				-
			
 
				-**禁止**：仅因 roi_zone="bid_down_zone" 就判定 bid_down，必须结合裂变信号。
			
 
				-
			
 
				 **硬约束**：
			
 
				 - reason 中禁止出现英文变量名（pause_line、bid_down_line、tier_roi_p50 等），改用中文术语
			
 
				 - reason 不得模板化（错例："ROI 低于线建议降价"；正例见 posterior-wisdom skill 的反例警示）
			
--- a/examples/auto_put_ad_mini/tools/ad_decision.py
+++ b/examples/auto_put_ad_mini/tools/ad_decision.py
@@ -367,7 +367,7 @@ async def get_ads_for_review(
 
				         roi_p90 = float(roi_series.quantile(0.90)) if len(roi_series) > 0 else 0.0
			
 
				 
			
 
				         # 加载调整历史（用于"持续低ROI升级关停"判断）
			
 
				-        from guardrails import AdjustmentHistory
			
 
				+        from tools.guardrails import AdjustmentHistory
			
 
				         adjustment_history = AdjustmentHistory()
			
 
				 
			
 
				         # 分类（业务语言）
			
@@ -711,13 +711,13 @@ async def get_ads_for_review(
 
				             tier = str(ad.get("audience_tier", "default") or "default")
			
 
				             review_by_tier.setdefault(tier, []).append(ad)
			
 
				 
			
 
				-        # tier 分组摘要（便于 LLM 快速判断是否需要分发子 Agent）
			
 
				+        # tier 分批：每个 tier 单独评估（降低单次 LLM 输入量，提升质量）
			
 
				         tier_batches = sorted(
			
 
				             [
			
 
				                 {
			
 
				                     "audience_tier": t,
			
 
				                     "count": len(ads),
			
 
				-                    "ad_ids": [a.get("ad_id") for a in ads],
			
 
				+                    "ads": ads,  # 完整广告数据
			
 
				                 }
			
 
				                 for t, ads in review_by_tier.items()
			
 
				             ],
			
@@ -762,10 +762,10 @@ async def get_ads_for_review(
 
				             # 仅传入规模 + 10 条样本（供 LLM 追溯形态，避免 1000+ 条名单挤占 context）
			
 
				             "zero_spend_ads_count": len(zero_spend_ads),
			
 
				             "zero_spend_ads_samples": zero_spend_ads[:10],
			
 
				-            "need_review_ads": need_review_ads,
			
 
				-            # ★ 新增：按 tier 分组（用于 agent(task=[...]) 并发评估）
			
 
				-            "review_by_tier": review_by_tier,
			
 
				+            # ★ 按 tier 分批评估（降低单次 LLM 输入量，提升决策质量）
			
 
				+            # tier_batches 包含完整广告数据，LLM 需循环处理每个 batch
			
 
				             "tier_batches": tier_batches,
			
 
				+            "need_review_ads_total": len(need_review_ads),  # 总数统计
			
 
				         }
			
 
				 
			
 
				         output_json = json.dumps(result, ensure_ascii=False, indent=2)
			
--- a/examples/auto_put_ad_mini/tools/report_generator.py
+++ b/examples/auto_put_ad_mini/tools/report_generator.py
@@ -23,23 +23,17 @@ _MINI_DIR = Path(__file__).resolve().parent.parent
 
				 _REPORTS_DIR = _MINI_DIR / "outputs" / "reports"
			
 
				 
			
 
				 # 最终输出列顺序（审批表格：简洁版，去掉技术性列）
			
 
				+# 与 im_approval.py 的 APPROVAL_COLUMNS 保持一致（15列精简版）
			
 
				 OUTPUT_COLUMNS = [
			
 
				-    # 核心标识（优先显示）
			
 
				-    "account_id", "ad_id", "cost_7d_avg",
			
 
				+    # 核心标识（前5列，含决策动作）
			
 
				+    "approval_date", "account_id", "ad_id", "cost_7d_avg", "action",
			
 
				     # 基础信息
			
 
				-    "ad_name", "audience_tier", "create_time", "ad_age_days", "bid_amount",
			
 
				-    # 昨日表现
			
 
				-    "yesterday_cost", "yesterday_roi",
			
 
				-    # 7日汇总
			
 
				-    "cost_7d_total", "revenue_7d_total",
			
 
				-    # 动态ROI（决策参考核心指标）
			
 
				-    "动态ROI", "动态ROI_7日均值",
			
 
				-    # 30日上下文
			
 
				-    "cost_30d_total", "cost_30d_avg",
			
 
				-    "stable_spend_days_30d", "creative_count",
			
 
				-    # 决策
			
 
				-    "action", "dimension", "reason",
			
 
				-    "recommended_change_pct", "current_bid", "recommended_bid",
			
 
				+    "ad_name", "audience_tier", "ad_age_days", "bid_amount",
			
 
				+    # 关键指标
			
 
				+    "动态ROI_7日均值", "cost_7d_total", "revenue_7d_total",
			
 
				+    # 决策详情
			
 
				+    "dimension", "reason",
			
 
				+    "recommended_change_pct",
			
 
				 ]
			
 
				 
			
 
				 # 中文列名映射
			
@@ -214,6 +208,9 @@ async def generate_report(
 
				 
			
 
				         _REPORTS_DIR.mkdir(parents=True, exist_ok=True)
			
 
				 
			
 
				+        # 添加审批日期列（当前日期）
			
 
				+        df["approval_date"] = datetime.now().strftime("%Y-%m-%d")
			
 
				+
			
 
				         # 选择输出列（存在的列）
			
 
				         cols = [c for c in OUTPUT_COLUMNS if c in df.columns]
			
 
				         df_out = df[cols].copy()