6 gün önce · 537e17b449
--- a/app/hot_content/repository.py
+++ b/app/hot_content/repository.py
@@ -2253,6 +2253,36 @@ class HotContentRepository:
 
															             cursor.execute(sql, tuple(cleaned))
														
 
															             return int(cursor.rowcount or 0)
														
 
															+    def list_wxindex_word_names_with_dt(
														
 
															+        self,
														
 
															+        names: list[str],
														
 
															+        *,
														
 
															+        dt: str,
														
 
															+    ) -> set[str]:
														
 
															+        """返回在 hot_content_wxindex_words 中存在指定日期数据的词名集合。"""
														
 
															+        target_dt = str(dt or "").strip()
														
 
															+        normalized_names = [
														
 
															+            str(name or "").strip() for name in names if str(name or "").strip()
														
 
															+        ]
														
 
															+        if not target_dt or not normalized_names:
														
 
															+            return set()
														
 
															+        self._ensure_wxindex_words_table()
														
 
															+        placeholders = ", ".join(["%s"] * len(normalized_names))
														
 
															+        sql = f"""
														
 
															+            SELECT DISTINCT name
														
 
															+            FROM hot_content_wxindex_words
														
 
															+            WHERE dt = %s
														
 
															+              AND name IN ({placeholders})
														
 
															+        """
														
 
															+        with self.conn.cursor() as cursor:
														
 
															+            cursor.execute(sql, [target_dt, *normalized_names])
														
 
															+            rows = cursor.fetchall()
														
 
															+        return {
														
 
															+            str(row.get("name") or "").strip()
														
 
															+            for row in rows or []
														
 
															+            if str(row.get("name") or "").strip()
														
 
															+        }
														
 
															+
														
 
															     def has_wxindex_word(self, name: str) -> bool:
														
 
															         return self.get_wxindex_word_latest_dt(name) is not None
														
--- a/app/hot_content/wxindex_heat_pattern.py
+++ b/app/hot_content/wxindex_heat_pattern.py
@@ -4,7 +4,7 @@ from __future__ import annotations
 
															 import csv
														
 
															 import json
														
 
															-from datetime import date, datetime
														
 
															+from datetime import date, datetime, timedelta
														
 
															 from pathlib import Path
														
 
															 from typing import Any
														
@@ -837,6 +837,45 @@ def _persist_pending_item_record(
 
															     return int(item.get("record_id") or 0)
														
 
															+def _filter_candidates_awaiting_yesterday_score(
														
 
															+    repository: HotContentRepository,
														
 
															+    candidate_items: list[dict[str, Any]],
														
 
															+    *,
														
 
															+    yesterday_ymd: str,
														
 
															+    existing_records: dict[str, dict[str, Any]],
														
 
															+    verbose: bool,
														
 
															+) -> tuple[list[dict[str, Any]], int]:
														
 
															+    """初始化完成后：未完成热度分析且缺少昨日指数数据的词留待下次执行。"""
														
 
															+    names_to_check = [
														
 
															+        item["name"]
														
 
															+        for item in candidate_items
														
 
															+        if not _is_heat_analysis_done(existing_records.get(item["name"]))
														
 
															+    ]
														
 
															+    if not names_to_check:
														
 
															+        return candidate_items, 0
														
 
															+
														
 
															+    names_with_yesterday = repository.list_wxindex_word_names_with_dt(
														
 
															+        names_to_check,
														
 
															+        dt=yesterday_ymd,
														
 
															+    )
														
 
															+    ready_items: list[dict[str, Any]] = []
														
 
															+    awaiting_count = 0
														
 
															+    for item in candidate_items:
														
 
															+        name = item["name"]
														
 
															+        if _is_heat_analysis_done(existing_records.get(name)):
														
 
															+            ready_items.append(item)
														
 
															+            continue
														
 
															+        if name in names_with_yesterday:
														
 
															+            ready_items.append(item)
														
 
															+            continue
														
 
															+        awaiting_count += 1
														
 
															+        if verbose:
														
 
															+            print(
														
 
															+                f"await yesterday score word={name} dt={yesterday_ymd}, skip this run"
														
 
															+            )
														
 
															+    return ready_items, awaiting_count
														
 
															+
														
 
															+
														
 
															 def _init_candidate_wxindex_word_records(
														
 
															     repository: HotContentRepository,
														
 
															     candidate_items: list[dict[str, Any]],
														
@@ -1092,6 +1131,7 @@ def run_wxindex_heat_pattern_daily_job(
 
															         "demand_match_batches": 0,
														
 
															         "senior_fit_batches": 0,
														
 
															         "records_initialized": 0,
														
 
															+        "awaiting_yesterday_score": 0,
														
 
															         "heat_resumed": 0,
														
 
															         "demand_match_resumed": 0,
														
 
															         "senior_fit_resumed": 0,
														
@@ -1149,6 +1189,17 @@ def run_wxindex_heat_pattern_daily_job(
 
															             analyze_ymd=analyze_ymd,
														
 
															             names=candidate_names,
														
 
															         )
														
 
															+
														
 
															+    yesterday_ymd = (current - timedelta(days=1)).strftime("%Y%m%d")
														
 
															+    candidate_items, awaiting_yesterday = _filter_candidates_awaiting_yesterday_score(
														
 
															+        repository,
														
 
															+        candidate_items,
														
 
															+        yesterday_ymd=yesterday_ymd,
														
 
															+        existing_records=existing_records,
														
 
															+        verbose=verbose,
														
 
															+    )
														
 
															+    summary["awaiting_yesterday_score"] = awaiting_yesterday
														
 
															+
														
 
															     for item in candidate_items:
														
 
															         if not item.get("record_id"):
														
 
															             existing = existing_records.get(item["name"])