1 неделя назад · eb612ece8c
--- a/examples/mode_workflow/server.py
+++ b/examples/mode_workflow/server.py
@@ -15,6 +15,7 @@
 
				 import hashlib
			
 
				 import json
			
 
				 import os
			
 
				+import re
			
 
				 import subprocess
			
 
				 import sys
			
 
				 import threading
			
@@ -472,7 +473,10 @@ class Handler(BaseHTTPRequestHandler):
 
				             elif u.path == "/api/category_tree":
			
 
				                 self._json_etag(_category_tree(qs.get("source_type", "实质")))
			
 
				             elif u.path == "/api/query_score":
			
 
				-                cache = SCORE_CACHE_DIR / f"{qs.get('sel', '')}.json"
			
 
				+                sel = qs.get("sel", "")
			
 
				+                if not re.fullmatch(r"[0-9a-f]{16}", sel):   # 防路径穿越:sel 必为 16 位十六进制
			
 
				+                    return self._err("bad sel", 400)
			
 
				+                cache = SCORE_CACHE_DIR / f"{sel}.json"
			
 
				                 if cache.is_file():
			
 
				                     self._json_etag(json.loads(cache.read_text(encoding="utf-8")))
			
 
				                 else:
			
--- a/examples/mode_workflow/stages/query_score.py
+++ b/examples/mode_workflow/stages/query_score.py
@@ -72,7 +72,19 @@ async def _call_with_retry(llm_call, messages, model, task_name, max_retries=3):
 
				         try:
			
 
				             resp = await llm_call(messages=cur_messages, model=model,
			
 
				                                   temperature=0.1, max_tokens=4000)
			
 
				-            cost = resp.get("cost") or 0.0
			
 
				+            # 成本:优先用 provider 自带 cost;缺省时按 token 用量估(同 llm_helper 口径)
			
 
				+            provider_cost = resp.get("cost")
			
 
				+            if isinstance(provider_cost, (int, float)) and provider_cost > 0:
			
 
				+                cost = provider_cost
			
 
				+            else:
			
 
				+                usage = resp.get("usage") or {}
			
 
				+                if hasattr(usage, "__dict__"):
			
 
				+                    it = getattr(usage, "input_tokens", 0) or getattr(usage, "prompt_tokens", 0)
			
 
				+                    ot = getattr(usage, "output_tokens", 0) or getattr(usage, "completion_tokens", 0)
			
 
				+                else:
			
 
				+                    it = usage.get("input_tokens", 0) or usage.get("prompt_tokens", 0)
			
 
				+                    ot = usage.get("output_tokens", 0) or usage.get("completion_tokens", 0)
			
 
				+                cost = (it / 1e6 * 3.0) + (ot / 1e6 * 15.0)
			
 
				             total_cost += cost
			
 
				             content = resp.get("content", "")
			
 
				             if isinstance(content, list):