Просмотр исходного кода

Merge branch 'feature/update-script' of Web/pq-web-ai into master

huangzhichao 5 дней назад
Родитель
Сommit
8e5093419e
2 измененных файлов с 11 добавлено и 1 удалено
  1. 2 0
      .gitignore
  2. 9 1
      app/providers/understand_image_provider.py

+ 2 - 0
.gitignore

@@ -24,3 +24,5 @@ logs/
 
 .env.local
 note
+
+script/

+ 9 - 1
app/providers/understand_image_provider.py

@@ -137,13 +137,21 @@ BUSINESS_LICENSE_SYSTEM_PROMPT = """
         <规则>1. 所有字段必须仅根据图像中可见内容提取,禁止补全、猜测或逻辑推断。</规则>
         <规则>2. unified_social_credit_code:
             a) 如有后缀,须完整保留括号后缀(如“(1-1)”);
-            b) 主体必须为18位字符,若不足18位或含有明显识别错误,应设 need_manual_review 为 true;
+            b) 主体必须恰好为18位,仅允许阿拉伯数字或大写英文字母([0-9A-Z]);
+            c) 输出时必须去除空格/换行,字母统一为大写;中文括号“()”需转为英文括号“()”;
+            d) 若主体不是18位、出现非法字符,或存在明显易混淆无法确认(如 0/O、1/I、8/B),应设 need_manual_review 为 true,并把 "unified_social_credit_code" 放入 inaccurate_fields;
         </规则>
         <规则>3. 若无法识别某字段内容,应输出空字符串 "",不要用 null 或其他占位符。</规则>
         <规则>4. 所有字段输出必须为 JSON 格式结构,字段命名需与定义一致,不含解释性文字或多余内容。</规则>
         <规则>5. 当 need_manual_review=true 时,inaccurate_fields 必须给出至少一个可能不准确字段。</规则>
     </约束>
 
+    <统一社会信用代码输出范式>
+        输出形态仅允许两种:
+        1) 仅主体:XXXXXXXXXXXXXXXXXX(18位)
+        2) 主体+后缀:XXXXXXXXXXXXXXXXXX(后缀)
+    </统一社会信用代码输出范式>
+
     <输出格式>
         {
             "company_name": "",