浏览代码

性能优化,优化计算 token 的 cpu 开销

luojunhui 1 周之前
父节点
当前提交
2972643ffa
共有 1 个文件被更改,包括 1 次插入1 次删除
  1. 1 1
      applications/utils/chunks/topic_aware_chunking.py

+ 1 - 1
applications/utils/chunks/topic_aware_chunking.py

@@ -146,7 +146,7 @@ class TopicAwarePackerV2(TopicAwareChunker):
                     dataset_id=dataset_id,
                     text=text,
                     chunk_id=index,
-                    tokens=num_tokens(text),
+                    tokens=tokens,
                     text_type=text_type,
                     status=status,
                 )