Procházet zdrojové kódy

fix the bug where non-english speech will always prepend sentences with 'speak' (#652)

cocktailpeanut před 1 rokem
rodič
revize
ec2c5b70fb
1 změnil soubory, kde provedl 1 přidání a 1 odebrání
  1. 1 1
      tools/llama/generate.py

+ 1 - 1
tools/llama/generate.py

@@ -602,7 +602,7 @@ def encode_tokens(
     num_codebooks=4,
     num_codebooks=4,
 ):
 ):
     string = clean_text(string)
     string = clean_text(string)
-    string = f"<|im_start|>user\nSpeak: {string}<|im_end|><|im_start|>assistant\n"
+    string = f"<|im_start|>user\n{string}<|im_end|><|im_start|>assistant\n"
 
 
     new_tokens = tokenizer.encode(
     new_tokens = tokenizer.encode(
         string,
         string,