11 months ago · c939c80480
--- a/cosyvoice/llm/llm.py
+++ b/cosyvoice/llm/llm.py
@@ -441,6 +441,8 @@ class Qwen2LM(TransformerLM):
 
															                     # in stream mode, yield token one by one
														
 
															                     yield top_ids
														
 
															                     out_tokens.append(top_ids)
														
 
															+                    if len(out_tokens) == max_len:
														
 
															+                        break
														
 
															                 time.sleep(0.001)
														
 
															             with self.lock:
														
 
															                 self.vllm_output_queue.pop(uuid)