lyuxiang.lx 1 рік тому
батько
коміт
bcda6d807c
1 змінених файлів з 1 додано та 0 видалено
  1. 1 0
      cosyvoice/cli/frontend.py

+ 1 - 0
cosyvoice/cli/frontend.py

@@ -78,6 +78,7 @@ class CosyVoiceFrontEnd:
         return text_token, text_token_len
 
     def _extract_speech_token(self, speech):
+        assert speech.shape[1] / 16000 <= 30, 'do not support extract speech token for audio longer than 30s'
         feat = whisper.log_mel_spectrogram(speech, n_mels=128)
         speech_token = self.speech_tokenizer_session.run(None,
                                                          {self.speech_tokenizer_session.get_inputs()[0].name: