### Control fino inline mediante lenguaje natural
S2 Pro aporta un nivel de “alma” sin precedentes a la voz. Usando sintaxis `[tag]`, puedes insertar instrucciones emocionales con precisión en cualquier parte del texto.
* **Más de 15,000 tags únicos soportados**
* Soporta descripciones libres como `[whisper in small voice]`, `[professional broadcast tone]`, `[pitch up]`
### Arquitectura Dual-Autoregressive (Dual-AR)
* **Slow AR (4B parámetros)**: modela la estructura temporal
* **Fast AR (400M parámetros)**: reconstruye detalles acústicos finos
### Alineación mediante RL
* Usa GRPO
* Señales de recompensa multidimensionales
### Rendimiento extremo en streaming
* RTF: 0.195
* TTFA: ~100 ms
* +3000 tokens/s
### Soporte multilingüe robusto
* Más de 80 idiomas
* Sin necesidad de phonemes específicos
### Generación multi-speaker nativa
Permite múltiples hablantes usando `<|speaker:i|>` en una sola generación.
### Generación multi-turno
Mantiene contexto para mejorar la naturalidad.
### Clonación de voz rápida
* Solo 10–30 segundos de audio
* Alta fidelidad de timbre y estilo
Para usar con SGLang Server, consulta el README correspondiente.
---
## Créditos
* [VITS2 (daniilrobnikov)](https://github.com/daniilrobnikov/vits2)
* [Bert-VITS2](https://github.com/fishaudio/Bert-VITS2)
* [GPT VITS](https://github.com/innnky/gpt-vits)
* [MQTTS](https://github.com/b04901014/MQTTS)
* [GPT Fast](https://github.com/pytorch-labs/gpt-fast)
* [GPT-SoVITS](https://github.com/RVC-Boss/GPT-SoVITS)
* [Qwen3](https://github.com/QwenLM/Qwen3)
## Informe Técnico
```bibtex
@misc{fish-speech-v1.4,
title={Fish-Speech: Leveraging Large Language Models for Advanced Multilingual Text-to-Speech Synthesis},
author={Shijia Liao and Yuxuan Wang and Tianyu Li and Yifan Cheng and Ruoyi Zhang and Rongzhi Zhou and Yijin Xing},
year={2024},
eprint={2411.01156},
archivePrefix={arXiv},
primaryClass={cs.SD},
url={https://arxiv.org/abs/2411.01156},
}
@misc{liao2026fishaudios2technical,
title={Fish Audio S2 Technical Report},
author={Shijia Liao and Yuxuan Wang and Songting Liu and Yifan Cheng and Ruoyi Zhang and Tianyu Li and Shidong Li and Yisheng Zheng and Xingwei Liu and Qingzheng Wang and Zhizhuo Zhou and Jiahua Liu and Xin Chen and Dawei Han},
year={2026},
eprint={2603.08823},
archivePrefix={arXiv},
primaryClass={cs.SD},
url={https://arxiv.org/abs/2603.08823},
}
```