!!! warning 我们不对代码库的任何非法使用承担任何责任. 请参阅您当地关于 DMCA (数字千年法案) 和其他相关法律法规.
此代码库根据 BSD-3-Clause 许可证发布, 所有模型根据 CC-BY-NC-SA-4.0 许可证发布.
我们建议 Windows 用户使用 WSL2 或 docker 来运行代码库, 或者使用由社区开发的整合环境.
Windows 专业用户可以考虑 WSL2 或 docker 来运行代码库。
Windows 非专业用户可考虑以下为免 Linux 环境的基础运行方法(附带模型编译功能,即 torch.compile):
install_env.bat安装环境。
install_env.bat的USE_MIRROR项来决定是否使用镜像站下载。preview, 使用镜像站且使用最新开发版本 torch(唯一激活编译方式)。false使用原始站下载环境。true为从镜像站下载稳定版本 torch 和其余环境。(可跳过,此步为激活编译模型环境)
LLVM编译器。
LLVM-17.0.6-win64.exe后,双击进行安装,选择合适的安装位置,最重要的是勾选Add Path to Current User添加环境变量。Microsoft Visual C++ 可再发行程序包, 解决潜在.dll丢失问题。
双击start.bat, 进入 Fish-Speech 训练推理配置 WebUI 页面。
API_FLAGS.txt, 前三行修改成如下格式: --infer
# --api
# --listen ...
...
API_FLAGS.txt, 前三行修改成如下格式: # --infer
--api
--listen ...
...
run_cmd.bat进入本项目的 conda/python 命令行环境# 创建一个 python 3.10 虚拟环境, 你也可以用 virtualenv
conda create -n fish-speech python=3.10
conda activate fish-speech
# 安装 pytorch
pip3 install torch torchvision torchaudio
# 安装 fish-speech
pip3 install -e .
# (Ubuntu / Debian 用户) 安装 sox
apt install libsox-dev
lora 微调支持.gradient checkpointing, causual sampling 和 flash-attn 支持.text2semantic 模型, 支持无音素模式.