!!! warning 私たちは、コードベースの違法な使用について一切の責任を負いません。お住まいの地域の DMCA(デジタルミレニアム著作権法)およびその他の関連法については、現地の法律を参照してください。
このコードベースは BSD-3-Clause ライセンスの下でリリースされており、すべてのモデルは CC-BY-NC-SA-4.0 ライセンスの下でリリースされています。
Windows のプロユーザーは、コードベースを実行するために WSL2 または Docker を検討することができます。
非プロの Windows ユーザーは、Linux 環境なしでコードベースを実行するために以下の方法を検討することができます(モデルコンパイル機能付き、つまり torch.compile):
install_env.batをクリックして環境をインストールします。
install_env.batのUSE_MIRROR項目を編集して、ミラーサイトを使用するかどうかを決定できます。USE_MIRROR=falseは、最新の安定版torchをオリジナルサイトからダウンロードします。USE_MIRROR=trueは、最新のtorchをミラーサイトからダウンロードします。デフォルトはtrueです。install_env.batのINSTALL_TYPE項目を編集して、コンパイル環境のダウンロードを有効にするかどうかを決定できます。INSTALL_TYPE=previewは、コンパイル環境付きのプレビュー版をダウンロードします。INSTALL_TYPE=stableは、コンパイル環境なしの安定版をダウンロードします。USE_MIRROR=previewの場合、このステップを実行します(オプション、コンパイルモデル環境を有効にするため):
LLVM-17.0.6-win64.exeをダウンロードした後、ダブルクリックしてインストールし、適切なインストール場所を選択し、最も重要なのはAdd Path to Current Userをチェックして環境変数に追加することです。Modifyボタンをクリックし、Desktop development with C++オプションを見つけてチェックしてダウンロードします。start.batをダブルクリックして、Fish-Speechトレーニング推論設定WebUIページに入ります。
API_FLAGS.txtを編集し、最初の3行を次のように変更します:
--infer
# --api
# --listen ...
...
API_FLAGS.txtを編集し、最初の3行を次のように変更します:
# --infer
--api
--listen ...
...
run_cmd.batをダブルクリックして、このプロジェクトのconda/pythonコマンドライン環境に入ります。# python 3.10仮想環境を作成します。virtualenvも使用できます。
conda create -n fish-speech python=3.10
conda activate fish-speech
# pytorchをインストールします。
pip3 install torch torchvision torchaudio
# fish-speechをインストールします。
pip3 install -e .
# (Ubuntu / Debianユーザー) soxをインストールします。
apt install libsox-dev
lora微調整サポートを追加しました。gradient checkpointing、causual sampling、およびflash-attnサポートを追加しました。text2semanticモデルを更新し、音素フリーモードをサポートしました。