!!! warning
私たちは、コードベースの違法な使用について一切の責任を負いません。お住まいの地域の DMCA(デジタルミレニアム著作権法)およびその他の関連法を参照してください。 <br/>
このコードベースとモデルは、CC-BY-NC-SA-4.0 ライセンス下でリリースされています。
Window にて開発を行っている方へ: 本コードベースを実行するのに WSL2 または Docker を利用することができます。
あまり詳しくない人は、Linux 環境なしでコードベースを実行するために以下の手順に従ってください。(モデルコンパイル機能torch.compileを利用できます。):
install_env.batを開いて実行に必要な環境を整えます。
install_env.batのUSE_MIRRORミラーサイトを使用する場合、項目を編集してください。USE_MIRROR=falseは、最新の安定版のtorchをオリジナルサイトからダウンロードします。USE_MIRROR=trueは、最新のtorchをミラーサイトからダウンロードします。デフォルトはtrueです。install_env.batのINSTALL_TYPEを編集して、コンパイル環境をダウンロードするかを設定できます。INSTALL_TYPE=previewは、コンパイル環境付きのプレビュー版をダウンロードします。INSTALL_TYPE=stableは、コンパイル環境なしの安定版をダウンロードします。USE_MIRROR=previewの場合、オプション、コンパイルモデル環境を有効にするたに以下のステップを実行してください。:
LLVM-17.0.6-win64.exeをダウンロードした後、ダブルクリックしてインストールし、適当な場所にインストールしてください。必ずAdd Path to Current Userをチェックして環境変数に追加することです。Modifyボタンをクリックし、Desktop development with C++オプションにチェックをつけてダウンロードします。start.batを実行し、Fish-Speechのトレーニング/推論設定WebUIを開いてください。。
API_FLAGS.txtの最初の3行を次のように変更してください:
--infer
# --api
# --listen ...
...
API_FLAGS.txtの最初の3行を次のように変更してください:
# --infer
--api
--listen ...
...
run_cmd.batをダブルクリックして、このプロジェクトの仮想環境を有効化できます。# python 3.10の仮想環境を作成します。virtualenvも使用できます。
conda create -n fish-speech python=3.10
conda activate fish-speech
# pytorchをインストールします。
pip3 install torch torchvision torchaudio
# fish-speechをインストールします。
pip3 install -e .[stable]
# (Ubuntu / Debianユーザー) soxをインストールします。
apt install libsox-dev
lora微調整サポートを追加しました。gradient checkpointing、causual sampling、およびflash-attnサポートを追加しました。text2semanticモデルを更新し、自由音素モードをサポートしました。