Нет описания

Ftps 82aa6e823e [chore] add docs for macos (#544) 1 год назад
.github d4d698c922 rename image to reduce confusion 1 год назад
docs 82aa6e823e [chore] add docs for macos (#544) 1 год назад
fish_speech 711209e541 update clean text for new model 1 год назад
tools 78a321878d Update v1.4 readmes & samples (#592) 1 год назад
.dockerignore e413df7145 perf: Optimizing docker builds (#547) 1 год назад
.gitignore e9394c71f0 keep up with official close-source api (#513) 1 год назад
.pre-commit-config.yaml de565f73ea [pre-commit.ci] pre-commit autoupdate (#447) 1 год назад
.project-root 5707699dfd Handle adaptive number of codebooks 2 лет назад
.readthedocs.yaml fe293ca492 Use readthedocs instead of github action 2 лет назад
API_FLAGS.txt dad516d86d update checkpoint path 1 год назад
LICENSE b91815e074 Switch to CC-BY-NC-SA 4.0 license 1 год назад
README.ja.md 78a321878d Update v1.4 readmes & samples (#592) 1 год назад
README.md 78a321878d Update v1.4 readmes & samples (#592) 1 год назад
README.pt-BR.md 78a321878d Update v1.4 readmes & samples (#592) 1 год назад
README.zh.md 78a321878d Update v1.4 readmes & samples (#592) 1 год назад
docker-compose.dev.yml f6c56c68d4 Update docker-compose.dev.yml 1 год назад
dockerfile 776c00f69b Add ffmpeg 1 год назад
dockerfile.dev dd14391692 optimize dockerbuild 1 год назад
entrypoint.sh e413df7145 perf: Optimizing docker builds (#547) 1 год назад
inference.ipynb dad516d86d update checkpoint path 1 год назад
install_env.bat ad55185ec3 Fix cache max_seq_len (#568) 1 год назад
mkdocs.yml 4f097ef2f4 remove ghcr & update docker registry 1 год назад
pyproject.toml 3e49f07821 Update pytorch version (#538) 1 год назад
pyrightconfig.json 6d57066e52 Update pre-commit hook 2 лет назад
run_cmd.bat 8702c61100 From whisper to sensevoice (#482) 1 год назад
start.bat 46440f25be 对脚本的一点小修改 (#414) 1 год назад

README.ja.md

Fish Speech

[English](README.md) | [简体中文](README.zh.md) | [Portuguese](README.pt-BR.md) | **日本語**




このコードベースとすべてのモデルは、CC-BY-NC-SA-4.0ライセンスの下でリリースされています。詳細については、LICENSEを参照してください。


機能

  1. ゼロショット & フューショット TTS:10〜30秒の音声サンプルを入力して、高品質のTTS出力を生成します。詳細は 音声クローンのベストプラクティス を参照してください。
  2. 多言語 & クロスリンガル対応:多言語テキストを入力ボックスにコピーペーストするだけで、言語を気にする必要はありません。現在、英語、日本語、韓国語、中国語、フランス語、ドイツ語、アラビア語、スペイン語に対応しています。
  3. 音素依存なし:このモデルは強力な汎化能力を持ち、TTSに音素を必要としません。あらゆる言語スクリプトに対応可能です。
  4. 高精度:5分間の英語テキストに対し、CER(文字誤り率)とWER(単語誤り率)は約2%の精度を達成します。
  5. 高速:fish-techアクセラレーションにより、Nvidia RTX 4060ラップトップではリアルタイムファクターが約1:5、Nvidia RTX 4090では約1:15です。
  6. WebUI 推論:使いやすいGradioベースのWebユーザーインターフェースを搭載し、Chrome、Firefox、Edgeなどのブラウザに対応しています。
  7. GUI 推論:PyQt6のグラフィカルインターフェースを提供し、APIサーバーとシームレスに連携します。Linux、Windows、macOSに対応しています。GUIを見る
  8. デプロイしやすい:Linux、Windows、macOSにネイティブ対応した推論サーバーを簡単にセットアップでき、速度の低下を最小限に抑えます。

免責事項

コードベースの違法な使用については一切責任を負いません。DMCA(デジタルミレニアム著作権法)およびその他の関連法については、地域の法律を参照してください。

オンラインデモ

Fish Audio

ローカル推論のクイックスタート

inference.ipynb

ビデオ

V1.4 デモビデオ: https://www.bilibili.com/video/BV1pu46eVEk7

V1.2 デモビデオ: https://www.bilibili.com/video/BV1wz421B71D

V1.1 デモビデオ: https://www.bilibili.com/video/BV1zJ4m1K7cj

ドキュメント

サンプル (2024/10/02 V1.4)

クレジット

スポンサー