Нема описа

Lengyue 311a8b64ea Add hubert dataset and hubert model пре 2 година
preparing_data 9adf687fb1 Update base training code пре 2 година
speech_lm 311a8b64ea Add hubert dataset and hubert model пре 2 година
.dockerignore 70797ef7d5 Add dockerignore пре 2 година
.gitignore c88bf969b1 Update gitignore пре 2 година
.pre-commit-config.yaml e4ce816175 Update deps пре 2 година
.project-root aa0a6be778 init training code пре 2 година
README.md e4ce816175 Update deps пре 2 година
dockerfile db347ca973 Add llm exp code пре 2 година
ds_config.json db0aa1a99a Init preprocessing tools пре 2 година
requirements.txt db347ca973 Add llm exp code пре 2 година
train.sh a0a5c3e95c Update training script пре 2 година

README.md

Speech LLM

Setup

# Basic environment setup
conda create -n speech-llm python=3.10
conda activate speech-llm
conda install pytorch torchvision torchaudio pytorch-cuda=12.1 -c pytorch -c nvidia

# Install requirements
pip3 install -r requirements.txt

# Install flash-attn
MAX_JOBS=4 pip install flash-attn --no-build-isolation