Sin descripción

Lengyue 01cf9bbafd Fix dataset and training loop hace 2 años
preparing_data 9adf687fb1 Update base training code hace 2 años
speech_lm 01cf9bbafd Fix dataset and training loop hace 2 años
.dockerignore 70797ef7d5 Add dockerignore hace 2 años
.gitignore 7650b2ac43 Update much robust dataloader hace 2 años
.pre-commit-config.yaml e4ce816175 Update deps hace 2 años
.project-root aa0a6be778 init training code hace 2 años
README.md e4ce816175 Update deps hace 2 años
dockerfile 7650b2ac43 Update much robust dataloader hace 2 años
ds_config.json db0aa1a99a Init preprocessing tools hace 2 años
requirements.txt 7650b2ac43 Update much robust dataloader hace 2 años
setup.py 7650b2ac43 Update much robust dataloader hace 2 años
train.sh a0a5c3e95c Update training script hace 2 años

README.md

Speech LLM

Setup

# Basic environment setup
conda create -n speech-llm python=3.10
conda activate speech-llm
conda install pytorch torchvision torchaudio pytorch-cuda=12.1 -c pytorch -c nvidia

# Install requirements
pip3 install -r requirements.txt

# Install flash-attn
MAX_JOBS=4 pip install flash-attn --no-build-isolation