Tidak Ada Deskripsi

Lengyue 01cf9bbafd Fix dataset and training loop 2 tahun lalu
preparing_data 9adf687fb1 Update base training code 2 tahun lalu
speech_lm 01cf9bbafd Fix dataset and training loop 2 tahun lalu
.dockerignore 70797ef7d5 Add dockerignore 2 tahun lalu
.gitignore 7650b2ac43 Update much robust dataloader 2 tahun lalu
.pre-commit-config.yaml e4ce816175 Update deps 2 tahun lalu
.project-root aa0a6be778 init training code 2 tahun lalu
README.md e4ce816175 Update deps 2 tahun lalu
dockerfile 7650b2ac43 Update much robust dataloader 2 tahun lalu
ds_config.json db0aa1a99a Init preprocessing tools 2 tahun lalu
requirements.txt 7650b2ac43 Update much robust dataloader 2 tahun lalu
setup.py 7650b2ac43 Update much robust dataloader 2 tahun lalu
train.sh a0a5c3e95c Update training script 2 tahun lalu

README.md

Speech LLM

Setup

# Basic environment setup
conda create -n speech-llm python=3.10
conda activate speech-llm
conda install pytorch torchvision torchaudio pytorch-cuda=12.1 -c pytorch -c nvidia

# Install requirements
pip3 install -r requirements.txt

# Install flash-attn
MAX_JOBS=4 pip install flash-attn --no-build-isolation