před 2 roky · 23109ecb94
--- a/requirements.txt
+++ b/requirements.txt
@@ -1,4 +1,4 @@
 
				-transformers>=4.34.0
			
 
				+transformers>=4.34.1
			
 
				 datasets>=2.14.5
			
 
				 bitsandbytes>=0.41.1
			
 
				 peft>=0.5.0
			
--- a/speech_lm/configs/whisper_vq.yaml
+++ b/speech_lm/configs/whisper_vq.yaml
@@ -43,7 +43,7 @@ schedule:
 
				   save_interval: 2000
			
 
				   gradient_accumulation_steps: "${eval: ${schedule.batch_size} // ${schedule.micro_batch_size}}"
			
 
				   clip_grad_norm: 2.0
			
 
				-  log_interval: 10
			
 
				+  log_interval: 50
			
 
				   eval_interval: 2000
			
 
				 
			
 
				 train_dataloader:
			
@@ -52,7 +52,11 @@ train_dataloader:
 
				     _target_: speech_lm.datasets.whisper_vq.WhisperVQDataset
			
 
				     filelist: filelists/whisper-vq.train.filelist
			
 
				   batch_size: ${schedule.micro_batch_size}
			
 
				-  num_workers: 8
			
 
				+  num_workers: 16
			
 
				+  prefetch_factor: 4
			
 
				+  pin_memory: true
			
 
				+  persistent_workers: true
			
 
				+  shuffle: true
			
 
				   collate_fn:
			
 
				     _target_: speech_lm.datasets.whisper_vq.WhisperVQCollator
			
 
				 
			
@@ -62,7 +66,10 @@ valid_dataloader:
 
				     _target_: speech_lm.datasets.whisper_vq.WhisperVQDataset
			
 
				     filelist: filelists/whisper-vq.test.filelist
			
 
				   batch_size: 32
			
 
				-  num_workers: 4
			
 
				+  num_workers: 8
			
 
				+  prefetch_factor: 4
			
 
				+  pin_memory: true
			
 
				+  shuffle: false
			
 
				   collate_fn:
			
 
				     _target_: speech_lm.datasets.whisper_vq.WhisperVQCollator
			
 
				 
			
--- a/speech_lm/train.py
+++ b/speech_lm/train.py
@@ -37,7 +37,7 @@ def valid(
 
				 
			
 
				     accumulate_infos = None
			
 
				 
			
 
				-    for idx, batch in tqdm(enumerate(valid_dataloader), desc="Evaluating"):
			
 
				+    for idx, batch in enumerate(tqdm(valid_dataloader, desc="Evaluating")):
			
 
				         outputs = model(**batch)
			
 
				         loss = outputs.loss
			
 
				         metrics = getattr(outputs, "metrics", {})
			
@@ -81,8 +81,6 @@ def train(
 
				     fabric: Fabric,
			
 
				     cfg: DictConfig,
			
 
				 ):
			
 
				-    bar = tqdm(total=cfg.schedule.max_steps, desc="Training")
			
 
				-    bar.update(global_step)
			
 
				     accumulate_steps = 0
			
 
				     optimizer.zero_grad()
			
 
				 
			
@@ -163,7 +161,6 @@ def train(
 
				             )
			
 
				 
			
 
				             global_step += 1
			
 
				-            bar.update(1)
			
 
				 
			
 
				             if global_step % cfg.schedule.log_interval == 0:
			
 
				                 step_time = (time.time() - start_time) / cfg.schedule.log_interval