2 anni fa · 7031d18b3d
--- a/speech_lm/train.py
+++ b/speech_lm/train.py
@@ -138,7 +138,6 @@ def train(
 
				                 optimizer,
			
 
				                 max_norm=cfg.schedule.clip_grad_norm,
			
 
				                 norm_type=2.0,
			
 
				-                error_if_nonfinite=False,
			
 
				             )
			
 
				 
			
 
				             # We can't average gradients across multiple steps