Lengyue
|
254e93e632
Fix inference without attention mask
|
hace 2 años |
Lengyue
|
0c084ec779
Apply gradient accumulate to save memory
|
hace 2 años |
Lengyue
|
4cfb62a08a
Fix gradient accumulate logging
|
hace 2 años |
Lengyue
|
086c82d789
Fix vq whisper training & remove ema in tb logger
|
hace 2 años |
Lengyue
|
23109ecb94
Optimize training loop & upgrade transformers
|
hace 2 años |
Lengyue
|
7704bb7d09
Fix filename
|
hace 2 años |
Lengyue
|
938eca21a6
Rename config & smaller schedule
|
hace 2 años |
Lengyue
|
a003e5a390
Add utilities & whisper vq model
|
hace 2 años |
Lengyue
|
a114dfab4f
Fix multi lingual whisper
|
hace 2 años |
Lengyue
|
9153fc8278
Add whisper loss example
|
hace 2 años |
Lengyue
|
1854897e3c
Fix utf-8 encoding
|
hace 2 años |
Lengyue
|
0687dd1f1a
Greatly reduced cpu usage
|
hace 2 años |
Lengyue
|
18af8a9406
Add whisper with flash attn & use whisper to batch transcribe
|
hace 2 años |
Lengyue
|
9920873cf2
Optimize schedule
|
hace 2 años |
Lengyue
|
7031d18b3d
Let model fail on non-inf loss
|
hace 2 años |
Lengyue
|
5f01798ab4
Fix non-inf gradient
|
hace 2 años |
Lengyue
|
2a19adb045
Fix grad acc loss
|
hace 2 años |
Lengyue
|
8f75f764ad
Fix incorrect batch time
|
hace 2 años |
Lengyue
|
5f07060c6a
Optimize training loop
|
hace 2 años |
Lengyue
|
5d65ec0bd5
fix typo
|
hace 2 años |
Lengyue
|
b6b478701a
Rename dataloader to add support for valid loader
|
hace 2 años |
Lengyue
|
fb23d5df2d
Better train loop tracking
|
hace 2 años |
Lengyue
|
3fc0a688ca
Update Readme
|
hace 2 años |
Lengyue
|
9beb5981ec
Remove unused ds config
|
hace 2 años |
Lengyue
|
d211a7eac7
Better ETA
|
hace 2 años |
Lengyue
|
2733ed600f
Accelerate training with fsdp
|
hace 2 años |
Lengyue
|
01cf9bbafd
Fix dataset and training loop
|
hace 2 años |
Lengyue
|
712908e673
Support stream reading
|
hace 2 años |
Lengyue
|
e01dd330a1
optimize InterleaveDataset
|
hace 2 años |
Lengyue
|
0282451dff
fix scheduler
|
hace 2 años |