Lengyue
|
5f01798ab4
Fix non-inf gradient
|
hace 2 años |
Lengyue
|
2a19adb045
Fix grad acc loss
|
hace 2 años |
Lengyue
|
8f75f764ad
Fix incorrect batch time
|
hace 2 años |
Lengyue
|
5f07060c6a
Optimize training loop
|
hace 2 años |
Lengyue
|
5d65ec0bd5
fix typo
|
hace 2 años |
Lengyue
|
b6b478701a
Rename dataloader to add support for valid loader
|
hace 2 años |
Lengyue
|
fb23d5df2d
Better train loop tracking
|
hace 2 años |
Lengyue
|
3fc0a688ca
Update Readme
|
hace 2 años |
Lengyue
|
9beb5981ec
Remove unused ds config
|
hace 2 años |
Lengyue
|
d211a7eac7
Better ETA
|
hace 2 años |
Lengyue
|
2733ed600f
Accelerate training with fsdp
|
hace 2 años |
Lengyue
|
01cf9bbafd
Fix dataset and training loop
|
hace 2 años |
Lengyue
|
712908e673
Support stream reading
|
hace 2 años |
Lengyue
|
e01dd330a1
optimize InterleaveDataset
|
hace 2 años |
Lengyue
|
0282451dff
fix scheduler
|
hace 2 años |
Lengyue
|
7650b2ac43
Update much robust dataloader
|
hace 2 años |
Lengyue
|
60ac11d7fe
Update deps
|
hace 2 años |
Lengyue
|
bce1f85209
Faster schedule
|
hace 2 años |
Lengyue
|
d28ba743d3
Fix quantizer norm
|
hace 2 años |
Lengyue
|
0dae48d2dc
Fix model training mode
|
hace 2 años |
Lengyue
|
0b5216ef0e
Fix hubert config
|
hace 2 años |
Lengyue
|
3297b2dc2c
Add hubert vq training
|
hace 2 años |
Lengyue
|
311a8b64ea
Add hubert dataset and hubert model
|
hace 2 años |
Lengyue
|
c88bf969b1
Update gitignore
|
hace 2 años |
Lengyue
|
70797ef7d5
Add dockerignore
|
hace 2 años |
Lengyue
|
900fc9dec9
Optimize data loading & gradient accumulate
|
hace 2 años |
Lengyue
|
026d419e9a
Fix logger in config
|
hace 2 años |
Lengyue
|
a0a5c3e95c
Update training script
|
hace 2 años |
Lengyue
|
db347ca973
Add llm exp code
|
hace 2 años |
Lengyue
|
9adf687fb1
Update base training code
|
hace 2 años |