Lengyue
|
26af12b8c6
Make AR and naive decoder configurable
|
hace 2 años |
Lengyue
|
3d002fd18b
Optimize amp training
|
hace 2 años |
Lengyue
|
87ca8cf62e
Rollback decoding
|
hace 2 años |
Lengyue
|
6e67ebda73
Optimize training speed by skip unused decode
|
hace 2 años |
Lengyue
|
0a1986bb14
Fix data leaking
|
hace 2 años |
Lengyue
|
362a1a7116
Update dual ar generate & config
|
hace 2 años |
Lengyue
|
9e1a9debfd
fix bug & implement generate
|
hace 2 años |
Lengyue
|
7a31b4043a
Fix target rotate
|
hace 2 años |
Lengyue
|
0855b454e4
Add VITS vq
|
hace 2 años |
Lengyue
|
cecee062c4
Remove flash attn deps as PyTorch ships in 2.2.0
|
hace 2 años |
Lengyue
|
415c78a7d4
Disable neft on eval
|
hace 2 años |
Lengyue
|
f5a2df2d23
Add 4 in 8 out support
|
hace 2 años |
Lengyue
|
8093258065
Optimize lora & add auto dpo training
|
hace 2 años |
Lengyue
|
7ac4d4b918
Add neft and save lora only
|
hace 2 años |
Lengyue
|
39f6902119
Add dropout options to optimize overfitting
|
hace 2 años |
Lengyue
|
2919eafd19
Disable flash attention 2 by default
|
hace 2 años |
Lengyue
|
dcc5e80ce2
Add flash attention & gradient checkpointing
|
hace 2 años |
spicysama
|
06a35aef53
add fastapi for inference (#12)
|
hace 2 años |
Lengyue
|
c583555995
Add half precision inference and document
|
hace 2 años |
Lengyue
|
9649873532
Update generate examples
|
hace 2 años |
Lengyue
|
9ac8edef1e
Support mix codebook training
|
hace 2 años |
Lengyue
|
62710e34a4
Add llama inference tool chain
|
hace 2 años |
Lengyue
|
4b22991668
Implement parallel decoding llama
|
hace 2 años |
Lengyue
|
25fce58cf6
Add llama implementation
|
hace 2 años |