Lengyue 62710e34a4 Add llama inference tool chain 2 lat temu
..
__init__.py f7f2c03282 Support pytorch lightning 2 lat temu
generate.py 62710e34a4 Add llama inference tool chain 2 lat temu
lit_module.py 4b22991668 Implement parallel decoding llama 2 lat temu
llama.py 62710e34a4 Add llama inference tool chain 2 lat temu
modules.py 62710e34a4 Add llama inference tool chain 2 lat temu
modules_old.py 62710e34a4 Add llama inference tool chain 2 lat temu
quantize.py 62710e34a4 Add llama inference tool chain 2 lat temu
tp.py 62710e34a4 Add llama inference tool chain 2 lat temu