├── .gitignore
├── chatglm_q
    ├── __init__.py
    ├── decoder.py
    ├── int4
    │   ├── __init__.py
    │   ├── qlinear.py
    │   ├── quantizer.py
    │   └── triton_ops.py
    ├── int8
    │   ├── __init__.py
    │   ├── qlinear.py
    │   ├── quantizer.py
    │   └── triton_ops.py
    ├── loader.py
    ├── model.py
    └── tokenizer.py
├── examples
    ├── convert_weight.py
    ├── evaluations
    │   ├── ceval.py
    │   ├── ceval_results.txt
    │   ├── ppl.py
    │   └── ppl_results.txt
    ├── onnx
    │   ├── export.py
    │   └── merge_data.py
    ├── quantize_gptq
    │   ├── int4g32.py
    │   ├── int8.py
    │   └── mnist.py
    ├── quantize_naive
    │   ├── int4g32.py
    │   └── int8.py
    └── web-ui.py
├── license
├── readme.md
├── setup.py
└── tests
    ├── test_tokenizer.py
    ├── test_triton_ops.py
    └── test_triton_ops_int4.py


/.gitignore:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/K024/chatglm-q/HEAD/.gitignore


--------------------------------------------------------------------------------
/chatglm_q/__init__.py:
--------------------------------------------------------------------------------
1 | 


--------------------------------------------------------------------------------
/chatglm_q/decoder.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/K024/chatglm-q/HEAD/chatglm_q/decoder.py


--------------------------------------------------------------------------------
/chatglm_q/int4/__init__.py:
--------------------------------------------------------------------------------
1 | 


--------------------------------------------------------------------------------
/chatglm_q/int4/qlinear.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/K024/chatglm-q/HEAD/chatglm_q/int4/qlinear.py


--------------------------------------------------------------------------------
/chatglm_q/int4/quantizer.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/K024/chatglm-q/HEAD/chatglm_q/int4/quantizer.py


--------------------------------------------------------------------------------
/chatglm_q/int4/triton_ops.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/K024/chatglm-q/HEAD/chatglm_q/int4/triton_ops.py


--------------------------------------------------------------------------------
/chatglm_q/int8/__init__.py:
--------------------------------------------------------------------------------
1 | 


--------------------------------------------------------------------------------
/chatglm_q/int8/qlinear.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/K024/chatglm-q/HEAD/chatglm_q/int8/qlinear.py


--------------------------------------------------------------------------------
/chatglm_q/int8/quantizer.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/K024/chatglm-q/HEAD/chatglm_q/int8/quantizer.py


--------------------------------------------------------------------------------
/chatglm_q/int8/triton_ops.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/K024/chatglm-q/HEAD/chatglm_q/int8/triton_ops.py


--------------------------------------------------------------------------------
/chatglm_q/loader.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/K024/chatglm-q/HEAD/chatglm_q/loader.py


--------------------------------------------------------------------------------
/chatglm_q/model.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/K024/chatglm-q/HEAD/chatglm_q/model.py


--------------------------------------------------------------------------------
/chatglm_q/tokenizer.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/K024/chatglm-q/HEAD/chatglm_q/tokenizer.py


--------------------------------------------------------------------------------
/examples/convert_weight.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/K024/chatglm-q/HEAD/examples/convert_weight.py


--------------------------------------------------------------------------------
/examples/evaluations/ceval.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/K024/chatglm-q/HEAD/examples/evaluations/ceval.py


--------------------------------------------------------------------------------
/examples/evaluations/ceval_results.txt:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/K024/chatglm-q/HEAD/examples/evaluations/ceval_results.txt


--------------------------------------------------------------------------------
/examples/evaluations/ppl.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/K024/chatglm-q/HEAD/examples/evaluations/ppl.py


--------------------------------------------------------------------------------
/examples/evaluations/ppl_results.txt:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/K024/chatglm-q/HEAD/examples/evaluations/ppl_results.txt


--------------------------------------------------------------------------------
/examples/onnx/export.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/K024/chatglm-q/HEAD/examples/onnx/export.py


--------------------------------------------------------------------------------
/examples/onnx/merge_data.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/K024/chatglm-q/HEAD/examples/onnx/merge_data.py


--------------------------------------------------------------------------------
/examples/quantize_gptq/int4g32.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/K024/chatglm-q/HEAD/examples/quantize_gptq/int4g32.py


--------------------------------------------------------------------------------
/examples/quantize_gptq/int8.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/K024/chatglm-q/HEAD/examples/quantize_gptq/int8.py


--------------------------------------------------------------------------------
/examples/quantize_gptq/mnist.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/K024/chatglm-q/HEAD/examples/quantize_gptq/mnist.py


--------------------------------------------------------------------------------
/examples/quantize_naive/int4g32.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/K024/chatglm-q/HEAD/examples/quantize_naive/int4g32.py


--------------------------------------------------------------------------------
/examples/quantize_naive/int8.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/K024/chatglm-q/HEAD/examples/quantize_naive/int8.py


--------------------------------------------------------------------------------
/examples/web-ui.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/K024/chatglm-q/HEAD/examples/web-ui.py


--------------------------------------------------------------------------------
/license:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/K024/chatglm-q/HEAD/license


--------------------------------------------------------------------------------
/readme.md:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/K024/chatglm-q/HEAD/readme.md


--------------------------------------------------------------------------------
/setup.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/K024/chatglm-q/HEAD/setup.py


--------------------------------------------------------------------------------
/tests/test_tokenizer.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/K024/chatglm-q/HEAD/tests/test_tokenizer.py


--------------------------------------------------------------------------------
/tests/test_triton_ops.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/K024/chatglm-q/HEAD/tests/test_triton_ops.py


--------------------------------------------------------------------------------
/tests/test_triton_ops_int4.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/K024/chatglm-q/HEAD/tests/test_triton_ops_int4.py


--------------------------------------------------------------------------------