├── README.md
├── math_reasoning
    ├── README.md
    ├── accuracy_utils.py
    ├── classifier.py
    ├── collect_training_data.py
    ├── combine_training_data.py
    ├── dataset
    │   ├── gsm8k_test.jsonl
    │   ├── gsm8k_test_eval.json
    │   ├── gsm8k_train.jsonl
    │   ├── gsm8k_train_eval.json
    │   ├── math500_test.jsonl
    │   ├── math500_test_eval.json
    │   ├── math_train.jsonl
    │   └── math_train_eval.json
    ├── eval_ckpt.py
    ├── train_classifier.py
    └── utils.py
└── star_graph
    ├── README.md
    ├── collect_rollouts.py
    ├── data
        ├── __init__.py
        ├── chess.py
        └── graphs.py
    ├── evaluate.py
    ├── evaluate_ckpts.py
    ├── models
        ├── __init__.py
        ├── base_model.py
        ├── cache.py
        ├── config.py
        ├── gpt.py
        ├── lib.py
        └── pythia.py
    ├── scripts
        └── evaluate.sh
    ├── tokenizing
        ├── __init__.py
        └── numeral_tokenizer.py
    ├── train.py
    ├── train_classifier.py
    ├── train_dpo.py
    ├── train_reinforce.py
    └── utils
        ├── __init__.py
        ├── load.py
        └── training_utils.py


/README.md:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/README.md


--------------------------------------------------------------------------------
/math_reasoning/README.md:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/math_reasoning/README.md


--------------------------------------------------------------------------------
/math_reasoning/accuracy_utils.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/math_reasoning/accuracy_utils.py


--------------------------------------------------------------------------------
/math_reasoning/classifier.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/math_reasoning/classifier.py


--------------------------------------------------------------------------------
/math_reasoning/collect_training_data.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/math_reasoning/collect_training_data.py


--------------------------------------------------------------------------------
/math_reasoning/combine_training_data.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/math_reasoning/combine_training_data.py


--------------------------------------------------------------------------------
/math_reasoning/dataset/gsm8k_test.jsonl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/math_reasoning/dataset/gsm8k_test.jsonl


--------------------------------------------------------------------------------
/math_reasoning/dataset/gsm8k_test_eval.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/math_reasoning/dataset/gsm8k_test_eval.json


--------------------------------------------------------------------------------
/math_reasoning/dataset/gsm8k_train.jsonl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/math_reasoning/dataset/gsm8k_train.jsonl


--------------------------------------------------------------------------------
/math_reasoning/dataset/gsm8k_train_eval.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/math_reasoning/dataset/gsm8k_train_eval.json


--------------------------------------------------------------------------------
/math_reasoning/dataset/math500_test.jsonl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/math_reasoning/dataset/math500_test.jsonl


--------------------------------------------------------------------------------
/math_reasoning/dataset/math500_test_eval.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/math_reasoning/dataset/math500_test_eval.json


--------------------------------------------------------------------------------
/math_reasoning/dataset/math_train.jsonl:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/math_reasoning/dataset/math_train.jsonl


--------------------------------------------------------------------------------
/math_reasoning/dataset/math_train_eval.json:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/math_reasoning/dataset/math_train_eval.json


--------------------------------------------------------------------------------
/math_reasoning/eval_ckpt.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/math_reasoning/eval_ckpt.py


--------------------------------------------------------------------------------
/math_reasoning/train_classifier.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/math_reasoning/train_classifier.py


--------------------------------------------------------------------------------
/math_reasoning/utils.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/math_reasoning/utils.py


--------------------------------------------------------------------------------
/star_graph/README.md:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/star_graph/README.md


--------------------------------------------------------------------------------
/star_graph/collect_rollouts.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/star_graph/collect_rollouts.py


--------------------------------------------------------------------------------
/star_graph/data/__init__.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/star_graph/data/__init__.py


--------------------------------------------------------------------------------
/star_graph/data/chess.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/star_graph/data/chess.py


--------------------------------------------------------------------------------
/star_graph/data/graphs.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/star_graph/data/graphs.py


--------------------------------------------------------------------------------
/star_graph/evaluate.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/star_graph/evaluate.py


--------------------------------------------------------------------------------
/star_graph/evaluate_ckpts.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/star_graph/evaluate_ckpts.py


--------------------------------------------------------------------------------
/star_graph/models/__init__.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/star_graph/models/__init__.py


--------------------------------------------------------------------------------
/star_graph/models/base_model.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/star_graph/models/base_model.py


--------------------------------------------------------------------------------
/star_graph/models/cache.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/star_graph/models/cache.py


--------------------------------------------------------------------------------
/star_graph/models/config.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/star_graph/models/config.py


--------------------------------------------------------------------------------
/star_graph/models/gpt.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/star_graph/models/gpt.py


--------------------------------------------------------------------------------
/star_graph/models/lib.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/star_graph/models/lib.py


--------------------------------------------------------------------------------
/star_graph/models/pythia.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/star_graph/models/pythia.py


--------------------------------------------------------------------------------
/star_graph/scripts/evaluate.sh:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/star_graph/scripts/evaluate.sh


--------------------------------------------------------------------------------
/star_graph/tokenizing/__init__.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/star_graph/tokenizing/__init__.py


--------------------------------------------------------------------------------
/star_graph/tokenizing/numeral_tokenizer.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/star_graph/tokenizing/numeral_tokenizer.py


--------------------------------------------------------------------------------
/star_graph/train.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/star_graph/train.py


--------------------------------------------------------------------------------
/star_graph/train_classifier.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/star_graph/train_classifier.py


--------------------------------------------------------------------------------
/star_graph/train_dpo.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/star_graph/train_dpo.py


--------------------------------------------------------------------------------
/star_graph/train_reinforce.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/star_graph/train_reinforce.py


--------------------------------------------------------------------------------
/star_graph/utils/__init__.py:
--------------------------------------------------------------------------------
1 | 


--------------------------------------------------------------------------------
/star_graph/utils/load.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/star_graph/utils/load.py


--------------------------------------------------------------------------------
/star_graph/utils/training_utils.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/jinpz/q_sharp/HEAD/star_graph/utils/training_utils.py


--------------------------------------------------------------------------------