├── LICENSE
├── README.md
├── contributions
    └── ex02-01.md
├── n步自举法
    ├── README.md
    ├── 习题解答.md
    └── 代码案例.md
├── 动态规划
    ├── README.md
    ├── img
    │   ├── pic4-1.png
    │   ├── pic4-2.png
    │   └── pic4-3.png
    ├── 习题解答.md
    └── 代码案例.md
├── 基于函数逼近的同轨策略控制
    ├── README.md
    ├── 习题解答.md
    └── 代码案例.md
├── 基于函数逼近的同轨策略预测
    ├── README.md
    ├── 习题解答.md
    └── 代码案例.md
├── 基于函数逼近的离轨策略方法
    ├── README.md
    ├── 习题解答.md
    └── 代码案例.md
├── 基于表格方法的规划和学习
    ├── README.md
    ├── 习题解答.md
    └── 代码案例.md
├── 多臂赌博机
    ├── README.md
    ├── img
    │   └── fig2_2.png
    ├── 习题解答.md
    └── 代码案例.md
├── 导论
    ├── README.md
    ├── img
    │   ├── case1-1.jpg
    │   ├── ex1-3.jpg
    │   ├── rl-chn.jpg
    │   └── tictactoe.jpg
    ├── src
    │   └── TicTacToe.ipynb
    ├── 习题解答.md
    └── 代码案例.md
├── 时序差分学习
    ├── README.md
    ├── img
    │   ├── output_11_1.png
    │   ├── output_11_2.png
    │   ├── output_11_3.png
    │   ├── output_11_4.png
    │   ├── output_3_1.png
    │   ├── output_6_1.png
    │   └── output_8_1.png
    ├── src
    │   └── ex_6.9_6.10.ipynb
    ├── 习题解答.md
    └── 代码案例.md
├── 有限马尔科夫决策过程
    ├── README.md
    ├── img
    │   ├── image-20210302170132162.png
    │   └── text
    ├── key-points
    │   └── text
    ├── 习题解答.md
    └── 代码案例.md
├── 策略梯度方法
    ├── README.md
    ├── 习题解答.md
    └── 代码案例.md
├── 蒙特卡洛方法
    ├── README.md
    ├── 习题解答.md
    └── 代码案例.md
├── 表格型深入研究与前沿技术
    ├── README.md
    ├── 习题解答.md
    └── 代码案例.md
└── 资格迹
    ├── README.md
    ├── 习题解答.md
    └── 代码案例.md


/LICENSE:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/finint/RL-Solutions/HEAD/LICENSE


--------------------------------------------------------------------------------
/README.md:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/finint/RL-Solutions/HEAD/README.md


--------------------------------------------------------------------------------
/contributions/ex02-01.md:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/finint/RL-Solutions/HEAD/contributions/ex02-01.md


--------------------------------------------------------------------------------
/n步自举法/README.md:
--------------------------------------------------------------------------------
1 |  ##


--------------------------------------------------------------------------------
/n步自举法/习题解答.md:
--------------------------------------------------------------------------------
1 |  ##


--------------------------------------------------------------------------------
/n步自举法/代码案例.md:
--------------------------------------------------------------------------------
1 | ##


--------------------------------------------------------------------------------
/动态规划/README.md:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/finint/RL-Solutions/HEAD/动态规划/README.md


--------------------------------------------------------------------------------
/动态规划/img/pic4-1.png:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/finint/RL-Solutions/HEAD/动态规划/img/pic4-1.png


--------------------------------------------------------------------------------
/动态规划/img/pic4-2.png:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/finint/RL-Solutions/HEAD/动态规划/img/pic4-2.png


--------------------------------------------------------------------------------
/动态规划/img/pic4-3.png:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/finint/RL-Solutions/HEAD/动态规划/img/pic4-3.png


--------------------------------------------------------------------------------
/动态规划/习题解答.md:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/finint/RL-Solutions/HEAD/动态规划/习题解答.md


--------------------------------------------------------------------------------
/动态规划/代码案例.md:
--------------------------------------------------------------------------------
1 | ##


--------------------------------------------------------------------------------
/基于函数逼近的同轨策略控制/README.md:
--------------------------------------------------------------------------------
1 |  ##


--------------------------------------------------------------------------------
/基于函数逼近的同轨策略控制/习题解答.md:
--------------------------------------------------------------------------------
1 |  ##


--------------------------------------------------------------------------------
/基于函数逼近的同轨策略控制/代码案例.md:
--------------------------------------------------------------------------------
1 | ##


--------------------------------------------------------------------------------
/基于函数逼近的同轨策略预测/README.md:
--------------------------------------------------------------------------------
1 |  ##


--------------------------------------------------------------------------------
/基于函数逼近的同轨策略预测/习题解答.md:
--------------------------------------------------------------------------------
1 |  ##


--------------------------------------------------------------------------------
/基于函数逼近的同轨策略预测/代码案例.md:
--------------------------------------------------------------------------------
1 | ##


--------------------------------------------------------------------------------
/基于函数逼近的离轨策略方法/README.md:
--------------------------------------------------------------------------------
1 |  ##


--------------------------------------------------------------------------------
/基于函数逼近的离轨策略方法/习题解答.md:
--------------------------------------------------------------------------------
1 |  ##


--------------------------------------------------------------------------------
/基于函数逼近的离轨策略方法/代码案例.md:
--------------------------------------------------------------------------------
1 | ##


--------------------------------------------------------------------------------
/基于表格方法的规划和学习/README.md:
--------------------------------------------------------------------------------
1 |  ##


--------------------------------------------------------------------------------
/基于表格方法的规划和学习/习题解答.md:
--------------------------------------------------------------------------------
1 |  ##


--------------------------------------------------------------------------------
/基于表格方法的规划和学习/代码案例.md:
--------------------------------------------------------------------------------
1 | ##


--------------------------------------------------------------------------------
/多臂赌博机/README.md:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/finint/RL-Solutions/HEAD/多臂赌博机/README.md


--------------------------------------------------------------------------------
/多臂赌博机/img/fig2_2.png:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/finint/RL-Solutions/HEAD/多臂赌博机/img/fig2_2.png


--------------------------------------------------------------------------------
/多臂赌博机/习题解答.md:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/finint/RL-Solutions/HEAD/多臂赌博机/习题解答.md


--------------------------------------------------------------------------------
/多臂赌博机/代码案例.md:
--------------------------------------------------------------------------------
1 | ##


--------------------------------------------------------------------------------
/导论/README.md:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/finint/RL-Solutions/HEAD/导论/README.md


--------------------------------------------------------------------------------
/导论/img/case1-1.jpg:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/finint/RL-Solutions/HEAD/导论/img/case1-1.jpg


--------------------------------------------------------------------------------
/导论/img/ex1-3.jpg:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/finint/RL-Solutions/HEAD/导论/img/ex1-3.jpg


--------------------------------------------------------------------------------
/导论/img/rl-chn.jpg:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/finint/RL-Solutions/HEAD/导论/img/rl-chn.jpg


--------------------------------------------------------------------------------
/导论/img/tictactoe.jpg:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/finint/RL-Solutions/HEAD/导论/img/tictactoe.jpg


--------------------------------------------------------------------------------
/导论/src/TicTacToe.ipynb:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/finint/RL-Solutions/HEAD/导论/src/TicTacToe.ipynb


--------------------------------------------------------------------------------
/导论/习题解答.md:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/finint/RL-Solutions/HEAD/导论/习题解答.md


--------------------------------------------------------------------------------
/导论/代码案例.md:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/finint/RL-Solutions/HEAD/导论/代码案例.md


--------------------------------------------------------------------------------
/时序差分学习/README.md:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/finint/RL-Solutions/HEAD/时序差分学习/README.md


--------------------------------------------------------------------------------
/时序差分学习/img/output_11_1.png:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/finint/RL-Solutions/HEAD/时序差分学习/img/output_11_1.png


--------------------------------------------------------------------------------
/时序差分学习/img/output_11_2.png:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/finint/RL-Solutions/HEAD/时序差分学习/img/output_11_2.png


--------------------------------------------------------------------------------
/时序差分学习/img/output_11_3.png:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/finint/RL-Solutions/HEAD/时序差分学习/img/output_11_3.png


--------------------------------------------------------------------------------
/时序差分学习/img/output_11_4.png:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/finint/RL-Solutions/HEAD/时序差分学习/img/output_11_4.png


--------------------------------------------------------------------------------
/时序差分学习/img/output_3_1.png:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/finint/RL-Solutions/HEAD/时序差分学习/img/output_3_1.png


--------------------------------------------------------------------------------
/时序差分学习/img/output_6_1.png:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/finint/RL-Solutions/HEAD/时序差分学习/img/output_6_1.png


--------------------------------------------------------------------------------
/时序差分学习/img/output_8_1.png:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/finint/RL-Solutions/HEAD/时序差分学习/img/output_8_1.png


--------------------------------------------------------------------------------
/时序差分学习/src/ex_6.9_6.10.ipynb:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/finint/RL-Solutions/HEAD/时序差分学习/src/ex_6.9_6.10.ipynb


--------------------------------------------------------------------------------
/时序差分学习/习题解答.md:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/finint/RL-Solutions/HEAD/时序差分学习/习题解答.md


--------------------------------------------------------------------------------
/时序差分学习/代码案例.md:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/finint/RL-Solutions/HEAD/时序差分学习/代码案例.md


--------------------------------------------------------------------------------
/有限马尔科夫决策过程/README.md:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/finint/RL-Solutions/HEAD/有限马尔科夫决策过程/README.md


--------------------------------------------------------------------------------
/有限马尔科夫决策过程/img/image-20210302170132162.png:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/finint/RL-Solutions/HEAD/有限马尔科夫决策过程/img/image-20210302170132162.png


--------------------------------------------------------------------------------
/有限马尔科夫决策过程/img/text:
--------------------------------------------------------------------------------
1 | 
2 | 


--------------------------------------------------------------------------------
/有限马尔科夫决策过程/key-points/text:
--------------------------------------------------------------------------------
1 | 
2 | 


--------------------------------------------------------------------------------
/有限马尔科夫决策过程/习题解答.md:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/finint/RL-Solutions/HEAD/有限马尔科夫决策过程/习题解答.md


--------------------------------------------------------------------------------
/有限马尔科夫决策过程/代码案例.md:
--------------------------------------------------------------------------------
1 | ##


--------------------------------------------------------------------------------
/策略梯度方法/README.md:
--------------------------------------------------------------------------------
1 |  ##


--------------------------------------------------------------------------------
/策略梯度方法/习题解答.md:
--------------------------------------------------------------------------------
1 |  ##


--------------------------------------------------------------------------------
/策略梯度方法/代码案例.md:
--------------------------------------------------------------------------------
1 | ##


--------------------------------------------------------------------------------
/蒙特卡洛方法/README.md:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/finint/RL-Solutions/HEAD/蒙特卡洛方法/README.md


--------------------------------------------------------------------------------
/蒙特卡洛方法/习题解答.md:
--------------------------------------------------------------------------------
1 |  ##


--------------------------------------------------------------------------------
/蒙特卡洛方法/代码案例.md:
--------------------------------------------------------------------------------
1 | ##


--------------------------------------------------------------------------------
/表格型深入研究与前沿技术/README.md:
--------------------------------------------------------------------------------
1 |  ##


--------------------------------------------------------------------------------
/表格型深入研究与前沿技术/习题解答.md:
--------------------------------------------------------------------------------
1 |  # 
2 | 
3 | 


--------------------------------------------------------------------------------
/表格型深入研究与前沿技术/代码案例.md:
--------------------------------------------------------------------------------
1 | ##


--------------------------------------------------------------------------------
/资格迹/README.md:
--------------------------------------------------------------------------------
1 |  ##


--------------------------------------------------------------------------------
/资格迹/习题解答.md:
--------------------------------------------------------------------------------
1 |  ##


--------------------------------------------------------------------------------
/资格迹/代码案例.md:
--------------------------------------------------------------------------------
1 | ##


--------------------------------------------------------------------------------