├── .gitignore
├── A2C
    └── Tutorial_Advantage_Actor_Critic_(A2C).ipynb
├── Deep_Q_Learning
    ├── README.md
    └── Tutorial_Deep_Q_Learning.ipynb
├── Exploration
    ├── README.md
    └── Tutorial_UCBVI.ipynb
├── LICENSE
├── README.md
├── Value Iteration and Q-Learning
    ├── README.md
    └── Value_Iteration_and_Q_Learning.ipynb
├── colab_test
    └── test_rlberry_setup.ipynb
├── logo
    └── logo_wide.svg
└── requirements.txt


/.gitignore:
--------------------------------------------------------------------------------
  1 | *.mp4
  2 | 
  3 | # Byte-compiled / optimized / DLL files
  4 | __pycache__/
  5 | *.py[cod]
  6 | *$py.class
  7 | 
  8 | # C extensions
  9 | *.so
 10 | 
 11 | # Distribution / packaging
 12 | .Python
 13 | build/
 14 | develop-eggs/
 15 | dist/
 16 | downloads/
 17 | eggs/
 18 | .eggs/
 19 | lib/
 20 | lib64/
 21 | parts/
 22 | sdist/
 23 | var/
 24 | wheels/
 25 | share/python-wheels/
 26 | *.egg-info/
 27 | .installed.cfg
 28 | *.egg
 29 | MANIFEST
 30 | 
 31 | # PyInstaller
 32 | #  Usually these files are written by a python script from a template
 33 | #  before PyInstaller builds the exe, so as to inject date/other infos into it.
 34 | *.manifest
 35 | *.spec
 36 | 
 37 | # Installer logs
 38 | pip-log.txt
 39 | pip-delete-this-directory.txt
 40 | 
 41 | # Unit test / coverage reports
 42 | htmlcov/
 43 | .tox/
 44 | .nox/
 45 | .coverage
 46 | .coverage.*
 47 | .cache
 48 | nosetests.xml
 49 | coverage.xml
 50 | *.cover
 51 | *.py,cover
 52 | .hypothesis/
 53 | .pytest_cache/
 54 | cover/
 55 | 
 56 | # Translations
 57 | *.mo
 58 | *.pot
 59 | 
 60 | # Django stuff:
 61 | *.log
 62 | local_settings.py
 63 | db.sqlite3
 64 | db.sqlite3-journal
 65 | 
 66 | # Flask stuff:
 67 | instance/
 68 | .webassets-cache
 69 | 
 70 | # Scrapy stuff:
 71 | .scrapy
 72 | 
 73 | # Sphinx documentation
 74 | docs/_build/
 75 | 
 76 | # PyBuilder
 77 | .pybuilder/
 78 | target/
 79 | 
 80 | # Jupyter Notebook
 81 | .ipynb_checkpoints
 82 | 
 83 | # IPython
 84 | profile_default/
 85 | ipython_config.py
 86 | 
 87 | # pyenv
 88 | #   For a library or package, you might want to ignore these files since the code is
 89 | #   intended to run in multiple environments; otherwise, check them in:
 90 | # .python-version
 91 | 
 92 | # pipenv
 93 | #   According to pypa/pipenv#598, it is recommended to include Pipfile.lock in version control.
 94 | #   However, in case of collaboration, if having platform-specific dependencies or dependencies
 95 | #   having no cross-platform support, pipenv may install dependencies that don't work, or not
 96 | #   install all needed dependencies.
 97 | #Pipfile.lock
 98 | 
 99 | # PEP 582; used by e.g. github.com/David-OConnor/pyflow
100 | __pypackages__/
101 | 
102 | # Celery stuff
103 | celerybeat-schedule
104 | celerybeat.pid
105 | 
106 | # SageMath parsed files
107 | *.sage.py
108 | 
109 | # Environments
110 | .env
111 | .venv
112 | env/
113 | venv/
114 | ENV/
115 | env.bak/
116 | venv.bak/
117 | 
118 | # Spyder project settings
119 | .spyderproject
120 | .spyproject
121 | 
122 | # Rope project settings
123 | .ropeproject
124 | 
125 | # mkdocs documentation
126 | /site
127 | 
128 | # mypy
129 | .mypy_cache/
130 | .dmypy.json
131 | dmypy.json
132 | 
133 | # Pyre type checker
134 | .pyre/
135 | 
136 | # pytype static type analyzer
137 | .pytype/
138 | 
139 | # Cython debug symbols
140 | cython_debug/


--------------------------------------------------------------------------------
/A2C/Tutorial_Advantage_Actor_Critic_(A2C).ipynb:
--------------------------------------------------------------------------------
  1 | {
  2 |   "nbformat": 4,
  3 |   "nbformat_minor": 0,
  4 |   "metadata": {
  5 |     "colab": {
  6 |       "name": "Tutorial - Advantage Actor Critic (A2C).ipynb",
  7 |       "provenance": [],
  8 |       "collapsed_sections": [],
  9 |       "authorship_tag": "ABX9TyOerJxVFIaozWjxy5taLfea",
 10 |       "include_colab_link": true
 11 |     },
 12 |     "kernelspec": {
 13 |       "name": "python3",
 14 |       "display_name": "Python 3"
 15 |     }
 16 |   },
 17 |   "cells": [
 18 |     {
 19 |       "cell_type": "markdown",
 20 |       "metadata": {
 21 |         "id": "view-in-github",
 22 |         "colab_type": "text"
 23 |       },
 24 |       "source": [
 25 |         "<a href=\"https://colab.research.google.com/github/rlberry-py/tutorials/blob/main/A2C/Tutorial_Advantage_Actor_Critic_(A2C).ipynb\" target=\"_parent\"><img src=\"https://colab.research.google.com/assets/colab-badge.svg\" alt=\"Open In Colab\"/></a>"
 26 |       ]
 27 |     },
 28 |     {
 29 |       "cell_type": "markdown",
 30 |       "metadata": {
 31 |         "id": "FRvfou6G9RGn"
 32 |       },
 33 |       "source": [
 34 |         "# Tutorial - Advantage Actor Critic (A2C)\n",
 35 |         "\n",
 36 |         "A2C keeps two neural networks:\n",
 37 |         "*   One network with paramemeters $\\theta$ to represent the policy $\\pi_\\theta$.\n",
 38 |         "*   One network with parameters $\\omega$ to represent a value function $V_\\omega$, that approximates $V^{\\pi_\\theta}$\n",
 39 |         "\n",
 40 |         "\n",
 41 |         "At each iteration, A2C collects $M$ transitions $(s_i, a_i, r_i, s_i')_{i=1}^M$ by following the policy $\\pi_\\theta$. If a terminal state is reached, we simply go back to the initial state and continue to play $\\pi_\\theta$ until we gather the $M$ transitions.\n",
 42 |         "\n",
 43 |         "Consider the following quantities, defined based on the collected transitions:\n",
 44 |         "\n",
 45 |         "$$\n",
 46 |         "\\widehat{V}(s_i) = \\widehat{Q}(s_i, a_i) = \\sum_{t=i}^{\\tau_i \\wedge M} \\gamma^{t-i} r_t + \\gamma^{M-i+1} V_\\omega(s_M')\\mathbb{I}\\{\\tau_i>M\\}\n",
 47 |         "$$\n",
 48 |         "\n",
 49 |         "where and $\\tau_i = \\min\\{t\\geq i: s_i' \\text{ is a terminal state}\\}$, and \n",
 50 |         "\n",
 51 |         "$$\n",
 52 |         "\\mathbf{A}_\\omega(s_i, a_i) = \\widehat{Q}(s_i, a_i) -  V_\\omega(s_i)  \n",
 53 |         "$$\n",
 54 |         "\n",
 55 |         "\n",
 56 |         "A2C then takes a gradient step to minimize the policy \"loss\" (keeping $\\omega$ fixed):\n",
 57 |         "\n",
 58 |         "$$\n",
 59 |         "L_\\pi(\\theta) =\n",
 60 |         "-\\frac{1}{M} \\sum_{i=1}^M \\mathbf{A}_\\omega(s_i, a_i) \\log \\pi_\\theta(a_i|s_i)\n",
 61 |         "- \\frac{\\alpha}{M}\\sum_{i=1}^M \\sum_a  \\pi(a|s_i) \\log \\frac{1}{\\pi(a|s_i)}\n",
 62 |         "$$\n",
 63 |         "\n",
 64 |         "and a gradient step to minimize the value loss (keeping $\\theta$ fixed):\n",
 65 |         "\n",
 66 |         "$$\n",
 67 |         "L_v(\\omega) = \\frac{1}{M} \\sum_{i=1}^M \\left( \\widehat{V}(s_i) - V_\\omega(s_i)   \\right)^2\n",
 68 |         "$$\n",
 69 |         " \n",
 70 |         "\n",
 71 |         "\n",
 72 |         "# Reminders\n",
 73 |         "\n",
 74 |         "\n",
 75 |         "Objective function:\n",
 76 |         "\n",
 77 |         "$$\n",
 78 |         "J(\\theta) = \\mathbb{E}_{\\pi_\\theta}\n",
 79 |         "\\left[ \n",
 80 |         "  \\sum_{t=0}^\\infty \\gamma^t r(S_t, A_t)\n",
 81 |         "\\right]\n",
 82 |         "$$\n",
 83 |         "\n",
 84 |         "Policy gradient:\n",
 85 |         "\n",
 86 |         "$$\n",
 87 |         "\\nabla_\\theta J(\\theta)= \\mathbb{E}_{\\pi_\\theta}\n",
 88 |         "\\left[ \n",
 89 |         "  \\sum_{t=0}^\\infty \\gamma^t A^{\\pi_\\theta}(S_t, A_t) \n",
 90 |         "  \\nabla_\\theta \\log \\pi_\\theta(A_t|S_t)\n",
 91 |         "\\right]\n",
 92 |         "$$\n",
 93 |         "where $A^{\\pi_\\theta}(s, a) = Q^{\\pi_\\theta}(s, a) - V^{\\pi_\\theta}(s) $ is the advantage function."
 94 |       ]
 95 |     },
 96 |     {
 97 |       "cell_type": "markdown",
 98 |       "metadata": {
 99 |         "id": "Er4wbIih9e24"
100 |       },
101 |       "source": [
102 |         "# Colab setup"
103 |       ]
104 |     },
105 |     {
106 |       "cell_type": "code",
107 |       "metadata": {
108 |         "colab": {
109 |           "base_uri": "https://localhost:8080/"
110 |         },
111 |         "id": "O12jMLD29DAU",
112 |         "outputId": "37a4b59a-2b5d-44f4-da53-51fd84d77c3f"
113 |       },
114 |       "source": [
115 |         "# After installing, restart the kernel\n",
116 |         "\n",
117 |         "# install rlberry library\n",
118 |         "!git clone https://github.com/rlberry-py/rlberry.git \n",
119 |         "!cd rlberry && git pull && pip install -e .[full] > /dev/null 2>&1\n",
120 |         "!pip install ffmpeg-python > /dev/null 2>&1\n",
121 |         "\n",
122 |         "# gym\n",
123 |         "!pip install 'gym[all]' > /dev/null 2>&1\n",
124 |         "\n",
125 |         "# packages required to show video\n",
126 |         "!pip install pyvirtualdisplay > /dev/null 2>&1\n",
127 |         "!apt-get install -y xvfb python-opengl ffmpeg > /dev/null 2>&1\n",
128 |         "\n",
129 |         "# ask to restart runtime\n",
130 |         "print(\"\")\n",
131 |         "print(\" ~~~  Libraries installed, please restart the runtime! ~~~ \")\n",
132 |         "print(\"\")"
133 |       ],
134 |       "execution_count": 1,
135 |       "outputs": [
136 |         {
137 |           "output_type": "stream",
138 |           "text": [
139 |             "Cloning into 'rlberry'...\n",
140 |             "remote: Enumerating objects: 472, done.\u001b[K\n",
141 |             "remote: Counting objects: 100% (472/472), done.\u001b[K\n",
142 |             "remote: Compressing objects: 100% (292/292), done.\u001b[K\n",
143 |             "remote: Total 3541 (delta 283), reused 326 (delta 177), pack-reused 3069\u001b[K\n",
144 |             "Receiving objects: 100% (3541/3541), 886.51 KiB | 9.85 MiB/s, done.\n",
145 |             "Resolving deltas: 100% (2277/2277), done.\n",
146 |             "Already up to date.\n",
147 |             "\n",
148 |             " ~~~  Libraries installed, please restart the runtime! ~~~ \n",
149 |             "\n"
150 |           ],
151 |           "name": "stdout"
152 |         }
153 |       ]
154 |     },
155 |     {
156 |       "cell_type": "code",
157 |       "metadata": {
158 |         "id": "gKOp4h0Oe9-X"
159 |       },
160 |       "source": [
161 |         "import gym\r\n",
162 |         "from gym import logger as gymlogger\r\n",
163 |         "from gym.wrappers import Monitor\r\n",
164 |         "gymlogger.set_level(40)  # error only\r\n",
165 |         "\r\n",
166 |         "import torch\r\n",
167 |         "import torch.nn as nn\r\n",
168 |         "import torch.nn.functional as F \r\n",
169 |         "from torch import optim\r\n",
170 |         "\r\n",
171 |         "import numpy as np\r\n",
172 |         "\r\n",
173 |         "\r\n",
174 |         "# for videos\r\n",
175 |         "import rlberry.colab_utils.display_setup\r\n",
176 |         "from rlberry.colab_utils.display_setup import show_video"
177 |       ],
178 |       "execution_count": 7,
179 |       "outputs": []
180 |     },
181 |     {
182 |       "cell_type": "code",
183 |       "metadata": {
184 |         "id": "MESFRbWdfA6P"
185 |       },
186 |       "source": [
187 |         "class ActorNetwork(nn.Module):\r\n",
188 |         "    \"\"\"\r\n",
189 |         "     This network represents the policy\r\n",
190 |         "    \"\"\"\r\n",
191 |         "\r\n",
192 |         "    def __init__(self, input_size, hidden_size, action_size):\r\n",
193 |         "        super(ActorNetwork, self).__init__()\r\n",
194 |         "        self.n_actions = action_size\r\n",
195 |         "        self.dim_observation = input_size\r\n",
196 |         "        \r\n",
197 |         "        self.net = nn.Sequential(\r\n",
198 |         "            nn.Linear(in_features=self.dim_observation, out_features=hidden_size),\r\n",
199 |         "            nn.ReLU(),\r\n",
200 |         "            nn.Linear(in_features=hidden_size, out_features=hidden_size),\r\n",
201 |         "            nn.ReLU(),\r\n",
202 |         "            nn.Linear(in_features=hidden_size, out_features=self.n_actions),\r\n",
203 |         "            nn.Softmax(dim=-1)\r\n",
204 |         "        )\r\n",
205 |         "        \r\n",
206 |         "    def policy(self, state):\r\n",
207 |         "        state = torch.tensor(state, dtype=torch.float)\r\n",
208 |         "        return self.net(state)\r\n",
209 |         "    \r\n",
210 |         "    def sample_action(self, state):\r\n",
211 |         "        state = torch.tensor(state, dtype=torch.float)\r\n",
212 |         "        action = torch.multinomial(self.policy(state), 1)\r\n",
213 |         "        return action.item()"
214 |       ],
215 |       "execution_count": 8,
216 |       "outputs": []
217 |     },
218 |     {
219 |       "cell_type": "code",
220 |       "metadata": {
221 |         "id": "R_DHHAQNfD7Z"
222 |       },
223 |       "source": [
224 |         "class ValueNetwork(nn.Module):\r\n",
225 |         "  \"\"\"\r\n",
226 |         "   This class represents the value function\r\n",
227 |         "  \"\"\"\r\n",
228 |         "\r\n",
229 |         "  def __init__(self, input_size, hidden_size, output_size):\r\n",
230 |         "      super(ValueNetwork, self).__init__()\r\n",
231 |         "      self.fc1 = nn.Linear(input_size, hidden_size)\r\n",
232 |         "      self.fc2 = nn.Linear(hidden_size, hidden_size)\r\n",
233 |         "      self.fc3 = nn.Linear(hidden_size, output_size)\r\n",
234 |         "\r\n",
235 |         "  def forward(self, x):\r\n",
236 |         "      out = F.relu(self.fc1(x))\r\n",
237 |         "      out = F.relu(self.fc2(out))\r\n",
238 |         "      out = self.fc3(out)\r\n",
239 |         "      return out\r\n",
240 |         "  \r\n",
241 |         "  def value(self, state):\r\n",
242 |         "      state = torch.tensor(state, dtype=torch.float)\r\n",
243 |         "      return self.forward(state)"
244 |       ],
245 |       "execution_count": 9,
246 |       "outputs": []
247 |     },
248 |     {
249 |       "cell_type": "code",
250 |       "metadata": {
251 |         "id": "_Ry-b3HgfGx5"
252 |       },
253 |       "source": [
254 |         "# You can select your environment here\r\n",
255 |         "env_id = 'CartPole-v1'  # @param [\"CartPole-v1\", \"LunarLander-v2\", \"MountainCar-v0\"]\r\n",
256 |         "env = gym.make(env_id)\r\n",
257 |         "eval_env = gym.make(env_id) # environment to evaluate the policy"
258 |       ],
259 |       "execution_count": 10,
260 |       "outputs": []
261 |     },
262 |     {
263 |       "cell_type": "code",
264 |       "metadata": {
265 |         "id": "h65dXIY5fMZg"
266 |       },
267 |       "source": [
268 |         "# Define you networks\r\n",
269 |         "value_network = ValueNetwork(env.observation_space.shape[0], 16, 1)\r\n",
270 |         "actor_network = ActorNetwork(env.observation_space.shape[0], 16, env.action_space.n)\r\n",
271 |         "print(value_network)\r\n",
272 |         "print(actor_network)\r\n",
273 |         "\r\n",
274 |         "# Define your optimizers\r\n",
275 |         "value_network_optimizer = torch.optim.RMSprop(value_network.parameters(), lr=0.01)\r\n",
276 |         "actor_network_optimizer = torch.optim.RMSprop(actor_network.parameters(), lr=0.01)\r\n",
277 |         "\r\n",
278 |         "# --------------------------------------------------------------\r\n",
279 |         "# Parameters\r\n",
280 |         "# --------------------------------------------------------------\r\n",
281 |         "num_iterations = 300     # Number of iterations\r\n",
282 |         "batch_size = 512         # How many samples to collect (value of M)\r\n",
283 |         "gamma = 1                # Discount factor\r\n",
284 |         "alpha = 0.001            # Entropy term coefficient\r\n",
285 |         "reward_threshold = 495   # Stop training when the policy achieves this amound of rewards\r\n",
286 |         "\r\n",
287 |         "\r\n",
288 |         "# --------------------------------------------------------------\r\n",
289 |         "# Train\r\n",
290 |         "# --------------------------------------------------------------\r\n",
291 |         "for iteration in range(num_iterations):\r\n",
292 |         "    # Initialize batch storage\r\n",
293 |         "    states = np.empty((batch_size,) + env.observation_space.shape, dtype=np.float)        # shape (batch_size, state_dim)\r\n",
294 |         "    rewards = np.empty((batch_size,), dtype=np.float)                                     # shape (batch_size, )                                 \r\n",
295 |         "    next_states = np.empty((batch_size,) + env.observation_space.shape, dtype=np.float)   # shape (batch_size, state_dim)\r\n",
296 |         "    dones = np.empty((batch_size,), dtype=np.bool)                                        # shape (batch_size, ) \r\n",
297 |         "    proba = torch.empty((batch_size,), dtype=np.float)                                    # shape (batch_size, ), store pi(a_t|s_t)\r\n",
298 |         "    next_value = 0                               # \r\n",
299 |         "  \r\n",
300 |         "    # Intialize environment\r\n",
301 |         "    state = env.reset()\r\n",
302 |         "\r\n",
303 |         "  # Generate batch\r\n",
304 |         "    for i in range(batch_size):\r\n",
305 |         "        action = actor_network.sample_action(state)\r\n",
306 |         "        next_state, reward, done, _ = env.step(action)\r\n",
307 |         "\r\n",
308 |         "        states[i] = # ...\r\n",
309 |         "        rewards[i] = # ...\r\n",
310 |         "        next_states[i] = # ...\r\n",
311 |         "        dones[i] = # ...\r\n",
312 |         "        proba[i] = # ...\r\n",
313 |         "\r\n",
314 |         "        state = next_state\r\n",
315 |         "        if done:\r\n",
316 |         "          state = env.reset()\r\n",
317 |         "\r\n",
318 |         "    if not done:\r\n",
319 |         "        next_value = value_network.value(next_states[-1]).detach().numpy()[0]\r\n",
320 |         "\r\n",
321 |         "    # compute returns (without bootstrapping)\r\n",
322 |         "    returns = np.zeros((batch_size,), dtype=np.float)\r\n",
323 |         "    T = batch_size\r\n",
324 |         "    for j in range(T):\r\n",
325 |         "        returns[T-j-1] = rewards[T-j-1]\r\n",
326 |         "        if j > 0:\r\n",
327 |         "            returns[T-j-1] += gamma * returns[T-j] * (1 - dones[T-j])\r\n",
328 |         "        else:\r\n",
329 |         "            returns[T-j-1] += gamma * next_value\r\n",
330 |         "\r\n",
331 |         "    # compute advantage\r\n",
332 |         "    values = value_network.value(states)\r\n",
333 |         "    advantages = # ...\r\n",
334 |         "\r\n",
335 |         "    # Compute MSE (Value loss)\r\n",
336 |         "    value_network_optimizer.zero_grad()\r\n",
337 |         "    loss_value = # ...\r\n",
338 |         "    loss_value.backward()\r\n",
339 |         "    value_network_optimizer.step()\r\n",
340 |         "\r\n",
341 |         "    # Compute entropy term\r\n",
342 |         "    dist = actor_network.policy(states)\r\n",
343 |         "    entropy_term = -(dist*dist.log()).sum(-1).mean()\r\n",
344 |         "\r\n",
345 |         "    # Compute policy loss\r\n",
346 |         "    actor_network_optimizer.zero_grad()\r\n",
347 |         "    loss_policy = # ...\r\n",
348 |         "    loss_policy += -alpha * entropy_term\r\n",
349 |         "    loss_policy.backward()\r\n",
350 |         "    actor_network_optimizer.step()\r\n",
351 |         "\r\n",
352 |         "    if( (iteration+1)%10 == 0 ):\r\n",
353 |         "        eval_rewards = np.zeros(5)\r\n",
354 |         "        for sim in range(5):\r\n",
355 |         "            eval_done = False\r\n",
356 |         "            eval_state = eval_env.reset()\r\n",
357 |         "            while not eval_done:\r\n",
358 |         "                eval_action = actor_network.sample_action(eval_state)\r\n",
359 |         "                eval_next_state, eval_reward, eval_done, _ = eval_env.step(eval_action)\r\n",
360 |         "                eval_rewards[sim] += eval_reward\r\n",
361 |         "                eval_state = eval_next_state\r\n",
362 |         "        print(\"Iteration = {}, loss_value = {:0.3f}, loss_policy = {:0.3f}, rewards = {:0.2f}\"\r\n",
363 |         "              .format(iteration +1, loss_value.item(), loss_policy.item(), eval_rewards.mean()))\r\n",
364 |         "        if (eval_rewards.mean() > reward_threshold):\r\n",
365 |         "            break"
366 |       ],
367 |       "execution_count": null,
368 |       "outputs": []
369 |     },
370 |     {
371 |       "cell_type": "code",
372 |       "metadata": {
373 |         "id": "kPzvAqDVhc_K"
374 |       },
375 |       "source": [
376 |         "env = Monitor(env, \"./gym-results\", force=True, video_callable=lambda episode: True)\r\n",
377 |         "for episode in range(1):\r\n",
378 |         "    done = False\r\n",
379 |         "    state = env.reset()\r\n",
380 |         "    while not done:\r\n",
381 |         "        action = actor_network.sample_action(state)\r\n",
382 |         "        state, reward, done, info = env.step(action)\r\n",
383 |         "env.close()\r\n",
384 |         "show_video(directory=\"./gym-results\")"
385 |       ],
386 |       "execution_count": null,
387 |       "outputs": []
388 |     },
389 |     {
390 |       "cell_type": "markdown",
391 |       "metadata": {
392 |         "id": "vNqnseJtlU87"
393 |       },
394 |       "source": [
395 |         "# Test other environments!\r\n",
396 |         "\r\n",
397 |         "Try some other environments available in OpenAI gym ([link](https://gym.openai.com/envs/#classic_control)). Suggestion: use `classic control` or `Box2D` environments."
398 |       ]
399 |     }
400 |   ]
401 | }


--------------------------------------------------------------------------------
/Deep_Q_Learning/README.md:
--------------------------------------------------------------------------------
 1 | # Instructions
 2 | 
 3 | **To run the notebook in [Google Colab](https://colab.research.google.com/)**, click on the link
 4 | `Open in Colab` at the top of the `.ipynb` file.
 5 | 
 6 | 
 7 | **To run the notebook locally**, download the `.ipynb` file and install the required libraries,
 8 | as explained below.
 9 | 
10 | * Setup virtual environment (optional but recommended):
11 | 
12 | ```
13 | conda create -n rltutorials python=3.8
14 | conda activate rltutorials
15 | ```
16 | 
17 | * Install required libraries:
18 | 
19 | ```
20 | conda install -c conda-forge jupyterlab
21 | pip install git+https://github.com/rlberry-py/rlberry.git#egg=rlberry[torch_agents]
22 | ```
23 | 


--------------------------------------------------------------------------------
/Deep_Q_Learning/Tutorial_Deep_Q_Learning.ipynb:
--------------------------------------------------------------------------------
  1 | {
  2 |   "nbformat": 4,
  3 |   "nbformat_minor": 0,
  4 |   "metadata": {
  5 |     "colab": {
  6 |       "name": "Tutorial_Deep_Q_Learning.ipynb",
  7 |       "provenance": [],
  8 |       "collapsed_sections": [],
  9 |       "authorship_tag": "ABX9TyP9EbLl6g2dURBpFFjKPouU",
 10 |       "include_colab_link": true
 11 |     },
 12 |     "kernelspec": {
 13 |       "name": "python3",
 14 |       "display_name": "Python 3"
 15 |     }
 16 |   },
 17 |   "cells": [
 18 |     {
 19 |       "cell_type": "markdown",
 20 |       "metadata": {
 21 |         "id": "view-in-github",
 22 |         "colab_type": "text"
 23 |       },
 24 |       "source": [
 25 |         "<a href=\"https://colab.research.google.com/github/rlberry-py/tutorials/blob/main/Deep_Q_Learning/Tutorial_Deep_Q_Learning.ipynb\" target=\"_parent\"><img src=\"https://colab.research.google.com/assets/colab-badge.svg\" alt=\"Open In Colab\"/></a>"
 26 |       ]
 27 |     },
 28 |     {
 29 |       "cell_type": "markdown",
 30 |       "metadata": {
 31 |         "id": "2j_no2BuvPUE"
 32 |       },
 33 |       "source": [
 34 |         "# Tutorial - Deep Q-Learning \n",
 35 |         "\n",
 36 |         "Deep Q-Learning uses a neural network to approximate $Q$ functions. Hence, we usually refer to this algorithm as DQN (for *deep Q network*).\n",
 37 |         "\n",
 38 |         "The parameters of the neural network are denoted by $\\theta$. \n",
 39 |         "*   As input, the network takes a state $s$,\n",
 40 |         "*   As output, the network returns $Q(s, a, \\theta)$, the value of each action $a$ in state $s$, according to the parameters $\\theta$.\n",
 41 |         "\n",
 42 |         "\n",
 43 |         "The goal of Deep Q-Learning is to learn the parameters $\\theta$ so that $Q(s, a, \\theta)$ approximates well the optimal $Q$-function $Q^*(s, a)$. \n",
 44 |         "\n",
 45 |         "In addition to the network with parameters $\\theta$, the algorithm keeps another network with the same architecture and parameters $\\theta^-$, called **target network**.\n",
 46 |         "\n",
 47 |         "The algorithm works as follows:\n",
 48 |         "\n",
 49 |         "1.   At each time $t$, the agent is in state $s_t$ and has observed the transitions $(s_i, a_i, r_i, s_i')_{i=1}^{t-1}$, which are stored in a **replay buffer**.\n",
 50 |         "\n",
 51 |         "2.  Choose action $a_t = \\arg\\max_a Q(s_t, a)$ with probability $1-\\varepsilon_t$, and $a_t$=random action with probability $\\varepsilon_t$. \n",
 52 |         "\n",
 53 |         "3. Take action $a_t$, observe reward $r_t$ and next state $s_t'$.\n",
 54 |         "\n",
 55 |         "4. Add transition $(s_t, a_t, r_t, s_t')$ to the **replay buffer**.\n",
 56 |         "\n",
 57 |         "4.  Sample a minibatch $\\mathcal{B}$ containing $B$ transitions from the replay buffer. Using this minibatch, we define the loss:\n",
 58 |         "\n",
 59 |         "$$\n",
 60 |         "L(\\theta) = \\sum_{(s_i, a_i, r_i, s_i') \\in \\mathcal{B}}\n",
 61 |         "\\left[\n",
 62 |         "Q(s_i, a_i, \\theta) -  y_i\n",
 63 |         "\\right]^2\n",
 64 |         "$$\n",
 65 |         "where the $y_i$ are the **targets** computed with the **target network** $\\theta^-$:\n",
 66 |         "\n",
 67 |         "$$\n",
 68 |         "y_i = r_i + \\gamma \\max_{a'} Q(s_i', a', \\theta^-).\n",
 69 |         "$$\n",
 70 |         "\n",
 71 |         "5. Update the parameters $\\theta$ to minimize the loss, e.g., with gradient descent (**keeping $\\theta^-$ fixed**): \n",
 72 |         "$$\n",
 73 |         "\\theta \\gets \\theta - \\eta \\nabla_\\theta L(\\theta)\n",
 74 |         "$$\n",
 75 |         "where $\\eta$ is the optimization learning rate. \n",
 76 |         "\n",
 77 |         "6. Every $N$ transitions ($t\\mod N$ = 0), update target parameters: $\\theta^- \\gets \\theta$.\n",
 78 |         "\n",
 79 |         "7. $t \\gets t+1$. Stop if $t = T$, otherwise go to step 2."
 80 |       ]
 81 |     },
 82 |     {
 83 |       "cell_type": "markdown",
 84 |       "metadata": {
 85 |         "id": "HhKHif__t9OD"
 86 |       },
 87 |       "source": [
 88 |         "# Colab setup"
 89 |       ]
 90 |     },
 91 |     {
 92 |       "cell_type": "code",
 93 |       "metadata": {
 94 |         "colab": {
 95 |           "base_uri": "https://localhost:8080/"
 96 |         },
 97 |         "id": "aylqy_sDqebM",
 98 |         "outputId": "e1a78b7f-f832-4119-e8c5-3e02264944d9"
 99 |       },
100 |       "source": [
101 |         "# After installing, restart the kernel\n",
102 |         "\n",
103 |         "if 'google.colab' in str(get_ipython()):\n",
104 |         "  print(\"Installing packages, please wait a few moments. You may need to restart the runtime after the installation.\")\n",
105 |         "\n",
106 |         "  # install rlberry library\n",
107 |         "  !pip install git+https://github.com/rlberry-py/rlberry.git#egg=rlberry[default] > /dev/null 2>&1\n",
108 |         "\n",
109 |         "  # install gym\n",
110 |         "  !pip install gym[all] > /dev/null 2>&1\n",
111 |         "\n",
112 |         "  # packages required to show video\n",
113 |         "  !pip install pyvirtualdisplay > /dev/null 2>&1\n",
114 |         "  !apt-get install -y xvfb python-opengl ffmpeg > /dev/null 2>&1"
115 |       ],
116 |       "execution_count": 18,
117 |       "outputs": [
118 |         {
119 |           "output_type": "stream",
120 |           "name": "stdout",
121 |           "text": [
122 |             "Installing packages, please wait a few moments. You may need to restart the runtime after the installation.\n"
123 |           ]
124 |         }
125 |       ]
126 |     },
127 |     {
128 |       "cell_type": "code",
129 |       "metadata": {
130 |         "id": "VWBRfwosfA9f"
131 |       },
132 |       "source": [
133 |         "# Imports\n",
134 |         "import torch\n",
135 |         "import torch.nn as nn\n",
136 |         "import torch.nn.functional as F\n",
137 |         "import torch.optim as optim\n",
138 |         "import numpy as np\n",
139 |         "import random\n",
140 |         "from copy import deepcopy\n",
141 |         "from gym.wrappers import Monitor\n",
142 |         "import gym"
143 |       ],
144 |       "execution_count": 19,
145 |       "outputs": []
146 |     },
147 |     {
148 |       "cell_type": "code",
149 |       "metadata": {
150 |         "id": "35Zzr-xCya5y"
151 |       },
152 |       "source": [
153 |         "# Create directory for saving videos\n",
154 |         "!mkdir videos > /dev/null 2>&1\n",
155 |         "\n",
156 |         "# Initialize display and import function to show videos\n",
157 |         "import rlberry.colab_utils.display_setup\n",
158 |         "from rlberry.colab_utils.display_setup import show_video"
159 |       ],
160 |       "execution_count": 20,
161 |       "outputs": []
162 |     },
163 |     {
164 |       "cell_type": "code",
165 |       "metadata": {
166 |         "id": "FLLwJLQlrTxo"
167 |       },
168 |       "source": [
169 |         "# Random number generator\n",
170 |         "import rlberry.seeding as seeding \n",
171 |         "seeder = seeding.Seeder(456)\n",
172 |         "rng = seeder.rng"
173 |       ],
174 |       "execution_count": 21,
175 |       "outputs": []
176 |     },
177 |     {
178 |       "cell_type": "markdown",
179 |       "metadata": {
180 |         "id": "528oqsgefIFl"
181 |       },
182 |       "source": [
183 |         "# 1. Define the parameters"
184 |       ]
185 |     },
186 |     {
187 |       "cell_type": "code",
188 |       "metadata": {
189 |         "id": "CtExtR4dfMbm",
190 |         "colab": {
191 |           "base_uri": "https://localhost:8080/"
192 |         },
193 |         "outputId": "64f36e7b-b953-4442-bc88-9d9fe6b90ef7"
194 |       },
195 |       "source": [
196 |         "# Environment\n",
197 |         "env = gym.make(\"CartPole-v0\")\n",
198 |         "\n",
199 |         "# Discount factor\n",
200 |         "GAMMA = 0.99\n",
201 |         "\n",
202 |         "# Batch size\n",
203 |         "BATCH_SIZE = 256\n",
204 |         "# Capacity of the replay buffer\n",
205 |         "BUFFER_CAPACITY = 10000\n",
206 |         "# Update target net every ... episodes\n",
207 |         "UPDATE_TARGET_EVERY = 20\n",
208 |         "\n",
209 |         "# Initial value of epsilon\n",
210 |         "EPSILON_START = 1.0\n",
211 |         "# Parameter to decrease epsilon\n",
212 |         "DECREASE_EPSILON = 200\n",
213 |         "# Minimum value of epislon\n",
214 |         "EPSILON_MIN = 0.05\n",
215 |         "\n",
216 |         "# Number of training episodes\n",
217 |         "N_EPISODES = 200\n",
218 |         "\n",
219 |         "# Learning rate\n",
220 |         "LEARNING_RATE = 0.1"
221 |       ],
222 |       "execution_count": 22,
223 |       "outputs": [
224 |         {
225 |           "output_type": "stream",
226 |           "name": "stdout",
227 |           "text": [
228 |             "INFO: Making new env: CartPole-v0\n"
229 |           ]
230 |         }
231 |       ]
232 |     },
233 |     {
234 |       "cell_type": "markdown",
235 |       "metadata": {
236 |         "id": "6g16Je-dhM2Q"
237 |       },
238 |       "source": [
239 |         "# 2. Define the replay buffer"
240 |       ]
241 |     },
242 |     {
243 |       "cell_type": "code",
244 |       "metadata": {
245 |         "id": "Jvh82br9hMNt"
246 |       },
247 |       "source": [
248 |         "class ReplayBuffer:\n",
249 |         "    def __init__(self, capacity):\n",
250 |         "        self.capacity = capacity\n",
251 |         "        self.memory = []\n",
252 |         "        self.position = 0\n",
253 |         "\n",
254 |         "    def push(self, state, action, reward, next_state, done):\n",
255 |         "        \"\"\"Saves a transition.\"\"\"\n",
256 |         "        if len(self.memory) < self.capacity:\n",
257 |         "            self.memory.append(None)\n",
258 |         "        self.memory[self.position] = (state, action, reward, next_state, done)\n",
259 |         "        self.position = (self.position + 1) % self.capacity\n",
260 |         "\n",
261 |         "    def sample(self, batch_size):\n",
262 |         "        return rng.choice(self.memory, batch_size).tolist()\n",
263 |         "\n",
264 |         "\n",
265 |         "    def __len__(self):\n",
266 |         "        return len(self.memory)\n",
267 |         "\n",
268 |         "# create instance of replay buffer\n",
269 |         "replay_buffer = ReplayBuffer(BUFFER_CAPACITY)"
270 |       ],
271 |       "execution_count": 23,
272 |       "outputs": []
273 |     },
274 |     {
275 |       "cell_type": "markdown",
276 |       "metadata": {
277 |         "id": "UCc9WZppi92W"
278 |       },
279 |       "source": [
280 |         "# 3. Define the neural network architecture, objective and optimizer"
281 |       ]
282 |     },
283 |     {
284 |       "cell_type": "code",
285 |       "metadata": {
286 |         "id": "sdNz3Jrwi9iS"
287 |       },
288 |       "source": [
289 |         "class Net(nn.Module):\n",
290 |         "    \"\"\"\n",
291 |         "    Basic neural net.\n",
292 |         "    \"\"\"\n",
293 |         "    def __init__(self, obs_size, hidden_size, n_actions):\n",
294 |         "        super(Net, self).__init__()\n",
295 |         "        self.net = nn.Sequential(\n",
296 |         "            nn.Linear(obs_size, hidden_size),\n",
297 |         "            nn.ReLU(),\n",
298 |         "            nn.Linear(hidden_size, n_actions)\n",
299 |         "        )\n",
300 |         "\n",
301 |         "    def forward(self, x):\n",
302 |         "        return self.net(x)"
303 |       ],
304 |       "execution_count": 24,
305 |       "outputs": []
306 |     },
307 |     {
308 |       "cell_type": "code",
309 |       "metadata": {
310 |         "id": "NI9hFJ28jLZ_"
311 |       },
312 |       "source": [
313 |         "# create network and target network\n",
314 |         "hidden_size = 128\n",
315 |         "obs_size = env.observation_space.shape[0]\n",
316 |         "n_actions = env.action_space.n\n",
317 |         "\n",
318 |         "q_net = Net(obs_size, hidden_size, n_actions)\n",
319 |         "target_net = Net(obs_size, hidden_size, n_actions)\n",
320 |         "\n",
321 |         "# objective and optimizer\n",
322 |         "objective = nn.MSELoss()\n",
323 |         "optimizer = optim.Adam(params=q_net.parameters(), lr=LEARNING_RATE)"
324 |       ],
325 |       "execution_count": 25,
326 |       "outputs": []
327 |     },
328 |     {
329 |       "cell_type": "markdown",
330 |       "metadata": {
331 |         "id": "xnR8nfoSjZjL"
332 |       },
333 |       "source": [
334 |         "# 4. Implement Deep Q-Learning"
335 |       ]
336 |     },
337 |     {
338 |       "cell_type": "code",
339 |       "metadata": {
340 |         "id": "z6fT8cKdjmTZ"
341 |       },
342 |       "source": [
343 |         "#\n",
344 |         "#  Some useful functions\n",
345 |         "#\n",
346 |         "\n",
347 |         "def get_q(states):\n",
348 |         "    \"\"\"\n",
349 |         "    Compute Q function for a list of states\n",
350 |         "    \"\"\"\n",
351 |         "    with torch.no_grad():\n",
352 |         "        states_v = torch.FloatTensor([states])\n",
353 |         "        output = q_net.forward(states_v).data.numpy()  # shape (1, len(states), n_actions)\n",
354 |         "    return output[0, :, :]  # shape (len(states), n_actions)\n",
355 |         "\n",
356 |         "def eval_dqn(n_sim=5):\n",
357 |         "    \"\"\"   \n",
358 |         "    Monte Carlo evaluation of DQN agent.\n",
359 |         "\n",
360 |         "    Repeat n_sim times:\n",
361 |         "        * Run the DQN policy until the environment reaches a terminal state (= one episode)\n",
362 |         "        * Compute the sum of rewards in this episode\n",
363 |         "        * Store the sum of rewards in the episode_rewards array.\n",
364 |         "    \"\"\"\n",
365 |         "    env_copy = deepcopy(env)\n",
366 |         "    episode_rewards = np.zeros(n_sim)\n",
367 |         "\n",
368 |         "    for ii in range(n_sim):\n",
369 |         "        state = env_copy.reset()\n",
370 |         "        done = False \n",
371 |         "        while not done:\n",
372 |         "            action = choose_action(state, 0.0)\n",
373 |         "            next_state, reward, done, _ = env_copy.step(action)\n",
374 |         "            episode_rewards[ii] += reward\n",
375 |         "            state = next_state\n",
376 |         "    return episode_rewards"
377 |       ],
378 |       "execution_count": 26,
379 |       "outputs": []
380 |     },
381 |     {
382 |       "cell_type": "code",
383 |       "metadata": {
384 |         "id": "OMspDNntkIoe"
385 |       },
386 |       "source": [
387 |         "def choose_action(state, epsilon):\n",
388 |         "    \"\"\"\n",
389 |         "    ** TO BE IMPLEMENTED **\n",
390 |         "    \n",
391 |         "    Return action according to an epsilon-greedy exploration policy\n",
392 |         "    \"\"\"\n",
393 |         "    return 0\n",
394 |         "    \n",
395 |         "\n",
396 |         "def update(state, action, reward, next_state, done):\n",
397 |         "    \"\"\"\n",
398 |         "    ** TO BE COMPLETED **\n",
399 |         "    \"\"\"\n",
400 |         "    \n",
401 |         "    # add data to replay buffer\n",
402 |         "    replay_buffer.push(state, action, reward, next_state, done)\n",
403 |         "    \n",
404 |         "    if len(replay_buffer) < BATCH_SIZE:\n",
405 |         "        return np.inf\n",
406 |         "    \n",
407 |         "    # get batch\n",
408 |         "    transitions = replay_buffer.sample(BATCH_SIZE)\n",
409 |         "\n",
410 |         "    # Compute loss - TO BE IMPLEMENTED!\n",
411 |         "    values  = torch.zeros(BATCH_SIZE)   # to be computed using batch\n",
412 |         "    targets = torch.zeros(BATCH_SIZE)   # to be computed using batch\n",
413 |         "    loss = objective(values, targets)\n",
414 |         "     \n",
415 |         "    # Optimize the model - UNCOMMENT!\n",
416 |         "#     optimizer.zero_grad()\n",
417 |         "#     loss.backward()\n",
418 |         "#     optimizer.step()\n",
419 |         "    \n",
420 |         "    return loss.data.numpy()"
421 |       ],
422 |       "execution_count": 27,
423 |       "outputs": []
424 |     },
425 |     {
426 |       "cell_type": "code",
427 |       "metadata": {
428 |         "id": "QIhpKPhkkU4W",
429 |         "colab": {
430 |           "base_uri": "https://localhost:8080/"
431 |         },
432 |         "outputId": "93f23393-0bc4-48bf-d315-1fbc1d94f7c2"
433 |       },
434 |       "source": [
435 |         "\n",
436 |         "#\n",
437 |         "# Train\n",
438 |         "# \n",
439 |         "\n",
440 |         "EVAL_EVERY = 5\n",
441 |         "REWARD_THRESHOLD = 199\n",
442 |         "\n",
443 |         "def train():\n",
444 |         "    state = env.reset()\n",
445 |         "    epsilon = EPSILON_START\n",
446 |         "    ep = 0\n",
447 |         "    total_time = 0\n",
448 |         "    while ep < N_EPISODES:\n",
449 |         "        action = choose_action(state, epsilon)\n",
450 |         "\n",
451 |         "        # take action and update replay buffer and networks\n",
452 |         "        next_state, reward, done, _ = env.step(action)\n",
453 |         "        loss = update(state, action, reward, next_state, done)\n",
454 |         "\n",
455 |         "        # update state\n",
456 |         "        state = next_state\n",
457 |         "\n",
458 |         "        # end episode if done\n",
459 |         "        if done:\n",
460 |         "            state = env.reset()\n",
461 |         "            ep   += 1\n",
462 |         "            if ( (ep+1)% EVAL_EVERY == 0):\n",
463 |         "                rewards = eval_dqn()\n",
464 |         "                print(\"episode =\", ep+1, \", reward = \", np.mean(rewards))\n",
465 |         "                if np.mean(rewards) >= REWARD_THRESHOLD:\n",
466 |         "                    break\n",
467 |         "\n",
468 |         "            # update target network\n",
469 |         "            if ep % UPDATE_TARGET_EVERY == 0:\n",
470 |         "                target_net.load_state_dict(q_net.state_dict())\n",
471 |         "            # decrease epsilon\n",
472 |         "            epsilon = EPSILON_MIN + (EPSILON_START - EPSILON_MIN) * \\\n",
473 |         "                            np.exp(-1. * ep / DECREASE_EPSILON )    \n",
474 |         "\n",
475 |         "        total_time += 1\n",
476 |         "\n",
477 |         "# Run the training loop\n",
478 |         "train()\n",
479 |         "\n",
480 |         "# Evaluate the final policy\n",
481 |         "rewards = eval_dqn(20)\n",
482 |         "print(\"\")\n",
483 |         "print(\"mean reward after training = \", np.mean(rewards))"
484 |       ],
485 |       "execution_count": 28,
486 |       "outputs": [
487 |         {
488 |           "output_type": "stream",
489 |           "name": "stdout",
490 |           "text": [
491 |             "episode = 5 , reward =  9.6\n",
492 |             "episode = 10 , reward =  9.4\n",
493 |             "episode = 15 , reward =  9.4\n",
494 |             "episode = 20 , reward =  9.2\n",
495 |             "episode = 25 , reward =  9.2\n",
496 |             "episode = 30 , reward =  9.8\n",
497 |             "episode = 35 , reward =  9.8\n",
498 |             "episode = 40 , reward =  10.0\n",
499 |             "episode = 45 , reward =  9.2\n",
500 |             "episode = 50 , reward =  9.8\n"
501 |           ]
502 |         },
503 |         {
504 |           "output_type": "stream",
505 |           "name": "stderr",
506 |           "text": [
507 |             "/usr/local/lib/python3.7/dist-packages/ipykernel_launcher.py:15: VisibleDeprecationWarning: Creating an ndarray from ragged nested sequences (which is a list-or-tuple of lists-or-tuples-or ndarrays with different lengths or shapes) is deprecated. If you meant to do this, you must specify 'dtype=object' when creating the ndarray\n",
508 |             "  from ipykernel import kernelapp as app\n"
509 |           ]
510 |         },
511 |         {
512 |           "output_type": "stream",
513 |           "name": "stdout",
514 |           "text": [
515 |             "episode = 55 , reward =  9.8\n",
516 |             "episode = 60 , reward =  9.4\n",
517 |             "episode = 65 , reward =  9.6\n",
518 |             "episode = 70 , reward =  9.6\n",
519 |             "episode = 75 , reward =  8.8\n",
520 |             "episode = 80 , reward =  10.0\n",
521 |             "episode = 85 , reward =  9.2\n",
522 |             "episode = 90 , reward =  9.4\n",
523 |             "episode = 95 , reward =  9.2\n",
524 |             "episode = 100 , reward =  9.2\n",
525 |             "episode = 105 , reward =  9.2\n",
526 |             "episode = 110 , reward =  9.6\n",
527 |             "episode = 115 , reward =  9.2\n",
528 |             "episode = 120 , reward =  9.2\n",
529 |             "episode = 125 , reward =  9.4\n",
530 |             "episode = 130 , reward =  9.8\n",
531 |             "episode = 135 , reward =  9.2\n",
532 |             "episode = 140 , reward =  9.2\n",
533 |             "episode = 145 , reward =  10.2\n",
534 |             "episode = 150 , reward =  9.2\n",
535 |             "episode = 155 , reward =  9.4\n",
536 |             "episode = 160 , reward =  9.6\n",
537 |             "episode = 165 , reward =  9.6\n",
538 |             "episode = 170 , reward =  9.4\n",
539 |             "episode = 175 , reward =  9.0\n",
540 |             "episode = 180 , reward =  9.0\n",
541 |             "episode = 185 , reward =  9.6\n",
542 |             "episode = 190 , reward =  9.2\n",
543 |             "episode = 195 , reward =  9.4\n",
544 |             "episode = 200 , reward =  9.4\n",
545 |             "\n",
546 |             "mean reward after training =  9.8\n"
547 |           ]
548 |         }
549 |       ]
550 |     },
551 |     {
552 |       "cell_type": "markdown",
553 |       "metadata": {
554 |         "id": "c8QZwuvjgrMm"
555 |       },
556 |       "source": [
557 |         "# Visualize the DQN policy"
558 |       ]
559 |     },
560 |     {
561 |       "cell_type": "code",
562 |       "metadata": {
563 |         "colab": {
564 |           "base_uri": "https://localhost:8080/",
565 |           "height": 474
566 |         },
567 |         "id": "FGcGwOcEfzPz",
568 |         "outputId": "3aa22829-9b5c-4308-cd1a-aadb1a629fb0"
569 |       },
570 |       "source": [
571 |         "def render_env(env):\n",
572 |         "  env = deepcopy(env)\n",
573 |         "  env = Monitor(env, './videos', force=True, video_callable=lambda episode: True)\n",
574 |         "  for episode in range(1):\n",
575 |         "    done = False\n",
576 |         "    state = env.reset()\n",
577 |         "    env.render()\n",
578 |         "    while not done:\n",
579 |         "        action = action = choose_action(state, 0.0)\n",
580 |         "        state, reward, done, info = env.step(action)\n",
581 |         "        env.render()\n",
582 |         "    env.close()\n",
583 |         "    show_video()\n",
584 |         "\n",
585 |         "render_env(env)"
586 |       ],
587 |       "execution_count": 29,
588 |       "outputs": [
589 |         {
590 |           "output_type": "stream",
591 |           "name": "stdout",
592 |           "text": [
593 |             "INFO: Clearing 4 monitor files from previous run (because force=True was provided)\n",
594 |             "INFO: Starting new video recorder writing to /content/videos/openaigym.video.1.705.video000000.mp4\n",
595 |             "INFO: Finished writing results. You can upload them to the scoreboard via gym.upload('/content/videos')\n"
596 |           ]
597 |         },
598 |         {
599 |           "output_type": "display_data",
600 |           "data": {
601 |             "text/html": [
602 |               "<video alt=\"videos/openaigym.video.1.705.video000000.mp4\" autoplay\n",
603 |               "                      loop controls style=\"height: 400px;\">\n",
604 |               "                    <source src=\"data:video/mp4;base64,AAAAIGZ0eXBpc29tAAACAGlzb21pc28yYXZjMW1wNDEAAAAIZnJlZQAACX1tZGF0AAACrgYF//+q3EXpvebZSLeWLNgg2SPu73gyNjQgLSBjb3JlIDE1MiByMjg1NCBlOWE1OTAzIC0gSC4yNjQvTVBFRy00IEFWQyBjb2RlYyAtIENvcHlsZWZ0IDIwMDMtMjAxNyAtIGh0dHA6Ly93d3cudmlkZW9sYW4ub3JnL3gyNjQuaHRtbCAtIG9wdGlvbnM6IGNhYmFjPTEgcmVmPTMgZGVibG9jaz0xOjA6MCBhbmFseXNlPTB4MzoweDExMyBtZT1oZXggc3VibWU9NyBwc3k9MSBwc3lfcmQ9MS4wMDowLjAwIG1peGVkX3JlZj0xIG1lX3JhbmdlPTE2IGNocm9tYV9tZT0xIHRyZWxsaXM9MSA4eDhkY3Q9MSBjcW09MCBkZWFkem9uZT0yMSwxMSBmYXN0X3Bza2lwPTEgY2hyb21hX3FwX29mZnNldD0tMiB0aHJlYWRzPTMgbG9va2FoZWFkX3RocmVhZHM9MSBzbGljZWRfdGhyZWFkcz0wIG5yPTAgZGVjaW1hdGU9MSBpbnRlcmxhY2VkPTAgYmx1cmF5X2NvbXBhdD0wIGNvbnN0cmFpbmVkX2ludHJhPTAgYmZyYW1lcz0zIGJfcHlyYW1pZD0yIGJfYWRhcHQ9MSBiX2JpYXM9MCBkaXJlY3Q9MSB3ZWlnaHRiPTEgb3Blbl9nb3A9MCB3ZWlnaHRwPTIga2V5aW50PTI1MCBrZXlpbnRfbWluPTI1IHNjZW5lY3V0PTQwIGludHJhX3JlZnJlc2g9MCByY19sb29rYWhlYWQ9NDAgcmM9Y3JmIG1idHJlZT0xIGNyZj0yMy4wIHFjb21wPTAuNjAgcXBtaW49MCBxcG1heD02OSBxcHN0ZXA9NCBpcF9yYXRpbz0xLjQwIGFxPTE6MS4wMACAAAACDmWIhAAv//72rvzLK0cLlS4dWXuzUfLoSXL9iDB9aAAAAwAAAwAAJuKiZ0WFMeJsgAAALmAIWElDyDzETFWKgS4v4K+ByKAPrX3tgDEZATr4EXstyvAXFCWbtM70af/KAoobdfsSp7KUox0D/RhweLc7ILF+6Mrkf6N5VIlp8kRNrQsd35qhIun0khNd/8eQWjVl8EFCLUxnnD47VhGUyNBLJuw9vk9MG0zOal06uBnJ8clLV/6hH4/m8W0Vks7xjI1SR0vmsTMyPlYAswgwqLzxTLkkbzz52lXLcIjHdcjGRFnfDuORQW98QBL1RQA0ZZulitn/ab2kMnDSDkFuaJhADJLNijoKwJ9PR4AlV/5TU/0Xt6b5Sr23S3VqRRq4vd8JRfDUAxE7XkFJQV66sMoMJdaLSwWTSnV+8tf1TjoKe/dR/VLfwjab/oTGZLAoQB1tU8vrQ4A0O5lGKhl8/7KhhV30eo5z+K2bZRS7bpofY242RXJyoi+K1wpgYv2oFDkmXwLwo4lWWekRzlX/eyTHlg6/uxNubwDifU+cDoRG+hgwy5Zq4AryFpUQaxmmvG86N7oXBk5uJNMfp3pXiIC6sVAY7p4r8+8R4+ANYSPM26AJhkPeNfox9wQq9ot7j7ymlICm/IGYu1pjH3a+HYZKvFI7GGbXbyNX9fZZUmK6OfO3eYAAAAMAAAMAE/EAAACuQZokbEK//jhAAAEVG4q4vQAOLIsPgNjcDI4fPXsr59vSY5wdspWyB3HWMOI+MqnNXF8WHDs49T6xtTTZAX93KEk/qs/fucNS/ik2zm/PGM0Bk7WhJy8+vhTmEgD4I6CWLFOpmjI1xVeHrdZHfie6G/TwmhvyvmqRr6WSQLWfwQjXUqykhrvW/LCv8oqvkXzvtcPM05/hoPhqtwAAAwAAyLHZrDSVry9nLhIHorHIAAAAV0GeQniEfwAAF05LsDni6HXS+JhC7h4pOLSrUMgjs39E4IABO1PObtRG5Dsnp66GLv8jGvvcIvQ5Sl8og8CQv377WMJOKObhRGZzpMAAAAZCvt0sPCCXgQAAADcBnmF0R/8AAA3XwoKXPn+Bo3GshD+HidXLE276W6EtRqu+tjP9mS10KAAAAwAAEaxfmzZYQE7AAAAAPAGeY2pH/wAAJLHL6MH8GsEREx9QXQA7rLPMIHDaL3WmY27WnTTvCiVy+QWX2FcpoIAAAGAj79H/LLAsoQAAAM1BmmdJqEFomUwIV//+OEAAARU236L6pneNM4JyAnpY9AC3jtwjf9iXHt1MKVxnIDVRAMAAr5XmiKAEfOcCm4l+4MSgS3LjIRH9Do38qPT/58jmzVKO+hqknaGtMsJTH9TV4oVpucLx5MSKnek3KdYCzGRtANT3WQYIjO9ERz0M9FOCP/yHLYvwpwMwQqLUNxQHKJMKTnEJBKbVtrXuXI1i/aQctx2yhTh7wOpZf6f8jfmrhBQhp0fzb8GsC9NazDc0USBZoP609u+/wHKRAAAAVUGehUURLCP/AAAXUEfYkZFRAAi5FAYJ0+6dxMon7dKkFi+I6Bakib3K/lcDtfUKuvz1gokvQd+seHXG+SaSTkXc3KF8hXmMp0w7c+GY/Jdm/qy2bMEAAABJAZ6makf/AAAko3FrluIUIyFOmGkGpuB8BUa+zQwAXE+hqoncaWP3cJPiKxnyDqu4+HH0V/9E5ADSSWkQPz8o/0VQTFuBm0zxYQAAAL5BmqpJqEFsmUwI//yEAAAQb1q5rig20pKAFhd6fG5rGmuauoKy3xot5FeeXl/NPXPVSHWbf4m1E/XPw6mVQqDrSHMQSyTI2X8F8gUVnNBcF7VkfI9uaFfrkPAVmZxMcH79Lxs+qtY2SOifkuELlbOSH2sHkQ3txZyvCi/fY5+oSSIfpXrT39p4IXvMw4SJrFwIfYSMXNhn812M8RZdoOuCFSdaRIur0cY1T0pW7FXTVY2y8zzrwlTfqLVtW2IwAAAAeUGeyEUVLCP/AAAXRQ+O0BTZv9DnkXAltZHPclrhUYR1Vseec7QP3ZwAtwJTkEpZI1VxLrMSTuO2AyAoCahAREgZTXzvW3/0p22LSUYN5iYCPHrP2913SCZX8TFdv23+QaLf9pnHSiseyXNxHQRnc4rory9a6OkwlQcAAABvAZ7pakf/AAAjxxXDSAAcQefJKSplyzCQhZTb5ShpFpal4whdLJ87U14MhQDenf4UlqLLIORB1aAjsWgbg3K5qmMdHOEMqBPRTCNh33KvKKprz9tjjF7amq4TG68385mebjaDIB2lrse0w9xDyAjZAAADh21vb3YAAABsbXZoZAAAAAAAAAAAAAAAAAAAA+gAAADcAAEAAAEAAAAAAAAAAAAAAAABAAAAAAAAAAAAAAAAAAAAAQAAAAAAAAAAAAAAAAAAQAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAIAAAKxdHJhawAAAFx0a2hkAAAAAwAAAAAAAAAAAAAAAQAAAAAAAADcAAAAAAAAAAAAAAAAAAAAAAABAAAAAAAAAAAAAAAAAAAAAQAAAAAAAAAAAAAAAAAAQAAAAAJYAAABkAAAAAAAJGVkdHMAAAAcZWxzdAAAAAAAAAABAAAA3AAAAgAAAQAAAAACKW1kaWEAAAAgbWRoZAAAAAAAAAAAAAAAAAAAMgAAAAsAVcQAAAAAAC1oZGxyAAAAAAAAAAB2aWRlAAAAAAAAAAAAAAAAVmlkZW9IYW5kbGVyAAAAAdRtaW5mAAAAFHZtaGQAAAABAAAAAAAAAAAAAAAkZGluZgAAABxkcmVmAAAAAAAAAAEAAAAMdXJsIAAAAAEAAAGUc3RibAAAAJhzdHNkAAAAAAAAAAEAAACIYXZjMQAAAAAAAAABAAAAAAAAAAAAAAAAAAAAAAJYAZAASAAAAEgAAAAAAAAAAQAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAABj//wAAADJhdmNDAWQAH//hABlnZAAfrNlAmDPl4QAAAwABAAADAGQPGDGWAQAGaOvjyyLAAAAAGHN0dHMAAAAAAAAAAQAAAAsAAAEAAAAAFHN0c3MAAAAAAAAAAQAAAAEAAABYY3R0cwAAAAAAAAAJAAAAAQAAAgAAAAABAAAFAAAAAAEAAAIAAAAAAQAAAAAAAAABAAABAAAAAAEAAAQAAAAAAgAAAQAAAAABAAAEAAAAAAIAAAEAAAAAHHN0c2MAAAAAAAAAAQAAAAEAAAALAAAAAQAAAEBzdHN6AAAAAAAAAAAAAAALAAAExAAAALIAAABbAAAAOwAAAEAAAADRAAAAWQAAAE0AAADCAAAAfQAAAHMAAAAUc3RjbwAAAAAAAAABAAAAMAAAAGJ1ZHRhAAAAWm1ldGEAAAAAAAAAIWhkbHIAAAAAAAAAAG1kaXJhcHBsAAAAAAAAAAAAAAAALWlsc3QAAAAlqXRvbwAAAB1kYXRhAAAAAQAAAABMYXZmNTcuODMuMTAw\" type=\"video/mp4\" />\n",
605 |               "                 </video>"
606 |             ],
607 |             "text/plain": [
608 |               "<IPython.core.display.HTML object>"
609 |             ]
610 |           },
611 |           "metadata": {}
612 |         }
613 |       ]
614 |     }
615 |   ]
616 | }


--------------------------------------------------------------------------------
/Exploration/README.md:
--------------------------------------------------------------------------------
 1 | # Instructions
 2 | 
 3 | **To run the notebook in [Google Colab](https://colab.research.google.com/)**, click on the link
 4 | `Open in Colab` at the top of the `.ipynb` file.
 5 | 
 6 | 
 7 | **To run the notebook locally**, download the `.ipynb` file and install the required libraries,
 8 | as explained below.
 9 | 
10 | * Setup virtual environment (optional but recommended):
11 | 
12 | ```
13 | conda create -n rltutorials python=3.8
14 | conda activate rltutorials
15 | ```
16 | 
17 | * Install required libraries:
18 | 
19 | ```
20 | conda install -c conda-forge jupyterlab
21 | pip install git+https://github.com/rlberry-py/rlberry.git#egg=rlberry[default]
22 | ```
23 | 
24 | 


--------------------------------------------------------------------------------
/LICENSE:
--------------------------------------------------------------------------------
 1 | MIT License
 2 | 
 3 | Copyright (c) 2020 rlberry-py
 4 | 
 5 | Permission is hereby granted, free of charge, to any person obtaining a copy
 6 | of this software and associated documentation files (the "Software"), to deal
 7 | in the Software without restriction, including without limitation the rights
 8 | to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
 9 | copies of the Software, and to permit persons to whom the Software is
10 | furnished to do so, subject to the following conditions:
11 | 
12 | The above copyright notice and this permission notice shall be included in all
13 | copies or substantial portions of the Software.
14 | 
15 | THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
16 | IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
17 | FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
18 | AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
19 | LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
20 | OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
21 | SOFTWARE.
22 | 


--------------------------------------------------------------------------------
/README.md:
--------------------------------------------------------------------------------
 1 | <!-- Logo -->
 2 | <!-- <p align="center">
 3 |    <img src="logo/logo_wide.svg" width="50%">
 4 | </p> -->
 5 | 
 6 | <!-- Short description -->
 7 | <!-- <p align="center">
 8 |    Reinforcement Learning Tutorials
 9 | </p> -->
10 | 
11 | # Reinforcement Learning Tutorials
12 | 
13 | *   [Value Iteration and Q-Learning](https://github.com/rlberry-py/tutorials/blob/main/Value%20Iteration%20and%20Q-Learning/Value_Iteration_and_Q_Learning.ipynb)
14 | 
15 | *   [Deep Q Learning](https://github.com/rlberry-py/tutorials/blob/main/Deep_Q_Learning/Tutorial_Deep_Q_Learning.ipynb)
16 | 
17 | *   [Advantage Actor-Critic (A2C)](https://github.com/rlberry-py/tutorials/blob/main/A2C/Tutorial_Advantage_Actor_Critic_(A2C).ipynb)
18 | 
19 | See also the [`rlberry`](https://github.com/rlberry-py/rlberry) library!
20 | 


--------------------------------------------------------------------------------
/Value Iteration and Q-Learning/README.md:
--------------------------------------------------------------------------------
 1 | # Instructions
 2 | 
 3 | **To run the notebook in [Google Colab](https://colab.research.google.com/)**, click on the link
 4 | `Open in Colab` at the top of the `.ipynb` file.
 5 | 
 6 | 
 7 | **To run the notebook locally**, download the `.ipynb` file and install the required libraries,
 8 | as explained below.
 9 | 
10 | * Setup virtual environment (optional but recommended):
11 | 
12 | ```
13 | conda create -n rltutorials python=3.8
14 | conda activate rltutorials
15 | ```
16 | 
17 | * Install required libraries:
18 | 
19 | ```
20 | conda install -c conda-forge jupyterlab
21 | pip install git+https://github.com/rlberry-py/rlberry.git#egg=rlberry[default]
22 | ```
23 | 
24 | 


--------------------------------------------------------------------------------
/Value Iteration and Q-Learning/Value_Iteration_and_Q_Learning.ipynb:
--------------------------------------------------------------------------------
  1 | {
  2 |   "nbformat": 4,
  3 |   "nbformat_minor": 0,
  4 |   "metadata": {
  5 |     "colab": {
  6 |       "name": "Tutorial - Value Iteration and Q-Learning.ipynb",
  7 |       "provenance": [],
  8 |       "collapsed_sections": [],
  9 |       "toc_visible": true,
 10 |       "authorship_tag": "ABX9TyM+8H1rbTADo1Hh3m1E+mXQ",
 11 |       "include_colab_link": true
 12 |     },
 13 |     "kernelspec": {
 14 |       "name": "python3",
 15 |       "display_name": "Python 3"
 16 |     }
 17 |   },
 18 |   "cells": [
 19 |     {
 20 |       "cell_type": "markdown",
 21 |       "metadata": {
 22 |         "id": "view-in-github",
 23 |         "colab_type": "text"
 24 |       },
 25 |       "source": [
 26 |         "<a href=\"https://colab.research.google.com/github/rlberry-py/tutorials/blob/main/Value%20Iteration%20and%20Q-Learning/Value_Iteration_and_Q_Learning.ipynb\" target=\"_parent\"><img src=\"https://colab.research.google.com/assets/colab-badge.svg\" alt=\"Open In Colab\"/></a>"
 27 |       ]
 28 |     },
 29 |     {
 30 |       "cell_type": "markdown",
 31 |       "metadata": {
 32 |         "id": "Io_4iovMTlzT"
 33 |       },
 34 |       "source": [
 35 |         "# Tutorial - Value Iteration and Q-Learning\n",
 36 |         "---------------------------------\n",
 37 |         "\n",
 38 |         "In this tutorial, you will:\n",
 39 |         "\n",
 40 |         "* Implement the value iteration algorithm to approximate the value function when *a model of the environment is available*.\n",
 41 |         "* Implement the Q-Learning algorithm to approximate the value function when *the model is unknown*, that is, the agent must learn through interactions.\n",
 42 |         "\n",
 43 |         "We start with a short review of these algorithms.\n",
 44 |         "\n",
 45 |         "\n",
 46 |         "## Markov decision processes and value functions\n",
 47 |         "\n",
 48 |         "In reinforcement learning, an agent interacts with an enviroment by taking actions and observing rewards. Its goal is to learn a *policy*, that is, a mapping from states to actions, that maximizes the amount of reward it gathers.\n",
 49 |         "\n",
 50 |         "The enviroment is modeled as a __Markov decision process (MDP)__, defined by a set of states $\\mathcal{S}$, a set of actions $\\mathcal{A}$, a reward function $r(s, a)$ and transition probabilities $P(s'|s,a)$. When an agent takes action $a$ in state $s$, it receives a random reward with mean $r(s,a)$ and makes a transion to a state $s'$ distributed according to $P(s'|s,a)$.\n",
 51 |         "\n",
 52 |         "A __policy__ $\\pi$ is such that $\\pi(a|s)$ gives the probability of choosing an action $a$ in state $s$. __If the policy is deterministic__, we denote by $\\pi(s)$ the action that it chooses in state $s$. We are interested in finding a policy that maximizes the value function $V^\\pi$, defined as \n",
 53 |         "\n",
 54 |         "$$\n",
 55 |         "V^\\pi(s) = \\sum_{a\\in \\mathcal{A}} \\pi(a|s) Q^\\pi(s, a), \n",
 56 |         "\\quad \\text{where} \\quad \n",
 57 |         "Q^\\pi(s, a) = \\mathbf{E}\\left[ \\sum_{t=0}^\\infty \\gamma^t r(S_t, A_t)  \\Big| S_0 = s, A_0 = a\\right].\n",
 58 |         "$$\n",
 59 |         "and represents the mean of the sum of discounted rewards gathered by the policy $\\pi$ in the MDP, where $\\gamma \\in [0, 1[$ is a discount factor ensuring the convergence of the sum. \n",
 60 |         "\n",
 61 |         "The __action-value function__ $Q^\\pi$ is the __fixed point of the Bellman operator $T^\\pi$__:\n",
 62 |         "\n",
 63 |         "$$ \n",
 64 |         "Q^\\pi(s, a) = T^\\pi Q^\\pi(s, a)\n",
 65 |         "$$\n",
 66 |         "where, for any function $f: \\mathcal{S}\\times\\mathcal{A} \\to \\mathbb{R}$\n",
 67 |         "$$\n",
 68 |         "T^\\pi f(s, a) =  r(s, a) + \\gamma \\sum_{s'} P(s'|s,a) \\left(\\sum_{a'}\\pi(a'|s')f(s',a')\\right) \n",
 69 |         "$$\n",
 70 |         "\n",
 71 |         "\n",
 72 |         "The __optimal value function__, defined as $V^*(s) = \\max_\\pi V^\\pi(s)$ can be shown to satisfy $V^*(s) = \\max_a Q^*(s, a)$, where $Q^*$ is the __fixed point of the optimal Bellman operator $T^*$__: \n",
 73 |         "\n",
 74 |         "$$ \n",
 75 |         "Q^*(s, a) = T^* Q^*(s, a)\n",
 76 |         "$$\n",
 77 |         "where, for any function $f: \\mathcal{S}\\times\\mathcal{A} \\to \\mathbb{R}$\n",
 78 |         "$$\n",
 79 |         "T^* f(s, a) =  r(s, a) + \\gamma \\sum_{s'} P(s'|s,a) \\max_{a'} f(s', a')\n",
 80 |         "$$\n",
 81 |         "and there exists an __optimal policy__ which is deterministic, given by $\\pi^*(s) \\in \\arg\\max_a Q^*(s, a)$.\n",
 82 |         "\n",
 83 |         "\n",
 84 |         "## Value iteration\n",
 85 |         "\n",
 86 |         "If both the reward function $r$ and the transition probablities $P$ are known, we can compute $Q^*$ using value iteration, which proceeds as follows:\n",
 87 |         "\n",
 88 |         "1. Start with arbitrary $Q_0$, set $t=0$.\n",
 89 |         "2. Compute $Q_{t+1}(s, a) = T^*Q_t(s,a)$ for every $(s, a)$.\n",
 90 |         "3. If $\\max_{s,a} | Q_{t+1}(s, a) -  Q_t(s,a)| \\leq \\varepsilon$, return $Q_{t}$. Otherwise, set $t \\gets t+1$ and go back to 2. \n",
 91 |         "\n",
 92 |         "The convergence is guaranteed by the contraction property of the Bellman operator, and $Q_{t+1}$ can be shown to be a good approximation of $Q^*$ for small epsilon. \n",
 93 |         "\n",
 94 |         "__Question__: Can you bound the error $\\max_{s,a} | Q^*(s, a) -  Q_t(s,a)|$ as a function of $\\gamma$ and $\\varepsilon$?\n",
 95 |         "\n",
 96 |         "## Q-Learning\n",
 97 |         "\n",
 98 |         "In value iteration, we need to know $r$ and $P$ to implement the Bellman operator. When these quantities are not available, we can approximate $Q^*$ using *samples* from the environment with the Q-Learning algorithm.\n",
 99 |         "\n",
100 |         "Q-Learning with __$\\varepsilon$-greedy exploration__ proceeds as follows:\n",
101 |         "\n",
102 |         "1. Start with arbitrary $Q_0$, get starting state $s_0$, set $t=0$.\n",
103 |         "2. Choosing action $a_t$: \n",
104 |         "  * With probability $\\varepsilon$ choose $a_t$ randomly (uniform distribution)  \n",
105 |         "  * With probability $1-\\varepsilon$, choose $a_t \\in \\arg\\max_a Q_t(s_t, a)$.\n",
106 |         "3. Take action $a_t$, observe next state $s_{t+1}$ and reward $r_t$.\n",
107 |         "4. Compute error $\\delta_t = r_t + \\gamma \\max_a Q_t(s_{t+1}, a) - Q_t(s_t, a_t)$.\n",
108 |         "5. Update \n",
109 |         "  * $Q_{t+1}(s, a) = Q_t(s, a) + \\alpha_t(s,a) \\delta_t$,  __if $s=s_t$ and $a=a_t$__\n",
110 |         "  * $Q_{t+1}(s, a) = Q_{t}(s, a)$ otherwise.\n",
111 |         "\n",
112 |         "Here, $\\alpha_t(s,a)$ is a learning rate that can depend, for instance, on the number of times the algorithm has visited the state-action pair $(s, a)$. \n"
113 |       ]
114 |     },
115 |     {
116 |       "cell_type": "markdown",
117 |       "metadata": {
118 |         "id": "KYq9-63OR8RW"
119 |       },
120 |       "source": [
121 |         "# Colab setup"
122 |       ]
123 |     },
124 |     {
125 |       "cell_type": "code",
126 |       "metadata": {
127 |         "id": "AxepTGrNR3DX",
128 |         "colab": {
129 |           "base_uri": "https://localhost:8080/"
130 |         },
131 |         "outputId": "42376421-d387-42a8-a943-0d1c5b5b3db0"
132 |       },
133 |       "source": [
134 |         "if 'google.colab' in str(get_ipython()):\n",
135 |         "  print(\"Installing packages, please wait a few moments. Restart the runtime after the installation.\")\n",
136 |         "\n",
137 |         "  # install rlberry library\n",
138 |         "  !pip install git+https://github.com/rlberry-py/rlberry.git#egg=rlberry[default] > /dev/null 2>&1\n",
139 |         "\n",
140 |         "  # packages required to show video\n",
141 |         "  !pip install pyvirtualdisplay > /dev/null 2>&1\n",
142 |         "  !apt-get install -y xvfb python-opengl ffmpeg > /dev/null 2>&1\n"
143 |       ],
144 |       "execution_count": 1,
145 |       "outputs": [
146 |         {
147 |           "output_type": "stream",
148 |           "name": "stdout",
149 |           "text": [
150 |             "Installing packages, please wait a few moments. Restart the runtime after the installation.\n"
151 |           ]
152 |         }
153 |       ]
154 |     },
155 |     {
156 |       "cell_type": "code",
157 |       "metadata": {
158 |         "id": "3_bPhqKlSiF0",
159 |         "colab": {
160 |           "base_uri": "https://localhost:8080/"
161 |         },
162 |         "outputId": "959689cb-1e62-41f3-c1ac-71741bd5bb48"
163 |       },
164 |       "source": [
165 |         "# Create directory for saving videos\n",
166 |         "!mkdir videos > /dev/null 2>&1\n",
167 |         "\n",
168 |         "# The following code is will be used to visualize the environments.\n",
169 |         "import base64\n",
170 |         "from pyvirtualdisplay import Display\n",
171 |         "from IPython import display as ipythondisplay\n",
172 |         "from IPython.display import clear_output\n",
173 |         "from pathlib import Path\n",
174 |         "\n",
175 |         "def show_video(filename=None, directory='./videos'):\n",
176 |         "    \"\"\"\n",
177 |         "    Either show all videos in a directory (if filename is None) or \n",
178 |         "    show video corresponding to filename.\n",
179 |         "    \"\"\"\n",
180 |         "    html = []\n",
181 |         "    if filename is not None:\n",
182 |         "        files = Path('./').glob(filename)\n",
183 |         "    else:\n",
184 |         "        files = Path(directory).glob(\"*.mp4\")\n",
185 |         "    for mp4 in files:\n",
186 |         "        print(mp4)\n",
187 |         "        video_b64 = base64.b64encode(mp4.read_bytes())\n",
188 |         "        html.append('''<video alt=\"{}\" autoplay \n",
189 |         "                      loop controls style=\"height: 400px;\">\n",
190 |         "                      <source src=\"data:video/mp4;base64,{}\" type=\"video/mp4\" />\n",
191 |         "                 </video>'''.format(mp4, video_b64.decode('ascii')))\n",
192 |         "    ipythondisplay.display(ipythondisplay.HTML(data=\"<br>\".join(html)))\n",
193 |         "     \n",
194 |         "from pyvirtualdisplay import Display\n",
195 |         "display = Display(visible=0, size=(800, 800))\n",
196 |         "display.start()"
197 |       ],
198 |       "execution_count": 2,
199 |       "outputs": [
200 |         {
201 |           "output_type": "execute_result",
202 |           "data": {
203 |             "text/plain": [
204 |               "<pyvirtualdisplay.display.Display at 0x7f799eb86a50>"
205 |             ]
206 |           },
207 |           "metadata": {},
208 |           "execution_count": 2
209 |         }
210 |       ]
211 |     },
212 |     {
213 |       "cell_type": "code",
214 |       "metadata": {
215 |         "id": "ZYZCXMpisE_O"
216 |       },
217 |       "source": [
218 |         "# other required libraries\n",
219 |         "import numpy as np\n",
220 |         "import matplotlib.pyplot as plt\n",
221 |         "\n"
222 |       ],
223 |       "execution_count": 3,
224 |       "outputs": []
225 |     },
226 |     {
227 |       "cell_type": "markdown",
228 |       "metadata": {
229 |         "id": "zOPiAupGmkxh"
230 |       },
231 |       "source": [
232 |         "# Warm up: interacting with a reinforcement learning environment"
233 |       ]
234 |     },
235 |     {
236 |       "cell_type": "code",
237 |       "metadata": {
238 |         "id": "6IZ0bVAlTjpZ",
239 |         "colab": {
240 |           "base_uri": "https://localhost:8080/",
241 |           "height": 578
242 |         },
243 |         "outputId": "60cf10f4-8f13-4264-c281-1194beff4c1d"
244 |       },
245 |       "source": [
246 |         "from rlberry.envs import GridWorld\n",
247 |         "\n",
248 |         "# A GridWorld is an environment where an agent moves in a 2d grid and aims to reach the state which gives a reward.\n",
249 |         "env = GridWorld(nrows=3, ncols=5, walls=((0,2),(1, 2)), success_probability=0.9)\n",
250 |         "\n",
251 |         "# Number of states and actions\n",
252 |         "print(\"number of states = \", env.observation_space.n)\n",
253 |         "print(\"number of actions = \", env.action_space.n)\n",
254 |         "\n",
255 |         "# Transitions probabilities, env.P[s, a, s'] = P(s'|s, a)\n",
256 |         "print(\"transition probabilities from state 0 by taking action 1: \", env.P[0, 1, :])\n",
257 |         "\n",
258 |         "# Reward function: env.R[s, a] = r(s, a)\n",
259 |         "print(\"mean reward in state 0 for action 1 = \", env.R[0, 1])\n",
260 |         "\n",
261 |         "# Following a random policy \n",
262 |         "state = env.reset()     # initial state \n",
263 |         "env.enable_rendering()  # save states for visualization\n",
264 |         "for tt in range(100):   # interact for 100 time steps\n",
265 |         "  action = env.action_space.sample()  # random action, a good RL agent must have a better strategy!\n",
266 |         "  next_state, reward, is_terminal, info = env.step(action)\n",
267 |         "  if is_terminal:\n",
268 |         "    break\n",
269 |         "  state = next_state\n",
270 |         "\n",
271 |         "# save video \n",
272 |         "env.save_video('./videos/random_policy.mp4', framerate=10)\n",
273 |         "# clear rendering data\n",
274 |         "env.clear_render_buffer()\n",
275 |         "env.disable_rendering()\n",
276 |         "# see video\n",
277 |         "show_video(filename='./videos/random_policy.mp4')"
278 |       ],
279 |       "execution_count": 4,
280 |       "outputs": [
281 |         {
282 |           "output_type": "stream",
283 |           "name": "stderr",
284 |           "text": [
285 |             "[INFO] OpenGL_accelerate module loaded \n",
286 |             "[INFO] Using accelerated ArrayDatatype \n",
287 |             "[INFO] Generating grammar tables from /usr/lib/python3.7/lib2to3/Grammar.txt \n",
288 |             "[INFO] Generating grammar tables from /usr/lib/python3.7/lib2to3/PatternGrammar.txt \n"
289 |           ]
290 |         },
291 |         {
292 |           "output_type": "stream",
293 |           "name": "stdout",
294 |           "text": [
295 |             "number of states =  13\n",
296 |             "number of actions =  4\n",
297 |             "transition probabilities from state 0 by taking action 1:  [0.  0.9 0.  0.  0.1 0.  0.  0.  0.  0.  0.  0.  0. ]\n",
298 |             "mean reward in state 0 for action 1 =  0.0\n",
299 |             "videos/random_policy.mp4\n"
300 |           ]
301 |         },
302 |         {
303 |           "output_type": "display_data",
304 |           "data": {
305 |             "text/html": [
306 |               "<video alt=\"videos/random_policy.mp4\" autoplay \n",
307 |               "                      loop controls style=\"height: 400px;\">\n",
308 |               "                      <source src=\"data:video/mp4;base64,AAAAIGZ0eXBpc29tAAACAGlzb21pc28yYXZjMW1wNDEAAAAIZnJlZQAAbMdtZGF0AAACrgYF//+q3EXpvebZSLeWLNgg2SPu73gyNjQgLSBjb3JlIDE1MiByMjg1NCBlOWE1OTAzIC0gSC4yNjQvTVBFRy00IEFWQyBjb2RlYyAtIENvcHlsZWZ0IDIwMDMtMjAxNyAtIGh0dHA6Ly93d3cudmlkZW9sYW4ub3JnL3gyNjQuaHRtbCAtIG9wdGlvbnM6IGNhYmFjPTEgcmVmPTMgZGVibG9jaz0xOjA6MCBhbmFseXNlPTB4MzoweDExMyBtZT1oZXggc3VibWU9NyBwc3k9MSBwc3lfcmQ9MS4wMDowLjAwIG1peGVkX3JlZj0xIG1lX3JhbmdlPTE2IGNocm9tYV9tZT0xIHRyZWxsaXM9MSA4eDhkY3Q9MSBjcW09MCBkZWFkem9uZT0yMSwxMSBmYXN0X3Bza2lwPTEgY2hyb21hX3FwX29mZnNldD0tMiB0aHJlYWRzPTMgbG9va2FoZWFkX3RocmVhZHM9MSBzbGljZWRfdGhyZWFkcz0wIG5yPTAgZGVjaW1hdGU9MSBpbnRlcmxhY2VkPTAgYmx1cmF5X2NvbXBhdD0wIGNvbnN0cmFpbmVkX2ludHJhPTAgYmZyYW1lcz0zIGJfcHlyYW1pZD0yIGJfYWRhcHQ9MSBiX2JpYXM9MCBkaXJlY3Q9MSB3ZWlnaHRiPTEgb3Blbl9nb3A9MCB3ZWlnaHRwPTIga2V5aW50PTI1MCBrZXlpbnRfbWluPTEwIHNjZW5lY3V0PTQwIGludHJhX3JlZnJlc2g9MCByY19sb29rYWhlYWQ9NDAgcmM9Y3JmIG1idHJlZT0xIGNyZj0yMy4wIHFjb21wPTAuNjAgcXBtaW49MCBxcG1heD02OSBxcHN0ZXA9NCBpcF9yYXRpbz0xLjQwIGFxPTE6MS4wMACAAAAGamWIhAAz//7uHj4FM3AOamQ97YqGAgx+CS04juRuxkU994wW1nP/5aAAAAMAAAMAAAMADNNCUAQzGEyZ394o8sKz8AAAAwAAAwHQAaAAC+3+FKveYAjcYOXfvle8oQLH0R2RCAtioXdSzvEKaXQI9RN7biMvA8rAeGTpIjgkmiPIG7UsrUr+0cg6NwmubFXpfHTBCrcFuoTAYtXdd8zJOQeRV3xVaKANlyCgnHrLROTeOMJcJk9zRQAiC9+KR2b1C82p6AAD2Q43Hmecz+i/HX7lN5/wjzgdbWDZBdZerNZ0VHLsq7YSRY6NCeaWizINn00uF5IE4GSTa8JLB+kpB7Te7uw03u59HqVz/MJufgJCzCFPdw0MEOHQdoyrsNbiMBv8pvVDGrDek4jU0a5nFTt2kIpaT3xEOnDMIU/v2WpTw2qbIg913MYf6QYOnxJDnmJVHg84iORm/6ePy5PNL531E700d3TxMh9GBX8V0h/seLJhoIf0Ww1HQRg28H80N7S0i96ASFwcpUPlPl0LV6RiJ9kd6jSuArjQK8OmnG5co/MTtprmRg199pSiupjJZdXtnBf6amcEg+4S0R4LRK7OiAkF0sIS5f62WXF5xYzlUany1MWTtsocw/zBPGcPf+nftZZdsWAAAyjZtHvIpvrbqdI79+WnmpdHo0h1rmz6ub4WtAII6V692ZYwL9T6ndNTA7X8eAVKRGioMGrYbE3qeyICpVXIoJLvfngHwLkDbtSyyP1iPyz5X0y3yvs1bdmUTza9KaHp/hWnmdCTRGOsuW25OKHfyU0itvZrxRIDcZdLCsc15guEwnX6r3GTZSA8+PA/W+Tj2yPXunvMUH/arTDvJLt38uxM/xFKBsMgK5rmlyK7TOV64oPJrfK02qku4qXFwUevMsMjavuESrOT+7tLC93uNwqXAfCEA6qJSL/kXldfq1/JVLwZeq4Entz5LSdiOzrCvFRj8OJP2J2DMKqfQpsbwaBYQLwhH0jJNv3gWuJn3NVjX3dXOxSnZ8aBL7dwLCChFM6iluW9HWs/2557nhTkdANJTxIS6RtULwC6Bhspej+5W8gZ7KY9VRIjUlBg8Yx2iv9UTKCoUN/VWwGHJ9r3O35S+GLf/3cA4Mo/02w96jeKZz0AdKy6pTONldq19hFdWOp8QSGBzXWqf1vZuiSJlUVP5TW733dl8206zvtnr8uTHIArXFq3WweiZMJqJVTXeJYtzeQAS07hb8nff/SWx/81mj8cn4eNBgRuV3f4Y1bXlyw5FuiDMFshMSz+5/yHh2S0kxdC1M8W2Pw4ybUECEfLjZBHHQvnijcVvjzgw3S4oLBDEleoC+AAleEZaDqfzK93psAIEo2wNW/AicqCi2YKdwgsPCC58IMDwgxvDA3i3cQ5AmiKgFef+BXf/Ar66xp/MrGPn/zmryQkAbV2KugbriJZ4BQyge9+SkkRtYbfcWOSKsiQ5k+4nU2P4gXTpS7M1s7MetEpXJ7aMpK9IYB76221IOfQubiXzxf6oL5UNbbtoaRNXrwmNwqT+zWjWH9IJcvRvsekK3Eo8AW90t4tKKldTVp2pe/vVcuP3fok3guUyiPWreAsB162t4z+2jtg6jUgdtBieod9ZgtdgbQbMtPw62+nR/+6678lwUD41+TZp8weZmTh60VNrQ1kAd6NvG9fXxpzXPrK6e5Ei9RwkL67nxbUkGEJVqxOvMk87qfG3PXDf9QrkgR3zoAF+W6gmEKyhiEn2/eYVyQIZ6g7lqqiOtLGIroE+TvxqdmQCmz1lR2B4kj/rPicLgpg39nxo4g6St3KdI8j643hrZj1h+EPT7DtFGfqBFXWdcukfVfBGSwG5EYvxwr/kEYkRN0tFekzto84mP0z0FczR291de9J3bEhyVIjgnCxQWQ7ty2XNL5iOE4Zh/XBQbT9qhEmDTLz6ff1N6S/8cNH6evzRLFXlV3bU/ojbZSt7AVmrZ0PMKFlUlrL3yvAM2ufnPZcDDagFBxqgHnzGF4gnJDyvQhUjgrzd+nyO2ifU4E4f8p74KdMd7AtnV5EDoh3vn+sVcmUyERpMlwx//vz977Uyc71dbRVzBk+ylo3lQzBjPOtCvMpplmCnapS4iSsUd6Km6Mam1R7xZcprhRFjTFv3b+xQQxSSECxK8bJX2bZ77D6UTAcubNBbrozi4GIEUMAAAJ0QZoibEM//p4QADX3W8EJ2mYPUfRbrzi5iZFnajz4/qiIMhj16kMr6Rn/Y1690BjFD1pq7CsrE+GtDcwU7Tt6b98WvtZ+x3TUBglq28LegAF18X3yPk3U5x9LzXbyov2QeYf5bdDVqeiHX9/0OzXndjHbh37aI9x22J49eelDduO9KB3/0mWmpgmMY48gT2GcoFoDTjkurYfbB5/wI8F5xqsx9V+JWVmwatjdfO9Fnv1PBVFf7IGaeThGTgGqLb1BK1zn5KHnAYXwBhQXQtG2Yi/nXfD0QFCvOIRSRup/kHnZcXvFfP2Rns/N+nN0esoa8+LMfpQfQJ1E7VtptzYSxam70Sqa2MgAEqlbk14hVJfhXAj82tBg/ADlWGV2zYIu1nWOp60Tpirwovj3nWJTpeE0uIeGMVA3NoxSInDWtIjOehIKvkcLnXZEHr+DgAqc9KC0u5Q0kyvRcSIh1Af524WgI8GLiNjV9R8W5YDabpM7uhmABB7wcQD3rgpRDshhaEieUu8AgJ9MQGIjofT2wGBZPW/iG/zdhgBiM5tSAOQwr13UxVIsJXB9/H8lLBlK/rP5o2FrflBjhT8sd2mYCGF/rB0XRgQiwZWdYGfgLOewqPgmhzbuV0nhLSSDMXRt4MOARChUFsY8whAQ4liHoDygEbmzqbngoUnCRyD3DTP5gUDQCFp3zwc3/htSgcDAsWZmlNH8iTKpB+4aK0buJ8f8pSJFnKe5Ur433iAU/RIValoHumJAHEgXThZticW8EQw9kxDoX6o6Rh+yw5PQCrAhOaZuTk3oxNCurFHDg9pa4ngFu3hyBGf0tvFUu5CKwanacAAAADsBnkF5Cf8ADoBXzm3QFTIQtuzoWwABFICiaaA5gdA50lqALGqU8dDPe8Burzybl9EhKIycXqKxsWBpwQAAAF1BmkM8IZMphDP//p4QAAADAAADAA+INOFepOw1b5h9UhsEb+YAbv0PVkkJ96i6ym3HcED+kARnElLeKJfNNk28UqULFhJPLf8SPrtflPaAkA9gvbMRxx+IFWQRK6AAAABSQZplSeEPJlMFPDP//p4QAAADAAADAA+XCdHoml5XqkOLKl5vp7Sky8WCoIAaepVqFn5jTiCZyV7KNuj3Sjsa6izCrzbQG01flQ7uHEZs/VZ4EQAAACsBnoRqQn8AAAMAAAMABDYjF6R8wgUsjFahAFKDJHQxlLdM4S6yRZPYRoJzAAACOkGah0nhDyZTBTwz//6eEAAAAwBFuPPhJXmgAcHFBWuABmMKW49Snqngb+y2HZrzuxjtw79tEe47ZTkJvvwZPL6FGcnTGQEza/GUzKoewT2GcoFoDTjnPO71IkFy7ywUJKko5nmnVoy6+d6LPfqeCqK/2QM1DvXVZgNUW3qCVrmk1Xiyw5/RXbuvQtG2Yi/nXfD0QFCytYNNlZKUaWS6KdFSPkijONZ2/Tm6PWQh6YHpWwooE5YwQzgyjtb5FcsbvRKsBluYTpvk7MCnqicNR4Zdak5Vhlds2CLtZ1jqqDY3P94UXx7zrCs/FaaW1irjFQNzaMUiJw1rSI0aww9ud3TC2PlsbUTD7iBPVwPpKAB1YhebzSIh1Ac4m1oQHO45hLMuc3OKZ4DabpM7v0CgVPxR0ln2TWQzBTdPr/uQEFiZoGeu+i5w6KOuznNGLhuIPgCaOqKB7VRPP5CxdyVA8uyKMn4+CwDBg4RwZo2FrflBjhT18YTTMAt7+oW1oHwXxVxJMKxDBYUAVfcwjv/smaQQk8JaSQZi6NvKyhL52RjwE3x/5jqaA8oBG5s6m5DTs6grwfBzULQTWNIArf55mXefux/MwqDIBR4kb+y/kD9IP3DRWjdxPgfoTmPLraKVR+Nx6I+5y/4Al6Cjs6YkAcSBdOFm2JxbVDn2p+YoO6cXtFhyegFWBCczjincSW+QB4Brwd2t41K+HhG88kCM/pbeKpdyEVoN+tueDU7wBsa0AAnoUL/E2QeI4QAAADMBnqZqQn8AAAMAEtiMQIaw3SAABspaHsgr5rCHotZaBGmW5PWA1156ZNCa/9Z9hyt0JuEAAAI4QZqoSeEPJlMCGf/+nhABk9c/CSvNAA4OKCtcADMYUtx6lPVPA39lsOzXndjHbh37aI9x2ynITffgyeX0KM5OmMgJm1+MpmVQ9gnsM5QLQGnHOed3qRILl3lgoSVJRzPNOrRl1870We/U8FUV/sgZqHeuqzAaotvUErXNJqvFlhz+iu3dehaNsxF/Ou+HogKFlawabKyUo0sl0U6KkfJFGcazt+nN0eshD0wPSthRQJyxghnBlHa3yK5Y3eiVYDLcwnTfJ2YFPVE4ajwy61JyrDK7ZsEXazrHVUGxuf7wovj3nWFZ+K00trFXGKgbm0YpEThrWkRo1hh7c7umFsfLY2omH3ECergfSUADqxC83mkRDqA5xNrQgOdxzCWZc5ucUzwG03SZ3foFAqfijpLPsmshmCm6fX/cgILEzQM9d9Fzh0UddnOaMXDcQfAE0dUUD2qiefyFi7kqB5dkUZPx8FgGDBwjgzRsLW/KDHCnr4wmmYBb39QtrQPgviriSYViGCwoAq+5hHf/ZM0ghJ4S0kgzF0beVlCXzsjHgJvj/zHU0B5QCNzZ1NyGnZ1BXg+DmoWgmsaQBW/zzMu8/dj+ZhUGQCjxI39l/IH6QfuGitG7ifA/QnMeXW0Uqj8bj0R9zl/wBL0FHZ0xIA4kC6cLNsTi2qHPtT8xQd04vaLDk9AKsCE5nHFO4kt8gDwDXg7tbxqV8PCN55IEZ/S28VS7kIrQb9bc8Gp3gDY1oABPQoX9217t4AAqYAAAAFRBmslJ4Q8mUwIZ//6eEAGT9judM57XIyl5D1lsUagafjYkAA4xgEHPpaDE9mV0pFwoiMC/7EANPn0kR9OIoRNTXKMouTTzdrDNAKGk/Mj60ggAEXAAAABPQZrqSeEPJlMCG//+p4QAZw5yaT4bYLx9XkAAsxZO5PwmPAudJAXbIhJmLxWjeq+hILusmzX4Xyt4LKIw2w0QYiRHDzFFUAQ5ETDCPAAEvQAAAsFBmw5J4Q8mUwIZ//6eEAH91z8JK80AFcxQVrgAZjCOCwp3lr627K/1Sw/gwBa54S/2w8mO2N/Gf6nITffgS7PbnNG5SM69VWvX/unp852iVB05Ghyh0GAIVcMwUu/DU3tCM9VNdFIiqI/1n39Ku/RtQEACdSWWwMCLpQPIY8VwzjhknJ8iJyEIyJMX5jVlB5wlnSoMFVjE3HdezW/EWuVz0YE71zrybNp+YSjo3GhEQIhk1ug5vtozo1juySCdv95AjAnvuc+z8BIqxvgePmCmSgKBJW7kHN8bRYPO58DF5xf90iuuNHAOvcXKzBWU8WkC0o2qcirrFMIsjp/O8Q5cLmdUVkIaV3X066GZ89kc38wLaqTKFl6nltBXxrONfzrKhgzvfOoD+ATAc2o4ulbAltZ9SrY+F6yRF/xgh/YRlHViTIR36MjJnB06CD+g0GplvwAAI//Ch7PfTNZ/LgIEKUYdTZaqn1jAv3F5azR/rkdUb3d7C9xHHDctKxlo+0w8UJRwt6Xl1/lHw3KWtEnow5T+G56kn88dbd3YC3y4mtyd4msqaF+0h/qMvgl2pKck2zshdLty4+sVk2M11eMSvrE6pSgg75yDX4uo+ENTMNbL0khKqitYcfFRRzk/RzzJlnkfHzWg+EAIbUUJ5quHvs02k1N+YNMmZ8ZLZX1gFhU1xCVsHSqW9+UvuQPK1NzODaznncYqjCOhdh/vKp8+0xxFqe/XwJUYXAvJ36o78UykBMN99lFcTPgC7o1lRLu+laU0SruGSF0Btpnp4Zkdar39RynEf9jhW7gSHFP4259K5WzUMq3ImTmAUKTj9vUGOLK88M+k3QVy55xly5ck+BfR83cvm2Q/DtVkMWCSgQ1Mnm43O54486PKN7PNFHIziqit7Hix+bBfVPSle9LaMk1WSSGUspk8UOgAAAMABZQAAAAxQZ8sRRE8K/8AargVlqIqG/TXTbWJhtlG5uLw/4+TlwCJZkotnIgtDAAAAwAAAwAPSAAAACoBn0t0Qn8AirSerniFSACjJEk2bVSG1URn5F06aB6Sh/CQAAADAAADAYEAAAAVAZ9NakJ/AADdPFpWmBQAAAMAAKSBAAAATkGbUEmoQWiZTBTwz/6eEAH94To9E0u2yotIoY/5pcjZSoakOy9cuFRyTQ/UBVVLOIbj0tgn3P/MFV+9P/JNVS5NV03aqbfIYAAAAwAHTQAAACwBn29qQn8AiwupX1nb5otq89iHrvjT4GTj1GCATT4hHA6TYQAAAwAAAwAKuAAAAlFBm3JJ4QpSZTBSwz/+nhABk+E6PRNMDCYrsYALROMIjTidjCluPUp6p4G/sth2a87sY7cO/bRHuO1cbcTMHxPL6FGcnTGQEza/GUzKoewT2GcoFoDTjnFr6wdqIir3+QDDlB9sg3Ixh7pxdtGbWZilVrRuXeWChJUlHM806tGXV3Qi6dIA3KotPZAzTl+XxqfN9S+oJWuaTVeLLEj9Jds8ovnUsute4vAFQgqFa4QiklhmOnUyoU6KmlEmRimzt+oN0esLjE7UlSnD7XTLuhf2um2/XdcsvvRKrM9PoAAGaTu8POfoswKeqJw1Hhl1qTQGWV1eGsiKacHU9qJxwufefHJOliU6itNLiRf6h+Gm4CxjP0OtaRGcyQZG/zXS+eHeDdPhuIE9XA+kplAO7Rhj9bDTfcgix3aAOdxzCWZb4WXAVgILDSZ3d5rAAx51tdCiX/NSlNcqSyTYDa8AkG0eoGeq4Fv3kjzpcLNVDSbiQ6AmE6iggDFZdqd1MXgeXZFGT8fBYBgwcIpnx3QgO20nWy0IVcnFU54/ULa0D4L4q4kmFYhgsKAKvuYR3/2TNBoYOEqa4MxdG3hQsMVRKFwIoO1ZfH/mKvogdcDrwzqbnoktad4tthgE2ppwaYBVBzzMzM/ss8IugGQCjxI39l/IH1GVT2+NG7ifFLQnMcfC0Uqj8bj0R9zl/wBL0FHZ0SHti8jIKRjXscoAYCbQTIS0rGSxE62gUsA2v6Tmid9TZoJIeVdNeDu1vGpXw8I3nkRduCCUoVLuQisAqAAAAwADugAAADIBn5FqQn8AbATJekfMIFLIxWoT0AAbKCZQDIkmzhQWU2IqH4aEZa+//O6AAAADAADKgQAAAkxBm5NJ4Q6JlMCG//6nhABP+Zdo5vfOyFKpfAC2M9gyxg0oD8s+Ld1XjBfnDDwZm1MZsouin73wTGNevrUCE6WG7KkzOMsRVkDDnBjxBZFLqydcwNOP/2BXbH5nw7J1gNYJZOioUdgCMteqvEFGB33Xe2oFyWC9ZwC6zL3/tb9OhcjFUNYd8+DEN/3voORtAvvnZiXcXinUp/YngAmvRPRCsx+I2TRA89Qpw9ST6C6jr06agmISyijKS34/TxuPVoR8+/EXaon7BrXP0JQXe86sQVDKRKrupq1AALDmiRKjyZYoVGkThnYDYFImxgMrq/HrrY2WOp45Tj5iIEy5t4C5brFTpjDirgGeszaMxK28eDJEZyRN7byLonZkxf+ts64WKfYxNs5JGkkHAa1REOoBEFlHFE594oXgCaKPi16AdjcYP2mHsACSRra6SFdUGwMqxnC6zy9rTe4K+dNGIkLFuYWCzUWCU0W2Gua4AyGSiggAENHUcvfKu+TMijJ+PcsxgoQHz+aNHf62Ww7vUOVcnFU7vx/Ia0D6sv+2XTh/0b4OqaZoCwyn3MWSB4Suplw/E12IXwFNtZLOgi6fSpOvtPfKm04Gms8PHoQeOQiGx/MrlwYmsaYBP4Ekpec/w6vWjtFsKrywL+fVyKM7Kp7kWjdxPj3lKRInFpDXFZlXPuMg/R2nuq690poAK8jKKRjXsdd4U5hPWwfG0yU42dDaBYADMAhOaYqYAtfrlKUXFHs1zIxa6R1SOLcmTgSNXrnZGPcjfgAAAwAAm4AAAAKDQZu3SeEPJlMCG//+p4QAPP7KfgvYfWDACdbCEaa8aW6pbvih3m42lfSrZRraAIIoLIrmtrkcw7JAZT+JzBQQ1CcLZnY93B1Es/+7vgPhJcIFUsuoxsTHORctXVKjcfcwd8WBVIXXTgyPsltwx6jTdZHMSzUHzr4JfxRPKVjQ5oteZEZWYgltUrCZezK4CGNoHsIhFh43hAYJuIvlVxNZLPmzg+hxc9cHBvciy3akO+w6DqRlmGlpZLusWBR2jdgfCGjAxk5eqGQPTSmd5PXV+cDR4iuWhLIy+SBM1USy+H+P96/DSH8Vf6ZtxPX0li0/tBwq07L9W7vP76P/4TC1fSASaQ34eoXgtXUyD4M/2W9WME0mgKhCnL//yq5DATr67eCXZwhKQa1k3KOchNdYoD2ppNLBUOWtIXUgete1a13WCQgUbn0uroJoXbERovQAA+SkMexPumM/mKBxqFoOPdHlWPMArn8ycspxCkZmEBcQjXHCUJRhIJBAUMiZ5B27PSSSteT3K63EG0MpRa/9ETROJSym3KVsTqzGLcvwRTNErpKiWi4QzAtgX7RL+NBLfTs0AFIrxSFOMfKUze5clYOgArksZTFx60XlFCuyuyuwPEF7mHiWwRoP36GE47zAJODAICoTg1VvZZZ1+A8BXe8br1Kh2sAFzd+cuubw2+B4kR1b4N1VXivTK75NNtoRuxGdSk39JlpRQOc6T2Bzzcflkp7bg6xx22GPgQrLesHBge2NR6bm1jpmXqC+D3iKWEivLGV/XmVwmq6p9cWKLHQDz954aVGjke7y2vjsksu4k4C9aOpf4lxqiCLBdZ9fE+iLyQ4tj9ZnBnwmwAAAAwAfMAAAAG1Bn9VFETwr/wAyQ/4/S+CaAA4XNP6fSvU24VjNxdRu38BYWE/6H9sP2MFTVcN6DbDC1iMuAqYjH7eB+X6njcyA1Vmmmw1ZBptUOTocZoTGUC9QLJp+/Rjcxk+Zmk4ZZR76CC0uAAADAAADAIuBAAAALQGf9HRCfwA/evpefs5jzVGSJJs2qkNqyiZx/IpGPDCnaS5RvAAAAwAAAwAQ8AAAABkBn/ZqQn8AAEWF4uXW385T5zoAAAMAAHTBAAAA+EGb+EmoQWiZTAhv//6nhAA8wvcZAIIiFz1wpmPToQ7xq+4X/A8j4dvkB58lLZJCOP54CL3Hwa/fnj4VFHgkxro301ThEJX/zqI9BKKEUSKP1UWkYLcCUSbobOarNn2oCbbfTi6Wp0R36tKu5i6k+iyoOQ7HjbrY4BZrx3Y9sZSaHv+nADBQvK14pRPCIKIf/PgHiDNagqNx78svVudrFgTnETP2ZPg/cTlFTYrpVC0dZT1s+sU/HX02OHmpObnuIRVeiTbML6WBrxg9CXXdp+vQmyhjY/u/qKg6jA2eCsmDXShYqZ/l5+P+UX6zob4OChUAAAMAAMqBAAAAIkGaHEnhClJlMCG//qeEAANzYIwyEj0T1Jh4SoAAAAMAAYEAAADNQZ46RTRMK/8AMlYU+/5hACb22umLEzwmAsadMXLDcD0nCGsOAXO2dtHhlU48YEMJjxwnci6lzCZyvQjw4DRkCcyurum7JcQoLEzsbwYrBVyXiiJ8eMAlIdZWgzAF6RbKd1G1c5nzPsx9PjxVxwFxWTyFn9w0AoTBQT/LV0poWBH+1sTnt9nzGp7KzXVYa8vy25o1IqJG2dBag0Ko684i5v24tAnqDEWL/dzLyEZ/eoIQNymHGaShmG2toUVA1jVDCL7MCIAAAAMAAAMBqQAAAEwBnll0Qn8AP3r6XvtYAjH8HUQ6YxwDc2ymSKYvA1Gn6VYDl73rwsbZQ799D5k3y0k95Sewo4ae9sb+PD/ZYYLAaQk53UAAAAMAAB/gAAAATgGeW2pCfwA/jwFb6kwBU9YOoh0xjgG5tlMkUxeBqNP0qwHL3vXhY2yh376ISTaYris7oDr/BvfUGRabYyZjFPCJCDS6qAAAAwAAAwBJwQAAABtBmkBJqEFomUwIZ//+nhAAAAMAAAMAAAMAKCEAAABvQZ5+RREsK/8AMlYU+/5hACb22umLEzwmAsadMXLDcD0nCGsOAXO2dtHhlU48YEMJjxwnci6lzCZyvQjw4DRkCcyurum7JcQoLEzsbwYrBTgiSzYqWYFZTVdhxWxt6azHrFVN2/QoAAADAAADAKCAAAAATAGenXRCfwA/evpe+1gCMfwdRDpjHANzbKZIpi8DUafpVgOXvevCxtlDv30PmTfLST3lJ7Cjhp72xv48P9lhgsBpCTndQAAAAwAAH+AAAABOAZ6fakJ/AD+PAVvqTAFT1g6iHTGOAbm2UyRTF4Go0/SrAcve9eFjbKHfvohJNpiuKzugOv8G99QZFptjJmMU8IkINLqoAAADAAADAEnBAAACO0Gag0moQWyZTAhf//6MsADv8J0131A158I7xUlIUXVj1iWOBEfi73AyfMq2tWoAQ9vygxAAzGCNcqqZRo3D/JwjgxQre4NQ79gbP454b81OtKHkA95hgxmajsy1+MpmVQ9gmxQewOSxkOXjahBcCpw5hkJJa9jLNvxNO6+d6LPfpQFePpYee/qceTKQM4fZghCncWq8WWHP6K7d12Fo2zESkQ71eiAoVMpMjNMik0lkuiMrXWhnT4qdsv0juj1fQaOAv439/a6WcEM4Mo7W9dSrGr0SqtCtO6jaA2YFPVE4ajwh346vZUqdkn4Lr51jqjNibnC23C0XxatytYbgtO1PGKUbm0Yo3t9GOMfntjedl7ul91ITRtdiZuJ1iNgog/px0rIR/i3jWUAmGkoaBIE5rM2Tvcy4EKA5m6TO7wfQVXlgla8Jk1kMwXDqbtab3iKRJwUZszqOejv5fClSvf5uwwBXKZtSAjqTySQvCYe2VZFGT8fA5jBLQZAc0bC67wRotlo0YTTMAyf9CYVoHwXvaOxJKxCIpyAVfcwjwtgleQQk8JabwZi6NvGKR5o0FSR4nEBjHU0B5QCHw51N3a54sTNjbCf5f3AoGgEooSSlsL99E/C5QZAKPEjbECTeX4h+4cETlXdmo9rZjg7bVLmTDscZKhKkgES9A29uWQ810bGgIzbE4nGVgAUMxQd4wvaLDk9AMjiE5oc31kOv8gDwDYTqtbxpm8PCLpJIEZ/S27TS7kIrFeAAPmAAAAAzQZ6hRRUsK/8AMk6GXuSwLUUFmzIyXUJyRPX6z04GHFAx4AQl5nN6DvO5M/uBEAAAAwEXAAAALQGewmpCfwA/jwFJLW019m/959ekT2MTjPx8T/AAbS3+gUx9dm9T1ru4AAAImAAAAj9BmsRJqEFsmUwIZ//+nhAAAAMAKj7v1g3YFL4SUikAODigrXAAzGFLcepT1TwN/ZbDs153Yx24d+2iPcdqymVI8c8nl9CjOTpjICZtfjKZlUPYJ7DOUC0BpxzgQk41N1tCZCEA7l3lgoSVJRzPNOrRl1870We/U8FUV/sgZpuQ35ZAaotvUErXNJqvFlhz+iu3dehaNsxF/Ou+HogKFc/h6kmApRpZLop0VI+SKM41nb9Obo9YsNz7m+lOH2umXdDODKO1vkVyxu9EquUEBcAA0GW5C0vCvjLPaFEqNEMutScqwyu2bBF2s6x1O9KdNOWFF8e86wrPxWmltYq4xUDc2jFIicNa0iM5up3a93TA8Mng9kAhLDEk5wPpKAB1YhebzSIh1AJPXIOwHO45hLMuc3OKZ4DabpM7vbogAQetbXUET+zUpTXKksk3va03vC5M0DPVOfp8LBtavhZTXv83YYAYjObUf+kMOSMvfPx43FcH38fBYBgwcI4M0bC1vygxwp+SO7TMAt7+oW1oHwXxVxJMKxDBYUAVfcwjv/smaQQk8JaSQZi6NvI78CcVhUG2Y8BN8f+Y6mgPKARubOpucOhsQnDW2GAS/uBQNAIWnfPB5/+Hx5mFQZAKPEjf2X8gfpB+4aK0buJ8fNCcxy1bRSqPxuPRH3OX/AEvQUdnTEgDiQLpws2xOLc7Ccpate+YoO6cXtFhyegFWBCc0hvqbNBLDyrprwd2t41K+HhG88kCM/pbeKpdyEVj7AADwwAAAFBBmuVJ4QpSZTAhn/6eEAAAAwAqEWwv05Mh4zenFWrs0EqgBXAg5ZkqZql9DfDo+/sBY8qVO+uX+dpTUkoNRoTTaOH/xIbES33qHA2gqAAj4QAAAkFBmwZJ4Q6JlMCGf/6eEAAAAwAqPu/WDYN7fxoOhGstijUDT8bEgAHGMDcoq/C+Ar8JCuIADg4oK1wAMxhS3HqU9U8Df2Ww7Ned2MduHftoj3HZEeicrFnk8voUZydMZATNr8ZTMqh7BPYZygWgNOOXkKi+0wLvLBQkqSjmeadWjLr53os9+p4Kor/ZAzRK0I+4GqLb1BK1zSarxZYc/ort3XoWjbMRfzrvh6IChVC4NNldaUaWS6KdFSPkijONZ2/Tm6PWF90bv55Th9rpl3Qzgyjtb5FcsbvRKq0Xu1j8/RZgU9UThqPDLrUnKsMrtmwRdrOsdUq11u3wK8cfedYVn4rTS2sVcYqBubRikROGtaRGXcgmsu7pfhkAeae0X9xAnq4H0lAA6sQvN5pEQ6gK3KSTIDnccwlmXObnFM8BtN0md3if0cI2j6Sz7JrIZgpun1/3ICCxM0DPXIRc4dFD3ZzmjFw3EHwBNHVFA/KozA293pHKcgeXZFGT8fBYBgwcI4M0bC1vygxwqFxG5eQLI+vqFtaB8F8VcSTCsQwWFAFX3MI7/7JmkEJPCWkkGYujbxhff1vZc+eJxD+x1NAeUAjc2dTdHFg9bu8W2wwCX9wKBoBC0754KCfl04IwqDIBR4kb+y/kD9IP3DRWjdxPgB2tmN5YWhwj43Hoj7nL/gCXoKOzpiQBxIF04WbYnE4a59esmKDunF7RYcnoBVgQnM8Ip3ElvsAeAa8HdreNSvh4RvPJAjP6W3iqXchFYumhAAAASkGbJ0nhDyZTAhn//p4QAAADACn+qd26NtUPdfCF5xG1BNXV3o1oP2ahPyZiR35JqKfNv/8w+7M6Xz7m/fFkzjoScMAQ8QoukzThAAACPUGbSknhDyZTAhn//p4QAAADACo8y6PRNMDCYrsYALROMIjTidjCluPUp6p4G/sth2a87sY7cO/bRHuO1cbcTMHxPL6FGcnTGQEza/GUzKoewT2GcoFoDTjnAhPM94egFcWejhkTOISVJRzPNOrRl1870We/U8FUV/sgZp3OEZ5waotvUErXNJqvFlhz+iu3dehaNsxF/Ou+HogKFeeQikobUDDqZUKdFSPkijONZ2/Tm6PWLJ8++G5Z39rpl3Qzgyjtb5FcsbvRKrlBOtABOUvn6RvCvjLPaFEqNEMutScqwyu2bBF2s6x1PQidNIWFF8e86wrPxWmltYq4xUDc2jFIicNa0iM56Q/UO7pgfmRt/6XqWRPKc4H0lAA6sQvN5pEQ6gEyLkHYDnccwlmXObnFM8BtN0md3t0QARQtbXUET+zUpTXKksk3va03vC5M0DPVUPp8LBtavhZTXv83YYAYjObUgDkMK9Ib/Px43FcH38fBYBgwcI4M0bC1vygxwp+WO7TMAt7+oW1oHwXxVxJMKxDBYUAVfcwjv/smaQQk8JaSQZi6NvI9QPuDaFlIonVZfH/mOpoDygEbmzqbmlssyd+4MN+Ev7gUDQCFp3zwb//Zm4RdAMgFHiRv7L+QP0g/cNFaN3E+L2hOY5KtopVH43Hoj7nL/gCXoKOzpiQBxIF04WbYnE7JAulq175ig7pxe0WHJ6AVYEJzRW+ps0EsPKumvB3a3jUr4eEbzyQIz+lt4ql3IRWBDAALaAAAADlBn2hFETwr/wAAAwAIrIT6YrFnP0GTDd2ydUAWKqBX4dCVwNc7hhY6OzCx/whuqYYTtDgAA7GIqYAAAAAaAZ+JakJ/AAADAAAvvt354zRdnXAwAzjtk+EAAAJCQZuLSahBaJlMCGf//p4QAAADAB/fY7nTOe1yMpeQ9ZbFGoGn42JAAOMYBBz6Wgw6B8JC16AFonGERpxOxhS3HqU9U8Df2Ww7Ned2MduHftoj3HY27ycrbBk8voUZydMZATNr8ZTMqh7BPYZygWgNOOWDWC+FQLvLBQkqSjmeadWjLr53os9+p4Kor/ZAzR00KO8GqLb1BK1zSarxZYc/ort3XoWjbMRfzrvh6IChV64NNld6UaWS6KdFSPkijONZ2/Tm6PWFn6YHvWwooE5YwQzgyjtb5FcsbvRKqcO08ybwr4yz2hRKjRDLrUnKsMrtmwRdrOsdU2V165wK8cfedYVn4rTS2sVcYqBubRikROGtaRGXcAmsu7pfoEKeae1AGRPKc4H0lAA6sQvN5pEQ6gJvKSTIDnccwlmXObnFM8BtN0md3cY0cJEJ7+zUpTXKksk3va03vC5M0DPXVRc4dFD3ZzmjFw3EHwBNHVFA/e4zGCnvSOU5A8uyKMn4+CwDBg4RwZo2FrflBjhULO6hsgEdYhjjnRj4L4q4kmFYhgsKAKvuYR3/2TNIISeEtJIMxdG3ifu/rey588TiH9jqaA8oBG5s6m6IrB63d4tthgEv7gUDQCFp3zwU6/LpwRhUGQCjxI39l/IH6QfuGitG7ifA3QnMbr+1SqPxuPRH3OX/AEvQUdnTEgDiQLpws2xOKoRI/ssmKDunF7RYcnoBVgQnM70p3ElvsAeAa8HdreNSvh4RvPJAjP6W3iqXchFZjhgAAABOQZusSeEKUmUwIZ/+nhAAAAMAH8BoYH8Z9DHwquGKBGG2xwJSHlzkgBsk0Whtl+i+aCEEjx87Y4Xyt3/KqwxA9WQ8Yh5kcBQBDUDR5OkoAAACPUGbzUnhDomUwIZ//p4QAAADACo77+EleaABwcUFa4AGYwpbj1KeqeBv7LYdmvO7GO3Dv20R7jtlOQm+/Bk8voUZydMZATNr8ZTMqh7BPYZygWgNOOdcfXVwy0XrrkOGRM4hJUlHM806tGXXzvRZ79TwVRX+yBmn/qquYDVFt6gla5pNV4ssOf0V27r0LRtmIv513w9EBQsYPy+zSNKNLJdFOipHyRRnGs7fpzdHrHbdMFTaU4fa6Zd0M4Mo7W+RXLG70SrDljoFlAnrnHtz9FmBT1ROGo8MutScqwyu2bBF2s6x1Uw6W63gV44+86wrPxWmltYq4xUDc2jFIicNa0iM2rZe3O7pgIGNPKmxqWRPKc4H0lAA6sQvN5pEQ6gEMRMiIDnccwlmXObnFM8BtN0md4BtAAASrQ9bXA97+zUpTXKksk3va03vC5M0DPVQPp71h3gvhZTXv83YYAYjObUftK+QD26lhmLLsijJ+PgsAwYOEcGaNha35QY4U+svdpmAW9/ULa0D4L4q4kmFYhgsKAKvuYR3/2TNIISeEtJIMxdG3kgwAaj8VQdgx4Cb4/8x1NAeUAjc2dTc+eMlWK8Hwc1C0E1jSAK3+eZmwX9ufhF0AyAUeJG/sv5A/SD9w0Vo3cT4u6E5jjIKilUfjceiPucv+AJego7OmJAHEgXThZticXzoGkQf2LwNGQd04vaLDk9AKsCE5o+pOTeN+QB4Brwd2t41K+HhG88kCM/pbeKpdyEVqJgNkACggQAAAkNBm+9J4Q8mUwURPDP//p4QAAADACo+79YNg3t/Gg6Eay2KNQNPxsSAAcYwCDn0tBh0D4SFr0ALROMIjTidjCluPUp6p4G/sth2a87sY7cO/bRHuOxt3k5W2DJ5fQozk6YyAmbX4ymZVD2CewzlAtAaccsGsF8KgXeWChJUlHM806tGXXzvRZ79TwVRX+yBmjpoUd4NUW3qCVrmk1Xiyw5/RXbuvQtG2Yi/nXfD0QFCr1wabK70o0sl0U6KkfJFGcazt+nN0esLP0wPethRQJyxghnBlHa3yK5Y3eiVU4dp5k3hXxlntCiVGiGXWpOVYZXbNgi7WdY6psrr1zgV44+86wrPxWmltYq4xUDc2jFIicNa0iMu4BNZd3S/QIU809qAMieU5wPpKAB1YhebzSIh1ATeUkmQHO45hLMuc3OKZ4DabpM7u4xo4SIT39mpSmuVJZJve1pveFyZoGeuqi5w6KHuznNGLhuIPgCaOqKB+9xmMFPekcpyB5dkUZPx8FgGDBwjgzRsLW/KDHCoWd1DZAI6xDHHOjHwXxVxJMKxDBYUAVfcwjv/smaQQk8JaSQZi6NvE/d/W9lz54nEP7HU0B5QCNzZ1N0RWD1u7xbbDAJf3AoGgELTvngp1+XTgjCoMgFHiRv7L+QP0g/cNFaN3E+BuhOY3X9qlUfjceiPucv+AJego7OmJAHEgXThZticVQiR/ZZMUHdOL2iw5PQCrAhOZ3pTuJLfYA8A14O7W8alfDwjeeSBGf0tvFUu5CKzFjEAAAA1AZ4OakJ/AAADAAtbJiBH3ayggOX9urxPdo4/cUbZb6wcgSSwAGy1NZu5nsb4BHryJmkeyYEAAABRQZoQSeEPJlMCGf/+nhAAAAMAKhFsL8+bplirSOsAA2ACXyLAvKVF4xdZFie4rTqjgU1Pcos/kupzpZv2N/a/G3Obg4A9G+utCvYAgCCDIky0AAACjEGaMUnhDyZTAhv//qeEADz69+DiN3AEQZ7BljBpQHjawtPk5EEmu/17Q/gx/Iz/SLo48df2QG9vC5TZILBYmTpvE8ukZ34CRuP+xO7Q0qfdB8yFdmxVSfLK7so4a4p9EtQesQXsNJZphcRbEVNphOTTdy58qGoifuZCeQjHuiaCaFpWdMM7Ydh9cd1+ob8UT9XPR8259aI6hzWJASsSTIyVgEZya4gd/2zKlnzS+RTwv9LRkHDf56YHwAjA46AOHGrPUGFAkrLXybhKNYyLMBlvcYGMonnGR4zBWVQn68F6xMjFXV4RLpBj/PEPI0FIy6TgXZIWK7Ro/ZbIUnfzNtqo+9jTz8LcVGRZZeyr5Z8ZG9+0/6MYDZzumJ23OxrT72ubneB7SLS5OeINIONHVjNqFoo2jJlwKX5OOBSRGql0iVq1VA1l1Nj2dGHY+XEtkuV+1H3CaANqT57zH0AfKMLDwro13BH+9CTgUDc1Kt03j2sRNgCh8pKreivi32PNZwSclQNfAHiHFtbCUOfl6Z/GHYVATdpS10UFZo+RBBp1JlbFUp9BR9VV9MqAfcm/PpNlXkXFUhFrHVgsVMApjr5WtduYjQkJBsAVUlWnr3HnktRhLmV2HMKoiRRTMEO1uNpL6t3DDYB9balo2de6NyVWbvFtktAZo7B2mmIAnoanrsxDmEJqVEJO4mVUMTi54miY7Gf3TszLVNDnqDUt4gLcG4GLKrVEL/4jput61KiKyzAdf4YCtL9+ClYsJS7++4VZ4qGWyaAFl1r3mCfZX+z0YahJNnyvBTnveFonAZsh9yTN42MWjjyV4WVyXRokGFA30W4Msb9b/oAUHcwlnteAFOFhehBREPAAHzAAAAAjQZpTSeEPJlMFETw3//6nhAABLum3UGwNmoxiAAADAAADAtsAAAI/AZ5yakJ/AD+Xs1zhSYAqeu5FhxfwjC2onVIhOGB5tPUxWCDZtvwS3ZfgWJq/KjCeESq+pC9nYo+ST4OxozQOvkn2bwy6kIU2dmReD1yYUSRVVlz4z/9nvLFwjA+LAJhBATFnfYAQODJMm5PAzfvYd13Ip/Arc5Cfzl2cFuRb/CUdYY90eWGeTVvB8LQDYw4/cxJu+UHuI9t86Siicr1Sq3CqKg93LJeSvR6UWvmXck3F/1wksiPpQH+RW7RofGGmvqy7Ef77Q8HUuf7NQ0ROiYuvP8qn2KQWLYc0FZhT11AIL2ct+htAz1o54RIuN2XzJt3w5BjvDTz+yNalWI+p3Yl1e9P2XxeWhe7/1xk2SkSMh0hcCOFJnNEWU9tZLBjosnhMD9NKa62XXd6c3OD2mmbyR5I9D6HJlmclB6UxDv7ww3xdRSrwUhqiqBtjnYYGxDkmskqCAY6U6n5cnRS/u1nVWCxLkSxBtHleh+YbP1+QAdBMGHMt7cUZsnmB5CaZotQz6EIeU3mWyE+8EtNDwYK7MuZrgzF8KiEyTGIxZ1EqKJ+8A16SYLr1wU8r8wWe5jgO0VQErc9UPZCpk0rj8vsh8yxlsFOwDe//h7RvV89yrEpmttC0H6i5v6bomsqJOM06/eWvggp3HQ99Cm8o0F2AA0rD8RDH+IltADUz8E+gAdFXgZv6UAaWjjyQ9if4ZD3Y+w0wL3TqH29uqIueDd5fZY06NtscfAcG5YjUGIeoTvAzZyEPSgAAAwAACRgAAAKQQZp3SeEPJlMCGf/+nhABNuPPhJXmgArmKCtcADMYRwWFO8tfW3ZX+qWH8GALXPCX+2Hkx2xv4z/U5Cb78CXZ7c5o3KRnXqq16/909PnO0SoOnI0OUOgwBCrhmCl34ZaL11x9+jagIAE6kstgYEXSgeQMkLhnqUlblUZD3MahfEX5jViappFnSoMFVjE3HdezW/IGjVz0fHucXF5Jm0/MJTCbjQroDuELHQc320O0ax2+Py9v9tAjAnync+z8BMKxvgePmPDPGGFh9ej+xb5xYPO6KUhnahWSaqSE8A69xcrMFZTxaQLSjbDMEacIq6yOX87xE/ILZNReQhpXdfTroZnz2RzhTRtqpIMcOeWW0FfGybWN/rKxSzzfOoLRgObO54nbc2+tPvcI1v8F1kiMAUsv0QoIKzEmRNLBaKfDng4DN6BoNTNcCAAL8QiI4EnnheTqa7s6MKx2C8H3cr9qjeINfmpVtxBuu9v7AWHXHRrwOP96HughnK7Fp70+BFt3k1Hx2p59Wwcd/QgUFCf9jk3vngH/b5jw6qISdxNAe2sOdPUMbFe39I6muNSYqomzckqEuOu5E/n79V055YhMvq8P5x7HsQDDfchU9ABNx5CLa2FQ1fYAalWaA4k65lWAGY2tSW4klTzPYIGIBErH4FO4axAQTbUwW83/XwJYzREGhqf17zYp1ojEBhG5od2pE8J7os4bLnOedw7A50qCZZ2OC6rns3IQvDAuNClmTu5n/G/QCSqfxjEvWpU4M/YDUnNATtPgLf89IEiGTMyzrBe0w1DLaGAC6a171B+yNjUHRK7q9+5URYpp5kSSWcql1adhnLbGRm0qp4WaSXRoWZtAt+b4MoVxDoAAAAMAk4AAAAA1QZ6VRRE8K/8APsO2+5cMJ7peFRfQx+BmKSPUWWi2/HOK8G2F8apIUUwdvwAAAwAAUd5toXkAAAArAZ60dEJ/AFQRT1c8QqQAUZIkmzaqQ2qiM/IunTQPQO3EBEAAAAMAAQEJOAAAABcBnrZqQn8AAHQeK61HcwAAAwAOUzVFgQAAAj5BmrpJqEFomUwIZ//+nhABk9c/CSvNAA4OKCtcADMYUtx6lPVPA39lsOzXndjHbh37aI9x2ynITffgyeX0KM5OmMgJm1+MpmVQ9gnsM5QLQGnHOuPrq4ZaL11yHDImcQkqSjmeadWjLr53os9+p4Kor/ZAzT/1VXMBqi29QStc0mq8WWHP6K7d16Fo2zEX8674eiAoWMH5fZpGlGlkuinRUj5IozjWdv05uj1jtumCptKcPtdMu6GcGUdrfIrljd6JVhyx0CygT1zj25+izAp6onDUeGXWpOVYZXbNgi7WdY6qYdLdbwK8cfedYVn4rTS2sVcYqBubRikROGtaRGbVsvbnd0wEDGnlTY1LInlOcD6SgAdWIXm80iIdQCGImREBzuOYSzLnNzimeA2m6TO8A2gAAJVoetrge9/ZqUprlSWSb3tab3hcmaBnqoH096w7wXwspr3+bsMAMRnNqP2lfIB7dSwzFl2RRk/HwWAYMHCODNGwtb8oMcKfWXu0zALe/qFtaB8F8VcSTCsQwWFAFX3MI7/7JmkEJPCWkkGYujbyQYANR+KoOwY8BN8f+Y6mgPKARubOpufPGSrFeD4OahaCaxpAFb/PMzYL+3Pwi6AZAKPEjf2X8gfpB+4aK0buJ8XdCcxxkFRSqPxuPRH3OX/AEvQUdnTEgDiQLpws2xOL50AkZUNMGeYoO6cXtFhyegFWBCc040nJvG/IA8A14O7W8alfDwjeeSBGf0tvFUu5CK27Po9AAAADACLhAAAAMUGe2EURLCv/AFQr3MznQyp4UkNcGWocV+o1gCbNQ+jarXapAV+n7pWAAAADAAXtZ0wAAAA0AZ75akJ/AGwEyXpHzB3wp1oADZRSZ7QiUB22YBRFkqEP1XrJrqKo0Pw93wAAAwAAE0Sj4QAAAl5BmvtJqEFsmUwIZ//+nhAB/dc/CSvNAA4OKCtcADMYUtx6lPVPA39lsOzXndjHbh37aI9x2ynITffgyeX0KM5OmMgJm1+MpmVQ9gnsM5QLQGnHOuPrq4ZaL11yHDImcQkqSjmeadWjLr53os9+p4Kor/ZAzT/1VXMBqi29QStc0mq8WWHP6K7d16Fo2zEX8674eiAoWMH5fZpGlGlkuinRUj5IozjWdv05uj1jtumCptKcPtdMu6GcGUdrfIrljd6JVhyx0CygT1zj25+izAp6onDUeGXWpOVYZXbNgi7WZyOGbpbreBXjj7zrCs/FaaW1irjFQJ4fc+RE4a7zFpu8Ly18pBdk0eVNjUsieU5wPpJ9iBcdV09dKtW3cdb0HgOdxzCWZcVrNwegO1uvoQeuFAAEO0KD3lNiQ/C6cnuIBuEsqWYFc57Am0VgFkbco3mTI0oceK3dU5aO1Tt8v5+StsHSkHfQFcID5TyyznrFmDe8OfuYjS1VN/w76ptX9mvhnDSBEP0HzgNTDcvIFkjEAf8TmWHn1uKuig3L67ZM4BFyIQROftvxHcqaGxugxKj4AEhzDikThI0G5uzrngWKd8BWMklNVIb5r7UDMk4VvZsug0G2k3ml9YxEVXEDh5kMqenZsq037+6q6WNUDYT028HZvEjQBKwFB9Z8Si1bJI7LQ+oKoKUjF0ASZldVHTSx0FTl8iqmTm8FIJQXUkKjiWHheHAauWp/djdI0UVwxukIY51YA5In8e4DZ13BFJSwraGfzMGRf/6gMwbk4RuYzfN3rogsegAAAwAA2YAAAABXQZscSeEKUmUwIZ/+nhAB/fY7nTd+2rnbVnE8qobXOlYUZ38oAVv9gdw/+QNv3xnbJ8Zp8AWnRe9eqw2pFhO5EXA4BlP0wzH98PpRZ7gHfr0vAAADAAHpAAAAT0GbPknhDomUwU0TDP/+nhAB/AaGCBw5Dri0G2TmxgVwABr+NbkTRN8l9DfDo+/sBY8qVO+uX+aiTiv52Dz35cEPwtbNpEKh4OgAAAMABZUAAAArAZ9dakJ/AIrEYvSPmDvhSwx4PzzSXm4rDHMz9/IQ/+ysvK7AAAADAAAKmAAAAmBBm0FJ4Q8mUwIZ//6eEAH99judM57XIyl5GD8uY3yDpxLd4QAEEACAR8akxaN0PCQyJAFS4oK1wAMxhS3HqU9U8Df2Ww7Ned2MduHftoj3HZP7ycsRBk8voUZydMZATNr8ZTMqh7BPYZygWgNOOYNRL6BDhkTOISVJRzPNOrRl1870We/U8FUV/sgZoetZYoDVFt6gla5pNV4ssOf0V27r0LRtmIv513w9EBQqlcGmyuVKNLJdFOipHyRRnGs7fpzdHrDk6N38Mpw+10y7oZwZR2t8iuWN3olVdFnrRd4V8ZZ7QolRohl1qTlWGV2zYIu1mcje9XYDPArxx951hWfitNLaxVxioE8PufIicNd5i0xIuCm72HdtjdKkzJLDEk5wPpJ9iBcdV09dKtW4DE3zTAV/t/ksy4rWbg9AdrdfQgwypHErWxlTDC163Fht7ypZgVznsCbRWAWRtyjeZMjShx5Hp8L5aO1Tt8v5+StsHSkHfQFcID5Tyyznpg1WRu728hiNLVU3/Dvqm1f2a+GcNIEQ/QfOAzeNy8gWSbQB/xOZYefW4q6KDcvrtkzgEXIhBE5+2/EdypobG6DEp1J87y3MgfCyqWueBYp3wFYySU1UhvmvtQMyThW9mycEwcq1pml9YxEVXEDh5kMqenZsm5aRKtXpY1QNhPTbwdm8SNAErAUH1nxJhTgV/AUjBCqClIxdAEmZXVR00sdBU5fIqpk5vBKd9yTbHTrzMBq5an92N0jRRXDG6QhjnVgDkie05RE38fSKSlhW0M/mYMi//1AZg3Jwjcxm+bvTOoABUwAAADVBn39FETwr/wBsB/w0rBLTeW2dmnhpPP0K5Xzqg7ExmH0AAbLNtQ7Kk6ATXIgwxwAAAwA9IQAAABoBn4BqQn8AAAMAACbC9/Cb4nrzZDpRegAHTAAAAmdBm4JJqEFomUwIZ//+nhAAAAMAWz3frBsG9v40HoPY/X/lp480Q21eOJ2nsungwFrlqBJfLRo3WXNY0ADg4oK1wAMxhS3HqU9U8Df2Ww7Ned2MduHftoj3HY6rmgLs8Ty+hRnJ0xkBM2vxlMyqHsE9hnKBaA045bZd0lVcu8sFCSpKOZ5p1aMuvneiz36ngqiv9kDNHcNq9QNUW3qCVrmk1Xiyw5/RXbuvQtG2Yi/nXfD0QFCjT6JZS1Uo0sl0U6KkfJFGcazt+nN0er3eI3xWpTh9rpl3Qzgyjtb5FcsbvRKqot8Wrc/RZgU9UThqPDLrUnKsMrtmwRdrM5G0NdlUtwovj3nWFZ+K00trFXGKgTw+58iJw13mLUIG36bvYrsSzpVYdJkTynOB9JPsQLjqunrpVq27OaSaYDnccwlmXFazcHoDtbr6EFpQz1EvDpUwwtetxYbe8qWYFc57Am0VgFkbco3mTI0oceBVQsnZ4RU7fL+fkrbB0pB30BXCA+U8ss55wTBYlW8FQxGlqqb/h31Tav7NfDOGkCIfoPnAaVG5eQLJNoA/4nMsPPrcVdFBuX12yZwCLkQgic/bfiO5U0NjdBiUz0W7y3MgfCyqWueBYp3wFYySU1UhvmvtQMyThW9m0niwctVpml9YxEVXEDh5kMqenZtPg6TJdXpY1QNhPTbwdm8SNAErAUH1nxJ1TgV/F0PqCqClIxdAEmZXVR00sdBU5fIqpk5vBNbwdJtjp15mA1ctT+7G6RoorhjdIQxzqwByRPgMoib+PpFJSwraGfzMGRf/6gMwbk4RuYzfN3qHv4EAAAJBQZujSeEKUmUwIZ/+nhAAAAMAAAMAD5ex3Om8df8JKRSAHBxQVrgAZjCluPUp6p4G/sth2a87sY7cO/bRHuO1ZTKkeOeTy+hRnJ0xkBM2vxlMyqHsE9hnKBaA045wIScam62hMhCAdy7ywUJKko5nmnVoy6+d6LPfqeCqK/2QM03Ib8sgNUW3qCVrmk1Xiyw5/RXbuvQtG2Yi/nXfD0QFCufw9STAUo0sl0U6KkfJFGcazt+nN0esWG59zfSnD7XTLuhnBlHa3yK5Y3eiVXKCAuAAaDLchaXhXxlntCiVGiGXWpOVYZXbNgi7WdY6nelOmnLCi+PedYVn4rTS2sVcYqBubRikROGtaRGc3U7te7pgeGTweyAQlhiSc4H0lAA6sQvN5pEQ6gEnrkHYDnccwlmXObnFM8BtN0md3t0QAIPWtrqCJ/ZqUprlSWSb3tab3hcmaBnqnP0+Fg2tXwspr3+bsMAMRnNqP/SGHJGXvn48biuD7+PgsAwYOEcGaNha35QY4U/JHdpmAW9/ULa0D4L4q4kmFYhgsKAKvuYR3/2TNIISeEtJIMxdG3jlYFb58Kg2zHgJvj/zHU0B5QCNzZ1NzTXtiE4a2wwCX9wKBoBC0754ON/w+PMwqDIBR4kb+y/kD9IP3DRWjdxPjPoTmOWraKVR+Nx6I+5y/4Al6Cjs6YkAcSBdOFm2JxPVAtIZMXgaMg7pxe0WHJ6AVYEJzTZycm8b8gDwDXg7tbxqV8PCN55IEZ/S28VS7kIrLXbW1gAAAFFBm8ZJ4Q6JlMCGf/6eEAAAAwAAAwAPiDQwQOHu/EHNylEecvxgBr94G5f/FNSg3Mae/sfQr/dXwEVUHm9HtIEC0h2ALvdlP/990LysRmC0OGEAAAAvQZ/kRRE8K/8AAAMAABppME6a/8mPrsccbQDQPnWpQAPGg+c98H/uGOJVXnSLjHkAAAAYAZ4FakJ/AAADAAAhu3x0AS3TG4ei2bz3AAAAWEGaB0moQWiZTAhn//6eEAAAAwAAAwAPlwnR6JpeaEFQ3QzzzfT2lJ7qw7W9ACt/HGXA3zoDTdwfBd5KsJIQnIk45/vWYJebQjv2VetVk3FLedTev6VAfakAAAI5QZooSeEKUmUwIZ/+nhAAAAMARbjz4SV5oAHBxQVrgAZjCluPUp6p4G/sth2a87sY7cO/bRHuO2U5Cb78GTy+hRnJ0xkBM2vxlMyqHsE9hnKBaA045zzu9SJBcu8sFCSpKOZ5p1aMuvneiz36ngqiv9kDNQ711WYDVFt6gla5pNV4ssOf0V27r0LRtmIv513w9EBQsrWDTZWSlGlkuinRUj5IozjWdv05uj1kIemB6VsKKBOWMEM4Mo7W+RXLG70SrAZbmE6b5OzAp6onDUeGXWpOVYZXbNgi7WdY6qg2Nz/eFF8e86wrPxWmltYq4xUDc2jFIicNa0iNGsMPbnd0wtj5bG1Ew+4gT1cD6SgAdWIXm80iIdQHOJtaEBzuOYSzLnNzimeA2m6TO79AoFT8UdJZ9k1kMwU3T6/7kBBYmaBnrvoucOijrs5zRi4biD4Amjqige1UTz+QsXclQPLsijJ+PgsAwYOEcGaNha35QY4U9fGE0zALe/qFtaB8F8VcSTCsQwWFAFX3MI7/7JmkEJPCWkkGYujbysoS+dkY8BN8f+Y6mgPKARubOpuQ07OoK8Hwc1C0E1jSAK3+eZl3n7sfzMKgyAUeJG/sv5A/SD9w0Vo3cT4H6E5jy62ilUfjceiPucv+AJego7OmJAHEgXThZticW1Q59qfmKDunF7RYcnoBVgQnM44p3ElvkAeAa8HdreNSvh4RvPJAjP6W3iqXchFaDfrbng1O8AbGtAAJ6FC/xNkHiOAAAAI3QZpJSeEOiZTAhv/+p4QAZ3XvwcRu4AWxnsGWMGlAflnxbuq8YL84YeDM2pjNlF0U/e+CY635ZILB50sN2VJmcZYirIGHODHiCyKXVk65gacgAUcNcU+vuu9tQLksF6zgF1mXwH6WRd+rCGodXZAznVDTsRg5G0C++dmJdxeKdSn9ieEfM8upZiNBbG6P7woWqrBpswASTS5e5qCYgx/ZGe3eX6b3R6yEPTBCmsff2AG2VHwW025sWFWmgamoAuY46F1OMsUKjSJwzsBsCkTlKGV2zqny1EqbTFtd/aMvEy5t4C5brFTpjDirjF7MTaMU22W9rSI0bMxA28iwO6opulT25LhYp9jE2zpSaSZX2vdEQ6gOcTa7AnPvFC8ATsR8W5ZpK8BR9qqFAqfuJ6c7AGVYzhdaHj/uQEGHcIGevFC5w6LpRYJTRbAa4xgEEKTaj2yifxsMC7lAoSZkUZPx7lmMFCBAJzRsL9Oy2Hd6QlnKcVTvdHeOdGPqy/7ZdOH/Rvg6ppmgLDKfcxsGXhLTBDMXRt5WUJfPnISn0qTr7TPyps6BwQvDx5Ejs6gkDvTfiF9IFA0Ahfd88Fev1FwPR2i2FV5YF/Pq5FGFlVhrxOVd2YH0JzHniyQ1xWZVz7jIP0dp7quvdJx9+JAtSkY17HbVDn2tCNpkpxs6G0CegIPW2czjincSXRtqq1V8AQreI10jqkcW5U5hltzyl3IRWg3629Bl6DJh2x+wAVaiC5J56COQAEnAAAACtkGabUnhDyZTAhn//p4QAf3XPwkrzQAVzFBWuABmMI4LCneWvrbsr/VLD+DAFrnhL/bDyY7Y38Z/qchN9+BLs9uc0blIzr1Va9f+6enznaJUHTkaHKHQYAhVwzBS78MtF664+/RtQEACdSWWwMCLpQPIGSFwz1KStyqMh7mNQviL8xqxNU0izpUGCqxibjuvZrfkDRq56Pj3OLi8kzafmEphNxoV0B3CFjoOb7aHaNY7fH5e3+2gRgT5TufZ+AmFY3wPHzHhnjDCw+vR/Yt84sHndFKQztQrJNVJCeAde4uVmCsp4tIFpRthmCNOEVdZHL+d4ifkFsmovIQ0ruvp10Mz57I5wpo21UkGOHPLLaCvjZNrG/1lYpZ5vnUFowHNnc8TtubfWn3uEa3+C6yRGAKWX6IUEFZiTImlgtFPhzwcBm9A0GpmuBAAF+IGodnwF0fiOl2V81bNTZaqn1jAv3F5azR/shyUb3ThFPiOOG5aU/Q14+PxO+VC3peXX+UfDcpa0d3BHspo6LiNecMYXn8F8Nr/LcneJrKmhftIf6jL4Jdpt/JNp9U/qduXH1ismBmurxiXlYnVKUEHfOQa/F1HwhqZhrZekkJVUVrDm9zEXPcUsf9tiV154RaEVAAd1XcZmsgeavdDZNGSTGfrdRktlfV+WiBBJiwmV0ftaYpfcgeVqbmYm1n7NB3KKbDf0gUwOoPma0+mzWGvgSowuBezv1S7G/1ICYb77KK4mfAF3RsBiXb6k954CXVkkdVb5pnqAhEdar39RynEf9jhW7gSGvIEZXejRlYJdWSTDxHAjVqC0c0FJS7s8M+W47eGsBxly5ck+BfR73Xvm2QtuVVkgV+Ob9lbnshheP2mpTTBm+eaKORnFVFb2PFj819labZuQEViVJqskkKJZTOiodAAAAMACykAAAA6QZ6LRRE8K/8AargVlqIqG/NeFRfQx+BmKSPUWWi2/HOKmOjZP+1xy5nK7b8AB2wVtz5O4gAEVYpczAAAAC0Bnqp0Qn8AirSerniFSACjJEk2bVSG1URn5F06aB6B24ixm4AAXg6YAAERDUgAAAAcAZ6sakJ/AADdPFpWnkAjBOdHBajJebAAAliBBwAAAmFBmq9JqEFomUwU8M/+nhAB/fY7nTOe1yMpeRg/LmN8g6cS3eEABD/gg7u4UbnMPhIVngCYpxhEacTsYUtx6lPVPA39lsOzXndjHbh37aI9x2RHonKxZ5PL6FGcnTGQEza/GUzKoewT2GcoFoDTjl5Covto4ZEziElSUczzTq0ZdfO9Fnv1PBVFf7IGaJWhH0A1RbeoJWuaTVeLLDn9Fdu69C0bZiL+dd8PRAUKoXBpsrhSjSyXRToqR8kUZxrO36c3R6wvujd+7KcPtdMu6GcGUdrfIrljd6JVWi92sXn6LMCnqicNR4Zdak5Vhlds2CLtZnI3uV1uxwK8cfedYVn4rTS2sVcYqBPD7nyInDXeYtMUwJZd7Dur542oyD5DEk5wPpJ9iBcdV09dKtW3+U3zTAV/t/ksy4rWbg9AdrdfQgv6Weol0rD8Lpye4gG4SypZgVznsCbRWAWRtyjeZMjShx5Jp8L5aO1Tt8v5+StsHSkHfQFcID5Tyyznpq1OSF728hiNLVU3/Dvqm1f2a+GcNIEQ/QfOAy2Ny8gWSbQB/xOZYefW4q6KDcvrtkzgEXIhBE5+2/EdypobG6DEpt+t3luZA+FlUtc8CxTvgKxkkpqpDfNfagZknCt7Nk35g5VrTNL6xiIquIHDzIZU9OzZON0iVavSxqgbCem3g7N4kaAJWAoPrPiS8AvTGnBdP07bBn6PYkWZXVR00sdBU5fIqpk5vBNMEdJtjp15mA1ctT+7G6RoorhjdIQxzqwByRPccoib+PpFJSwraGfzMGRf/6gMwbk4RuYzfN3p/4AAjYEAAAAyAZ7OakJ/AIsLqVBLLw1W1uxp0arIkUOo1H0ZKQCIoxU2/+bB78Iv6vi51HmgAFaCsoEAAAJiQZrQSeEKUmUwIZ/+nhAAAAMAWz3frBsG9v40HQjWWxRqBp+NiQADapbjAKHxOqZKM5dvwkNJQEeuWCI04nYwpbj1KeqeBv7LYdmvO7GO3Dv20R7jsndZOWunieX0KM5OmMgJm1+MpmVQ9gnsM5QLQGnHLbXKffRwyJnEJKko5nmnVoy6+d6LPfqeCqK/2QM0e2s4TBqi29QStc0mq8WWHP6K7d16Fo2zEX8674eiAoVhv5fZXClGlkuinRUj5IozjWdv05uj1hqSmB7NsKKBOWMEM4Mo7W+RXLG70SqqPp52q8K+Ms9oUSo0Qy61JyrDK7ZsEXazORv3cUrHArxx951hWfitNLaxVxioE8PufIicNd5i0zMmGV5SBa1VdKkyD5DEk5wPpJ9iBcdV09dKtW4BRNrQgXNt/ksy4rWbg9AdrdfQguI6eol0zD8Lpye4gG4SypZgVznsCbRWAWRtyjeZMjShx5NSkL5aO1Tt8v5+StsHSkHfQFcID5TyyznuXe8/bW7eQxGlqqb/h31Tav7NfDOGkCIfoPnAZlG5eQLJNoA/4nMsPPrcVdFBuX12yZwCLkQgic/bfiO5U0NjdBiUyH3I38RCPayqWueBYp3wFYySU1UhvmvtQMyThW9mybiwcq1pml9YxEVXEDh5kMqenZsm+aRKtXpY1QNhPTbwdm8SNAErAUH1nxJgzgV/CUjBCqClIxdAEmZXVR00sdBU5fIqpk5vBNGkdJtjp15mA1ctT+7G6RoorhjdIQxzqwByRPdcoib+PpFJSwraGfzMGRf/6gMwbk4RuYzfN3p+FwAAAFBBmvFJ4Q6JlMCGf/6eEAAAAwBa4thfnzdMsVaR1gAGwAS+RYF5SovGLsF86Pvyh7Xp9Xbo1R7/hfLdmJ74bomiNE0h8dbDCEAalWu5gC5UYAAAAFdBmxNJ4Q8mUwURPDP//p4QAAADAFs936wbBvb+NB0I1lsUagafjYkAA2qW4wQ/YDhpv2PZl2KT4ufEHQIoBKSCCkTQyvn+aXrP8SD99/m3MzixRYKp/0EAAAAsAZ8yakJ/AAADABiBMkCPu1lBAcv7dXie+dU5ihyqXLigtt+0BK8lFNPCcsAAAABGQZs0SeEPJlMCGf/+nhAAAAMAWr1Tu3RoGB/JFfqwJb57rnsRm7kuAYGcfMxkObb/4QkPdxxyHbMo2S0LeguAWEUH4O5rXgAAAj9Bm1ZJ4Q8mUwURPDP//p4QAAADAFs5l0eiaYGExXYwAWicYRGnE7GFLcepT1TwN/ZbDs153Yx24d+2iPcdq424mYPieX0KM5OmMgJm1+MpmVQ9gnsM5QLQGnHOBCeZ7w9AK4s9HDImcQkqSjmeadWjLr53os9+p4Kor/ZAzTucIzzg1RbeoJWuaTVeLLDn9Fdu69C0bZiL+dd8PRAUK88hFJQ2oGHUyoU6KkfJFGcazt+nN0esWT598Nyzv7XTLuhnBlHa3yK5Y3eiVXKCdaACcpfP0jeFfGWe0KJUaIZdak5Vhlds2CLtZ1jqehE6aQsKL4951hWfitNLaxVxioG5tGKRE4a1pEZz0h+od3TA/Mjb/0vUsieU5wPpKAB1YhebzSIh1AJkXIOwHO45hLMuc3OKZ4DabpM7vbogAiha2uoIn9mpSmuVJZJve1pveFyZoGeqofT4WDa1fCymvf5uwwAxGc2pAHIYV6Q3+fjxuK4Pv4+CwDBg4RwZo2FrflBjhT8sd2mYBb39QtrQPgviriSYViGCwoAq+5hHf/ZM0ghJ4S0kgzF0beR6gfcG0LKRROqy+P/MdTQHlAI3NnU3NLZZk79wYb8Jf3AoGgELTvng3/+zNwi6AZAKPEjf2X8gfpB+4aK0buJ8XtCcxyVbRSqPxuPRH3OX/AEvQUdnTEgDiQLpws2xOJ2SBdLVr3zFB3Ti9osOT0AqwITmit9TZoJYeVdNeDu1vGpXw8I3nkgRn9LbxVLuQisCGAAKmQAAADEBn3VqQn8AAAMAGIEyXpHzCBSyMVqE9AAGygmUAyJJs4UFlNiKh+RUaM7JkVFAABGwAAACQEGbd0nhDyZTAhn//p4QAAADAEW+LEwbBudcMHt08zIzRQ+D0Kf6Cm6Tpukr8ASI1nKJtAV+aABwcUFa4AGYwpbj1KeqeBv7LYdmvO7GO3Dv20R7jsA/zU7oDJ5fQozk6YyAmbX4ymZVD2CewzlAtAaccsE1qUauXeWChJUlHM806tGXXzvRZ79TwVRX+yBmfytj7ANUW3qCVrmk1Xiyw5/RXbuvQtG2Yi/nXfD0QFCpNJkZSs0o0sl0U6KkfJFGcazt+nN0er5Apg8ayzv7XTLuhnBlHa3yK5Y3eiVU3+aeMZ+izAp6onDUeGXWpOVYZXbNgi7WdY6otYon24UXx7zrCs/FaaW1irjFQNzaMUiJw1rSIz0eg3B3dMFYC3moRpRYYknOB9JQAOrELzeaREOoBDTfQqBc23+SzLnNzimeA2m6TO7tKWNJ9bT+zUpTXKksk3va03vC5M0DPW3nUbIGnq+FlNe/zdhgBiM5tSAhpkfY2XZrR43FcH38fBYBgwcI4M0bC1vygxwp97ZynFU6EBjjnRj4L4q4kmFYhgsKAKvuYR3/2TNIISeEtJIMxdG3ih48z6CS7xFz/5jqaA8oBG5s6m7kc8WJpZthgEv7gUDQCFp3zwXE/WVeZhUGQCjxI39l/IH6QfuGitG7ifFvQnMcEWopVH43Hoj7nL/gCXoKOzpiQBxIF04WbYnFUW59qrmKDunF7RYcnoBVgQnND2+sh1wAAeAa8HdreNSvh4RvPJAjP6W3iqXchFZhtQAAAmBBm5lJ4Q8mUwURPDP//p4QAAADAAADAA+WufhJXmgAcHFBWuABmMKW49Snqngb+y2HZrzuxjtw79tEe47ZTkJvvwZPL6FGcnTGQEza/GUzKoewT2GcoFoDTjnXH11cMtF665DhkTOISVJRzPNOrRl1870We/U8FUV/sgZp/6qrmA1RbeoJWuaTVeLLDn9Fdu69C0bZiL+dd8PRAULGD8vs0jSjSyXRToqR8kUZxrO36c3R6x23TBU2lOH2umXdDODKO1vkVyxu9Eqw5Y6BZQJ65x7c/RZgU9UThqPDLrUnKsMrtmwRdrM5HDN0t1vArxx951hWfitNLaxVxioE8PufIicNd5i03eF5a+UguyaPKmxqWRPKc4H0k+xAuOq6eulWrbuOt6DwHO45hLMuK1m4PQHa3X0IPXCgACHaFB7ymxIfhdOT3EA3CWVLMCuc9gTaKwCyNuUbzJkaUOPFbuqctHap2+X8/JW2DpSDvoCuEB8p5ZZz1izBveHP3MRpaqm/4d9U2r+zXwzhpAiH6D5wGphuXkCyRiAP+JzLDz63FXRQbl9dsmcAi5EIInP234juVNDY3QYlR8ACQ5hxSJwkaDc3Z1zwLFO+ArGSSmqkN819qBmScK3s2XQaDbSbzS+sYiKriBw8yGVPTs2Vab9/dVdLGqBsJ6beDs3iRoAlYCg+s+JRatkkdlofUFUFKRi6AJMyuqjppY6Cpy+RVTJzeCkEoLqSFRxLDwvDgNXLU/uxukaKK4Y3SEMc6sAckT+PcBs67gikpYVtDP5mDIv/9QGYNycI3MZvm710QWSugQAAADMBn7hqQn8AAAMAAAMABDYjF6R8wd8KdaAA2UUme0IlAdtmAURBuTy/wChe3bKr/9MpqlwAAAJbQZu7SeEPJlMFPDP//p4QAAADAFs338JK80ADg4oK1wAMxhS3HqU9U8Df2Ww7Ned2MduHftoj3HbKchN9+DJ5fQozk6YyAmbX4ymZVD2CewzlAtAacc553epEguXeWChJUlHM806tGXXzvRZ79TwVRX+yBmod66rMBqi29QStc0mq8WWHP6K7d16Fo2zEX8674eiAoWVrBpsrJSjSyXRToqR8kUZxrO36c3R6yEPTA9K2FFAnLGCGcGUdrfIrljd6JVgMtzCdN8nZgU9UThqPDLrUnKsMrtmwRdrM5HDvY3P94UXx7zrCs/FaaW1irjFQJ4fc+RE4a7zFqikI9ud7HCPlsbUTD7iBPVwPpJ9iBcdV09dKtW4YTSSZAc7jmEsy4rWbg9AdrdfQg6EQjiXT7m/C6cnuIBuEsqWYFc57Am0VgFkbco3mTI0oceTc1taNHap2+X8/JW2DpSDvoCuEB8p5ZZz0hPj/dO9uaYjS1VN/w76ptX9mvhnDSBEP0HzgMfGcvIFkjEAf8TmWHn1uKuig3L67ZM4BFyIQROftvxHcqaGxugxKpWC5G/iHZ7WVS1zwLFO+ArGSSmqkN819qBmScK3s2TW2DlTNM0vrGIiq4gcPMhlT07NkznSJJ4aVOhKXEqmCoobxI0ASsBQfWfElqBemPeonUFUFKRi6AJMyuqjppY6Cpy+RVTJzeChj0Ok2x09gzAauWp/djdI0UVwxukIY51YA5InrOURN+7gikpYVtDP5mDIv/9QGYNycI3MZvm71bhe6JogQ2ATptIANSKF7na6NfehhAAAANAGf2mpCfwAAAwAYgTJAhrDdIAAGyloeyCvmqqZ55wzPXetDE9v2PY9hNcTPbo6D3kMRkKYAAAJaQZvdSeEPJlMFPDP//p4QAf3XPwkrzQAODigrXAAzGFLcepT1TwN/ZbDs153Yx24d+2iPcdspyE334Mnl9CjOTpjICZtfjKZlUPYJ7DOUC0Bpxznnd6kSC5d5YKElSUczzTq0ZdfO9Fnv1PBVFf7IGah3rqswGqLb1BK1zSarxZYc/ort3XoWjbMRfzrvh6IChZWsGmyslKNLJdFOipHyRRnGs7fpzdHrIQ9MD0rYUUCcsYIZwZR2t8iuWN3olWAy3MJ03ydmBT1ROGo8MutScqwyu2bBF2szkcO9jc/3hRfHvOsKz8VppbWKuMVAnh9z5EThrvMWqKQj253scI+WxtRMPuIE9XA+kn2IFx1XT10q1bhhNJJkBzuOYSzLitZuD0B2t19CDoRCOJdPub8Lpye4gG4SypZgVznsCbRWAWRtyjeZMjShx5NzW1o0dqnb5fz8lbYOlIO+gK4QHynllnPSE+P90725piNLVU3/Dvqm1f2a+GcNIEQ/QfOAx8Zy8gWSMQB/xOZYefW4q6KDcvrtkzgEXIhBE5+2/EdypobG6DEqlYLkb+IdntZVLXPAsU74CsZJKaqQ3zX2oGZJwrezZNbYOVM0zS+sYiKriBw8yGVPTs2TOdIknhpU6EpcSqYKihvEjQBKwFB9Z8SWoF6Y96idQVQUpGLoAkzK6qOmljoKnL5FVMnN4KGPQ6TbHT2DMBq5an92N0jRRXDG6QhjnVgDkies5RE37uCKSlhW0M/mYMi//1AZg3Jwjcxm+bvVuF7omiBDYBOm0gA1IoXudro19vgAHTEAAAAxAZ/8akJ/AIrEYgQ1hukAADZS0PZBXzVU5Se0a3j9LdfBB6HzjCTGpTACuhggQAALuQAAAE9Bm/9J4Q8mUwU8L//+jLACA9N6a76ga8+Ed4qSkKLqx6xLHAgwAcipC022fKzYlsov2a4VGAAhRuq6yle9nKpIIaQRdFK5PDyrBBmgABOwAAAAKwGeHmpCfwCKxGIEfdrKCA5f26vE92XcL7M9WyT8kqPHxJ/OxBGCREAAAcsAAABOQZoASeEPJlMCF//+jLACAZHXX+zg/xUubSQBBE/lnv34u/AlF8Netp35Qp+biMwkrUFD4Xy3Zie+G6JoDu/kBGb8lHgNED44IU4MABixAAACPkGaIUnhDyZTAhf//oywAgPTemu+vkfnIRKAEPb8oMQAMxgjXKqmUaNw/ycI4MUK3uDUO/YGz+OhlrlejbyrAPeYYMZmo7MtfjKZlUPYJsUHsDksZDm+3OxEKdbFcXeqve5hkJJa9jLNvxNO6+d6LPfpQFePpYefAaFitCkDOH2YIQp3FqvFlhz+iu3ddhaNsxEpEO9XogKFeeQilF9otJZLojK11oZ0+KnbL9I7o9Ysnz9HJNKH2ulnBDODKO1vXUqxq9EquUE6wAEzJ8jRfEnUtPPVE4ajwh346vZUqdkn4Lr51jqedE6S4W24Wi+LVuVrDcFp2p4xSjc2jFG9voxxj85782Vu7pfKvVN/6WR9xOsRsFEH9OOlZCP8W8aygEyLkWgFXzmszZO9zLgQoDmbpM7vbjgAsi6OuoJK14TJrIZguHU3a03vEUiTgoxwvqACSIEuFZTXv83YYArlM2pAHIvj1w4BeiXQhdgM8kIjWcHL1JY0/dFztpOtlo0q5OKp53Ae58DHwXvaOxJKxCIpyAVfcwjwtgleQQk8JabwZi6NvHNQQA1xEMbmcYTfHl7rvlTZ0DJn51NzT3tfkzY2wn+X9wKBoBKKEkpeo/w7OjEKDIBR4kbYgSby/EP3Dgicq7s1Z23MctQ0UuZMOxxkqEqSARL0Db25ZDzXRsaAjNsTietLLxfvdD77DhAiJdYcnoBkcQnNIdAIkx3yAPANhOq1vGmbw8IukkgRn9LbtNLuQisHbQAAAwAAsoAAAAI9QZpCSeEPJlMCF//+jLABluE6a76+R+chEoAQ9vygxAAzGCNcqqZRo3D/JwjgxQre4NQ79gbP46GWuV6NvKsA95hgxmajsy1+MpmVQ9gmxQewOSxkOb7c7EQp1sVxd6q97mGQklr2Ms2/E07r53os9+lAV4+lh58BoWK0KQM4fZghCncWq8WWHP6K7d12Fo2zESkQ71eiAoV55CKUX2i0lkuiMrXWhnT4qdsv0juj1iyfP0ck0ofa6WcEM4Mo7W9dSrGr0Sq5QTrAATMnyNF8SdS089UThqPCHfjq9lSp2SfguvnWOp50TpLhbbhaL4tW5WsNwWnanjFKNzaMUb2+jHGPznvzZW7ul8q9U3/pZH3E6xGwUQf046VkI/xbxrKATIuRaAVfOazNk73MuBCgOZukzu9uOACyLo66gkrXhMmshmC4dTdrTe8RSJOCjHC+oAJIgS4VlNe/zdhgCuUzakAci+PXDgF6JdCF2AzyQiNZwcvUljT90XO2k62WjSrk4qnncB7nwMfBe9o7EkrEIinIBV9zCPC2CV5BCTwlpvBmLo28jyQOKMKjWy4k8TiAxjqaA8oBD4c6m5xqGvyZsbYT/L+4FA0AlFCSUvhf4dnRiFBkAo8SNsQJN5fiH7hwROVd2bQ7bmOWoaKXMmHY4yVCVJAIl6Bt7csh5ro2NARm2Jxbn4rlLV2J99hwgREusOT0AyOITmj99TZoNYn6BNhOq1vGmbw8IukkgRn9LbtNLuQisfYAAAMAADLhAAAAUkGaY0nhDyZTAhX//jhABiETcQukxfdQFzKFvTjOSQAFK8fKPbXFIWeXn33ej7dq648mpQYIDVjRgF0bgXzCO+LFzO0q/FxLrrQYQoAAAAMAJ2AAAAJXQZqESeEPJlMCE//98QAO5v+1mNR4eHB+yRQrIsaSyyyWB1UJTVHPgAAFz9a1bABeVvPLaqfsX+1yq07lYXv8kF+DFB3g7aBy5Fs/gGFn0YalIMKt3mGDGZmZZ8pR6uMceOK/dSyJ/WZn1PXToL/l86WChJLXsZYjhPP6meVYuoARYkdWMgZoArXSTq9kryTSL0/OXWmkqf6m9Vny+yqEVrm49BeiAoU6OiWZhCOPLX+MmIB1EmER4UgCn2uPV840vompC+Kbj0ymBGWm3NYkxHTDU0+66v7xaFkEUKeqJwzsBPrEvZzSp2RmOLYZ/Ru2AmddWg97XqqfrNBbcMO1XALyOw+5oNsYH3mLUGC/1l8pdK31YxJpUODpNFYKFlG+RXK0DKQhG7bueo0dbNvc8FMgleD4lvQGFw8UILVmjiVrNDTXmJHTLd68Z8x6ZRgl6fI/tFWdyjekc/X6WwKrvruuYosQkCL3HQWtK+TwCuEB4W88F2OwML9PvieDqv53ashg98lK2JDMKiybELug+cBuN1DZAI3t2vmPUCS+nxTt9Bz7e3mN3+Br7XA5B+/pc/2P14Ku4kfI7y3HcmMILO+FrOCCxKZ3jrokAU6+1BJIoFb2bUE0QyrPOrKLtibu0DHkUEOxA+cXP9JhlIvvKmXr2Qz+6WL3c/v/IDS+Ob1Q04Ffv54wGy4m1dS71GwnFW49uf5Eg2MKCZObwTLPck2xqpK7GluPDmv1Txm8QPTcxCQhj5VIDkifg5RE3rRN1774ESbJNuHc//A6wHEjyAMGCs9dvhcAAAcebW9vdgAAAGxtdmhkAAAAAAAAAAAAAAAAAAAD6AAAJ3QAAQAAAQAAAAAAAAAAAAAAAAEAAAAAAAAAAAAAAAAAAAABAAAAAAAAAAAAAAAAAABAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAgAABkh0cmFrAAAAXHRraGQAAAADAAAAAAAAAAAAAAABAAAAAAAAJ3QAAAAAAAAAAAAAAAAAAAAAAAEAAAAAAAAAAAAAAAAAAAABAAAAAAAAAAAAAAAAAABAAAAAAyAAAAHgAAAAAAAkZWR0cwAAABxlbHN0AAAAAAAAAAEAACd0AAAIAAABAAAAAAXAbWRpYQAAACBtZGhkAAAAAAAAAAAAAAAAAAAoAAABlABVxAAAAAAALWhkbHIAAAAAAAAAAHZpZGUAAAAAAAAAAAAAAABWaWRlb0hhbmRsZXIAAAAFa21pbmYAAAAUdm1oZAAAAAEAAAAAAAAAAAAAACRkaW5mAAAAHGRyZWYAAAAAAAAAAQAAAAx1cmwgAAAAAQAABStzdGJsAAAAl3N0c2QAAAAAAAAAAQAAAIdhdmMxAAAAAAAAAAEAAAAAAAAAAAAAAAAAAAAAAyAB4ABIAAAASAAAAAAAAAABAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAGP//AAAAMWF2Y0MBZAAW/+EAGGdkABas2UDIPaEAAAMAAQAAAwAUDxYtlgEABmjr48siwAAAABhzdHRzAAAAAAAAAAEAAABlAAAEAAAAABRzdHNzAAAAAAAAAAEAAAABAAACiGN0dHMAAAAAAAAATwAAAAEAAAgAAAAAAQAADAAAAAABAAAEAAAAAAEAAAgAAAAAAQAADAAAAAABAAAEAAAAAAEAAAwAAAAAAQAABAAAAAADAAAIAAAAAAEAABQAAAAAAQAACAAAAAABAAAAAAAAAAEAAAQAAAAAAQAADAAAAAABAAAEAAAAAAEAAAwAAAAAAQAABAAAAAABAAAIAAAAAAEAABQAAAAAAQAACAAAAAABAAAAAAAAAAEAAAQAAAAAAQAACAAAAAABAAAUAAAAAAEAAAgAAAAAAQAAAAAAAAABAAAEAAAAAAEAABQAAAAAAQAACAAAAAABAAAAAAAAAAEAAAQAAAAAAQAAEAAAAAACAAAEAAAAAAQAAAgAAAAAAQAAEAAAAAACAAAEAAAAAAMAAAgAAAAAAQAADAAAAAABAAAEAAAAAAIAAAgAAAAAAQAADAAAAAABAAAEAAAAAAEAABQAAAAAAQAACAAAAAABAAAAAAAAAAEAAAQAAAAAAQAAEAAAAAACAAAEAAAAAAIAAAgAAAAAAQAADAAAAAABAAAEAAAAAAEAABAAAAAAAgAABAAAAAACAAAIAAAAAAEAABAAAAAAAgAABAAAAAADAAAIAAAAAAEAABQAAAAAAQAACAAAAAABAAAAAAAAAAEAAAQAAAAAAQAADAAAAAABAAAEAAAAAAIAAAgAAAAAAQAADAAAAAABAAAEAAAAAAEAAAgAAAAAAQAADAAAAAABAAAEAAAAAAEAAAgAAAAAAQAADAAAAAABAAAEAAAAAAEAAAwAAAAAAQAABAAAAAABAAAMAAAAAAEAAAQAAAAAAQAADAAAAAABAAAEAAAAAAUAAAgAAAAAHHN0c2MAAAAAAAAAAQAAAAEAAABlAAAAAQAAAahzdHN6AAAAAAAAAAAAAABlAAAJIAAAAngAAAA/AAAAYQAAAFYAAAAvAAACPgAAADcAAAI8AAAAWAAAAFMAAALFAAAANQAAAC4AAAAZAAAAUgAAADAAAAJVAAAANgAAAlAAAAKHAAAAcQAAADEAAAAdAAAA/AAAACYAAADRAAAAUAAAAFIAAAAfAAAAcwAAAFAAAABSAAACPwAAADcAAAAxAAACQwAAAFQAAAJFAAAATgAAAkEAAAA9AAAAHgAAAkYAAABSAAACQQAAAkcAAAA5AAAAVQAAApAAAAAnAAACQwAAApQAAAA5AAAALwAAABsAAAJCAAAANQAAADgAAAJiAAAAWwAAAFMAAAAvAAACZAAAADkAAAAeAAACawAAAkUAAABVAAAAMwAAABwAAABcAAACPQAAAjsAAAK6AAAAPgAAADEAAAAgAAACZQAAADYAAAJmAAAAVAAAAFsAAAAwAAAASgAAAkMAAAA1AAACRAAAAmQAAAA3AAACXwAAADgAAAJeAAAANQAAAFMAAAAvAAAAUgAAAkIAAAJBAAAAVgAAAlsAAAAUc3RjbwAAAAAAAAABAAAAMAAAAGJ1ZHRhAAAAWm1ldGEAAAAAAAAAIWhkbHIAAAAAAAAAAG1kaXJhcHBsAAAAAAAAAAAAAAAALWlsc3QAAAAlqXRvbwAAAB1kYXRhAAAAAQAAAABMYXZmNTcuODMuMTAw\" type=\"video/mp4\" />\n",
309 |               "                 </video>"
310 |             ],
311 |             "text/plain": [
312 |               "<IPython.core.display.HTML object>"
313 |             ]
314 |           },
315 |           "metadata": {}
316 |         }
317 |       ]
318 |     },
319 |     {
320 |       "cell_type": "markdown",
321 |       "metadata": {
322 |         "id": "snmFW5Bzqpwj"
323 |       },
324 |       "source": [
325 |         "# Implementing Value Iteration\n",
326 |         "\n",
327 |         "1. Write a function ``bellman_operator`` that takes as input a function $Q$ and returns $T^* Q$.\n",
328 |         "2. Write a function  ``value_iteration`` that returns a function $Q$ such that $||Q-T^* Q||_\\infty \\leq \\varepsilon$\n",
329 |         "3. Evaluate the performance of the policy $\\pi(s) = \\arg\\max_a Q(s, a)$, where Q is returned by ``value_iteration``."
330 |       ]
331 |     },
332 |     {
333 |       "cell_type": "code",
334 |       "metadata": {
335 |         "id": "RPIOmpjkq0YX"
336 |       },
337 |       "source": [
338 |         "def bellman_operator(Q, env, gamma=0.99):\n",
339 |         "  S = env.observation_space.n\n",
340 |         "  A = env.action_space.n \n",
341 |         "  TQ = np.zeros((S, A))\n",
342 |         "\n",
343 |         "  # to complete...\n",
344 |         "\n",
345 |         "  return TQ"
346 |       ],
347 |       "execution_count": 5,
348 |       "outputs": []
349 |     },
350 |     {
351 |       "cell_type": "code",
352 |       "metadata": {
353 |         "id": "tEKAtA1LsYFx"
354 |       },
355 |       "source": [
356 |         "def value_iteration(env, gamma=0.99, epsilon=1e-6):\n",
357 |         "  S = env.observation_space.n\n",
358 |         "  A = env.action_space.n \n",
359 |         "  Q = np.zeros((S, A))\n",
360 |         "\n",
361 |         "  # to complete...\n",
362 |         "\n",
363 |         "  return Q"
364 |       ],
365 |       "execution_count": 6,
366 |       "outputs": []
367 |     },
368 |     {
369 |       "cell_type": "code",
370 |       "metadata": {
371 |         "id": "rZ7k-rDLssSk",
372 |         "colab": {
373 |           "base_uri": "https://localhost:8080/",
374 |           "height": 440
375 |         },
376 |         "outputId": "7731f953-093d-4c3b-e84f-1b356eb892c3"
377 |       },
378 |       "source": [
379 |         "Q_vi = value_iteration(env)\n",
380 |         "\n",
381 |         "# Following value iteration policy \n",
382 |         "state = env.reset()     \n",
383 |         "env.enable_rendering()  \n",
384 |         "for tt in range(100):   \n",
385 |         "  action = Q_vi[state, :].argmax()\n",
386 |         "  next_state, reward, is_terminal, info = env.step(action)\n",
387 |         "  if is_terminal:\n",
388 |         "    break\n",
389 |         "  state = next_state\n",
390 |         "\n",
391 |         "# save video (run last cell to visualize it!)\n",
392 |         "env.save_video('./videos/value_iteration_policy.mp4', framerate=10)\n",
393 |         "# clear rendering data\n",
394 |         "env.clear_render_buffer()\n",
395 |         "env.disable_rendering()\n",
396 |         "# see video\n",
397 |         "show_video(filename='./videos/value_iteration_policy.mp4')"
398 |       ],
399 |       "execution_count": 7,
400 |       "outputs": [
401 |         {
402 |           "output_type": "stream",
403 |           "name": "stdout",
404 |           "text": [
405 |             "videos/value_iteration_policy.mp4\n"
406 |           ]
407 |         },
408 |         {
409 |           "output_type": "display_data",
410 |           "data": {
411 |             "text/html": [
412 |               "<video alt=\"videos/value_iteration_policy.mp4\" autoplay \n",
413 |               "                      loop controls style=\"height: 400px;\">\n",
414 |               "                      <source src=\"data:video/mp4;base64,AAAAIGZ0eXBpc29tAAACAGlzb21pc28yYXZjMW1wNDEAAAAIZnJlZQAAFk5tZGF0AAACrgYF//+q3EXpvebZSLeWLNgg2SPu73gyNjQgLSBjb3JlIDE1MiByMjg1NCBlOWE1OTAzIC0gSC4yNjQvTVBFRy00IEFWQyBjb2RlYyAtIENvcHlsZWZ0IDIwMDMtMjAxNyAtIGh0dHA6Ly93d3cudmlkZW9sYW4ub3JnL3gyNjQuaHRtbCAtIG9wdGlvbnM6IGNhYmFjPTEgcmVmPTMgZGVibG9jaz0xOjA6MCBhbmFseXNlPTB4MzoweDExMyBtZT1oZXggc3VibWU9NyBwc3k9MSBwc3lfcmQ9MS4wMDowLjAwIG1peGVkX3JlZj0xIG1lX3JhbmdlPTE2IGNocm9tYV9tZT0xIHRyZWxsaXM9MSA4eDhkY3Q9MSBjcW09MCBkZWFkem9uZT0yMSwxMSBmYXN0X3Bza2lwPTEgY2hyb21hX3FwX29mZnNldD0tMiB0aHJlYWRzPTMgbG9va2FoZWFkX3RocmVhZHM9MSBzbGljZWRfdGhyZWFkcz0wIG5yPTAgZGVjaW1hdGU9MSBpbnRlcmxhY2VkPTAgYmx1cmF5X2NvbXBhdD0wIGNvbnN0cmFpbmVkX2ludHJhPTAgYmZyYW1lcz0zIGJfcHlyYW1pZD0yIGJfYWRhcHQ9MSBiX2JpYXM9MCBkaXJlY3Q9MSB3ZWlnaHRiPTEgb3Blbl9nb3A9MCB3ZWlnaHRwPTIga2V5aW50PTI1MCBrZXlpbnRfbWluPTEwIHNjZW5lY3V0PTQwIGludHJhX3JlZnJlc2g9MCByY19sb29rYWhlYWQ9NDAgcmM9Y3JmIG1idHJlZT0xIGNyZj0yMy4wIHFjb21wPTAuNjAgcXBtaW49MCBxcG1heD02OSBxcHN0ZXA9NCBpcF9yYXRpbz0xLjQwIGFxPTE6MS4wMACAAAAIiGWIhAA7//7wbr4FNGqVK7P6NBPYvnc/U0BuRdzZoKSsoXlUqBJjR7QAAAMAAAMAAAMAADMvM7PDSoQpLZ0BBtig+gAAAwAAAwATYWLAADPY/DdDvVADxUUfzfyu5ghzOFZA3vAnpcOF3jgAd80QAspIgc9TnYwmKDEA5gFxjzUBQVPCjHts0mHJ0+U/hPjVE6cOQGu5t2Y8Mt+3/Pe4tHZ6bkfHbEza2iuX9Xysq8o2FBYSrBf7migDpEb8UjwJJ0s2X+QACtZ5B+TBu5axiPAFym8/4T18WtrBsgusvZHMvdMG/65I5cadGhPNLRZkNdlznd7W8EvxLHA5qQmMpB7TjbrAyU67lNOHDIO4RDobXGNWe7hoYIcOiE2fTcEw+srwM87O4TD/CPDkQbf41INiQZwIi4E3COS2nUq3A8dqVdEUp4bVRLvvVob99Kx7mWY9egPXBOm012GxbysJThfeQ+B+6csz0kgT53jCajv8FUfjrF43J86YKU0Ri6Oz6DPYbFe0g6cQC/jnKVEF+m+zDqw03j6h4GG90BFz7hYrza6U22shpe0eFWaBOyNw8gAZGZAXkvIDzkXxxyc94GaIXvrsjmFIGA6tSSFpnx/4CZzxBnC/9oANiCgK1mn1fQJDGI2wDRak6xD0JBwNlrXvwYsFUMCJWsgymzDZ6gMxIpbM1YQibl59ynb9i7+06G+dv3UtpqUgIbSZm4rvnkfqoKC6GsvgQB6kokIOqERqIc//kcri18IGVdwRlXnf7Mbq5afI53brFkuYs1Hugfaipyo6d38eGTKH75IziI8UHZ0RXvFPPGXemURXt4P1Wl1D62WiXZPLwI3cwEcKXtudfj64MryTu6BVTRI2AlFthOdk0MPwO2uJ3E6WIwhe5MqY/Ot1NxaNSTvpmmc1PmR5XANj4BGrd/wwj8qMhZADiU/tUW8ovKk2aoOS9psGaHbIZZbZOOCIEwCAStiBMAwaY6grCxTbIHhtsRZ2Pv2IyOW4jnmqDP0o8KslsiNna1+YobRPi4uscCDW2MG8DNEL3tIsUUTSm/WqGXPKrX42GkXPm1rM9udc7XMDlmJmvlGf+u1TrEPQkG6ke3oAGLBU+hzxKGEIZaj1GbjKRwbB2VhEd7nux24i0lH8qoQS7nj7x+nwusdUbWkbOvzIDpDDJoe8rSt1EGf/x+nC104GVdwR1q8fzBHu3VQTFiNuSIeR0AK93VhICWWsuyT90idtqvBAdNBCL9MXuHbJyep3gR9L5As5DK2Jt5ev9X1CUAEpL/F4Gl0uniOQd6+moTiMV9VCIeGwAAADAAADAY3MAAAzasUTW//1vG7/5N2VnT+M4AJht1O4kjpXaK83kaz4JBrfNAfjb/wDf3sMa6VpR+FNNzweTlqg5QcaEV8MTyP2gjhW+vAXo00Ory9rJBWUCqoR36AA71AxGWAOnNv4goALmdgHbABA3yQAVnaSwABBCQAuHCAkNmAoVmAovCAs3CAvfC6Np7+GdLTTM2/M5ujYY5XclKY1HbSz/7SswTf4TggsREWtKmIoiTLFgnJuqM1u3cGu5C9v6QqWfjlHJ9BxcT/0/ggL5poXOLuCr7oYbG24xH47IINsEiQmXApZGHmzIcYS9UmsvPrQLtMp2u6Egj8DL0KPsP3UXZGq0S5sVGZmMyxzvmTKrHJ9dShwg1jLQqS6zuwJJiymajECHAxsHj9vRyJ7IAht6r+4AqfIYn/hoJ9ia/lNDI+iCSr5/w4IT27NisyjWfDEk7jPgalrS312IdH6UJeSf+LarzXQAC3ZIx1RA8gwknXvKUxndb+8kPfN1jXC5IhdJfNUZUU0jljf7r94dEzMimvv0I8SlzWAxBMrvv2T88cdYrG25xy5y+HXks7bX6ddFNHBzuXwP2ySauh/r4ADCSd67OMATm4+LRbE+huqyhkwMYzl0mgfXuUkwy/wcf/dYtvDaTkaRUf0k/1gifgAMJJ3rs46IdQZUmmQLPGmXilrhPmjLo/ShEXq3JT1P7nBxc9EzMimvv1ARPfSR38eViSHsYcMb7yREKW+pfP+CmPJWJrQQJFcT3Lblvf1Ktl28d8y6Jo5IEtbm/9MYmaAuTe75Nz8Lba7W8Jdi1LRk/xb5rPCssXsRFXED6Fyx5SF15uVob730FuXftesP3VVxvAC63MRXEcVD7IezaI+xnBd65Sz+mL1zD1h7XH/I8xDQzEyZ7HiJ04Rb3h8S2yKKJKvdAmOyA+4jAsHXNi4HIcRymjEiYfC+AwVlDSL0z/Su5rAncPZ2GCKcZSLDSVidNkCSbqsjIzU1Ed3ZtQH4+qa8TU4Cv+q/5FmpbWGfVbwCv+GgzSrNpCkxWRsR/n4N/4IcLqywNgNrdV/+JEAXjuTP7Ao1boWrPp8nQNtnQznaG2qW2bara7WZpdUapmoh1Etld+334io8F2yAsO11ZskPgLRCu3WSNyA9OPWRaTw9TL2zvJmnZe2QL12/OawmlC3r/7jf2mluXUtQ4tFOlNpFfTeWFc0zmNvBSmJvh4R1d12vxolFapQdYi9TC1ulk7kzQIoMG12xwvpCwAgrgwIHGvo/GC44h5Sa3v44/bT/0rxJBzOwCZgvXhaSvrcY0jdBZEQbaZ5/8pLEGzWS/vaChuk0mRJ0Tms62nTjmg/Lt2DCNj7OKpyNOydb1vIRma8mfC/YiaUWE8ZS2f2J0QN7i26TIB+fQnficRhUHlqkeAwpAc/6oZcGbK0RUN1vzq0ET82G5wFOubeghK4QLYIVKDjBbIfCHSQ5ZRcNkgiMaElxH252bXQeZcsddqmO2+EKHG4fq9brjlQ4gZfRGnTBAOfZxuPmXW6wG+bf0xAIOG29sFXAyi+JPPsioisvvtKM5VCyQTrtPjDAyb3bodX7ntBG0AckhaSoQAAALxBmiRsQ7/+qZYABvMhiwVKdk1OEUb/vy9EhXYWDQvkfADvZ1hKTeZX0kNHls+5x1uGqWAbKp3mcuU/42D75ZPJ0wMhA7cWpDPE9yABsWFzMz69iR9IcSSRkgbBFMP6I9fugIp++fV6/RRqrTjBjyRjFMlFgoS9h+stIXe03TtEt7KYfkR3ZuB+cO8kgAP+GQ6KOZWCj3A5jfxO9R+CecYxzvXNjRsCOPw51qzSUUKIurJ6Y4j9krfdNBg9VQAAACRBnkJ4hX8AC1tE/koc1V7Sq76XAAyF8hDYMnbxowOLaHOZgRcAAAAmAZ5hdEJ/AA5+1oEe7J8NZFMCUHAAEUb6oUdAqlB3549NVhFDqSAAAAASAZ5jakJ/AAADAAADAAADAArZAAAAJEGaaEmoQWiZTAh3//6plgAAAwAAAwAAjBnpQJhU3HjQrLjUgQAAABRBnoZFESwr/wAAAwAAAwAAAwAIOQAAABIBnqV0Qn8AAAMAAAMAAAMACtkAAAASAZ6nakJ/AAADAAADAAADAArYAAAAJEGarEmoQWyZTAh3//6plgAAAwAAAwAAjBnpQJcc3HjPYLjUgAAAABRBnspFFSwr/wAAAwAAAwAAAwAIOQAAABIBnul0Qn8AAAMAAAMAAAMACtgAAAASAZ7rakJ/AAADAAADAAADAArYAAAAJEGa8EmoQWyZTAh3//6plgAAAwAAAwAAjBnpQJhU3HjQrLjUgQAAABRBnw5FFSwr/wAAAwAAAwAAAwAIOQAAABIBny10Qn8AAAMAAAMAAAMACtkAAAASAZ8vakJ/AAADAAADAAADAArYAAAAJEGbNEmoQWyZTAh3//6plgAAAwAAAwAAjBnpQJcc3HjPYLjUgAAAABRBn1JFFSwr/wAAAwAAAwAAAwAIOQAAABIBn3F0Qn8AAAMAAAMAAAMACtgAAAASAZ9zakJ/AAADAAADAAADAArYAAAAJEGbeEmoQWyZTAh3//6plgAAAwAAAwAAjBnpQJhU3HjQrLjUgQAAABRBn5ZFFSwr/wAAAwAAAwAAAwAIOAAAABIBn7V0Qn8AAAMAAAMAAAMACtkAAAASAZ+3akJ/AAADAAADAAADAArZAAAAJEGbvEmoQWyZTAh3//6plgAAAwAAAwAAjBnpQJcc3HjPYLjUgAAAABRBn9pFFSwr/wAAAwAAAwAAAwAIOQAAABIBn/l0Qn8AAAMAAAMAAAMACtgAAAASAZ/7akJ/AAADAAADAAADAArZAAAAJEGb4EmoQWyZTAh3//6plgAAAwAAAwAAjBnpQJhU3HjQrLjUgQAAABRBnh5FFSwr/wAAAwAAAwAAAwAIOAAAABIBnj10Qn8AAAMAAAMAAAMACtgAAAASAZ4/akJ/AAADAAADAAADAArZAAAAJEGaJEmoQWyZTAh3//6plgAAAwAAAwAAjBnpQJcc3HjPYLjUgAAAABRBnkJFFSwr/wAAAwAAAwAAAwAIOQAAABIBnmF0Qn8AAAMAAAMAAAMACtgAAAASAZ5jakJ/AAADAAADAAADAArZAAAAJEGaaEmoQWyZTAh3//6plgAAAwAAAwAAjBnpQJhU3HjQrLjUgQAAABRBnoZFFSwr/wAAAwAAAwAAAwAIOQAAABIBnqV0Qn8AAAMAAAMAAAMACtkAAAASAZ6nakJ/AAADAAADAAADAArYAAAAJEGarEmoQWyZTAh3//6plgAAAwAAAwAAjBnpQJcc3HjPYLjUgAAAABRBnspFFSwr/wAAAwAAAwAAAwAIOQAAABIBnul0Qn8AAAMAAAMAAAMACtgAAAASAZ7rakJ/AAADAAADAAADAArYAAAAJEGa8EmoQWyZTAh3//6plgAAAwAAAwAAjBnpQJhU3HjQrLjUgQAAABRBnw5FFSwr/wAAAwAAAwAAAwAIOQAAABIBny10Qn8AAAMAAAMAAAMACtkAAAASAZ8vakJ/AAADAAADAAADAArYAAAAJEGbNEmoQWyZTAh3//6plgAAAwAAAwAAjBnpQJcc3HjPYLjUgAAAABRBn1JFFSwr/wAAAwAAAwAAAwAIOQAAABIBn3F0Qn8AAAMAAAMAAAMACtgAAAASAZ9zakJ/AAADAAADAAADAArYAAAAJEGbeEmoQWyZTAh3//6plgAAAwAAAwAAjBnpQJhU3HjQrLjUgQAAABRBn5ZFFSwr/wAAAwAAAwAAAwAIOAAAABIBn7V0Qn8AAAMAAAMAAAMACtkAAAASAZ+3akJ/AAADAAADAAADAArZAAAAJEGbvEmoQWyZTAh3//6plgAAAwAAAwAAjBnpQJcc3HjPYLjUgAAAABRBn9pFFSwr/wAAAwAAAwAAAwAIOQAAABIBn/l0Qn8AAAMAAAMAAAMACtgAAAASAZ/7akJ/AAADAAADAAADAArZAAAAJEGb4EmoQWyZTAh3//6plgAAAwAAAwAAjBnpQJhU3HjQrLjUgQAAABRBnh5FFSwr/wAAAwAAAwAAAwAIOAAAABIBnj10Qn8AAAMAAAMAAAMACtgAAAASAZ4/akJ/AAADAAADAAADAArZAAAAJEGaJEmoQWyZTAh3//6plgAAAwAAAwAAjBnpQJcc3HjPYLjUgAAAABRBnkJFFSwr/wAAAwAAAwAAAwAIOQAAABIBnmF0Qn8AAAMAAAMAAAMACtgAAAASAZ5jakJ/AAADAAADAAADAArZAAAAJEGaaEmoQWyZTAh3//6plgAAAwAAAwAAjBnpQJhU3HjQrLjUgQAAABRBnoZFFSwr/wAAAwAAAwAAAwAIOQAAABIBnqV0Qn8AAAMAAAMAAAMACtkAAAASAZ6nakJ/AAADAAADAAADAArYAAAAG0GarEmoQWyZTAh3//6plgAAAwAAAwAAAwAFNAAAABRBnspFFSwr/wAAAwAAAwAAAwAIOQAAABIBnul0Qn8AAAMAAAMAAAMACtgAAAASAZ7rakJ/AAADAAADAAADAArYAAAAG0Ga8EmoQWyZTAh3//6plgAAAwAAAwAAAwAFNQAAABRBnw5FFSwr/wAAAwAAAwAAAwAIOQAAABIBny10Qn8AAAMAAAMAAAMACtkAAAASAZ8vakJ/AAADAAADAAADAArYAAAAG0GbNEmoQWyZTAhv//6nhAAAAwAAAwAAAwAKSAAAABRBn1JFFSwr/wAAAwAAAwAAAwAIOQAAABIBn3F0Qn8AAAMAAAMAAAMACtgAAAASAZ9zakJ/AAADAAADAAADAArYAAAAG0GbeEmoQWyZTAhv//6nhAAAAwAAAwAAAwAKSQAAABRBn5ZFFSwr/wAAAwAAAwAAAwAIOAAAABIBn7V0Qn8AAAMAAAMAAAMACtkAAAASAZ+3akJ/AAADAAADAAADAArZAAAAG0GbvEmoQWyZTAhv//6nhAAAAwAAAwAAAwAKSAAAABRBn9pFFSwr/wAAAwAAAwAAAwAIOQAAABIBn/l0Qn8AAAMAAAMAAAMACtgAAAASAZ/7akJ/AAADAAADAAADAArZAAAAG0Gb4EmoQWyZTAhn//6eEAAAAwAAAwAAAwAoIQAAABRBnh5FFSwr/wAAAwAAAwAAAwAIOAAAABIBnj10Qn8AAAMAAAMAAAMACtgAAAASAZ4/akJ/AAADAAADAAADAArZAAAAGkGaJEmoQWyZTAhP//3xAAADAAADAAADAAGBAAAAFEGeQkUVLCv/AAADAAADAAADAAg5AAAAEgGeYXRCfwAAAwAAAwAAAwAK2AAAABIBnmNqQn8AAAMAAAMAAAMACtkAAAfObW9vdgAAAGxtdmhkAAAAAAAAAAAAAAAAAAAD6AAAJ3QAAQAAAQAAAAAAAAAAAAAAAAEAAAAAAAAAAAAAAAAAAAABAAAAAAAAAAAAAAAAAABAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAgAABvh0cmFrAAAAXHRraGQAAAADAAAAAAAAAAAAAAABAAAAAAAAJ3QAAAAAAAAAAAAAAAAAAAAAAAEAAAAAAAAAAAAAAAAAAAABAAAAAAAAAAAAAAAAAABAAAAAAyAAAAHgAAAAAAAkZWR0cwAAABxlbHN0AAAAAAAAAAEAACd0AAAIAAABAAAAAAZwbWRpYQAAACBtZGhkAAAAAAAAAAAAAAAAAAAoAAABlABVxAAAAAAALWhkbHIAAAAAAAAAAHZpZGUAAAAAAAAAAAAAAABWaWRlb0hhbmRsZXIAAAAGG21pbmYAAAAUdm1oZAAAAAEAAAAAAAAAAAAAACRkaW5mAAAAHGRyZWYAAAAAAAAAAQAAAAx1cmwgAAAAAQAABdtzdGJsAAAAl3N0c2QAAAAAAAAAAQAAAIdhdmMxAAAAAAAAAAEAAAAAAAAAAAAAAAAAAAAAAyAB4ABIAAAASAAAAAAAAAABAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAGP//AAAAMWF2Y0MBZAAW/+EAGGdkABas2UDIPaEAAAMAAQAAAwAUDxYtlgEABmjr48siwAAAABhzdHRzAAAAAAAAAAEAAABlAAAEAAAAABRzdHNzAAAAAAAAAAEAAAABAAADOGN0dHMAAAAAAAAAZQAAAAEAAAgAAAAAAQAAFAAAAAABAAAIAAAAAAEAAAAAAAAAAQAABAAAAAABAAAUAAAAAAEAAAgAAAAAAQAAAAAAAAABAAAEAAAAAAEAABQAAAAAAQAACAAAAAABAAAAAAAAAAEAAAQAAAAAAQAAFAAAAAABAAAIAAAAAAEAAAAAAAAAAQAABAAAAAABAAAUAAAAAAEAAAgAAAAAAQAAAAAAAAABAAAEAAAAAAEAABQAAAAAAQAACAAAAAABAAAAAAAAAAEAAAQAAAAAAQAAFAAAAAABAAAIAAAAAAEAAAAAAAAAAQAABAAAAAABAAAUAAAAAAEAAAgAAAAAAQAAAAAAAAABAAAEAAAAAAEAABQAAAAAAQAACAAAAAABAAAAAAAAAAEAAAQAAAAAAQAAFAAAAAABAAAIAAAAAAEAAAAAAAAAAQAABAAAAAABAAAUAAAAAAEAAAgAAAAAAQAAAAAAAAABAAAEAAAAAAEAABQAAAAAAQAACAAAAAABAAAAAAAAAAEAAAQAAAAAAQAAFAAAAAABAAAIAAAAAAEAAAAAAAAAAQAABAAAAAABAAAUAAAAAAEAAAgAAAAAAQAAAAAAAAABAAAEAAAAAAEAABQAAAAAAQAACAAAAAABAAAAAAAAAAEAAAQAAAAAAQAAFAAAAAABAAAIAAAAAAEAAAAAAAAAAQAABAAAAAABAAAUAAAAAAEAAAgAAAAAAQAAAAAAAAABAAAEAAAAAAEAABQAAAAAAQAACAAAAAABAAAAAAAAAAEAAAQAAAAAAQAAFAAAAAABAAAIAAAAAAEAAAAAAAAAAQAABAAAAAABAAAUAAAAAAEAAAgAAAAAAQAAAAAAAAABAAAEAAAAAAEAABQAAAAAAQAACAAAAAABAAAAAAAAAAEAAAQAAAAAAQAAFAAAAAABAAAIAAAAAAEAAAAAAAAAAQAABAAAAAABAAAUAAAAAAEAAAgAAAAAAQAAAAAAAAABAAAEAAAAAAEAABQAAAAAAQAACAAAAAABAAAAAAAAAAEAAAQAAAAAAQAAFAAAAAABAAAIAAAAAAEAAAAAAAAAAQAABAAAAAAcc3RzYwAAAAAAAAABAAAAAQAAAGUAAAABAAABqHN0c3oAAAAAAAAAAAAAAGUAAAs+AAAAwAAAACgAAAAqAAAAFgAAACgAAAAYAAAAFgAAABYAAAAoAAAAGAAAABYAAAAWAAAAKAAAABgAAAAWAAAAFgAAACgAAAAYAAAAFgAAABYAAAAoAAAAGAAAABYAAAAWAAAAKAAAABgAAAAWAAAAFgAAACgAAAAYAAAAFgAAABYAAAAoAAAAGAAAABYAAAAWAAAAKAAAABgAAAAWAAAAFgAAACgAAAAYAAAAFgAAABYAAAAoAAAAGAAAABYAAAAWAAAAKAAAABgAAAAWAAAAFgAAACgAAAAYAAAAFgAAABYAAAAoAAAAGAAAABYAAAAWAAAAKAAAABgAAAAWAAAAFgAAACgAAAAYAAAAFgAAABYAAAAoAAAAGAAAABYAAAAWAAAAHwAAABgAAAAWAAAAFgAAAB8AAAAYAAAAFgAAABYAAAAfAAAAGAAAABYAAAAWAAAAHwAAABgAAAAWAAAAFgAAAB8AAAAYAAAAFgAAABYAAAAfAAAAGAAAABYAAAAWAAAAHgAAABgAAAAWAAAAFgAAABRzdGNvAAAAAAAAAAEAAAAwAAAAYnVkdGEAAABabWV0YQAAAAAAAAAhaGRscgAAAAAAAAAAbWRpcmFwcGwAAAAAAAAAAAAAAAAtaWxzdAAAACWpdG9vAAAAHWRhdGEAAAABAAAAAExhdmY1Ny44My4xMDA=\" type=\"video/mp4\" />\n",
415 |               "                 </video>"
416 |             ],
417 |             "text/plain": [
418 |               "<IPython.core.display.HTML object>"
419 |             ]
420 |           },
421 |           "metadata": {}
422 |         }
423 |       ]
424 |     },
425 |     {
426 |       "cell_type": "markdown",
427 |       "metadata": {
428 |         "id": "1Uw6LVyVulOX"
429 |       },
430 |       "source": [
431 |         "# Implementing Q-Learning\n",
432 |         "\n",
433 |         "Implement a function ``q_learning`` that takes as input an environment, runs Q learning for $T$ time steps and returns $Q_T$. \n",
434 |         "\n",
435 |         "Test different learning rates:\n",
436 |         "  * $\\alpha_t(s, a) = \\frac{1}{\\text{number of visits to} (s, a)}$\n",
437 |         "  * $\\alpha_t(s, a) =$ constant in $]0, 1[$\n",
438 |         "  * others?\n",
439 |         "\n",
440 |         "Test different initializations of the Q function and try different values of $\\varepsilon$ in the $\\varepsilon$-greedy exploration!\n",
441 |         "\n",
442 |         "It might be very useful to plot the difference between the Q-learning approximation and the output of value iteration above, as a function of time.\n"
443 |       ]
444 |     },
445 |     {
446 |       "cell_type": "code",
447 |       "metadata": {
448 |         "id": "OrhUOlrfv6xp"
449 |       },
450 |       "source": [
451 |         "def q_learning(env, gamma=0.99, T=5000, Q_vi=None):\n",
452 |         "  \"\"\"\n",
453 |         "  Q_vi is the output of value iteration.\n",
454 |         "  \"\"\"\n",
455 |         "  S = env.observation_space.n\n",
456 |         "  A = env.action_space.n \n",
457 |         "  error = np.zeros(T)\n",
458 |         "  Q = np.zeros((S, A))  # can we improve this initialization? \n",
459 |         "\n",
460 |         "  state = env.reset()\n",
461 |         "    # to complete...\n",
462 |         "  for tt in range(T):\n",
463 |         "    # choose action a_t\n",
464 |         "    # ...\n",
465 |         "    # take action, observe next state and reward \n",
466 |         "    # ...\n",
467 |         "    # compute delta_t\n",
468 |         "    # ...\n",
469 |         "    # update Q\n",
470 |         "    # ...\n",
471 |         "\n",
472 |         "    error[tt] = np.abs(Q-Q_vi).max()\n",
473 |         "  \n",
474 |         "  plt.plot(error)\n",
475 |         "  plt.xlabel('iteration')\n",
476 |         "  plt.title('Q-Learning error')\n",
477 |         "  plt.show()\n",
478 |         "  \n",
479 |         "  return Q "
480 |       ],
481 |       "execution_count": 8,
482 |       "outputs": []
483 |     },
484 |     {
485 |       "cell_type": "code",
486 |       "metadata": {
487 |         "id": "fOetdWM4xhLt",
488 |         "colab": {
489 |           "base_uri": "https://localhost:8080/",
490 |           "height": 718
491 |         },
492 |         "outputId": "f755ca3f-86f1-4c48-ffe7-fa88d1dc68b3"
493 |       },
494 |       "source": [
495 |         "Q_ql = q_learning(env, Q_vi=Q_vi)\n",
496 |         "\n",
497 |         "# Following Q-Learning policy \n",
498 |         "state = env.reset()     \n",
499 |         "env.enable_rendering()  \n",
500 |         "for tt in range(100):   \n",
501 |         "  action = Q_ql[state, :].argmax()\n",
502 |         "  next_state, reward, is_terminal, info = env.step(action)\n",
503 |         "  if is_terminal:\n",
504 |         "    break\n",
505 |         "  state = next_state\n",
506 |         "\n",
507 |         "# save video (run last cell to visualize it!)\n",
508 |         "env.save_video('./videos/q_learning_policy.mp4', framerate=10)\n",
509 |         "# clear rendering data\n",
510 |         "env.clear_render_buffer()\n",
511 |         "env.disable_rendering()\n",
512 |         "# see video\n",
513 |         "show_video(filename='./videos/q_learning_policy.mp4')"
514 |       ],
515 |       "execution_count": 9,
516 |       "outputs": [
517 |         {
518 |           "output_type": "display_data",
519 |           "data": {
520 |             "image/png": "iVBORw0KGgoAAAANSUhEUgAAAYIAAAEWCAYAAABrDZDcAAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADh0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uMy4yLjIsIGh0dHA6Ly9tYXRwbG90bGliLm9yZy+WH4yJAAAVq0lEQVR4nO3df5BlZX3n8fdnGX5lMcOvAYFhHFwmaw27WbQ6qFG3KEV+ZGPGctkNmionSpaYLO5G19VRawUxZcCYELPRWCzqsmoEQ0KcJBuRH7IxKkgPgjAiMAI64PBzAEEEBL77x30aL23Pz+7pO93P+1V1q895znPP/T5dt++nz3NOn05VIUnq1z8bdQGSpNEyCCSpcwaBJHXOIJCkzhkEktQ5g0CSOmcQSDMgyZIkjyTZZdS1SNvKINBOJclvJrk+yaNJ7krysSQLt/CcK5L81mzVOJWq+n5V7VVVT42yDml7GATaaST5b8BZwH8HFgIvAZYCX0qy6whLI8mCUb7+1pqqzm2tfa6MVTPHINBOIcnPA+8H3lpVX6yqn1TV7cB/BJ4PvGE79/vmJDcmeSDJxUmeN7TtI0nWJ/lhkjVJXjG07fQkFyb5TJIfAr/Zjjw+kOSrSR5O8qUk+7f+S5PUxIfo5vq27W9M8r0k9yf5H0luT3LMJsawe5IPJ/l+kruTfDzJnm3b0UnuSPKuJHcBn9pE7QcnWZ1kY5J1Sf7T5sa6Pd9rzV0GgXYWvwzsAfz1cGNVPQL8X+DYbd1hkhXAe4DXAYuArwCfG+pyNXAksC/wF8BfJtljaPsK4EJgb+Czre0NwJuAA4DdgHdspoQp+yZZDnwM+A3gIAZHP4dsZj9nAr/Qaj289X3f0PbntjE8DzhlE7WfD9wBHAycCHwwySu3MFZ1wiDQzmJ/4L6qenKKbRsYfJBvq7cAf1BVN7b9fhA4cuKooKo+U1X3V9WTVfVHwO7Avxx6/ter6m+q6umq+nFr+1RV3dzWP8/gw3lTNtX3ROBvq+qfquoJBh/qU970K0kYfLi/rao2VtXDbRwnDXV7Gjitqh4fqvOZ2hl8b18GvKuqHquqa4FzgTduYazqhEGgncV9wP6bmJ8+qG2nTYs80h7v2cI+nwd8JMmDSR4ENgKh/fad5B1t2uihtn0hgw/NCeun2OddQ8uPAntt5vU31ffg4X1X1aPA/ZvYxyLg54A1Q+P4Is8Oxnur6rFJzxuu/WBgIkQmfI9nH4VMNVZ1wiDQzuLrwOMMpnGekWQv4ATgCoCqeku7OmevqvrgFva5Hvjtqtp76LFnVX2tnQ94J4NzEPtU1d7AQwyCYsKOujXvBmDxxEqb799vE33vA34MHDE0hoVVNRxAU9U53PYDYN8kzxlqWwLcuYV9qBMGgXYKVfUQg5PF/zPJ8Ul2TbKUwZTKfWx53npBkj2GHrsCHwfeneQIgCQLk/yH1v85wJPAve257wN+fsYHNrULgdck+eUkuwGn8+wAekab2vlfwNlJDgBIckiS47b2xapqPfA14A/a9+YXgZOBz0xvGJovDALtNKrqQwxO7n4YeBi4jcG0yDFV9aMtPP3PGfzmPPH4VFVdxOBy1PPb1TA3MDi6ALiYwRTLzQymSR5jlqZHqmot8FYGJ3A3AI8A9zA4IprKu4B1wJVtHJfy7HMZW+P1DC7F/QFwEYNzCpduc/Gal+I/ptHOKsmbgDOAl1XV90ddz47Spr8eBJZV1W2jrkf98Q9HtNOqqk8leZLBpaXzKgiSvAa4jMGU0IeB64HbR1mT+uURgTQCSc5lcBlpgHHgd6vqptFWpV4ZBJLUOU8WS1Ln5uQ5gv3337+WLl066jIkaU5Zs2bNfVX1M3+lPyeDYOnSpYyPj4+6DEmaU5J8b6p2p4YkqXMGgSR1ziCQpM4ZBJLUOYNAkjpnEEhS5wwCSeqcQSBJnTMIJKlzBoEkdc4gkKTOGQSS1DmDQJI6ZxBIUucMAknqnEEgSZ0zCCSpcwaBJHXOIJCkzhkEktQ5g0CSOmcQSFLnDAJJ6pxBIEmdMwgkqXMzEgRJjk9yU5J1SVZNsX33JBe07VclWTpp+5IkjyR5x0zUI0naetMOgiS7AB8FTgCWA69PsnxSt5OBB6rqcOBs4KxJ2/8Y+Ifp1iJJ2nYzcURwFLCuqm6tqieA84EVk/qsAM5ryxcCr0oSgCSvBW4D1s5ALZKkbTQTQXAIsH5o/Y7WNmWfqnoSeAjYL8lewLuA92/pRZKckmQ8yfi99947A2VLkmD0J4tPB86uqke21LGqzqmqsaoaW7Ro0Y6vTJI6sWAG9nEncOjQ+uLWNlWfO5IsABYC9wMvBk5M8iFgb+DpJI9V1Z/NQF2SpK0wE0FwNbAsyWEMPvBPAt4wqc9qYCXwdeBE4PKqKuAVEx2SnA48YghI0uyadhBU1ZNJTgUuBnYBPllVa5OcAYxX1WrgE8Cnk6wDNjIIC0nSTiCDX8znlrGxsRofHx91GZI0pyRZU1Vjk9tHfbJYkjRiBoEkdc4gkKTOGQSS1DmDQJI6ZxBIUucMAknqnEEgSZ0zCCSpcwaBJHXOIJCkzhkEktQ5g0CSOmcQSFLnDAJJ6pxBIEmdMwgkqXMGgSR1ziCQpM4ZBJLUOYNAkjpnEEhS5wwCSeqcQSBJnTMIJKlzBoEkdc4gkKTOGQSS1DmDQJI6ZxBIUudmJAiSHJ/kpiTrkqyaYvvuSS5o269KsrS1vzrJmiTXt6+vnIl6JElbb9pBkGQX4KPACcBy4PVJlk/qdjLwQFUdDpwNnNXa7wNeU1X/GlgJfHq69UiSts1MHBEcBayrqlur6gngfGDFpD4rgPPa8oXAq5Kkqr5ZVT9o7WuBPZPsPgM1SZK20kwEwSHA+qH1O1rblH2q6kngIWC/SX3+PXBNVT0+AzVJkrbSglEXAJDkCAbTRcdups8pwCkAS5YsmaXKJGn+m4kjgjuBQ4fWF7e2KfskWQAsBO5v64uBi4A3VtV3N/UiVXVOVY1V1diiRYtmoGxJEsxMEFwNLEtyWJLdgJOA1ZP6rGZwMhjgRODyqqokewN/D6yqqq/OQC2SpG007SBoc/6nAhcDNwKfr6q1Sc5I8mut2yeA/ZKsA94OTFxieipwOPC+JNe2xwHTrUmStPVSVaOuYZuNjY3V+Pj4qMuQpDklyZqqGpvc7l8WS1LnDAJJ6pxBIEmdMwgkqXMGgSR1ziCQpM4ZBJLUOYNAkjpnEEhS5wwCSeqcQSBJnTMIJKlzBoEkdc4gkKTOGQSS1DmDQJI6ZxBIUucMAknqnEEgSZ0zCCSpcwaBJHXOIJCkzhkEktQ5g0CSOmcQSFLnDAJJ6pxBIEmdMwgkqXMGgSR1ziCQpM4ZBJLUuRkJgiTHJ7kpybokq6bYvnuSC9r2q5IsHdr27tZ+U5LjZqIeSdLWm3YQJNkF+ChwArAceH2S5ZO6nQw8UFWHA2cDZ7XnLgdOAo4Ajgc+1vYnSZolC2ZgH0cB66rqVoAk5wMrgG8P9VkBnN6WLwT+LEla+/lV9ThwW5J1bX9fn4G6fsb7/3Ytdz302I7YtSTNio+c9EJ2WzCzs/ozEQSHAOuH1u8AXrypPlX1ZJKHgP1a+5WTnnvIVC+S5BTgFIAlS5ZsV6HrN/6Y72/80XY9V5J2BkXN+D5nIghmRVWdA5wDMDY2tl3fiXNXjs1oTZI0H8zE8cWdwKFD64tb25R9kiwAFgL3b+VzJUk70EwEwdXAsiSHJdmNwcnf1ZP6rAZWtuUTgcurqlr7Se2qosOAZcA3ZqAmSdJWmvbUUJvzPxW4GNgF+GRVrU1yBjBeVauBTwCfbieDNzIIC1q/zzM4sfwk8J+r6qnp1iRJ2noZ/GI+t4yNjdX4+Pioy5CkOSXJmqr6mZOl/mWxJHXOIJCkzhkEktQ5g0CSOmcQSFLnDAJJ6pxBIEmdMwgkqXMGgSR1ziCQpM4ZBJLUOYNAkjpnEEhS5wwCSeqcQSBJnTMIJKlzBoEkdc4gkKTOGQSS1DmDQJI6ZxBIUucMAknqnEEgSZ0zCCSpcwaBJHXOIJCkzhkEktQ5g0CSOmcQSFLnDAJJ6ty0giDJvkkuSXJL+7rPJvqtbH1uSbKytf1ckr9P8p0ka5OcOZ1aJEnbZ7pHBKuAy6pqGXBZW3+WJPsCpwEvBo4CThsKjA9X1QuAFwIvS3LCNOuRJG2j6QbBCuC8tnwe8Nop+hwHXFJVG6vqAeAS4PiqerSqvgxQVU8A1wCLp1mPJGkbTTcIDqyqDW35LuDAKfocAqwfWr+jtT0jyd7AaxgcVUiSZtGCLXVIcinw3Ck2vXd4paoqSW1rAUkWAJ8D/rSqbt1Mv1OAUwCWLFmyrS8jSdqELQZBVR2zqW1J7k5yUFVtSHIQcM8U3e4Ejh5aXwxcMbR+DnBLVf3JFuo4p/VlbGxsmwNHkjS16U4NrQZWtuWVwBem6HMxcGySfdpJ4mNbG0l+H1gI/N4065AkbafpBsGZwKuT3AIc09ZJMpbkXICq2gh8ALi6Pc6oqo1JFjOYXloOXJPk2iS/Nc16JEnbKFVzb5ZlbGysxsfHR12GJM0pSdZU1djkdv+yWJI6ZxBIUucMAknqnEEgSZ0zCCSpcwaBJHXOIJCkzhkEktQ5g0CSOmcQSFLnDAJJ6pxBIEmdMwgkqXMGgSR1ziCQpM4ZBJLUOYNAkjpnEEhS5wwCSeqcQSBJnTMIJKlzBoEkdc4gkKTOGQSS1DmDQJI6ZxBIUucMAknqnEEgSZ0zCCSpcwaBJHXOIJCkzk0rCJLsm+SSJLe0r/tsot/K1ueWJCun2L46yQ3TqUWStH2me0SwCrisqpYBl7X1Z0myL3Aa8GLgKOC04cBI8jrgkWnWIUnaTtMNghXAeW35POC1U/Q5DrikqjZW1QPAJcDxAEn2At4O/P4065AkbafpBsGBVbWhLd8FHDhFn0OA9UPrd7Q2gA8AfwQ8uqUXSnJKkvEk4/fee+80SpYkDVuwpQ5JLgWeO8Wm9w6vVFUlqa194SRHAv+iqt6WZOmW+lfVOcA5AGNjY1v9OpKkzdtiEFTVMZvaluTuJAdV1YYkBwH3TNHtTuDoofXFwBXAS4GxJLe3Og5IckVVHY0kadZMd2poNTBxFdBK4AtT9LkYODbJPu0k8bHAxVX151V1cFUtBV4O3GwISNLsm24QnAm8OsktwDFtnSRjSc4FqKqNDM4FXN0eZ7Q2SdJOIFVzb7p9bGysxsfHR12GJM0pSdZU1djkdv+yWJI6ZxBIUucMAknqnEEgSZ0zCCSpcwaBJHXOIJCkzhkEktQ5g0CSOmcQSFLnDAJJ6pxBIEmdMwgkqXMGgSR1ziCQpM4ZBJLUOYNAkjpnEEhS5wwCSeqcQSBJnTMIJKlzBoEkdc4gkKTOGQSS1LlU1ahr2GZJ7gW+t51P3x+4bwbLmQsccx96G3Nv44Xpj/l5VbVocuOcDILpSDJeVWOjrmM2OeY+9Dbm3sYLO27MTg1JUucMAknqXI9BcM6oCxgBx9yH3sbc23hhB425u3MEkqRn6/GIQJI0xCCQpM51EwRJjk9yU5J1SVaNup7pSPLJJPckuWGobd8klyS5pX3dp7UnyZ+2cX8ryYuGnrOy9b8lycpRjGVrJTk0yZeTfDvJ2iT/tbXP23En2SPJN5Jc18b8/tZ+WJKr2tguSLJba9+9ra9r25cO7evdrf2mJMeNZkRbJ8kuSb6Z5O/a+rweL0CS25Ncn+TaJOOtbfbe21U17x/ALsB3gecDuwHXActHXdc0xvNvgRcBNwy1fQhY1ZZXAWe15V8B/gEI8BLgqta+L3Br+7pPW95n1GPbzJgPAl7Ulp8D3Awsn8/jbrXv1ZZ3Ba5qY/k8cFJr/zjwO235d4GPt+WTgAva8vL2nt8dOKz9LOwy6vFtZtxvB/4C+Lu2Pq/H22q+Hdh/Utusvbd7OSI4ClhXVbdW1RPA+cCKEde03arqH4GNk5pXAOe15fOA1w61/58auBLYO8lBwHHAJVW1saoeAC4Bjt/x1W+fqtpQVde05YeBG4FDmMfjbrU/0lZ3bY8CXglc2Nonj3nie3Eh8Kokae3nV9XjVXUbsI7Bz8ROJ8li4N8B57b1MI/HuwWz9t7uJQgOAdYPrd/R2uaTA6tqQ1u+CziwLW9q7HP2e9KmAF7I4DfkeT3uNk1yLXAPgx/s7wIPVtWTrctw/c+MrW1/CNiPuTXmPwHeCTzd1vdjfo93QgFfSrImySmtbdbe2wu2t2rtvKqqkszL64KT7AX8FfB7VfXDwS+AA/Nx3FX1FHBkkr2Bi4AXjLikHSbJrwL3VNWaJEePup5Z9vKqujPJAcAlSb4zvHFHv7d7OSK4Ezh0aH1xa5tP7m6Hh7Sv97T2TY19zn1PkuzKIAQ+W1V/3Zrn/bgBqupB4MvASxlMBUz8Ejdc/zNja9sXAvczd8b8MuDXktzOYPr2lcBHmL/jfUZV3dm+3sMg8I9iFt/bvQTB1cCydvXBbgxOLK0ecU0zbTUwcZXASuALQ+1vbFcavAR4qB1uXgwcm2SfdjXCsa1tp9Tmfj8B3FhVfzy0ad6OO8midiRAkj2BVzM4N/Jl4MTWbfKYJ74XJwKX1+As4mrgpHaVzWHAMuAbszOKrVdV766qxVW1lMHP6OVV9RvM0/FOSPLPkzxnYpnBe/IGZvO9Peqz5bP1YHCm/WYGc6zvHXU90xzL54ANwE8YzAOezGBu9DLgFuBSYN/WN8BH27ivB8aG9vNmBifS1gFvGvW4tjDmlzOYR/0WcG17/Mp8Hjfwi8A325hvAN7X2p/P4INtHfCXwO6tfY+2vq5tf/7Qvt7bvhc3ASeMemxbMfaj+elVQ/N6vG1817XH2onPp9l8b3uLCUnqXC9TQ5KkTTAIJKlzBoEkdc4gkKTOGQSS1DmDQF1L8rX2dWmSN8zwvt8z1WtJOxsvH5WAdkuDd1TVr27DcxbUT++BM9X2R6pqr5moT9qRPCJQ15JM3N3zTOAV7X7wb2s3e/vDJFe3e77/dut/dJKvJFkNfLu1/U27WdjaiRuGJTkT2LPt77PDr9X+IvQPk9zQ7kH/60P7viLJhUm+k+SzGb6ZkrSDeNM5aWAVQ0cE7QP9oar6pSS7A19N8qXW90XAv6rBLY4B3lxVG9ttIK5O8ldVtSrJqVV15BSv9TrgSODfAPu35/xj2/ZC4AjgB8BXGdx/559mfrjST3lEIE3tWAb3c7mWwe2u92NwzxqAbwyFAMB/SXIdcCWDm34tY/NeDnyuqp6qqruB/wf80tC+76iqpxncRmPpjIxG2gyPCKSpBXhrVT3rpl3tXMKPJq0fA7y0qh5NcgWDe+Bsr8eHlp/Cn1HNAo8IpIGHGfwLzAkXA7/Tbn1Nkl9od4acbCHwQAuBFzD414ETfjLx/Em+Avx6Ow+xiMG/Ht1p746p+c/fNqSBbwFPtSme/83gPvhLgWvaCdt7+em/Chz2ReAtSW5kcKfLK4e2nQN8K8k1Nbid8oSLGPxfgesY3FH1nVV1VwsSadZ5+agkdc6pIUnqnEEgSZ0zCCSpcwaBJHXOIJCkzhkEktQ5g0CSOvf/AQ/Xfo538TV8AAAAAElFTkSuQmCC\n",
521 |             "text/plain": [
522 |               "<Figure size 432x288 with 1 Axes>"
523 |             ]
524 |           },
525 |           "metadata": {
526 |             "needs_background": "light"
527 |           }
528 |         },
529 |         {
530 |           "output_type": "stream",
531 |           "name": "stdout",
532 |           "text": [
533 |             "videos/q_learning_policy.mp4\n"
534 |           ]
535 |         },
536 |         {
537 |           "output_type": "display_data",
538 |           "data": {
539 |             "text/html": [
540 |               "<video alt=\"videos/q_learning_policy.mp4\" autoplay \n",
541 |               "                      loop controls style=\"height: 400px;\">\n",
542 |               "                      <source src=\"data:video/mp4;base64,AAAAIGZ0eXBpc29tAAACAGlzb21pc28yYXZjMW1wNDEAAAAIZnJlZQAAFk5tZGF0AAACrgYF//+q3EXpvebZSLeWLNgg2SPu73gyNjQgLSBjb3JlIDE1MiByMjg1NCBlOWE1OTAzIC0gSC4yNjQvTVBFRy00IEFWQyBjb2RlYyAtIENvcHlsZWZ0IDIwMDMtMjAxNyAtIGh0dHA6Ly93d3cudmlkZW9sYW4ub3JnL3gyNjQuaHRtbCAtIG9wdGlvbnM6IGNhYmFjPTEgcmVmPTMgZGVibG9jaz0xOjA6MCBhbmFseXNlPTB4MzoweDExMyBtZT1oZXggc3VibWU9NyBwc3k9MSBwc3lfcmQ9MS4wMDowLjAwIG1peGVkX3JlZj0xIG1lX3JhbmdlPTE2IGNocm9tYV9tZT0xIHRyZWxsaXM9MSA4eDhkY3Q9MSBjcW09MCBkZWFkem9uZT0yMSwxMSBmYXN0X3Bza2lwPTEgY2hyb21hX3FwX29mZnNldD0tMiB0aHJlYWRzPTMgbG9va2FoZWFkX3RocmVhZHM9MSBzbGljZWRfdGhyZWFkcz0wIG5yPTAgZGVjaW1hdGU9MSBpbnRlcmxhY2VkPTAgYmx1cmF5X2NvbXBhdD0wIGNvbnN0cmFpbmVkX2ludHJhPTAgYmZyYW1lcz0zIGJfcHlyYW1pZD0yIGJfYWRhcHQ9MSBiX2JpYXM9MCBkaXJlY3Q9MSB3ZWlnaHRiPTEgb3Blbl9nb3A9MCB3ZWlnaHRwPTIga2V5aW50PTI1MCBrZXlpbnRfbWluPTEwIHNjZW5lY3V0PTQwIGludHJhX3JlZnJlc2g9MCByY19sb29rYWhlYWQ9NDAgcmM9Y3JmIG1idHJlZT0xIGNyZj0yMy4wIHFjb21wPTAuNjAgcXBtaW49MCBxcG1heD02OSBxcHN0ZXA9NCBpcF9yYXRpbz0xLjQwIGFxPTE6MS4wMACAAAAIiGWIhAA7//7wbr4FNGqVK7P6NBPYvnc/U0BuRdzZoKSsoXlUqBJjR7QAAAMAAAMAAAMAADMvM7PDSoQpLZ0BBtig+gAAAwAAAwATYWLAADPY/DdDvVADxUUfzfyu5ghzOFZA3vAnpcOF3jgAd80QAspIgc9TnYwmKDEA5gFxjzUBQVPCjHts0mHJ0+U/hPjVE6cOQGu5t2Y8Mt+3/Pe4tHZ6bkfHbEza2iuX9Xysq8o2FBYSrBf7migDpEb8UjwJJ0s2X+QACtZ5B+TBu5axiPAFym8/4T18WtrBsgusvZHMvdMG/65I5cadGhPNLRZkNdlznd7W8EvxLHA5qQmMpB7TjbrAyU67lNOHDIO4RDobXGNWe7hoYIcOiE2fTcEw+srwM87O4TD/CPDkQbf41INiQZwIi4E3COS2nUq3A8dqVdEUp4bVRLvvVob99Kx7mWY9egPXBOm012GxbysJThfeQ+B+6csz0kgT53jCajv8FUfjrF43J86YKU0Ri6Oz6DPYbFe0g6cQC/jnKVEF+m+zDqw03j6h4GG90BFz7hYrza6U22shpe0eFWaBOyNw8gAZGZAXkvIDzkXxxyc94GaIXvrsjmFIGA6tSSFpnx/4CZzxBnC/9oANiCgK1mn1fQJDGI2wDRak6xD0JBwNlrXvwYsFUMCJWsgymzDZ6gMxIpbM1YQibl59ynb9i7+06G+dv3UtpqUgIbSZm4rvnkfqoKC6GsvgQB6kokIOqERqIc//kcri18IGVdwRlXnf7Mbq5afI53brFkuYs1Hugfaipyo6d38eGTKH75IziI8UHZ0RXvFPPGXemURXt4P1Wl1D62WiXZPLwI3cwEcKXtudfj64MryTu6BVTRI2AlFthOdk0MPwO2uJ3E6WIwhe5MqY/Ot1NxaNSTvpmmc1PmR5XANj4BGrd/wwj8qMhZADiU/tUW8ovKk2aoOS9psGaHbIZZbZOOCIEwCAStiBMAwaY6grCxTbIHhtsRZ2Pv2IyOW4jnmqDP0o8KslsiNna1+YobRPi4uscCDW2MG8DNEL3tIsUUTSm/WqGXPKrX42GkXPm1rM9udc7XMDlmJmvlGf+u1TrEPQkG6ke3oAGLBU+hzxKGEIZaj1GbjKRwbB2VhEd7nux24i0lH8qoQS7nj7x+nwusdUbWkbOvzIDpDDJoe8rSt1EGf/x+nC104GVdwR1q8fzBHu3VQTFiNuSIeR0AK93VhICWWsuyT90idtqvBAdNBCL9MXuHbJyep3gR9L5As5DK2Jt5ev9X1CUAEpL/F4Gl0uniOQd6+moTiMV9VCIeGwAAADAAADAY3MAAAzasUTW//1vG7/5N2VnT+M4AJht1O4kjpXaK83kaz4JBrfNAfjb/wDf3sMa6VpR+FNNzweTlqg5QcaEV8MTyP2gjhW+vAXo00Ory9rJBWUCqoR36AA71AxGWAOnNv4goALmdgHbABA3yQAVnaSwABBCQAuHCAkNmAoVmAovCAs3CAvfC6Np7+GdLTTM2/M5ujYY5XclKY1HbSz/7SswTf4TggsREWtKmIoiTLFgnJuqM1u3cGu5C9v6QqWfjlHJ9BxcT/0/ggL5poXOLuCr7oYbG24xH47IINsEiQmXApZGHmzIcYS9UmsvPrQLtMp2u6Egj8DL0KPsP3UXZGq0S5sVGZmMyxzvmTKrHJ9dShwg1jLQqS6zuwJJiymajECHAxsHj9vRyJ7IAht6r+4AqfIYn/hoJ9ia/lNDI+iCSr5/w4IT27NisyjWfDEk7jPgalrS312IdH6UJeSf+LarzXQAC3ZIx1RA8gwknXvKUxndb+8kPfN1jXC5IhdJfNUZUU0jljf7r94dEzMimvv0I8SlzWAxBMrvv2T88cdYrG25xy5y+HXks7bX6ddFNHBzuXwP2ySauh/r4ADCSd67OMATm4+LRbE+huqyhkwMYzl0mgfXuUkwy/wcf/dYtvDaTkaRUf0k/1gifgAMJJ3rs46IdQZUmmQLPGmXilrhPmjLo/ShEXq3JT1P7nBxc9EzMimvv1ARPfSR38eViSHsYcMb7yREKW+pfP+CmPJWJrQQJFcT3Lblvf1Ktl28d8y6Jo5IEtbm/9MYmaAuTe75Nz8Lba7W8Jdi1LRk/xb5rPCssXsRFXED6Fyx5SF15uVob730FuXftesP3VVxvAC63MRXEcVD7IezaI+xnBd65Sz+mL1zD1h7XH/I8xDQzEyZ7HiJ04Rb3h8S2yKKJKvdAmOyA+4jAsHXNi4HIcRymjEiYfC+AwVlDSL0z/Su5rAncPZ2GCKcZSLDSVidNkCSbqsjIzU1Ed3ZtQH4+qa8TU4Cv+q/5FmpbWGfVbwCv+GgzSrNpCkxWRsR/n4N/4IcLqywNgNrdV/+JEAXjuTP7Ao1boWrPp8nQNtnQznaG2qW2bara7WZpdUapmoh1Etld+334io8F2yAsO11ZskPgLRCu3WSNyA9OPWRaTw9TL2zvJmnZe2QL12/OawmlC3r/7jf2mluXUtQ4tFOlNpFfTeWFc0zmNvBSmJvh4R1d12vxolFapQdYi9TC1ulk7kzQIoMG12xwvpCwAgrgwIHGvo/GC44h5Sa3v44/bT/0rxJBzOwCZgvXhaSvrcY0jdBZEQbaZ5/8pLEGzWS/vaChuk0mRJ0Tms62nTjmg/Lt2DCNj7OKpyNOydb1vIRma8mfC/YiaUWE8ZS2f2J0QN7i26TIB+fQnficRhUHlqkeAwpAc/6oZcGbK0RUN1vzq0ET82G5wFOubeghK4QLYIVKDjBbIfCHSQ5ZRcNkgiMaElxH252bXQeZcsddqmO2+EKHG4fq9brjlQ4gZfRGnTBAOfZxuPmXW6wG+bf0xAIOG29sFXAyi+JPPsioisvvtKM5VCyQTrtPjDAyb3bodX7ntBG0AckhaSoQAAALxBmiRsQ7/+qZYABvMhiwVKdk1OEUb/vy9EhXYWDQvkfADvZ1hKTeZX0kNHls+5x1uGqWAbKp3mcuU/42D75ZPJ0wMhA7cWpDPE9yABsWFzMz69iR9IcSSRkgbBFMP6I9fugIp++fV6/RRqrTjBjyRjFMlFgoS9h+stIXe03TtEt7KYfkR3ZuB+cO8kgAP+GQ6KOZWCj3A5jfxO9R+CecYxzvXNjRsCOPw51qzSUUKIurJ6Y4j9krfdNBg9VQAAACRBnkJ4hX8AC1tE/koc1V7Sq76XAAyF8hDYMnbxowOLaHOZgRcAAAAmAZ5hdEJ/AA5+1oEe7J8NZFMCUHAAEUb6oUdAqlB3549NVhFDqSAAAAASAZ5jakJ/AAADAAADAAADAArZAAAAJEGaaEmoQWiZTAh3//6plgAAAwAAAwAAjBnpQJhU3HjQrLjUgQAAABRBnoZFESwr/wAAAwAAAwAAAwAIOQAAABIBnqV0Qn8AAAMAAAMAAAMACtkAAAASAZ6nakJ/AAADAAADAAADAArYAAAAJEGarEmoQWyZTAh3//6plgAAAwAAAwAAjBnpQJcc3HjPYLjUgAAAABRBnspFFSwr/wAAAwAAAwAAAwAIOQAAABIBnul0Qn8AAAMAAAMAAAMACtgAAAASAZ7rakJ/AAADAAADAAADAArYAAAAJEGa8EmoQWyZTAh3//6plgAAAwAAAwAAjBnpQJhU3HjQrLjUgQAAABRBnw5FFSwr/wAAAwAAAwAAAwAIOQAAABIBny10Qn8AAAMAAAMAAAMACtkAAAASAZ8vakJ/AAADAAADAAADAArYAAAAJEGbNEmoQWyZTAh3//6plgAAAwAAAwAAjBnpQJcc3HjPYLjUgAAAABRBn1JFFSwr/wAAAwAAAwAAAwAIOQAAABIBn3F0Qn8AAAMAAAMAAAMACtgAAAASAZ9zakJ/AAADAAADAAADAArYAAAAJEGbeEmoQWyZTAh3//6plgAAAwAAAwAAjBnpQJhU3HjQrLjUgQAAABRBn5ZFFSwr/wAAAwAAAwAAAwAIOAAAABIBn7V0Qn8AAAMAAAMAAAMACtkAAAASAZ+3akJ/AAADAAADAAADAArZAAAAJEGbvEmoQWyZTAh3//6plgAAAwAAAwAAjBnpQJcc3HjPYLjUgAAAABRBn9pFFSwr/wAAAwAAAwAAAwAIOQAAABIBn/l0Qn8AAAMAAAMAAAMACtgAAAASAZ/7akJ/AAADAAADAAADAArZAAAAJEGb4EmoQWyZTAh3//6plgAAAwAAAwAAjBnpQJhU3HjQrLjUgQAAABRBnh5FFSwr/wAAAwAAAwAAAwAIOAAAABIBnj10Qn8AAAMAAAMAAAMACtgAAAASAZ4/akJ/AAADAAADAAADAArZAAAAJEGaJEmoQWyZTAh3//6plgAAAwAAAwAAjBnpQJcc3HjPYLjUgAAAABRBnkJFFSwr/wAAAwAAAwAAAwAIOQAAABIBnmF0Qn8AAAMAAAMAAAMACtgAAAASAZ5jakJ/AAADAAADAAADAArZAAAAJEGaaEmoQWyZTAh3//6plgAAAwAAAwAAjBnpQJhU3HjQrLjUgQAAABRBnoZFFSwr/wAAAwAAAwAAAwAIOQAAABIBnqV0Qn8AAAMAAAMAAAMACtkAAAASAZ6nakJ/AAADAAADAAADAArYAAAAJEGarEmoQWyZTAh3//6plgAAAwAAAwAAjBnpQJcc3HjPYLjUgAAAABRBnspFFSwr/wAAAwAAAwAAAwAIOQAAABIBnul0Qn8AAAMAAAMAAAMACtgAAAASAZ7rakJ/AAADAAADAAADAArYAAAAJEGa8EmoQWyZTAh3//6plgAAAwAAAwAAjBnpQJhU3HjQrLjUgQAAABRBnw5FFSwr/wAAAwAAAwAAAwAIOQAAABIBny10Qn8AAAMAAAMAAAMACtkAAAASAZ8vakJ/AAADAAADAAADAArYAAAAJEGbNEmoQWyZTAh3//6plgAAAwAAAwAAjBnpQJcc3HjPYLjUgAAAABRBn1JFFSwr/wAAAwAAAwAAAwAIOQAAABIBn3F0Qn8AAAMAAAMAAAMACtgAAAASAZ9zakJ/AAADAAADAAADAArYAAAAJEGbeEmoQWyZTAh3//6plgAAAwAAAwAAjBnpQJhU3HjQrLjUgQAAABRBn5ZFFSwr/wAAAwAAAwAAAwAIOAAAABIBn7V0Qn8AAAMAAAMAAAMACtkAAAASAZ+3akJ/AAADAAADAAADAArZAAAAJEGbvEmoQWyZTAh3//6plgAAAwAAAwAAjBnpQJcc3HjPYLjUgAAAABRBn9pFFSwr/wAAAwAAAwAAAwAIOQAAABIBn/l0Qn8AAAMAAAMAAAMACtgAAAASAZ/7akJ/AAADAAADAAADAArZAAAAJEGb4EmoQWyZTAh3//6plgAAAwAAAwAAjBnpQJhU3HjQrLjUgQAAABRBnh5FFSwr/wAAAwAAAwAAAwAIOAAAABIBnj10Qn8AAAMAAAMAAAMACtgAAAASAZ4/akJ/AAADAAADAAADAArZAAAAJEGaJEmoQWyZTAh3//6plgAAAwAAAwAAjBnpQJcc3HjPYLjUgAAAABRBnkJFFSwr/wAAAwAAAwAAAwAIOQAAABIBnmF0Qn8AAAMAAAMAAAMACtgAAAASAZ5jakJ/AAADAAADAAADAArZAAAAJEGaaEmoQWyZTAh3//6plgAAAwAAAwAAjBnpQJhU3HjQrLjUgQAAABRBnoZFFSwr/wAAAwAAAwAAAwAIOQAAABIBnqV0Qn8AAAMAAAMAAAMACtkAAAASAZ6nakJ/AAADAAADAAADAArYAAAAG0GarEmoQWyZTAh3//6plgAAAwAAAwAAAwAFNAAAABRBnspFFSwr/wAAAwAAAwAAAwAIOQAAABIBnul0Qn8AAAMAAAMAAAMACtgAAAASAZ7rakJ/AAADAAADAAADAArYAAAAG0Ga8EmoQWyZTAh3//6plgAAAwAAAwAAAwAFNQAAABRBnw5FFSwr/wAAAwAAAwAAAwAIOQAAABIBny10Qn8AAAMAAAMAAAMACtkAAAASAZ8vakJ/AAADAAADAAADAArYAAAAG0GbNEmoQWyZTAhv//6nhAAAAwAAAwAAAwAKSAAAABRBn1JFFSwr/wAAAwAAAwAAAwAIOQAAABIBn3F0Qn8AAAMAAAMAAAMACtgAAAASAZ9zakJ/AAADAAADAAADAArYAAAAG0GbeEmoQWyZTAhv//6nhAAAAwAAAwAAAwAKSQAAABRBn5ZFFSwr/wAAAwAAAwAAAwAIOAAAABIBn7V0Qn8AAAMAAAMAAAMACtkAAAASAZ+3akJ/AAADAAADAAADAArZAAAAG0GbvEmoQWyZTAhv//6nhAAAAwAAAwAAAwAKSAAAABRBn9pFFSwr/wAAAwAAAwAAAwAIOQAAABIBn/l0Qn8AAAMAAAMAAAMACtgAAAASAZ/7akJ/AAADAAADAAADAArZAAAAG0Gb4EmoQWyZTAhn//6eEAAAAwAAAwAAAwAoIQAAABRBnh5FFSwr/wAAAwAAAwAAAwAIOAAAABIBnj10Qn8AAAMAAAMAAAMACtgAAAASAZ4/akJ/AAADAAADAAADAArZAAAAGkGaJEmoQWyZTAhP//3xAAADAAADAAADAAGBAAAAFEGeQkUVLCv/AAADAAADAAADAAg5AAAAEgGeYXRCfwAAAwAAAwAAAwAK2AAAABIBnmNqQn8AAAMAAAMAAAMACtkAAAfObW9vdgAAAGxtdmhkAAAAAAAAAAAAAAAAAAAD6AAAJ3QAAQAAAQAAAAAAAAAAAAAAAAEAAAAAAAAAAAAAAAAAAAABAAAAAAAAAAAAAAAAAABAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAgAABvh0cmFrAAAAXHRraGQAAAADAAAAAAAAAAAAAAABAAAAAAAAJ3QAAAAAAAAAAAAAAAAAAAAAAAEAAAAAAAAAAAAAAAAAAAABAAAAAAAAAAAAAAAAAABAAAAAAyAAAAHgAAAAAAAkZWR0cwAAABxlbHN0AAAAAAAAAAEAACd0AAAIAAABAAAAAAZwbWRpYQAAACBtZGhkAAAAAAAAAAAAAAAAAAAoAAABlABVxAAAAAAALWhkbHIAAAAAAAAAAHZpZGUAAAAAAAAAAAAAAABWaWRlb0hhbmRsZXIAAAAGG21pbmYAAAAUdm1oZAAAAAEAAAAAAAAAAAAAACRkaW5mAAAAHGRyZWYAAAAAAAAAAQAAAAx1cmwgAAAAAQAABdtzdGJsAAAAl3N0c2QAAAAAAAAAAQAAAIdhdmMxAAAAAAAAAAEAAAAAAAAAAAAAAAAAAAAAAyAB4ABIAAAASAAAAAAAAAABAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAGP//AAAAMWF2Y0MBZAAW/+EAGGdkABas2UDIPaEAAAMAAQAAAwAUDxYtlgEABmjr48siwAAAABhzdHRzAAAAAAAAAAEAAABlAAAEAAAAABRzdHNzAAAAAAAAAAEAAAABAAADOGN0dHMAAAAAAAAAZQAAAAEAAAgAAAAAAQAAFAAAAAABAAAIAAAAAAEAAAAAAAAAAQAABAAAAAABAAAUAAAAAAEAAAgAAAAAAQAAAAAAAAABAAAEAAAAAAEAABQAAAAAAQAACAAAAAABAAAAAAAAAAEAAAQAAAAAAQAAFAAAAAABAAAIAAAAAAEAAAAAAAAAAQAABAAAAAABAAAUAAAAAAEAAAgAAAAAAQAAAAAAAAABAAAEAAAAAAEAABQAAAAAAQAACAAAAAABAAAAAAAAAAEAAAQAAAAAAQAAFAAAAAABAAAIAAAAAAEAAAAAAAAAAQAABAAAAAABAAAUAAAAAAEAAAgAAAAAAQAAAAAAAAABAAAEAAAAAAEAABQAAAAAAQAACAAAAAABAAAAAAAAAAEAAAQAAAAAAQAAFAAAAAABAAAIAAAAAAEAAAAAAAAAAQAABAAAAAABAAAUAAAAAAEAAAgAAAAAAQAAAAAAAAABAAAEAAAAAAEAABQAAAAAAQAACAAAAAABAAAAAAAAAAEAAAQAAAAAAQAAFAAAAAABAAAIAAAAAAEAAAAAAAAAAQAABAAAAAABAAAUAAAAAAEAAAgAAAAAAQAAAAAAAAABAAAEAAAAAAEAABQAAAAAAQAACAAAAAABAAAAAAAAAAEAAAQAAAAAAQAAFAAAAAABAAAIAAAAAAEAAAAAAAAAAQAABAAAAAABAAAUAAAAAAEAAAgAAAAAAQAAAAAAAAABAAAEAAAAAAEAABQAAAAAAQAACAAAAAABAAAAAAAAAAEAAAQAAAAAAQAAFAAAAAABAAAIAAAAAAEAAAAAAAAAAQAABAAAAAABAAAUAAAAAAEAAAgAAAAAAQAAAAAAAAABAAAEAAAAAAEAABQAAAAAAQAACAAAAAABAAAAAAAAAAEAAAQAAAAAAQAAFAAAAAABAAAIAAAAAAEAAAAAAAAAAQAABAAAAAABAAAUAAAAAAEAAAgAAAAAAQAAAAAAAAABAAAEAAAAAAEAABQAAAAAAQAACAAAAAABAAAAAAAAAAEAAAQAAAAAAQAAFAAAAAABAAAIAAAAAAEAAAAAAAAAAQAABAAAAAAcc3RzYwAAAAAAAAABAAAAAQAAAGUAAAABAAABqHN0c3oAAAAAAAAAAAAAAGUAAAs+AAAAwAAAACgAAAAqAAAAFgAAACgAAAAYAAAAFgAAABYAAAAoAAAAGAAAABYAAAAWAAAAKAAAABgAAAAWAAAAFgAAACgAAAAYAAAAFgAAABYAAAAoAAAAGAAAABYAAAAWAAAAKAAAABgAAAAWAAAAFgAAACgAAAAYAAAAFgAAABYAAAAoAAAAGAAAABYAAAAWAAAAKAAAABgAAAAWAAAAFgAAACgAAAAYAAAAFgAAABYAAAAoAAAAGAAAABYAAAAWAAAAKAAAABgAAAAWAAAAFgAAACgAAAAYAAAAFgAAABYAAAAoAAAAGAAAABYAAAAWAAAAKAAAABgAAAAWAAAAFgAAACgAAAAYAAAAFgAAABYAAAAoAAAAGAAAABYAAAAWAAAAHwAAABgAAAAWAAAAFgAAAB8AAAAYAAAAFgAAABYAAAAfAAAAGAAAABYAAAAWAAAAHwAAABgAAAAWAAAAFgAAAB8AAAAYAAAAFgAAABYAAAAfAAAAGAAAABYAAAAWAAAAHgAAABgAAAAWAAAAFgAAABRzdGNvAAAAAAAAAAEAAAAwAAAAYnVkdGEAAABabWV0YQAAAAAAAAAhaGRscgAAAAAAAAAAbWRpcmFwcGwAAAAAAAAAAAAAAAAtaWxzdAAAACWpdG9vAAAAHWRhdGEAAAABAAAAAExhdmY1Ny44My4xMDA=\" type=\"video/mp4\" />\n",
543 |               "                 </video>"
544 |             ],
545 |             "text/plain": [
546 |               "<IPython.core.display.HTML object>"
547 |             ]
548 |           },
549 |           "metadata": {}
550 |         }
551 |       ]
552 |     }
553 |   ]
554 | }


--------------------------------------------------------------------------------
/colab_test/test_rlberry_setup.ipynb:
--------------------------------------------------------------------------------
  1 | {
  2 |   "nbformat": 4,
  3 |   "nbformat_minor": 0,
  4 |   "metadata": {
  5 |     "colab": {
  6 |       "name": "test_rlberry_setup.ipynb",
  7 |       "provenance": [],
  8 |       "collapsed_sections": [],
  9 |       "authorship_tag": "ABX9TyO6kyz5+E9FocC44CxfHJ76",
 10 |       "include_colab_link": true
 11 |     },
 12 |     "kernelspec": {
 13 |       "name": "python3",
 14 |       "display_name": "Python 3"
 15 |     }
 16 |   },
 17 |   "cells": [
 18 |     {
 19 |       "cell_type": "markdown",
 20 |       "metadata": {
 21 |         "id": "view-in-github",
 22 |         "colab_type": "text"
 23 |       },
 24 |       "source": [
 25 |         "<a href=\"https://colab.research.google.com/github/rlberry-py/tutorials/blob/main/colab_test/test_rlberry_setup.ipynb\" target=\"_parent\"><img src=\"https://colab.research.google.com/assets/colab-badge.svg\" alt=\"Open In Colab\"/></a>"
 26 |       ]
 27 |     },
 28 |     {
 29 |       "cell_type": "markdown",
 30 |       "metadata": {
 31 |         "id": "qL-gF6FESKFk"
 32 |       },
 33 |       "source": [
 34 |         "# Colab setup"
 35 |       ]
 36 |     },
 37 |     {
 38 |       "cell_type": "code",
 39 |       "metadata": {
 40 |         "id": "sK5bE1AsL2Z8"
 41 |       },
 42 |       "source": [
 43 |         "# After installing, restart the kernel\n",
 44 |         "\n",
 45 |         "# install rlberry library\n",
 46 |         "!git clone https://github.com/rlberry-py/rlberry.git\n",
 47 |         "!cd rlberry && git pull && pip install -e .[full]\n",
 48 |         "!pip install ffmpeg-python > /dev/null 2>&1\n",
 49 |         "\n",
 50 |         "# packages required to show video\n",
 51 |         "!pip install pyvirtualdisplay > /dev/null 2>&1\n",
 52 |         "!apt-get install -y xvfb python-opengl ffmpeg > /dev/null 2>&1\n",
 53 |         "\n",
 54 |         "# restart runtime\n",
 55 |         "import os\n",
 56 |         "os.kill(os.getpid(), 9)"
 57 |       ],
 58 |       "execution_count": null,
 59 |       "outputs": []
 60 |     },
 61 |     {
 62 |       "cell_type": "code",
 63 |       "metadata": {
 64 |         "id": "jr1cmKKoSFpq"
 65 |       },
 66 |       "source": [
 67 |         "# Create directory for saving videos\n",
 68 |         "!mkdir videos > /dev/null 2>&1\n",
 69 |         "\n",
 70 |         "# Initialize virtual display and import show_video function\n",
 71 |         "import rlberry.colab_utils.display_setup\n",
 72 |         "from rlberry.colab_utils.display_setup import show_video"
 73 |       ],
 74 |       "execution_count": 4,
 75 |       "outputs": []
 76 |     },
 77 |     {
 78 |       "cell_type": "markdown",
 79 |       "metadata": {
 80 |         "id": "PNZY8gcrSP--"
 81 |       },
 82 |       "source": [
 83 |         "# 1. Importing modules and running unit tests\n",
 84 |         "---"
 85 |       ]
 86 |     },
 87 |     {
 88 |       "cell_type": "code",
 89 |       "metadata": {
 90 |         "id": "0JdnSic9PCDm"
 91 |       },
 92 |       "source": [
 93 |         "import rlberry\n",
 94 |         "import rlberry.agents\n",
 95 |         "import rlberry.stats\n",
 96 |         "import rlberry.envs\n",
 97 |         "import rlberry.exploration_tools\n",
 98 |         "import rlberry.rendering\n",
 99 |         "import rlberry.seeding \n",
100 |         "import rlberry.spaces \n",
101 |         "import rlberry.utils\n",
102 |         "import rlberry.wrappers"
103 |       ],
104 |       "execution_count": 5,
105 |       "outputs": []
106 |     },
107 |     {
108 |       "cell_type": "code",
109 |       "metadata": {
110 |         "id": "UeNblieLHklr"
111 |       },
112 |       "source": [
113 |         "!python -m pytest rlberry/"
114 |       ],
115 |       "execution_count": null,
116 |       "outputs": []
117 |     },
118 |     {
119 |       "cell_type": "markdown",
120 |       "metadata": {
121 |         "id": "wdaxg13aIa9X"
122 |       },
123 |       "source": [
124 |         "# 2. Interacting with GridWorld and saving video"
125 |       ]
126 |     },
127 |     {
128 |       "cell_type": "code",
129 |       "metadata": {
130 |         "id": "ZwpyeJAsRKRR"
131 |       },
132 |       "source": [
133 |         "from rlberry.envs import GridWorld\n",
134 |         "\n",
135 |         "env = GridWorld(nrows=12, ncols=15, walls=((5,5),(6, 6)))\n",
136 |         "\n",
137 |         "# call enable_rendering if you want to record a video from the interactions\n",
138 |         "env.enable_rendering()\n",
139 |         "# get initial state\n",
140 |         "state = env.reset()\n",
141 |         "# run a random policy for 100 time steps\n",
142 |         "for tt in range(100):\n",
143 |         "  action = env.action_space.sample()  # a good RL algorithm must learn a better way to choose actions!\n",
144 |         "  next_state, reward, is_terminal, info = env.step(action)\n",
145 |         "  if is_terminal:\n",
146 |         "    break\n",
147 |         "  state = next_state\n",
148 |         "env.save_video(\"videos/env_example.mp4\", framerate=10)\n",
149 |         "\n",
150 |         "# show video\n",
151 |         "show_video()"
152 |       ],
153 |       "execution_count": null,
154 |       "outputs": []
155 |     },
156 |     {
157 |       "cell_type": "code",
158 |       "metadata": {
159 |         "id": "YAsvlO52TMBX"
160 |       },
161 |       "source": [
162 |         ""
163 |       ],
164 |       "execution_count": null,
165 |       "outputs": []
166 |     }
167 |   ]
168 | }


--------------------------------------------------------------------------------
/logo/logo_wide.svg:
--------------------------------------------------------------------------------
 1 | <svg xmlns="http://www.w3.org/2000/svg" viewBox="0 0 636.63 151.07">
 2 |     <defs>
 3 |         <style>
 4 |             .cls-1{fill:#d31e1e;}.cls-2{fill:#7aaf00;}.cls-3{fill:#589b00;}.cls-4{fill:#5dad00;}.cls-5{fill:#e83636;}.cls-6{fill:none;stroke:#d31e1e;stroke-miterlimit:10;stroke-width:4px;}
 5 |         </style>
 6 |     </defs>
 7 |     <title>Fichier 16</title>
 8 |     <g id="Calque_2" data-name="Calque 2">
 9 |         <g id="Calque_2-2" data-name="Calque 2">
10 |             <circle class="cls-1" cx="26.08" cy="93.93" r="26.08"/>
11 |             <circle class="cls-1" cx="57.83" cy="75.03" r="26.08"/>
12 |             <circle class="cls-1" cx="93.5" cy="47.46" r="25.58"/>
13 |         </g>
14 |         <g id="Calque_3" data-name="Calque 3">
15 |             <path class="cls-2"
16 |                   d="M18.43,104.16S61.89,86.77,74.74,73.92s33.64-36.28,42.33-43.46,23.06-11.72,23.06-11.72v7.18s-2.76.84-6.49,2.32c-5.31,2.12-12.57,5.56-16.57,9.78C110.27,45.2,88,72.41,79.28,78.84S53.2,97.36,41.48,101.51s-21.54,7.18-21.54,7.18Z"/>
17 |             <path class="cls-2"
18 |                   d="M118.38,33.55c6.36-7.93,34.2,11.85,44.25,20.53S178.84,77.22,176,81.32,160.58,82.75,148.17,75C135.26,66,112.36,41.08,118.38,33.55Z"/>
19 |             <path class="cls-3"
20 |                   d="M125.65,34c32-6,54-5.29,62.28,0S200,45.16,197.37,51.1s-5.29,5.75-5.29,5.75-5.29-5.81-20-11.51S125.65,34,125.65,34Z"/>
21 |             <path class="cls-4"
22 |                   d="M118.21,27.07c3-10.52,26.07-25.73,35.53-26.75,17.38-1.89,30.37,4.67,37.17,20,2.12,4.78-12.28,2.34-22.57,4.75-8,1.88-21.65,6.62-33.06,7.75S115.18,37.59,118.21,27.07Z"/>
23 |         </g>
24 |         <g id="Calque_4" data-name="Calque 4">
25 |             <circle class="cls-5" cx="103.46" cy="83.75" r="26.08"/>
26 |             <circle class="cls-5" cx="67.65" cy="109.83" r="26.08"/>
27 |         </g>
28 |         <g id="Calque_5" data-name="Calque 5">
29 |             <path class="cls-6" d="M79.28,21.88C60.74,6.75,44,23.05,46,40.67"/>
30 |             <polygon class="cls-1" points="39.99 40.42 48.37 48.95 51.57 37.42 39.99 40.42"/>
31 |             <path class="cls-6" d="M41.57,48.88C30.48,33.27,7.88,45.31,8.2,61.44"/>
32 |             <polygon class="cls-1" points="2.31 60.99 10.45 69.77 13.98 58.33 2.31 60.99"/>
33 |         </g>
34 |         <g id="Titre">
35 |             <path class="cls-1"
36 |                   d="M255,57.83q3.6,1.92,3.6,4.8a4.21,4.21,0,0,1-.12,1.2q-1.08,3.84-4.8,3.84a10.11,10.11,0,0,1-1.8-.24,47.3,47.3,0,0,0-7.8-.84q-8.64,0-13.92,4a12.66,12.66,0,0,0-5.28,10.68v35a6.15,6.15,0,0,1-1.5,4.44,6,6,0,0,1-4.5,1.56,6.15,6.15,0,0,1-4.44-1.5,6,6,0,0,1-1.56-4.5V62.63a5.44,5.44,0,0,1,6-6q6,0,6,6v2.28a25.32,25.32,0,0,1,8.88-6.6,26.94,26.94,0,0,1,11.28-2.4Q251.44,55.91,255,57.83Z"/>
37 |             <path class="cls-1"
38 |                   d="M277.54,119.45a18.39,18.39,0,0,1-6.42-7.92,27.78,27.78,0,0,1-2.28-11.46V34.55a6,6,0,1,1,12,0v65.52a14.37,14.37,0,0,0,1.68,7.32q1.68,2.88,4.32,2.88h3a5,5,0,0,1,3.9,1.68,6.24,6.24,0,0,1,1.5,4.32,5.15,5.15,0,0,1-2.28,4.32,9.66,9.66,0,0,1-5.88,1.68h-.24A16.14,16.14,0,0,1,277.54,119.45Z"/>
39 |             <path class="cls-1"
40 |                   d="M358.3,60.47a30.31,30.31,0,0,1,11,11.94,35.82,35.82,0,0,1,4,17,33.82,33.82,0,0,1-4.32,17,31.56,31.56,0,0,1-11.94,12,33.23,33.23,0,0,1-16.86,4.38,32.37,32.37,0,0,1-28.62-16.38,33.46,33.46,0,0,1-4.38-17V34.67A5.89,5.89,0,0,1,309,30.23a6.09,6.09,0,0,1,10.5,4.44v32.4a30.21,30.21,0,0,1,38.82-6.6ZM351.1,109a21.09,21.09,0,0,0,7.68-8.1,23.62,23.62,0,0,0,2.82-11.52,23.28,23.28,0,0,0-2.82-11.46,21.2,21.2,0,0,0-7.68-8,21,21,0,0,0-29.34,8A23.69,23.69,0,0,0,319,89.39a24,24,0,0,0,2.76,11.52A21.16,21.16,0,0,0,351.1,109Z"/>
41 |             <path class="cls-1"
42 |                   d="M449,92.21a5.5,5.5,0,0,1-4,1.5H399.4A21.1,21.1,0,0,0,407,107.27a24.34,24.34,0,0,0,22.91,3.84,22.39,22.39,0,0,0,6.42-3.24,6.25,6.25,0,0,1,4-1.32,5.18,5.18,0,0,1,3.6,1.2,5.27,5.27,0,0,1,2.16,4.08,4.37,4.37,0,0,1-1.92,3.6A33.36,33.36,0,0,1,434,120.71a36.64,36.64,0,0,1-29.22-2.22,30.82,30.82,0,0,1-12.17-11.82,33.5,33.5,0,0,1-4.38-17.16,35.59,35.59,0,0,1,4.13-17.22A30,30,0,0,1,403.9,60.41a32.86,32.86,0,0,1,16.73-4.26,30.16,30.16,0,0,1,16,4.08,26.93,26.93,0,0,1,10.33,11.4,37.59,37.59,0,0,1,3.59,16.8A5,5,0,0,1,449,92.21ZM406.42,71.27a21.5,21.5,0,0,0-6.9,12.84h40q-1.1-8-6-12.84c-3.29-3.2-7.56-4.8-12.85-4.8Q411.87,66.47,406.42,71.27Z"/>
43 |             <path class="cls-1"
44 |                   d="M508.23,57.83q3.6,1.92,3.6,4.8a4.21,4.21,0,0,1-.12,1.2q-1.08,3.84-4.8,3.84a10.11,10.11,0,0,1-1.8-.24,47.3,47.3,0,0,0-7.8-.84q-8.64,0-13.92,4a12.66,12.66,0,0,0-5.28,10.68v35a6.15,6.15,0,0,1-1.5,4.44,6,6,0,0,1-4.5,1.56,6.15,6.15,0,0,1-4.44-1.5,6,6,0,0,1-1.56-4.5V62.63a5.44,5.44,0,0,1,6-6q6,0,6,6v2.28a25.32,25.32,0,0,1,8.88-6.6,26.94,26.94,0,0,1,11.28-2.4Q504.63,55.91,508.23,57.83Z"/>
45 |             <path class="cls-1"
46 |                   d="M566.55,57.83q3.6,1.92,3.6,4.8a4.21,4.21,0,0,1-.12,1.2q-1.08,3.84-4.8,3.84a10.11,10.11,0,0,1-1.8-.24,47.3,47.3,0,0,0-7.8-.84q-8.64,0-13.92,4a12.66,12.66,0,0,0-5.28,10.68v35a6.15,6.15,0,0,1-1.5,4.44,6,6,0,0,1-4.5,1.56,6.15,6.15,0,0,1-4.44-1.5,6,6,0,0,1-1.56-4.5V62.63a5.44,5.44,0,0,1,6-6q6,0,6,6v2.28a25.32,25.32,0,0,1,8.88-6.6,26.94,26.94,0,0,1,11.28-2.4Q563,55.91,566.55,57.83Z"/>
47 |             <path class="cls-1"
48 |                   d="M636.63,61.91a7.56,7.56,0,0,1-.72,2.88l-36.72,82.56q-1.44,3.72-4.68,3.72a7.56,7.56,0,0,1-2.88-.72q-3.6-1.56-3.6-4.68a6.39,6.39,0,0,1,.72-2.88l12-27-27-51.24a5.11,5.11,0,0,1-.6-2.52,4.79,4.79,0,0,1,1-2.88,6.33,6.33,0,0,1,2.52-2,5.85,5.85,0,0,1,2.4-.48,5.38,5.38,0,0,1,5,3.36l22,43.68,19.32-43.56q1.56-3.48,4.68-3.48a6.88,6.88,0,0,1,2.88.6Q636.63,58.67,636.63,61.91Z"/>
49 |             <circle class="cls-1" cx="343.39" cy="91.1" r="27.39"/>
50 |         </g>
51 |     </g>
52 | </svg>


--------------------------------------------------------------------------------
/requirements.txt:
--------------------------------------------------------------------------------
 1 | git+https://github.com/rlberry-py/rlberry.git
 2 | jupyterlab
 3 | ffmpeg-python
 4 | ipywidgets
 5 | pyglet==1.5.27
 6 | numpy>=1.17
 7 | scipy>=1.6
 8 | pygame
 9 | matplotlib
10 | seaborn
11 | pandas
12 | gym==0.21
13 | dill
14 | docopt
15 | pyyaml
16 | numba
17 | optuna
18 | PyOpenGL==3.1.5
19 | PyOpenGL_accelerate==3.1.5
20 | pyvirtualdisplay
21 | torch>=1.6.0
22 | stable-baselines3
23 | protobuf==3.20.1
24 | tensorboard
25 | ipywidgets
26 | 


--------------------------------------------------------------------------------