├── .gitignore
├── 01_InpaintingImageWang
    ├── 01_Inpainting_ImageWang.ipynb
    ├── 02_DownstreamTask_ImageWang.ipynb
    ├── 03_ImageWang_Leadboard_128.ipynb
    ├── 03_ImageWang_Leadboard_192.ipynb
    ├── 04_ActivationStats.ipynb
    ├── 04_InvestigateProblemsWithLargerImages.ipynb
    ├── README.md
    ├── RandomCutout.py
    └── config.py
├── 02_InpaintingVaryDatasetSize
    ├── 01_InpaintingWithVariedDatasetSize.ipynb
    ├── README.md
    ├── RandomCutout.py
    └── config.py
├── 03_PretextTrainingTime
    ├── 03_PretextTrainingTime.ipynb
    ├── RandomCutout.py
    └── config.py
├── 04_ImprovingPretextTask.ipynb
├── LICENSE
├── README.md
└── misc
    ├── 00_BaselineApproaches.ipynb
    ├── 02_Inpainting_ImageWang.ipynb
    └── 03_DownstreamTask_Pascal.ipynb


/.gitignore:
--------------------------------------------------------------------------------
  1 | # Byte-compiled / optimized / DLL files
  2 | __pycache__/
  3 | *.py[cod]
  4 | *$py.class
  5 | 
  6 | # C extensions
  7 | *.so
  8 | 
  9 | # PyCharm settings
 10 | .idea/
 11 | 
 12 | #Model checkpoints
 13 | *.pth
 14 | 
 15 | # Distribution / packaging
 16 | .Python
 17 | build/
 18 | develop-eggs/
 19 | dist/
 20 | downloads/
 21 | eggs/
 22 | .eggs/
 23 | lib/
 24 | lib64/
 25 | parts/
 26 | sdist/
 27 | var/
 28 | wheels/
 29 | pip-wheel-metadata/
 30 | share/python-wheels/
 31 | *.egg-info/
 32 | .installed.cfg
 33 | *.egg
 34 | MANIFEST
 35 | 
 36 | # PyInstaller
 37 | #  Usually these files are written by a python script from a template
 38 | #  before PyInstaller builds the exe, so as to inject date/other infos into it.
 39 | *.manifest
 40 | *.spec
 41 | 
 42 | # Installer logs
 43 | pip-log.txt
 44 | pip-delete-this-directory.txt
 45 | 
 46 | # Unit test / coverage reports
 47 | htmlcov/
 48 | .tox/
 49 | .nox/
 50 | .coverage
 51 | .coverage.*
 52 | .cache
 53 | nosetests.xml
 54 | coverage.xml
 55 | *.cover
 56 | *.py,cover
 57 | .hypothesis/
 58 | .pytest_cache/
 59 | 
 60 | # Translations
 61 | *.mo
 62 | *.pot
 63 | 
 64 | # Django stuff:
 65 | *.log
 66 | local_settings.py
 67 | db.sqlite3
 68 | db.sqlite3-journal
 69 | 
 70 | # Flask stuff:
 71 | instance/
 72 | .webassets-cache
 73 | 
 74 | # Scrapy stuff:
 75 | .scrapy
 76 | 
 77 | # Sphinx documentation
 78 | docs/_build/
 79 | 
 80 | # PyBuilder
 81 | target/
 82 | 
 83 | # Jupyter Notebook
 84 | .ipynb_checkpoints
 85 | 
 86 | # IPython
 87 | profile_default/
 88 | ipython_config.py
 89 | 
 90 | # pyenv
 91 | .python-version
 92 | 
 93 | # pipenv
 94 | #   According to pypa/pipenv#598, it is recommended to include Pipfile.lock in version control.
 95 | #   However, in case of collaboration, if having platform-specific dependencies or dependencies
 96 | #   having no cross-platform support, pipenv may install dependencies that don't work, or not
 97 | #   install all needed dependencies.
 98 | #Pipfile.lock
 99 | 
100 | # PEP 582; used by e.g. github.com/David-OConnor/pyflow
101 | __pypackages__/
102 | 
103 | # Celery stuff
104 | celerybeat-schedule
105 | celerybeat.pid
106 | 
107 | # SageMath parsed files
108 | *.sage.py
109 | 
110 | # Environments
111 | .env
112 | .venv
113 | env/
114 | venv/
115 | ENV/
116 | env.bak/
117 | venv.bak/
118 | 
119 | # Spyder project settings
120 | .spyderproject
121 | .spyproject
122 | 
123 | # Rope project settings
124 | .ropeproject
125 | 
126 | # mkdocs documentation
127 | /site
128 | 
129 | # mypy
130 | .mypy_cache/
131 | .dmypy.json
132 | dmypy.json
133 | 
134 | # Pyre type checker
135 | .pyre/
136 | 


--------------------------------------------------------------------------------
/01_InpaintingImageWang/README.md:
--------------------------------------------------------------------------------
 1 | # Image Inpainting
 2 | 
 3 | **Hypothesis**: By training a network on the task of image inpainting, we are left with a set of weights that outperform randomly initialized weights on a downstream task.
 4 | 
 5 | **Result**: True
 6 | 
 7 | - Random weights baseline: **54.0%** accuracy
 8 | - Pretext weights with head fine-tuning: **56.3%** accuracy
 9 | 
10 | 
11 | **Methodology**:
12 | 
13 | We train a U-Net with an `xresnet34` backbone on the task of image inpainting in which it is tasked with "filling in" missing patches that have been cutout from an image.
14 | 
15 | ![](https://joshvarty.files.wordpress.com/2020/02/inpainting-3.png)
16 | 
17 | We take the `xresnet34` network, add a `torch.nn.Linear()` to it and train/validate it on the ImageWang dataset.
18 | 
19 | 


--------------------------------------------------------------------------------
/01_InpaintingImageWang/RandomCutout.py:
--------------------------------------------------------------------------------
 1 | import numpy as np
 2 | from fastai2.vision.all import PILImage, Image
 3 | from fastai2.vision.augment import RandTransform
 4 | 
 5 | 
 6 | # We create this dummy class in order to create a transform that ONLY operates on images of this type
 7 | # We will use it to create all input images
 8 | class PILImageInput(PILImage):
 9 |     pass
10 | 
11 | 
12 | class RandomCutout(RandTransform):
13 |     "Picks a random scaled crop of an image and resize it to `size`"
14 |     split_idx = None
15 | 
16 |     def __init__(self, min_n_holes=5, max_n_holes=10, min_length=5, max_length=50, **kwargs):
17 |         super().__init__(**kwargs)
18 |         self.min_n_holes = min_n_holes
19 |         self.max_n_holes = max_n_holes
20 |         self.min_length = min_length
21 |         self.max_length = max_length
22 | 
23 |     def encodes(self, x: PILImageInput):
24 |         """
25 |         Note that we're accepting our dummy PILImageInput class
26 |         fastai2 will only pass images of this type to our encoder.
27 |         This means that our transform will only be applied to input images and won't
28 |         be run against output images.
29 |         """
30 | 
31 |         n_holes = np.random.randint(self.min_n_holes, self.max_n_holes)
32 |         pixels = np.array(x)  # Convert to mutable numpy array. FeelsBadMan
33 |         h, w = pixels.shape[:2]
34 | 
35 |         for n in range(n_holes):
36 |             h_length = np.random.randint(self.min_length, self.max_length)
37 |             w_length = np.random.randint(self.min_length, self.max_length)
38 |             h_y = np.random.randint(0, h)
39 |             h_x = np.random.randint(0, w)
40 |             y1 = int(np.clip(h_y - h_length / 2, 0, h))
41 |             y2 = int(np.clip(h_y + h_length / 2, 0, h))
42 |             x1 = int(np.clip(h_x - w_length / 2, 0, w))
43 |             x2 = int(np.clip(h_x + w_length / 2, 0, w))
44 | 
45 |             pixels[y1:y2, x1:x2, :] = 0
46 | 
47 |         return Image.fromarray(pixels, mode='RGB')


--------------------------------------------------------------------------------
/01_InpaintingImageWang/config.py:
--------------------------------------------------------------------------------
 1 | from fastai2.layers import Mish, MaxPool
 2 | from fastai2.vision.models.xresnet import xresnet34
 3 | 
 4 | config = {
 5 |     'lr': 8e-3,
 6 |     'size': 128,
 7 |     'sqrmom': 0.99,
 8 |     'mom': 0.9,
 9 |     'eps': 1e-6,
10 |     'epochs': 15,
11 |     'bs': 64,
12 |     'opt': 'ranger',
13 |     'sh': 0.,
14 |     'sa': 0,
15 |     'sym': 0,
16 |     'beta': 0.,
17 |     'act_fn': Mish,
18 |     'fp16': 0,
19 |     'pool': MaxPool,
20 |     'runs': 1,
21 |     'model': xresnet34
22 | }
23 | 


--------------------------------------------------------------------------------
/02_InpaintingVaryDatasetSize/01_InpaintingWithVariedDatasetSize.ipynb:
--------------------------------------------------------------------------------
   1 | {
   2 |  "cells": [
   3 |   {
   4 |    "cell_type": "markdown",
   5 |    "metadata": {},
   6 |    "source": [
   7 |     "## Inpainting with Variable Dataset Size"
   8 |    ]
   9 |   },
  10 |   {
  11 |    "cell_type": "markdown",
  12 |    "metadata": {},
  13 |    "source": [
  14 |     "Recall that the Image网 dataset consists of:\n",
  15 |     "\n",
  16 |     "1. A `/val` folder with 10 classes.\n",
  17 |     "2. A `/train` folder with 20 classes. \n",
  18 |     "  - There are ~125 images in each class that exists in `/val`. There are \n",
  19 |     "  - There are ~1,300 images in each class that does not exist in `/val`\n",
  20 |     "3. An `/unsup` folder with 7,750 unlabelled images."
  21 |    ]
  22 |   },
  23 |   {
  24 |    "cell_type": "markdown",
  25 |    "metadata": {},
  26 |    "source": [
  27 |     "The question we would like to answer with this notebook is:\n",
  28 |     "\n",
  29 |     "> What is the effect of dataset size during pretext training on downstream task performance?\n",
  30 |     "\n",
  31 |     "To answer this question we will consider four different datasets, each built from ImageWang.\n",
  32 |     "\n",
  33 |     "They are:\n",
  34 |     "\n",
  35 |     "1. All data in `/train`, `/unsup` and `/val`\n",
  36 |     "2. All data in `/train`, `/unsup`\n",
  37 |     "3. All data in `/train`\n",
  38 |     "4. Only Data in `/train` that has a corresponding class in `/val`"
  39 |    ]
  40 |   },
  41 |   {
  42 |    "cell_type": "code",
  43 |    "execution_count": 1,
  44 |    "metadata": {},
  45 |    "outputs": [],
  46 |    "source": [
  47 |     "import gc\n",
  48 |     "import json\n",
  49 |     "import torch\n",
  50 |     "import numpy as np\n",
  51 |     "\n",
  52 |     "from config import config\n",
  53 |     "from RandomCutout import RandomCutout, PILImageInput\n",
  54 |     "\n",
  55 |     "from fastai2.basics import *\n",
  56 |     "from fastai2.vision.all import *\n",
  57 |     "\n",
  58 |     "from torch.nn import MSELoss\n",
  59 |     "from functools import partial"
  60 |    ]
  61 |   },
  62 |   {
  63 |    "cell_type": "code",
  64 |    "execution_count": 2,
  65 |    "metadata": {},
  66 |    "outputs": [],
  67 |    "source": [
  68 |     "# Default parameters\n",
  69 |     "lr=config['lr']\n",
  70 |     "size=config['size']\n",
  71 |     "sqrmom=config['sqrmom']\n",
  72 |     "mom=config['mom']\n",
  73 |     "eps=config['eps']\n",
  74 |     "epochs=config['epochs']\n",
  75 |     "bs=config['bs']\n",
  76 |     "opt=config['opt']\n",
  77 |     "sh=config['sh']\n",
  78 |     "sa=config['sa']\n",
  79 |     "sym=config['sym']\n",
  80 |     "beta=config['beta']\n",
  81 |     "act_fn=config['act_fn']\n",
  82 |     "fp16=config['fp16']\n",
  83 |     "pool=config['pool']\n",
  84 |     "runs=config['runs']\n",
  85 |     "\n",
  86 |     "model = config['model']\n",
  87 |     "\n",
  88 |     "if   opt=='adam'  : opt_func = partial(Adam, mom=mom, sqr_mom=sqrmom, eps=eps)\n",
  89 |     "elif opt=='rms'   : opt_func = partial(RMSProp, sqr_mom=sqrmom)\n",
  90 |     "elif opt=='sgd'   : opt_func = partial(SGD, mom=mom)\n",
  91 |     "elif opt=='ranger': opt_func = partial(ranger, mom=mom, sqr_mom=sqrmom, eps=eps, beta=beta)\n",
  92 |     "    \n",
  93 |     "size = 128\n",
  94 |     "bs = 64\n",
  95 |     "runs=3"
  96 |    ]
  97 |   },
  98 |   {
  99 |    "cell_type": "code",
 100 |    "execution_count": 3,
 101 |    "metadata": {},
 102 |    "outputs": [
 103 |     {
 104 |      "name": "stdout",
 105 |      "output_type": "stream",
 106 |      "text": [
 107 |       "lr 0.008\n",
 108 |       "size 128\n",
 109 |       "sqrmom 0.99\n",
 110 |       "mom 0.9\n",
 111 |       "eps 1e-06\n",
 112 |       "epochs 15\n",
 113 |       "bs 64\n",
 114 |       "opt ranger\n",
 115 |       "sh 0.0\n",
 116 |       "sa 0\n",
 117 |       "sym 0\n",
 118 |       "beta 0.0\n",
 119 |       "act_fn <class 'fastai2.layers.Mish'>\n",
 120 |       "fp16 0\n",
 121 |       "pool <function MaxPool at 0x7f87caaece60>\n",
 122 |       "runs 3\n",
 123 |       "model <function xresnet34 at 0x7f87ca8fa8c0>\n"
 124 |      ]
 125 |     }
 126 |    ],
 127 |    "source": [
 128 |     "print(\"lr\", lr)\n",
 129 |     "print(\"size\", size)\n",
 130 |     "print(\"sqrmom\", sqrmom)\n",
 131 |     "print(\"mom\", mom)\n",
 132 |     "print(\"eps\", eps)\n",
 133 |     "print(\"epochs\", epochs)\n",
 134 |     "print(\"bs\", bs)\n",
 135 |     "print(\"opt\", opt)\n",
 136 |     "print(\"sh\", sh)\n",
 137 |     "print(\"sa\", sa)\n",
 138 |     "print(\"sym\", sym)\n",
 139 |     "print(\"beta\", beta)\n",
 140 |     "print(\"act_fn\", act_fn)\n",
 141 |     "print(\"fp16\", fp16)\n",
 142 |     "print(\"pool\", pool)\n",
 143 |     "print(\"runs\", runs)\n",
 144 |     "print(\"model\", model)"
 145 |    ]
 146 |   },
 147 |   {
 148 |    "cell_type": "markdown",
 149 |    "metadata": {},
 150 |    "source": [
 151 |     "## Get Items From Folder"
 152 |    ]
 153 |   },
 154 |   {
 155 |    "cell_type": "markdown",
 156 |    "metadata": {},
 157 |    "source": [
 158 |     "So before we do anything, let's create some helper methods that will give us only the training sets that we would like."
 159 |    ]
 160 |   },
 161 |   {
 162 |    "cell_type": "code",
 163 |    "execution_count": 4,
 164 |    "metadata": {},
 165 |    "outputs": [],
 166 |    "source": [
 167 |     "source = untar_data(URLs.IMAGEWANG_160)"
 168 |    ]
 169 |   },
 170 |   {
 171 |    "cell_type": "code",
 172 |    "execution_count": 5,
 173 |    "metadata": {},
 174 |    "outputs": [],
 175 |    "source": [
 176 |     "# transforms are the same for each experiment\n",
 177 |     "item_tfms=[RandomResizedCrop(size, min_scale=0.35), FlipItem(0.5), RandomCutout]\n",
 178 |     "batch_tfms=RandomErasing(p=0.9, max_count=3, sh=sh) if sh else None"
 179 |    ]
 180 |   },
 181 |   {
 182 |    "cell_type": "code",
 183 |    "execution_count": 6,
 184 |    "metadata": {},
 185 |    "outputs": [
 186 |     {
 187 |      "name": "stdout",
 188 |      "output_type": "stream",
 189 |      "text": [
 190 |       "All Files:\t26348\n",
 191 |       "Train Files:\t14669\n",
 192 |       "Unsup Files:\t7750\n",
 193 |       "Valid Files:\t3929\n",
 194 |       "\n",
 195 |       "Train+Unsup Files: 22419\n",
 196 |       "Train(in validation set)+Unsup Files: 1275\n"
 197 |      ]
 198 |     }
 199 |    ],
 200 |    "source": [
 201 |     "def get_all_items(path):\n",
 202 |     "    return get_files(path, extensions='.JPEG', recurse=True)\n",
 203 |     "\n",
 204 |     "def get_train_items(path):\n",
 205 |     "    return get_files(path/'train', extensions='.JPEG', recurse=True)\n",
 206 |     "\n",
 207 |     "def get_unsup_items(path):\n",
 208 |     "    return get_files(path/'unsup', extensions='.JPEG', recurse=True)\n",
 209 |     "\n",
 210 |     "def get_valid_items(path):\n",
 211 |     "    return get_files(path/'val', extensions='.JPEG', recurse=True)\n",
 212 |     "\n",
 213 |     "def get_train_and_unsup(path):\n",
 214 |     "    return get_train_items(path) + get_unsup_items(path)\n",
 215 |     "\n",
 216 |     "def get_train_items_that_are_present_in_val(path):\n",
 217 |     "    \"\"\"\n",
 218 |     "    We first get a list of all classes in /val\n",
 219 |     "    Then we use that list to get all the examples of each class from /train\n",
 220 |     "    \"\"\"\n",
 221 |     "    val = source/'val'\n",
 222 |     "    validation_classes = [path.name for path in val.iterdir()]\n",
 223 |     "    \n",
 224 |     "    train_files = L()\n",
 225 |     "    for class_name in validation_classes:\n",
 226 |     "        items = get_files(path/'train'/class_name, extensions='.JPEG', recurse=True)\n",
 227 |     "        train_files = train_files + items\n",
 228 |     "        \n",
 229 |     "    return train_files\n",
 230 |     "\n",
 231 |     "all_items = get_all_items(untar_data(URLs.IMAGEWANG_160))\n",
 232 |     "train_items = get_train_items(untar_data(URLs.IMAGEWANG_160))\n",
 233 |     "unsup_items = get_unsup_items(untar_data(URLs.IMAGEWANG_160))\n",
 234 |     "valid_items = get_valid_items(untar_data(URLs.IMAGEWANG_160))\n",
 235 |     "\n",
 236 |     "print(\"All Files:\\t{}\".format(len(all_items)))\n",
 237 |     "print(\"Train Files:\\t{}\".format(len(train_items)))\n",
 238 |     "print(\"Unsup Files:\\t{}\".format(len(unsup_items)))\n",
 239 |     "print(\"Valid Files:\\t{}\".format(len(valid_items)))\n",
 240 |     "print()\n",
 241 |     "\n",
 242 |     "train_and_unsup_items = get_train_and_unsup(untar_data(URLs.IMAGEWANG_160))\n",
 243 |     "print(\"Train+Unsup Files: {}\".format(len(train_and_unsup_items)))\n",
 244 |     "train_in_valid_items = get_train_items_that_are_present_in_val(untar_data(URLs.IMAGEWANG_160))\n",
 245 |     "print(\"Train(in validation set)+Unsup Files: {}\".format(len(train_in_valid_items)))"
 246 |    ]
 247 |   },
 248 |   {
 249 |    "cell_type": "markdown",
 250 |    "metadata": {},
 251 |    "source": [
 252 |     "## Train with all data in `/train`, `/unsup` and `/val`"
 253 |    ]
 254 |   },
 255 |   {
 256 |    "cell_type": "code",
 257 |    "execution_count": 7,
 258 |    "metadata": {},
 259 |    "outputs": [
 260 |     {
 261 |      "name": "stdout",
 262 |      "output_type": "stream",
 263 |      "text": [
 264 |       "Training Size: 26348\n",
 265 |       "Validation Size: 0\n"
 266 |      ]
 267 |     }
 268 |    ],
 269 |    "source": [
 270 |     "dblock = DataBlock(blocks=(ImageBlock(cls=PILImageInput), ImageBlock),\n",
 271 |     "                   splitter=RandomSplitter(valid_pct=0),\n",
 272 |     "                   get_items=get_all_items, \n",
 273 |     "                   get_y=lambda o: o,\n",
 274 |     "                   item_tfms=item_tfms,\n",
 275 |     "                   batch_tfms=batch_tfms)\n",
 276 |     "\n",
 277 |     "dbunch =  dblock.dataloaders(source, path=source, bs=bs)\n",
 278 |     "\n",
 279 |     "#CHANGE: We're predicting pixel values, so we're just going to predict an output for each RGB channel\n",
 280 |     "dbunch.vocab = ['R', 'G', 'B']\n",
 281 |     "\n",
 282 |     "print(\"Training Size:\", len(dbunch.train_ds))\n",
 283 |     "print(\"Validation Size:\", len(dbunch.valid_ds))"
 284 |    ]
 285 |   },
 286 |   {
 287 |    "cell_type": "code",
 288 |    "execution_count": 8,
 289 |    "metadata": {},
 290 |    "outputs": [
 291 |     {
 292 |      "data": {
 293 |       "text/html": [
 294 |        "<table border=\"1\" class=\"dataframe\">\n",
 295 |        "  <thead>\n",
 296 |        "    <tr style=\"text-align: left;\">\n",
 297 |        "      <th>epoch</th>\n",
 298 |        "      <th>train_loss</th>\n",
 299 |        "      <th>valid_loss</th>\n",
 300 |        "      <th>time</th>\n",
 301 |        "    </tr>\n",
 302 |        "  </thead>\n",
 303 |        "  <tbody>\n",
 304 |        "    <tr>\n",
 305 |        "      <td>0</td>\n",
 306 |        "      <td>0.016735</td>\n",
 307 |        "      <td>None</td>\n",
 308 |        "      <td>02:34</td>\n",
 309 |        "    </tr>\n",
 310 |        "    <tr>\n",
 311 |        "      <td>1</td>\n",
 312 |        "      <td>0.005480</td>\n",
 313 |        "      <td>None</td>\n",
 314 |        "      <td>02:30</td>\n",
 315 |        "    </tr>\n",
 316 |        "    <tr>\n",
 317 |        "      <td>2</td>\n",
 318 |        "      <td>0.004872</td>\n",
 319 |        "      <td>None</td>\n",
 320 |        "      <td>02:30</td>\n",
 321 |        "    </tr>\n",
 322 |        "    <tr>\n",
 323 |        "      <td>3</td>\n",
 324 |        "      <td>0.004522</td>\n",
 325 |        "      <td>None</td>\n",
 326 |        "      <td>02:30</td>\n",
 327 |        "    </tr>\n",
 328 |        "    <tr>\n",
 329 |        "      <td>4</td>\n",
 330 |        "      <td>0.004380</td>\n",
 331 |        "      <td>None</td>\n",
 332 |        "      <td>02:30</td>\n",
 333 |        "    </tr>\n",
 334 |        "    <tr>\n",
 335 |        "      <td>5</td>\n",
 336 |        "      <td>0.004298</td>\n",
 337 |        "      <td>None</td>\n",
 338 |        "      <td>02:30</td>\n",
 339 |        "    </tr>\n",
 340 |        "    <tr>\n",
 341 |        "      <td>6</td>\n",
 342 |        "      <td>0.004284</td>\n",
 343 |        "      <td>None</td>\n",
 344 |        "      <td>02:30</td>\n",
 345 |        "    </tr>\n",
 346 |        "    <tr>\n",
 347 |        "      <td>7</td>\n",
 348 |        "      <td>0.004252</td>\n",
 349 |        "      <td>None</td>\n",
 350 |        "      <td>02:30</td>\n",
 351 |        "    </tr>\n",
 352 |        "    <tr>\n",
 353 |        "      <td>8</td>\n",
 354 |        "      <td>0.004163</td>\n",
 355 |        "      <td>None</td>\n",
 356 |        "      <td>02:30</td>\n",
 357 |        "    </tr>\n",
 358 |        "    <tr>\n",
 359 |        "      <td>9</td>\n",
 360 |        "      <td>0.004135</td>\n",
 361 |        "      <td>None</td>\n",
 362 |        "      <td>02:30</td>\n",
 363 |        "    </tr>\n",
 364 |        "    <tr>\n",
 365 |        "      <td>10</td>\n",
 366 |        "      <td>0.004204</td>\n",
 367 |        "      <td>None</td>\n",
 368 |        "      <td>02:30</td>\n",
 369 |        "    </tr>\n",
 370 |        "    <tr>\n",
 371 |        "      <td>11</td>\n",
 372 |        "      <td>0.004075</td>\n",
 373 |        "      <td>None</td>\n",
 374 |        "      <td>02:30</td>\n",
 375 |        "    </tr>\n",
 376 |        "    <tr>\n",
 377 |        "      <td>12</td>\n",
 378 |        "      <td>0.003972</td>\n",
 379 |        "      <td>None</td>\n",
 380 |        "      <td>02:30</td>\n",
 381 |        "    </tr>\n",
 382 |        "    <tr>\n",
 383 |        "      <td>13</td>\n",
 384 |        "      <td>0.003911</td>\n",
 385 |        "      <td>None</td>\n",
 386 |        "      <td>02:30</td>\n",
 387 |        "    </tr>\n",
 388 |        "    <tr>\n",
 389 |        "      <td>14</td>\n",
 390 |        "      <td>0.003798</td>\n",
 391 |        "      <td>None</td>\n",
 392 |        "      <td>02:30</td>\n",
 393 |        "    </tr>\n",
 394 |        "  </tbody>\n",
 395 |        "</table>"
 396 |       ],
 397 |       "text/plain": [
 398 |        "<IPython.core.display.HTML object>"
 399 |       ]
 400 |      },
 401 |      "metadata": {},
 402 |      "output_type": "display_data"
 403 |     },
 404 |     {
 405 |      "name": "stderr",
 406 |      "output_type": "stream",
 407 |      "text": [
 408 |       "/home/josh/anaconda3/envs/fastai2/lib/python3.7/site-packages/fastprogress/fastprogress.py:74: UserWarning: Your generator is empty.\n",
 409 |       "  warn(\"Your generator is empty.\")\n"
 410 |      ]
 411 |     },
 412 |     {
 413 |      "data": {
 414 |       "text/html": [
 415 |        "<table border=\"1\" class=\"dataframe\">\n",
 416 |        "  <thead>\n",
 417 |        "    <tr style=\"text-align: left;\">\n",
 418 |        "      <th>epoch</th>\n",
 419 |        "      <th>train_loss</th>\n",
 420 |        "      <th>valid_loss</th>\n",
 421 |        "      <th>time</th>\n",
 422 |        "    </tr>\n",
 423 |        "  </thead>\n",
 424 |        "  <tbody>\n",
 425 |        "    <tr>\n",
 426 |        "      <td>0</td>\n",
 427 |        "      <td>0.016650</td>\n",
 428 |        "      <td>None</td>\n",
 429 |        "      <td>02:30</td>\n",
 430 |        "    </tr>\n",
 431 |        "    <tr>\n",
 432 |        "      <td>1</td>\n",
 433 |        "      <td>0.005430</td>\n",
 434 |        "      <td>None</td>\n",
 435 |        "      <td>02:30</td>\n",
 436 |        "    </tr>\n",
 437 |        "    <tr>\n",
 438 |        "      <td>2</td>\n",
 439 |        "      <td>0.004920</td>\n",
 440 |        "      <td>None</td>\n",
 441 |        "      <td>02:30</td>\n",
 442 |        "    </tr>\n",
 443 |        "    <tr>\n",
 444 |        "      <td>3</td>\n",
 445 |        "      <td>0.004689</td>\n",
 446 |        "      <td>None</td>\n",
 447 |        "      <td>02:30</td>\n",
 448 |        "    </tr>\n",
 449 |        "    <tr>\n",
 450 |        "      <td>4</td>\n",
 451 |        "      <td>0.004529</td>\n",
 452 |        "      <td>None</td>\n",
 453 |        "      <td>02:30</td>\n",
 454 |        "    </tr>\n",
 455 |        "    <tr>\n",
 456 |        "      <td>5</td>\n",
 457 |        "      <td>0.004477</td>\n",
 458 |        "      <td>None</td>\n",
 459 |        "      <td>02:30</td>\n",
 460 |        "    </tr>\n",
 461 |        "    <tr>\n",
 462 |        "      <td>6</td>\n",
 463 |        "      <td>0.004304</td>\n",
 464 |        "      <td>None</td>\n",
 465 |        "      <td>02:30</td>\n",
 466 |        "    </tr>\n",
 467 |        "    <tr>\n",
 468 |        "      <td>7</td>\n",
 469 |        "      <td>0.004278</td>\n",
 470 |        "      <td>None</td>\n",
 471 |        "      <td>02:30</td>\n",
 472 |        "    </tr>\n",
 473 |        "    <tr>\n",
 474 |        "      <td>8</td>\n",
 475 |        "      <td>0.004193</td>\n",
 476 |        "      <td>None</td>\n",
 477 |        "      <td>02:30</td>\n",
 478 |        "    </tr>\n",
 479 |        "    <tr>\n",
 480 |        "      <td>9</td>\n",
 481 |        "      <td>0.004143</td>\n",
 482 |        "      <td>None</td>\n",
 483 |        "      <td>02:30</td>\n",
 484 |        "    </tr>\n",
 485 |        "    <tr>\n",
 486 |        "      <td>10</td>\n",
 487 |        "      <td>0.004176</td>\n",
 488 |        "      <td>None</td>\n",
 489 |        "      <td>02:30</td>\n",
 490 |        "    </tr>\n",
 491 |        "    <tr>\n",
 492 |        "      <td>11</td>\n",
 493 |        "      <td>0.004125</td>\n",
 494 |        "      <td>None</td>\n",
 495 |        "      <td>02:30</td>\n",
 496 |        "    </tr>\n",
 497 |        "    <tr>\n",
 498 |        "      <td>12</td>\n",
 499 |        "      <td>0.003944</td>\n",
 500 |        "      <td>None</td>\n",
 501 |        "      <td>02:30</td>\n",
 502 |        "    </tr>\n",
 503 |        "    <tr>\n",
 504 |        "      <td>13</td>\n",
 505 |        "      <td>0.003806</td>\n",
 506 |        "      <td>None</td>\n",
 507 |        "      <td>02:30</td>\n",
 508 |        "    </tr>\n",
 509 |        "    <tr>\n",
 510 |        "      <td>14</td>\n",
 511 |        "      <td>0.003859</td>\n",
 512 |        "      <td>None</td>\n",
 513 |        "      <td>02:30</td>\n",
 514 |        "    </tr>\n",
 515 |        "  </tbody>\n",
 516 |        "</table>"
 517 |       ],
 518 |       "text/plain": [
 519 |        "<IPython.core.display.HTML object>"
 520 |       ]
 521 |      },
 522 |      "metadata": {},
 523 |      "output_type": "display_data"
 524 |     },
 525 |     {
 526 |      "data": {
 527 |       "text/html": [
 528 |        "<table border=\"1\" class=\"dataframe\">\n",
 529 |        "  <thead>\n",
 530 |        "    <tr style=\"text-align: left;\">\n",
 531 |        "      <th>epoch</th>\n",
 532 |        "      <th>train_loss</th>\n",
 533 |        "      <th>valid_loss</th>\n",
 534 |        "      <th>time</th>\n",
 535 |        "    </tr>\n",
 536 |        "  </thead>\n",
 537 |        "  <tbody>\n",
 538 |        "    <tr>\n",
 539 |        "      <td>0</td>\n",
 540 |        "      <td>0.017128</td>\n",
 541 |        "      <td>None</td>\n",
 542 |        "      <td>02:30</td>\n",
 543 |        "    </tr>\n",
 544 |        "    <tr>\n",
 545 |        "      <td>1</td>\n",
 546 |        "      <td>0.005302</td>\n",
 547 |        "      <td>None</td>\n",
 548 |        "      <td>02:30</td>\n",
 549 |        "    </tr>\n",
 550 |        "    <tr>\n",
 551 |        "      <td>2</td>\n",
 552 |        "      <td>0.004838</td>\n",
 553 |        "      <td>None</td>\n",
 554 |        "      <td>02:30</td>\n",
 555 |        "    </tr>\n",
 556 |        "    <tr>\n",
 557 |        "      <td>3</td>\n",
 558 |        "      <td>0.004739</td>\n",
 559 |        "      <td>None</td>\n",
 560 |        "      <td>02:30</td>\n",
 561 |        "    </tr>\n",
 562 |        "    <tr>\n",
 563 |        "      <td>4</td>\n",
 564 |        "      <td>0.004560</td>\n",
 565 |        "      <td>None</td>\n",
 566 |        "      <td>02:30</td>\n",
 567 |        "    </tr>\n",
 568 |        "    <tr>\n",
 569 |        "      <td>5</td>\n",
 570 |        "      <td>0.004536</td>\n",
 571 |        "      <td>None</td>\n",
 572 |        "      <td>02:30</td>\n",
 573 |        "    </tr>\n",
 574 |        "    <tr>\n",
 575 |        "      <td>6</td>\n",
 576 |        "      <td>0.004400</td>\n",
 577 |        "      <td>None</td>\n",
 578 |        "      <td>02:30</td>\n",
 579 |        "    </tr>\n",
 580 |        "    <tr>\n",
 581 |        "      <td>7</td>\n",
 582 |        "      <td>0.004351</td>\n",
 583 |        "      <td>None</td>\n",
 584 |        "      <td>02:30</td>\n",
 585 |        "    </tr>\n",
 586 |        "    <tr>\n",
 587 |        "      <td>8</td>\n",
 588 |        "      <td>0.004241</td>\n",
 589 |        "      <td>None</td>\n",
 590 |        "      <td>02:30</td>\n",
 591 |        "    </tr>\n",
 592 |        "    <tr>\n",
 593 |        "      <td>9</td>\n",
 594 |        "      <td>0.004143</td>\n",
 595 |        "      <td>None</td>\n",
 596 |        "      <td>02:30</td>\n",
 597 |        "    </tr>\n",
 598 |        "    <tr>\n",
 599 |        "      <td>10</td>\n",
 600 |        "      <td>0.004150</td>\n",
 601 |        "      <td>None</td>\n",
 602 |        "      <td>02:30</td>\n",
 603 |        "    </tr>\n",
 604 |        "    <tr>\n",
 605 |        "      <td>11</td>\n",
 606 |        "      <td>0.004077</td>\n",
 607 |        "      <td>None</td>\n",
 608 |        "      <td>02:30</td>\n",
 609 |        "    </tr>\n",
 610 |        "    <tr>\n",
 611 |        "      <td>12</td>\n",
 612 |        "      <td>0.004096</td>\n",
 613 |        "      <td>None</td>\n",
 614 |        "      <td>02:30</td>\n",
 615 |        "    </tr>\n",
 616 |        "    <tr>\n",
 617 |        "      <td>13</td>\n",
 618 |        "      <td>0.003935</td>\n",
 619 |        "      <td>None</td>\n",
 620 |        "      <td>02:30</td>\n",
 621 |        "    </tr>\n",
 622 |        "    <tr>\n",
 623 |        "      <td>14</td>\n",
 624 |        "      <td>0.003805</td>\n",
 625 |        "      <td>None</td>\n",
 626 |        "      <td>02:30</td>\n",
 627 |        "    </tr>\n",
 628 |        "  </tbody>\n",
 629 |        "</table>"
 630 |       ],
 631 |       "text/plain": [
 632 |        "<IPython.core.display.HTML object>"
 633 |       ]
 634 |      },
 635 |      "metadata": {},
 636 |      "output_type": "display_data"
 637 |     }
 638 |    ],
 639 |    "source": [
 640 |     "for run in range(runs):\n",
 641 |     "    learn = unet_learner(dbunch, model, pretrained=False, opt_func=opt_func, metrics=[], loss_func=MSELoss())\n",
 642 |     "\n",
 643 |     "    if fp16: learn = learn.to_fp16()\n",
 644 |     "    cbs = []\n",
 645 |     "    learn.fit_flat_cos(epochs, lr, wd=1e-2, cbs=cbs)\n",
 646 |     "\n",
 647 |     "    #Save model backbone\n",
 648 |     "    torch.save(learn.model[0].state_dict(), 'all_train_unsup_val_pretext_{}.pth'.format(run))\n",
 649 |     "    \n",
 650 |     "    del learn\n",
 651 |     "    torch.cuda.empty_cache() \n",
 652 |     "    gc.collect()    "
 653 |    ]
 654 |   },
 655 |   {
 656 |    "cell_type": "markdown",
 657 |    "metadata": {},
 658 |    "source": [
 659 |     "## Train with all data in `/train` and `/unsup`"
 660 |    ]
 661 |   },
 662 |   {
 663 |    "cell_type": "code",
 664 |    "execution_count": 9,
 665 |    "metadata": {},
 666 |    "outputs": [
 667 |     {
 668 |      "name": "stdout",
 669 |      "output_type": "stream",
 670 |      "text": [
 671 |       "Training Size: 22419\n",
 672 |       "Validation Size: 0\n"
 673 |      ]
 674 |     }
 675 |    ],
 676 |    "source": [
 677 |     "dblock = DataBlock(blocks=(ImageBlock(cls=PILImageInput), ImageBlock),\n",
 678 |     "                   splitter=RandomSplitter(valid_pct=0),\n",
 679 |     "                   get_items=get_train_and_unsup, \n",
 680 |     "                   get_y=lambda o: o,\n",
 681 |     "                   item_tfms=item_tfms, \n",
 682 |     "                   batch_tfms=batch_tfms)\n",
 683 |     "\n",
 684 |     "dbunch =  dblock.dataloaders(source, path=source, bs=bs)\n",
 685 |     "\n",
 686 |     "#CHANGE: We're predicting pixel values, so we're just going to predict an output for each RGB channel\n",
 687 |     "dbunch.vocab = ['R', 'G', 'B']\n",
 688 |     "\n",
 689 |     "print(\"Training Size:\", len(dbunch.train_ds))\n",
 690 |     "print(\"Validation Size:\", len(dbunch.valid_ds))"
 691 |    ]
 692 |   },
 693 |   {
 694 |    "cell_type": "code",
 695 |    "execution_count": 10,
 696 |    "metadata": {},
 697 |    "outputs": [
 698 |     {
 699 |      "data": {
 700 |       "text/html": [
 701 |        "<table border=\"1\" class=\"dataframe\">\n",
 702 |        "  <thead>\n",
 703 |        "    <tr style=\"text-align: left;\">\n",
 704 |        "      <th>epoch</th>\n",
 705 |        "      <th>train_loss</th>\n",
 706 |        "      <th>valid_loss</th>\n",
 707 |        "      <th>time</th>\n",
 708 |        "    </tr>\n",
 709 |        "  </thead>\n",
 710 |        "  <tbody>\n",
 711 |        "    <tr>\n",
 712 |        "      <td>0</td>\n",
 713 |        "      <td>0.039221</td>\n",
 714 |        "      <td>None</td>\n",
 715 |        "      <td>02:08</td>\n",
 716 |        "    </tr>\n",
 717 |        "    <tr>\n",
 718 |        "      <td>1</td>\n",
 719 |        "      <td>0.005747</td>\n",
 720 |        "      <td>None</td>\n",
 721 |        "      <td>02:08</td>\n",
 722 |        "    </tr>\n",
 723 |        "    <tr>\n",
 724 |        "      <td>2</td>\n",
 725 |        "      <td>0.005353</td>\n",
 726 |        "      <td>None</td>\n",
 727 |        "      <td>02:08</td>\n",
 728 |        "    </tr>\n",
 729 |        "    <tr>\n",
 730 |        "      <td>3</td>\n",
 731 |        "      <td>0.005068</td>\n",
 732 |        "      <td>None</td>\n",
 733 |        "      <td>02:08</td>\n",
 734 |        "    </tr>\n",
 735 |        "    <tr>\n",
 736 |        "      <td>4</td>\n",
 737 |        "      <td>0.004822</td>\n",
 738 |        "      <td>None</td>\n",
 739 |        "      <td>02:08</td>\n",
 740 |        "    </tr>\n",
 741 |        "    <tr>\n",
 742 |        "      <td>5</td>\n",
 743 |        "      <td>0.004581</td>\n",
 744 |        "      <td>None</td>\n",
 745 |        "      <td>02:08</td>\n",
 746 |        "    </tr>\n",
 747 |        "    <tr>\n",
 748 |        "      <td>6</td>\n",
 749 |        "      <td>0.004599</td>\n",
 750 |        "      <td>None</td>\n",
 751 |        "      <td>02:08</td>\n",
 752 |        "    </tr>\n",
 753 |        "    <tr>\n",
 754 |        "      <td>7</td>\n",
 755 |        "      <td>0.004477</td>\n",
 756 |        "      <td>None</td>\n",
 757 |        "      <td>02:08</td>\n",
 758 |        "    </tr>\n",
 759 |        "    <tr>\n",
 760 |        "      <td>8</td>\n",
 761 |        "      <td>0.004373</td>\n",
 762 |        "      <td>None</td>\n",
 763 |        "      <td>02:08</td>\n",
 764 |        "    </tr>\n",
 765 |        "    <tr>\n",
 766 |        "      <td>9</td>\n",
 767 |        "      <td>0.004322</td>\n",
 768 |        "      <td>None</td>\n",
 769 |        "      <td>02:08</td>\n",
 770 |        "    </tr>\n",
 771 |        "    <tr>\n",
 772 |        "      <td>10</td>\n",
 773 |        "      <td>0.004392</td>\n",
 774 |        "      <td>None</td>\n",
 775 |        "      <td>02:08</td>\n",
 776 |        "    </tr>\n",
 777 |        "    <tr>\n",
 778 |        "      <td>11</td>\n",
 779 |        "      <td>0.004314</td>\n",
 780 |        "      <td>None</td>\n",
 781 |        "      <td>02:08</td>\n",
 782 |        "    </tr>\n",
 783 |        "    <tr>\n",
 784 |        "      <td>12</td>\n",
 785 |        "      <td>0.004105</td>\n",
 786 |        "      <td>None</td>\n",
 787 |        "      <td>02:08</td>\n",
 788 |        "    </tr>\n",
 789 |        "    <tr>\n",
 790 |        "      <td>13</td>\n",
 791 |        "      <td>0.003903</td>\n",
 792 |        "      <td>None</td>\n",
 793 |        "      <td>02:08</td>\n",
 794 |        "    </tr>\n",
 795 |        "    <tr>\n",
 796 |        "      <td>14</td>\n",
 797 |        "      <td>0.003880</td>\n",
 798 |        "      <td>None</td>\n",
 799 |        "      <td>02:08</td>\n",
 800 |        "    </tr>\n",
 801 |        "  </tbody>\n",
 802 |        "</table>"
 803 |       ],
 804 |       "text/plain": [
 805 |        "<IPython.core.display.HTML object>"
 806 |       ]
 807 |      },
 808 |      "metadata": {},
 809 |      "output_type": "display_data"
 810 |     },
 811 |     {
 812 |      "data": {
 813 |       "text/html": [
 814 |        "<table border=\"1\" class=\"dataframe\">\n",
 815 |        "  <thead>\n",
 816 |        "    <tr style=\"text-align: left;\">\n",
 817 |        "      <th>epoch</th>\n",
 818 |        "      <th>train_loss</th>\n",
 819 |        "      <th>valid_loss</th>\n",
 820 |        "      <th>time</th>\n",
 821 |        "    </tr>\n",
 822 |        "  </thead>\n",
 823 |        "  <tbody>\n",
 824 |        "    <tr>\n",
 825 |        "      <td>0</td>\n",
 826 |        "      <td>0.038902</td>\n",
 827 |        "      <td>None</td>\n",
 828 |        "      <td>02:08</td>\n",
 829 |        "    </tr>\n",
 830 |        "    <tr>\n",
 831 |        "      <td>1</td>\n",
 832 |        "      <td>0.005771</td>\n",
 833 |        "      <td>None</td>\n",
 834 |        "      <td>02:08</td>\n",
 835 |        "    </tr>\n",
 836 |        "    <tr>\n",
 837 |        "      <td>2</td>\n",
 838 |        "      <td>0.005489</td>\n",
 839 |        "      <td>None</td>\n",
 840 |        "      <td>02:08</td>\n",
 841 |        "    </tr>\n",
 842 |        "    <tr>\n",
 843 |        "      <td>3</td>\n",
 844 |        "      <td>0.005071</td>\n",
 845 |        "      <td>None</td>\n",
 846 |        "      <td>02:08</td>\n",
 847 |        "    </tr>\n",
 848 |        "    <tr>\n",
 849 |        "      <td>4</td>\n",
 850 |        "      <td>0.004872</td>\n",
 851 |        "      <td>None</td>\n",
 852 |        "      <td>02:08</td>\n",
 853 |        "    </tr>\n",
 854 |        "    <tr>\n",
 855 |        "      <td>5</td>\n",
 856 |        "      <td>0.004596</td>\n",
 857 |        "      <td>None</td>\n",
 858 |        "      <td>02:08</td>\n",
 859 |        "    </tr>\n",
 860 |        "    <tr>\n",
 861 |        "      <td>6</td>\n",
 862 |        "      <td>0.004538</td>\n",
 863 |        "      <td>None</td>\n",
 864 |        "      <td>02:08</td>\n",
 865 |        "    </tr>\n",
 866 |        "    <tr>\n",
 867 |        "      <td>7</td>\n",
 868 |        "      <td>0.004442</td>\n",
 869 |        "      <td>None</td>\n",
 870 |        "      <td>02:08</td>\n",
 871 |        "    </tr>\n",
 872 |        "    <tr>\n",
 873 |        "      <td>8</td>\n",
 874 |        "      <td>0.004372</td>\n",
 875 |        "      <td>None</td>\n",
 876 |        "      <td>02:08</td>\n",
 877 |        "    </tr>\n",
 878 |        "    <tr>\n",
 879 |        "      <td>9</td>\n",
 880 |        "      <td>0.004342</td>\n",
 881 |        "      <td>None</td>\n",
 882 |        "      <td>02:08</td>\n",
 883 |        "    </tr>\n",
 884 |        "    <tr>\n",
 885 |        "      <td>10</td>\n",
 886 |        "      <td>0.004376</td>\n",
 887 |        "      <td>None</td>\n",
 888 |        "      <td>02:08</td>\n",
 889 |        "    </tr>\n",
 890 |        "    <tr>\n",
 891 |        "      <td>11</td>\n",
 892 |        "      <td>0.004244</td>\n",
 893 |        "      <td>None</td>\n",
 894 |        "      <td>02:08</td>\n",
 895 |        "    </tr>\n",
 896 |        "    <tr>\n",
 897 |        "      <td>12</td>\n",
 898 |        "      <td>0.004197</td>\n",
 899 |        "      <td>None</td>\n",
 900 |        "      <td>02:08</td>\n",
 901 |        "    </tr>\n",
 902 |        "    <tr>\n",
 903 |        "      <td>13</td>\n",
 904 |        "      <td>0.003948</td>\n",
 905 |        "      <td>None</td>\n",
 906 |        "      <td>02:08</td>\n",
 907 |        "    </tr>\n",
 908 |        "    <tr>\n",
 909 |        "      <td>14</td>\n",
 910 |        "      <td>0.003870</td>\n",
 911 |        "      <td>None</td>\n",
 912 |        "      <td>02:08</td>\n",
 913 |        "    </tr>\n",
 914 |        "  </tbody>\n",
 915 |        "</table>"
 916 |       ],
 917 |       "text/plain": [
 918 |        "<IPython.core.display.HTML object>"
 919 |       ]
 920 |      },
 921 |      "metadata": {},
 922 |      "output_type": "display_data"
 923 |     },
 924 |     {
 925 |      "data": {
 926 |       "text/html": [
 927 |        "<table border=\"1\" class=\"dataframe\">\n",
 928 |        "  <thead>\n",
 929 |        "    <tr style=\"text-align: left;\">\n",
 930 |        "      <th>epoch</th>\n",
 931 |        "      <th>train_loss</th>\n",
 932 |        "      <th>valid_loss</th>\n",
 933 |        "      <th>time</th>\n",
 934 |        "    </tr>\n",
 935 |        "  </thead>\n",
 936 |        "  <tbody>\n",
 937 |        "    <tr>\n",
 938 |        "      <td>0</td>\n",
 939 |        "      <td>0.039105</td>\n",
 940 |        "      <td>None</td>\n",
 941 |        "      <td>02:08</td>\n",
 942 |        "    </tr>\n",
 943 |        "    <tr>\n",
 944 |        "      <td>1</td>\n",
 945 |        "      <td>0.005674</td>\n",
 946 |        "      <td>None</td>\n",
 947 |        "      <td>02:08</td>\n",
 948 |        "    </tr>\n",
 949 |        "    <tr>\n",
 950 |        "      <td>2</td>\n",
 951 |        "      <td>0.005298</td>\n",
 952 |        "      <td>None</td>\n",
 953 |        "      <td>02:08</td>\n",
 954 |        "    </tr>\n",
 955 |        "    <tr>\n",
 956 |        "      <td>3</td>\n",
 957 |        "      <td>0.004939</td>\n",
 958 |        "      <td>None</td>\n",
 959 |        "      <td>02:08</td>\n",
 960 |        "    </tr>\n",
 961 |        "    <tr>\n",
 962 |        "      <td>4</td>\n",
 963 |        "      <td>0.004763</td>\n",
 964 |        "      <td>None</td>\n",
 965 |        "      <td>02:08</td>\n",
 966 |        "    </tr>\n",
 967 |        "    <tr>\n",
 968 |        "      <td>5</td>\n",
 969 |        "      <td>0.004596</td>\n",
 970 |        "      <td>None</td>\n",
 971 |        "      <td>02:08</td>\n",
 972 |        "    </tr>\n",
 973 |        "    <tr>\n",
 974 |        "      <td>6</td>\n",
 975 |        "      <td>0.004536</td>\n",
 976 |        "      <td>None</td>\n",
 977 |        "      <td>02:08</td>\n",
 978 |        "    </tr>\n",
 979 |        "    <tr>\n",
 980 |        "      <td>7</td>\n",
 981 |        "      <td>0.004641</td>\n",
 982 |        "      <td>None</td>\n",
 983 |        "      <td>02:08</td>\n",
 984 |        "    </tr>\n",
 985 |        "    <tr>\n",
 986 |        "      <td>8</td>\n",
 987 |        "      <td>0.004362</td>\n",
 988 |        "      <td>None</td>\n",
 989 |        "      <td>02:08</td>\n",
 990 |        "    </tr>\n",
 991 |        "    <tr>\n",
 992 |        "      <td>9</td>\n",
 993 |        "      <td>0.004354</td>\n",
 994 |        "      <td>None</td>\n",
 995 |        "      <td>02:08</td>\n",
 996 |        "    </tr>\n",
 997 |        "    <tr>\n",
 998 |        "      <td>10</td>\n",
 999 |        "      <td>0.004228</td>\n",
1000 |        "      <td>None</td>\n",
1001 |        "      <td>02:08</td>\n",
1002 |        "    </tr>\n",
1003 |        "    <tr>\n",
1004 |        "      <td>11</td>\n",
1005 |        "      <td>0.004231</td>\n",
1006 |        "      <td>None</td>\n",
1007 |        "      <td>02:08</td>\n",
1008 |        "    </tr>\n",
1009 |        "    <tr>\n",
1010 |        "      <td>12</td>\n",
1011 |        "      <td>0.004023</td>\n",
1012 |        "      <td>None</td>\n",
1013 |        "      <td>02:08</td>\n",
1014 |        "    </tr>\n",
1015 |        "    <tr>\n",
1016 |        "      <td>13</td>\n",
1017 |        "      <td>0.004008</td>\n",
1018 |        "      <td>None</td>\n",
1019 |        "      <td>02:08</td>\n",
1020 |        "    </tr>\n",
1021 |        "    <tr>\n",
1022 |        "      <td>14</td>\n",
1023 |        "      <td>0.003962</td>\n",
1024 |        "      <td>None</td>\n",
1025 |        "      <td>02:08</td>\n",
1026 |        "    </tr>\n",
1027 |        "  </tbody>\n",
1028 |        "</table>"
1029 |       ],
1030 |       "text/plain": [
1031 |        "<IPython.core.display.HTML object>"
1032 |       ]
1033 |      },
1034 |      "metadata": {},
1035 |      "output_type": "display_data"
1036 |     }
1037 |    ],
1038 |    "source": [
1039 |     "for run in range(runs):\n",
1040 |     "    learn = unet_learner(dbunch, model, pretrained=False, opt_func=opt_func, metrics=[], loss_func=MSELoss())\n",
1041 |     "\n",
1042 |     "    if fp16: learn = learn.to_fp16()\n",
1043 |     "    cbs = []\n",
1044 |     "    learn.fit_flat_cos(epochs, lr, wd=1e-2, cbs=cbs)\n",
1045 |     "\n",
1046 |     "    #Save model backbone\n",
1047 |     "    torch.save(learn.model[0].state_dict(), 'all_train_unsup_pretext_{}.pth'.format(run))\n",
1048 |     "    \n",
1049 |     "    del learn\n",
1050 |     "    torch.cuda.empty_cache() \n",
1051 |     "    gc.collect()    "
1052 |    ]
1053 |   },
1054 |   {
1055 |    "cell_type": "markdown",
1056 |    "metadata": {},
1057 |    "source": [
1058 |     "## Train with all data in `/train`"
1059 |    ]
1060 |   },
1061 |   {
1062 |    "cell_type": "code",
1063 |    "execution_count": 11,
1064 |    "metadata": {},
1065 |    "outputs": [
1066 |     {
1067 |      "name": "stdout",
1068 |      "output_type": "stream",
1069 |      "text": [
1070 |       "Training Size: 14669\n",
1071 |       "Validation Size: 0\n"
1072 |      ]
1073 |     }
1074 |    ],
1075 |    "source": [
1076 |     "dblock = DataBlock(blocks=(ImageBlock(cls=PILImageInput), ImageBlock),\n",
1077 |     "                   splitter=RandomSplitter(valid_pct=0),\n",
1078 |     "                   get_items=get_train_items, \n",
1079 |     "                   get_y=lambda o: o,\n",
1080 |     "                   item_tfms=item_tfms, \n",
1081 |     "                   batch_tfms=batch_tfms)\n",
1082 |     "\n",
1083 |     "dbunch =  dblock.dataloaders(source, path=source, bs=bs)\n",
1084 |     "\n",
1085 |     "#CHANGE: We're predicting pixel values, so we're just going to predict an output for each RGB channel\n",
1086 |     "dbunch.vocab = ['R', 'G', 'B']\n",
1087 |     "\n",
1088 |     "print(\"Training Size:\", len(dbunch.train_ds))\n",
1089 |     "print(\"Validation Size:\", len(dbunch.valid_ds))"
1090 |    ]
1091 |   },
1092 |   {
1093 |    "cell_type": "code",
1094 |    "execution_count": 12,
1095 |    "metadata": {},
1096 |    "outputs": [
1097 |     {
1098 |      "data": {
1099 |       "text/html": [
1100 |        "<table border=\"1\" class=\"dataframe\">\n",
1101 |        "  <thead>\n",
1102 |        "    <tr style=\"text-align: left;\">\n",
1103 |        "      <th>epoch</th>\n",
1104 |        "      <th>train_loss</th>\n",
1105 |        "      <th>valid_loss</th>\n",
1106 |        "      <th>time</th>\n",
1107 |        "    </tr>\n",
1108 |        "  </thead>\n",
1109 |        "  <tbody>\n",
1110 |        "    <tr>\n",
1111 |        "      <td>0</td>\n",
1112 |        "      <td>0.185480</td>\n",
1113 |        "      <td>None</td>\n",
1114 |        "      <td>01:24</td>\n",
1115 |        "    </tr>\n",
1116 |        "    <tr>\n",
1117 |        "      <td>1</td>\n",
1118 |        "      <td>0.010443</td>\n",
1119 |        "      <td>None</td>\n",
1120 |        "      <td>01:24</td>\n",
1121 |        "    </tr>\n",
1122 |        "    <tr>\n",
1123 |        "      <td>2</td>\n",
1124 |        "      <td>0.005977</td>\n",
1125 |        "      <td>None</td>\n",
1126 |        "      <td>01:24</td>\n",
1127 |        "    </tr>\n",
1128 |        "    <tr>\n",
1129 |        "      <td>3</td>\n",
1130 |        "      <td>0.006075</td>\n",
1131 |        "      <td>None</td>\n",
1132 |        "      <td>01:24</td>\n",
1133 |        "    </tr>\n",
1134 |        "    <tr>\n",
1135 |        "      <td>4</td>\n",
1136 |        "      <td>0.005620</td>\n",
1137 |        "      <td>None</td>\n",
1138 |        "      <td>01:24</td>\n",
1139 |        "    </tr>\n",
1140 |        "    <tr>\n",
1141 |        "      <td>5</td>\n",
1142 |        "      <td>0.005190</td>\n",
1143 |        "      <td>None</td>\n",
1144 |        "      <td>01:24</td>\n",
1145 |        "    </tr>\n",
1146 |        "    <tr>\n",
1147 |        "      <td>6</td>\n",
1148 |        "      <td>0.005272</td>\n",
1149 |        "      <td>None</td>\n",
1150 |        "      <td>01:24</td>\n",
1151 |        "    </tr>\n",
1152 |        "    <tr>\n",
1153 |        "      <td>7</td>\n",
1154 |        "      <td>0.005040</td>\n",
1155 |        "      <td>None</td>\n",
1156 |        "      <td>01:24</td>\n",
1157 |        "    </tr>\n",
1158 |        "    <tr>\n",
1159 |        "      <td>8</td>\n",
1160 |        "      <td>0.004982</td>\n",
1161 |        "      <td>None</td>\n",
1162 |        "      <td>01:24</td>\n",
1163 |        "    </tr>\n",
1164 |        "    <tr>\n",
1165 |        "      <td>9</td>\n",
1166 |        "      <td>0.004757</td>\n",
1167 |        "      <td>None</td>\n",
1168 |        "      <td>01:24</td>\n",
1169 |        "    </tr>\n",
1170 |        "    <tr>\n",
1171 |        "      <td>10</td>\n",
1172 |        "      <td>0.004697</td>\n",
1173 |        "      <td>None</td>\n",
1174 |        "      <td>01:24</td>\n",
1175 |        "    </tr>\n",
1176 |        "    <tr>\n",
1177 |        "      <td>11</td>\n",
1178 |        "      <td>0.004739</td>\n",
1179 |        "      <td>None</td>\n",
1180 |        "      <td>01:24</td>\n",
1181 |        "    </tr>\n",
1182 |        "    <tr>\n",
1183 |        "      <td>12</td>\n",
1184 |        "      <td>0.004572</td>\n",
1185 |        "      <td>None</td>\n",
1186 |        "      <td>01:24</td>\n",
1187 |        "    </tr>\n",
1188 |        "    <tr>\n",
1189 |        "      <td>13</td>\n",
1190 |        "      <td>0.004483</td>\n",
1191 |        "      <td>None</td>\n",
1192 |        "      <td>01:24</td>\n",
1193 |        "    </tr>\n",
1194 |        "    <tr>\n",
1195 |        "      <td>14</td>\n",
1196 |        "      <td>0.004370</td>\n",
1197 |        "      <td>None</td>\n",
1198 |        "      <td>01:24</td>\n",
1199 |        "    </tr>\n",
1200 |        "  </tbody>\n",
1201 |        "</table>"
1202 |       ],
1203 |       "text/plain": [
1204 |        "<IPython.core.display.HTML object>"
1205 |       ]
1206 |      },
1207 |      "metadata": {},
1208 |      "output_type": "display_data"
1209 |     },
1210 |     {
1211 |      "data": {
1212 |       "text/html": [
1213 |        "<table border=\"1\" class=\"dataframe\">\n",
1214 |        "  <thead>\n",
1215 |        "    <tr style=\"text-align: left;\">\n",
1216 |        "      <th>epoch</th>\n",
1217 |        "      <th>train_loss</th>\n",
1218 |        "      <th>valid_loss</th>\n",
1219 |        "      <th>time</th>\n",
1220 |        "    </tr>\n",
1221 |        "  </thead>\n",
1222 |        "  <tbody>\n",
1223 |        "    <tr>\n",
1224 |        "      <td>0</td>\n",
1225 |        "      <td>0.184486</td>\n",
1226 |        "      <td>None</td>\n",
1227 |        "      <td>01:24</td>\n",
1228 |        "    </tr>\n",
1229 |        "    <tr>\n",
1230 |        "      <td>1</td>\n",
1231 |        "      <td>0.010486</td>\n",
1232 |        "      <td>None</td>\n",
1233 |        "      <td>01:24</td>\n",
1234 |        "    </tr>\n",
1235 |        "    <tr>\n",
1236 |        "      <td>2</td>\n",
1237 |        "      <td>0.006268</td>\n",
1238 |        "      <td>None</td>\n",
1239 |        "      <td>01:24</td>\n",
1240 |        "    </tr>\n",
1241 |        "    <tr>\n",
1242 |        "      <td>3</td>\n",
1243 |        "      <td>0.005693</td>\n",
1244 |        "      <td>None</td>\n",
1245 |        "      <td>01:24</td>\n",
1246 |        "    </tr>\n",
1247 |        "    <tr>\n",
1248 |        "      <td>4</td>\n",
1249 |        "      <td>0.005413</td>\n",
1250 |        "      <td>None</td>\n",
1251 |        "      <td>01:24</td>\n",
1252 |        "    </tr>\n",
1253 |        "    <tr>\n",
1254 |        "      <td>5</td>\n",
1255 |        "      <td>0.005430</td>\n",
1256 |        "      <td>None</td>\n",
1257 |        "      <td>01:24</td>\n",
1258 |        "    </tr>\n",
1259 |        "    <tr>\n",
1260 |        "      <td>6</td>\n",
1261 |        "      <td>0.005210</td>\n",
1262 |        "      <td>None</td>\n",
1263 |        "      <td>01:24</td>\n",
1264 |        "    </tr>\n",
1265 |        "    <tr>\n",
1266 |        "      <td>7</td>\n",
1267 |        "      <td>0.005036</td>\n",
1268 |        "      <td>None</td>\n",
1269 |        "      <td>01:24</td>\n",
1270 |        "    </tr>\n",
1271 |        "    <tr>\n",
1272 |        "      <td>8</td>\n",
1273 |        "      <td>0.005011</td>\n",
1274 |        "      <td>None</td>\n",
1275 |        "      <td>01:24</td>\n",
1276 |        "    </tr>\n",
1277 |        "    <tr>\n",
1278 |        "      <td>9</td>\n",
1279 |        "      <td>0.004929</td>\n",
1280 |        "      <td>None</td>\n",
1281 |        "      <td>01:24</td>\n",
1282 |        "    </tr>\n",
1283 |        "    <tr>\n",
1284 |        "      <td>10</td>\n",
1285 |        "      <td>0.004888</td>\n",
1286 |        "      <td>None</td>\n",
1287 |        "      <td>01:24</td>\n",
1288 |        "    </tr>\n",
1289 |        "    <tr>\n",
1290 |        "      <td>11</td>\n",
1291 |        "      <td>0.004755</td>\n",
1292 |        "      <td>None</td>\n",
1293 |        "      <td>01:24</td>\n",
1294 |        "    </tr>\n",
1295 |        "    <tr>\n",
1296 |        "      <td>12</td>\n",
1297 |        "      <td>0.004522</td>\n",
1298 |        "      <td>None</td>\n",
1299 |        "      <td>01:24</td>\n",
1300 |        "    </tr>\n",
1301 |        "    <tr>\n",
1302 |        "      <td>13</td>\n",
1303 |        "      <td>0.004333</td>\n",
1304 |        "      <td>None</td>\n",
1305 |        "      <td>01:24</td>\n",
1306 |        "    </tr>\n",
1307 |        "    <tr>\n",
1308 |        "      <td>14</td>\n",
1309 |        "      <td>0.004323</td>\n",
1310 |        "      <td>None</td>\n",
1311 |        "      <td>01:24</td>\n",
1312 |        "    </tr>\n",
1313 |        "  </tbody>\n",
1314 |        "</table>"
1315 |       ],
1316 |       "text/plain": [
1317 |        "<IPython.core.display.HTML object>"
1318 |       ]
1319 |      },
1320 |      "metadata": {},
1321 |      "output_type": "display_data"
1322 |     },
1323 |     {
1324 |      "data": {
1325 |       "text/html": [
1326 |        "<table border=\"1\" class=\"dataframe\">\n",
1327 |        "  <thead>\n",
1328 |        "    <tr style=\"text-align: left;\">\n",
1329 |        "      <th>epoch</th>\n",
1330 |        "      <th>train_loss</th>\n",
1331 |        "      <th>valid_loss</th>\n",
1332 |        "      <th>time</th>\n",
1333 |        "    </tr>\n",
1334 |        "  </thead>\n",
1335 |        "  <tbody>\n",
1336 |        "    <tr>\n",
1337 |        "      <td>0</td>\n",
1338 |        "      <td>0.184661</td>\n",
1339 |        "      <td>None</td>\n",
1340 |        "      <td>01:24</td>\n",
1341 |        "    </tr>\n",
1342 |        "    <tr>\n",
1343 |        "      <td>1</td>\n",
1344 |        "      <td>0.010222</td>\n",
1345 |        "      <td>None</td>\n",
1346 |        "      <td>01:24</td>\n",
1347 |        "    </tr>\n",
1348 |        "    <tr>\n",
1349 |        "      <td>2</td>\n",
1350 |        "      <td>0.006018</td>\n",
1351 |        "      <td>None</td>\n",
1352 |        "      <td>01:24</td>\n",
1353 |        "    </tr>\n",
1354 |        "    <tr>\n",
1355 |        "      <td>3</td>\n",
1356 |        "      <td>0.005746</td>\n",
1357 |        "      <td>None</td>\n",
1358 |        "      <td>01:24</td>\n",
1359 |        "    </tr>\n",
1360 |        "    <tr>\n",
1361 |        "      <td>4</td>\n",
1362 |        "      <td>0.005596</td>\n",
1363 |        "      <td>None</td>\n",
1364 |        "      <td>01:24</td>\n",
1365 |        "    </tr>\n",
1366 |        "    <tr>\n",
1367 |        "      <td>5</td>\n",
1368 |        "      <td>0.005327</td>\n",
1369 |        "      <td>None</td>\n",
1370 |        "      <td>01:24</td>\n",
1371 |        "    </tr>\n",
1372 |        "    <tr>\n",
1373 |        "      <td>6</td>\n",
1374 |        "      <td>0.005002</td>\n",
1375 |        "      <td>None</td>\n",
1376 |        "      <td>01:24</td>\n",
1377 |        "    </tr>\n",
1378 |        "    <tr>\n",
1379 |        "      <td>7</td>\n",
1380 |        "      <td>0.004956</td>\n",
1381 |        "      <td>None</td>\n",
1382 |        "      <td>01:24</td>\n",
1383 |        "    </tr>\n",
1384 |        "    <tr>\n",
1385 |        "      <td>8</td>\n",
1386 |        "      <td>0.004934</td>\n",
1387 |        "      <td>None</td>\n",
1388 |        "      <td>01:24</td>\n",
1389 |        "    </tr>\n",
1390 |        "    <tr>\n",
1391 |        "      <td>9</td>\n",
1392 |        "      <td>0.004931</td>\n",
1393 |        "      <td>None</td>\n",
1394 |        "      <td>01:24</td>\n",
1395 |        "    </tr>\n",
1396 |        "    <tr>\n",
1397 |        "      <td>10</td>\n",
1398 |        "      <td>0.004784</td>\n",
1399 |        "      <td>None</td>\n",
1400 |        "      <td>01:24</td>\n",
1401 |        "    </tr>\n",
1402 |        "    <tr>\n",
1403 |        "      <td>11</td>\n",
1404 |        "      <td>0.004607</td>\n",
1405 |        "      <td>None</td>\n",
1406 |        "      <td>01:24</td>\n",
1407 |        "    </tr>\n",
1408 |        "    <tr>\n",
1409 |        "      <td>12</td>\n",
1410 |        "      <td>0.004510</td>\n",
1411 |        "      <td>None</td>\n",
1412 |        "      <td>01:24</td>\n",
1413 |        "    </tr>\n",
1414 |        "    <tr>\n",
1415 |        "      <td>13</td>\n",
1416 |        "      <td>0.004388</td>\n",
1417 |        "      <td>None</td>\n",
1418 |        "      <td>01:24</td>\n",
1419 |        "    </tr>\n",
1420 |        "    <tr>\n",
1421 |        "      <td>14</td>\n",
1422 |        "      <td>0.004330</td>\n",
1423 |        "      <td>None</td>\n",
1424 |        "      <td>01:24</td>\n",
1425 |        "    </tr>\n",
1426 |        "  </tbody>\n",
1427 |        "</table>"
1428 |       ],
1429 |       "text/plain": [
1430 |        "<IPython.core.display.HTML object>"
1431 |       ]
1432 |      },
1433 |      "metadata": {},
1434 |      "output_type": "display_data"
1435 |     }
1436 |    ],
1437 |    "source": [
1438 |     "for run in range(runs):\n",
1439 |     "    learn = unet_learner(dbunch, model, pretrained=False, opt_func=opt_func, metrics=[], loss_func=MSELoss())\n",
1440 |     "\n",
1441 |     "    if fp16: learn = learn.to_fp16()\n",
1442 |     "    cbs = []\n",
1443 |     "    learn.fit_flat_cos(epochs, lr, wd=1e-2, cbs=cbs)\n",
1444 |     "\n",
1445 |     "    #Save model backbone\n",
1446 |     "    torch.save(learn.model[0].state_dict(), 'all_train_pretext_{}.pth'.format(run))\n",
1447 |     "    \n",
1448 |     "    del learn\n",
1449 |     "    torch.cuda.empty_cache() \n",
1450 |     "    gc.collect()    "
1451 |    ]
1452 |   },
1453 |   {
1454 |    "cell_type": "markdown",
1455 |    "metadata": {},
1456 |    "source": [
1457 |     "## Train with partial data from `/train`"
1458 |    ]
1459 |   },
1460 |   {
1461 |    "cell_type": "code",
1462 |    "execution_count": 10,
1463 |    "metadata": {},
1464 |    "outputs": [
1465 |     {
1466 |      "name": "stdout",
1467 |      "output_type": "stream",
1468 |      "text": [
1469 |       "Training Size: 1275\n",
1470 |       "Validation Size: 0\n"
1471 |      ]
1472 |     }
1473 |    ],
1474 |    "source": [
1475 |     "dblock = DataBlock(blocks=(ImageBlock(cls=PILImageInput), ImageBlock),\n",
1476 |     "                   splitter=RandomSplitter(valid_pct=0),\n",
1477 |     "                   get_items=get_train_items_that_are_present_in_val, \n",
1478 |     "                   get_y=lambda o: o,\n",
1479 |     "                   item_tfms=item_tfms, \n",
1480 |     "                   batch_tfms=batch_tfms)\n",
1481 |     "\n",
1482 |     "dbunch =  dblock.dataloaders(source, path=source, bs=bs)\n",
1483 |     "\n",
1484 |     "#CHANGE: We're predicting pixel values, so we're just going to predict an output for each RGB channel\n",
1485 |     "dbunch.vocab = ['R', 'G', 'B']\n",
1486 |     "\n",
1487 |     "print(\"Training Size:\", len(dbunch.train_ds))\n",
1488 |     "print(\"Validation Size:\", len(dbunch.valid_ds))"
1489 |    ]
1490 |   },
1491 |   {
1492 |    "cell_type": "code",
1493 |    "execution_count": 11,
1494 |    "metadata": {
1495 |     "scrolled": false
1496 |    },
1497 |    "outputs": [
1498 |     {
1499 |      "data": {
1500 |       "text/html": [
1501 |        "<table border=\"1\" class=\"dataframe\">\n",
1502 |        "  <thead>\n",
1503 |        "    <tr style=\"text-align: left;\">\n",
1504 |        "      <th>epoch</th>\n",
1505 |        "      <th>train_loss</th>\n",
1506 |        "      <th>valid_loss</th>\n",
1507 |        "      <th>time</th>\n",
1508 |        "    </tr>\n",
1509 |        "  </thead>\n",
1510 |        "  <tbody>\n",
1511 |        "    <tr>\n",
1512 |        "      <td>0</td>\n",
1513 |        "      <td>0.928153</td>\n",
1514 |        "      <td>None</td>\n",
1515 |        "      <td>00:07</td>\n",
1516 |        "    </tr>\n",
1517 |        "    <tr>\n",
1518 |        "      <td>1</td>\n",
1519 |        "      <td>0.813562</td>\n",
1520 |        "      <td>None</td>\n",
1521 |        "      <td>00:07</td>\n",
1522 |        "    </tr>\n",
1523 |        "    <tr>\n",
1524 |        "      <td>2</td>\n",
1525 |        "      <td>0.741672</td>\n",
1526 |        "      <td>None</td>\n",
1527 |        "      <td>00:07</td>\n",
1528 |        "    </tr>\n",
1529 |        "    <tr>\n",
1530 |        "      <td>3</td>\n",
1531 |        "      <td>0.675520</td>\n",
1532 |        "      <td>None</td>\n",
1533 |        "      <td>00:07</td>\n",
1534 |        "    </tr>\n",
1535 |        "    <tr>\n",
1536 |        "      <td>4</td>\n",
1537 |        "      <td>0.610155</td>\n",
1538 |        "      <td>None</td>\n",
1539 |        "      <td>00:07</td>\n",
1540 |        "    </tr>\n",
1541 |        "    <tr>\n",
1542 |        "      <td>5</td>\n",
1543 |        "      <td>0.543690</td>\n",
1544 |        "      <td>None</td>\n",
1545 |        "      <td>00:07</td>\n",
1546 |        "    </tr>\n",
1547 |        "    <tr>\n",
1548 |        "      <td>6</td>\n",
1549 |        "      <td>0.477957</td>\n",
1550 |        "      <td>None</td>\n",
1551 |        "      <td>00:07</td>\n",
1552 |        "    </tr>\n",
1553 |        "    <tr>\n",
1554 |        "      <td>7</td>\n",
1555 |        "      <td>0.414091</td>\n",
1556 |        "      <td>None</td>\n",
1557 |        "      <td>00:07</td>\n",
1558 |        "    </tr>\n",
1559 |        "    <tr>\n",
1560 |        "      <td>8</td>\n",
1561 |        "      <td>0.354247</td>\n",
1562 |        "      <td>None</td>\n",
1563 |        "      <td>00:07</td>\n",
1564 |        "    </tr>\n",
1565 |        "    <tr>\n",
1566 |        "      <td>9</td>\n",
1567 |        "      <td>0.298382</td>\n",
1568 |        "      <td>None</td>\n",
1569 |        "      <td>00:07</td>\n",
1570 |        "    </tr>\n",
1571 |        "    <tr>\n",
1572 |        "      <td>10</td>\n",
1573 |        "      <td>0.247550</td>\n",
1574 |        "      <td>None</td>\n",
1575 |        "      <td>00:07</td>\n",
1576 |        "    </tr>\n",
1577 |        "    <tr>\n",
1578 |        "      <td>11</td>\n",
1579 |        "      <td>0.202207</td>\n",
1580 |        "      <td>None</td>\n",
1581 |        "      <td>00:07</td>\n",
1582 |        "    </tr>\n",
1583 |        "    <tr>\n",
1584 |        "      <td>12</td>\n",
1585 |        "      <td>0.164292</td>\n",
1586 |        "      <td>None</td>\n",
1587 |        "      <td>00:07</td>\n",
1588 |        "    </tr>\n",
1589 |        "    <tr>\n",
1590 |        "      <td>13</td>\n",
1591 |        "      <td>0.134360</td>\n",
1592 |        "      <td>None</td>\n",
1593 |        "      <td>00:07</td>\n",
1594 |        "    </tr>\n",
1595 |        "    <tr>\n",
1596 |        "      <td>14</td>\n",
1597 |        "      <td>0.113019</td>\n",
1598 |        "      <td>None</td>\n",
1599 |        "      <td>00:07</td>\n",
1600 |        "    </tr>\n",
1601 |        "  </tbody>\n",
1602 |        "</table>"
1603 |       ],
1604 |       "text/plain": [
1605 |        "<IPython.core.display.HTML object>"
1606 |       ]
1607 |      },
1608 |      "metadata": {},
1609 |      "output_type": "display_data"
1610 |     },
1611 |     {
1612 |      "data": {
1613 |       "text/html": [
1614 |        "<table border=\"1\" class=\"dataframe\">\n",
1615 |        "  <thead>\n",
1616 |        "    <tr style=\"text-align: left;\">\n",
1617 |        "      <th>epoch</th>\n",
1618 |        "      <th>train_loss</th>\n",
1619 |        "      <th>valid_loss</th>\n",
1620 |        "      <th>time</th>\n",
1621 |        "    </tr>\n",
1622 |        "  </thead>\n",
1623 |        "  <tbody>\n",
1624 |        "    <tr>\n",
1625 |        "      <td>0</td>\n",
1626 |        "      <td>0.925984</td>\n",
1627 |        "      <td>None</td>\n",
1628 |        "      <td>00:07</td>\n",
1629 |        "    </tr>\n",
1630 |        "    <tr>\n",
1631 |        "      <td>1</td>\n",
1632 |        "      <td>0.812690</td>\n",
1633 |        "      <td>None</td>\n",
1634 |        "      <td>00:07</td>\n",
1635 |        "    </tr>\n",
1636 |        "    <tr>\n",
1637 |        "      <td>2</td>\n",
1638 |        "      <td>0.739564</td>\n",
1639 |        "      <td>None</td>\n",
1640 |        "      <td>00:07</td>\n",
1641 |        "    </tr>\n",
1642 |        "    <tr>\n",
1643 |        "      <td>3</td>\n",
1644 |        "      <td>0.674601</td>\n",
1645 |        "      <td>None</td>\n",
1646 |        "      <td>00:07</td>\n",
1647 |        "    </tr>\n",
1648 |        "    <tr>\n",
1649 |        "      <td>4</td>\n",
1650 |        "      <td>0.608644</td>\n",
1651 |        "      <td>None</td>\n",
1652 |        "      <td>00:07</td>\n",
1653 |        "    </tr>\n",
1654 |        "    <tr>\n",
1655 |        "      <td>5</td>\n",
1656 |        "      <td>0.542074</td>\n",
1657 |        "      <td>None</td>\n",
1658 |        "      <td>00:07</td>\n",
1659 |        "    </tr>\n",
1660 |        "    <tr>\n",
1661 |        "      <td>6</td>\n",
1662 |        "      <td>0.477865</td>\n",
1663 |        "      <td>None</td>\n",
1664 |        "      <td>00:08</td>\n",
1665 |        "    </tr>\n",
1666 |        "    <tr>\n",
1667 |        "      <td>7</td>\n",
1668 |        "      <td>0.414007</td>\n",
1669 |        "      <td>None</td>\n",
1670 |        "      <td>00:07</td>\n",
1671 |        "    </tr>\n",
1672 |        "    <tr>\n",
1673 |        "      <td>8</td>\n",
1674 |        "      <td>0.353446</td>\n",
1675 |        "      <td>None</td>\n",
1676 |        "      <td>00:07</td>\n",
1677 |        "    </tr>\n",
1678 |        "    <tr>\n",
1679 |        "      <td>9</td>\n",
1680 |        "      <td>0.297540</td>\n",
1681 |        "      <td>None</td>\n",
1682 |        "      <td>00:07</td>\n",
1683 |        "    </tr>\n",
1684 |        "    <tr>\n",
1685 |        "      <td>10</td>\n",
1686 |        "      <td>0.246756</td>\n",
1687 |        "      <td>None</td>\n",
1688 |        "      <td>00:07</td>\n",
1689 |        "    </tr>\n",
1690 |        "    <tr>\n",
1691 |        "      <td>11</td>\n",
1692 |        "      <td>0.202051</td>\n",
1693 |        "      <td>None</td>\n",
1694 |        "      <td>00:07</td>\n",
1695 |        "    </tr>\n",
1696 |        "    <tr>\n",
1697 |        "      <td>12</td>\n",
1698 |        "      <td>0.164051</td>\n",
1699 |        "      <td>None</td>\n",
1700 |        "      <td>00:07</td>\n",
1701 |        "    </tr>\n",
1702 |        "    <tr>\n",
1703 |        "      <td>13</td>\n",
1704 |        "      <td>0.134142</td>\n",
1705 |        "      <td>None</td>\n",
1706 |        "      <td>00:08</td>\n",
1707 |        "    </tr>\n",
1708 |        "    <tr>\n",
1709 |        "      <td>14</td>\n",
1710 |        "      <td>0.112815</td>\n",
1711 |        "      <td>None</td>\n",
1712 |        "      <td>00:08</td>\n",
1713 |        "    </tr>\n",
1714 |        "  </tbody>\n",
1715 |        "</table>"
1716 |       ],
1717 |       "text/plain": [
1718 |        "<IPython.core.display.HTML object>"
1719 |       ]
1720 |      },
1721 |      "metadata": {},
1722 |      "output_type": "display_data"
1723 |     },
1724 |     {
1725 |      "data": {
1726 |       "text/html": [
1727 |        "<table border=\"1\" class=\"dataframe\">\n",
1728 |        "  <thead>\n",
1729 |        "    <tr style=\"text-align: left;\">\n",
1730 |        "      <th>epoch</th>\n",
1731 |        "      <th>train_loss</th>\n",
1732 |        "      <th>valid_loss</th>\n",
1733 |        "      <th>time</th>\n",
1734 |        "    </tr>\n",
1735 |        "  </thead>\n",
1736 |        "  <tbody>\n",
1737 |        "    <tr>\n",
1738 |        "      <td>0</td>\n",
1739 |        "      <td>0.921843</td>\n",
1740 |        "      <td>None</td>\n",
1741 |        "      <td>00:08</td>\n",
1742 |        "    </tr>\n",
1743 |        "    <tr>\n",
1744 |        "      <td>1</td>\n",
1745 |        "      <td>0.812477</td>\n",
1746 |        "      <td>None</td>\n",
1747 |        "      <td>00:07</td>\n",
1748 |        "    </tr>\n",
1749 |        "    <tr>\n",
1750 |        "      <td>2</td>\n",
1751 |        "      <td>0.741308</td>\n",
1752 |        "      <td>None</td>\n",
1753 |        "      <td>00:07</td>\n",
1754 |        "    </tr>\n",
1755 |        "    <tr>\n",
1756 |        "      <td>3</td>\n",
1757 |        "      <td>0.675774</td>\n",
1758 |        "      <td>None</td>\n",
1759 |        "      <td>00:08</td>\n",
1760 |        "    </tr>\n",
1761 |        "    <tr>\n",
1762 |        "      <td>4</td>\n",
1763 |        "      <td>0.610134</td>\n",
1764 |        "      <td>None</td>\n",
1765 |        "      <td>00:08</td>\n",
1766 |        "    </tr>\n",
1767 |        "    <tr>\n",
1768 |        "      <td>5</td>\n",
1769 |        "      <td>0.543442</td>\n",
1770 |        "      <td>None</td>\n",
1771 |        "      <td>00:07</td>\n",
1772 |        "    </tr>\n",
1773 |        "    <tr>\n",
1774 |        "      <td>6</td>\n",
1775 |        "      <td>0.477867</td>\n",
1776 |        "      <td>None</td>\n",
1777 |        "      <td>00:07</td>\n",
1778 |        "    </tr>\n",
1779 |        "    <tr>\n",
1780 |        "      <td>7</td>\n",
1781 |        "      <td>0.414159</td>\n",
1782 |        "      <td>None</td>\n",
1783 |        "      <td>00:07</td>\n",
1784 |        "    </tr>\n",
1785 |        "    <tr>\n",
1786 |        "      <td>8</td>\n",
1787 |        "      <td>0.353886</td>\n",
1788 |        "      <td>None</td>\n",
1789 |        "      <td>00:07</td>\n",
1790 |        "    </tr>\n",
1791 |        "    <tr>\n",
1792 |        "      <td>9</td>\n",
1793 |        "      <td>0.298228</td>\n",
1794 |        "      <td>None</td>\n",
1795 |        "      <td>00:07</td>\n",
1796 |        "    </tr>\n",
1797 |        "    <tr>\n",
1798 |        "      <td>10</td>\n",
1799 |        "      <td>0.247207</td>\n",
1800 |        "      <td>None</td>\n",
1801 |        "      <td>00:08</td>\n",
1802 |        "    </tr>\n",
1803 |        "    <tr>\n",
1804 |        "      <td>11</td>\n",
1805 |        "      <td>0.202228</td>\n",
1806 |        "      <td>None</td>\n",
1807 |        "      <td>00:07</td>\n",
1808 |        "    </tr>\n",
1809 |        "    <tr>\n",
1810 |        "      <td>12</td>\n",
1811 |        "      <td>0.164021</td>\n",
1812 |        "      <td>None</td>\n",
1813 |        "      <td>00:07</td>\n",
1814 |        "    </tr>\n",
1815 |        "    <tr>\n",
1816 |        "      <td>13</td>\n",
1817 |        "      <td>0.134206</td>\n",
1818 |        "      <td>None</td>\n",
1819 |        "      <td>00:07</td>\n",
1820 |        "    </tr>\n",
1821 |        "    <tr>\n",
1822 |        "      <td>14</td>\n",
1823 |        "      <td>0.112829</td>\n",
1824 |        "      <td>None</td>\n",
1825 |        "      <td>00:07</td>\n",
1826 |        "    </tr>\n",
1827 |        "  </tbody>\n",
1828 |        "</table>"
1829 |       ],
1830 |       "text/plain": [
1831 |        "<IPython.core.display.HTML object>"
1832 |       ]
1833 |      },
1834 |      "metadata": {},
1835 |      "output_type": "display_data"
1836 |     }
1837 |    ],
1838 |    "source": [
1839 |     "for run in range(runs):\n",
1840 |     "    learn = unet_learner(dbunch, model, pretrained=False, opt_func=opt_func, metrics=[], loss_func=MSELoss())\n",
1841 |     "\n",
1842 |     "    if fp16: learn = learn.to_fp16()\n",
1843 |     "    cbs = []\n",
1844 |     "    learn.fit_flat_cos(epochs, lr, wd=1e-2, cbs=cbs)\n",
1845 |     "\n",
1846 |     "    #Save model backbone\n",
1847 |     "    torch.save(learn.model[0].state_dict(), 'partial_train_pretext_{}.pth'.format(run))\n",
1848 |     "    \n",
1849 |     "    del learn\n",
1850 |     "    torch.cuda.empty_cache() \n",
1851 |     "    gc.collect()"
1852 |    ]
1853 |   },
1854 |   {
1855 |    "cell_type": "markdown",
1856 |    "metadata": {},
1857 |    "source": [
1858 |     "# Downstream Task: Image网"
1859 |    ]
1860 |   },
1861 |   {
1862 |    "cell_type": "markdown",
1863 |    "metadata": {},
1864 |    "source": [
1865 |     "Now that we've trained models on our pretext tasks, let's compare the performance of each model against one another."
1866 |    ]
1867 |   },
1868 |   {
1869 |    "cell_type": "code",
1870 |    "execution_count": 12,
1871 |    "metadata": {},
1872 |    "outputs": [],
1873 |    "source": [
1874 |     "def get_dbunch(size, bs, sh=0., workers=None):\n",
1875 |     "    if size<=224: \n",
1876 |     "        path = URLs.IMAGEWANG_160\n",
1877 |     "    else: \n",
1878 |     "        path = URLs.IMAGEWANG\n",
1879 |     "    source = untar_data(path)\n",
1880 |     "    if workers is None: workers = min(8, num_cpus())\n",
1881 |     "    item_tfms=[RandomResizedCrop(size, min_scale=0.35), FlipItem(0.5)]\n",
1882 |     "    batch_tfms=RandomErasing(p=0.9, max_count=3, sh=sh) if sh else None\n",
1883 |     "    \n",
1884 |     "    dblock = DataBlock(blocks=(ImageBlock, CategoryBlock),\n",
1885 |     "                       splitter=GrandparentSplitter(valid_name='val'),\n",
1886 |     "                       get_items=get_image_files, get_y=parent_label,\n",
1887 |     "                       item_tfms=item_tfms, batch_tfms=batch_tfms)\n",
1888 |     "    \n",
1889 |     "    return dblock.dataloaders(source, path=source, bs=bs, num_workers=workers)"
1890 |    ]
1891 |   },
1892 |   {
1893 |    "cell_type": "code",
1894 |    "execution_count": 14,
1895 |    "metadata": {},
1896 |    "outputs": [],
1897 |    "source": [
1898 |     "dbunch = get_dbunch(size, bs)"
1899 |    ]
1900 |   },
1901 |   {
1902 |    "cell_type": "markdown",
1903 |    "metadata": {},
1904 |    "source": [
1905 |     "## Random Baseline"
1906 |    ]
1907 |   },
1908 |   {
1909 |    "cell_type": "code",
1910 |    "execution_count": 15,
1911 |    "metadata": {},
1912 |    "outputs": [
1913 |     {
1914 |      "name": "stdout",
1915 |      "output_type": "stream",
1916 |      "text": [
1917 |       "Run: 0\n"
1918 |      ]
1919 |     },
1920 |     {
1921 |      "data": {
1922 |       "text/html": [
1923 |        "<table border=\"1\" class=\"dataframe\">\n",
1924 |        "  <thead>\n",
1925 |        "    <tr style=\"text-align: left;\">\n",
1926 |        "      <th>epoch</th>\n",
1927 |        "      <th>train_loss</th>\n",
1928 |        "      <th>valid_loss</th>\n",
1929 |        "      <th>accuracy</th>\n",
1930 |        "      <th>top_k_accuracy</th>\n",
1931 |        "      <th>time</th>\n",
1932 |        "    </tr>\n",
1933 |        "  </thead>\n",
1934 |        "  <tbody>\n",
1935 |        "    <tr>\n",
1936 |        "      <td>0</td>\n",
1937 |        "      <td>1.796687</td>\n",
1938 |        "      <td>3.636446</td>\n",
1939 |        "      <td>0.012217</td>\n",
1940 |        "      <td>0.296768</td>\n",
1941 |        "      <td>00:18</td>\n",
1942 |        "    </tr>\n",
1943 |        "    <tr>\n",
1944 |        "      <td>1</td>\n",
1945 |        "      <td>1.550067</td>\n",
1946 |        "      <td>3.181229</td>\n",
1947 |        "      <td>0.056757</td>\n",
1948 |        "      <td>0.467804</td>\n",
1949 |        "      <td>00:18</td>\n",
1950 |        "    </tr>\n",
1951 |        "    <tr>\n",
1952 |        "      <td>2</td>\n",
1953 |        "      <td>1.426739</td>\n",
1954 |        "      <td>4.102186</td>\n",
1955 |        "      <td>0.005345</td>\n",
1956 |        "      <td>0.191652</td>\n",
1957 |        "      <td>00:18</td>\n",
1958 |        "    </tr>\n",
1959 |        "    <tr>\n",
1960 |        "      <td>3</td>\n",
1961 |        "      <td>1.324669</td>\n",
1962 |        "      <td>3.096211</td>\n",
1963 |        "      <td>0.107406</td>\n",
1964 |        "      <td>0.500127</td>\n",
1965 |        "      <td>00:18</td>\n",
1966 |        "    </tr>\n",
1967 |        "    <tr>\n",
1968 |        "      <td>4</td>\n",
1969 |        "      <td>1.261578</td>\n",
1970 |        "      <td>3.208763</td>\n",
1971 |        "      <td>0.083736</td>\n",
1972 |        "      <td>0.473403</td>\n",
1973 |        "      <td>00:18</td>\n",
1974 |        "    </tr>\n",
1975 |        "    <tr>\n",
1976 |        "      <td>5</td>\n",
1977 |        "      <td>1.204970</td>\n",
1978 |        "      <td>2.567671</td>\n",
1979 |        "      <td>0.252482</td>\n",
1980 |        "      <td>0.739883</td>\n",
1981 |        "      <td>00:18</td>\n",
1982 |        "    </tr>\n",
1983 |        "    <tr>\n",
1984 |        "      <td>6</td>\n",
1985 |        "      <td>1.151186</td>\n",
1986 |        "      <td>2.390353</td>\n",
1987 |        "      <td>0.305930</td>\n",
1988 |        "      <td>0.771443</td>\n",
1989 |        "      <td>00:18</td>\n",
1990 |        "    </tr>\n",
1991 |        "    <tr>\n",
1992 |        "      <td>7</td>\n",
1993 |        "      <td>1.118767</td>\n",
1994 |        "      <td>2.636642</td>\n",
1995 |        "      <td>0.242555</td>\n",
1996 |        "      <td>0.693306</td>\n",
1997 |        "      <td>00:18</td>\n",
1998 |        "    </tr>\n",
1999 |        "    <tr>\n",
2000 |        "      <td>8</td>\n",
2001 |        "      <td>1.100804</td>\n",
2002 |        "      <td>2.697914</td>\n",
2003 |        "      <td>0.257826</td>\n",
2004 |        "      <td>0.692543</td>\n",
2005 |        "      <td>00:18</td>\n",
2006 |        "    </tr>\n",
2007 |        "    <tr>\n",
2008 |        "      <td>9</td>\n",
2009 |        "      <td>1.048302</td>\n",
2010 |        "      <td>2.673872</td>\n",
2011 |        "      <td>0.265716</td>\n",
2012 |        "      <td>0.694070</td>\n",
2013 |        "      <td>00:18</td>\n",
2014 |        "    </tr>\n",
2015 |        "    <tr>\n",
2016 |        "      <td>10</td>\n",
2017 |        "      <td>1.023241</td>\n",
2018 |        "      <td>2.509643</td>\n",
2019 |        "      <td>0.344108</td>\n",
2020 |        "      <td>0.750827</td>\n",
2021 |        "      <td>00:18</td>\n",
2022 |        "    </tr>\n",
2023 |        "    <tr>\n",
2024 |        "      <td>11</td>\n",
2025 |        "      <td>1.003334</td>\n",
2026 |        "      <td>2.147938</td>\n",
2027 |        "      <td>0.421990</td>\n",
2028 |        "      <td>0.847798</td>\n",
2029 |        "      <td>00:18</td>\n",
2030 |        "    </tr>\n",
2031 |        "    <tr>\n",
2032 |        "      <td>12</td>\n",
2033 |        "      <td>0.930420</td>\n",
2034 |        "      <td>1.994279</td>\n",
2035 |        "      <td>0.471876</td>\n",
2036 |        "      <td>0.875032</td>\n",
2037 |        "      <td>00:18</td>\n",
2038 |        "    </tr>\n",
2039 |        "    <tr>\n",
2040 |        "      <td>13</td>\n",
2041 |        "      <td>0.864267</td>\n",
2042 |        "      <td>1.915607</td>\n",
2043 |        "      <td>0.512853</td>\n",
2044 |        "      <td>0.878595</td>\n",
2045 |        "      <td>00:18</td>\n",
2046 |        "    </tr>\n",
2047 |        "    <tr>\n",
2048 |        "      <td>14</td>\n",
2049 |        "      <td>0.807440</td>\n",
2050 |        "      <td>1.874488</td>\n",
2051 |        "      <td>0.523797</td>\n",
2052 |        "      <td>0.886485</td>\n",
2053 |        "      <td>00:19</td>\n",
2054 |        "    </tr>\n",
2055 |        "  </tbody>\n",
2056 |        "</table>"
2057 |       ],
2058 |       "text/plain": [
2059 |        "<IPython.core.display.HTML object>"
2060 |       ]
2061 |      },
2062 |      "metadata": {},
2063 |      "output_type": "display_data"
2064 |     },
2065 |     {
2066 |      "name": "stdout",
2067 |      "output_type": "stream",
2068 |      "text": [
2069 |       "Run: 1\n"
2070 |      ]
2071 |     },
2072 |     {
2073 |      "data": {
2074 |       "text/html": [
2075 |        "<table border=\"1\" class=\"dataframe\">\n",
2076 |        "  <thead>\n",
2077 |        "    <tr style=\"text-align: left;\">\n",
2078 |        "      <th>epoch</th>\n",
2079 |        "      <th>train_loss</th>\n",
2080 |        "      <th>valid_loss</th>\n",
2081 |        "      <th>accuracy</th>\n",
2082 |        "      <th>top_k_accuracy</th>\n",
2083 |        "      <th>time</th>\n",
2084 |        "    </tr>\n",
2085 |        "  </thead>\n",
2086 |        "  <tbody>\n",
2087 |        "    <tr>\n",
2088 |        "      <td>0</td>\n",
2089 |        "      <td>1.785860</td>\n",
2090 |        "      <td>3.457567</td>\n",
2091 |        "      <td>0.030288</td>\n",
2092 |        "      <td>0.337745</td>\n",
2093 |        "      <td>00:18</td>\n",
2094 |        "    </tr>\n",
2095 |        "    <tr>\n",
2096 |        "      <td>1</td>\n",
2097 |        "      <td>1.537349</td>\n",
2098 |        "      <td>3.515796</td>\n",
2099 |        "      <td>0.020870</td>\n",
2100 |        "      <td>0.392975</td>\n",
2101 |        "      <td>00:18</td>\n",
2102 |        "    </tr>\n",
2103 |        "    <tr>\n",
2104 |        "      <td>2</td>\n",
2105 |        "      <td>1.418070</td>\n",
2106 |        "      <td>2.866719</td>\n",
2107 |        "      <td>0.103080</td>\n",
2108 |        "      <td>0.630186</td>\n",
2109 |        "      <td>00:19</td>\n",
2110 |        "    </tr>\n",
2111 |        "    <tr>\n",
2112 |        "      <td>3</td>\n",
2113 |        "      <td>1.327588</td>\n",
2114 |        "      <td>3.035241</td>\n",
2115 |        "      <td>0.114278</td>\n",
2116 |        "      <td>0.566302</td>\n",
2117 |        "      <td>00:19</td>\n",
2118 |        "    </tr>\n",
2119 |        "    <tr>\n",
2120 |        "      <td>4</td>\n",
2121 |        "      <td>1.240670</td>\n",
2122 |        "      <td>3.118759</td>\n",
2123 |        "      <td>0.132349</td>\n",
2124 |        "      <td>0.656401</td>\n",
2125 |        "      <td>00:18</td>\n",
2126 |        "    </tr>\n",
2127 |        "    <tr>\n",
2128 |        "      <td>5</td>\n",
2129 |        "      <td>1.239033</td>\n",
2130 |        "      <td>2.498254</td>\n",
2131 |        "      <td>0.243573</td>\n",
2132 |        "      <td>0.766098</td>\n",
2133 |        "      <td>00:19</td>\n",
2134 |        "    </tr>\n",
2135 |        "    <tr>\n",
2136 |        "      <td>6</td>\n",
2137 |        "      <td>1.161790</td>\n",
2138 |        "      <td>2.439876</td>\n",
2139 |        "      <td>0.287350</td>\n",
2140 |        "      <td>0.780606</td>\n",
2141 |        "      <td>00:19</td>\n",
2142 |        "    </tr>\n",
2143 |        "    <tr>\n",
2144 |        "      <td>7</td>\n",
2145 |        "      <td>1.111243</td>\n",
2146 |        "      <td>2.615522</td>\n",
2147 |        "      <td>0.255027</td>\n",
2148 |        "      <td>0.702723</td>\n",
2149 |        "      <td>00:18</td>\n",
2150 |        "    </tr>\n",
2151 |        "    <tr>\n",
2152 |        "      <td>8</td>\n",
2153 |        "      <td>1.071862</td>\n",
2154 |        "      <td>2.776183</td>\n",
2155 |        "      <td>0.236192</td>\n",
2156 |        "      <td>0.689488</td>\n",
2157 |        "      <td>00:18</td>\n",
2158 |        "    </tr>\n",
2159 |        "    <tr>\n",
2160 |        "      <td>9</td>\n",
2161 |        "      <td>1.047892</td>\n",
2162 |        "      <td>2.640335</td>\n",
2163 |        "      <td>0.266989</td>\n",
2164 |        "      <td>0.689997</td>\n",
2165 |        "      <td>00:18</td>\n",
2166 |        "    </tr>\n",
2167 |        "    <tr>\n",
2168 |        "      <td>10</td>\n",
2169 |        "      <td>1.025256</td>\n",
2170 |        "      <td>2.888909</td>\n",
2171 |        "      <td>0.203105</td>\n",
2172 |        "      <td>0.702723</td>\n",
2173 |        "      <td>00:18</td>\n",
2174 |        "    </tr>\n",
2175 |        "    <tr>\n",
2176 |        "      <td>11</td>\n",
2177 |        "      <td>1.006802</td>\n",
2178 |        "      <td>2.147226</td>\n",
2179 |        "      <td>0.415882</td>\n",
2180 |        "      <td>0.844235</td>\n",
2181 |        "      <td>00:19</td>\n",
2182 |        "    </tr>\n",
2183 |        "    <tr>\n",
2184 |        "      <td>12</td>\n",
2185 |        "      <td>0.944483</td>\n",
2186 |        "      <td>2.018685</td>\n",
2187 |        "      <td>0.455841</td>\n",
2188 |        "      <td>0.855688</td>\n",
2189 |        "      <td>00:17</td>\n",
2190 |        "    </tr>\n",
2191 |        "    <tr>\n",
2192 |        "      <td>13</td>\n",
2193 |        "      <td>0.862398</td>\n",
2194 |        "      <td>1.939311</td>\n",
2195 |        "      <td>0.499364</td>\n",
2196 |        "      <td>0.880122</td>\n",
2197 |        "      <td>00:18</td>\n",
2198 |        "    </tr>\n",
2199 |        "    <tr>\n",
2200 |        "      <td>14</td>\n",
2201 |        "      <td>0.817526</td>\n",
2202 |        "      <td>1.898363</td>\n",
2203 |        "      <td>0.514889</td>\n",
2204 |        "      <td>0.887503</td>\n",
2205 |        "      <td>00:18</td>\n",
2206 |        "    </tr>\n",
2207 |        "  </tbody>\n",
2208 |        "</table>"
2209 |       ],
2210 |       "text/plain": [
2211 |        "<IPython.core.display.HTML object>"
2212 |       ]
2213 |      },
2214 |      "metadata": {},
2215 |      "output_type": "display_data"
2216 |     },
2217 |     {
2218 |      "name": "stdout",
2219 |      "output_type": "stream",
2220 |      "text": [
2221 |       "Run: 2\n"
2222 |      ]
2223 |     },
2224 |     {
2225 |      "data": {
2226 |       "text/html": [
2227 |        "<table border=\"1\" class=\"dataframe\">\n",
2228 |        "  <thead>\n",
2229 |        "    <tr style=\"text-align: left;\">\n",
2230 |        "      <th>epoch</th>\n",
2231 |        "      <th>train_loss</th>\n",
2232 |        "      <th>valid_loss</th>\n",
2233 |        "      <th>accuracy</th>\n",
2234 |        "      <th>top_k_accuracy</th>\n",
2235 |        "      <th>time</th>\n",
2236 |        "    </tr>\n",
2237 |        "  </thead>\n",
2238 |        "  <tbody>\n",
2239 |        "    <tr>\n",
2240 |        "      <td>0</td>\n",
2241 |        "      <td>1.787773</td>\n",
2242 |        "      <td>3.516780</td>\n",
2243 |        "      <td>0.007636</td>\n",
2244 |        "      <td>0.366251</td>\n",
2245 |        "      <td>00:18</td>\n",
2246 |        "    </tr>\n",
2247 |        "    <tr>\n",
2248 |        "      <td>1</td>\n",
2249 |        "      <td>1.567964</td>\n",
2250 |        "      <td>3.588476</td>\n",
2251 |        "      <td>0.029270</td>\n",
2252 |        "      <td>0.306439</td>\n",
2253 |        "      <td>00:17</td>\n",
2254 |        "    </tr>\n",
2255 |        "    <tr>\n",
2256 |        "      <td>2</td>\n",
2257 |        "      <td>1.430103</td>\n",
2258 |        "      <td>3.278402</td>\n",
2259 |        "      <td>0.076101</td>\n",
2260 |        "      <td>0.526343</td>\n",
2261 |        "      <td>00:18</td>\n",
2262 |        "    </tr>\n",
2263 |        "    <tr>\n",
2264 |        "      <td>3</td>\n",
2265 |        "      <td>1.358013</td>\n",
2266 |        "      <td>3.461002</td>\n",
2267 |        "      <td>0.053449</td>\n",
2268 |        "      <td>0.433189</td>\n",
2269 |        "      <td>00:18</td>\n",
2270 |        "    </tr>\n",
2271 |        "    <tr>\n",
2272 |        "      <td>4</td>\n",
2273 |        "      <td>1.265356</td>\n",
2274 |        "      <td>3.048952</td>\n",
2275 |        "      <td>0.119369</td>\n",
2276 |        "      <td>0.541614</td>\n",
2277 |        "      <td>00:18</td>\n",
2278 |        "    </tr>\n",
2279 |        "    <tr>\n",
2280 |        "      <td>5</td>\n",
2281 |        "      <td>1.195957</td>\n",
2282 |        "      <td>2.295239</td>\n",
2283 |        "      <td>0.340545</td>\n",
2284 |        "      <td>0.791550</td>\n",
2285 |        "      <td>00:17</td>\n",
2286 |        "    </tr>\n",
2287 |        "    <tr>\n",
2288 |        "      <td>6</td>\n",
2289 |        "      <td>1.158875</td>\n",
2290 |        "      <td>2.454480</td>\n",
2291 |        "      <td>0.286587</td>\n",
2292 |        "      <td>0.757445</td>\n",
2293 |        "      <td>00:17</td>\n",
2294 |        "    </tr>\n",
2295 |        "    <tr>\n",
2296 |        "      <td>7</td>\n",
2297 |        "      <td>1.128101</td>\n",
2298 |        "      <td>2.198237</td>\n",
2299 |        "      <td>0.373886</td>\n",
2300 |        "      <td>0.825655</td>\n",
2301 |        "      <td>00:18</td>\n",
2302 |        "    </tr>\n",
2303 |        "    <tr>\n",
2304 |        "      <td>8</td>\n",
2305 |        "      <td>1.066233</td>\n",
2306 |        "      <td>2.845231</td>\n",
2307 |        "      <td>0.219140</td>\n",
2308 |        "      <td>0.649784</td>\n",
2309 |        "      <td>00:19</td>\n",
2310 |        "    </tr>\n",
2311 |        "    <tr>\n",
2312 |        "      <td>9</td>\n",
2313 |        "      <td>1.052186</td>\n",
2314 |        "      <td>2.875170</td>\n",
2315 |        "      <td>0.240265</td>\n",
2316 |        "      <td>0.623059</td>\n",
2317 |        "      <td>00:18</td>\n",
2318 |        "    </tr>\n",
2319 |        "    <tr>\n",
2320 |        "      <td>10</td>\n",
2321 |        "      <td>1.025988</td>\n",
2322 |        "      <td>3.082022</td>\n",
2323 |        "      <td>0.196997</td>\n",
2324 |        "      <td>0.590990</td>\n",
2325 |        "      <td>00:18</td>\n",
2326 |        "    </tr>\n",
2327 |        "    <tr>\n",
2328 |        "      <td>11</td>\n",
2329 |        "      <td>0.998113</td>\n",
2330 |        "      <td>2.181639</td>\n",
2331 |        "      <td>0.407992</td>\n",
2332 |        "      <td>0.820311</td>\n",
2333 |        "      <td>00:18</td>\n",
2334 |        "    </tr>\n",
2335 |        "    <tr>\n",
2336 |        "      <td>12</td>\n",
2337 |        "      <td>0.940452</td>\n",
2338 |        "      <td>2.145926</td>\n",
2339 |        "      <td>0.422499</td>\n",
2340 |        "      <td>0.843472</td>\n",
2341 |        "      <td>00:19</td>\n",
2342 |        "    </tr>\n",
2343 |        "    <tr>\n",
2344 |        "      <td>13</td>\n",
2345 |        "      <td>0.864049</td>\n",
2346 |        "      <td>1.939076</td>\n",
2347 |        "      <td>0.501654</td>\n",
2348 |        "      <td>0.876304</td>\n",
2349 |        "      <td>00:18</td>\n",
2350 |        "    </tr>\n",
2351 |        "    <tr>\n",
2352 |        "      <td>14</td>\n",
2353 |        "      <td>0.821920</td>\n",
2354 |        "      <td>1.871261</td>\n",
2355 |        "      <td>0.529651</td>\n",
2356 |        "      <td>0.887503</td>\n",
2357 |        "      <td>00:18</td>\n",
2358 |        "    </tr>\n",
2359 |        "  </tbody>\n",
2360 |        "</table>"
2361 |       ],
2362 |       "text/plain": [
2363 |        "<IPython.core.display.HTML object>"
2364 |       ]
2365 |      },
2366 |      "metadata": {},
2367 |      "output_type": "display_data"
2368 |     }
2369 |    ],
2370 |    "source": [
2371 |     "for run in range(runs):\n",
2372 |     "    print(f'Run: {run}')\n",
2373 |     "    learn = Learner(dbunch, model(c_out=20, pretrained=False, act_cls=torch.nn.ReLU, sa=sa, sym=sym, pool=pool), opt_func=opt_func, \\\n",
2374 |     "            metrics=[accuracy,top_k_accuracy], loss_func=LabelSmoothingCrossEntropy())\n",
2375 |     "\n",
2376 |     "    if fp16: learn = learn.to_fp16()\n",
2377 |     "    cbs = []\n",
2378 |     "    learn.fit_flat_cos(epochs, lr, wd=1e-2, cbs=cbs)\n",
2379 |     "        \n",
2380 |     "    del learn\n",
2381 |     "    torch.cuda.empty_cache() \n",
2382 |     "    gc.collect()    "
2383 |    ]
2384 |   },
2385 |   {
2386 |    "cell_type": "markdown",
2387 |    "metadata": {},
2388 |    "source": [
2389 |     "Results:\n",
2390 |     "- Run 1: 0.523797\n",
2391 |     "- Run 2: 0.514889\n",
2392 |     "- Run 3: 0.529651\n",
2393 |     "\n",
2394 |     "Average: **52.3%**\n"
2395 |    ]
2396 |   },
2397 |   {
2398 |    "cell_type": "markdown",
2399 |    "metadata": {},
2400 |    "source": [
2401 |     "## All data in `/train`, `/unsup` and `/val`"
2402 |    ]
2403 |   },
2404 |   {
2405 |    "cell_type": "code",
2406 |    "execution_count": 16,
2407 |    "metadata": {},
2408 |    "outputs": [
2409 |     {
2410 |      "name": "stdout",
2411 |      "output_type": "stream",
2412 |      "text": [
2413 |       "Run: 0\n"
2414 |      ]
2415 |     },
2416 |     {
2417 |      "data": {
2418 |       "text/html": [
2419 |        "<table border=\"1\" class=\"dataframe\">\n",
2420 |        "  <thead>\n",
2421 |        "    <tr style=\"text-align: left;\">\n",
2422 |        "      <th>epoch</th>\n",
2423 |        "      <th>train_loss</th>\n",
2424 |        "      <th>valid_loss</th>\n",
2425 |        "      <th>accuracy</th>\n",
2426 |        "      <th>top_k_accuracy</th>\n",
2427 |        "      <th>time</th>\n",
2428 |        "    </tr>\n",
2429 |        "  </thead>\n",
2430 |        "  <tbody>\n",
2431 |        "    <tr>\n",
2432 |        "      <td>0</td>\n",
2433 |        "      <td>1.625774</td>\n",
2434 |        "      <td>3.095902</td>\n",
2435 |        "      <td>0.078646</td>\n",
2436 |        "      <td>0.489692</td>\n",
2437 |        "      <td>00:17</td>\n",
2438 |        "    </tr>\n",
2439 |        "    <tr>\n",
2440 |        "      <td>1</td>\n",
2441 |        "      <td>1.444291</td>\n",
2442 |        "      <td>2.837894</td>\n",
2443 |        "      <td>0.127768</td>\n",
2444 |        "      <td>0.628659</td>\n",
2445 |        "      <td>00:18</td>\n",
2446 |        "    </tr>\n",
2447 |        "    <tr>\n",
2448 |        "      <td>2</td>\n",
2449 |        "      <td>1.323350</td>\n",
2450 |        "      <td>3.941919</td>\n",
2451 |        "      <td>0.042250</td>\n",
2452 |        "      <td>0.542886</td>\n",
2453 |        "      <td>00:18</td>\n",
2454 |        "    </tr>\n",
2455 |        "    <tr>\n",
2456 |        "      <td>3</td>\n",
2457 |        "      <td>1.267578</td>\n",
2458 |        "      <td>3.100082</td>\n",
2459 |        "      <td>0.164418</td>\n",
2460 |        "      <td>0.588445</td>\n",
2461 |        "      <td>00:18</td>\n",
2462 |        "    </tr>\n",
2463 |        "    <tr>\n",
2464 |        "      <td>4</td>\n",
2465 |        "      <td>1.190820</td>\n",
2466 |        "      <td>2.658577</td>\n",
2467 |        "      <td>0.227030</td>\n",
2468 |        "      <td>0.714177</td>\n",
2469 |        "      <td>00:18</td>\n",
2470 |        "    </tr>\n",
2471 |        "    <tr>\n",
2472 |        "      <td>5</td>\n",
2473 |        "      <td>1.146419</td>\n",
2474 |        "      <td>2.336139</td>\n",
2475 |        "      <td>0.328582</td>\n",
2476 |        "      <td>0.795113</td>\n",
2477 |        "      <td>00:19</td>\n",
2478 |        "    </tr>\n",
2479 |        "    <tr>\n",
2480 |        "      <td>6</td>\n",
2481 |        "      <td>1.118836</td>\n",
2482 |        "      <td>2.850287</td>\n",
2483 |        "      <td>0.189107</td>\n",
2484 |        "      <td>0.712141</td>\n",
2485 |        "      <td>00:19</td>\n",
2486 |        "    </tr>\n",
2487 |        "    <tr>\n",
2488 |        "      <td>7</td>\n",
2489 |        "      <td>1.078408</td>\n",
2490 |        "      <td>2.145468</td>\n",
2491 |        "      <td>0.407228</td>\n",
2492 |        "      <td>0.847035</td>\n",
2493 |        "      <td>00:19</td>\n",
2494 |        "    </tr>\n",
2495 |        "    <tr>\n",
2496 |        "      <td>8</td>\n",
2497 |        "      <td>1.048037</td>\n",
2498 |        "      <td>2.526860</td>\n",
2499 |        "      <td>0.276661</td>\n",
2500 |        "      <td>0.741919</td>\n",
2501 |        "      <td>00:19</td>\n",
2502 |        "    </tr>\n",
2503 |        "    <tr>\n",
2504 |        "      <td>9</td>\n",
2505 |        "      <td>1.051319</td>\n",
2506 |        "      <td>2.374088</td>\n",
2507 |        "      <td>0.315856</td>\n",
2508 |        "      <td>0.797404</td>\n",
2509 |        "      <td>00:19</td>\n",
2510 |        "    </tr>\n",
2511 |        "    <tr>\n",
2512 |        "      <td>10</td>\n",
2513 |        "      <td>0.999648</td>\n",
2514 |        "      <td>2.133427</td>\n",
2515 |        "      <td>0.406210</td>\n",
2516 |        "      <td>0.829728</td>\n",
2517 |        "      <td>00:19</td>\n",
2518 |        "    </tr>\n",
2519 |        "    <tr>\n",
2520 |        "      <td>11</td>\n",
2521 |        "      <td>0.978107</td>\n",
2522 |        "      <td>1.897381</td>\n",
2523 |        "      <td>0.484093</td>\n",
2524 |        "      <td>0.889539</td>\n",
2525 |        "      <td>00:19</td>\n",
2526 |        "    </tr>\n",
2527 |        "    <tr>\n",
2528 |        "      <td>12</td>\n",
2529 |        "      <td>0.906650</td>\n",
2530 |        "      <td>2.031821</td>\n",
2531 |        "      <td>0.461441</td>\n",
2532 |        "      <td>0.871469</td>\n",
2533 |        "      <td>00:18</td>\n",
2534 |        "    </tr>\n",
2535 |        "    <tr>\n",
2536 |        "      <td>13</td>\n",
2537 |        "      <td>0.836670</td>\n",
2538 |        "      <td>1.864637</td>\n",
2539 |        "      <td>0.523797</td>\n",
2540 |        "      <td>0.886740</td>\n",
2541 |        "      <td>00:18</td>\n",
2542 |        "    </tr>\n",
2543 |        "    <tr>\n",
2544 |        "      <td>14</td>\n",
2545 |        "      <td>0.800843</td>\n",
2546 |        "      <td>1.744135</td>\n",
2547 |        "      <td>0.567065</td>\n",
2548 |        "      <td>0.906337</td>\n",
2549 |        "      <td>00:19</td>\n",
2550 |        "    </tr>\n",
2551 |        "  </tbody>\n",
2552 |        "</table>"
2553 |       ],
2554 |       "text/plain": [
2555 |        "<IPython.core.display.HTML object>"
2556 |       ]
2557 |      },
2558 |      "metadata": {},
2559 |      "output_type": "display_data"
2560 |     },
2561 |     {
2562 |      "name": "stdout",
2563 |      "output_type": "stream",
2564 |      "text": [
2565 |       "Run: 1\n"
2566 |      ]
2567 |     },
2568 |     {
2569 |      "data": {
2570 |       "text/html": [
2571 |        "<table border=\"1\" class=\"dataframe\">\n",
2572 |        "  <thead>\n",
2573 |        "    <tr style=\"text-align: left;\">\n",
2574 |        "      <th>epoch</th>\n",
2575 |        "      <th>train_loss</th>\n",
2576 |        "      <th>valid_loss</th>\n",
2577 |        "      <th>accuracy</th>\n",
2578 |        "      <th>top_k_accuracy</th>\n",
2579 |        "      <th>time</th>\n",
2580 |        "    </tr>\n",
2581 |        "  </thead>\n",
2582 |        "  <tbody>\n",
2583 |        "    <tr>\n",
2584 |        "      <td>0</td>\n",
2585 |        "      <td>1.568926</td>\n",
2586 |        "      <td>3.201440</td>\n",
2587 |        "      <td>0.038941</td>\n",
2588 |        "      <td>0.481038</td>\n",
2589 |        "      <td>00:19</td>\n",
2590 |        "    </tr>\n",
2591 |        "    <tr>\n",
2592 |        "      <td>1</td>\n",
2593 |        "      <td>1.430129</td>\n",
2594 |        "      <td>3.079170</td>\n",
2595 |        "      <td>0.083482</td>\n",
2596 |        "      <td>0.520489</td>\n",
2597 |        "      <td>00:18</td>\n",
2598 |        "    </tr>\n",
2599 |        "    <tr>\n",
2600 |        "      <td>2</td>\n",
2601 |        "      <td>1.314956</td>\n",
2602 |        "      <td>3.455348</td>\n",
2603 |        "      <td>0.047849</td>\n",
2604 |        "      <td>0.501145</td>\n",
2605 |        "      <td>00:18</td>\n",
2606 |        "    </tr>\n",
2607 |        "    <tr>\n",
2608 |        "      <td>3</td>\n",
2609 |        "      <td>1.237833</td>\n",
2610 |        "      <td>3.630859</td>\n",
2611 |        "      <td>0.062866</td>\n",
2612 |        "      <td>0.410028</td>\n",
2613 |        "      <td>00:18</td>\n",
2614 |        "    </tr>\n",
2615 |        "    <tr>\n",
2616 |        "      <td>4</td>\n",
2617 |        "      <td>1.202348</td>\n",
2618 |        "      <td>3.706586</td>\n",
2619 |        "      <td>0.118860</td>\n",
2620 |        "      <td>0.519980</td>\n",
2621 |        "      <td>00:18</td>\n",
2622 |        "    </tr>\n",
2623 |        "    <tr>\n",
2624 |        "      <td>5</td>\n",
2625 |        "      <td>1.147139</td>\n",
2626 |        "      <td>2.649355</td>\n",
2627 |        "      <td>0.237720</td>\n",
2628 |        "      <td>0.727412</td>\n",
2629 |        "      <td>00:19</td>\n",
2630 |        "    </tr>\n",
2631 |        "    <tr>\n",
2632 |        "      <td>6</td>\n",
2633 |        "      <td>1.108960</td>\n",
2634 |        "      <td>2.339426</td>\n",
2635 |        "      <td>0.310766</td>\n",
2636 |        "      <td>0.813439</td>\n",
2637 |        "      <td>00:18</td>\n",
2638 |        "    </tr>\n",
2639 |        "    <tr>\n",
2640 |        "      <td>7</td>\n",
2641 |        "      <td>1.067904</td>\n",
2642 |        "      <td>2.263319</td>\n",
2643 |        "      <td>0.372359</td>\n",
2644 |        "      <td>0.828710</td>\n",
2645 |        "      <td>00:18</td>\n",
2646 |        "    </tr>\n",
2647 |        "    <tr>\n",
2648 |        "      <td>8</td>\n",
2649 |        "      <td>1.042159</td>\n",
2650 |        "      <td>2.021785</td>\n",
2651 |        "      <td>0.444133</td>\n",
2652 |        "      <td>0.875032</td>\n",
2653 |        "      <td>00:19</td>\n",
2654 |        "    </tr>\n",
2655 |        "    <tr>\n",
2656 |        "      <td>9</td>\n",
2657 |        "      <td>1.015093</td>\n",
2658 |        "      <td>2.671152</td>\n",
2659 |        "      <td>0.263171</td>\n",
2660 |        "      <td>0.723339</td>\n",
2661 |        "      <td>00:19</td>\n",
2662 |        "    </tr>\n",
2663 |        "    <tr>\n",
2664 |        "      <td>10</td>\n",
2665 |        "      <td>0.997422</td>\n",
2666 |        "      <td>2.621575</td>\n",
2667 |        "      <td>0.254518</td>\n",
2668 |        "      <td>0.757699</td>\n",
2669 |        "      <td>00:18</td>\n",
2670 |        "    </tr>\n",
2671 |        "    <tr>\n",
2672 |        "      <td>11</td>\n",
2673 |        "      <td>0.979442</td>\n",
2674 |        "      <td>2.190845</td>\n",
2675 |        "      <td>0.434462</td>\n",
2676 |        "      <td>0.837872</td>\n",
2677 |        "      <td>00:18</td>\n",
2678 |        "    </tr>\n",
2679 |        "    <tr>\n",
2680 |        "      <td>12</td>\n",
2681 |        "      <td>0.912322</td>\n",
2682 |        "      <td>1.977628</td>\n",
2683 |        "      <td>0.490710</td>\n",
2684 |        "      <td>0.862051</td>\n",
2685 |        "      <td>00:18</td>\n",
2686 |        "    </tr>\n",
2687 |        "    <tr>\n",
2688 |        "      <td>13</td>\n",
2689 |        "      <td>0.833866</td>\n",
2690 |        "      <td>1.781970</td>\n",
2691 |        "      <td>0.557648</td>\n",
2692 |        "      <td>0.900993</td>\n",
2693 |        "      <td>00:19</td>\n",
2694 |        "    </tr>\n",
2695 |        "    <tr>\n",
2696 |        "      <td>14</td>\n",
2697 |        "      <td>0.789675</td>\n",
2698 |        "      <td>1.760421</td>\n",
2699 |        "      <td>0.567320</td>\n",
2700 |        "      <td>0.901247</td>\n",
2701 |        "      <td>00:18</td>\n",
2702 |        "    </tr>\n",
2703 |        "  </tbody>\n",
2704 |        "</table>"
2705 |       ],
2706 |       "text/plain": [
2707 |        "<IPython.core.display.HTML object>"
2708 |       ]
2709 |      },
2710 |      "metadata": {},
2711 |      "output_type": "display_data"
2712 |     },
2713 |     {
2714 |      "name": "stdout",
2715 |      "output_type": "stream",
2716 |      "text": [
2717 |       "Run: 2\n"
2718 |      ]
2719 |     },
2720 |     {
2721 |      "data": {
2722 |       "text/html": [
2723 |        "<table border=\"1\" class=\"dataframe\">\n",
2724 |        "  <thead>\n",
2725 |        "    <tr style=\"text-align: left;\">\n",
2726 |        "      <th>epoch</th>\n",
2727 |        "      <th>train_loss</th>\n",
2728 |        "      <th>valid_loss</th>\n",
2729 |        "      <th>accuracy</th>\n",
2730 |        "      <th>top_k_accuracy</th>\n",
2731 |        "      <th>time</th>\n",
2732 |        "    </tr>\n",
2733 |        "  </thead>\n",
2734 |        "  <tbody>\n",
2735 |        "    <tr>\n",
2736 |        "      <td>0</td>\n",
2737 |        "      <td>1.581555</td>\n",
2738 |        "      <td>3.089038</td>\n",
2739 |        "      <td>0.047086</td>\n",
2740 |        "      <td>0.465258</td>\n",
2741 |        "      <td>00:18</td>\n",
2742 |        "    </tr>\n",
2743 |        "    <tr>\n",
2744 |        "      <td>1</td>\n",
2745 |        "      <td>1.425198</td>\n",
2746 |        "      <td>3.232237</td>\n",
2747 |        "      <td>0.058794</td>\n",
2748 |        "      <td>0.478493</td>\n",
2749 |        "      <td>00:18</td>\n",
2750 |        "    </tr>\n",
2751 |        "    <tr>\n",
2752 |        "      <td>2</td>\n",
2753 |        "      <td>1.339247</td>\n",
2754 |        "      <td>2.751087</td>\n",
2755 |        "      <td>0.168236</td>\n",
2756 |        "      <td>0.620514</td>\n",
2757 |        "      <td>00:18</td>\n",
2758 |        "    </tr>\n",
2759 |        "    <tr>\n",
2760 |        "      <td>3</td>\n",
2761 |        "      <td>1.272282</td>\n",
2762 |        "      <td>2.690238</td>\n",
2763 |        "      <td>0.213286</td>\n",
2764 |        "      <td>0.664800</td>\n",
2765 |        "      <td>00:18</td>\n",
2766 |        "    </tr>\n",
2767 |        "    <tr>\n",
2768 |        "      <td>4</td>\n",
2769 |        "      <td>1.200665</td>\n",
2770 |        "      <td>3.445563</td>\n",
2771 |        "      <td>0.078391</td>\n",
2772 |        "      <td>0.573174</td>\n",
2773 |        "      <td>00:18</td>\n",
2774 |        "    </tr>\n",
2775 |        "    <tr>\n",
2776 |        "      <td>5</td>\n",
2777 |        "      <td>1.142999</td>\n",
2778 |        "      <td>2.443823</td>\n",
2779 |        "      <td>0.295495</td>\n",
2780 |        "      <td>0.752863</td>\n",
2781 |        "      <td>00:18</td>\n",
2782 |        "    </tr>\n",
2783 |        "    <tr>\n",
2784 |        "      <td>6</td>\n",
2785 |        "      <td>1.115349</td>\n",
2786 |        "      <td>2.237138</td>\n",
2787 |        "      <td>0.369051</td>\n",
2788 |        "      <td>0.809366</td>\n",
2789 |        "      <td>00:18</td>\n",
2790 |        "    </tr>\n",
2791 |        "    <tr>\n",
2792 |        "      <td>7</td>\n",
2793 |        "      <td>1.067307</td>\n",
2794 |        "      <td>2.606795</td>\n",
2795 |        "      <td>0.266989</td>\n",
2796 |        "      <td>0.720031</td>\n",
2797 |        "      <td>00:19</td>\n",
2798 |        "    </tr>\n",
2799 |        "    <tr>\n",
2800 |        "      <td>8</td>\n",
2801 |        "      <td>1.053232</td>\n",
2802 |        "      <td>2.296061</td>\n",
2803 |        "      <td>0.355307</td>\n",
2804 |        "      <td>0.792823</td>\n",
2805 |        "      <td>00:18</td>\n",
2806 |        "    </tr>\n",
2807 |        "    <tr>\n",
2808 |        "      <td>9</td>\n",
2809 |        "      <td>1.029087</td>\n",
2810 |        "      <td>2.112665</td>\n",
2811 |        "      <td>0.418682</td>\n",
2812 |        "      <td>0.855943</td>\n",
2813 |        "      <td>00:18</td>\n",
2814 |        "    </tr>\n",
2815 |        "    <tr>\n",
2816 |        "      <td>10</td>\n",
2817 |        "      <td>0.999695</td>\n",
2818 |        "      <td>2.200657</td>\n",
2819 |        "      <td>0.398575</td>\n",
2820 |        "      <td>0.795368</td>\n",
2821 |        "      <td>00:18</td>\n",
2822 |        "    </tr>\n",
2823 |        "    <tr>\n",
2824 |        "      <td>11</td>\n",
2825 |        "      <td>0.970600</td>\n",
2826 |        "      <td>2.090351</td>\n",
2827 |        "      <td>0.445915</td>\n",
2828 |        "      <td>0.838381</td>\n",
2829 |        "      <td>00:18</td>\n",
2830 |        "    </tr>\n",
2831 |        "    <tr>\n",
2832 |        "      <td>12</td>\n",
2833 |        "      <td>0.907420</td>\n",
2834 |        "      <td>2.011256</td>\n",
2835 |        "      <td>0.484856</td>\n",
2836 |        "      <td>0.849580</td>\n",
2837 |        "      <td>00:18</td>\n",
2838 |        "    </tr>\n",
2839 |        "    <tr>\n",
2840 |        "      <td>13</td>\n",
2841 |        "      <td>0.848490</td>\n",
2842 |        "      <td>1.828082</td>\n",
2843 |        "      <td>0.540850</td>\n",
2844 |        "      <td>0.893357</td>\n",
2845 |        "      <td>00:18</td>\n",
2846 |        "    </tr>\n",
2847 |        "    <tr>\n",
2848 |        "      <td>14</td>\n",
2849 |        "      <td>0.795542</td>\n",
2850 |        "      <td>1.785425</td>\n",
2851 |        "      <td>0.555612</td>\n",
2852 |        "      <td>0.893612</td>\n",
2853 |        "      <td>00:18</td>\n",
2854 |        "    </tr>\n",
2855 |        "  </tbody>\n",
2856 |        "</table>"
2857 |       ],
2858 |       "text/plain": [
2859 |        "<IPython.core.display.HTML object>"
2860 |       ]
2861 |      },
2862 |      "metadata": {},
2863 |      "output_type": "display_data"
2864 |     }
2865 |    ],
2866 |    "source": [
2867 |     "for run in range(runs):\n",
2868 |     "    print(f'Run: {run}')\n",
2869 |     "    learn = Learner(dbunch, model(c_out=20, pretrained=False, act_cls=torch.nn.ReLU, sa=sa, sym=sym, pool=pool), opt_func=opt_func, \\\n",
2870 |     "            metrics=[accuracy,top_k_accuracy], loss_func=LabelSmoothingCrossEntropy())\n",
2871 |     "\n",
2872 |     "    if fp16: learn = learn.to_fp16()\n",
2873 |     "    cbs = []\n",
2874 |     "\n",
2875 |     "    # Load weights generated from training on our pretext task\n",
2876 |     "    model_path = 'all_train_unsup_val_pretext_' + str(run) + '.pth'\n",
2877 |     "    state_dict = torch.load(model_path)\n",
2878 |     "    # HACK: If we don't have all of the parameters for our learner, we get an error\n",
2879 |     "    linear_layer = learn.model[-1]\n",
2880 |     "    state_dict['11.weight'] = linear_layer.weight\n",
2881 |     "    state_dict['11.bias'] = linear_layer.bias\n",
2882 |     "\n",
2883 |     "    learn.model.load_state_dict(state_dict)\n",
2884 |     "\n",
2885 |     "    learn.freeze()\n",
2886 |     "    learn.fit_flat_cos(epochs, lr, wd=1e-2, cbs=cbs)\n",
2887 |     "\n",
2888 |     "    del learn\n",
2889 |     "    torch.cuda.empty_cache() \n",
2890 |     "    gc.collect()  "
2891 |    ]
2892 |   },
2893 |   {
2894 |    "cell_type": "markdown",
2895 |    "metadata": {},
2896 |    "source": [
2897 |     "Results:\n",
2898 |     "- Run 1: 0.567065\n",
2899 |     "- Run 2: 0.567320\n",
2900 |     "- Run 3: 0.555612\n",
2901 |     "\n",
2902 |     "Average: **56.3%**\n"
2903 |    ]
2904 |   },
2905 |   {
2906 |    "cell_type": "markdown",
2907 |    "metadata": {},
2908 |    "source": [
2909 |     "## All data in `/train` and `/unsup`"
2910 |    ]
2911 |   },
2912 |   {
2913 |    "cell_type": "code",
2914 |    "execution_count": 17,
2915 |    "metadata": {},
2916 |    "outputs": [
2917 |     {
2918 |      "name": "stdout",
2919 |      "output_type": "stream",
2920 |      "text": [
2921 |       "Run: 0\n"
2922 |      ]
2923 |     },
2924 |     {
2925 |      "data": {
2926 |       "text/html": [
2927 |        "<table border=\"1\" class=\"dataframe\">\n",
2928 |        "  <thead>\n",
2929 |        "    <tr style=\"text-align: left;\">\n",
2930 |        "      <th>epoch</th>\n",
2931 |        "      <th>train_loss</th>\n",
2932 |        "      <th>valid_loss</th>\n",
2933 |        "      <th>accuracy</th>\n",
2934 |        "      <th>top_k_accuracy</th>\n",
2935 |        "      <th>time</th>\n",
2936 |        "    </tr>\n",
2937 |        "  </thead>\n",
2938 |        "  <tbody>\n",
2939 |        "    <tr>\n",
2940 |        "      <td>0</td>\n",
2941 |        "      <td>1.602850</td>\n",
2942 |        "      <td>3.211928</td>\n",
2943 |        "      <td>0.061848</td>\n",
2944 |        "      <td>0.520234</td>\n",
2945 |        "      <td>00:17</td>\n",
2946 |        "    </tr>\n",
2947 |        "    <tr>\n",
2948 |        "      <td>1</td>\n",
2949 |        "      <td>1.428863</td>\n",
2950 |        "      <td>2.790500</td>\n",
2951 |        "      <td>0.163909</td>\n",
2952 |        "      <td>0.611097</td>\n",
2953 |        "      <td>00:18</td>\n",
2954 |        "    </tr>\n",
2955 |        "    <tr>\n",
2956 |        "      <td>2</td>\n",
2957 |        "      <td>1.336136</td>\n",
2958 |        "      <td>3.666106</td>\n",
2959 |        "      <td>0.029015</td>\n",
2960 |        "      <td>0.350725</td>\n",
2961 |        "      <td>00:17</td>\n",
2962 |        "    </tr>\n",
2963 |        "    <tr>\n",
2964 |        "      <td>3</td>\n",
2965 |        "      <td>1.241302</td>\n",
2966 |        "      <td>2.805484</td>\n",
2967 |        "      <td>0.166455</td>\n",
2968 |        "      <td>0.617460</td>\n",
2969 |        "      <td>00:18</td>\n",
2970 |        "    </tr>\n",
2971 |        "    <tr>\n",
2972 |        "      <td>4</td>\n",
2973 |        "      <td>1.177933</td>\n",
2974 |        "      <td>2.845249</td>\n",
2975 |        "      <td>0.185798</td>\n",
2976 |        "      <td>0.640876</td>\n",
2977 |        "      <td>00:18</td>\n",
2978 |        "    </tr>\n",
2979 |        "    <tr>\n",
2980 |        "      <td>5</td>\n",
2981 |        "      <td>1.162077</td>\n",
2982 |        "      <td>2.421694</td>\n",
2983 |        "      <td>0.289896</td>\n",
2984 |        "      <td>0.761517</td>\n",
2985 |        "      <td>00:18</td>\n",
2986 |        "    </tr>\n",
2987 |        "    <tr>\n",
2988 |        "      <td>6</td>\n",
2989 |        "      <td>1.103601</td>\n",
2990 |        "      <td>2.232995</td>\n",
2991 |        "      <td>0.351998</td>\n",
2992 |        "      <td>0.804785</td>\n",
2993 |        "      <td>00:18</td>\n",
2994 |        "    </tr>\n",
2995 |        "    <tr>\n",
2996 |        "      <td>7</td>\n",
2997 |        "      <td>1.069577</td>\n",
2998 |        "      <td>2.269675</td>\n",
2999 |        "      <td>0.362433</td>\n",
3000 |        "      <td>0.840672</td>\n",
3001 |        "      <td>00:18</td>\n",
3002 |        "    </tr>\n",
3003 |        "    <tr>\n",
3004 |        "      <td>8</td>\n",
3005 |        "      <td>1.045862</td>\n",
3006 |        "      <td>2.452979</td>\n",
3007 |        "      <td>0.330109</td>\n",
3008 |        "      <td>0.739374</td>\n",
3009 |        "      <td>00:18</td>\n",
3010 |        "    </tr>\n",
3011 |        "    <tr>\n",
3012 |        "      <td>9</td>\n",
3013 |        "      <td>1.016141</td>\n",
3014 |        "      <td>2.519302</td>\n",
3015 |        "      <td>0.300585</td>\n",
3016 |        "      <td>0.735811</td>\n",
3017 |        "      <td>00:18</td>\n",
3018 |        "    </tr>\n",
3019 |        "    <tr>\n",
3020 |        "      <td>10</td>\n",
3021 |        "      <td>1.004404</td>\n",
3022 |        "      <td>2.698458</td>\n",
3023 |        "      <td>0.291168</td>\n",
3024 |        "      <td>0.698906</td>\n",
3025 |        "      <td>00:18</td>\n",
3026 |        "    </tr>\n",
3027 |        "    <tr>\n",
3028 |        "      <td>11</td>\n",
3029 |        "      <td>0.971225</td>\n",
3030 |        "      <td>1.930125</td>\n",
3031 |        "      <td>0.473912</td>\n",
3032 |        "      <td>0.877322</td>\n",
3033 |        "      <td>00:18</td>\n",
3034 |        "    </tr>\n",
3035 |        "    <tr>\n",
3036 |        "      <td>12</td>\n",
3037 |        "      <td>0.911982</td>\n",
3038 |        "      <td>1.883306</td>\n",
3039 |        "      <td>0.502163</td>\n",
3040 |        "      <td>0.881904</td>\n",
3041 |        "      <td>00:18</td>\n",
3042 |        "    </tr>\n",
3043 |        "    <tr>\n",
3044 |        "      <td>13</td>\n",
3045 |        "      <td>0.829162</td>\n",
3046 |        "      <td>1.775815</td>\n",
3047 |        "      <td>0.551794</td>\n",
3048 |        "      <td>0.897175</td>\n",
3049 |        "      <td>00:18</td>\n",
3050 |        "    </tr>\n",
3051 |        "    <tr>\n",
3052 |        "      <td>14</td>\n",
3053 |        "      <td>0.797153</td>\n",
3054 |        "      <td>1.750255</td>\n",
3055 |        "      <td>0.564011</td>\n",
3056 |        "      <td>0.901502</td>\n",
3057 |        "      <td>00:18</td>\n",
3058 |        "    </tr>\n",
3059 |        "  </tbody>\n",
3060 |        "</table>"
3061 |       ],
3062 |       "text/plain": [
3063 |        "<IPython.core.display.HTML object>"
3064 |       ]
3065 |      },
3066 |      "metadata": {},
3067 |      "output_type": "display_data"
3068 |     },
3069 |     {
3070 |      "name": "stdout",
3071 |      "output_type": "stream",
3072 |      "text": [
3073 |       "Run: 1\n"
3074 |      ]
3075 |     },
3076 |     {
3077 |      "data": {
3078 |       "text/html": [
3079 |        "<table border=\"1\" class=\"dataframe\">\n",
3080 |        "  <thead>\n",
3081 |        "    <tr style=\"text-align: left;\">\n",
3082 |        "      <th>epoch</th>\n",
3083 |        "      <th>train_loss</th>\n",
3084 |        "      <th>valid_loss</th>\n",
3085 |        "      <th>accuracy</th>\n",
3086 |        "      <th>top_k_accuracy</th>\n",
3087 |        "      <th>time</th>\n",
3088 |        "    </tr>\n",
3089 |        "  </thead>\n",
3090 |        "  <tbody>\n",
3091 |        "    <tr>\n",
3092 |        "      <td>0</td>\n",
3093 |        "      <td>1.638295</td>\n",
3094 |        "      <td>3.437557</td>\n",
3095 |        "      <td>0.021889</td>\n",
3096 |        "      <td>0.345890</td>\n",
3097 |        "      <td>00:18</td>\n",
3098 |        "    </tr>\n",
3099 |        "    <tr>\n",
3100 |        "      <td>1</td>\n",
3101 |        "      <td>1.447040</td>\n",
3102 |        "      <td>2.952383</td>\n",
3103 |        "      <td>0.118096</td>\n",
3104 |        "      <td>0.656401</td>\n",
3105 |        "      <td>00:18</td>\n",
3106 |        "    </tr>\n",
3107 |        "    <tr>\n",
3108 |        "      <td>2</td>\n",
3109 |        "      <td>1.340724</td>\n",
3110 |        "      <td>2.892893</td>\n",
3111 |        "      <td>0.145839</td>\n",
3112 |        "      <td>0.613388</td>\n",
3113 |        "      <td>00:18</td>\n",
3114 |        "    </tr>\n",
3115 |        "    <tr>\n",
3116 |        "      <td>3</td>\n",
3117 |        "      <td>1.264487</td>\n",
3118 |        "      <td>3.103402</td>\n",
3119 |        "      <td>0.131331</td>\n",
3120 |        "      <td>0.506236</td>\n",
3121 |        "      <td>00:18</td>\n",
3122 |        "    </tr>\n",
3123 |        "    <tr>\n",
3124 |        "      <td>4</td>\n",
3125 |        "      <td>1.203761</td>\n",
3126 |        "      <td>4.001534</td>\n",
3127 |        "      <td>0.045559</td>\n",
3128 |        "      <td>0.279969</td>\n",
3129 |        "      <td>00:17</td>\n",
3130 |        "    </tr>\n",
3131 |        "    <tr>\n",
3132 |        "      <td>5</td>\n",
3133 |        "      <td>1.159279</td>\n",
3134 |        "      <td>2.380309</td>\n",
3135 |        "      <td>0.320692</td>\n",
3136 |        "      <td>0.789005</td>\n",
3137 |        "      <td>00:18</td>\n",
3138 |        "    </tr>\n",
3139 |        "    <tr>\n",
3140 |        "      <td>6</td>\n",
3141 |        "      <td>1.105778</td>\n",
3142 |        "      <td>2.542387</td>\n",
3143 |        "      <td>0.278188</td>\n",
3144 |        "      <td>0.763808</td>\n",
3145 |        "      <td>00:18</td>\n",
3146 |        "    </tr>\n",
3147 |        "    <tr>\n",
3148 |        "      <td>7</td>\n",
3149 |        "      <td>1.080390</td>\n",
3150 |        "      <td>2.503495</td>\n",
3151 |        "      <td>0.301094</td>\n",
3152 |        "      <td>0.748028</td>\n",
3153 |        "      <td>00:19</td>\n",
3154 |        "    </tr>\n",
3155 |        "    <tr>\n",
3156 |        "      <td>8</td>\n",
3157 |        "      <td>1.028160</td>\n",
3158 |        "      <td>2.709562</td>\n",
3159 |        "      <td>0.254772</td>\n",
3160 |        "      <td>0.677526</td>\n",
3161 |        "      <td>00:18</td>\n",
3162 |        "    </tr>\n",
3163 |        "    <tr>\n",
3164 |        "      <td>9</td>\n",
3165 |        "      <td>1.036337</td>\n",
3166 |        "      <td>2.156838</td>\n",
3167 |        "      <td>0.396539</td>\n",
3168 |        "      <td>0.827182</td>\n",
3169 |        "      <td>00:19</td>\n",
3170 |        "    </tr>\n",
3171 |        "    <tr>\n",
3172 |        "      <td>10</td>\n",
3173 |        "      <td>1.018457</td>\n",
3174 |        "      <td>2.120152</td>\n",
3175 |        "      <td>0.422754</td>\n",
3176 |        "      <td>0.826419</td>\n",
3177 |        "      <td>00:19</td>\n",
3178 |        "    </tr>\n",
3179 |        "    <tr>\n",
3180 |        "      <td>11</td>\n",
3181 |        "      <td>0.975978</td>\n",
3182 |        "      <td>2.172145</td>\n",
3183 |        "      <td>0.409010</td>\n",
3184 |        "      <td>0.829219</td>\n",
3185 |        "      <td>00:19</td>\n",
3186 |        "    </tr>\n",
3187 |        "    <tr>\n",
3188 |        "      <td>12</td>\n",
3189 |        "      <td>0.899663</td>\n",
3190 |        "      <td>1.987048</td>\n",
3191 |        "      <td>0.494019</td>\n",
3192 |        "      <td>0.852125</td>\n",
3193 |        "      <td>00:18</td>\n",
3194 |        "    </tr>\n",
3195 |        "    <tr>\n",
3196 |        "      <td>13</td>\n",
3197 |        "      <td>0.838159</td>\n",
3198 |        "      <td>1.815443</td>\n",
3199 |        "      <td>0.544413</td>\n",
3200 |        "      <td>0.900229</td>\n",
3201 |        "      <td>00:18</td>\n",
3202 |        "    </tr>\n",
3203 |        "    <tr>\n",
3204 |        "      <td>14</td>\n",
3205 |        "      <td>0.797020</td>\n",
3206 |        "      <td>1.773857</td>\n",
3207 |        "      <td>0.556121</td>\n",
3208 |        "      <td>0.905828</td>\n",
3209 |        "      <td>00:18</td>\n",
3210 |        "    </tr>\n",
3211 |        "  </tbody>\n",
3212 |        "</table>"
3213 |       ],
3214 |       "text/plain": [
3215 |        "<IPython.core.display.HTML object>"
3216 |       ]
3217 |      },
3218 |      "metadata": {},
3219 |      "output_type": "display_data"
3220 |     },
3221 |     {
3222 |      "name": "stdout",
3223 |      "output_type": "stream",
3224 |      "text": [
3225 |       "Run: 2\n"
3226 |      ]
3227 |     },
3228 |     {
3229 |      "data": {
3230 |       "text/html": [
3231 |        "<table border=\"1\" class=\"dataframe\">\n",
3232 |        "  <thead>\n",
3233 |        "    <tr style=\"text-align: left;\">\n",
3234 |        "      <th>epoch</th>\n",
3235 |        "      <th>train_loss</th>\n",
3236 |        "      <th>valid_loss</th>\n",
3237 |        "      <th>accuracy</th>\n",
3238 |        "      <th>top_k_accuracy</th>\n",
3239 |        "      <th>time</th>\n",
3240 |        "    </tr>\n",
3241 |        "  </thead>\n",
3242 |        "  <tbody>\n",
3243 |        "    <tr>\n",
3244 |        "      <td>0</td>\n",
3245 |        "      <td>1.637182</td>\n",
3246 |        "      <td>3.337158</td>\n",
3247 |        "      <td>0.039450</td>\n",
3248 |        "      <td>0.444897</td>\n",
3249 |        "      <td>00:18</td>\n",
3250 |        "    </tr>\n",
3251 |        "    <tr>\n",
3252 |        "      <td>1</td>\n",
3253 |        "      <td>1.439949</td>\n",
3254 |        "      <td>2.875855</td>\n",
3255 |        "      <td>0.114533</td>\n",
3256 |        "      <td>0.589718</td>\n",
3257 |        "      <td>00:19</td>\n",
3258 |        "    </tr>\n",
3259 |        "    <tr>\n",
3260 |        "      <td>2</td>\n",
3261 |        "      <td>1.333174</td>\n",
3262 |        "      <td>2.860575</td>\n",
3263 |        "      <td>0.152711</td>\n",
3264 |        "      <td>0.588445</td>\n",
3265 |        "      <td>00:19</td>\n",
3266 |        "    </tr>\n",
3267 |        "    <tr>\n",
3268 |        "      <td>3</td>\n",
3269 |        "      <td>1.239065</td>\n",
3270 |        "      <td>2.408661</td>\n",
3271 |        "      <td>0.277170</td>\n",
3272 |        "      <td>0.768643</td>\n",
3273 |        "      <td>00:18</td>\n",
3274 |        "    </tr>\n",
3275 |        "    <tr>\n",
3276 |        "      <td>4</td>\n",
3277 |        "      <td>1.223965</td>\n",
3278 |        "      <td>2.996097</td>\n",
3279 |        "      <td>0.143293</td>\n",
3280 |        "      <td>0.577501</td>\n",
3281 |        "      <td>00:18</td>\n",
3282 |        "    </tr>\n",
3283 |        "    <tr>\n",
3284 |        "      <td>5</td>\n",
3285 |        "      <td>1.162042</td>\n",
3286 |        "      <td>2.423923</td>\n",
3287 |        "      <td>0.281242</td>\n",
3288 |        "      <td>0.789768</td>\n",
3289 |        "      <td>00:18</td>\n",
3290 |        "    </tr>\n",
3291 |        "    <tr>\n",
3292 |        "      <td>6</td>\n",
3293 |        "      <td>1.113972</td>\n",
3294 |        "      <td>2.210407</td>\n",
3295 |        "      <td>0.362433</td>\n",
3296 |        "      <td>0.832782</td>\n",
3297 |        "      <td>00:18</td>\n",
3298 |        "    </tr>\n",
3299 |        "    <tr>\n",
3300 |        "      <td>7</td>\n",
3301 |        "      <td>1.091237</td>\n",
3302 |        "      <td>2.087266</td>\n",
3303 |        "      <td>0.423008</td>\n",
3304 |        "      <td>0.843217</td>\n",
3305 |        "      <td>00:18</td>\n",
3306 |        "    </tr>\n",
3307 |        "    <tr>\n",
3308 |        "      <td>8</td>\n",
3309 |        "      <td>1.047078</td>\n",
3310 |        "      <td>2.546793</td>\n",
3311 |        "      <td>0.274370</td>\n",
3312 |        "      <td>0.712904</td>\n",
3313 |        "      <td>00:18</td>\n",
3314 |        "    </tr>\n",
3315 |        "    <tr>\n",
3316 |        "      <td>9</td>\n",
3317 |        "      <td>1.014250</td>\n",
3318 |        "      <td>2.401478</td>\n",
3319 |        "      <td>0.301349</td>\n",
3320 |        "      <td>0.810893</td>\n",
3321 |        "      <td>00:18</td>\n",
3322 |        "    </tr>\n",
3323 |        "    <tr>\n",
3324 |        "      <td>10</td>\n",
3325 |        "      <td>1.004290</td>\n",
3326 |        "      <td>2.988967</td>\n",
3327 |        "      <td>0.225757</td>\n",
3328 |        "      <td>0.645202</td>\n",
3329 |        "      <td>00:18</td>\n",
3330 |        "    </tr>\n",
3331 |        "    <tr>\n",
3332 |        "      <td>11</td>\n",
3333 |        "      <td>0.987600</td>\n",
3334 |        "      <td>2.008582</td>\n",
3335 |        "      <td>0.474421</td>\n",
3336 |        "      <td>0.856707</td>\n",
3337 |        "      <td>00:18</td>\n",
3338 |        "    </tr>\n",
3339 |        "    <tr>\n",
3340 |        "      <td>12</td>\n",
3341 |        "      <td>0.923478</td>\n",
3342 |        "      <td>1.959892</td>\n",
3343 |        "      <td>0.486638</td>\n",
3344 |        "      <td>0.865360</td>\n",
3345 |        "      <td>00:18</td>\n",
3346 |        "    </tr>\n",
3347 |        "    <tr>\n",
3348 |        "      <td>13</td>\n",
3349 |        "      <td>0.852061</td>\n",
3350 |        "      <td>1.831291</td>\n",
3351 |        "      <td>0.544413</td>\n",
3352 |        "      <td>0.888521</td>\n",
3353 |        "      <td>00:18</td>\n",
3354 |        "    </tr>\n",
3355 |        "    <tr>\n",
3356 |        "      <td>14</td>\n",
3357 |        "      <td>0.805299</td>\n",
3358 |        "      <td>1.774460</td>\n",
3359 |        "      <td>0.564520</td>\n",
3360 |        "      <td>0.899211</td>\n",
3361 |        "      <td>00:18</td>\n",
3362 |        "    </tr>\n",
3363 |        "  </tbody>\n",
3364 |        "</table>"
3365 |       ],
3366 |       "text/plain": [
3367 |        "<IPython.core.display.HTML object>"
3368 |       ]
3369 |      },
3370 |      "metadata": {},
3371 |      "output_type": "display_data"
3372 |     }
3373 |    ],
3374 |    "source": [
3375 |     "for run in range(runs):\n",
3376 |     "    print(f'Run: {run}')\n",
3377 |     "    learn = Learner(dbunch, model(c_out=20, pretrained=False, act_cls=torch.nn.ReLU, sa=sa, sym=sym, pool=pool), opt_func=opt_func, \\\n",
3378 |     "            metrics=[accuracy,top_k_accuracy], loss_func=LabelSmoothingCrossEntropy())\n",
3379 |     "\n",
3380 |     "    if fp16: learn = learn.to_fp16()\n",
3381 |     "    cbs = []\n",
3382 |     "\n",
3383 |     "    # Load weights generated from training on our pretext task\n",
3384 |     "    model_path = 'all_train_unsup_pretext_' + str(run) + '.pth'\n",
3385 |     "    state_dict = torch.load(model_path)\n",
3386 |     "    # HACK: If we don't have all of the parameters for our learner, we get an error\n",
3387 |     "    linear_layer = learn.model[-1]\n",
3388 |     "    state_dict['11.weight'] = linear_layer.weight\n",
3389 |     "    state_dict['11.bias'] = linear_layer.bias\n",
3390 |     "\n",
3391 |     "    learn.model.load_state_dict(state_dict)\n",
3392 |     "\n",
3393 |     "    learn.freeze()\n",
3394 |     "    learn.fit_flat_cos(epochs, lr, wd=1e-2, cbs=cbs)\n",
3395 |     "    \n",
3396 |     "    del learn\n",
3397 |     "    torch.cuda.empty_cache() \n",
3398 |     "    gc.collect()  "
3399 |    ]
3400 |   },
3401 |   {
3402 |    "cell_type": "markdown",
3403 |    "metadata": {},
3404 |    "source": [
3405 |     "Results:\n",
3406 |     "- Run 1: 0.564011\n",
3407 |     "- Run 2: 0.556121\n",
3408 |     "- Run 3: 0.564520\n",
3409 |     "\n",
3410 |     "Average: **56.2%**\n"
3411 |    ]
3412 |   },
3413 |   {
3414 |    "cell_type": "markdown",
3415 |    "metadata": {},
3416 |    "source": [
3417 |     "## All data in `/train`"
3418 |    ]
3419 |   },
3420 |   {
3421 |    "cell_type": "code",
3422 |    "execution_count": 18,
3423 |    "metadata": {},
3424 |    "outputs": [
3425 |     {
3426 |      "name": "stdout",
3427 |      "output_type": "stream",
3428 |      "text": [
3429 |       "Run: 0\n"
3430 |      ]
3431 |     },
3432 |     {
3433 |      "data": {
3434 |       "text/html": [
3435 |        "<table border=\"1\" class=\"dataframe\">\n",
3436 |        "  <thead>\n",
3437 |        "    <tr style=\"text-align: left;\">\n",
3438 |        "      <th>epoch</th>\n",
3439 |        "      <th>train_loss</th>\n",
3440 |        "      <th>valid_loss</th>\n",
3441 |        "      <th>accuracy</th>\n",
3442 |        "      <th>top_k_accuracy</th>\n",
3443 |        "      <th>time</th>\n",
3444 |        "    </tr>\n",
3445 |        "  </thead>\n",
3446 |        "  <tbody>\n",
3447 |        "    <tr>\n",
3448 |        "      <td>0</td>\n",
3449 |        "      <td>1.627793</td>\n",
3450 |        "      <td>3.362736</td>\n",
3451 |        "      <td>0.022652</td>\n",
3452 |        "      <td>0.570629</td>\n",
3453 |        "      <td>00:19</td>\n",
3454 |        "    </tr>\n",
3455 |        "    <tr>\n",
3456 |        "      <td>1</td>\n",
3457 |        "      <td>1.451993</td>\n",
3458 |        "      <td>3.474679</td>\n",
3459 |        "      <td>0.048104</td>\n",
3460 |        "      <td>0.400611</td>\n",
3461 |        "      <td>00:19</td>\n",
3462 |        "    </tr>\n",
3463 |        "    <tr>\n",
3464 |        "      <td>2</td>\n",
3465 |        "      <td>1.344181</td>\n",
3466 |        "      <td>3.008803</td>\n",
3467 |        "      <td>0.116315</td>\n",
3468 |        "      <td>0.540596</td>\n",
3469 |        "      <td>00:19</td>\n",
3470 |        "    </tr>\n",
3471 |        "    <tr>\n",
3472 |        "      <td>3</td>\n",
3473 |        "      <td>1.264943</td>\n",
3474 |        "      <td>3.061157</td>\n",
3475 |        "      <td>0.107406</td>\n",
3476 |        "      <td>0.564775</td>\n",
3477 |        "      <td>00:19</td>\n",
3478 |        "    </tr>\n",
3479 |        "    <tr>\n",
3480 |        "      <td>4</td>\n",
3481 |        "      <td>1.212386</td>\n",
3482 |        "      <td>3.232984</td>\n",
3483 |        "      <td>0.115042</td>\n",
3484 |        "      <td>0.481802</td>\n",
3485 |        "      <td>00:18</td>\n",
3486 |        "    </tr>\n",
3487 |        "    <tr>\n",
3488 |        "      <td>5</td>\n",
3489 |        "      <td>1.154960</td>\n",
3490 |        "      <td>2.205971</td>\n",
3491 |        "      <td>0.365487</td>\n",
3492 |        "      <td>0.837618</td>\n",
3493 |        "      <td>00:19</td>\n",
3494 |        "    </tr>\n",
3495 |        "    <tr>\n",
3496 |        "      <td>6</td>\n",
3497 |        "      <td>1.115693</td>\n",
3498 |        "      <td>2.266136</td>\n",
3499 |        "      <td>0.325783</td>\n",
3500 |        "      <td>0.802494</td>\n",
3501 |        "      <td>00:19</td>\n",
3502 |        "    </tr>\n",
3503 |        "    <tr>\n",
3504 |        "      <td>7</td>\n",
3505 |        "      <td>1.080417</td>\n",
3506 |        "      <td>2.650732</td>\n",
3507 |        "      <td>0.261899</td>\n",
3508 |        "      <td>0.726648</td>\n",
3509 |        "      <td>00:18</td>\n",
3510 |        "    </tr>\n",
3511 |        "    <tr>\n",
3512 |        "      <td>8</td>\n",
3513 |        "      <td>1.053103</td>\n",
3514 |        "      <td>2.763943</td>\n",
3515 |        "      <td>0.212777</td>\n",
3516 |        "      <td>0.724103</td>\n",
3517 |        "      <td>00:19</td>\n",
3518 |        "    </tr>\n",
3519 |        "    <tr>\n",
3520 |        "      <td>9</td>\n",
3521 |        "      <td>1.021855</td>\n",
3522 |        "      <td>2.384633</td>\n",
3523 |        "      <td>0.340799</td>\n",
3524 |        "      <td>0.782133</td>\n",
3525 |        "      <td>00:19</td>\n",
3526 |        "    </tr>\n",
3527 |        "    <tr>\n",
3528 |        "      <td>10</td>\n",
3529 |        "      <td>1.000220</td>\n",
3530 |        "      <td>2.818520</td>\n",
3531 |        "      <td>0.230339</td>\n",
3532 |        "      <td>0.635531</td>\n",
3533 |        "      <td>00:19</td>\n",
3534 |        "    </tr>\n",
3535 |        "    <tr>\n",
3536 |        "      <td>11</td>\n",
3537 |        "      <td>0.976686</td>\n",
3538 |        "      <td>2.211483</td>\n",
3539 |        "      <td>0.414609</td>\n",
3540 |        "      <td>0.815729</td>\n",
3541 |        "      <td>00:19</td>\n",
3542 |        "    </tr>\n",
3543 |        "    <tr>\n",
3544 |        "      <td>12</td>\n",
3545 |        "      <td>0.919176</td>\n",
3546 |        "      <td>1.833879</td>\n",
3547 |        "      <td>0.531942</td>\n",
3548 |        "      <td>0.890048</td>\n",
3549 |        "      <td>00:19</td>\n",
3550 |        "    </tr>\n",
3551 |        "    <tr>\n",
3552 |        "      <td>13</td>\n",
3553 |        "      <td>0.833864</td>\n",
3554 |        "      <td>1.800408</td>\n",
3555 |        "      <td>0.552049</td>\n",
3556 |        "      <td>0.895393</td>\n",
3557 |        "      <td>00:18</td>\n",
3558 |        "    </tr>\n",
3559 |        "    <tr>\n",
3560 |        "      <td>14</td>\n",
3561 |        "      <td>0.814029</td>\n",
3562 |        "      <td>1.783575</td>\n",
3563 |        "      <td>0.557139</td>\n",
3564 |        "      <td>0.902774</td>\n",
3565 |        "      <td>00:19</td>\n",
3566 |        "    </tr>\n",
3567 |        "  </tbody>\n",
3568 |        "</table>"
3569 |       ],
3570 |       "text/plain": [
3571 |        "<IPython.core.display.HTML object>"
3572 |       ]
3573 |      },
3574 |      "metadata": {},
3575 |      "output_type": "display_data"
3576 |     },
3577 |     {
3578 |      "name": "stdout",
3579 |      "output_type": "stream",
3580 |      "text": [
3581 |       "Run: 1\n"
3582 |      ]
3583 |     },
3584 |     {
3585 |      "data": {
3586 |       "text/html": [
3587 |        "<table border=\"1\" class=\"dataframe\">\n",
3588 |        "  <thead>\n",
3589 |        "    <tr style=\"text-align: left;\">\n",
3590 |        "      <th>epoch</th>\n",
3591 |        "      <th>train_loss</th>\n",
3592 |        "      <th>valid_loss</th>\n",
3593 |        "      <th>accuracy</th>\n",
3594 |        "      <th>top_k_accuracy</th>\n",
3595 |        "      <th>time</th>\n",
3596 |        "    </tr>\n",
3597 |        "  </thead>\n",
3598 |        "  <tbody>\n",
3599 |        "    <tr>\n",
3600 |        "      <td>0</td>\n",
3601 |        "      <td>1.628827</td>\n",
3602 |        "      <td>3.318213</td>\n",
3603 |        "      <td>0.043523</td>\n",
3604 |        "      <td>0.447697</td>\n",
3605 |        "      <td>00:18</td>\n",
3606 |        "    </tr>\n",
3607 |        "    <tr>\n",
3608 |        "      <td>1</td>\n",
3609 |        "      <td>1.447626</td>\n",
3610 |        "      <td>2.767823</td>\n",
3611 |        "      <td>0.147620</td>\n",
3612 |        "      <td>0.637567</td>\n",
3613 |        "      <td>00:19</td>\n",
3614 |        "    </tr>\n",
3615 |        "    <tr>\n",
3616 |        "      <td>2</td>\n",
3617 |        "      <td>1.355482</td>\n",
3618 |        "      <td>2.841080</td>\n",
3619 |        "      <td>0.156019</td>\n",
3620 |        "      <td>0.596589</td>\n",
3621 |        "      <td>00:18</td>\n",
3622 |        "    </tr>\n",
3623 |        "    <tr>\n",
3624 |        "      <td>3</td>\n",
3625 |        "      <td>1.271204</td>\n",
3626 |        "      <td>2.949238</td>\n",
3627 |        "      <td>0.164164</td>\n",
3628 |        "      <td>0.579537</td>\n",
3629 |        "      <td>00:19</td>\n",
3630 |        "    </tr>\n",
3631 |        "    <tr>\n",
3632 |        "      <td>4</td>\n",
3633 |        "      <td>1.218051</td>\n",
3634 |        "      <td>2.350754</td>\n",
3635 |        "      <td>0.322983</td>\n",
3636 |        "      <td>0.756172</td>\n",
3637 |        "      <td>00:19</td>\n",
3638 |        "    </tr>\n",
3639 |        "    <tr>\n",
3640 |        "      <td>5</td>\n",
3641 |        "      <td>1.166977</td>\n",
3642 |        "      <td>2.391598</td>\n",
3643 |        "      <td>0.317893</td>\n",
3644 |        "      <td>0.768389</td>\n",
3645 |        "      <td>00:19</td>\n",
3646 |        "    </tr>\n",
3647 |        "    <tr>\n",
3648 |        "      <td>6</td>\n",
3649 |        "      <td>1.136429</td>\n",
3650 |        "      <td>2.395736</td>\n",
3651 |        "      <td>0.324256</td>\n",
3652 |        "      <td>0.767625</td>\n",
3653 |        "      <td>00:19</td>\n",
3654 |        "    </tr>\n",
3655 |        "    <tr>\n",
3656 |        "      <td>7</td>\n",
3657 |        "      <td>1.077798</td>\n",
3658 |        "      <td>2.595934</td>\n",
3659 |        "      <td>0.262153</td>\n",
3660 |        "      <td>0.704759</td>\n",
3661 |        "      <td>00:19</td>\n",
3662 |        "    </tr>\n",
3663 |        "    <tr>\n",
3664 |        "      <td>8</td>\n",
3665 |        "      <td>1.054319</td>\n",
3666 |        "      <td>2.576859</td>\n",
3667 |        "      <td>0.273352</td>\n",
3668 |        "      <td>0.703741</td>\n",
3669 |        "      <td>00:19</td>\n",
3670 |        "    </tr>\n",
3671 |        "    <tr>\n",
3672 |        "      <td>9</td>\n",
3673 |        "      <td>1.022132</td>\n",
3674 |        "      <td>2.658796</td>\n",
3675 |        "      <td>0.260626</td>\n",
3676 |        "      <td>0.696360</td>\n",
3677 |        "      <td>00:18</td>\n",
3678 |        "    </tr>\n",
3679 |        "    <tr>\n",
3680 |        "      <td>10</td>\n",
3681 |        "      <td>1.008774</td>\n",
3682 |        "      <td>2.549793</td>\n",
3683 |        "      <td>0.316875</td>\n",
3684 |        "      <td>0.737083</td>\n",
3685 |        "      <td>00:18</td>\n",
3686 |        "    </tr>\n",
3687 |        "    <tr>\n",
3688 |        "      <td>11</td>\n",
3689 |        "      <td>0.982686</td>\n",
3690 |        "      <td>2.003919</td>\n",
3691 |        "      <td>0.476457</td>\n",
3692 |        "      <td>0.864597</td>\n",
3693 |        "      <td>00:18</td>\n",
3694 |        "    </tr>\n",
3695 |        "    <tr>\n",
3696 |        "      <td>12</td>\n",
3697 |        "      <td>0.914450</td>\n",
3698 |        "      <td>1.894943</td>\n",
3699 |        "      <td>0.517944</td>\n",
3700 |        "      <td>0.874523</td>\n",
3701 |        "      <td>00:19</td>\n",
3702 |        "    </tr>\n",
3703 |        "    <tr>\n",
3704 |        "      <td>13</td>\n",
3705 |        "      <td>0.841279</td>\n",
3706 |        "      <td>1.777462</td>\n",
3707 |        "      <td>0.561466</td>\n",
3708 |        "      <td>0.897938</td>\n",
3709 |        "      <td>00:19</td>\n",
3710 |        "    </tr>\n",
3711 |        "    <tr>\n",
3712 |        "      <td>14</td>\n",
3713 |        "      <td>0.802985</td>\n",
3714 |        "      <td>1.792379</td>\n",
3715 |        "      <td>0.554594</td>\n",
3716 |        "      <td>0.895648</td>\n",
3717 |        "      <td>00:19</td>\n",
3718 |        "    </tr>\n",
3719 |        "  </tbody>\n",
3720 |        "</table>"
3721 |       ],
3722 |       "text/plain": [
3723 |        "<IPython.core.display.HTML object>"
3724 |       ]
3725 |      },
3726 |      "metadata": {},
3727 |      "output_type": "display_data"
3728 |     },
3729 |     {
3730 |      "name": "stdout",
3731 |      "output_type": "stream",
3732 |      "text": [
3733 |       "Run: 2\n"
3734 |      ]
3735 |     },
3736 |     {
3737 |      "data": {
3738 |       "text/html": [
3739 |        "<table border=\"1\" class=\"dataframe\">\n",
3740 |        "  <thead>\n",
3741 |        "    <tr style=\"text-align: left;\">\n",
3742 |        "      <th>epoch</th>\n",
3743 |        "      <th>train_loss</th>\n",
3744 |        "      <th>valid_loss</th>\n",
3745 |        "      <th>accuracy</th>\n",
3746 |        "      <th>top_k_accuracy</th>\n",
3747 |        "      <th>time</th>\n",
3748 |        "    </tr>\n",
3749 |        "  </thead>\n",
3750 |        "  <tbody>\n",
3751 |        "    <tr>\n",
3752 |        "      <td>0</td>\n",
3753 |        "      <td>1.620282</td>\n",
3754 |        "      <td>3.367476</td>\n",
3755 |        "      <td>0.032069</td>\n",
3756 |        "      <td>0.375668</td>\n",
3757 |        "      <td>00:18</td>\n",
3758 |        "    </tr>\n",
3759 |        "    <tr>\n",
3760 |        "      <td>1</td>\n",
3761 |        "      <td>1.441924</td>\n",
3762 |        "      <td>3.095998</td>\n",
3763 |        "      <td>0.071265</td>\n",
3764 |        "      <td>0.540341</td>\n",
3765 |        "      <td>00:19</td>\n",
3766 |        "    </tr>\n",
3767 |        "    <tr>\n",
3768 |        "      <td>2</td>\n",
3769 |        "      <td>1.353013</td>\n",
3770 |        "      <td>3.000089</td>\n",
3771 |        "      <td>0.160601</td>\n",
3772 |        "      <td>0.547468</td>\n",
3773 |        "      <td>00:19</td>\n",
3774 |        "    </tr>\n",
3775 |        "    <tr>\n",
3776 |        "      <td>3</td>\n",
3777 |        "      <td>1.266711</td>\n",
3778 |        "      <td>2.898040</td>\n",
3779 |        "      <td>0.152456</td>\n",
3780 |        "      <td>0.672436</td>\n",
3781 |        "      <td>00:19</td>\n",
3782 |        "    </tr>\n",
3783 |        "    <tr>\n",
3784 |        "      <td>4</td>\n",
3785 |        "      <td>1.204563</td>\n",
3786 |        "      <td>2.673355</td>\n",
3787 |        "      <td>0.213795</td>\n",
3788 |        "      <td>0.657928</td>\n",
3789 |        "      <td>00:18</td>\n",
3790 |        "    </tr>\n",
3791 |        "    <tr>\n",
3792 |        "      <td>5</td>\n",
3793 |        "      <td>1.155093</td>\n",
3794 |        "      <td>2.352402</td>\n",
3795 |        "      <td>0.317638</td>\n",
3796 |        "      <td>0.780606</td>\n",
3797 |        "      <td>00:18</td>\n",
3798 |        "    </tr>\n",
3799 |        "    <tr>\n",
3800 |        "      <td>6</td>\n",
3801 |        "      <td>1.113702</td>\n",
3802 |        "      <td>2.099077</td>\n",
3803 |        "      <td>0.386358</td>\n",
3804 |        "      <td>0.858488</td>\n",
3805 |        "      <td>00:18</td>\n",
3806 |        "    </tr>\n",
3807 |        "    <tr>\n",
3808 |        "      <td>7</td>\n",
3809 |        "      <td>1.098539</td>\n",
3810 |        "      <td>2.100349</td>\n",
3811 |        "      <td>0.419700</td>\n",
3812 |        "      <td>0.848053</td>\n",
3813 |        "      <td>00:19</td>\n",
3814 |        "    </tr>\n",
3815 |        "    <tr>\n",
3816 |        "      <td>8</td>\n",
3817 |        "      <td>1.030218</td>\n",
3818 |        "      <td>2.428787</td>\n",
3819 |        "      <td>0.337490</td>\n",
3820 |        "      <td>0.754645</td>\n",
3821 |        "      <td>00:19</td>\n",
3822 |        "    </tr>\n",
3823 |        "    <tr>\n",
3824 |        "      <td>9</td>\n",
3825 |        "      <td>1.013681</td>\n",
3826 |        "      <td>2.954827</td>\n",
3827 |        "      <td>0.223721</td>\n",
3828 |        "      <td>0.673454</td>\n",
3829 |        "      <td>00:18</td>\n",
3830 |        "    </tr>\n",
3831 |        "    <tr>\n",
3832 |        "      <td>10</td>\n",
3833 |        "      <td>0.997192</td>\n",
3834 |        "      <td>2.666405</td>\n",
3835 |        "      <td>0.253754</td>\n",
3836 |        "      <td>0.708068</td>\n",
3837 |        "      <td>00:18</td>\n",
3838 |        "    </tr>\n",
3839 |        "    <tr>\n",
3840 |        "      <td>11</td>\n",
3841 |        "      <td>0.975269</td>\n",
3842 |        "      <td>2.070158</td>\n",
3843 |        "      <td>0.437770</td>\n",
3844 |        "      <td>0.851362</td>\n",
3845 |        "      <td>00:18</td>\n",
3846 |        "    </tr>\n",
3847 |        "    <tr>\n",
3848 |        "      <td>12</td>\n",
3849 |        "      <td>0.908841</td>\n",
3850 |        "      <td>1.920864</td>\n",
3851 |        "      <td>0.501654</td>\n",
3852 |        "      <td>0.873505</td>\n",
3853 |        "      <td>00:18</td>\n",
3854 |        "    </tr>\n",
3855 |        "    <tr>\n",
3856 |        "      <td>13</td>\n",
3857 |        "      <td>0.837699</td>\n",
3858 |        "      <td>1.803132</td>\n",
3859 |        "      <td>0.548486</td>\n",
3860 |        "      <td>0.895393</td>\n",
3861 |        "      <td>00:18</td>\n",
3862 |        "    </tr>\n",
3863 |        "    <tr>\n",
3864 |        "      <td>14</td>\n",
3865 |        "      <td>0.798381</td>\n",
3866 |        "      <td>1.765594</td>\n",
3867 |        "      <td>0.557903</td>\n",
3868 |        "      <td>0.905065</td>\n",
3869 |        "      <td>00:18</td>\n",
3870 |        "    </tr>\n",
3871 |        "  </tbody>\n",
3872 |        "</table>"
3873 |       ],
3874 |       "text/plain": [
3875 |        "<IPython.core.display.HTML object>"
3876 |       ]
3877 |      },
3878 |      "metadata": {},
3879 |      "output_type": "display_data"
3880 |     }
3881 |    ],
3882 |    "source": [
3883 |     "for run in range(runs):\n",
3884 |     "    print(f'Run: {run}')\n",
3885 |     "    learn = Learner(dbunch, model(c_out=20, pretrained=False, act_cls=torch.nn.ReLU, sa=sa, sym=sym, pool=pool), opt_func=opt_func, \\\n",
3886 |     "            metrics=[accuracy,top_k_accuracy], loss_func=LabelSmoothingCrossEntropy())\n",
3887 |     "\n",
3888 |     "    if fp16: learn = learn.to_fp16()\n",
3889 |     "    cbs = []\n",
3890 |     "\n",
3891 |     "    # Load weights generated from training on our pretext task\n",
3892 |     "    model_path = 'all_train_pretext_' + str(run) + '.pth'\n",
3893 |     "    state_dict = torch.load(model_path)\n",
3894 |     "    # HACK: If we don't have all of the parameters for our learner, we get an error\n",
3895 |     "    linear_layer = learn.model[-1]\n",
3896 |     "    state_dict['11.weight'] = linear_layer.weight\n",
3897 |     "    state_dict['11.bias'] = linear_layer.bias\n",
3898 |     "\n",
3899 |     "    learn.model.load_state_dict(state_dict)\n",
3900 |     "\n",
3901 |     "    learn.freeze()\n",
3902 |     "    learn.fit_flat_cos(epochs, lr, wd=1e-2, cbs=cbs)\n",
3903 |     "\n",
3904 |     "    del learn\n",
3905 |     "    torch.cuda.empty_cache() \n",
3906 |     "    gc.collect()  \n"
3907 |    ]
3908 |   },
3909 |   {
3910 |    "cell_type": "markdown",
3911 |    "metadata": {},
3912 |    "source": [
3913 |     "Results:\n",
3914 |     "- Run 1: 0.557139\n",
3915 |     "- Run 2: 0.554594\n",
3916 |     "- Run 3: 0.557903\n",
3917 |     "\n",
3918 |     "Average: **55.7%**\n"
3919 |    ]
3920 |   },
3921 |   {
3922 |    "cell_type": "markdown",
3923 |    "metadata": {},
3924 |    "source": [
3925 |     "## Partial data from `/train`"
3926 |    ]
3927 |   },
3928 |   {
3929 |    "cell_type": "code",
3930 |    "execution_count": 19,
3931 |    "metadata": {
3932 |     "scrolled": false
3933 |    },
3934 |    "outputs": [
3935 |     {
3936 |      "name": "stdout",
3937 |      "output_type": "stream",
3938 |      "text": [
3939 |       "Run: 0\n"
3940 |      ]
3941 |     },
3942 |     {
3943 |      "data": {
3944 |       "text/html": [
3945 |        "<table border=\"1\" class=\"dataframe\">\n",
3946 |        "  <thead>\n",
3947 |        "    <tr style=\"text-align: left;\">\n",
3948 |        "      <th>epoch</th>\n",
3949 |        "      <th>train_loss</th>\n",
3950 |        "      <th>valid_loss</th>\n",
3951 |        "      <th>accuracy</th>\n",
3952 |        "      <th>top_k_accuracy</th>\n",
3953 |        "      <th>time</th>\n",
3954 |        "    </tr>\n",
3955 |        "  </thead>\n",
3956 |        "  <tbody>\n",
3957 |        "    <tr>\n",
3958 |        "      <td>0</td>\n",
3959 |        "      <td>1.797130</td>\n",
3960 |        "      <td>3.778669</td>\n",
3961 |        "      <td>0.007636</td>\n",
3962 |        "      <td>0.340036</td>\n",
3963 |        "      <td>00:18</td>\n",
3964 |        "    </tr>\n",
3965 |        "    <tr>\n",
3966 |        "      <td>1</td>\n",
3967 |        "      <td>1.524488</td>\n",
3968 |        "      <td>3.360474</td>\n",
3969 |        "      <td>0.030797</td>\n",
3970 |        "      <td>0.460422</td>\n",
3971 |        "      <td>00:18</td>\n",
3972 |        "    </tr>\n",
3973 |        "    <tr>\n",
3974 |        "      <td>2</td>\n",
3975 |        "      <td>1.406890</td>\n",
3976 |        "      <td>3.524480</td>\n",
3977 |        "      <td>0.086027</td>\n",
3978 |        "      <td>0.562230</td>\n",
3979 |        "      <td>00:19</td>\n",
3980 |        "    </tr>\n",
3981 |        "    <tr>\n",
3982 |        "      <td>3</td>\n",
3983 |        "      <td>1.337326</td>\n",
3984 |        "      <td>3.171107</td>\n",
3985 |        "      <td>0.088063</td>\n",
3986 |        "      <td>0.449224</td>\n",
3987 |        "      <td>00:19</td>\n",
3988 |        "    </tr>\n",
3989 |        "    <tr>\n",
3990 |        "      <td>4</td>\n",
3991 |        "      <td>1.259828</td>\n",
3992 |        "      <td>2.522374</td>\n",
3993 |        "      <td>0.240774</td>\n",
3994 |        "      <td>0.718249</td>\n",
3995 |        "      <td>00:19</td>\n",
3996 |        "    </tr>\n",
3997 |        "    <tr>\n",
3998 |        "      <td>5</td>\n",
3999 |        "      <td>1.201898</td>\n",
4000 |        "      <td>2.279533</td>\n",
4001 |        "      <td>0.327055</td>\n",
4002 |        "      <td>0.807330</td>\n",
4003 |        "      <td>00:18</td>\n",
4004 |        "    </tr>\n",
4005 |        "    <tr>\n",
4006 |        "      <td>6</td>\n",
4007 |        "      <td>1.146901</td>\n",
4008 |        "      <td>2.474758</td>\n",
4009 |        "      <td>0.282006</td>\n",
4010 |        "      <td>0.788496</td>\n",
4011 |        "      <td>00:18</td>\n",
4012 |        "    </tr>\n",
4013 |        "    <tr>\n",
4014 |        "      <td>7</td>\n",
4015 |        "      <td>1.122496</td>\n",
4016 |        "      <td>2.544470</td>\n",
4017 |        "      <td>0.246882</td>\n",
4018 |        "      <td>0.730975</td>\n",
4019 |        "      <td>00:18</td>\n",
4020 |        "    </tr>\n",
4021 |        "    <tr>\n",
4022 |        "      <td>8</td>\n",
4023 |        "      <td>1.072612</td>\n",
4024 |        "      <td>3.057313</td>\n",
4025 |        "      <td>0.177399</td>\n",
4026 |        "      <td>0.556885</td>\n",
4027 |        "      <td>00:18</td>\n",
4028 |        "    </tr>\n",
4029 |        "    <tr>\n",
4030 |        "      <td>9</td>\n",
4031 |        "      <td>1.063244</td>\n",
4032 |        "      <td>2.605919</td>\n",
4033 |        "      <td>0.285060</td>\n",
4034 |        "      <td>0.759481</td>\n",
4035 |        "      <td>00:18</td>\n",
4036 |        "    </tr>\n",
4037 |        "    <tr>\n",
4038 |        "      <td>10</td>\n",
4039 |        "      <td>1.028191</td>\n",
4040 |        "      <td>2.512052</td>\n",
4041 |        "      <td>0.297022</td>\n",
4042 |        "      <td>0.757699</td>\n",
4043 |        "      <td>00:18</td>\n",
4044 |        "    </tr>\n",
4045 |        "    <tr>\n",
4046 |        "      <td>11</td>\n",
4047 |        "      <td>1.003204</td>\n",
4048 |        "      <td>2.184387</td>\n",
4049 |        "      <td>0.391703</td>\n",
4050 |        "      <td>0.820311</td>\n",
4051 |        "      <td>00:18</td>\n",
4052 |        "    </tr>\n",
4053 |        "    <tr>\n",
4054 |        "      <td>12</td>\n",
4055 |        "      <td>0.936490</td>\n",
4056 |        "      <td>2.031955</td>\n",
4057 |        "      <td>0.455078</td>\n",
4058 |        "      <td>0.852125</td>\n",
4059 |        "      <td>00:18</td>\n",
4060 |        "    </tr>\n",
4061 |        "    <tr>\n",
4062 |        "      <td>13</td>\n",
4063 |        "      <td>0.857810</td>\n",
4064 |        "      <td>1.869483</td>\n",
4065 |        "      <td>0.529142</td>\n",
4066 |        "      <td>0.881904</td>\n",
4067 |        "      <td>00:18</td>\n",
4068 |        "    </tr>\n",
4069 |        "    <tr>\n",
4070 |        "      <td>14</td>\n",
4071 |        "      <td>0.808324</td>\n",
4072 |        "      <td>1.850018</td>\n",
4073 |        "      <td>0.531942</td>\n",
4074 |        "      <td>0.893103</td>\n",
4075 |        "      <td>00:18</td>\n",
4076 |        "    </tr>\n",
4077 |        "  </tbody>\n",
4078 |        "</table>"
4079 |       ],
4080 |       "text/plain": [
4081 |        "<IPython.core.display.HTML object>"
4082 |       ]
4083 |      },
4084 |      "metadata": {},
4085 |      "output_type": "display_data"
4086 |     },
4087 |     {
4088 |      "name": "stdout",
4089 |      "output_type": "stream",
4090 |      "text": [
4091 |       "Run: 1\n"
4092 |      ]
4093 |     },
4094 |     {
4095 |      "data": {
4096 |       "text/html": [
4097 |        "<table border=\"1\" class=\"dataframe\">\n",
4098 |        "  <thead>\n",
4099 |        "    <tr style=\"text-align: left;\">\n",
4100 |        "      <th>epoch</th>\n",
4101 |        "      <th>train_loss</th>\n",
4102 |        "      <th>valid_loss</th>\n",
4103 |        "      <th>accuracy</th>\n",
4104 |        "      <th>top_k_accuracy</th>\n",
4105 |        "      <th>time</th>\n",
4106 |        "    </tr>\n",
4107 |        "  </thead>\n",
4108 |        "  <tbody>\n",
4109 |        "    <tr>\n",
4110 |        "      <td>0</td>\n",
4111 |        "      <td>1.780323</td>\n",
4112 |        "      <td>3.410928</td>\n",
4113 |        "      <td>0.060066</td>\n",
4114 |        "      <td>0.558666</td>\n",
4115 |        "      <td>00:18</td>\n",
4116 |        "    </tr>\n",
4117 |        "    <tr>\n",
4118 |        "      <td>1</td>\n",
4119 |        "      <td>1.539562</td>\n",
4120 |        "      <td>3.149061</td>\n",
4121 |        "      <td>0.067956</td>\n",
4122 |        "      <td>0.473912</td>\n",
4123 |        "      <td>00:18</td>\n",
4124 |        "    </tr>\n",
4125 |        "    <tr>\n",
4126 |        "      <td>2</td>\n",
4127 |        "      <td>1.412005</td>\n",
4128 |        "      <td>3.066640</td>\n",
4129 |        "      <td>0.086791</td>\n",
4130 |        "      <td>0.507254</td>\n",
4131 |        "      <td>00:18</td>\n",
4132 |        "    </tr>\n",
4133 |        "    <tr>\n",
4134 |        "      <td>3</td>\n",
4135 |        "      <td>1.350727</td>\n",
4136 |        "      <td>3.625888</td>\n",
4137 |        "      <td>0.050395</td>\n",
4138 |        "      <td>0.338763</td>\n",
4139 |        "      <td>00:19</td>\n",
4140 |        "    </tr>\n",
4141 |        "    <tr>\n",
4142 |        "      <td>4</td>\n",
4143 |        "      <td>1.245407</td>\n",
4144 |        "      <td>3.159899</td>\n",
4145 |        "      <td>0.135149</td>\n",
4146 |        "      <td>0.535251</td>\n",
4147 |        "      <td>00:18</td>\n",
4148 |        "    </tr>\n",
4149 |        "    <tr>\n",
4150 |        "      <td>5</td>\n",
4151 |        "      <td>1.208371</td>\n",
4152 |        "      <td>2.604892</td>\n",
4153 |        "      <td>0.254772</td>\n",
4154 |        "      <td>0.753118</td>\n",
4155 |        "      <td>00:18</td>\n",
4156 |        "    </tr>\n",
4157 |        "    <tr>\n",
4158 |        "      <td>6</td>\n",
4159 |        "      <td>1.166424</td>\n",
4160 |        "      <td>2.375758</td>\n",
4161 |        "      <td>0.324256</td>\n",
4162 |        "      <td>0.765844</td>\n",
4163 |        "      <td>00:18</td>\n",
4164 |        "    </tr>\n",
4165 |        "    <tr>\n",
4166 |        "      <td>7</td>\n",
4167 |        "      <td>1.107868</td>\n",
4168 |        "      <td>2.270139</td>\n",
4169 |        "      <td>0.352507</td>\n",
4170 |        "      <td>0.794604</td>\n",
4171 |        "      <td>00:18</td>\n",
4172 |        "    </tr>\n",
4173 |        "    <tr>\n",
4174 |        "      <td>8</td>\n",
4175 |        "      <td>1.097099</td>\n",
4176 |        "      <td>2.424599</td>\n",
4177 |        "      <td>0.320438</td>\n",
4178 |        "      <td>0.756681</td>\n",
4179 |        "      <td>00:18</td>\n",
4180 |        "    </tr>\n",
4181 |        "    <tr>\n",
4182 |        "      <td>9</td>\n",
4183 |        "      <td>1.049574</td>\n",
4184 |        "      <td>2.268082</td>\n",
4185 |        "      <td>0.380249</td>\n",
4186 |        "      <td>0.818529</td>\n",
4187 |        "      <td>00:18</td>\n",
4188 |        "    </tr>\n",
4189 |        "    <tr>\n",
4190 |        "      <td>10</td>\n",
4191 |        "      <td>1.026168</td>\n",
4192 |        "      <td>2.483929</td>\n",
4193 |        "      <td>0.304658</td>\n",
4194 |        "      <td>0.754390</td>\n",
4195 |        "      <td>00:18</td>\n",
4196 |        "    </tr>\n",
4197 |        "    <tr>\n",
4198 |        "      <td>11</td>\n",
4199 |        "      <td>0.998369</td>\n",
4200 |        "      <td>2.144263</td>\n",
4201 |        "      <td>0.429371</td>\n",
4202 |        "      <td>0.833291</td>\n",
4203 |        "      <td>00:18</td>\n",
4204 |        "    </tr>\n",
4205 |        "    <tr>\n",
4206 |        "      <td>12</td>\n",
4207 |        "      <td>0.932811</td>\n",
4208 |        "      <td>2.080014</td>\n",
4209 |        "      <td>0.457114</td>\n",
4210 |        "      <td>0.844999</td>\n",
4211 |        "      <td>00:19</td>\n",
4212 |        "    </tr>\n",
4213 |        "    <tr>\n",
4214 |        "      <td>13</td>\n",
4215 |        "      <td>0.852301</td>\n",
4216 |        "      <td>1.910314</td>\n",
4217 |        "      <td>0.500127</td>\n",
4218 |        "      <td>0.877577</td>\n",
4219 |        "      <td>00:18</td>\n",
4220 |        "    </tr>\n",
4221 |        "    <tr>\n",
4222 |        "      <td>14</td>\n",
4223 |        "      <td>0.812425</td>\n",
4224 |        "      <td>1.897508</td>\n",
4225 |        "      <td>0.515398</td>\n",
4226 |        "      <td>0.886740</td>\n",
4227 |        "      <td>00:18</td>\n",
4228 |        "    </tr>\n",
4229 |        "  </tbody>\n",
4230 |        "</table>"
4231 |       ],
4232 |       "text/plain": [
4233 |        "<IPython.core.display.HTML object>"
4234 |       ]
4235 |      },
4236 |      "metadata": {},
4237 |      "output_type": "display_data"
4238 |     },
4239 |     {
4240 |      "name": "stdout",
4241 |      "output_type": "stream",
4242 |      "text": [
4243 |       "Run: 2\n"
4244 |      ]
4245 |     },
4246 |     {
4247 |      "data": {
4248 |       "text/html": [
4249 |        "<table border=\"1\" class=\"dataframe\">\n",
4250 |        "  <thead>\n",
4251 |        "    <tr style=\"text-align: left;\">\n",
4252 |        "      <th>epoch</th>\n",
4253 |        "      <th>train_loss</th>\n",
4254 |        "      <th>valid_loss</th>\n",
4255 |        "      <th>accuracy</th>\n",
4256 |        "      <th>top_k_accuracy</th>\n",
4257 |        "      <th>time</th>\n",
4258 |        "    </tr>\n",
4259 |        "  </thead>\n",
4260 |        "  <tbody>\n",
4261 |        "    <tr>\n",
4262 |        "      <td>0</td>\n",
4263 |        "      <td>1.788961</td>\n",
4264 |        "      <td>3.721398</td>\n",
4265 |        "      <td>0.024688</td>\n",
4266 |        "      <td>0.394502</td>\n",
4267 |        "      <td>00:19</td>\n",
4268 |        "    </tr>\n",
4269 |        "    <tr>\n",
4270 |        "      <td>1</td>\n",
4271 |        "      <td>1.544201</td>\n",
4272 |        "      <td>3.658749</td>\n",
4273 |        "      <td>0.032833</td>\n",
4274 |        "      <td>0.464240</td>\n",
4275 |        "      <td>00:18</td>\n",
4276 |        "    </tr>\n",
4277 |        "    <tr>\n",
4278 |        "      <td>2</td>\n",
4279 |        "      <td>1.423848</td>\n",
4280 |        "      <td>3.340656</td>\n",
4281 |        "      <td>0.076864</td>\n",
4282 |        "      <td>0.488165</td>\n",
4283 |        "      <td>00:18</td>\n",
4284 |        "    </tr>\n",
4285 |        "    <tr>\n",
4286 |        "      <td>3</td>\n",
4287 |        "      <td>1.330147</td>\n",
4288 |        "      <td>2.886402</td>\n",
4289 |        "      <td>0.147620</td>\n",
4290 |        "      <td>0.597098</td>\n",
4291 |        "      <td>00:18</td>\n",
4292 |        "    </tr>\n",
4293 |        "    <tr>\n",
4294 |        "      <td>4</td>\n",
4295 |        "      <td>1.265848</td>\n",
4296 |        "      <td>3.353801</td>\n",
4297 |        "      <td>0.101298</td>\n",
4298 |        "      <td>0.598880</td>\n",
4299 |        "      <td>00:19</td>\n",
4300 |        "    </tr>\n",
4301 |        "    <tr>\n",
4302 |        "      <td>5</td>\n",
4303 |        "      <td>1.181482</td>\n",
4304 |        "      <td>2.580587</td>\n",
4305 |        "      <td>0.260881</td>\n",
4306 |        "      <td>0.754645</td>\n",
4307 |        "      <td>00:19</td>\n",
4308 |        "    </tr>\n",
4309 |        "    <tr>\n",
4310 |        "      <td>6</td>\n",
4311 |        "      <td>1.153128</td>\n",
4312 |        "      <td>2.539572</td>\n",
4313 |        "      <td>0.261644</td>\n",
4314 |        "      <td>0.771443</td>\n",
4315 |        "      <td>00:19</td>\n",
4316 |        "    </tr>\n",
4317 |        "    <tr>\n",
4318 |        "      <td>7</td>\n",
4319 |        "      <td>1.113899</td>\n",
4320 |        "      <td>2.344562</td>\n",
4321 |        "      <td>0.341563</td>\n",
4322 |        "      <td>0.787987</td>\n",
4323 |        "      <td>00:18</td>\n",
4324 |        "    </tr>\n",
4325 |        "    <tr>\n",
4326 |        "      <td>8</td>\n",
4327 |        "      <td>1.070694</td>\n",
4328 |        "      <td>2.717144</td>\n",
4329 |        "      <td>0.255536</td>\n",
4330 |        "      <td>0.682616</td>\n",
4331 |        "      <td>00:18</td>\n",
4332 |        "    </tr>\n",
4333 |        "    <tr>\n",
4334 |        "      <td>9</td>\n",
4335 |        "      <td>1.060504</td>\n",
4336 |        "      <td>3.052906</td>\n",
4337 |        "      <td>0.173581</td>\n",
4338 |        "      <td>0.630186</td>\n",
4339 |        "      <td>00:18</td>\n",
4340 |        "    </tr>\n",
4341 |        "    <tr>\n",
4342 |        "      <td>10</td>\n",
4343 |        "      <td>1.027405</td>\n",
4344 |        "      <td>2.483355</td>\n",
4345 |        "      <td>0.330618</td>\n",
4346 |        "      <td>0.757954</td>\n",
4347 |        "      <td>00:18</td>\n",
4348 |        "    </tr>\n",
4349 |        "    <tr>\n",
4350 |        "      <td>11</td>\n",
4351 |        "      <td>0.998507</td>\n",
4352 |        "      <td>2.272611</td>\n",
4353 |        "      <td>0.403920</td>\n",
4354 |        "      <td>0.794604</td>\n",
4355 |        "      <td>00:18</td>\n",
4356 |        "    </tr>\n",
4357 |        "    <tr>\n",
4358 |        "      <td>12</td>\n",
4359 |        "      <td>0.921136</td>\n",
4360 |        "      <td>2.110825</td>\n",
4361 |        "      <td>0.448206</td>\n",
4362 |        "      <td>0.840926</td>\n",
4363 |        "      <td>00:18</td>\n",
4364 |        "    </tr>\n",
4365 |        "    <tr>\n",
4366 |        "      <td>13</td>\n",
4367 |        "      <td>0.851984</td>\n",
4368 |        "      <td>1.867243</td>\n",
4369 |        "      <td>0.529397</td>\n",
4370 |        "      <td>0.889030</td>\n",
4371 |        "      <td>00:18</td>\n",
4372 |        "    </tr>\n",
4373 |        "    <tr>\n",
4374 |        "      <td>14</td>\n",
4375 |        "      <td>0.811503</td>\n",
4376 |        "      <td>1.849699</td>\n",
4377 |        "      <td>0.544413</td>\n",
4378 |        "      <td>0.890303</td>\n",
4379 |        "      <td>00:18</td>\n",
4380 |        "    </tr>\n",
4381 |        "  </tbody>\n",
4382 |        "</table>"
4383 |       ],
4384 |       "text/plain": [
4385 |        "<IPython.core.display.HTML object>"
4386 |       ]
4387 |      },
4388 |      "metadata": {},
4389 |      "output_type": "display_data"
4390 |     }
4391 |    ],
4392 |    "source": [
4393 |     "for run in range(runs):\n",
4394 |     "    print(f'Run: {run}')\n",
4395 |     "    learn = Learner(dbunch, model(c_out=20, pretrained=False, act_cls=torch.nn.ReLU, sa=sa, sym=sym, pool=pool), opt_func=opt_func, \\\n",
4396 |     "            metrics=[accuracy,top_k_accuracy], loss_func=LabelSmoothingCrossEntropy())\n",
4397 |     "\n",
4398 |     "    if fp16: learn = learn.to_fp16()\n",
4399 |     "    cbs = []\n",
4400 |     "\n",
4401 |     "    # Load weights generated from training on our pretext task\n",
4402 |     "    model_path = 'partial_train_pretext_' + str(run) + '.pth'\n",
4403 |     "    state_dict = torch.load(model_path)\n",
4404 |     "    # HACK: If we don't have all of the parameters for our learner, we get an error\n",
4405 |     "    linear_layer = learn.model[-1]\n",
4406 |     "    state_dict['11.weight'] = linear_layer.weight\n",
4407 |     "    state_dict['11.bias'] = linear_layer.bias\n",
4408 |     "\n",
4409 |     "    learn.model.load_state_dict(state_dict)\n",
4410 |     "\n",
4411 |     "    learn.freeze()\n",
4412 |     "    learn.fit_flat_cos(epochs, lr, wd=1e-2, cbs=cbs)\n",
4413 |     "\n",
4414 |     "    del learn\n",
4415 |     "    torch.cuda.empty_cache() \n",
4416 |     "    gc.collect()  "
4417 |    ]
4418 |   },
4419 |   {
4420 |    "cell_type": "markdown",
4421 |    "metadata": {},
4422 |    "source": [
4423 |     "Results:\n",
4424 |     "- Run 1: 0.531942\n",
4425 |     "- Run 2: 0.515398\n",
4426 |     "- Run 3: 0.544413\n",
4427 |     "\n",
4428 |     "Average: **53.1%**\n"
4429 |    ]
4430 |   },
4431 |   {
4432 |    "cell_type": "markdown",
4433 |    "metadata": {},
4434 |    "source": [
4435 |     "## Results:"
4436 |    ]
4437 |   },
4438 |   {
4439 |    "cell_type": "markdown",
4440 |    "metadata": {},
4441 |    "source": [
4442 |     "- Random: **52.3%**\n",
4443 |     "- Partial `/train`: **53.1%**\n",
4444 |     "- All `/train`: **55.7%**\n",
4445 |     "- All `/train` and `/unsup` : **56.2%**\n",
4446 |     "- All `/train`,`/unsup` and `/val` : **56.3%**"
4447 |    ]
4448 |   },
4449 |   {
4450 |    "cell_type": "code",
4451 |    "execution_count": 26,
4452 |    "metadata": {},
4453 |    "outputs": [
4454 |     {
4455 |      "data": {
4456 |       "text/plain": [
4457 |        "<matplotlib.collections.PathCollection at 0x7f87a00954d0>"
4458 |       ]
4459 |      },
4460 |      "execution_count": 26,
4461 |      "metadata": {},
4462 |      "output_type": "execute_result"
4463 |     },
4464 |     {
4465 |      "data": {
4466 |       "image/png": "iVBORw0KGgoAAAANSUhEUgAAAYgAAAEWCAYAAAB8LwAVAAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADh0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uMy4xLjEsIGh0dHA6Ly9tYXRwbG90bGliLm9yZy8QZhcZAAAgAElEQVR4nO3debxVdb3/8ddbBMUUcTh5ZVDUHHLK4WhpOZaiVkhqN9NKLDMroizt6m3yml2vcb0NVxv06nWolDQjNAuHzKE0OSSKQCRy9ccBUsQwNULBz++P73frYrPOYR08+4zv5+OxH3ut75o+a9jrs9f0XYoIzMzM6q3X3QGYmVnP5ARhZmalnCDMzKyUE4SZmZVygjAzs1JOEGZmVsoJYh1IOlnSbV08zU9KekrSC5K26Mpp9yaSrpJ0QXfHUSNpnKT7ujuO/kjSYEk3S3pO0g3dHU9v5ATRBknvkPT7vHE9K+l3kvYDiIgfR8SRXRjLQOC/gCMjYuOIWNrg6Y2SFJLW76TxPSHpXe10P1RSa2dMy9q2tvXQB50AbAVsERHv7+5geqNO2QH0NZKGALcAnwR+CgwCDgJWdFNIWwEbArM6Y2SS1o+IlZ0xLus7+tJ2IWkAsC3w53WZp760LF6XiPCn7gM0A8va6T4OuC83fxF4ofB5Gbgqd9sUuAJYDCwELgAGtDHODYBvA4vy59u5bCfgRSDy+H9TMuyo3P30POxi4AuF7ucBNwI/Av4GnEY6ejwHeBxYSkqEm+f+/19hei8AB+TyjwJzgL8CU4Ftc/mBwDPAyNz+FmAZsAtwLfAKsDyP64t1sb8hd3ulML1hwP7A/Xk8i4FLgEF5GAHfAp4GngMeAXbP3a4CLsjNmwB3Ad8FVDfdE4GWurIzgSm5+RhgNvB8XndnVdx2tgCm5OX8IPD12rZSWFbTctzTgANz+WHAzEJ/dwAPFtrvA8bm5ieAs/J8PwdMAjbM3bYk/blZBjwL3JvX9RrrobDdfCyv83vyON4G/D6P42Hg0EIcp+Zt4HlgPvCJQrdDgdY87qfzehubl+Wfczz/2s6yuwr4AXB7Hv/d5G0sd98ld3sWmAv8c92w3wduJf1efge8RPo9vpDncT3gy8CTOb5rgE3rfkOvLotC2anAAtJ2fwawX172y4BLCjHsAPyG9Ht6BvgxMLTQvc31lrsfC8wgbTuPA0d1dD/S6fvCrphIb/sAQ/JKvho4Gtisrvs4Cj/6QvlI0g76mNw+GfghaSf4RtIO4xNtTPN84IHcX1P+gX69buNdv41ha92vy9PaA1gCvCt3Py//UMbmH8lg4HN5eiNIieiHwHVtTS8POw94M+nI88vA7wvdv5F/HIPzD2B83Q/jXe0s70OB1rqyfUk7qvVzPHOAz+Vuo4HpwFBSsngzsHXudlX+AW2Rl/cFbUxzI9JOaMdC2TTgxNy8GDgoN28G7FNx27melGzfAOyef9C1PxObk3YyH87z9cHcvgXpCHE5aQe/PvCXvC1tkpfpctKpktryfJCUSDfPy+aM3O1C0k52YP4cRE6O9euhsJ6vyfEOBoaTtv1j8rZyRG5vysO8m7QjFHAI8PfassnrcSXw1Tztj5O2w5/k+dgN+AewfRvL7qq8Tg4mbZPfKSy7N5B20qfm5bMPaSe8W2HY54C357g3JG33PyqM/6OkbXh7YGPgJuDadpZFrewHeXxH5vgnk36nw0mJ5pA8jjfl5bUB6Td8D/Dtut9BW+tt/xz/ETn+4cAuHd2PdPq+sCsm0hs/pJ3OVaR/RCtJ/wq3yt3GUZcg8gY1HfiX3L4V6ZTU4EI/HwTuamN6j5MTS24fDTxRt/GuLUHsUij7JnBFbj6P/O+w0H0O8M5C+9akJLJ+2fSAXwEfK7SvR9o5bJvbB+b5nwn8msI/dtYhQZT08zng57n5cNI/0rcB69X1dxVwJfAocPZaxvkj4Ku5eUfSzmmj3P7/gE8AQzqwzQzIy7C4Hv6d13ZyH6ZwVJDL7gfG5eZ7gePyfN1GSjRHkY4uHqlbnh+qW9c/yM3nA78A3lQS32rrobCety+U/Qt5p1komwqc0sY8TwY+W1iPy8n/bklJIYC3FvqfTj4SKhnXVcD1hfaNgVWkP14fAO6t6/+HwNcKw15T1/08Vk8QdwKfKrTvzJrbfHFZ1MqGF8qWAh8otP+M/MelZH7GAg9VXG8/BL5VMo4O7Uc6++OL1G2IiDkRMS4iRpD+CQ4jnfZpyxXA3Ii4KLdvS9ppLpa0TNIy0kbwxjaGH0Y69K15Mpd1xIJ2hl9Q1++2wM8Lsc0h/Ri3amPc2wLfKfT/LOlf5HCAiHiZ9CPdHbg48pa8riTtJOkWSX+R9DfSjnbLPK3fkE45XQo8JemyfN2o5t2khP2DtUzmJ6QfG8BJwOSI+HtuP570L/pJSXdLOqBC2E2knU39eqipX8e17sNz892knezBufm3pH/ph+T2or8Umv9O2pkCTCT9S75N0nxJ51SIuxjvtsD7a+s5r+t3kP5AIOloSQ/kGzeWkZbRloXhl0bEqty8PH8/Vei+vBBru7FExAuk7WxYjuutdXGdDPxTG/NRpuw3tj6rb/Nl46iPv3R+JL1R0vWSFuZt9kesvmyg7fU2kvQnsV5H9yOdygmigoj4E6/t/NaQf4Q7k85f1iwgZf4tI2Jo/gyJiN3amMwi0sZQs00u64iR7Qxfv8NeABxdiG1oRGwYEQtL+q31/4m6/gdHxO8BJA0Hvgb8L3CxpA3amXa9su7fB/5EOgU0BPhXUkJKA0R8NyL2JZ222Ak4uzDs5aSjmFslvaGd6d4GbClpL1Ki+Elh/NMi4ljSD3Ey6d/82iwhHW3Wr4ea+nVc674wN9cniLtpO0GUiojnI+ILEbE98F7g85LeWevc1mCF5gWkI4jien5DRPxHXqc/A/6TdDQ9lHTOXyXjXFevLjtJG5NOxSzKcd1dF9fGEfHJNuajTNlvbCWr7/Bfzx+bC/Pwe+Zt9kNUXzYLSKfuyso7sh/pVE4QJSTtIukLkkbk9pGkHcgDJf0eDUwgHTbX/jEREYtJO6CLJQ2RtJ6kHSQd0sZkrwO+LKlJ0pak87g/6mDoX5G0kaTdSOdqJ7XT7w+Ab0jaNs9Hk6Rjc7clpAua29f1f24eN5I2lfT+3CxSAr2ClCQXky7O1jxVN656TwFbSNq0ULYJ6WLdC5J2Id1RRp7efpLemm//fZF0XngVqxtPupB5i6TBZRONdJfKjaR/3ZuTLoAiaVB+1mXTfGT0t5Lxl41vFem89nl5PewKnFLo5VZgJ0knSVpf0geAXUkXlSFdd9qZdD76wYiYRf7nTDqfvVaS3iPpTXmd1OKuxb629QBpm3uvpNGSBkjaMN+GPIJ0N98G5ESYt/3Ovt37mHyL+SDSNvSHiFhAWkY7SfqwpIH5s5+kN3dg3NcBZ0raLieffwcmRefdrbQJ6YL4svyH6ey19F90BXCqpHfmfcVwSbusw36kUzlBlHue9KP8g6QXSYnhUeALJf1+gHRqYY7SQ2wvSKqd2vgI6Uc1m3Qx8kbyoXqJC4AW0gXemcAfc1lH3E06vXAn8J8R0d7DfN8hXVe5TdLzpHl8K0A+zfIN4Hf5sPZtEfFz4CLg+nz4/CjpAj6kBLkV8JV8aulU0sZ+UO5+ISn5LZN0Vn0g+QjtOmB+7mcY6W6Pk0jr4nJWT3ZDctlfSacJlpL+1RbHGaS7uhYAv5C0YRvL4SfAu4Ab6nYUHwaeyPN6BunfIJK2yet4mzVHBaTEtDHpVMJVpCOqWkxLgfeQtqOlpLt93hMRz+TuL5LW+6yIeCkPdj/wZEQ83cb06u1IugPqhTzs9yLit7lbu+shx7CAdDfNv5ISwQLSjm69iHietK5/Slr2J5G2oc70E9KR6LOkGxVOznE9T0pGJ5KOBP5C2h43KB9NqStJd3PdA/wf6Y/FZzorcODfSBfPnwN+SfqzUElEPEj63XwrD383rx3tdGQ/0qlqdzdYLyZpFGmDH9iJ/4bMupSkq0g3K3y5u2OxxEcQZmZWygnCzMxKNTRBSDpK0lxJ88put1OqyGyJpBn5c1qh2zclzZI0R9J380U3KxERT0SEfHrJerN8W7lPL/UgDauLSakulEtJTwa2AtMkTYmI2XW9ToqI8XXDHkh6InLPXHQf6Va/3zYqXjMzW10jK+vbH5gXEfMBJF1PujuiPkGUCdKj7YNI9xEPZPV7ldew5ZZbxqhRo15PvGZm/c706dOfiYimsm6NTBDDWf2pxFbybZR1jpd0MKnqhDMjYkFE3C/pLtL99CJViDWnfkBJp5NuZWSbbbahpaWls+fBzKxPk1T/dP+rGnkNouyaQf09tTcDoyJiT9K921cDSHoTqS6kEaREc3hOIquPLOKyiGiOiOamptIEaGZm66iRCaKV1ascGEFd1RERsTQiau9YuJz0YAzA+4AHIuKFXB/Lr0gVmJmZWRdpZIKYBuyYH2sfRHoCcrWnLiUVnwYcQ6owDlJNmofk6ggGki5Qr3GKyczMGqdh1yAiYqWk8aSqggcAV0bELEnnk17UMgWYIGkMqcKsZ0nVaEN6lPxwUpUTAfw6Im5uVKxmZramPlPVRnNzc/gitZlZx0iaHhHNZd38JLWZmZVygjAzs1JOEGZmVsoJwszMSjlBmJlZKScIMzMr5QRhZmalnCDMzKyUE4SZmZVygjAzs1JOEGZmVsoJwszMSjlBmJlZKScIMzMr5QRhZmalnCDMzKyUE4SZmZVygjAzs1JOEGZmVsoJwszMSjU0QUg6StJcSfMknVPSfZykJZJm5M9pufywQtkMSf+QNLaRsZqZ2erWb9SIJQ0ALgWOAFqBaZKmRMTsul4nRcT4YkFE3AXslcezOTAPuK1RsZqZ2ZoaeQSxPzAvIuZHxEvA9cCx6zCeE4BfRcTfOzU6MzNrVyMTxHBgQaG9NZfVO17SI5JulDSypPuJwHVlE5B0uqQWSS1Llix5/RGbmdmrGpkgVFIWde03A6MiYk/gDuDq1UYgbQ3sAUwtm0BEXBYRzRHR3NTU1Akhm5lZTSMTRCtQPCIYASwq9hARSyNiRW69HNi3bhz/DPw8Il5uWJRmZlaqkQliGrCjpO0kDSKdKppS7CEfIdSMAebUjeODtHF6yczMGqthdzFFxEpJ40mnhwYAV0bELEnnAy0RMQWYIGkMsBJ4FhhXG17SKNIRyN2NitHMzNqmiPrLAr1Tc3NztLS0dHcYZma9iqTpEdFc1s1PUpuZWSknCDMzK+UEYWZmpZwgzMyslBOEmZmVcoIwM7NSThBmZlbKCcLMzEo5QZiZWSknCDMzK+UEYWZmpZwgzMysVMNqczUzs8aa/NBCJk6dy6Jlyxk2dDBnj96ZsXuXvbhz3ThBmJn1QpMfWsi5N81k+curAFi4bDnn3jQToNOShE8xmZn1QhOnzn01OdQsf3kVE6fO7bRp+AjCzIzGn67pbIuWLe9Q+brwEYSZ9Xu10zULly0neO10zeSHFnZ3aG0aNnRwh8rXhROEmfV7XXG6prOdPXpnBg8csFrZ4IEDOHv0zp02DZ9iMrN+rytO13S22ukv38VkZtZAw4YOZmFJMujM0zWNMHbv4Q29TtLQU0ySjpI0V9I8SeeUdB8naYmkGflzWqHbNpJukzRH0mxJoxoZq5n1X11xuqY3atgRhKQBwKXAEUArME3SlIiYXdfrpIgYXzKKa4BvRMTtkjYGXmlUrGbWv3XF6ZreaK0JQtLPgCuBX0VER3bS+wPzImJ+Hs/1wLFAfYIom+auwPoRcTtARLzQgemamXVYo0/X9EZVTjF9HzgJeEzSf0japeK4hwMLCu2tuaze8ZIekXSjpJG5bCdgmaSbJD0kaWI+IlmNpNMltUhqWbJkScWwzMysirUmiIi4IyJOBvYBngBul/R7SadKGtjOoCobXV37zcCoiNgTuAO4OpevDxwEnAXsB2wPjCuJ7bKIaI6I5qamprXNipmZdUCli9SStiDtoE8DHgK+Q0oYt7czWCswstA+AlhU7CEilkbEitx6ObBvYdiHImJ+RKwEJufpmZlZF1lrgpB0E3AvsBHw3ogYExGTIuIzwMbtDDoN2FHSdpIGAScCU+rGvXWhdQwwpzDsZpJqhwWHU+HahZmZdZ4qdzFdEhG/KesQEc1tDRQRKyWNB6YCA4ArI2KWpPOBloiYAkyQNAZYCTxLPo0UEasknQXcKUnAdNIRhpmZdRFF1F8WKOlJ2h3YFdiwVhYR1zQwrg5rbm6OlpaW7g7DzKxXkTS9rT/7VW5z/RpwKClB3AocDdxHek7BzBqst9Uyan1HlYvUJwDvBP4SEacCbwE2aGhUZgb0zlpGre+okiCW5wfkVkoaAjxNuu3UzBqsN9Yyan1HlYvULZKGki4STwdeAB5saFRmBvTOWkat72g3QeQ7iC6MiGXADyT9GhgSEY90SXRm/VxvrWXU+oZ2TzFFusVpcqH9CScHs67jWkatO1W5BvGApP0aHomZrWHs3sO58Lg9GD50MAKGDx3Mhcft4buYrEtUuQZxGPAJSU8CL5LqWIpcf5KZNZhrGbXuUiVBHN3wKMzMrMepkiDW/qi1mZn1OVUSxC9JSUKkqja2A+YCuzUwLjMz62ZrTRARsUexXdI+wCcaFpGZmfUIld4HURQRfyS9xMfMzPqwKpX1fb7Quh7pxT1+v6eZWR9X5RrEJoXmlaRrEj9rTDhmZtZTVLkG8W9dEYiZmfUsVV45enuurK/WvpmkqY0Ny8zMuluVi9RNubI+ACLir8AbGxeSmZn1BFUSxCpJ29RaJG2LH54zM+vzqlyk/hJwn6S7c/vBwOmNC8nMzHqCtR5BRMSvSbe2TgJ+CuwbEZWuQUg6StJcSfMknVPSfZykJZJm5M9phW6rCuVTqs+SmZl1hirPQbwP+E1E3JLbh0oaGxGT1zLcAOBS4AigFZgmaUpEzK7rdVJEjC8ZxfKI2KvSXJiZWaercg3iaxHxXK0lX7D+WoXh9gfmRcT8iHgJuB44dt3CNDOzrlYlQZT1U+XaxXBgQaG9NZfVO17SI5JulDSyUL6hpBZJD0gaW2F6ZmbWiaokiBZJ/yVpB0nbS/oWML3CcCopq7/76WZgVH750B3A1YVu20REM3AS8G1JO6wxAen0nERalixx7R9mZp2pSoL4DPAS6SL1DcA/gE9XGK4VKB4RjAAWFXuIiKURsSK3Xg7sW+i2KH/PB34L7F0/gYi4LCKaI6K5qampQkhmZlZVlao2XgTWuAOpgmnAjpK2AxYCJ5KOBl4laeuIWJxbxwBzcvlmwN8jYoWkLYG3A99chxjMzGwdVbmLqQn4IukFQRvWyiPi8PaGi4iVksYDU4EBwJURMUvS+UBLREwBJkgaQ6oE8FlgXB78zcAPJb1COsr5j5K7n8zMrIEU0f5D0ZJuI51eOgs4AzgFWBIR/9L48Kprbm6OlpaW7g7DzKxXkTQ9X+9dQ5VrEFtExBXAyxFxd0R8FHhbp0ZoZmY9TpXbVV/O34slvZt0oXlE40IyM7OeoEqCuEDSpsAXgP8GhgBnNjQqMzPrdlXuYrolNz4HHNbYcMzMrKeocg3CzMz6IScIMzMr5QRhZmalqjwoNxT4CDCq2H9ETGhcWGZm1t2q3MV0K/AAMBN4pbHhmJlZT1ElQWwYEZ9veCRmZtajVLkGca2kj0vaWtLmtU/DIzMzs25V5QjiJWAi8CVee59DANs3KigzM+t+VRLE54E3RcQzjQ7GzMx6jiqnmGYBf290IGZm1rNUOYJYBcyQdBdQe/ubb3M1M+vjqiSIyfljZmb9SJXK+q7uikDMzKxnqfIk9Y7AhcCurP7KUd/FZGbWh1W5SP2/wPdJ740+DLgGuLaRQZmZWferkiAGR8SdpPdXPxkR5wGHNzYsMzPrblUuUv9D0nrAY5LGAwuBNzY2LDMz625VjiA+B2wETAD2BT4EnFJl5JKOkjRX0jxJ55R0HydpiaQZ+XNaXfchkhZKuqTK9MzMrPNUuYtpGoCkiIhTq45Y0gDgUuAIoBWYJmlKRMyu63VSRIxvYzRfB+6uOk0zM+s8az2CkHSApNnAnNz+FknfqzDu/YF5ETE/Il4CrgeOrRqYpH2BrYDbqg5jZmadp8oppm8Do4GlABHxMHBwheGGAwsK7a25rN7xkh6RdKOkkQD5msfFwNntTUDS6ZJaJLUsWbKkQkhmZlZVpVeORsSCuqJVFQZT2ajq2m8GRkXEnsAdQO2hvE8Bt5ZMtz6uyyKiOSKam5qaKoRkZmZVVbmLaYGkA4GQNIh0sXpOheFagZGF9hHAomIPEbG00Ho5cFFuPgA4SNKngI2BQZJeiIg1LnSbmVljVEkQZwDfIZ0eaiVdE/h0heGmATtK2o50a+yJwEnFHiRtHRGLc+sYcuKJiJML/YwDmp0czMy6VrsJIt+J9OHiDruqiFiZn5uYCgwAroyIWZLOB1oiYgowQdIY0lPazwLjOjodMzNrDEXUXxao60H6bUQc2jXhrLvm5uZoaWnp7jDMzHoVSdMjormsW5VTTL/LD6pNAl6sFUbEHzspPjMz64GqJIgD8/f5hbLA9TGZmfVpVRLExyJifrFAkqv6NjPr46o8B3FjSdkNnR2ImZn1LG0eQUjaBdgN2FTScYVOQyi8OMjMzPqm9k4x7Qy8BxgKvLdQ/jzw8UYGZWZm3a/NBBERvwB+IemAiLi/C2MyM7MeoMo1iPfl9zIMlHSnpGckfajhkZmZWbeqkiCOjIi/kU43tQI7sZZaVs3MrPerkiAG5u9jgOsi4tkGxmNmZj1Elecgbpb0J2A58ClJTcA/GhuWmZl1t7UeQeRaVA8g1aj6Mqm6jcpvhjMzs96pyhEEwJuBUZKK/V/TgHjMzKyHWGuCkHQtsAMwg9feJBc4QZiZ9WlVjiCagV1jbfWCm5lZn1LlLqZHgX9qdCBmZtazVDmC2BKYLelBYEWtMCLGNCwqMzPrdlUSxHmNDqI3mvzQQiZOncuiZcsZNnQwZ4/embF7D+/usMzMOk2VBLEDcG9EPNboYHqLyQ8t5NybZrL85XTNfuGy5Zx700wAJwkz6zOqXIMYBfxQ0uOSfirpM5L2anBcPdrEqXNfTQ41y19excSpc7spIjOzzlflQbmvRsThwO7AfaR6mKZXGbmkoyTNlTRP0jkl3cdJWiJpRv6clsu3lTQ9l82SdEbHZquxFi1b3qFyM7PeqMpzEF8G3g5sDDwEnAXcW2G4AcClwBGkSv6mSZoSEbPrep0UEePryhYDB0bECkkbA4/mYRetdY66wLChg1lYkgyGDR3cDdGYmTVGlVNMxwFbAHcANwFTImJxheH2B+ZFxPyIeAm4nopVdETESxFRu2Nqg4pxdpmzR+/M4IEDVisbPHAAZ4/euZsiMjPrfFVOMe0DvBN4kHQ0MFPSfRXGPRxYUGhvzWX1jpf0iKQbJY2sFUoaKemRPI6Lyo4eJJ0uqUVSy5IlSyqE1DnG7j2cC4/bg+FDByNg+NDBXHjcHr5AbWZ9SpVTTLsDBwGHkJ6qXkCFU0yASsrqn8a+mVSF+Ip8neFq4HCAiFgA7ClpGDBZ0o0R8dRqI4u4DLgMoLm5uUuf9B6793AnBDPr06qcurkIGAJ8F3hzRBwWEV+tMFwrMLLQPgJY7SggIpYWTiVdDuxbP5J85DCLlKTMzKyLVDnF9G7gW8DfgJ0lDVzLIDXTgB0lbSdpEHAiMKXYg6StC61jgDm5fISkwbl5M9JFct9DambWhaqcYjqEVHPrE6TTRiMlnRIR97Q3XESslDQemAoMAK6MiFmSzgdaImIKMEHSGGAl8CwwLg/+ZuBiSZGn+Z8RMXNdZtDMzNaN1lZJq6TpwEkRMTe370S6brDG6aDu1NzcHC0tLd0dhplZryJpekQ0l3Wr9E7qWnIAiIg/89p7qs3MrI+qUhdTi6QrgGtz+8lUfJLazMx6ryoJ4pPAp4EJpOsB9wDfa2RQZmbW/daaIPIzCtcC10ZE1z2NZmZm3arNaxBKzpP0DPAnYG6uWK/KMxBmZtbLtXeR+nOk5w/2i4gtImJz4K3A2yWd2SXRmZlZt2kvQXwE+GBE/F+tICLmAx/K3czMrA9rL0EMjIhn6gvzdQjf5mpm1se1lyBeWsduZmbWB7R3F9NbJP2tpFzAhg2Kx8zMeog2E0REDGirm5mZ9X096k1tZmbWc1R5krpPm/zQQiZOncuiZcsZNnQwZ4/e2S8CMjOjnyeIyQ8t5NybZrL85VUALFy2nHNvSrWKO0mYWX/Xr08xTZw699XkULP85VVMnOp3E5mZ9esEsWjZ8g6Vm5n1J/06QQwbOrhD5WZm/Um/ThBnj96ZwQNXv5t38MABnD16526KyMys5+jXF6lrF6J9F5OZ2Zr6dYKAlCScEMzM1tTQU0ySjpI0V9I8SeeUdB+X3zExI39Oy+V7Sbpf0ixJj0j6QCPjNDOzNTXsCELSAOBS4AigFZgmaUpEzK7rdVJEjK8r+zvwkYh4TNIwYLqkqRGxrFHxmpnZ6hp5BLE/MC8i5kfES8D1wLFVBoyIP0fEY7l5EfA00NSwSM3MbA2NTBDDgQWF9tZcVu/4fBrpRkkj6ztK2h8YBDxe0u10SS2SWpYs8euyzcw6UyMThErKoq79ZmBUROwJ3AFcvdoIpK2Ba4FTI+KVNUYWcVlENEdEc1OTDzDMzDpTIxNEK1A8IhgBLCr2EBFLI2JFbr0c2LfWTdIQ4JfAlyPigQbGaWZmJRqZIKYBO0raTtIg4ERgSrGHfIRQMwaYk8sHAT8HromIGxoYo5mZtaFhdzFFxEpJ44GpwADgyoiYJel8oCUipgATJI0BVgLPAuPy4P8MHAxsIalWNi4iZjQqXjMzW50i6i8L9E7Nzc3R0tLS3WGYmfUqkqZHRHNZt35dF5OZmbXNCcLMzEo5QZiZWSknCDMzK+UEYWZmpZwgzMyslBOEmZmVcoIwM7NSThBmZlbKCcLMzEo5QZiZWSknCDMzK+UEYWZmpZwgzMyslBOEmZmVcoIwM7NSThBmZlbKCcLMzEo5QZiZWSknCDMzK9XQBCHpKElzJc2TdE5J93GSlkiakT+nFcxnyWQAAAqfSURBVLr9WtIySbc0MkYzMyu3fqNGLGkAcClwBNAKTJM0JSJm1/U6KSLGl4xiIrAR8IlGxWhmZm1r5BHE/sC8iJgfES8B1wPHVh04Iu4Enm9UcGZm1r5GJojhwIJCe2suq3e8pEck3ShpZAPjMTOzDmhkglBJWdS13wyMiog9gTuAqzs0Ael0SS2SWpYsWbKOYZqZWZlGJohWoHhEMAJYVOwhIpZGxIrcejmwb0cmEBGXRURzRDQ3NTW9rmDNzGx1jUwQ04AdJW0naRBwIjCl2IOkrQutY4A5DYzHzMw6oGF3MUXESknjganAAODKiJgl6XygJSKmABMkjQFWAs8C42rDS7oX2AXYWFIr8LGImNqoeM3MbHWKqL8s0Ds1NzdHS0tLd4dhZtarSJoeEc1l3fwktZmZlXKCMDOzUk4QZmZWygnCzMxKOUGYmVkpJwgzMyvlBGFmZqX6zHMQkpYAT76OUWwJPNNJ4fRU/WEewfPZ1/SH+ezOedw2IkrrKuozCeL1ktTS1sMifUV/mEfwfPY1/WE+e+o8+hSTmZmVcoIwM7NSThCvuay7A+gC/WEewfPZ1/SH+eyR8+hrEGZmVspHEGZmVsoJwszMSvX7BCHpKElzJc2TdE53x7MuJD0haaakGZJactnmkm6X9Fj+3iyXS9J38/w+ImmfwnhOyf0/JumU7pqfQjxXSnpa0qOFsk6bL0n75uU2Lw9b9h71hmpjHs+TtDCvzxmSjil0OzfHO1fS6EJ56Xac3+j4hzzvk/LbHbucpJGS7pI0R9IsSZ/N5X1mfbYzj713fUZEv/2Q3nT3OLA9MAh4GNi1u+Nah/l4AtiyruybwDm5+Rzgotx8DPArQMDbgD/k8s2B+fl7s9y8WTfP18HAPsCjjZgv4EHggDzMr4Cje8g8ngecVdLvrnkb3QDYLm+7A9rbjoGfAifm5h8An+ymdbk1sE9u3gT4c56fPrM+25nHXrs++/sRxP7AvIiYHxEvAdcDx3ZzTJ3lWODq3Hw1MLZQfk0kDwBDld4NPhq4PSKejYi/ArcDR3V10EURcQ/pVbRFnTJfuduQiLg/0q/tmsK4ukwb89iWY4HrI2JFRPwfMI+0DZdux/kf9OHAjXn44vLqUhGxOCL+mJufJ71/fjh9aH22M49t6fHrs78niOHAgkJ7K+2v0J4qgNskTZd0ei7bKiIWQ9pwgTfm8rbmubcsi86ar+G5ub68pxifT61cWTvtQsfncQtgWUSsrCvvVpJGAXsDf6CPrs+6eYReuj77e4IoO0fZG+/7fXtE7AMcDXxa0sHt9NvWPPf2ZdHR+erJ8/t9YAdgL2AxcHEu7/XzKGlj4GfA5yLib+31WlLWK+a1ZB577frs7wmiFRhZaB8BLOqmWNZZRCzK308DPycdoj6VD7vJ30/n3tua596yLDprvlpzc315t4uIpyJiVUS8AlxOWp/Q8Xl8hnRqZv268m4haSBpx/njiLgpF/ep9Vk2j715ffb3BDEN2DHfGTAIOBGY0s0xdYikN0japNYMHAk8SpqP2h0epwC/yM1TgI/ku0TeBjyXD+2nAkdK2iwfAh+Zy3qaTpmv3O15SW/L53Y/UhhXt6rtMLP3kdYnpHk8UdIGkrYDdiRdmC3djvO5+LuAE/LwxeXVpfIyvgKYExH/VejUZ9ZnW/PYq9dnI6+A94YP6W6JP5PuGvhSd8ezDvFvT7rL4WFgVm0eSOcr7wQey9+b53IBl+b5nQk0F8b1UdKFsnnAqT1g3q4jHZK/TPpX9bHOnC+gmfRjfRy4hFyzQA+Yx2vzPDxC2olsXej/SzneuRTu0mlrO87bx4N53m8ANuimdfkO0umQR4AZ+XNMX1qf7cxjr12frmrDzMxK9fdTTGZm1gYnCDMzK+UEYWZmpZwgzMyslBOEmZmVcoKwhpN0oaRDJY1VB2vMldSUa698SNJBdd3+R9KunRtt55DULOm7XTzNQyUd+DqGH9vW8myvW4XxjpN0ybrGZd3HCcK6wltJddIcAtzbwWHfCfwpIvaOiNWGjYjTImJ2J8XYqSKiJSImdPZ4C0/RljkUWOcEQar4ra0k0F4366OcIKxhJE2U9AiwH3A/cBrwfUlfLel3W0l35grN7pS0jaS9SNVBH5Pr0R9cN8xvJTXn5hckXZQrLLxD0v65+3xJY3I/oyTdK+mP+XNgLl9P0veU6vC/RdKtkk7I3faVdHce79RCtRATJM3O8V5fMj+HSrolN5+nVElbLZ7SxJHn4eIc252Smgrz+e+S7gY+m4+qfiZpWv68XalyuDOAM/OyOqisvzy+79bWgaTRku7Jy2IMMDEPv0MhrjW6Sfp4HufDeRob5X7fL+nRXH5PyTy+W9L9krYsWwbWw3THU5X+9J8Pqd6Z/wYGAr9rp7+bgVNy80eBybl5HHBJG8P8lvyELekJ1qNz88+B2/I03wLMyOUbARvm5h2Bltx8AnAr6Q/TPwF/zWUDgd8DTbm/DwBX5uZF5KdYgaElsR0K3JKbz8vj2QDYElgKDCwZJoCTc/NXa/Od5/N7hf5+ArwjN29DqtqhNp2zKvS3Eemp+8NIT/DukMuvAk5oY1mv1g3YotB8AfCZ3DwTGF5cLrV1SKpm4l66+T0j/lT/tHe4atYZ9iZVObAL0N7poAOA43LztaQjh454Cfh1bp4JrIiIlyXNBEbl8oHAJfnIZBWwUy5/B3BDpMrU/iLprly+M7A7cHuqZocBpGoxIFWb8GNJk4HJFeL7ZUSsAFZIehrYitWrpwZ4BZiUm38E3FToNqnQ/C5gV732wrQhyvVx1SntLyKel/Rx4B7gzIh4vEL89XaXdAEwFNiY1+rt+h1wlaSf1sV/GKkqjCOj/VpcrQdxgrCGyDvhq0g1Tj5D+tcqSTOAAyJi+VpG0dE6YF6O/HeVtKNdARARrxTO258JPEU6qlgP+Ect3LZmA5gVEQeUdHs36W1wY4CvSNotXqunv8yKQvMqqv32isvgxULzepQsQ635hs3S/rI9SEcywyrEUeYqYGxEPCxpHOmIiYg4Q9JbSctnRt4OIL35bXtSUm5Zx2laF/M1CGuIiJgREXvx2msXfwOMjoi92thh/Z5UayXAycB9DQhrU2BxPlL4MOmIgDyt4/O1iK3IOzvS6ZcmSQdAqspZ0m6S1gNGRsRdwBd57V/067Uer9XUeRJtL4PbgPG1lsJO+HnSqy7b7U/StsAXSEd3R+cdetnwRfXdNgEWK1VvfXJhGjtExB8i4qukPwa1aqufJB0hXiNptzamYT2ME4Q1TL7I+te8Q94l2r/jaAJwar6o/WHgsw0I6XvAKZIeIP2Trf0r/xnpdM+jwA9Jd1w9F+l1jycAF0l6mHSq7EBSYvlRPn31EPCtiFjWCfG9COwmaTrp1ZLnt9HfBKA5XyCfTbo4Dek6zvtqF6nL+pNerZL6rEjvEfkY8D+SNiS92vJspVuKd6ibZn23r5CW0+3Anwr9TZQ0U9KjpFNYD9c6RMRcUjK5oWT81gO5Nlcz0lvAIuIFSVuQqlN+e0T8pYtjeCEiOuNIxKxT+BqEWXKLpKHAIODrXZ0czHoiH0GYmVkpX4MwM7NSThBmZlbKCcLMzEo5QZiZWSknCDMzK/X/AT6Of0H5Nj+rAAAAAElFTkSuQmCC\n",
4467 |       "text/plain": [
4468 |        "<Figure size 432x288 with 1 Axes>"
4469 |       ]
4470 |      },
4471 |      "metadata": {
4472 |       "needs_background": "light"
4473 |      },
4474 |      "output_type": "display_data"
4475 |     }
4476 |    ],
4477 |    "source": [
4478 |     "# No pretraining, train subset, all train, train + unsup, train + unsup + val\n",
4479 |     "x = [0, 1275, 14669, 22419, 26348]\n",
4480 |     "y = [0.523,  0.531, 0.557, 0.562, 0.563]\n",
4481 |     "plt.title(\"Size of pretext task vs. downstream performance\")\n",
4482 |     "plt.xlabel(\"# of images in pretext task\")\n",
4483 |     "plt.ylabel(\"Downstream accuray\")\n",
4484 |     "plt.scatter(x,y)"
4485 |    ]
4486 |   },
4487 |   {
4488 |    "cell_type": "markdown",
4489 |    "metadata": {},
4490 |    "source": [
4491 |     "In general adding more images to our pretext task seems to help, but the performance gains seem to be saturating."
4492 |    ]
4493 |   }
4494 |  ],
4495 |  "metadata": {
4496 |   "kernelspec": {
4497 |    "display_name": "Python (fastai2)",
4498 |    "language": "python",
4499 |    "name": "fastai2"
4500 |   },
4501 |   "language_info": {
4502 |    "codemirror_mode": {
4503 |     "name": "ipython",
4504 |     "version": 3
4505 |    },
4506 |    "file_extension": ".py",
4507 |    "mimetype": "text/x-python",
4508 |    "name": "python",
4509 |    "nbconvert_exporter": "python",
4510 |    "pygments_lexer": "ipython3",
4511 |    "version": "3.7.6"
4512 |   }
4513 |  },
4514 |  "nbformat": 4,
4515 |  "nbformat_minor": 2
4516 | }
4517 | 


--------------------------------------------------------------------------------
/02_InpaintingVaryDatasetSize/README.md:
--------------------------------------------------------------------------------
 1 | ## Effect of Pretext Dataset Size on Downstream Performance
 2 | 
 3 | **Hypothesis:** By increasing the size of our pretext dataset we can improve downstream performance.
 4 | 
 5 | **Result:** True, but perhaps with saturating improvements.
 6 | 
 7 | **Methodology:**
 8 | 
 9 | Image inpainting pretext task.
10 | 
11 | Using four subsets of the ImageWang dataset:
12 | 
13 | - `/train` that has a corresponding class in `/val`
14 |   - `1,275` images
15 | - All `/train` data
16 |   - `14,669` images
17 | - All `/train` data + all `/unsup` data
18 |   - `22,419` images
19 | - All `/train` data + all `/unsup` data + all `/val` data
20 |   - `26,348` images
21 |   
22 | Results: 
23 | 
24 | Random: **52.3%**
25 | 
26 | Partial /train: **53.1%**
27 | 
28 | All /train: **55.7%**
29 | 
30 | All /train and /unsup : **56.2%**
31 | 
32 | All /train,/unsup and /val : **56.3%**
33 | 
34 | 
35 | ![test](https://i.imgur.com/ZuuAygJ.png)
36 | 


--------------------------------------------------------------------------------
/02_InpaintingVaryDatasetSize/RandomCutout.py:
--------------------------------------------------------------------------------
 1 | import numpy as np
 2 | from fastai2.vision.all import PILImage, Image
 3 | from fastai2.vision.augment import RandTransform
 4 | 
 5 | 
 6 | # We create this dummy class in order to create a transform that ONLY operates on images of this type
 7 | # We will use it to create all input images
 8 | class PILImageInput(PILImage):
 9 |     pass
10 | 
11 | 
12 | class RandomCutout(RandTransform):
13 |     "Picks a random scaled crop of an image and resize it to `size`"
14 |     split_idx = None
15 | 
16 |     def __init__(self, min_n_holes=5, max_n_holes=10, min_length=5, max_length=50, **kwargs):
17 |         super().__init__(**kwargs)
18 |         self.min_n_holes = min_n_holes
19 |         self.max_n_holes = max_n_holes
20 |         self.min_length = min_length
21 |         self.max_length = max_length
22 | 
23 |     def encodes(self, x: PILImageInput):
24 |         """
25 |         Note that we're accepting our dummy PILImageInput class
26 |         fastai2 will only pass images of this type to our encoder.
27 |         This means that our transform will only be applied to input images and won't
28 |         be run against output images.
29 |         """
30 | 
31 |         n_holes = np.random.randint(self.min_n_holes, self.max_n_holes)
32 |         pixels = np.array(x)  # Convert to mutable numpy array. FeelsBadMan
33 |         h, w = pixels.shape[:2]
34 | 
35 |         for n in range(n_holes):
36 |             h_length = np.random.randint(self.min_length, self.max_length)
37 |             w_length = np.random.randint(self.min_length, self.max_length)
38 |             h_y = np.random.randint(0, h)
39 |             h_x = np.random.randint(0, w)
40 |             y1 = int(np.clip(h_y - h_length / 2, 0, h))
41 |             y2 = int(np.clip(h_y + h_length / 2, 0, h))
42 |             x1 = int(np.clip(h_x - w_length / 2, 0, w))
43 |             x2 = int(np.clip(h_x + w_length / 2, 0, w))
44 | 
45 |             pixels[y1:y2, x1:x2, :] = 0
46 | 
47 |         return Image.fromarray(pixels, mode='RGB')


--------------------------------------------------------------------------------
/02_InpaintingVaryDatasetSize/config.py:
--------------------------------------------------------------------------------
 1 | from fastai2.layers import Mish, MaxPool
 2 | from fastai2.vision.models.xresnet import xresnet34
 3 | 
 4 | config = {
 5 |     'lr': 8e-3,
 6 |     'size': 128,
 7 |     'sqrmom': 0.99,
 8 |     'mom': 0.9,
 9 |     'eps': 1e-6,
10 |     'epochs': 15,
11 |     'bs': 64,
12 |     'opt': 'ranger',
13 |     'sh': 0.,
14 |     'sa': 0,
15 |     'sym': 0,
16 |     'beta': 0.,
17 |     'act_fn': Mish,
18 |     'fp16': 0,
19 |     'pool': MaxPool,
20 |     'runs': 1,
21 |     'model': xresnet34
22 | }
23 | 


--------------------------------------------------------------------------------
/03_PretextTrainingTime/RandomCutout.py:
--------------------------------------------------------------------------------
 1 | import numpy as np
 2 | from fastai2.vision.all import PILImage, Image
 3 | from fastai2.vision.augment import RandTransform
 4 | 
 5 | 
 6 | # We create this dummy class in order to create a transform that ONLY operates on images of this type
 7 | # We will use it to create all input images
 8 | class PILImageInput(PILImage):
 9 |     pass
10 | 
11 | 
12 | class RandomCutout(RandTransform):
13 |     "Picks a random scaled crop of an image and resize it to `size`"
14 |     split_idx = None
15 | 
16 |     def __init__(self, min_n_holes=5, max_n_holes=10, min_length=5, max_length=50, **kwargs):
17 |         super().__init__(**kwargs)
18 |         self.min_n_holes = min_n_holes
19 |         self.max_n_holes = max_n_holes
20 |         self.min_length = min_length
21 |         self.max_length = max_length
22 | 
23 |     def encodes(self, x: PILImageInput):
24 |         """
25 |         Note that we're accepting our dummy PILImageInput class
26 |         fastai2 will only pass images of this type to our encoder.
27 |         This means that our transform will only be applied to input images and won't
28 |         be run against output images.
29 |         """
30 | 
31 |         n_holes = np.random.randint(self.min_n_holes, self.max_n_holes)
32 |         pixels = np.array(x)  # Convert to mutable numpy array. FeelsBadMan
33 |         h, w = pixels.shape[:2]
34 | 
35 |         for n in range(n_holes):
36 |             h_length = np.random.randint(self.min_length, self.max_length)
37 |             w_length = np.random.randint(self.min_length, self.max_length)
38 |             h_y = np.random.randint(0, h)
39 |             h_x = np.random.randint(0, w)
40 |             y1 = int(np.clip(h_y - h_length / 2, 0, h))
41 |             y2 = int(np.clip(h_y + h_length / 2, 0, h))
42 |             x1 = int(np.clip(h_x - w_length / 2, 0, w))
43 |             x2 = int(np.clip(h_x + w_length / 2, 0, w))
44 | 
45 |             pixels[y1:y2, x1:x2, :] = 0
46 | 
47 |         return Image.fromarray(pixels, mode='RGB')


--------------------------------------------------------------------------------
/03_PretextTrainingTime/config.py:
--------------------------------------------------------------------------------
 1 | from fastai2.layers import Mish, MaxPool
 2 | from fastai2.vision.models.xresnet import xresnet34
 3 | 
 4 | config = {
 5 |     'lr': 8e-3,
 6 |     'size': 128,
 7 |     'sqrmom': 0.99,
 8 |     'mom': 0.9,
 9 |     'eps': 1e-6,
10 |     'epochs': 15,
11 |     'bs': 64,
12 |     'opt': 'ranger',
13 |     'sh': 0.,
14 |     'sa': 0,
15 |     'sym': 0,
16 |     'beta': 0.,
17 |     'act_fn': Mish,
18 |     'fp16': 0,
19 |     'pool': MaxPool,
20 |     'runs': 1,
21 |     'model': xresnet34
22 | }
23 | 


--------------------------------------------------------------------------------
/LICENSE:
--------------------------------------------------------------------------------
 1 | MIT License
 2 | 
 3 | Copyright (c) 2020 Josh Varty
 4 | 
 5 | Permission is hereby granted, free of charge, to any person obtaining a copy
 6 | of this software and associated documentation files (the "Software"), to deal
 7 | in the Software without restriction, including without limitation the rights
 8 | to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
 9 | copies of the Software, and to permit persons to whom the Software is
10 | furnished to do so, subject to the following conditions:
11 | 
12 | The above copyright notice and this permission notice shall be included in all
13 | copies or substantial portions of the Software.
14 | 
15 | THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
16 | IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
17 | FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
18 | AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
19 | LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
20 | OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
21 | SOFTWARE.
22 | 


--------------------------------------------------------------------------------
/README.md:
--------------------------------------------------------------------------------
 1 | # SelfSupervisedLearning
 2 | Experiments with self-supervised learning
 3 | 
 4 | ### Requirements
 5 | 
 6 | You must have [`fastai2`](https://github.com/fastai/fastai2) installed in order to run these notebooks.
 7 | 
 8 | 
 9 | ### Resources
10 | 
11 | [Self-Supervised Learning: Part 1](https://joshvarty.com/2020/02/03/self-supervised-learning-part-1/)
12 | 


--------------------------------------------------------------------------------