├── README.md
├── data
    ├── 1.txt
    ├── others
    │   ├── models
    │   │   ├── .gitkeep
    │   │   └── no_reg_save_0917.pth
    │   ├── no_reg_0917
    │   ├── test_df.pkl.zip
    │   └── train.csv.zip
    ├── test_clean
    └── train_clean.zip
├── exp
    └── nb_.py
├── interpret_tabular.ipynb
├── p_fastai.ipynb
└── test_tablr_mixup_quick_n_dirty_messy_code.ipynb


/README.md:
--------------------------------------------------------------------------------
 1 | # fastai-shared-notebooks
 2 | 
 3 | Some useful functions for fastai tabular model analysing  
 4 | Hope the [notebook](https://github.com/Pak911/fastai-shared-notebooks/blob/master/interpret_tabular.ipynb) is self explanatory :)
 5 | 
 6 | Contains functions and examples of:
 7 | - How to make **prediction on a new dataset** with trained fastai model (learner)
 8 | - How to **use trained embeddings** in other process (to train **Random Forest** in this case)
 9 | - How to calculate **feature importance** in fastai
10 | - How to calculate **partial dependence** for categorical features
11 | - How to plot **dendrograms** for the data
12 | - How to plot **embeddings**
13 | 
14 | Thanks to:
15 | - [fastai](https://github.com/fastai/fastai) framework itself
16 | - fastai Machine Learning course [lesson 3](https://youtu.be/YSFG_W8JxBo?t=4048) and [lesson 4](https://www.youtube.com/watch?v=YSFG_W8JxBo). Or if you prefer - the [notebook](https://github.com/fastai/fastai/blob/master/courses/ml1/lesson2-rf_interpretation.ipynb) of these tutorials  
17 | My notebook is pretty much an implementation of these ones for fastai tabular model case (with some of my thoughts and experiments' results)
18 | 


--------------------------------------------------------------------------------
/data/1.txt:
--------------------------------------------------------------------------------
1 | Test
2 | 


--------------------------------------------------------------------------------
/data/others/models/.gitkeep:
--------------------------------------------------------------------------------
1 | 
2 | 


--------------------------------------------------------------------------------
/data/others/models/no_reg_save_0917.pth:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Pak911/fastai-shared-notebooks/ae5e01216e6a31ccb55b23bc2ae73bc23350b987/data/others/models/no_reg_save_0917.pth


--------------------------------------------------------------------------------
/data/others/no_reg_0917:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Pak911/fastai-shared-notebooks/ae5e01216e6a31ccb55b23bc2ae73bc23350b987/data/others/no_reg_0917


--------------------------------------------------------------------------------
/data/others/test_df.pkl.zip:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Pak911/fastai-shared-notebooks/ae5e01216e6a31ccb55b23bc2ae73bc23350b987/data/others/test_df.pkl.zip


--------------------------------------------------------------------------------
/data/others/train.csv.zip:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Pak911/fastai-shared-notebooks/ae5e01216e6a31ccb55b23bc2ae73bc23350b987/data/others/train.csv.zip


--------------------------------------------------------------------------------
/data/test_clean:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Pak911/fastai-shared-notebooks/ae5e01216e6a31ccb55b23bc2ae73bc23350b987/data/test_clean


--------------------------------------------------------------------------------
/data/train_clean.zip:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/Pak911/fastai-shared-notebooks/ae5e01216e6a31ccb55b23bc2ae73bc23350b987/data/train_clean.zip


--------------------------------------------------------------------------------
/exp/nb_.py:
--------------------------------------------------------------------------------
  1 | 
  2 | #################################################
  3 | ### THIS FILE WAS AUTOGENERATED! DO NOT EDIT! ###
  4 | #################################################
  5 | # files to edit: 01-main_train.ipynb 02-main_train-experiments.ipynb 03-main_simple-FI.ipynb 04-main_retrain-FI.ipynb 05-main_part_dep.ipynb 06-main_dendrogram-and-dem-red.ipynb _functions.ipynb check_data.ipynb contract_till_interpret_importance_clean.ipynb interpret_tabular.ipynb test_mixup.ipynb
  6 | from fastai.layers import FlattenedLoss
  7 | 
  8 | from fastai.tabular import *
  9 | 
 10 | from fastai.basic_train import _loss_func2activ
 11 | 
 12 | from fastai.callbacks import CSVLogger
 13 | 
 14 | from scipy.cluster import hierarchy as hc
 15 | 
 16 | from sklearn import manifold
 17 | 
 18 | import pickle
 19 | 
 20 | def _list_diff(list_1, list_2):
 21 |     diff = set(list_1) - set(list_2)
 22 |     return [item for item in list_1 if item in diff]
 23 | 
 24 | def list_diff(list1, list2, *args):
 25 |     diff = _list_diff(list1, list2)
 26 |     for arg in args:
 27 |         diff = _list_diff(diff, arg)
 28 |     return diff
 29 | 
 30 | def exp_mmape(pred:Tensor, targ:Tensor)->Rank0Tensor:
 31 |     "Exp median absolute percentage error between `pred` and `targ`."
 32 |     pred,targ = flatten_check(pred,targ)
 33 |     pred, targ = torch.exp(pred), torch.exp(targ)
 34 |     pct_var = (targ - pred)/targ
 35 |     return torch.abs(pct_var).median()
 36 | 
 37 | def MAELossFlat(*args, axis:int=-1, floatify:bool=True, **kwargs):
 38 |     "Same as `nn.MAELoss`, but flattens input and target."
 39 |     return FlattenedLoss(nn.L1Loss, *args, axis=axis, floatify=floatify, is_2d=False, **kwargs)
 40 | 
 41 | def _list_diff(list_1, list_2):
 42 |     diff = set(list_1) - set(list_2)
 43 |     return [item for item in list_1 if item in diff]
 44 | 
 45 | def list_diff(list1, list2, *args):
 46 |     diff = _list_diff(list1, list2)
 47 |     for arg in args:
 48 |         diff = _list_diff(diff, arg)
 49 |     return diff
 50 | 
 51 | def which_elms(values, in_list):
 52 |     '''
 53 |     Just outputs elements from values that are in list in_list
 54 |     '''
 55 |     return [x for x in values if (x in in_list)]
 56 | 
 57 | def is_in_list(values, in_list):
 58 |     '''
 59 |     Just outputs is one of the elements from values is in list in_list
 60 |     '''
 61 |     if (len(which_elms(values, in_list)) > 0):
 62 |         return True
 63 |     else:
 64 |         return False
 65 | 
 66 | def apply_fill_n_catf(df:DataFrame, learn:Learner)->DataFrame:
 67 |     '''
 68 |     Reapplies FillMissing and Categorify to given dataframe.
 69 |     '''
 70 | 
 71 |     df_copy = df.copy()
 72 |     fill, catf = None, None
 73 |     is_alone = True if (len(df) == 1) else False
 74 | 
 75 |     proc = learn.data.processor[0]
 76 |     if (is_alone):
 77 |         df_copy = df_copy.append(df_copy.iloc[0])
 78 | 
 79 |     for prc in proc.procs:
 80 |         if (type(prc) == FillMissing):
 81 |             fill = prc
 82 |         elif (type(prc) == Categorify):
 83 |             catf = prc
 84 |     if (fill is not None):
 85 |         fill.apply_test(df_copy)
 86 | 
 87 |     if (catf is not None):
 88 |         catf.apply_test(df_copy)
 89 |         for c in catf.cat_names:
 90 |             df_copy[c] = (df_copy[c].cat.codes).astype(np.int64) + 1
 91 |         cats = df_copy[catf.cat_names].to_numpy()
 92 | 
 93 |     # ugly workaround as apperently catf.apply_test doesn't work with lone row
 94 |     if (is_alone):
 95 |         df_copy = df_copy[:1]
 96 | 
 97 |     return df_copy
 98 | 
 99 | 
100 | def apply_fill(df:DataFrame, learn:Learner)->DataFrame:
101 |     '''
102 |     Reapplies FillMissing to given dataframe.
103 |     '''
104 | 
105 |     df_copy = df.copy()
106 |     fill = None
107 |     is_alone = True if (len(df) == 1) else False
108 | 
109 |     proc = learn.data.processor[0]
110 |     if (is_alone):
111 |         df_copy = df_copy.append(df_copy.iloc[0])
112 | 
113 |     for prc in proc.procs:
114 |         if (type(prc) == FillMissing):
115 |             fill = prc
116 |     if (fill is not None):
117 |         fill.apply_test(df_copy)
118 | 
119 |     # ugly workaround as apperently catf.apply_test doesn't work with lone row
120 |     if (is_alone):
121 |         df_copy = df_copy[:1]
122 | 
123 |     return df_copy
124 | 
125 | 
126 | def get_model_real_input(df:DataFrame, learn:Learner, bs:int=None)->Tensor:
127 | 
128 |     df_copy = df.copy()
129 |     fill, catf, norm = None, None, None
130 |     cats, conts = None, None
131 |     is_alone = True if (len(df) == 1) else False
132 | 
133 | 
134 |     proc = learn.data.processor[0]
135 |     if (is_alone):
136 |         df_copy = df_copy.append(df_copy.iloc[0])
137 | 
138 |     for prc in proc.procs:
139 |         if (type(prc) == FillMissing):
140 |             fill = prc
141 |         elif (type(prc) == Categorify):
142 |             catf = prc
143 |         elif (type(prc) == Normalize):
144 |             norm = prc
145 |     if (fill is not None):
146 |         fill.apply_test(df_copy)
147 |     if (catf is not None):
148 |         catf.apply_test(df_copy)
149 |         for c in catf.cat_names:
150 |             df_copy[c] = (df_copy[c].cat.codes).astype(np.int64) + 1
151 |         cats = df_copy[catf.cat_names].to_numpy()
152 | 
153 |     if (norm is not None):
154 |         norm.apply_test(df_copy)
155 |         conts = df_copy[norm.cont_names].to_numpy().astype('float32')
156 | 
157 |     # ugly workaround as apperently catf.apply_test doesn't work with lone row
158 |     if (is_alone):
159 |         xs = [torch.tensor([cats[0]], device=learn.data.device), torch.tensor([conts[0]], device=learn.data.device)]
160 |     else:
161 |         if (bs is None):
162 |             xs = [torch.tensor(cats, device=learn.data.device), torch.tensor(conts, device=learn.data.device)]
163 |         elif (bs > 0):
164 |             xs = [list(chunks(l=torch.tensor(cats, device=learn.data.device), n=bs)),
165 |                   list(chunks(l=torch.tensor(conts, device=learn.data.device), n=bs))]
166 | 
167 |     return xs
168 | 
169 | 
170 | def get_cust_preds(df:DataFrame, learn:Learner, bs:int=None, parent=None)->Tensor:
171 |     '''
172 |     Using existing model to predict output (learn.model) on a new dataframe at once (learn.predict does it for
173 |     one row which is pretty slow).
174 |     '''
175 |     def turn_to_activ(learn, acts):
176 |         activ = _loss_func2activ(learn.loss_func)
177 |         if activ is not None:
178 |             return to_np(activ(acts))
179 |         else:
180 |             return to_np(acts)
181 | 
182 |     xs = get_model_real_input(df=df, learn=learn, bs=bs)
183 |     learn.model.eval();
184 |     if (bs is None):
185 |         outp = learn.model(x_cat=xs[0], x_cont=xs[1])
186 | 
187 |     elif (bs > 0):
188 |         res = []
189 |         for ca, co in zip(xs[0], xs[1]):
190 |             res.append(to_np(learn.model(x_cat=ca, x_cont=co)))
191 |         #double translation to save gpu memory
192 |         outp = tensor(np.concatenate(res, axis=0))
193 |     return turn_to_activ(learn=learn, acts=outp)
194 | 
195 | 
196 | def convert_dep_col(df:DataFrame, dep_col:AnyStr, learn:Learner)->Tensor:
197 |     '''
198 |     Converts dataframe column, named "depended column", into tensor, that can later be used to compare with predictions.
199 |     Log will be applied if it was done in a training dataset
200 |     '''
201 |     actls = df[dep_col].T.to_numpy()[np.newaxis].T.astype('float32')
202 |     actls = np.log(actls) if (hasattr(learn.data, 'log') and learn.data.log) else actls
203 |     return torch.tensor(actls, device=learn.data.device)
204 | 
205 | 
206 | def calc_loss(func:Callable, pred:Tensor, targ:Tensor, device=None)->Rank0Tensor:
207 |     '''
208 |     Calculates error from predictions and actuals with a given metrics function
209 |     '''
210 |     if (device is None):
211 |         return func(pred, targ)
212 |     else:
213 |         return func(torch.tensor(pred, device=device), targ)
214 | 
215 | 
216 | def calc_error(df:DataFrame, learn:Learner, dep_col:AnyStr,
217 |                func:Callable, bs:int=None)->float:
218 |     '''
219 |     Wrapping function to calculate error for new dataframe on existing learner (learn.model)
220 |     See following functions' docstrings for details
221 |     '''
222 |     preds = get_cust_preds(df=df, learn=learn, bs=bs)
223 |     actls = convert_dep_col(df, dep_col, learn)
224 |     error = calc_loss(func, pred=preds, targ=actls, device=learn.data.device)
225 |     return float(error)
226 | 
227 | def emb_fwrd_sim(model, x_cat:Tensor, x_cont:Tensor)->Tensor:
228 |     '''
229 |     Part that was completely taking from fastai Tabular model source :)
230 |     Gets inner representation of input dataframe (Catigorified, Filled and Normalized)
231 |     and process it with embeddings 'prelayer'. Also continuous variables are processed with BatchNorm if needed.
232 |     As a result output is model gets on it's layers as input (embedding in fact are not layers, but before them)
233 |     '''
234 |     if model.n_emb != 0:
235 |         x = [e(x_cat[:,i]) for i,e in enumerate(model.embeds)]
236 |         x = torch.cat(x, 1)
237 |         x = model.emb_drop(x)
238 |     if model.n_cont != 0:
239 |         x_cont = model.bn_cont(x_cont)
240 |         x = torch.cat([x, x_cont], 1) if model.n_emb != 0 else x_cont
241 |     return x
242 | 
243 | 
244 | def get_inner_repr(df:DataFrame, learn:Learner)->Tensor:
245 |     '''
246 |     Gets new dataframe that has categorical and continuous columns the learner war learnt with
247 |     (are being taken from learner automatically)
248 |     And outputs inner representation of these data -- what model gets after embeddings
249 |     Is useful for ex. to use learnt embeddings in random forest
250 |     This output can be directly feed to RF learner (after turning it to numpy if needed)
251 |     '''
252 |     xs = get_model_real_input(df=df, learn=learn)
253 |     return emb_fwrd_sim(model=learn.model, x_cat=xs[0], x_cont=xs[1])
254 | 
255 | def calc_error_mixed_col(df:DataFrame,
256 |                          learn:Learner,
257 |                          dep_col:AnyStr,
258 |                          sampl_col:AnyStr,
259 |                          func:Callable,
260 |                          bs:int=None,
261 |                          rounds=5)->float:
262 |     df_temp = pd.concat([df]*rounds, ignore_index=True).copy()
263 |     df_temp[sampl_col] = np.random.permutation(df_temp[sampl_col].values)
264 |     return calc_error(df=df_temp, learn=learn, dep_col=dep_col, func=func, bs=bs)
265 | 
266 | 
267 | def get_columns(learn:Learner)->tuple:
268 |     cats, cats_temp, conts, conts_temp = [], [], [], []
269 |     proc = learn.data.processor[0]
270 |     for prc in proc.procs:
271 |         if (type(prc) == Categorify):
272 |             cats_temp = prc.cat_names
273 |         elif (type(prc) == Normalize):
274 |             conts = prc.cont_names
275 | 
276 |     #delete _na columns
277 |     conts_temp = [cont+'_na' for cont in conts]
278 |     for cat in cats_temp:
279 |         if (cat not in conts_temp):
280 |              cats.append(cat)
281 | 
282 |     return cats, conts
283 | 
284 | 
285 | def calc_feat_importance(df:DataFrame,
286 |                          learn:Learner,
287 |                          dep_col:AnyStr,
288 |                          func:Callable,
289 |                          bs:int=None,
290 |                          rounds=5)->OrderedDict:
291 | 
292 |     base_error = calc_error(df=df, learn=learn, dep_col=dep_col, func=func, bs=bs)
293 |     cats, conts = get_columns(learn=learn)
294 |     importance = {}
295 |     pbar = master_bar(cats+conts, total=len(cats+conts))
296 |     for col in pbar:
297 |         importance[col] = calc_error_mixed_col(df=df, learn=learn, dep_col=dep_col,
298 |                                                sampl_col=col, func=func, bs=bs, rounds=rounds)
299 |         _ = progress_bar(range(1), display=False, parent=pbar) #looks like fastprogress doesn't work without 2nd bar :(
300 |     for key, value in importance.items():
301 |         importance[key] = (value - base_error)/base_error
302 |     return collections.OrderedDict(sorted(importance.items(), key=lambda kv: kv[1], reverse=True))
303 | 
304 | 
305 | def calc_fi_custom(df:DataFrame,
306 |                    learn:Learner,
307 |                    dep_col:AnyStr,
308 |                    fields:List,
309 |                    func:Callable,
310 |                    bs:int=None,
311 |                    rounds=5)->OrderedDict:
312 | 
313 |     base_error = calc_error(df=df, learn=learn, dep_col=dep_col, func=func, bs=bs)
314 |     importance = {}
315 |     pbar = master_bar(fields, total=len(fields))
316 |     for field in pbar:
317 |         key = field if isinstance(field, str) else ', '.join(str(e) for e in field)
318 |         importance[key] = calc_error_mixed_col(df=df, learn=learn, dep_col=dep_col,
319 |                                                sampl_col=field, func=func, bs=bs, rounds=rounds)
320 |         _ = progress_bar(range(1), display=False, parent=pbar) #looks like fastprogress doesn't work without 2nd bar :(
321 |     for key, value in importance.items():
322 |         importance[key] = (value - base_error)/base_error
323 |     return collections.OrderedDict(sorted(importance.items(), key=lambda kv: kv[1], reverse=True))
324 | 
325 | def ord_dic_to_df(ord_dict:OrderedDict)->DataFrame:
326 |     return pd.DataFrame([[k, v] for k, v in ord_dict.items()], columns=['feature', 'importance'])
327 | 
328 | def plot_importance(df:DataFrame, limit=20, asc=False):
329 |     df_copy = df.copy()
330 |     df_copy['feature'] = df_copy['feature'].str.slice(0,25)
331 |     ax = df_copy.sort_values(by='importance', ascending=asc)[:limit].sort_values(by='importance', ascending=not(asc)).plot.barh(x="feature", y="importance", sort_columns=True, figsize=(10, 10))
332 |     for p in ax.patches:
333 |         ax.annotate(f'{p.get_width():.4f}', ((p.get_width() * 1.005), p.get_y()  * 1.005))
334 | 
335 | 
336 | #     implement function that returns learner object in your notebook
337 | #
338 | #     For ex.
339 | #     def build_learner_cur(df:DataFrame,
340 | #                       bs:int,
341 | #                       acc_func:Callable,
342 | #                       dep_var:str,
343 | #                       to_drop_cat:tuple=(),
344 | #                       to_drop_cont:tuple=()):
345 | #         cat_vars_mod = list_diff(cat_vars, to_drop_cat)
346 | #         cont_vars_mod = list_diff(cont_vars, to_drop_cont)
347 | #         data = (TabularList.from_df(df, path=path, cat_names=cat_vars_mod, cont_names=cont_vars_mod, procs=procs)
348 | #                 .split_by_idx(valid_idx)
349 | #                 .label_from_df(cols=dep_var, label_cls=FloatList, log=True)
350 | #                 .databunch(bs=bs))
351 | #         np.random.seed(1001)
352 | #         learn = tabular_learner(data,
353 | #                                 layers=p['layers'],
354 | #                                 ps=p['layers_drop'],
355 | #                                 emb_drop=p['emb_drop'],
356 | #                                 y_range=y_range,
357 | #                                 metrics=acc_func,
358 | #                                 loss_func=MAELossFlat(),
359 | #                                 callback_fns=[CSVLogger])
360 | #         return learn
361 | #
362 | 
363 | #     implement function does 1 training loop in your notebook
364 | #
365 | #     For ex.
366 | #     def do_train_loop_cur(learn:Learner, cycles):
367 | #         learn.fit_one_cycle(cyc_len=cycles, max_lr=p['max_lr'], wd=p['w_decay'])
368 | 
369 | def clear_pbar():
370 |     # Just to clear the output. Yes, I know, I agree It's awfull should be refactored
371 |     for _ in progress_bar(range(1), parent=None, leave=False):
372 |         1==1
373 | 
374 | def extract_metrics_median(metrics_df:DataFrame, acc_func:Callable, bottom_X:float=0.2)->float:
375 |     func_name = acc_func.__name__
376 |     metr = metrics_df[func_name].to_numpy()
377 |     subset = metr[np.argsort(metr)][-math.ceil(len(metr)*bottom_X):] if (func_name =='accuracy') else metr[np.argsort(metr)][:math.ceil(len(metr)*bottom_X)]
378 |     metrics = np.median(subset)
379 |     return float(metrics)
380 | 
381 | def calc_valid_acc(learn:Learner, func:Callable)->float:
382 |     metr = learn.csv_logger.read_logged_file()
383 |     acc = extract_metrics_median(metrics_df=metr, acc_func=func)
384 |     return float(acc)
385 | 
386 | def calc_acc(df:DataFrame,
387 |              bs:int,
388 |              acc_func:Callable,
389 |              dep_var:str,
390 |              to_drop_cat:tuple=(),
391 |              to_drop_cont:tuple=(),
392 |              load_learn:str=None,
393 |              trains:int=1,
394 |              cycles:int=80,
395 |              is_overall_mode:bool=None)->float:
396 |     learn = build_learner(df=df,
397 |                   bs=bs,
398 |                   acc_func=acc_func,
399 |                   dep_var=dep_var,
400 |                   to_drop_cat=to_drop_cat,
401 |                   to_drop_cont=to_drop_cont)
402 |     if (load_learn is not None):
403 |         learn = learn.load(load_learn)
404 |     else:
405 |         for i in range(trains):
406 |             print(f"Train {i+1} of {trains}")
407 |             do_train_loop(learn, cycles)
408 |             clear_pbar()
409 |     if (is_overall_mode is None) or (is_overall_mode == False):
410 |         acc = calc_valid_acc(learn=learn, func=acc_func)
411 |     else:
412 |         acc = calc_error(df=df, learn=learn, dep_col=dep_var, func=acc_func, bs=bs)
413 |     return acc
414 | 
415 | def calc_1_imp_relearn(base_error:float,
416 |                        df:DataFrame,
417 |                        bs:int,
418 |                        acc_func:Callable,
419 |                        dep_var:str,
420 |                        to_drop_cat:tuple=(),
421 |                        to_drop_cont:tuple=(),
422 |                        load_learn:str=None,
423 |                        trains:int=1,
424 |                        cycles:int=80,
425 |                        is_overall_mode:bool=None)->float:
426 |     error = calc_acc(df, bs, acc_func, dep_var, to_drop_cat, to_drop_cont, load_learn,
427 |                      trains=trains, cycles=cycles, is_overall_mode=is_overall_mode)
428 |     if (acc_func.__name__ == 'accuracy'):
429 |         base_acc, accuracy = base_error, error # Just rename for better understanding
430 |         importance = (base_acc - accuracy)/base_acc
431 |     else:
432 |         importance = (error - base_error)/base_error
433 |     return (list(to_drop_cat)+list(to_drop_cont), importance)
434 | 
435 | def print_importance_res(dropped:List, importance:float):
436 |     print('Features '+', '.join(dropped)+' have accumulated importance of')
437 |     print(importance)
438 | 
439 | def calc_many_imps_relearn(base_error:float,
440 |                            df:DataFrame,
441 |                            bs:int,
442 |                            acc_func:Callable,
443 |                            dep_var:str,
444 |                            to_drop_cats:tuple=(),
445 |                            to_drop_conts:tuple=(),
446 |                            load_learn:str=None,
447 |                            trains:int=1,
448 |                            cycles:int=80,
449 |                            is_overall_mode:bool=None)->float:
450 | 
451 |     to_drop_cats = listify(to_drop_cats)
452 |     to_drop_conts = listify(to_drop_conts)
453 |     importances = {}
454 | 
455 |     overall = len(list(to_drop_cats)+list(to_drop_conts))
456 |     for i, var in enumerate(to_drop_cats):
457 |         var = listify(var)
458 |         print(f"Categorical feature {i+1} of {len(to_drop_cats)}")
459 |         imp = calc_1_imp_relearn(base_error, df, bs, acc_func,
460 |                                  dep_var=dep_var, to_drop_cat=var, trains=trains,
461 |                                  cycles=cycles, is_overall_mode=is_overall_mode)
462 |         key = imp[0] if isinstance(imp[0], str) else ', '.join(str(e) for e in imp[0])
463 |         importances[key] = imp
464 | 
465 |     for i, var in enumerate(to_drop_conts):
466 |         var = listify(var)
467 |         print(f"Continuous feature {i+1} of {len(to_drop_conts)}")
468 |         imp = calc_1_imp_relearn(base_error, df, bs, acc_func,
469 |                                   dep_var=dep_var, to_drop_cont=var, trains=trains,
470 |                                  cycles=cycles, is_overall_mode=is_overall_mode)
471 |         key = imp[0] if isinstance(imp[0], str) else ', '.join(str(e) for e in imp[0])
472 |         importances[key] = imp
473 | 
474 |     return importances
475 | 
476 | def calc_mean_dict(lst):
477 |     mean_dict = {}
478 |     ln = len(lst)
479 |     for key, value in lst[0].items():
480 |         mean_dict[key] = np.zeros(ln)
481 |     for i, row in enumerate(lst):
482 |         for key, value in row.items():
483 |             mean_dict[key][i] = value[1]
484 |     for key, value in mean_dict.items():
485 |         mean_dict[key] = np.median(value)
486 | 
487 |     return mean_dict
488 | 
489 | 
490 | def calc_many_imps_relearn_steps(base_error:float,
491 |                                  df:DataFrame,
492 |                                  bs:int,
493 |                                  acc_func:Callable,
494 |                                  dep_var:str,
495 |                                  to_drop_cats:tuple=(),
496 |                                  to_drop_conts:tuple=(),
497 |                                  load_learn:str=None,
498 |                                  trains=1,
499 |                                  cycles=80,
500 |                                  rounds=5,
501 |                                  is_overall_mode:bool=None)->dict:
502 |     '''
503 |     to_drop_cats and to_drop_conts:tuple can be tupple of tuples (lists of lists)
504 |     this means we measure every item in the first list and retrain without every item in the second one in one turn
505 |     (treat it as one entity)
506 |     '''
507 |     acc = []
508 |     for i in range(rounds):
509 |         print(f"Round {i+1} of {rounds}")
510 |         acc_ = calc_many_imps_relearn(base_error=base_error,
511 |                                       df=df,
512 |                                       bs=bs,
513 |                                       acc_func=acc_func,
514 |                                       dep_var=dep_var,
515 |                                       to_drop_cats=to_drop_cats,
516 |                                       to_drop_conts=to_drop_conts,
517 |                                       trains=trains,
518 |                                       cycles=cycles,
519 |                                       is_overall_mode=is_overall_mode)
520 |         acc.append(acc_)
521 |     imp = calc_mean_dict(acc)
522 |     return collections.OrderedDict(sorted(imp.items(), key=lambda kv: kv[1], reverse=True))
523 | 
524 | 
525 | def calc_base_acc_steps(df:DataFrame,
526 |                         bs:int,
527 |                         acc_func:Callable,
528 |                         dep_var:str,
529 |                         trains=1,
530 |                         cycles=80,
531 |                         rounds=5,
532 |                         is_overall_mode:bool=None)->float:
533 |     base_acc=np.empty((rounds))
534 |     for i in range(rounds):
535 |         print(f"Round {i+1} of {rounds}")
536 |         base_acc[i] = calc_acc(df=df, bs=bs,
537 |                                acc_func=acc_func, dep_var=dep_var, trains=trains,
538 |                                cycles=cycles, is_overall_mode=is_overall_mode)
539 |     return np.median(base_acc)
540 | 
541 | def get_field_uniq_x_coef(df:DataFrame, field:str, coef:float)->list:
542 |     '''
543 |     This function outputs threshold to number of occurrences different variants of list of columns (fields)
544 |     In short if coef for ex. is 0.9, then function outputs number of occurrences for all but least 10%
545 |     of the least used
546 |     If coef is more 1.0, then 'coef' itself is used as threshold
547 |     '''
548 |     if (coef > 1):
549 |         return math.ceil(coef)
550 |     coef = 0. if (coef < 0) else coef
551 |     occs = df.groupby(field).size().reset_index(name="Times").sort_values(['Times'], ascending=False)
552 |     num = math.ceil(coef*len(occs))
553 |     if (num <= 0):
554 |         # number of occurances is now = max_occs+1 (so it will be no items with this filter)
555 |         return occs.iloc[0]['Times'] + 1
556 |     else:
557 |         return occs.iloc[num-1]['Times']
558 | 
559 | 
560 | def get_part_dep_one_list(df:DataFrame,
561 |                      learn:Learner, bs:int=None, fields:list=(), coef:float=1.0, to_int:bool=False,
562 |                      dep_name:str=None, is_sorted:bool=True)->DataFrame:
563 |     '''
564 |     Function calculate partial dependency for column in fields.
565 |     Fields is a list of lists of what columns we want to test. The inner items are treated as connected fields.
566 |     For ex. fields = [['Store','StoreType']] mean that Store and StoreType is treated as one entity
567 |     (it's values are substitute as a pair, not as separate values)
568 |     coef is useful when we don't want to deal with all the variants, but only with most common
569 |     '''
570 |     NAN_SUBST = '###na###'
571 |     CONT_COLS = get_cont_cols(learn)
572 |     if (dep_name is None):
573 |         dep_name = 'dep_var'
574 | 
575 |     fields = listify(fields)
576 |     df = apply_fill(df=df, learn=learn)
577 | 
578 |     #divide cont variables into groups
579 |     if is_in_list(values=fields, in_list=CONT_COLS):
580 |         for col in which_elms(values=fields, in_list=CONT_COLS):
581 |             edges = np.histogram_bin_edges(a=df[col].dropna(), bins='auto')
582 |             for x,y in zip(edges[::],edges[1::]):
583 |                 df.loc[(df[col] > x) & (df[col] < y), col] = (x+y)/2
584 | 
585 |     field_min_occ = get_field_uniq_x_coef(df=df, field=fields, coef=coef)
586 |     df[fields] = df[fields].fillna(NAN_SUBST) #to treat None as a separate field
587 |     occs = df.groupby(fields).size().reset_index(name="Times").sort_values(['Times'], ascending=False)
588 |     occs[fields] = occs[fields].replace(to_replace=NAN_SUBST, value=np.nan) #get back Nones from NAN_SUBST
589 |     df[fields] = df[fields].replace(to_replace=NAN_SUBST, value=np.nan) #get back Nones from NAN_SUBST
590 |     occs = occs[occs['Times'] >= field_min_occ]
591 |     df_copy = df.merge(occs[fields]).copy()
592 | 
593 |     frame = []
594 |     ln = len(occs)
595 |     if (ln > 0):
596 |         pbar = master_bar(occs.iterrows(), total=ln)
597 |         for _, row in pbar:
598 |             # We don't need to do df_copy = df.merge(occs[field]).copy() every time
599 |             # as every time we change the same column (set of columns)
600 |             record = []
601 |             pb = progress_bar(fields, display=False, parent=pbar)
602 |             for fld in pb:
603 |                 df_copy[fld] = row[fld]
604 |             preds = get_cust_preds(df=df_copy, learn=learn, bs=bs)
605 |             preds = np.exp(np.median(preds)) if (hasattr(learn.data, 'log') and learn.data.log) else np.median(preds)
606 |             pred = int(preds) if to_int else preds
607 |             for fld in fields:
608 |                 record.append(row[fld])
609 |             record.append(pred)
610 |             record.append(row['Times'])
611 |             frame.append(record)
612 |     out = pd.DataFrame(frame, columns=fields+[dep_name, 'times'])
613 |     median = out[dep_name].median()
614 |     out[dep_name] /= median
615 |     if (is_sorted == True):
616 |         out = out.sort_values(by=dep_name, ascending=False)
617 |     return out
618 | 
619 | def get_cat_cols(learn:Learner,  is_wo_na=True)->List:
620 |     '''
621 |     Just outputs category fields from LabelLists object
622 |     '''
623 |     catf = None
624 |     result = []
625 |     proc = learn.data.processor[0]
626 |     for prc in proc.procs:
627 |         if (type(prc) == Categorify):
628 |             catf = prc
629 |     if (catf is not None):
630 |         result = [c for c in catf.cat_names if ((is_wo_na is not None) and (is_wo_na == True) and (c[-3:] != "_na"))]
631 |     return result
632 | 
633 | 
634 | def get_cont_cols(learn:Learner)->List:
635 |     '''
636 |     Just outputs continuous fields from LabelLists object
637 |     '''
638 |     norm = None
639 |     result = []
640 |     proc = learn.data.processor[0]
641 | 
642 |     for prc in proc.procs:
643 |         if (type(prc) == Normalize):
644 |             norm = prc
645 | 
646 |     if (norm is not None):
647 |         result = norm.cont_names
648 | 
649 |     return result
650 | 
651 | 
652 | def get_part_dep(df:DataFrame, learn:Learner, bs:int=None,
653 |                  fields:tuple=None, coef:float=1.0, to_int:bool=False,
654 |                  dep_name:str=None, is_sorted:bool=True)->List:
655 |     '''
656 |     Makes a datafreme with partial dependencies for every categorical variable in df
657 |     '''
658 |     result = []
659 |     if (fields is None):
660 |         fields = get_cat_cols(learn=learn) + get_cont_cols(learn=learn)
661 | 
662 |     for field in fields:
663 |         new_df = get_part_dep_one_list(df=df, learn=learn, bs=bs, fields=field, to_int=to_int,
664 |                                        dep_name=dep_name, coef=coef, is_sorted=is_sorted)
665 |         new_df['feature'] = str(field)
666 |         if is_listy(field):
667 |             new_df['value'] = new_df[field].values.tolist()
668 |             new_df.drop(columns=field, inplace=True)
669 |         else:
670 |             new_df = new_df.rename(index=str, columns={str(field): "value"})
671 |         result.append(new_df)
672 |     clear_pbar()
673 |     result = pd.concat(result, ignore_index=True, sort=True)
674 |     result = result[['feature', 'value', dep_name, 'times']]
675 | 
676 |     return result
677 | 
678 | def build_correlation_matr(df:DataFrame):
679 |     '''
680 |     Build Spearman rank-order correlation matrix
681 |     NA in df should be fixed before pass here
682 |     '''
683 |     corr = np.round(scipy.stats.spearmanr(df).correlation, 4)
684 |     corr[np.isnan(corr)] = 0.0
685 |     np.fill_diagonal(corr, 1.0)
686 |     return corr
687 | 
688 | def plot_dendrogram_corr(corr_matr, columns, figsize=None, leaf_font_size=16):
689 |     '''
690 |     Plots dendrogram for a given correlation matrix
691 |     '''
692 |     if (figsize is None):
693 |         figsize = (15, 0.02*leaf_font_size*len(columns))
694 |     corr_condensed = hc.distance.squareform(1-corr_matr)
695 |     z = hc.linkage(corr_condensed, method='average')
696 |     fig = plt.figure(figsize=figsize)
697 |     dendrogram = hc.dendrogram(z, labels=columns, orientation='left', leaf_font_size=leaf_font_size)
698 |     plt.show()
699 | 
700 | def plot_dendrogram(df:DataFrame, figsize=None, leaf_font_size=16):
701 |     corr = build_correlation_matr(df)
702 |     plot_dendrogram_corr(corr_matr=corr, columns=df.columns, figsize=figsize, leaf_font_size=leaf_font_size)
703 | 
704 | def cramers_corrected_stat(confusion_matrix):
705 |     """ calculate Cramers V statistic for categorial-categorial association.
706 |         uses correction from Bergsma and Wicher,
707 |         Journal of the Korean Statistical Society 42 (2013): 323-328
708 |     """
709 |     chi2 = scipy.stats.chi2_contingency(confusion_matrix)[0]
710 |     if (chi2 == 0):
711 |         return 0.0
712 |     n = confusion_matrix.sum().sum()
713 |     phi2 = chi2/n
714 |     r,k = confusion_matrix.shape
715 |     phi2corr = max(0, phi2 - ((k-1)*(r-1))/(n-1))
716 |     rcorr = r - ((r-1)**2)/(n-1)
717 |     kcorr = k - ((k-1)**2)/(n-1)
718 |     return np.sqrt(phi2corr / min( (kcorr-1), (rcorr-1)))
719 | 
720 | def get_cramer_v_matr(df:DataFrame)->np.ndarray:
721 |     '''
722 |     Calculate Cramers V statistic for every pair in df's columns
723 |     '''
724 |     cols = list(df.columns)
725 |     corrM = np.zeros((len(cols), len(cols)))
726 |     pbar = master_bar(list(itertools.combinations(cols, 2)))
727 |     for col1, col2 in pbar:
728 |         _ = progress_bar(range(1), parent=pbar) #looks like fastprogress doesn't work without 2nd bar :(
729 |         idx1, idx2 = cols.index(col1), cols.index(col2)
730 |         corrM[idx1, idx2] = cramers_corrected_stat(pd.crosstab(df[col1], df[col2]))
731 |         corrM[idx2, idx1] = corrM[idx1, idx2]
732 |     np.fill_diagonal(corrM, 1.0)
733 |     return corrM
734 | 
735 | def get_top_corr_df(df:DataFrame, corr_thr:float=0.8, corr_matr:array=None)->DataFrame:
736 |     if (corr_matr is not None):
737 |         corr = corr_matr
738 |     else:
739 |         corr = build_correlation_matr(df=df)
740 |     corr = np.where(abs(corr)<corr_thr, 0, corr)
741 |     idxs = []
742 |     for i in range(corr.shape[0]):
743 |         if (corr[i, :].sum() + corr[:, i].sum() > 2):
744 |             idxs.append(i)
745 |     cols = df.columns[idxs]
746 |     return pd.DataFrame(corr[np.ix_(idxs, idxs)], columns=cols, index=cols)
747 | 
748 | def get_top_corr_dict_corrs(top_corrs:DataFrame)->OrderedDict:
749 |     cols = top_corrs.columns
750 |     top_corrs_np = top_corrs.to_numpy()
751 |     corr_dict = {}
752 |     for i in range(top_corrs_np.shape[0]):
753 |         for j in range(i+1, top_corrs_np.shape[0]):
754 |             if (top_corrs_np[i, j] > 0):
755 |                 corr_dict[cols[i]+' vs '+cols[j]] = np.round(top_corrs_np[i, j], 3)
756 |     return collections.OrderedDict(sorted(corr_dict.items(), key=lambda kv: abs(kv[1]), reverse=True))
757 | 
758 | def get_top_corr_dict(df:DataFrame, corr_thr:float=0.8, corr_matr:array=None)->OrderedDict:
759 |     '''
760 |     Outputs top pairs of correlation in a given dataframe with a given correlation matrix
761 |     Filters output mith minimal correlation of corr_thr
762 |     '''
763 |     top_corrs = get_top_corr_df(df, corr_thr, corr_matr)
764 |     return get_top_corr_dict_corrs(top_corrs)
765 | 
766 | def get_classes_o_list(learn:Learner):
767 |     procs = learn.data.processor[0]
768 |     return procs.classes
769 | 
770 | def get_rev_emb_idxs(learn:Learner)->dict:
771 |     classes_dict = get_classes_o_list(learn=learn)
772 |     return {c:i for i, (c, _) in enumerate(classes_dict.items()) if (c[-3:] != "_na")}
773 | 
774 | 
775 | def get_emb_outp(learn:Learner, field:str, inp:str, rev_emb_idxs:dict, classes, embs):
776 |     emb = embs[rev_emb_idxs[field]]
777 |     idx, = np.where(classes[field] == inp)
778 |     if (len(idx) == 1):
779 |         cat_idx = idx[0]
780 |     else:
781 |         cat_idx = 0
782 |     return emb(torch.tensor(cat_idx, device=learn.data.device))
783 | 
784 | 
785 | def get_embs_map(learn:Learner)->OrderedDict:
786 |     '''
787 |     Output embedding vector for every item of every cafegirical column as a dictionary of dicts
788 | 
789 |     '''
790 |     cat_cols = get_cat_cols(learn=learn, is_wo_na=True)
791 |     rev_emb_idxs = get_rev_emb_idxs(learn=learn)
792 |     classes = get_classes_o_list(learn=learn)
793 |     embs = learn.model.embeds
794 |     learn.model.eval();
795 |     result = OrderedDict()
796 | 
797 |     for cat in cat_cols:
798 |         cat_res = OrderedDict()
799 |         for val in classes[cat]:
800 |             cat_res[val] = get_emb_outp(learn=learn,
801 |                                         field=cat, inp=str(val),
802 |                                         rev_emb_idxs=rev_emb_idxs,
803 |                                         classes=classes, embs=embs)
804 |         result[cat] = cat_res
805 | 
806 |     return result
807 | 
808 | 
809 | def emb_map_reduce_dim(embs_map:OrderedDict, outp_dim:int=3, to_df:bool=True, method:str='pytorch', exclude:list=None):
810 |     '''
811 |     Reduces dimention of embedding map upto outp_dim
812 |     Can use 'pytorch' approach (pca)
813 |     or 'scilearn' for manifold.TSNE (longer, but not sure that it is better)
814 |     '''
815 |     exclude = listify(exclude)
816 |     result = OrderedDict()
817 |     for feat, val in embs_map.items():
818 |         reformat = []
819 |         names = []
820 |         for k,v in val.items():
821 |             reformat.append(v)
822 |             names.append(k)
823 |         reformat = torch.stack(reformat)
824 |         if (exclude is not None) and (feat in exclude):
825 |             continue
826 |         if (method == 'scilearn'):
827 |             tsne = manifold.TSNE(n_components=outp_dim, init='pca')
828 |             reduced = tsne.fit_transform(to_np(reformat))
829 |         else:
830 |             reduced = reformat.pca(outp_dim)
831 |         record = OrderedDict({k:v for k, v in zip(names, reduced)})
832 |         result[feat] = record
833 | 
834 |     if (to_df == True):
835 |         data = []
836 |         for feat, val in result.items():
837 |             for k,v in val.items():
838 |                 dt = list(v) if (method == 'scilearn') else list(to_np(v))
839 |                 data.append([feat] + [k]  + dt)
840 |         names = ['feature', 'value'] + ['axis_' + str(i) for i in range(outp_dim)]
841 |         result = pd.DataFrame(data, columns=names)
842 | 
843 |     return result
844 | 
845 | 
846 | def add_times_col(embs_map:DataFrame, df:DataFrame)->DataFrame:
847 |     '''
848 |     Adds to embeddings map dataframe new column with times of value's number of occurrences
849 |     Usefull for estimation of how accurate the value is (more time means more sure you can be)
850 |     '''
851 |     times = np.zeros(len(embs_map))
852 |     last_feat = ''
853 |     vc = None
854 |     for i, (f, v) in enumerate(zip(embs_map['feature'], embs_map['value'])):
855 |         if (f != last_feat):
856 |             vc = df[f].value_counts(dropna=False)
857 |             vc.index = vc.index.map(str)
858 |             last_feat = f
859 |         if (v != '#na#'):
860 |             times[i] = vc[v]
861 |         else:
862 |             times[i] = vc['nan'] if ('nan' in vc.index) else 0
863 |     result = embs_map.copy()
864 |     result['times'] = times
865 |     return result
866 | 
867 | # Little helpers for saving/loading variables with pickle
868 | def sv_var(var, name, path):
869 |     f = open(path/f"{name}.pkl","wb")
870 |     pickle.dump(var, f)
871 |     f.close()
872 | 
873 | def ld_var(name, path):
874 |     f = open(path/f"{name}.pkl","rb")
875 |     var = pickle.load(f)
876 |     f.close()
877 |     return var
878 | 
879 | def plot_2d_emb(emb_map:DataFrame, feature:str, top_x:int=10):
880 |     sub_df = emb_map.query(f"feature == '{feature}'").sort_values('times', ascending=False).head(top_x)
881 |     X = sub_df['axis_0']
882 |     Y = sub_df['axis_1']
883 |     plt.figure(figsize=(15, 8))
884 |     plt.scatter(X, Y)
885 |     for name, x, y in zip(sub_df['value'], X, Y):
886 |         plt.text(x, y, name, color=np.random.rand(3)*0.7, fontsize=11)
887 |     plt.show()


--------------------------------------------------------------------------------
/p_fastai.ipynb:
--------------------------------------------------------------------------------
   1 | {
   2 |  "cells": [
   3 |   {
   4 |    "cell_type": "code",
   5 |    "execution_count": 1,
   6 |    "metadata": {
   7 |     "ExecuteTime": {
   8 |      "end_time": "2020-02-04T07:51:59.955651Z",
   9 |      "start_time": "2020-02-04T07:51:59.944675Z"
  10 |     }
  11 |    },
  12 |    "outputs": [],
  13 |    "source": [
  14 |     "%reload_ext autoreload\n",
  15 |     "%autoreload 2"
  16 |    ]
  17 |   },
  18 |   {
  19 |    "cell_type": "code",
  20 |    "execution_count": 2,
  21 |    "metadata": {
  22 |     "ExecuteTime": {
  23 |      "end_time": "2020-02-04T07:52:00.775667Z",
  24 |      "start_time": "2020-02-04T07:51:59.956726Z"
  25 |     }
  26 |    },
  27 |    "outputs": [],
  28 |    "source": [
  29 |     "from fastai.tabular import *"
  30 |    ]
  31 |   },
  32 |   {
  33 |    "cell_type": "code",
  34 |    "execution_count": 3,
  35 |    "metadata": {
  36 |     "ExecuteTime": {
  37 |      "end_time": "2020-02-04T07:52:00.789494Z",
  38 |      "start_time": "2020-02-04T07:52:00.776873Z"
  39 |     }
  40 |    },
  41 |    "outputs": [],
  42 |    "source": [
  43 |     "from fastai import tabular"
  44 |    ]
  45 |   },
  46 |   {
  47 |    "cell_type": "code",
  48 |    "execution_count": 4,
  49 |    "metadata": {
  50 |     "ExecuteTime": {
  51 |      "end_time": "2020-02-04T07:52:00.803458Z",
  52 |      "start_time": "2020-02-04T07:52:00.790694Z"
  53 |     }
  54 |    },
  55 |    "outputs": [],
  56 |    "source": [
  57 |     "# import sys\n",
  58 |     "# sys.path.append(\"../common\")"
  59 |    ]
  60 |   },
  61 |   {
  62 |    "cell_type": "code",
  63 |    "execution_count": 5,
  64 |    "metadata": {
  65 |     "ExecuteTime": {
  66 |      "end_time": "2020-02-04T07:52:00.860672Z",
  67 |      "start_time": "2020-02-04T07:52:00.804450Z"
  68 |     }
  69 |    },
  70 |    "outputs": [],
  71 |    "source": [
  72 |     "from exp.nb_ import *"
  73 |    ]
  74 |   },
  75 |   {
  76 |    "cell_type": "code",
  77 |    "execution_count": 6,
  78 |    "metadata": {
  79 |     "ExecuteTime": {
  80 |      "end_time": "2020-02-04T07:52:00.875788Z",
  81 |      "start_time": "2020-02-04T07:52:00.861602Z"
  82 |     }
  83 |    },
  84 |    "outputs": [],
  85 |    "source": [
  86 |     "# path=Path('../data/other/')"
  87 |    ]
  88 |   },
  89 |   {
  90 |    "cell_type": "code",
  91 |    "execution_count": 7,
  92 |    "metadata": {
  93 |     "ExecuteTime": {
  94 |      "end_time": "2020-02-04T07:52:00.904266Z",
  95 |      "start_time": "2020-02-04T07:52:00.876759Z"
  96 |     }
  97 |    },
  98 |    "outputs": [],
  99 |    "source": [
 100 |     "df = pd.read_csv(path/'train.csv.zip', compression='zip')"
 101 |    ]
 102 |   },
 103 |   {
 104 |    "cell_type": "code",
 105 |    "execution_count": 8,
 106 |    "metadata": {
 107 |     "ExecuteTime": {
 108 |      "end_time": "2020-02-04T07:52:00.926246Z",
 109 |      "start_time": "2020-02-04T07:52:00.905799Z"
 110 |     }
 111 |    },
 112 |    "outputs": [
 113 |     {
 114 |      "data": {
 115 |       "text/html": [
 116 |        "<div>\n",
 117 |        "<style scoped>\n",
 118 |        "    .dataframe tbody tr th:only-of-type {\n",
 119 |        "        vertical-align: middle;\n",
 120 |        "    }\n",
 121 |        "\n",
 122 |        "    .dataframe tbody tr th {\n",
 123 |        "        vertical-align: top;\n",
 124 |        "    }\n",
 125 |        "\n",
 126 |        "    .dataframe thead th {\n",
 127 |        "        text-align: right;\n",
 128 |        "    }\n",
 129 |        "</style>\n",
 130 |        "<table border=\"1\" class=\"dataframe\">\n",
 131 |        "  <thead>\n",
 132 |        "    <tr style=\"text-align: right;\">\n",
 133 |        "      <th></th>\n",
 134 |        "      <th>S1</th>\n",
 135 |        "      <th>C1</th>\n",
 136 |        "      <th>S2</th>\n",
 137 |        "      <th>C2</th>\n",
 138 |        "      <th>S3</th>\n",
 139 |        "      <th>C3</th>\n",
 140 |        "      <th>S4</th>\n",
 141 |        "      <th>C4</th>\n",
 142 |        "      <th>S5</th>\n",
 143 |        "      <th>C5</th>\n",
 144 |        "      <th>hand</th>\n",
 145 |        "    </tr>\n",
 146 |        "  </thead>\n",
 147 |        "  <tbody>\n",
 148 |        "    <tr>\n",
 149 |        "      <th>579</th>\n",
 150 |        "      <td>3</td>\n",
 151 |        "      <td>7</td>\n",
 152 |        "      <td>1</td>\n",
 153 |        "      <td>6</td>\n",
 154 |        "      <td>3</td>\n",
 155 |        "      <td>2</td>\n",
 156 |        "      <td>3</td>\n",
 157 |        "      <td>11</td>\n",
 158 |        "      <td>2</td>\n",
 159 |        "      <td>8</td>\n",
 160 |        "      <td>0</td>\n",
 161 |        "    </tr>\n",
 162 |        "    <tr>\n",
 163 |        "      <th>6186</th>\n",
 164 |        "      <td>3</td>\n",
 165 |        "      <td>12</td>\n",
 166 |        "      <td>4</td>\n",
 167 |        "      <td>9</td>\n",
 168 |        "      <td>1</td>\n",
 169 |        "      <td>13</td>\n",
 170 |        "      <td>1</td>\n",
 171 |        "      <td>7</td>\n",
 172 |        "      <td>2</td>\n",
 173 |        "      <td>1</td>\n",
 174 |        "      <td>0</td>\n",
 175 |        "    </tr>\n",
 176 |        "    <tr>\n",
 177 |        "      <th>6420</th>\n",
 178 |        "      <td>2</td>\n",
 179 |        "      <td>6</td>\n",
 180 |        "      <td>4</td>\n",
 181 |        "      <td>3</td>\n",
 182 |        "      <td>2</td>\n",
 183 |        "      <td>13</td>\n",
 184 |        "      <td>4</td>\n",
 185 |        "      <td>10</td>\n",
 186 |        "      <td>4</td>\n",
 187 |        "      <td>12</td>\n",
 188 |        "      <td>0</td>\n",
 189 |        "    </tr>\n",
 190 |        "    <tr>\n",
 191 |        "      <th>19868</th>\n",
 192 |        "      <td>4</td>\n",
 193 |        "      <td>11</td>\n",
 194 |        "      <td>4</td>\n",
 195 |        "      <td>9</td>\n",
 196 |        "      <td>3</td>\n",
 197 |        "      <td>6</td>\n",
 198 |        "      <td>1</td>\n",
 199 |        "      <td>2</td>\n",
 200 |        "      <td>4</td>\n",
 201 |        "      <td>5</td>\n",
 202 |        "      <td>0</td>\n",
 203 |        "    </tr>\n",
 204 |        "    <tr>\n",
 205 |        "      <th>10820</th>\n",
 206 |        "      <td>2</td>\n",
 207 |        "      <td>10</td>\n",
 208 |        "      <td>1</td>\n",
 209 |        "      <td>11</td>\n",
 210 |        "      <td>4</td>\n",
 211 |        "      <td>9</td>\n",
 212 |        "      <td>2</td>\n",
 213 |        "      <td>3</td>\n",
 214 |        "      <td>3</td>\n",
 215 |        "      <td>6</td>\n",
 216 |        "      <td>0</td>\n",
 217 |        "    </tr>\n",
 218 |        "  </tbody>\n",
 219 |        "</table>\n",
 220 |        "</div>"
 221 |       ],
 222 |       "text/plain": [
 223 |        "       S1  C1  S2  C2  S3  C3  S4  C4  S5  C5  hand\n",
 224 |        "579     3   7   1   6   3   2   3  11   2   8     0\n",
 225 |        "6186    3  12   4   9   1  13   1   7   2   1     0\n",
 226 |        "6420    2   6   4   3   2  13   4  10   4  12     0\n",
 227 |        "19868   4  11   4   9   3   6   1   2   4   5     0\n",
 228 |        "10820   2  10   1  11   4   9   2   3   3   6     0"
 229 |       ]
 230 |      },
 231 |      "execution_count": 8,
 232 |      "metadata": {},
 233 |      "output_type": "execute_result"
 234 |     }
 235 |    ],
 236 |    "source": [
 237 |     "df.sample(5)"
 238 |    ]
 239 |   },
 240 |   {
 241 |    "cell_type": "code",
 242 |    "execution_count": 9,
 243 |    "metadata": {
 244 |     "ExecuteTime": {
 245 |      "end_time": "2020-02-04T07:52:00.942073Z",
 246 |      "start_time": "2020-02-04T07:52:00.927846Z"
 247 |     }
 248 |    },
 249 |    "outputs": [],
 250 |    "source": [
 251 |     "suits = {1:'Hearts', 2:'Spades', 3:'Diamonds', 4:'Clubs'}"
 252 |    ]
 253 |   },
 254 |   {
 255 |    "cell_type": "code",
 256 |    "execution_count": 10,
 257 |    "metadata": {
 258 |     "ExecuteTime": {
 259 |      "end_time": "2020-02-04T07:52:00.957886Z",
 260 |      "start_time": "2020-02-04T07:52:00.943066Z"
 261 |     }
 262 |    },
 263 |    "outputs": [],
 264 |    "source": [
 265 |     "cards = {1:'Ace', 2:'2', 3:'3', 4:'4', 5:'5', 6:'6', 7:'7', 8:'8', 9:'9', 10:'10', 11:'Jack', 12:'Queen', 13:'King'}"
 266 |    ]
 267 |   },
 268 |   {
 269 |    "cell_type": "code",
 270 |    "execution_count": 11,
 271 |    "metadata": {
 272 |     "ExecuteTime": {
 273 |      "end_time": "2020-02-04T07:52:00.973366Z",
 274 |      "start_time": "2020-02-04T07:52:00.958856Z"
 275 |     }
 276 |    },
 277 |    "outputs": [],
 278 |    "source": [
 279 |     "hands =  {0: 'Nothing', 1:  'Pair', 2: 'Two pairs', 3: 'Three of a kind',\n",
 280 |     "          4: 'Straight', 5: 'Flush', 6: 'Full house', 7: 'Four of a kind',\n",
 281 |     "          8: 'Straight flush', 9: 'Royal flush'}"
 282 |    ]
 283 |   },
 284 |   {
 285 |    "cell_type": "code",
 286 |    "execution_count": 12,
 287 |    "metadata": {
 288 |     "ExecuteTime": {
 289 |      "end_time": "2020-02-04T07:52:01.008323Z",
 290 |      "start_time": "2020-02-04T07:52:00.974322Z"
 291 |     }
 292 |    },
 293 |    "outputs": [],
 294 |    "source": [
 295 |     "df = df.replace({'C1':cards, 'C2':cards, 'C3':cards, 'C4':cards, 'C5':cards})"
 296 |    ]
 297 |   },
 298 |   {
 299 |    "cell_type": "code",
 300 |    "execution_count": 13,
 301 |    "metadata": {
 302 |     "ExecuteTime": {
 303 |      "end_time": "2020-02-04T07:52:01.035289Z",
 304 |      "start_time": "2020-02-04T07:52:01.009265Z"
 305 |     }
 306 |    },
 307 |    "outputs": [],
 308 |    "source": [
 309 |     "df = df.replace({'S1':suits, 'S2':suits, 'S3':suits, 'S4':suits, 'S5':suits})"
 310 |    ]
 311 |   },
 312 |   {
 313 |    "cell_type": "code",
 314 |    "execution_count": 14,
 315 |    "metadata": {
 316 |     "ExecuteTime": {
 317 |      "end_time": "2020-02-04T07:52:01.057186Z",
 318 |      "start_time": "2020-02-04T07:52:01.036211Z"
 319 |     }
 320 |    },
 321 |    "outputs": [],
 322 |    "source": [
 323 |     "df = df.replace({'hand':hands})"
 324 |    ]
 325 |   },
 326 |   {
 327 |    "cell_type": "code",
 328 |    "execution_count": 15,
 329 |    "metadata": {
 330 |     "ExecuteTime": {
 331 |      "end_time": "2020-02-04T07:52:01.080732Z",
 332 |      "start_time": "2020-02-04T07:52:01.058131Z"
 333 |     }
 334 |    },
 335 |    "outputs": [
 336 |     {
 337 |      "data": {
 338 |       "text/html": [
 339 |        "<div>\n",
 340 |        "<style scoped>\n",
 341 |        "    .dataframe tbody tr th:only-of-type {\n",
 342 |        "        vertical-align: middle;\n",
 343 |        "    }\n",
 344 |        "\n",
 345 |        "    .dataframe tbody tr th {\n",
 346 |        "        vertical-align: top;\n",
 347 |        "    }\n",
 348 |        "\n",
 349 |        "    .dataframe thead th {\n",
 350 |        "        text-align: right;\n",
 351 |        "    }\n",
 352 |        "</style>\n",
 353 |        "<table border=\"1\" class=\"dataframe\">\n",
 354 |        "  <thead>\n",
 355 |        "    <tr style=\"text-align: right;\">\n",
 356 |        "      <th></th>\n",
 357 |        "      <th>S1</th>\n",
 358 |        "      <th>C1</th>\n",
 359 |        "      <th>S2</th>\n",
 360 |        "      <th>C2</th>\n",
 361 |        "      <th>S3</th>\n",
 362 |        "      <th>C3</th>\n",
 363 |        "      <th>S4</th>\n",
 364 |        "      <th>C4</th>\n",
 365 |        "      <th>S5</th>\n",
 366 |        "      <th>C5</th>\n",
 367 |        "      <th>hand</th>\n",
 368 |        "    </tr>\n",
 369 |        "  </thead>\n",
 370 |        "  <tbody>\n",
 371 |        "    <tr>\n",
 372 |        "      <th>0</th>\n",
 373 |        "      <td>Clubs</td>\n",
 374 |        "      <td>9</td>\n",
 375 |        "      <td>Spades</td>\n",
 376 |        "      <td>Ace</td>\n",
 377 |        "      <td>Spades</td>\n",
 378 |        "      <td>2</td>\n",
 379 |        "      <td>Clubs</td>\n",
 380 |        "      <td>7</td>\n",
 381 |        "      <td>Spades</td>\n",
 382 |        "      <td>8</td>\n",
 383 |        "      <td>Nothing</td>\n",
 384 |        "    </tr>\n",
 385 |        "    <tr>\n",
 386 |        "      <th>1</th>\n",
 387 |        "      <td>Hearts</td>\n",
 388 |        "      <td>4</td>\n",
 389 |        "      <td>Diamonds</td>\n",
 390 |        "      <td>6</td>\n",
 391 |        "      <td>Hearts</td>\n",
 392 |        "      <td>Queen</td>\n",
 393 |        "      <td>Diamonds</td>\n",
 394 |        "      <td>Jack</td>\n",
 395 |        "      <td>Spades</td>\n",
 396 |        "      <td>7</td>\n",
 397 |        "      <td>Nothing</td>\n",
 398 |        "    </tr>\n",
 399 |        "    <tr>\n",
 400 |        "      <th>2</th>\n",
 401 |        "      <td>Hearts</td>\n",
 402 |        "      <td>Jack</td>\n",
 403 |        "      <td>Clubs</td>\n",
 404 |        "      <td>Ace</td>\n",
 405 |        "      <td>Diamonds</td>\n",
 406 |        "      <td>7</td>\n",
 407 |        "      <td>Clubs</td>\n",
 408 |        "      <td>Jack</td>\n",
 409 |        "      <td>Spades</td>\n",
 410 |        "      <td>Ace</td>\n",
 411 |        "      <td>Two pairs</td>\n",
 412 |        "    </tr>\n",
 413 |        "    <tr>\n",
 414 |        "      <th>3</th>\n",
 415 |        "      <td>Spades</td>\n",
 416 |        "      <td>9</td>\n",
 417 |        "      <td>Spades</td>\n",
 418 |        "      <td>4</td>\n",
 419 |        "      <td>Diamonds</td>\n",
 420 |        "      <td>6</td>\n",
 421 |        "      <td>Hearts</td>\n",
 422 |        "      <td>9</td>\n",
 423 |        "      <td>Clubs</td>\n",
 424 |        "      <td>9</td>\n",
 425 |        "      <td>Three of a kind</td>\n",
 426 |        "    </tr>\n",
 427 |        "    <tr>\n",
 428 |        "      <th>4</th>\n",
 429 |        "      <td>Hearts</td>\n",
 430 |        "      <td>8</td>\n",
 431 |        "      <td>Spades</td>\n",
 432 |        "      <td>4</td>\n",
 433 |        "      <td>Spades</td>\n",
 434 |        "      <td>Jack</td>\n",
 435 |        "      <td>Spades</td>\n",
 436 |        "      <td>2</td>\n",
 437 |        "      <td>Spades</td>\n",
 438 |        "      <td>Ace</td>\n",
 439 |        "      <td>Nothing</td>\n",
 440 |        "    </tr>\n",
 441 |        "    <tr>\n",
 442 |        "      <th>...</th>\n",
 443 |        "      <td>...</td>\n",
 444 |        "      <td>...</td>\n",
 445 |        "      <td>...</td>\n",
 446 |        "      <td>...</td>\n",
 447 |        "      <td>...</td>\n",
 448 |        "      <td>...</td>\n",
 449 |        "      <td>...</td>\n",
 450 |        "      <td>...</td>\n",
 451 |        "      <td>...</td>\n",
 452 |        "      <td>...</td>\n",
 453 |        "      <td>...</td>\n",
 454 |        "    </tr>\n",
 455 |        "    <tr>\n",
 456 |        "      <th>25005</th>\n",
 457 |        "      <td>Clubs</td>\n",
 458 |        "      <td>9</td>\n",
 459 |        "      <td>Clubs</td>\n",
 460 |        "      <td>6</td>\n",
 461 |        "      <td>Diamonds</td>\n",
 462 |        "      <td>6</td>\n",
 463 |        "      <td>Clubs</td>\n",
 464 |        "      <td>Queen</td>\n",
 465 |        "      <td>Clubs</td>\n",
 466 |        "      <td>5</td>\n",
 467 |        "      <td>Pair</td>\n",
 468 |        "    </tr>\n",
 469 |        "    <tr>\n",
 470 |        "      <th>25006</th>\n",
 471 |        "      <td>Diamonds</td>\n",
 472 |        "      <td>8</td>\n",
 473 |        "      <td>Diamonds</td>\n",
 474 |        "      <td>5</td>\n",
 475 |        "      <td>Clubs</td>\n",
 476 |        "      <td>Jack</td>\n",
 477 |        "      <td>Spades</td>\n",
 478 |        "      <td>2</td>\n",
 479 |        "      <td>Hearts</td>\n",
 480 |        "      <td>King</td>\n",
 481 |        "      <td>Nothing</td>\n",
 482 |        "    </tr>\n",
 483 |        "    <tr>\n",
 484 |        "      <th>25007</th>\n",
 485 |        "      <td>Hearts</td>\n",
 486 |        "      <td>8</td>\n",
 487 |        "      <td>Clubs</td>\n",
 488 |        "      <td>5</td>\n",
 489 |        "      <td>Diamonds</td>\n",
 490 |        "      <td>Jack</td>\n",
 491 |        "      <td>Diamonds</td>\n",
 492 |        "      <td>2</td>\n",
 493 |        "      <td>Spades</td>\n",
 494 |        "      <td>King</td>\n",
 495 |        "      <td>Nothing</td>\n",
 496 |        "    </tr>\n",
 497 |        "    <tr>\n",
 498 |        "      <th>25008</th>\n",
 499 |        "      <td>Clubs</td>\n",
 500 |        "      <td>Queen</td>\n",
 501 |        "      <td>Diamonds</td>\n",
 502 |        "      <td>5</td>\n",
 503 |        "      <td>Spades</td>\n",
 504 |        "      <td>Ace</td>\n",
 505 |        "      <td>Spades</td>\n",
 506 |        "      <td>7</td>\n",
 507 |        "      <td>Clubs</td>\n",
 508 |        "      <td>6</td>\n",
 509 |        "      <td>Nothing</td>\n",
 510 |        "    </tr>\n",
 511 |        "    <tr>\n",
 512 |        "      <th>25009</th>\n",
 513 |        "      <td>Hearts</td>\n",
 514 |        "      <td>Ace</td>\n",
 515 |        "      <td>Hearts</td>\n",
 516 |        "      <td>3</td>\n",
 517 |        "      <td>Hearts</td>\n",
 518 |        "      <td>7</td>\n",
 519 |        "      <td>Hearts</td>\n",
 520 |        "      <td>2</td>\n",
 521 |        "      <td>Clubs</td>\n",
 522 |        "      <td>2</td>\n",
 523 |        "      <td>Pair</td>\n",
 524 |        "    </tr>\n",
 525 |        "  </tbody>\n",
 526 |        "</table>\n",
 527 |        "<p>25010 rows × 11 columns</p>\n",
 528 |        "</div>"
 529 |       ],
 530 |       "text/plain": [
 531 |        "             S1     C1        S2   C2        S3     C3        S4     C4  \\\n",
 532 |        "0         Clubs      9    Spades  Ace    Spades      2     Clubs      7   \n",
 533 |        "1        Hearts      4  Diamonds    6    Hearts  Queen  Diamonds   Jack   \n",
 534 |        "2        Hearts   Jack     Clubs  Ace  Diamonds      7     Clubs   Jack   \n",
 535 |        "3        Spades      9    Spades    4  Diamonds      6    Hearts      9   \n",
 536 |        "4        Hearts      8    Spades    4    Spades   Jack    Spades      2   \n",
 537 |        "...         ...    ...       ...  ...       ...    ...       ...    ...   \n",
 538 |        "25005     Clubs      9     Clubs    6  Diamonds      6     Clubs  Queen   \n",
 539 |        "25006  Diamonds      8  Diamonds    5     Clubs   Jack    Spades      2   \n",
 540 |        "25007    Hearts      8     Clubs    5  Diamonds   Jack  Diamonds      2   \n",
 541 |        "25008     Clubs  Queen  Diamonds    5    Spades    Ace    Spades      7   \n",
 542 |        "25009    Hearts    Ace    Hearts    3    Hearts      7    Hearts      2   \n",
 543 |        "\n",
 544 |        "           S5    C5             hand  \n",
 545 |        "0      Spades     8          Nothing  \n",
 546 |        "1      Spades     7          Nothing  \n",
 547 |        "2      Spades   Ace        Two pairs  \n",
 548 |        "3       Clubs     9  Three of a kind  \n",
 549 |        "4      Spades   Ace          Nothing  \n",
 550 |        "...       ...   ...              ...  \n",
 551 |        "25005   Clubs     5             Pair  \n",
 552 |        "25006  Hearts  King          Nothing  \n",
 553 |        "25007  Spades  King          Nothing  \n",
 554 |        "25008   Clubs     6          Nothing  \n",
 555 |        "25009   Clubs     2             Pair  \n",
 556 |        "\n",
 557 |        "[25010 rows x 11 columns]"
 558 |       ]
 559 |      },
 560 |      "execution_count": 15,
 561 |      "metadata": {},
 562 |      "output_type": "execute_result"
 563 |     }
 564 |    ],
 565 |    "source": [
 566 |     "df"
 567 |    ]
 568 |   },
 569 |   {
 570 |    "cell_type": "code",
 571 |    "execution_count": 16,
 572 |    "metadata": {
 573 |     "ExecuteTime": {
 574 |      "end_time": "2020-02-04T07:52:01.096132Z",
 575 |      "start_time": "2020-02-04T07:52:01.081656Z"
 576 |     }
 577 |    },
 578 |    "outputs": [],
 579 |    "source": [
 580 |     "cat_vars_tpl = ('S1', 'C1', 'S2', 'C2', 'S3', 'C3', 'S4', 'C4', 'S5', 'C5')"
 581 |    ]
 582 |   },
 583 |   {
 584 |    "cell_type": "code",
 585 |    "execution_count": 17,
 586 |    "metadata": {
 587 |     "ExecuteTime": {
 588 |      "end_time": "2020-02-04T07:52:01.110767Z",
 589 |      "start_time": "2020-02-04T07:52:01.096947Z"
 590 |     }
 591 |    },
 592 |    "outputs": [],
 593 |    "source": [
 594 |     "cont_vars_tpl = ()"
 595 |    ]
 596 |   },
 597 |   {
 598 |    "cell_type": "code",
 599 |    "execution_count": 18,
 600 |    "metadata": {
 601 |     "ExecuteTime": {
 602 |      "end_time": "2020-02-04T07:52:01.125733Z",
 603 |      "start_time": "2020-02-04T07:52:01.111710Z"
 604 |     }
 605 |    },
 606 |    "outputs": [],
 607 |    "source": [
 608 |     "cat_vars = list(cat_vars_tpl)\n",
 609 |     "cont_vars = list(cont_vars_tpl)\n",
 610 |     "all_vars = cat_vars + cont_vars"
 611 |    ]
 612 |   },
 613 |   {
 614 |    "cell_type": "code",
 615 |    "execution_count": 19,
 616 |    "metadata": {
 617 |     "ExecuteTime": {
 618 |      "end_time": "2020-02-04T07:52:01.141399Z",
 619 |      "start_time": "2020-02-04T07:52:01.126635Z"
 620 |     }
 621 |    },
 622 |    "outputs": [
 623 |     {
 624 |      "data": {
 625 |       "text/plain": [
 626 |        "['hand']"
 627 |       ]
 628 |      },
 629 |      "execution_count": 19,
 630 |      "metadata": {},
 631 |      "output_type": "execute_result"
 632 |     }
 633 |    ],
 634 |    "source": [
 635 |     "list_diff(df.columns, cat_vars, cont_vars)"
 636 |    ]
 637 |   },
 638 |   {
 639 |    "cell_type": "code",
 640 |    "execution_count": 20,
 641 |    "metadata": {
 642 |     "ExecuteTime": {
 643 |      "end_time": "2020-02-04T07:52:01.156417Z",
 644 |      "start_time": "2020-02-04T07:52:01.142273Z"
 645 |     }
 646 |    },
 647 |    "outputs": [],
 648 |    "source": [
 649 |     "dep_var = 'hand'"
 650 |    ]
 651 |   },
 652 |   {
 653 |    "cell_type": "code",
 654 |    "execution_count": 21,
 655 |    "metadata": {
 656 |     "ExecuteTime": {
 657 |      "end_time": "2020-02-04T07:52:01.172226Z",
 658 |      "start_time": "2020-02-04T07:52:01.157283Z"
 659 |     }
 660 |    },
 661 |    "outputs": [],
 662 |    "source": [
 663 |     "np.random.seed(1001)\n",
 664 |     "ln = len(df)\n",
 665 |     "valid_idx = np.random.choice(ln, int(ln*0.2), replace=False)"
 666 |    ]
 667 |   },
 668 |   {
 669 |    "cell_type": "code",
 670 |    "execution_count": 22,
 671 |    "metadata": {
 672 |     "ExecuteTime": {
 673 |      "end_time": "2020-02-04T07:52:01.187319Z",
 674 |      "start_time": "2020-02-04T07:52:01.173050Z"
 675 |     }
 676 |    },
 677 |    "outputs": [
 678 |     {
 679 |      "data": {
 680 |       "text/plain": [
 681 |        "5002"
 682 |       ]
 683 |      },
 684 |      "execution_count": 22,
 685 |      "metadata": {},
 686 |      "output_type": "execute_result"
 687 |     }
 688 |    ],
 689 |    "source": [
 690 |     "len(valid_idx)"
 691 |    ]
 692 |   },
 693 |   {
 694 |    "cell_type": "code",
 695 |    "execution_count": 23,
 696 |    "metadata": {
 697 |     "ExecuteTime": {
 698 |      "end_time": "2020-02-04T07:52:01.202673Z",
 699 |      "start_time": "2020-02-04T07:52:01.188745Z"
 700 |     }
 701 |    },
 702 |    "outputs": [],
 703 |    "source": [
 704 |     "procs=[FillMissing, Categorify, Normalize]"
 705 |    ]
 706 |   },
 707 |   {
 708 |    "cell_type": "code",
 709 |    "execution_count": 24,
 710 |    "metadata": {
 711 |     "ExecuteTime": {
 712 |      "end_time": "2020-02-04T07:52:01.217812Z",
 713 |      "start_time": "2020-02-04T07:52:01.203632Z"
 714 |     }
 715 |    },
 716 |    "outputs": [],
 717 |    "source": [
 718 |     "def emb_sz_rule_reduced(n_cat:int)->int: return min(10, round(1.6 * n_cat**0.56))"
 719 |    ]
 720 |   },
 721 |   {
 722 |    "cell_type": "code",
 723 |    "execution_count": 25,
 724 |    "metadata": {
 725 |     "ExecuteTime": {
 726 |      "end_time": "2020-02-04T07:52:01.232510Z",
 727 |      "start_time": "2020-02-04T07:52:01.218743Z"
 728 |     }
 729 |    },
 730 |    "outputs": [],
 731 |    "source": [
 732 |     "#monkey pacth embenning rule as 600 floats is too much for our case\n",
 733 |     "tabular.data.emb_sz_rule = emb_sz_rule_reduced"
 734 |    ]
 735 |   },
 736 |   {
 737 |    "cell_type": "code",
 738 |    "execution_count": 26,
 739 |    "metadata": {
 740 |     "ExecuteTime": {
 741 |      "end_time": "2020-02-04T07:52:04.803907Z",
 742 |      "start_time": "2020-02-04T07:52:04.784128Z"
 743 |     }
 744 |    },
 745 |    "outputs": [],
 746 |    "source": [
 747 |     "BS = 128"
 748 |    ]
 749 |   },
 750 |   {
 751 |    "cell_type": "markdown",
 752 |    "metadata": {},
 753 |    "source": [
 754 |     "### 85%"
 755 |    ]
 756 |   },
 757 |   {
 758 |    "cell_type": "code",
 759 |    "execution_count": 27,
 760 |    "metadata": {
 761 |     "ExecuteTime": {
 762 |      "end_time": "2020-02-04T07:52:06.561774Z",
 763 |      "start_time": "2020-02-04T07:52:06.544310Z"
 764 |     }
 765 |    },
 766 |    "outputs": [],
 767 |    "source": [
 768 |     "layers = [1000, 500, 200]\n",
 769 |     "layers_drop = [0.001, 0.005, 0.01]\n",
 770 |     "emb_drop = 0.01\n",
 771 |     "cycles = 60\n",
 772 |     "w_decay = 0.01\n",
 773 |     "max_lr = 1e-3"
 774 |    ]
 775 |   },
 776 |   {
 777 |    "cell_type": "code",
 778 |    "execution_count": 29,
 779 |    "metadata": {
 780 |     "ExecuteTime": {
 781 |      "end_time": "2020-02-04T07:52:35.978771Z",
 782 |      "start_time": "2020-02-04T07:52:35.865662Z"
 783 |     }
 784 |    },
 785 |    "outputs": [],
 786 |    "source": [
 787 |     "data = (TabularList.from_df(df, path=path, cat_names=cat_vars, cont_names=cont_vars, procs=procs)\n",
 788 |     "        .split_by_idx(valid_idx)\n",
 789 |     "        .label_from_df(cols=dep_var, label_cls=CategoryList)\n",
 790 |     "        .databunch(bs=BS))"
 791 |    ]
 792 |   },
 793 |   {
 794 |    "cell_type": "code",
 795 |    "execution_count": 30,
 796 |    "metadata": {
 797 |     "ExecuteTime": {
 798 |      "end_time": "2020-02-04T07:52:38.774091Z",
 799 |      "start_time": "2020-02-04T07:52:37.769101Z"
 800 |     }
 801 |    },
 802 |    "outputs": [],
 803 |    "source": [
 804 |     "learn = None\n",
 805 |     "np.random.seed(1001)\n",
 806 |     "learn = tabular_learner(data, \n",
 807 |     "                        layers=layers, \n",
 808 |     "                        ps=layers_drop, \n",
 809 |     "                        emb_drop=emb_drop, \n",
 810 |     "                        metrics=accuracy,\n",
 811 |     "                        callback_fns=[CSVLogger])"
 812 |    ]
 813 |   },
 814 |   {
 815 |    "cell_type": "code",
 816 |    "execution_count": 31,
 817 |    "metadata": {
 818 |     "ExecuteTime": {
 819 |      "end_time": "2020-02-04T07:52:40.957424Z",
 820 |      "start_time": "2020-02-04T07:52:40.937148Z"
 821 |     }
 822 |    },
 823 |    "outputs": [],
 824 |    "source": [
 825 |     "max_lr = 3e-3"
 826 |    ]
 827 |   },
 828 |   {
 829 |    "cell_type": "code",
 830 |    "execution_count": 32,
 831 |    "metadata": {
 832 |     "ExecuteTime": {
 833 |      "end_time": "2020-02-04T07:53:47.679547Z",
 834 |      "start_time": "2020-02-04T07:52:41.994384Z"
 835 |     },
 836 |     "scrolled": true
 837 |    },
 838 |    "outputs": [
 839 |     {
 840 |      "data": {
 841 |       "text/html": [
 842 |        "<table border=\"1\" class=\"dataframe\">\n",
 843 |        "  <thead>\n",
 844 |        "    <tr style=\"text-align: left;\">\n",
 845 |        "      <th>epoch</th>\n",
 846 |        "      <th>train_loss</th>\n",
 847 |        "      <th>valid_loss</th>\n",
 848 |        "      <th>accuracy</th>\n",
 849 |        "      <th>time</th>\n",
 850 |        "    </tr>\n",
 851 |        "  </thead>\n",
 852 |        "  <tbody>\n",
 853 |        "    <tr>\n",
 854 |        "      <td>0</td>\n",
 855 |        "      <td>2.205918</td>\n",
 856 |        "      <td>2.112571</td>\n",
 857 |        "      <td>0.401439</td>\n",
 858 |        "      <td>00:01</td>\n",
 859 |        "    </tr>\n",
 860 |        "    <tr>\n",
 861 |        "      <td>1</td>\n",
 862 |        "      <td>1.838952</td>\n",
 863 |        "      <td>1.732437</td>\n",
 864 |        "      <td>0.563575</td>\n",
 865 |        "      <td>00:01</td>\n",
 866 |        "    </tr>\n",
 867 |        "    <tr>\n",
 868 |        "      <td>2</td>\n",
 869 |        "      <td>1.309539</td>\n",
 870 |        "      <td>1.130222</td>\n",
 871 |        "      <td>0.666933</td>\n",
 872 |        "      <td>00:01</td>\n",
 873 |        "    </tr>\n",
 874 |        "    <tr>\n",
 875 |        "      <td>3</td>\n",
 876 |        "      <td>0.813635</td>\n",
 877 |        "      <td>0.750517</td>\n",
 878 |        "      <td>0.730308</td>\n",
 879 |        "      <td>00:01</td>\n",
 880 |        "    </tr>\n",
 881 |        "    <tr>\n",
 882 |        "      <td>4</td>\n",
 883 |        "      <td>0.678973</td>\n",
 884 |        "      <td>0.668179</td>\n",
 885 |        "      <td>0.736505</td>\n",
 886 |        "      <td>00:01</td>\n",
 887 |        "    </tr>\n",
 888 |        "    <tr>\n",
 889 |        "      <td>5</td>\n",
 890 |        "      <td>0.605285</td>\n",
 891 |        "      <td>0.624136</td>\n",
 892 |        "      <td>0.764894</td>\n",
 893 |        "      <td>00:01</td>\n",
 894 |        "    </tr>\n",
 895 |        "    <tr>\n",
 896 |        "      <td>6</td>\n",
 897 |        "      <td>0.583843</td>\n",
 898 |        "      <td>0.585979</td>\n",
 899 |        "      <td>0.784286</td>\n",
 900 |        "      <td>00:01</td>\n",
 901 |        "    </tr>\n",
 902 |        "    <tr>\n",
 903 |        "      <td>7</td>\n",
 904 |        "      <td>0.578587</td>\n",
 905 |        "      <td>0.574682</td>\n",
 906 |        "      <td>0.783886</td>\n",
 907 |        "      <td>00:01</td>\n",
 908 |        "    </tr>\n",
 909 |        "    <tr>\n",
 910 |        "      <td>8</td>\n",
 911 |        "      <td>0.555972</td>\n",
 912 |        "      <td>0.589546</td>\n",
 913 |        "      <td>0.765094</td>\n",
 914 |        "      <td>00:01</td>\n",
 915 |        "    </tr>\n",
 916 |        "    <tr>\n",
 917 |        "      <td>9</td>\n",
 918 |        "      <td>0.555005</td>\n",
 919 |        "      <td>0.550606</td>\n",
 920 |        "      <td>0.795082</td>\n",
 921 |        "      <td>00:01</td>\n",
 922 |        "    </tr>\n",
 923 |        "    <tr>\n",
 924 |        "      <td>10</td>\n",
 925 |        "      <td>0.549625</td>\n",
 926 |        "      <td>0.568322</td>\n",
 927 |        "      <td>0.774090</td>\n",
 928 |        "      <td>00:01</td>\n",
 929 |        "    </tr>\n",
 930 |        "    <tr>\n",
 931 |        "      <td>11</td>\n",
 932 |        "      <td>0.536985</td>\n",
 933 |        "      <td>0.534980</td>\n",
 934 |        "      <td>0.799480</td>\n",
 935 |        "      <td>00:01</td>\n",
 936 |        "    </tr>\n",
 937 |        "    <tr>\n",
 938 |        "      <td>12</td>\n",
 939 |        "      <td>0.515323</td>\n",
 940 |        "      <td>0.556685</td>\n",
 941 |        "      <td>0.778888</td>\n",
 942 |        "      <td>00:01</td>\n",
 943 |        "    </tr>\n",
 944 |        "    <tr>\n",
 945 |        "      <td>13</td>\n",
 946 |        "      <td>0.527872</td>\n",
 947 |        "      <td>0.526369</td>\n",
 948 |        "      <td>0.788285</td>\n",
 949 |        "      <td>00:01</td>\n",
 950 |        "    </tr>\n",
 951 |        "    <tr>\n",
 952 |        "      <td>14</td>\n",
 953 |        "      <td>0.491941</td>\n",
 954 |        "      <td>0.509346</td>\n",
 955 |        "      <td>0.798281</td>\n",
 956 |        "      <td>00:01</td>\n",
 957 |        "    </tr>\n",
 958 |        "    <tr>\n",
 959 |        "      <td>15</td>\n",
 960 |        "      <td>0.491977</td>\n",
 961 |        "      <td>0.509173</td>\n",
 962 |        "      <td>0.804678</td>\n",
 963 |        "      <td>00:01</td>\n",
 964 |        "    </tr>\n",
 965 |        "    <tr>\n",
 966 |        "      <td>16</td>\n",
 967 |        "      <td>0.485478</td>\n",
 968 |        "      <td>0.507428</td>\n",
 969 |        "      <td>0.807677</td>\n",
 970 |        "      <td>00:01</td>\n",
 971 |        "    </tr>\n",
 972 |        "    <tr>\n",
 973 |        "      <td>17</td>\n",
 974 |        "      <td>0.441469</td>\n",
 975 |        "      <td>0.497824</td>\n",
 976 |        "      <td>0.812675</td>\n",
 977 |        "      <td>00:01</td>\n",
 978 |        "    </tr>\n",
 979 |        "    <tr>\n",
 980 |        "      <td>18</td>\n",
 981 |        "      <td>0.445393</td>\n",
 982 |        "      <td>0.498861</td>\n",
 983 |        "      <td>0.807077</td>\n",
 984 |        "      <td>00:01</td>\n",
 985 |        "    </tr>\n",
 986 |        "    <tr>\n",
 987 |        "      <td>19</td>\n",
 988 |        "      <td>0.426425</td>\n",
 989 |        "      <td>0.500376</td>\n",
 990 |        "      <td>0.803079</td>\n",
 991 |        "      <td>00:01</td>\n",
 992 |        "    </tr>\n",
 993 |        "    <tr>\n",
 994 |        "      <td>20</td>\n",
 995 |        "      <td>0.404493</td>\n",
 996 |        "      <td>0.486102</td>\n",
 997 |        "      <td>0.814074</td>\n",
 998 |        "      <td>00:01</td>\n",
 999 |        "    </tr>\n",
1000 |        "    <tr>\n",
1001 |        "      <td>21</td>\n",
1002 |        "      <td>0.372939</td>\n",
1003 |        "      <td>0.505704</td>\n",
1004 |        "      <td>0.814874</td>\n",
1005 |        "      <td>00:01</td>\n",
1006 |        "    </tr>\n",
1007 |        "    <tr>\n",
1008 |        "      <td>22</td>\n",
1009 |        "      <td>0.371952</td>\n",
1010 |        "      <td>0.528841</td>\n",
1011 |        "      <td>0.811675</td>\n",
1012 |        "      <td>00:01</td>\n",
1013 |        "    </tr>\n",
1014 |        "    <tr>\n",
1015 |        "      <td>23</td>\n",
1016 |        "      <td>0.363207</td>\n",
1017 |        "      <td>0.535034</td>\n",
1018 |        "      <td>0.815474</td>\n",
1019 |        "      <td>00:01</td>\n",
1020 |        "    </tr>\n",
1021 |        "    <tr>\n",
1022 |        "      <td>24</td>\n",
1023 |        "      <td>0.329414</td>\n",
1024 |        "      <td>0.518336</td>\n",
1025 |        "      <td>0.816473</td>\n",
1026 |        "      <td>00:01</td>\n",
1027 |        "    </tr>\n",
1028 |        "    <tr>\n",
1029 |        "      <td>25</td>\n",
1030 |        "      <td>0.311502</td>\n",
1031 |        "      <td>0.552192</td>\n",
1032 |        "      <td>0.811275</td>\n",
1033 |        "      <td>00:01</td>\n",
1034 |        "    </tr>\n",
1035 |        "    <tr>\n",
1036 |        "      <td>26</td>\n",
1037 |        "      <td>0.285678</td>\n",
1038 |        "      <td>0.570582</td>\n",
1039 |        "      <td>0.802679</td>\n",
1040 |        "      <td>00:01</td>\n",
1041 |        "    </tr>\n",
1042 |        "    <tr>\n",
1043 |        "      <td>27</td>\n",
1044 |        "      <td>0.264499</td>\n",
1045 |        "      <td>0.604454</td>\n",
1046 |        "      <td>0.814274</td>\n",
1047 |        "      <td>00:01</td>\n",
1048 |        "    </tr>\n",
1049 |        "    <tr>\n",
1050 |        "      <td>28</td>\n",
1051 |        "      <td>0.240877</td>\n",
1052 |        "      <td>0.607614</td>\n",
1053 |        "      <td>0.803479</td>\n",
1054 |        "      <td>00:01</td>\n",
1055 |        "    </tr>\n",
1056 |        "    <tr>\n",
1057 |        "      <td>29</td>\n",
1058 |        "      <td>0.229444</td>\n",
1059 |        "      <td>0.659252</td>\n",
1060 |        "      <td>0.799080</td>\n",
1061 |        "      <td>00:01</td>\n",
1062 |        "    </tr>\n",
1063 |        "    <tr>\n",
1064 |        "      <td>30</td>\n",
1065 |        "      <td>0.190171</td>\n",
1066 |        "      <td>0.684641</td>\n",
1067 |        "      <td>0.805678</td>\n",
1068 |        "      <td>00:01</td>\n",
1069 |        "    </tr>\n",
1070 |        "    <tr>\n",
1071 |        "      <td>31</td>\n",
1072 |        "      <td>0.183758</td>\n",
1073 |        "      <td>0.688326</td>\n",
1074 |        "      <td>0.809676</td>\n",
1075 |        "      <td>00:01</td>\n",
1076 |        "    </tr>\n",
1077 |        "    <tr>\n",
1078 |        "      <td>32</td>\n",
1079 |        "      <td>0.160400</td>\n",
1080 |        "      <td>0.721759</td>\n",
1081 |        "      <td>0.799880</td>\n",
1082 |        "      <td>00:01</td>\n",
1083 |        "    </tr>\n",
1084 |        "    <tr>\n",
1085 |        "      <td>33</td>\n",
1086 |        "      <td>0.139423</td>\n",
1087 |        "      <td>0.760439</td>\n",
1088 |        "      <td>0.802479</td>\n",
1089 |        "      <td>00:01</td>\n",
1090 |        "    </tr>\n",
1091 |        "    <tr>\n",
1092 |        "      <td>34</td>\n",
1093 |        "      <td>0.137123</td>\n",
1094 |        "      <td>0.761462</td>\n",
1095 |        "      <td>0.804078</td>\n",
1096 |        "      <td>00:01</td>\n",
1097 |        "    </tr>\n",
1098 |        "    <tr>\n",
1099 |        "      <td>35</td>\n",
1100 |        "      <td>0.111374</td>\n",
1101 |        "      <td>0.851556</td>\n",
1102 |        "      <td>0.813475</td>\n",
1103 |        "      <td>00:01</td>\n",
1104 |        "    </tr>\n",
1105 |        "    <tr>\n",
1106 |        "      <td>36</td>\n",
1107 |        "      <td>0.103550</td>\n",
1108 |        "      <td>0.841699</td>\n",
1109 |        "      <td>0.806278</td>\n",
1110 |        "      <td>00:01</td>\n",
1111 |        "    </tr>\n",
1112 |        "    <tr>\n",
1113 |        "      <td>37</td>\n",
1114 |        "      <td>0.093193</td>\n",
1115 |        "      <td>0.862319</td>\n",
1116 |        "      <td>0.813475</td>\n",
1117 |        "      <td>00:01</td>\n",
1118 |        "    </tr>\n",
1119 |        "    <tr>\n",
1120 |        "      <td>38</td>\n",
1121 |        "      <td>0.090956</td>\n",
1122 |        "      <td>0.860148</td>\n",
1123 |        "      <td>0.813275</td>\n",
1124 |        "      <td>00:01</td>\n",
1125 |        "    </tr>\n",
1126 |        "    <tr>\n",
1127 |        "      <td>39</td>\n",
1128 |        "      <td>0.074539</td>\n",
1129 |        "      <td>0.893442</td>\n",
1130 |        "      <td>0.805878</td>\n",
1131 |        "      <td>00:01</td>\n",
1132 |        "    </tr>\n",
1133 |        "    <tr>\n",
1134 |        "      <td>40</td>\n",
1135 |        "      <td>0.072776</td>\n",
1136 |        "      <td>0.897482</td>\n",
1137 |        "      <td>0.805478</td>\n",
1138 |        "      <td>00:01</td>\n",
1139 |        "    </tr>\n",
1140 |        "    <tr>\n",
1141 |        "      <td>41</td>\n",
1142 |        "      <td>0.055441</td>\n",
1143 |        "      <td>0.927529</td>\n",
1144 |        "      <td>0.807277</td>\n",
1145 |        "      <td>00:01</td>\n",
1146 |        "    </tr>\n",
1147 |        "    <tr>\n",
1148 |        "      <td>42</td>\n",
1149 |        "      <td>0.054699</td>\n",
1150 |        "      <td>0.952890</td>\n",
1151 |        "      <td>0.806278</td>\n",
1152 |        "      <td>00:01</td>\n",
1153 |        "    </tr>\n",
1154 |        "    <tr>\n",
1155 |        "      <td>43</td>\n",
1156 |        "      <td>0.049760</td>\n",
1157 |        "      <td>0.961054</td>\n",
1158 |        "      <td>0.808277</td>\n",
1159 |        "      <td>00:01</td>\n",
1160 |        "    </tr>\n",
1161 |        "    <tr>\n",
1162 |        "      <td>44</td>\n",
1163 |        "      <td>0.039395</td>\n",
1164 |        "      <td>0.978022</td>\n",
1165 |        "      <td>0.814674</td>\n",
1166 |        "      <td>00:01</td>\n",
1167 |        "    </tr>\n",
1168 |        "    <tr>\n",
1169 |        "      <td>45</td>\n",
1170 |        "      <td>0.037557</td>\n",
1171 |        "      <td>1.029176</td>\n",
1172 |        "      <td>0.804678</td>\n",
1173 |        "      <td>00:01</td>\n",
1174 |        "    </tr>\n",
1175 |        "    <tr>\n",
1176 |        "      <td>46</td>\n",
1177 |        "      <td>0.041109</td>\n",
1178 |        "      <td>1.014667</td>\n",
1179 |        "      <td>0.813075</td>\n",
1180 |        "      <td>00:01</td>\n",
1181 |        "    </tr>\n",
1182 |        "    <tr>\n",
1183 |        "      <td>47</td>\n",
1184 |        "      <td>0.029432</td>\n",
1185 |        "      <td>1.019557</td>\n",
1186 |        "      <td>0.814674</td>\n",
1187 |        "      <td>00:01</td>\n",
1188 |        "    </tr>\n",
1189 |        "    <tr>\n",
1190 |        "      <td>48</td>\n",
1191 |        "      <td>0.033982</td>\n",
1192 |        "      <td>1.015839</td>\n",
1193 |        "      <td>0.811675</td>\n",
1194 |        "      <td>00:01</td>\n",
1195 |        "    </tr>\n",
1196 |        "    <tr>\n",
1197 |        "      <td>49</td>\n",
1198 |        "      <td>0.025987</td>\n",
1199 |        "      <td>1.016407</td>\n",
1200 |        "      <td>0.817273</td>\n",
1201 |        "      <td>00:01</td>\n",
1202 |        "    </tr>\n",
1203 |        "    <tr>\n",
1204 |        "      <td>50</td>\n",
1205 |        "      <td>0.023834</td>\n",
1206 |        "      <td>1.051663</td>\n",
1207 |        "      <td>0.810876</td>\n",
1208 |        "      <td>00:01</td>\n",
1209 |        "    </tr>\n",
1210 |        "    <tr>\n",
1211 |        "      <td>51</td>\n",
1212 |        "      <td>0.023775</td>\n",
1213 |        "      <td>1.071784</td>\n",
1214 |        "      <td>0.813874</td>\n",
1215 |        "      <td>00:01</td>\n",
1216 |        "    </tr>\n",
1217 |        "    <tr>\n",
1218 |        "      <td>52</td>\n",
1219 |        "      <td>0.020347</td>\n",
1220 |        "      <td>1.062983</td>\n",
1221 |        "      <td>0.815674</td>\n",
1222 |        "      <td>00:01</td>\n",
1223 |        "    </tr>\n",
1224 |        "    <tr>\n",
1225 |        "      <td>53</td>\n",
1226 |        "      <td>0.020789</td>\n",
1227 |        "      <td>1.085731</td>\n",
1228 |        "      <td>0.816473</td>\n",
1229 |        "      <td>00:01</td>\n",
1230 |        "    </tr>\n",
1231 |        "    <tr>\n",
1232 |        "      <td>54</td>\n",
1233 |        "      <td>0.015353</td>\n",
1234 |        "      <td>1.044057</td>\n",
1235 |        "      <td>0.814274</td>\n",
1236 |        "      <td>00:01</td>\n",
1237 |        "    </tr>\n",
1238 |        "    <tr>\n",
1239 |        "      <td>55</td>\n",
1240 |        "      <td>0.018753</td>\n",
1241 |        "      <td>1.061173</td>\n",
1242 |        "      <td>0.812275</td>\n",
1243 |        "      <td>00:01</td>\n",
1244 |        "    </tr>\n",
1245 |        "    <tr>\n",
1246 |        "      <td>56</td>\n",
1247 |        "      <td>0.017749</td>\n",
1248 |        "      <td>1.069316</td>\n",
1249 |        "      <td>0.816274</td>\n",
1250 |        "      <td>00:01</td>\n",
1251 |        "    </tr>\n",
1252 |        "    <tr>\n",
1253 |        "      <td>57</td>\n",
1254 |        "      <td>0.019003</td>\n",
1255 |        "      <td>1.047713</td>\n",
1256 |        "      <td>0.817073</td>\n",
1257 |        "      <td>00:01</td>\n",
1258 |        "    </tr>\n",
1259 |        "    <tr>\n",
1260 |        "      <td>58</td>\n",
1261 |        "      <td>0.017709</td>\n",
1262 |        "      <td>1.067066</td>\n",
1263 |        "      <td>0.814874</td>\n",
1264 |        "      <td>00:01</td>\n",
1265 |        "    </tr>\n",
1266 |        "    <tr>\n",
1267 |        "      <td>59</td>\n",
1268 |        "      <td>0.016746</td>\n",
1269 |        "      <td>1.074862</td>\n",
1270 |        "      <td>0.816473</td>\n",
1271 |        "      <td>00:01</td>\n",
1272 |        "    </tr>\n",
1273 |        "  </tbody>\n",
1274 |        "</table>"
1275 |       ],
1276 |       "text/plain": [
1277 |        "<IPython.core.display.HTML object>"
1278 |       ]
1279 |      },
1280 |      "metadata": {},
1281 |      "output_type": "display_data"
1282 |     }
1283 |    ],
1284 |    "source": [
1285 |     "learn.fit_one_cycle(cyc_len=cycles, max_lr=max_lr, wd=w_decay)"
1286 |    ]
1287 |   },
1288 |   {
1289 |    "cell_type": "code",
1290 |    "execution_count": 33,
1291 |    "metadata": {
1292 |     "ExecuteTime": {
1293 |      "end_time": "2020-02-04T07:53:56.552998Z",
1294 |      "start_time": "2020-02-04T07:53:56.522725Z"
1295 |     }
1296 |    },
1297 |    "outputs": [],
1298 |    "source": [
1299 |     "learn = None\n",
1300 |     "np.random.seed(1001)\n",
1301 |     "learn = tabular_learner(data, \n",
1302 |     "                        layers=layers, \n",
1303 |     "                        ps=layers_drop, \n",
1304 |     "                        emb_drop=emb_drop, \n",
1305 |     "                        metrics=accuracy,\n",
1306 |     "                        callback_fns=[CSVLogger])"
1307 |    ]
1308 |   },
1309 |   {
1310 |    "cell_type": "code",
1311 |    "execution_count": 34,
1312 |    "metadata": {
1313 |     "ExecuteTime": {
1314 |      "end_time": "2020-02-04T07:54:02.286166Z",
1315 |      "start_time": "2020-02-04T07:54:02.265641Z"
1316 |     }
1317 |    },
1318 |    "outputs": [],
1319 |    "source": [
1320 |     "max_lr = 1e-3"
1321 |    ]
1322 |   },
1323 |   {
1324 |    "cell_type": "code",
1325 |    "execution_count": 35,
1326 |    "metadata": {
1327 |     "ExecuteTime": {
1328 |      "end_time": "2020-02-04T07:55:13.309107Z",
1329 |      "start_time": "2020-02-04T07:54:07.155296Z"
1330 |     }
1331 |    },
1332 |    "outputs": [
1333 |     {
1334 |      "data": {
1335 |       "text/html": [
1336 |        "<table border=\"1\" class=\"dataframe\">\n",
1337 |        "  <thead>\n",
1338 |        "    <tr style=\"text-align: left;\">\n",
1339 |        "      <th>epoch</th>\n",
1340 |        "      <th>train_loss</th>\n",
1341 |        "      <th>valid_loss</th>\n",
1342 |        "      <th>accuracy</th>\n",
1343 |        "      <th>time</th>\n",
1344 |        "    </tr>\n",
1345 |        "  </thead>\n",
1346 |        "  <tbody>\n",
1347 |        "    <tr>\n",
1348 |        "      <td>0</td>\n",
1349 |        "      <td>2.331994</td>\n",
1350 |        "      <td>2.298419</td>\n",
1351 |        "      <td>0.194322</td>\n",
1352 |        "      <td>00:01</td>\n",
1353 |        "    </tr>\n",
1354 |        "    <tr>\n",
1355 |        "      <td>1</td>\n",
1356 |        "      <td>2.194543</td>\n",
1357 |        "      <td>2.170036</td>\n",
1358 |        "      <td>0.338065</td>\n",
1359 |        "      <td>00:01</td>\n",
1360 |        "    </tr>\n",
1361 |        "    <tr>\n",
1362 |        "      <td>2</td>\n",
1363 |        "      <td>2.021234</td>\n",
1364 |        "      <td>1.974362</td>\n",
1365 |        "      <td>0.478009</td>\n",
1366 |        "      <td>00:01</td>\n",
1367 |        "    </tr>\n",
1368 |        "    <tr>\n",
1369 |        "      <td>3</td>\n",
1370 |        "      <td>1.721586</td>\n",
1371 |        "      <td>1.634895</td>\n",
1372 |        "      <td>0.589564</td>\n",
1373 |        "      <td>00:01</td>\n",
1374 |        "    </tr>\n",
1375 |        "    <tr>\n",
1376 |        "      <td>4</td>\n",
1377 |        "      <td>1.334806</td>\n",
1378 |        "      <td>1.243646</td>\n",
1379 |        "      <td>0.651939</td>\n",
1380 |        "      <td>00:01</td>\n",
1381 |        "    </tr>\n",
1382 |        "    <tr>\n",
1383 |        "      <td>5</td>\n",
1384 |        "      <td>0.949042</td>\n",
1385 |        "      <td>0.932930</td>\n",
1386 |        "      <td>0.693722</td>\n",
1387 |        "      <td>00:01</td>\n",
1388 |        "    </tr>\n",
1389 |        "    <tr>\n",
1390 |        "      <td>6</td>\n",
1391 |        "      <td>0.753170</td>\n",
1392 |        "      <td>0.758099</td>\n",
1393 |        "      <td>0.713315</td>\n",
1394 |        "      <td>00:01</td>\n",
1395 |        "    </tr>\n",
1396 |        "    <tr>\n",
1397 |        "      <td>7</td>\n",
1398 |        "      <td>0.648477</td>\n",
1399 |        "      <td>0.701769</td>\n",
1400 |        "      <td>0.729308</td>\n",
1401 |        "      <td>00:01</td>\n",
1402 |        "    </tr>\n",
1403 |        "    <tr>\n",
1404 |        "      <td>8</td>\n",
1405 |        "      <td>0.584061</td>\n",
1406 |        "      <td>0.622591</td>\n",
1407 |        "      <td>0.758097</td>\n",
1408 |        "      <td>00:01</td>\n",
1409 |        "    </tr>\n",
1410 |        "    <tr>\n",
1411 |        "      <td>9</td>\n",
1412 |        "      <td>0.528725</td>\n",
1413 |        "      <td>0.572585</td>\n",
1414 |        "      <td>0.781887</td>\n",
1415 |        "      <td>00:01</td>\n",
1416 |        "    </tr>\n",
1417 |        "    <tr>\n",
1418 |        "      <td>10</td>\n",
1419 |        "      <td>0.494663</td>\n",
1420 |        "      <td>0.538572</td>\n",
1421 |        "      <td>0.799280</td>\n",
1422 |        "      <td>00:01</td>\n",
1423 |        "    </tr>\n",
1424 |        "    <tr>\n",
1425 |        "      <td>11</td>\n",
1426 |        "      <td>0.461023</td>\n",
1427 |        "      <td>0.514471</td>\n",
1428 |        "      <td>0.813075</td>\n",
1429 |        "      <td>00:01</td>\n",
1430 |        "    </tr>\n",
1431 |        "    <tr>\n",
1432 |        "      <td>12</td>\n",
1433 |        "      <td>0.414033</td>\n",
1434 |        "      <td>0.458877</td>\n",
1435 |        "      <td>0.833067</td>\n",
1436 |        "      <td>00:01</td>\n",
1437 |        "    </tr>\n",
1438 |        "    <tr>\n",
1439 |        "      <td>13</td>\n",
1440 |        "      <td>0.403342</td>\n",
1441 |        "      <td>0.466545</td>\n",
1442 |        "      <td>0.832867</td>\n",
1443 |        "      <td>00:01</td>\n",
1444 |        "    </tr>\n",
1445 |        "    <tr>\n",
1446 |        "      <td>14</td>\n",
1447 |        "      <td>0.371448</td>\n",
1448 |        "      <td>0.460364</td>\n",
1449 |        "      <td>0.834666</td>\n",
1450 |        "      <td>00:01</td>\n",
1451 |        "    </tr>\n",
1452 |        "    <tr>\n",
1453 |        "      <td>15</td>\n",
1454 |        "      <td>0.349066</td>\n",
1455 |        "      <td>0.456447</td>\n",
1456 |        "      <td>0.831667</td>\n",
1457 |        "      <td>00:01</td>\n",
1458 |        "    </tr>\n",
1459 |        "    <tr>\n",
1460 |        "      <td>16</td>\n",
1461 |        "      <td>0.328623</td>\n",
1462 |        "      <td>0.431201</td>\n",
1463 |        "      <td>0.846661</td>\n",
1464 |        "      <td>00:01</td>\n",
1465 |        "    </tr>\n",
1466 |        "    <tr>\n",
1467 |        "      <td>17</td>\n",
1468 |        "      <td>0.298262</td>\n",
1469 |        "      <td>0.440647</td>\n",
1470 |        "      <td>0.842063</td>\n",
1471 |        "      <td>00:01</td>\n",
1472 |        "    </tr>\n",
1473 |        "    <tr>\n",
1474 |        "      <td>18</td>\n",
1475 |        "      <td>0.287341</td>\n",
1476 |        "      <td>0.451292</td>\n",
1477 |        "      <td>0.841863</td>\n",
1478 |        "      <td>00:01</td>\n",
1479 |        "    </tr>\n",
1480 |        "    <tr>\n",
1481 |        "      <td>19</td>\n",
1482 |        "      <td>0.276202</td>\n",
1483 |        "      <td>0.437112</td>\n",
1484 |        "      <td>0.851859</td>\n",
1485 |        "      <td>00:01</td>\n",
1486 |        "    </tr>\n",
1487 |        "    <tr>\n",
1488 |        "      <td>20</td>\n",
1489 |        "      <td>0.238942</td>\n",
1490 |        "      <td>0.440875</td>\n",
1491 |        "      <td>0.852459</td>\n",
1492 |        "      <td>00:01</td>\n",
1493 |        "    </tr>\n",
1494 |        "    <tr>\n",
1495 |        "      <td>21</td>\n",
1496 |        "      <td>0.247444</td>\n",
1497 |        "      <td>0.457117</td>\n",
1498 |        "      <td>0.842263</td>\n",
1499 |        "      <td>00:01</td>\n",
1500 |        "    </tr>\n",
1501 |        "    <tr>\n",
1502 |        "      <td>22</td>\n",
1503 |        "      <td>0.210603</td>\n",
1504 |        "      <td>0.466623</td>\n",
1505 |        "      <td>0.840464</td>\n",
1506 |        "      <td>00:01</td>\n",
1507 |        "    </tr>\n",
1508 |        "    <tr>\n",
1509 |        "      <td>23</td>\n",
1510 |        "      <td>0.199370</td>\n",
1511 |        "      <td>0.467143</td>\n",
1512 |        "      <td>0.846661</td>\n",
1513 |        "      <td>00:01</td>\n",
1514 |        "    </tr>\n",
1515 |        "    <tr>\n",
1516 |        "      <td>24</td>\n",
1517 |        "      <td>0.188943</td>\n",
1518 |        "      <td>0.480817</td>\n",
1519 |        "      <td>0.842663</td>\n",
1520 |        "      <td>00:01</td>\n",
1521 |        "    </tr>\n",
1522 |        "    <tr>\n",
1523 |        "      <td>25</td>\n",
1524 |        "      <td>0.170104</td>\n",
1525 |        "      <td>0.515387</td>\n",
1526 |        "      <td>0.851459</td>\n",
1527 |        "      <td>00:01</td>\n",
1528 |        "    </tr>\n",
1529 |        "    <tr>\n",
1530 |        "      <td>26</td>\n",
1531 |        "      <td>0.164523</td>\n",
1532 |        "      <td>0.501244</td>\n",
1533 |        "      <td>0.849660</td>\n",
1534 |        "      <td>00:01</td>\n",
1535 |        "    </tr>\n",
1536 |        "    <tr>\n",
1537 |        "      <td>27</td>\n",
1538 |        "      <td>0.142704</td>\n",
1539 |        "      <td>0.519314</td>\n",
1540 |        "      <td>0.849660</td>\n",
1541 |        "      <td>00:01</td>\n",
1542 |        "    </tr>\n",
1543 |        "    <tr>\n",
1544 |        "      <td>28</td>\n",
1545 |        "      <td>0.129232</td>\n",
1546 |        "      <td>0.570613</td>\n",
1547 |        "      <td>0.843862</td>\n",
1548 |        "      <td>00:01</td>\n",
1549 |        "    </tr>\n",
1550 |        "    <tr>\n",
1551 |        "      <td>29</td>\n",
1552 |        "      <td>0.117849</td>\n",
1553 |        "      <td>0.530075</td>\n",
1554 |        "      <td>0.849260</td>\n",
1555 |        "      <td>00:01</td>\n",
1556 |        "    </tr>\n",
1557 |        "    <tr>\n",
1558 |        "      <td>30</td>\n",
1559 |        "      <td>0.119687</td>\n",
1560 |        "      <td>0.561751</td>\n",
1561 |        "      <td>0.841064</td>\n",
1562 |        "      <td>00:01</td>\n",
1563 |        "    </tr>\n",
1564 |        "    <tr>\n",
1565 |        "      <td>31</td>\n",
1566 |        "      <td>0.101157</td>\n",
1567 |        "      <td>0.572376</td>\n",
1568 |        "      <td>0.849460</td>\n",
1569 |        "      <td>00:01</td>\n",
1570 |        "    </tr>\n",
1571 |        "    <tr>\n",
1572 |        "      <td>32</td>\n",
1573 |        "      <td>0.099457</td>\n",
1574 |        "      <td>0.589522</td>\n",
1575 |        "      <td>0.848461</td>\n",
1576 |        "      <td>00:01</td>\n",
1577 |        "    </tr>\n",
1578 |        "    <tr>\n",
1579 |        "      <td>33</td>\n",
1580 |        "      <td>0.089280</td>\n",
1581 |        "      <td>0.600624</td>\n",
1582 |        "      <td>0.843263</td>\n",
1583 |        "      <td>00:01</td>\n",
1584 |        "    </tr>\n",
1585 |        "    <tr>\n",
1586 |        "      <td>34</td>\n",
1587 |        "      <td>0.081708</td>\n",
1588 |        "      <td>0.605003</td>\n",
1589 |        "      <td>0.843263</td>\n",
1590 |        "      <td>00:01</td>\n",
1591 |        "    </tr>\n",
1592 |        "    <tr>\n",
1593 |        "      <td>35</td>\n",
1594 |        "      <td>0.078050</td>\n",
1595 |        "      <td>0.604864</td>\n",
1596 |        "      <td>0.843463</td>\n",
1597 |        "      <td>00:01</td>\n",
1598 |        "    </tr>\n",
1599 |        "    <tr>\n",
1600 |        "      <td>36</td>\n",
1601 |        "      <td>0.066039</td>\n",
1602 |        "      <td>0.605219</td>\n",
1603 |        "      <td>0.842863</td>\n",
1604 |        "      <td>00:01</td>\n",
1605 |        "    </tr>\n",
1606 |        "    <tr>\n",
1607 |        "      <td>37</td>\n",
1608 |        "      <td>0.064291</td>\n",
1609 |        "      <td>0.633393</td>\n",
1610 |        "      <td>0.846062</td>\n",
1611 |        "      <td>00:01</td>\n",
1612 |        "    </tr>\n",
1613 |        "    <tr>\n",
1614 |        "      <td>38</td>\n",
1615 |        "      <td>0.056519</td>\n",
1616 |        "      <td>0.631011</td>\n",
1617 |        "      <td>0.848461</td>\n",
1618 |        "      <td>00:01</td>\n",
1619 |        "    </tr>\n",
1620 |        "    <tr>\n",
1621 |        "      <td>39</td>\n",
1622 |        "      <td>0.051951</td>\n",
1623 |        "      <td>0.650549</td>\n",
1624 |        "      <td>0.849260</td>\n",
1625 |        "      <td>00:01</td>\n",
1626 |        "    </tr>\n",
1627 |        "    <tr>\n",
1628 |        "      <td>40</td>\n",
1629 |        "      <td>0.044399</td>\n",
1630 |        "      <td>0.685167</td>\n",
1631 |        "      <td>0.844262</td>\n",
1632 |        "      <td>00:01</td>\n",
1633 |        "    </tr>\n",
1634 |        "    <tr>\n",
1635 |        "      <td>41</td>\n",
1636 |        "      <td>0.044420</td>\n",
1637 |        "      <td>0.668895</td>\n",
1638 |        "      <td>0.846861</td>\n",
1639 |        "      <td>00:01</td>\n",
1640 |        "    </tr>\n",
1641 |        "    <tr>\n",
1642 |        "      <td>42</td>\n",
1643 |        "      <td>0.041040</td>\n",
1644 |        "      <td>0.670817</td>\n",
1645 |        "      <td>0.846861</td>\n",
1646 |        "      <td>00:01</td>\n",
1647 |        "    </tr>\n",
1648 |        "    <tr>\n",
1649 |        "      <td>43</td>\n",
1650 |        "      <td>0.039731</td>\n",
1651 |        "      <td>0.671813</td>\n",
1652 |        "      <td>0.851859</td>\n",
1653 |        "      <td>00:01</td>\n",
1654 |        "    </tr>\n",
1655 |        "    <tr>\n",
1656 |        "      <td>44</td>\n",
1657 |        "      <td>0.031731</td>\n",
1658 |        "      <td>0.687265</td>\n",
1659 |        "      <td>0.846461</td>\n",
1660 |        "      <td>00:01</td>\n",
1661 |        "    </tr>\n",
1662 |        "    <tr>\n",
1663 |        "      <td>45</td>\n",
1664 |        "      <td>0.032173</td>\n",
1665 |        "      <td>0.665432</td>\n",
1666 |        "      <td>0.850260</td>\n",
1667 |        "      <td>00:01</td>\n",
1668 |        "    </tr>\n",
1669 |        "    <tr>\n",
1670 |        "      <td>46</td>\n",
1671 |        "      <td>0.023729</td>\n",
1672 |        "      <td>0.681700</td>\n",
1673 |        "      <td>0.852459</td>\n",
1674 |        "      <td>00:01</td>\n",
1675 |        "    </tr>\n",
1676 |        "    <tr>\n",
1677 |        "      <td>47</td>\n",
1678 |        "      <td>0.027560</td>\n",
1679 |        "      <td>0.674341</td>\n",
1680 |        "      <td>0.853858</td>\n",
1681 |        "      <td>00:01</td>\n",
1682 |        "    </tr>\n",
1683 |        "    <tr>\n",
1684 |        "      <td>48</td>\n",
1685 |        "      <td>0.023127</td>\n",
1686 |        "      <td>0.678907</td>\n",
1687 |        "      <td>0.856058</td>\n",
1688 |        "      <td>00:01</td>\n",
1689 |        "    </tr>\n",
1690 |        "    <tr>\n",
1691 |        "      <td>49</td>\n",
1692 |        "      <td>0.026471</td>\n",
1693 |        "      <td>0.683994</td>\n",
1694 |        "      <td>0.854658</td>\n",
1695 |        "      <td>00:01</td>\n",
1696 |        "    </tr>\n",
1697 |        "    <tr>\n",
1698 |        "      <td>50</td>\n",
1699 |        "      <td>0.022080</td>\n",
1700 |        "      <td>0.696483</td>\n",
1701 |        "      <td>0.855458</td>\n",
1702 |        "      <td>00:01</td>\n",
1703 |        "    </tr>\n",
1704 |        "    <tr>\n",
1705 |        "      <td>51</td>\n",
1706 |        "      <td>0.018941</td>\n",
1707 |        "      <td>0.677758</td>\n",
1708 |        "      <td>0.857057</td>\n",
1709 |        "      <td>00:01</td>\n",
1710 |        "    </tr>\n",
1711 |        "    <tr>\n",
1712 |        "      <td>52</td>\n",
1713 |        "      <td>0.023797</td>\n",
1714 |        "      <td>0.695770</td>\n",
1715 |        "      <td>0.855258</td>\n",
1716 |        "      <td>00:01</td>\n",
1717 |        "    </tr>\n",
1718 |        "    <tr>\n",
1719 |        "      <td>53</td>\n",
1720 |        "      <td>0.020567</td>\n",
1721 |        "      <td>0.681417</td>\n",
1722 |        "      <td>0.855058</td>\n",
1723 |        "      <td>00:01</td>\n",
1724 |        "    </tr>\n",
1725 |        "    <tr>\n",
1726 |        "      <td>54</td>\n",
1727 |        "      <td>0.017171</td>\n",
1728 |        "      <td>0.692562</td>\n",
1729 |        "      <td>0.855858</td>\n",
1730 |        "      <td>00:01</td>\n",
1731 |        "    </tr>\n",
1732 |        "    <tr>\n",
1733 |        "      <td>55</td>\n",
1734 |        "      <td>0.019457</td>\n",
1735 |        "      <td>0.694607</td>\n",
1736 |        "      <td>0.856058</td>\n",
1737 |        "      <td>00:01</td>\n",
1738 |        "    </tr>\n",
1739 |        "    <tr>\n",
1740 |        "      <td>56</td>\n",
1741 |        "      <td>0.015836</td>\n",
1742 |        "      <td>0.707812</td>\n",
1743 |        "      <td>0.857057</td>\n",
1744 |        "      <td>00:01</td>\n",
1745 |        "    </tr>\n",
1746 |        "    <tr>\n",
1747 |        "      <td>57</td>\n",
1748 |        "      <td>0.017651</td>\n",
1749 |        "      <td>0.704757</td>\n",
1750 |        "      <td>0.857657</td>\n",
1751 |        "      <td>00:01</td>\n",
1752 |        "    </tr>\n",
1753 |        "    <tr>\n",
1754 |        "      <td>58</td>\n",
1755 |        "      <td>0.018022</td>\n",
1756 |        "      <td>0.690686</td>\n",
1757 |        "      <td>0.856857</td>\n",
1758 |        "      <td>00:01</td>\n",
1759 |        "    </tr>\n",
1760 |        "    <tr>\n",
1761 |        "      <td>59</td>\n",
1762 |        "      <td>0.018367</td>\n",
1763 |        "      <td>0.692275</td>\n",
1764 |        "      <td>0.857257</td>\n",
1765 |        "      <td>00:01</td>\n",
1766 |        "    </tr>\n",
1767 |        "  </tbody>\n",
1768 |        "</table>"
1769 |       ],
1770 |       "text/plain": [
1771 |        "<IPython.core.display.HTML object>"
1772 |       ]
1773 |      },
1774 |      "metadata": {},
1775 |      "output_type": "display_data"
1776 |     }
1777 |    ],
1778 |    "source": [
1779 |     "learn.fit_one_cycle(cyc_len=cycles, max_lr=max_lr, wd=w_decay)"
1780 |    ]
1781 |   },
1782 |   {
1783 |    "cell_type": "code",
1784 |    "execution_count": 36,
1785 |    "metadata": {
1786 |     "ExecuteTime": {
1787 |      "end_time": "2020-02-04T07:55:39.855236Z",
1788 |      "start_time": "2020-02-04T07:55:39.814219Z"
1789 |     }
1790 |    },
1791 |    "outputs": [],
1792 |    "source": [
1793 |     "learn.save('no_reg_save_0857')"
1794 |    ]
1795 |   },
1796 |   {
1797 |    "cell_type": "code",
1798 |    "execution_count": 37,
1799 |    "metadata": {
1800 |     "ExecuteTime": {
1801 |      "end_time": "2020-02-04T07:55:43.203481Z",
1802 |      "start_time": "2020-02-04T07:55:43.162057Z"
1803 |     }
1804 |    },
1805 |    "outputs": [],
1806 |    "source": [
1807 |     "learn.export('no_reg_0857')"
1808 |    ]
1809 |   },
1810 |   {
1811 |    "cell_type": "markdown",
1812 |    "metadata": {},
1813 |    "source": [
1814 |     "### 91%"
1815 |    ]
1816 |   },
1817 |   {
1818 |    "cell_type": "code",
1819 |    "execution_count": 38,
1820 |    "metadata": {
1821 |     "ExecuteTime": {
1822 |      "end_time": "2020-02-04T07:56:24.556232Z",
1823 |      "start_time": "2020-02-04T07:56:24.538453Z"
1824 |     }
1825 |    },
1826 |    "outputs": [],
1827 |    "source": [
1828 |     "layers = [1000, 500, 200]\n",
1829 |     "layers_drop = [0, 0, 0]\n",
1830 |     "emb_drop = 0\n",
1831 |     "cycles = 60\n",
1832 |     "w_decay = 0\n",
1833 |     "max_lr = 1e-3"
1834 |    ]
1835 |   },
1836 |   {
1837 |    "cell_type": "code",
1838 |    "execution_count": 39,
1839 |    "metadata": {
1840 |     "ExecuteTime": {
1841 |      "end_time": "2020-02-04T07:56:27.686208Z",
1842 |      "start_time": "2020-02-04T07:56:27.602630Z"
1843 |     }
1844 |    },
1845 |    "outputs": [],
1846 |    "source": [
1847 |     "data = (TabularList.from_df(df, path=path, cat_names=cat_vars, cont_names=cont_vars, procs=procs)\n",
1848 |     "        .split_by_idx(valid_idx)\n",
1849 |     "        .label_from_df(cols=dep_var, label_cls=CategoryList)\n",
1850 |     "        .databunch(bs=BS))"
1851 |    ]
1852 |   },
1853 |   {
1854 |    "cell_type": "code",
1855 |    "execution_count": 40,
1856 |    "metadata": {
1857 |     "ExecuteTime": {
1858 |      "end_time": "2020-02-04T07:56:29.035207Z",
1859 |      "start_time": "2020-02-04T07:56:28.995806Z"
1860 |     }
1861 |    },
1862 |    "outputs": [],
1863 |    "source": [
1864 |     "np.random.seed(1001)\n",
1865 |     "learn = tabular_learner(data, \n",
1866 |     "                        layers=layers, \n",
1867 |     "                        ps=layers_drop, \n",
1868 |     "                        emb_drop=emb_drop, \n",
1869 |     "                        metrics=accuracy,\n",
1870 |     "                        callback_fns=[CSVLogger])"
1871 |    ]
1872 |   },
1873 |   {
1874 |    "cell_type": "code",
1875 |    "execution_count": 41,
1876 |    "metadata": {
1877 |     "ExecuteTime": {
1878 |      "end_time": "2020-02-04T07:57:38.378645Z",
1879 |      "start_time": "2020-02-04T07:56:31.075407Z"
1880 |     }
1881 |    },
1882 |    "outputs": [
1883 |     {
1884 |      "data": {
1885 |       "text/html": [
1886 |        "<table border=\"1\" class=\"dataframe\">\n",
1887 |        "  <thead>\n",
1888 |        "    <tr style=\"text-align: left;\">\n",
1889 |        "      <th>epoch</th>\n",
1890 |        "      <th>train_loss</th>\n",
1891 |        "      <th>valid_loss</th>\n",
1892 |        "      <th>accuracy</th>\n",
1893 |        "      <th>time</th>\n",
1894 |        "    </tr>\n",
1895 |        "  </thead>\n",
1896 |        "  <tbody>\n",
1897 |        "    <tr>\n",
1898 |        "      <td>0</td>\n",
1899 |        "      <td>2.313908</td>\n",
1900 |        "      <td>2.273549</td>\n",
1901 |        "      <td>0.196921</td>\n",
1902 |        "      <td>00:01</td>\n",
1903 |        "    </tr>\n",
1904 |        "    <tr>\n",
1905 |        "      <td>1</td>\n",
1906 |        "      <td>2.172157</td>\n",
1907 |        "      <td>2.179061</td>\n",
1908 |        "      <td>0.348061</td>\n",
1909 |        "      <td>00:01</td>\n",
1910 |        "    </tr>\n",
1911 |        "    <tr>\n",
1912 |        "      <td>2</td>\n",
1913 |        "      <td>1.973504</td>\n",
1914 |        "      <td>2.007226</td>\n",
1915 |        "      <td>0.481807</td>\n",
1916 |        "      <td>00:01</td>\n",
1917 |        "    </tr>\n",
1918 |        "    <tr>\n",
1919 |        "      <td>3</td>\n",
1920 |        "      <td>1.689038</td>\n",
1921 |        "      <td>1.660626</td>\n",
1922 |        "      <td>0.580768</td>\n",
1923 |        "      <td>00:01</td>\n",
1924 |        "    </tr>\n",
1925 |        "    <tr>\n",
1926 |        "      <td>4</td>\n",
1927 |        "      <td>1.307421</td>\n",
1928 |        "      <td>1.237087</td>\n",
1929 |        "      <td>0.642143</td>\n",
1930 |        "      <td>00:01</td>\n",
1931 |        "    </tr>\n",
1932 |        "    <tr>\n",
1933 |        "      <td>5</td>\n",
1934 |        "      <td>0.935313</td>\n",
1935 |        "      <td>0.906835</td>\n",
1936 |        "      <td>0.689324</td>\n",
1937 |        "      <td>00:01</td>\n",
1938 |        "    </tr>\n",
1939 |        "    <tr>\n",
1940 |        "      <td>6</td>\n",
1941 |        "      <td>0.720014</td>\n",
1942 |        "      <td>0.736957</td>\n",
1943 |        "      <td>0.729108</td>\n",
1944 |        "      <td>00:01</td>\n",
1945 |        "    </tr>\n",
1946 |        "    <tr>\n",
1947 |        "      <td>7</td>\n",
1948 |        "      <td>0.615489</td>\n",
1949 |        "      <td>0.668774</td>\n",
1950 |        "      <td>0.732907</td>\n",
1951 |        "      <td>00:01</td>\n",
1952 |        "    </tr>\n",
1953 |        "    <tr>\n",
1954 |        "      <td>8</td>\n",
1955 |        "      <td>0.557820</td>\n",
1956 |        "      <td>0.615824</td>\n",
1957 |        "      <td>0.761295</td>\n",
1958 |        "      <td>00:01</td>\n",
1959 |        "    </tr>\n",
1960 |        "    <tr>\n",
1961 |        "      <td>9</td>\n",
1962 |        "      <td>0.527487</td>\n",
1963 |        "      <td>0.616045</td>\n",
1964 |        "      <td>0.759296</td>\n",
1965 |        "      <td>00:01</td>\n",
1966 |        "    </tr>\n",
1967 |        "    <tr>\n",
1968 |        "      <td>10</td>\n",
1969 |        "      <td>0.490004</td>\n",
1970 |        "      <td>0.592557</td>\n",
1971 |        "      <td>0.780888</td>\n",
1972 |        "      <td>00:01</td>\n",
1973 |        "    </tr>\n",
1974 |        "    <tr>\n",
1975 |        "      <td>11</td>\n",
1976 |        "      <td>0.466418</td>\n",
1977 |        "      <td>0.594011</td>\n",
1978 |        "      <td>0.787085</td>\n",
1979 |        "      <td>00:01</td>\n",
1980 |        "    </tr>\n",
1981 |        "    <tr>\n",
1982 |        "      <td>12</td>\n",
1983 |        "      <td>0.406437</td>\n",
1984 |        "      <td>0.551691</td>\n",
1985 |        "      <td>0.795682</td>\n",
1986 |        "      <td>00:01</td>\n",
1987 |        "    </tr>\n",
1988 |        "    <tr>\n",
1989 |        "      <td>13</td>\n",
1990 |        "      <td>0.377757</td>\n",
1991 |        "      <td>0.507683</td>\n",
1992 |        "      <td>0.817873</td>\n",
1993 |        "      <td>00:01</td>\n",
1994 |        "    </tr>\n",
1995 |        "    <tr>\n",
1996 |        "      <td>14</td>\n",
1997 |        "      <td>0.344630</td>\n",
1998 |        "      <td>0.494862</td>\n",
1999 |        "      <td>0.829268</td>\n",
2000 |        "      <td>00:01</td>\n",
2001 |        "    </tr>\n",
2002 |        "    <tr>\n",
2003 |        "      <td>15</td>\n",
2004 |        "      <td>0.306855</td>\n",
2005 |        "      <td>0.473736</td>\n",
2006 |        "      <td>0.833267</td>\n",
2007 |        "      <td>00:01</td>\n",
2008 |        "    </tr>\n",
2009 |        "    <tr>\n",
2010 |        "      <td>16</td>\n",
2011 |        "      <td>0.267285</td>\n",
2012 |        "      <td>0.457451</td>\n",
2013 |        "      <td>0.842263</td>\n",
2014 |        "      <td>00:01</td>\n",
2015 |        "    </tr>\n",
2016 |        "    <tr>\n",
2017 |        "      <td>17</td>\n",
2018 |        "      <td>0.239622</td>\n",
2019 |        "      <td>0.433977</td>\n",
2020 |        "      <td>0.848061</td>\n",
2021 |        "      <td>00:01</td>\n",
2022 |        "    </tr>\n",
2023 |        "    <tr>\n",
2024 |        "      <td>18</td>\n",
2025 |        "      <td>0.212051</td>\n",
2026 |        "      <td>0.441524</td>\n",
2027 |        "      <td>0.856857</td>\n",
2028 |        "      <td>00:01</td>\n",
2029 |        "    </tr>\n",
2030 |        "    <tr>\n",
2031 |        "      <td>19</td>\n",
2032 |        "      <td>0.175836</td>\n",
2033 |        "      <td>0.427019</td>\n",
2034 |        "      <td>0.860056</td>\n",
2035 |        "      <td>00:01</td>\n",
2036 |        "    </tr>\n",
2037 |        "    <tr>\n",
2038 |        "      <td>20</td>\n",
2039 |        "      <td>0.179292</td>\n",
2040 |        "      <td>0.413149</td>\n",
2041 |        "      <td>0.868053</td>\n",
2042 |        "      <td>00:01</td>\n",
2043 |        "    </tr>\n",
2044 |        "    <tr>\n",
2045 |        "      <td>21</td>\n",
2046 |        "      <td>0.145776</td>\n",
2047 |        "      <td>0.435202</td>\n",
2048 |        "      <td>0.871851</td>\n",
2049 |        "      <td>00:01</td>\n",
2050 |        "    </tr>\n",
2051 |        "    <tr>\n",
2052 |        "      <td>22</td>\n",
2053 |        "      <td>0.135723</td>\n",
2054 |        "      <td>0.426725</td>\n",
2055 |        "      <td>0.872451</td>\n",
2056 |        "      <td>00:01</td>\n",
2057 |        "    </tr>\n",
2058 |        "    <tr>\n",
2059 |        "      <td>23</td>\n",
2060 |        "      <td>0.110933</td>\n",
2061 |        "      <td>0.399659</td>\n",
2062 |        "      <td>0.879648</td>\n",
2063 |        "      <td>00:01</td>\n",
2064 |        "    </tr>\n",
2065 |        "    <tr>\n",
2066 |        "      <td>24</td>\n",
2067 |        "      <td>0.112447</td>\n",
2068 |        "      <td>0.405441</td>\n",
2069 |        "      <td>0.885646</td>\n",
2070 |        "      <td>00:01</td>\n",
2071 |        "    </tr>\n",
2072 |        "    <tr>\n",
2073 |        "      <td>25</td>\n",
2074 |        "      <td>0.109505</td>\n",
2075 |        "      <td>0.445875</td>\n",
2076 |        "      <td>0.876249</td>\n",
2077 |        "      <td>00:01</td>\n",
2078 |        "    </tr>\n",
2079 |        "    <tr>\n",
2080 |        "      <td>26</td>\n",
2081 |        "      <td>0.085330</td>\n",
2082 |        "      <td>0.414886</td>\n",
2083 |        "      <td>0.892443</td>\n",
2084 |        "      <td>00:01</td>\n",
2085 |        "    </tr>\n",
2086 |        "    <tr>\n",
2087 |        "      <td>27</td>\n",
2088 |        "      <td>0.093703</td>\n",
2089 |        "      <td>0.424397</td>\n",
2090 |        "      <td>0.883846</td>\n",
2091 |        "      <td>00:01</td>\n",
2092 |        "    </tr>\n",
2093 |        "    <tr>\n",
2094 |        "      <td>28</td>\n",
2095 |        "      <td>0.069007</td>\n",
2096 |        "      <td>0.417213</td>\n",
2097 |        "      <td>0.892043</td>\n",
2098 |        "      <td>00:01</td>\n",
2099 |        "    </tr>\n",
2100 |        "    <tr>\n",
2101 |        "      <td>29</td>\n",
2102 |        "      <td>0.071660</td>\n",
2103 |        "      <td>0.431338</td>\n",
2104 |        "      <td>0.886046</td>\n",
2105 |        "      <td>00:01</td>\n",
2106 |        "    </tr>\n",
2107 |        "    <tr>\n",
2108 |        "      <td>30</td>\n",
2109 |        "      <td>0.057473</td>\n",
2110 |        "      <td>0.432187</td>\n",
2111 |        "      <td>0.889244</td>\n",
2112 |        "      <td>00:01</td>\n",
2113 |        "    </tr>\n",
2114 |        "    <tr>\n",
2115 |        "      <td>31</td>\n",
2116 |        "      <td>0.059103</td>\n",
2117 |        "      <td>0.449140</td>\n",
2118 |        "      <td>0.886845</td>\n",
2119 |        "      <td>00:01</td>\n",
2120 |        "    </tr>\n",
2121 |        "    <tr>\n",
2122 |        "      <td>32</td>\n",
2123 |        "      <td>0.052104</td>\n",
2124 |        "      <td>0.447411</td>\n",
2125 |        "      <td>0.893243</td>\n",
2126 |        "      <td>00:01</td>\n",
2127 |        "    </tr>\n",
2128 |        "    <tr>\n",
2129 |        "      <td>33</td>\n",
2130 |        "      <td>0.038668</td>\n",
2131 |        "      <td>0.439108</td>\n",
2132 |        "      <td>0.895042</td>\n",
2133 |        "      <td>00:01</td>\n",
2134 |        "    </tr>\n",
2135 |        "    <tr>\n",
2136 |        "      <td>34</td>\n",
2137 |        "      <td>0.041638</td>\n",
2138 |        "      <td>0.458463</td>\n",
2139 |        "      <td>0.889644</td>\n",
2140 |        "      <td>00:01</td>\n",
2141 |        "    </tr>\n",
2142 |        "    <tr>\n",
2143 |        "      <td>35</td>\n",
2144 |        "      <td>0.035198</td>\n",
2145 |        "      <td>0.427333</td>\n",
2146 |        "      <td>0.898840</td>\n",
2147 |        "      <td>00:01</td>\n",
2148 |        "    </tr>\n",
2149 |        "    <tr>\n",
2150 |        "      <td>36</td>\n",
2151 |        "      <td>0.031995</td>\n",
2152 |        "      <td>0.455337</td>\n",
2153 |        "      <td>0.894642</td>\n",
2154 |        "      <td>00:01</td>\n",
2155 |        "    </tr>\n",
2156 |        "    <tr>\n",
2157 |        "      <td>37</td>\n",
2158 |        "      <td>0.027499</td>\n",
2159 |        "      <td>0.435317</td>\n",
2160 |        "      <td>0.901439</td>\n",
2161 |        "      <td>00:01</td>\n",
2162 |        "    </tr>\n",
2163 |        "    <tr>\n",
2164 |        "      <td>38</td>\n",
2165 |        "      <td>0.022093</td>\n",
2166 |        "      <td>0.429125</td>\n",
2167 |        "      <td>0.902639</td>\n",
2168 |        "      <td>00:01</td>\n",
2169 |        "    </tr>\n",
2170 |        "    <tr>\n",
2171 |        "      <td>39</td>\n",
2172 |        "      <td>0.019265</td>\n",
2173 |        "      <td>0.448910</td>\n",
2174 |        "      <td>0.903239</td>\n",
2175 |        "      <td>00:01</td>\n",
2176 |        "    </tr>\n",
2177 |        "    <tr>\n",
2178 |        "      <td>40</td>\n",
2179 |        "      <td>0.017139</td>\n",
2180 |        "      <td>0.443420</td>\n",
2181 |        "      <td>0.898840</td>\n",
2182 |        "      <td>00:01</td>\n",
2183 |        "    </tr>\n",
2184 |        "    <tr>\n",
2185 |        "      <td>41</td>\n",
2186 |        "      <td>0.016307</td>\n",
2187 |        "      <td>0.450993</td>\n",
2188 |        "      <td>0.900240</td>\n",
2189 |        "      <td>00:01</td>\n",
2190 |        "    </tr>\n",
2191 |        "    <tr>\n",
2192 |        "      <td>42</td>\n",
2193 |        "      <td>0.011115</td>\n",
2194 |        "      <td>0.446412</td>\n",
2195 |        "      <td>0.901639</td>\n",
2196 |        "      <td>00:01</td>\n",
2197 |        "    </tr>\n",
2198 |        "    <tr>\n",
2199 |        "      <td>43</td>\n",
2200 |        "      <td>0.008331</td>\n",
2201 |        "      <td>0.467298</td>\n",
2202 |        "      <td>0.904638</td>\n",
2203 |        "      <td>00:01</td>\n",
2204 |        "    </tr>\n",
2205 |        "    <tr>\n",
2206 |        "      <td>44</td>\n",
2207 |        "      <td>0.010157</td>\n",
2208 |        "      <td>0.471097</td>\n",
2209 |        "      <td>0.899240</td>\n",
2210 |        "      <td>00:01</td>\n",
2211 |        "    </tr>\n",
2212 |        "    <tr>\n",
2213 |        "      <td>45</td>\n",
2214 |        "      <td>0.013544</td>\n",
2215 |        "      <td>0.491757</td>\n",
2216 |        "      <td>0.903039</td>\n",
2217 |        "      <td>00:01</td>\n",
2218 |        "    </tr>\n",
2219 |        "    <tr>\n",
2220 |        "      <td>46</td>\n",
2221 |        "      <td>0.007486</td>\n",
2222 |        "      <td>0.485141</td>\n",
2223 |        "      <td>0.901639</td>\n",
2224 |        "      <td>00:01</td>\n",
2225 |        "    </tr>\n",
2226 |        "    <tr>\n",
2227 |        "      <td>47</td>\n",
2228 |        "      <td>0.007791</td>\n",
2229 |        "      <td>0.498424</td>\n",
2230 |        "      <td>0.902439</td>\n",
2231 |        "      <td>00:01</td>\n",
2232 |        "    </tr>\n",
2233 |        "    <tr>\n",
2234 |        "      <td>48</td>\n",
2235 |        "      <td>0.003988</td>\n",
2236 |        "      <td>0.491984</td>\n",
2237 |        "      <td>0.904238</td>\n",
2238 |        "      <td>00:01</td>\n",
2239 |        "    </tr>\n",
2240 |        "    <tr>\n",
2241 |        "      <td>49</td>\n",
2242 |        "      <td>0.005047</td>\n",
2243 |        "      <td>0.482024</td>\n",
2244 |        "      <td>0.907437</td>\n",
2245 |        "      <td>00:01</td>\n",
2246 |        "    </tr>\n",
2247 |        "    <tr>\n",
2248 |        "      <td>50</td>\n",
2249 |        "      <td>0.004036</td>\n",
2250 |        "      <td>0.475449</td>\n",
2251 |        "      <td>0.910236</td>\n",
2252 |        "      <td>00:01</td>\n",
2253 |        "    </tr>\n",
2254 |        "    <tr>\n",
2255 |        "      <td>51</td>\n",
2256 |        "      <td>0.005484</td>\n",
2257 |        "      <td>0.484445</td>\n",
2258 |        "      <td>0.905638</td>\n",
2259 |        "      <td>00:01</td>\n",
2260 |        "    </tr>\n",
2261 |        "    <tr>\n",
2262 |        "      <td>52</td>\n",
2263 |        "      <td>0.002572</td>\n",
2264 |        "      <td>0.493349</td>\n",
2265 |        "      <td>0.906637</td>\n",
2266 |        "      <td>00:01</td>\n",
2267 |        "    </tr>\n",
2268 |        "    <tr>\n",
2269 |        "      <td>53</td>\n",
2270 |        "      <td>0.002669</td>\n",
2271 |        "      <td>0.487943</td>\n",
2272 |        "      <td>0.909036</td>\n",
2273 |        "      <td>00:01</td>\n",
2274 |        "    </tr>\n",
2275 |        "    <tr>\n",
2276 |        "      <td>54</td>\n",
2277 |        "      <td>0.002448</td>\n",
2278 |        "      <td>0.486431</td>\n",
2279 |        "      <td>0.906837</td>\n",
2280 |        "      <td>00:01</td>\n",
2281 |        "    </tr>\n",
2282 |        "    <tr>\n",
2283 |        "      <td>55</td>\n",
2284 |        "      <td>0.002741</td>\n",
2285 |        "      <td>0.472413</td>\n",
2286 |        "      <td>0.909036</td>\n",
2287 |        "      <td>00:01</td>\n",
2288 |        "    </tr>\n",
2289 |        "    <tr>\n",
2290 |        "      <td>56</td>\n",
2291 |        "      <td>0.002761</td>\n",
2292 |        "      <td>0.482204</td>\n",
2293 |        "      <td>0.910036</td>\n",
2294 |        "      <td>00:01</td>\n",
2295 |        "    </tr>\n",
2296 |        "    <tr>\n",
2297 |        "      <td>57</td>\n",
2298 |        "      <td>0.002024</td>\n",
2299 |        "      <td>0.488853</td>\n",
2300 |        "      <td>0.906837</td>\n",
2301 |        "      <td>00:01</td>\n",
2302 |        "    </tr>\n",
2303 |        "    <tr>\n",
2304 |        "      <td>58</td>\n",
2305 |        "      <td>0.002998</td>\n",
2306 |        "      <td>0.476179</td>\n",
2307 |        "      <td>0.907837</td>\n",
2308 |        "      <td>00:01</td>\n",
2309 |        "    </tr>\n",
2310 |        "    <tr>\n",
2311 |        "      <td>59</td>\n",
2312 |        "      <td>0.003897</td>\n",
2313 |        "      <td>0.482491</td>\n",
2314 |        "      <td>0.908237</td>\n",
2315 |        "      <td>00:01</td>\n",
2316 |        "    </tr>\n",
2317 |        "  </tbody>\n",
2318 |        "</table>"
2319 |       ],
2320 |       "text/plain": [
2321 |        "<IPython.core.display.HTML object>"
2322 |       ]
2323 |      },
2324 |      "metadata": {},
2325 |      "output_type": "display_data"
2326 |     }
2327 |    ],
2328 |    "source": [
2329 |     "learn.fit_one_cycle(cyc_len=cycles, max_lr=max_lr, wd=w_decay)"
2330 |    ]
2331 |   },
2332 |   {
2333 |    "cell_type": "code",
2334 |    "execution_count": 42,
2335 |    "metadata": {
2336 |     "ExecuteTime": {
2337 |      "end_time": "2020-02-04T07:58:08.683290Z",
2338 |      "start_time": "2020-02-04T07:58:08.622617Z"
2339 |     }
2340 |    },
2341 |    "outputs": [],
2342 |    "source": [
2343 |     "learn.save('no_reg_save_0908')\n",
2344 |     "learn.export('no_reg_0908')"
2345 |    ]
2346 |   },
2347 |   {
2348 |    "cell_type": "code",
2349 |    "execution_count": 43,
2350 |    "metadata": {
2351 |     "ExecuteTime": {
2352 |      "end_time": "2020-02-04T07:58:31.888308Z",
2353 |      "start_time": "2020-02-04T07:58:31.867844Z"
2354 |     }
2355 |    },
2356 |    "outputs": [],
2357 |    "source": [
2358 |     "max_lr = 1e-4"
2359 |    ]
2360 |   },
2361 |   {
2362 |    "cell_type": "code",
2363 |    "execution_count": 44,
2364 |    "metadata": {
2365 |     "ExecuteTime": {
2366 |      "end_time": "2020-02-04T07:59:54.280873Z",
2367 |      "start_time": "2020-02-04T07:58:49.076527Z"
2368 |     }
2369 |    },
2370 |    "outputs": [
2371 |     {
2372 |      "data": {
2373 |       "text/html": [
2374 |        "<table border=\"1\" class=\"dataframe\">\n",
2375 |        "  <thead>\n",
2376 |        "    <tr style=\"text-align: left;\">\n",
2377 |        "      <th>epoch</th>\n",
2378 |        "      <th>train_loss</th>\n",
2379 |        "      <th>valid_loss</th>\n",
2380 |        "      <th>accuracy</th>\n",
2381 |        "      <th>time</th>\n",
2382 |        "    </tr>\n",
2383 |        "  </thead>\n",
2384 |        "  <tbody>\n",
2385 |        "    <tr>\n",
2386 |        "      <td>0</td>\n",
2387 |        "      <td>0.002346</td>\n",
2388 |        "      <td>0.501966</td>\n",
2389 |        "      <td>0.906237</td>\n",
2390 |        "      <td>00:01</td>\n",
2391 |        "    </tr>\n",
2392 |        "    <tr>\n",
2393 |        "      <td>1</td>\n",
2394 |        "      <td>0.001800</td>\n",
2395 |        "      <td>0.484959</td>\n",
2396 |        "      <td>0.907237</td>\n",
2397 |        "      <td>00:01</td>\n",
2398 |        "    </tr>\n",
2399 |        "    <tr>\n",
2400 |        "      <td>2</td>\n",
2401 |        "      <td>0.002740</td>\n",
2402 |        "      <td>0.503099</td>\n",
2403 |        "      <td>0.906837</td>\n",
2404 |        "      <td>00:01</td>\n",
2405 |        "    </tr>\n",
2406 |        "    <tr>\n",
2407 |        "      <td>3</td>\n",
2408 |        "      <td>0.002739</td>\n",
2409 |        "      <td>0.516548</td>\n",
2410 |        "      <td>0.904238</td>\n",
2411 |        "      <td>00:01</td>\n",
2412 |        "    </tr>\n",
2413 |        "    <tr>\n",
2414 |        "      <td>4</td>\n",
2415 |        "      <td>0.002884</td>\n",
2416 |        "      <td>0.490764</td>\n",
2417 |        "      <td>0.907237</td>\n",
2418 |        "      <td>00:01</td>\n",
2419 |        "    </tr>\n",
2420 |        "    <tr>\n",
2421 |        "      <td>5</td>\n",
2422 |        "      <td>0.006304</td>\n",
2423 |        "      <td>0.546647</td>\n",
2424 |        "      <td>0.901639</td>\n",
2425 |        "      <td>00:01</td>\n",
2426 |        "    </tr>\n",
2427 |        "    <tr>\n",
2428 |        "      <td>6</td>\n",
2429 |        "      <td>0.008227</td>\n",
2430 |        "      <td>0.532048</td>\n",
2431 |        "      <td>0.904238</td>\n",
2432 |        "      <td>00:01</td>\n",
2433 |        "    </tr>\n",
2434 |        "    <tr>\n",
2435 |        "      <td>7</td>\n",
2436 |        "      <td>0.011213</td>\n",
2437 |        "      <td>0.539905</td>\n",
2438 |        "      <td>0.899240</td>\n",
2439 |        "      <td>00:01</td>\n",
2440 |        "    </tr>\n",
2441 |        "    <tr>\n",
2442 |        "      <td>8</td>\n",
2443 |        "      <td>0.014906</td>\n",
2444 |        "      <td>0.552567</td>\n",
2445 |        "      <td>0.895242</td>\n",
2446 |        "      <td>00:01</td>\n",
2447 |        "    </tr>\n",
2448 |        "    <tr>\n",
2449 |        "      <td>9</td>\n",
2450 |        "      <td>0.022929</td>\n",
2451 |        "      <td>0.613138</td>\n",
2452 |        "      <td>0.890244</td>\n",
2453 |        "      <td>00:01</td>\n",
2454 |        "    </tr>\n",
2455 |        "    <tr>\n",
2456 |        "      <td>10</td>\n",
2457 |        "      <td>0.037277</td>\n",
2458 |        "      <td>0.597136</td>\n",
2459 |        "      <td>0.887445</td>\n",
2460 |        "      <td>00:01</td>\n",
2461 |        "    </tr>\n",
2462 |        "    <tr>\n",
2463 |        "      <td>11</td>\n",
2464 |        "      <td>0.033755</td>\n",
2465 |        "      <td>0.545198</td>\n",
2466 |        "      <td>0.892643</td>\n",
2467 |        "      <td>00:01</td>\n",
2468 |        "    </tr>\n",
2469 |        "    <tr>\n",
2470 |        "      <td>12</td>\n",
2471 |        "      <td>0.043162</td>\n",
2472 |        "      <td>0.579143</td>\n",
2473 |        "      <td>0.884646</td>\n",
2474 |        "      <td>00:01</td>\n",
2475 |        "    </tr>\n",
2476 |        "    <tr>\n",
2477 |        "      <td>13</td>\n",
2478 |        "      <td>0.044136</td>\n",
2479 |        "      <td>0.581904</td>\n",
2480 |        "      <td>0.882247</td>\n",
2481 |        "      <td>00:01</td>\n",
2482 |        "    </tr>\n",
2483 |        "    <tr>\n",
2484 |        "      <td>14</td>\n",
2485 |        "      <td>0.054939</td>\n",
2486 |        "      <td>0.539270</td>\n",
2487 |        "      <td>0.893842</td>\n",
2488 |        "      <td>00:01</td>\n",
2489 |        "    </tr>\n",
2490 |        "    <tr>\n",
2491 |        "      <td>15</td>\n",
2492 |        "      <td>0.059145</td>\n",
2493 |        "      <td>0.518904</td>\n",
2494 |        "      <td>0.891843</td>\n",
2495 |        "      <td>00:01</td>\n",
2496 |        "    </tr>\n",
2497 |        "    <tr>\n",
2498 |        "      <td>16</td>\n",
2499 |        "      <td>0.059168</td>\n",
2500 |        "      <td>0.516859</td>\n",
2501 |        "      <td>0.889844</td>\n",
2502 |        "      <td>00:01</td>\n",
2503 |        "    </tr>\n",
2504 |        "    <tr>\n",
2505 |        "      <td>17</td>\n",
2506 |        "      <td>0.055548</td>\n",
2507 |        "      <td>0.528800</td>\n",
2508 |        "      <td>0.887845</td>\n",
2509 |        "      <td>00:01</td>\n",
2510 |        "    </tr>\n",
2511 |        "    <tr>\n",
2512 |        "      <td>18</td>\n",
2513 |        "      <td>0.043889</td>\n",
2514 |        "      <td>0.500283</td>\n",
2515 |        "      <td>0.894442</td>\n",
2516 |        "      <td>00:01</td>\n",
2517 |        "    </tr>\n",
2518 |        "    <tr>\n",
2519 |        "      <td>19</td>\n",
2520 |        "      <td>0.054916</td>\n",
2521 |        "      <td>0.513064</td>\n",
2522 |        "      <td>0.891843</td>\n",
2523 |        "      <td>00:01</td>\n",
2524 |        "    </tr>\n",
2525 |        "    <tr>\n",
2526 |        "      <td>20</td>\n",
2527 |        "      <td>0.049862</td>\n",
2528 |        "      <td>0.489953</td>\n",
2529 |        "      <td>0.888045</td>\n",
2530 |        "      <td>00:01</td>\n",
2531 |        "    </tr>\n",
2532 |        "    <tr>\n",
2533 |        "      <td>21</td>\n",
2534 |        "      <td>0.060476</td>\n",
2535 |        "      <td>0.484738</td>\n",
2536 |        "      <td>0.895242</td>\n",
2537 |        "      <td>00:01</td>\n",
2538 |        "    </tr>\n",
2539 |        "    <tr>\n",
2540 |        "      <td>22</td>\n",
2541 |        "      <td>0.043035</td>\n",
2542 |        "      <td>0.471726</td>\n",
2543 |        "      <td>0.901040</td>\n",
2544 |        "      <td>00:01</td>\n",
2545 |        "    </tr>\n",
2546 |        "    <tr>\n",
2547 |        "      <td>23</td>\n",
2548 |        "      <td>0.044736</td>\n",
2549 |        "      <td>0.506684</td>\n",
2550 |        "      <td>0.891643</td>\n",
2551 |        "      <td>00:01</td>\n",
2552 |        "    </tr>\n",
2553 |        "    <tr>\n",
2554 |        "      <td>24</td>\n",
2555 |        "      <td>0.043547</td>\n",
2556 |        "      <td>0.447643</td>\n",
2557 |        "      <td>0.899840</td>\n",
2558 |        "      <td>00:01</td>\n",
2559 |        "    </tr>\n",
2560 |        "    <tr>\n",
2561 |        "      <td>25</td>\n",
2562 |        "      <td>0.034926</td>\n",
2563 |        "      <td>0.488299</td>\n",
2564 |        "      <td>0.897241</td>\n",
2565 |        "      <td>00:01</td>\n",
2566 |        "    </tr>\n",
2567 |        "    <tr>\n",
2568 |        "      <td>26</td>\n",
2569 |        "      <td>0.036234</td>\n",
2570 |        "      <td>0.438057</td>\n",
2571 |        "      <td>0.904238</td>\n",
2572 |        "      <td>00:01</td>\n",
2573 |        "    </tr>\n",
2574 |        "    <tr>\n",
2575 |        "      <td>27</td>\n",
2576 |        "      <td>0.034746</td>\n",
2577 |        "      <td>0.457143</td>\n",
2578 |        "      <td>0.901439</td>\n",
2579 |        "      <td>00:01</td>\n",
2580 |        "    </tr>\n",
2581 |        "    <tr>\n",
2582 |        "      <td>28</td>\n",
2583 |        "      <td>0.032796</td>\n",
2584 |        "      <td>0.464443</td>\n",
2585 |        "      <td>0.904838</td>\n",
2586 |        "      <td>00:01</td>\n",
2587 |        "    </tr>\n",
2588 |        "    <tr>\n",
2589 |        "      <td>29</td>\n",
2590 |        "      <td>0.039069</td>\n",
2591 |        "      <td>0.453879</td>\n",
2592 |        "      <td>0.904438</td>\n",
2593 |        "      <td>00:01</td>\n",
2594 |        "    </tr>\n",
2595 |        "    <tr>\n",
2596 |        "      <td>30</td>\n",
2597 |        "      <td>0.018969</td>\n",
2598 |        "      <td>0.471743</td>\n",
2599 |        "      <td>0.903838</td>\n",
2600 |        "      <td>00:01</td>\n",
2601 |        "    </tr>\n",
2602 |        "    <tr>\n",
2603 |        "      <td>31</td>\n",
2604 |        "      <td>0.021271</td>\n",
2605 |        "      <td>0.461286</td>\n",
2606 |        "      <td>0.904038</td>\n",
2607 |        "      <td>00:01</td>\n",
2608 |        "    </tr>\n",
2609 |        "    <tr>\n",
2610 |        "      <td>32</td>\n",
2611 |        "      <td>0.028999</td>\n",
2612 |        "      <td>0.457090</td>\n",
2613 |        "      <td>0.905038</td>\n",
2614 |        "      <td>00:01</td>\n",
2615 |        "    </tr>\n",
2616 |        "    <tr>\n",
2617 |        "      <td>33</td>\n",
2618 |        "      <td>0.020766</td>\n",
2619 |        "      <td>0.476078</td>\n",
2620 |        "      <td>0.900640</td>\n",
2621 |        "      <td>00:01</td>\n",
2622 |        "    </tr>\n",
2623 |        "    <tr>\n",
2624 |        "      <td>34</td>\n",
2625 |        "      <td>0.020445</td>\n",
2626 |        "      <td>0.485603</td>\n",
2627 |        "      <td>0.903838</td>\n",
2628 |        "      <td>00:01</td>\n",
2629 |        "    </tr>\n",
2630 |        "    <tr>\n",
2631 |        "      <td>35</td>\n",
2632 |        "      <td>0.013557</td>\n",
2633 |        "      <td>0.488922</td>\n",
2634 |        "      <td>0.904638</td>\n",
2635 |        "      <td>00:01</td>\n",
2636 |        "    </tr>\n",
2637 |        "    <tr>\n",
2638 |        "      <td>36</td>\n",
2639 |        "      <td>0.019166</td>\n",
2640 |        "      <td>0.480485</td>\n",
2641 |        "      <td>0.907237</td>\n",
2642 |        "      <td>00:01</td>\n",
2643 |        "    </tr>\n",
2644 |        "    <tr>\n",
2645 |        "      <td>37</td>\n",
2646 |        "      <td>0.010679</td>\n",
2647 |        "      <td>0.454522</td>\n",
2648 |        "      <td>0.911435</td>\n",
2649 |        "      <td>00:01</td>\n",
2650 |        "    </tr>\n",
2651 |        "    <tr>\n",
2652 |        "      <td>38</td>\n",
2653 |        "      <td>0.012357</td>\n",
2654 |        "      <td>0.444417</td>\n",
2655 |        "      <td>0.910236</td>\n",
2656 |        "      <td>00:01</td>\n",
2657 |        "    </tr>\n",
2658 |        "    <tr>\n",
2659 |        "      <td>39</td>\n",
2660 |        "      <td>0.008135</td>\n",
2661 |        "      <td>0.471780</td>\n",
2662 |        "      <td>0.906637</td>\n",
2663 |        "      <td>00:01</td>\n",
2664 |        "    </tr>\n",
2665 |        "    <tr>\n",
2666 |        "      <td>40</td>\n",
2667 |        "      <td>0.005919</td>\n",
2668 |        "      <td>0.492716</td>\n",
2669 |        "      <td>0.909636</td>\n",
2670 |        "      <td>00:01</td>\n",
2671 |        "    </tr>\n",
2672 |        "    <tr>\n",
2673 |        "      <td>41</td>\n",
2674 |        "      <td>0.005558</td>\n",
2675 |        "      <td>0.484825</td>\n",
2676 |        "      <td>0.910436</td>\n",
2677 |        "      <td>00:01</td>\n",
2678 |        "    </tr>\n",
2679 |        "    <tr>\n",
2680 |        "      <td>42</td>\n",
2681 |        "      <td>0.007230</td>\n",
2682 |        "      <td>0.507019</td>\n",
2683 |        "      <td>0.909836</td>\n",
2684 |        "      <td>00:01</td>\n",
2685 |        "    </tr>\n",
2686 |        "    <tr>\n",
2687 |        "      <td>43</td>\n",
2688 |        "      <td>0.011892</td>\n",
2689 |        "      <td>0.501090</td>\n",
2690 |        "      <td>0.914434</td>\n",
2691 |        "      <td>00:01</td>\n",
2692 |        "    </tr>\n",
2693 |        "    <tr>\n",
2694 |        "      <td>44</td>\n",
2695 |        "      <td>0.005760</td>\n",
2696 |        "      <td>0.484983</td>\n",
2697 |        "      <td>0.912835</td>\n",
2698 |        "      <td>00:01</td>\n",
2699 |        "    </tr>\n",
2700 |        "    <tr>\n",
2701 |        "      <td>45</td>\n",
2702 |        "      <td>0.003329</td>\n",
2703 |        "      <td>0.492622</td>\n",
2704 |        "      <td>0.912035</td>\n",
2705 |        "      <td>00:01</td>\n",
2706 |        "    </tr>\n",
2707 |        "    <tr>\n",
2708 |        "      <td>46</td>\n",
2709 |        "      <td>0.005762</td>\n",
2710 |        "      <td>0.494583</td>\n",
2711 |        "      <td>0.913834</td>\n",
2712 |        "      <td>00:01</td>\n",
2713 |        "    </tr>\n",
2714 |        "    <tr>\n",
2715 |        "      <td>47</td>\n",
2716 |        "      <td>0.004002</td>\n",
2717 |        "      <td>0.489260</td>\n",
2718 |        "      <td>0.915434</td>\n",
2719 |        "      <td>00:01</td>\n",
2720 |        "    </tr>\n",
2721 |        "    <tr>\n",
2722 |        "      <td>48</td>\n",
2723 |        "      <td>0.003667</td>\n",
2724 |        "      <td>0.459472</td>\n",
2725 |        "      <td>0.916633</td>\n",
2726 |        "      <td>00:01</td>\n",
2727 |        "    </tr>\n",
2728 |        "    <tr>\n",
2729 |        "      <td>49</td>\n",
2730 |        "      <td>0.003055</td>\n",
2731 |        "      <td>0.491118</td>\n",
2732 |        "      <td>0.917833</td>\n",
2733 |        "      <td>00:01</td>\n",
2734 |        "    </tr>\n",
2735 |        "    <tr>\n",
2736 |        "      <td>50</td>\n",
2737 |        "      <td>0.002262</td>\n",
2738 |        "      <td>0.484979</td>\n",
2739 |        "      <td>0.919632</td>\n",
2740 |        "      <td>00:01</td>\n",
2741 |        "    </tr>\n",
2742 |        "    <tr>\n",
2743 |        "      <td>51</td>\n",
2744 |        "      <td>0.002346</td>\n",
2745 |        "      <td>0.456207</td>\n",
2746 |        "      <td>0.918233</td>\n",
2747 |        "      <td>00:01</td>\n",
2748 |        "    </tr>\n",
2749 |        "    <tr>\n",
2750 |        "      <td>52</td>\n",
2751 |        "      <td>0.001485</td>\n",
2752 |        "      <td>0.459586</td>\n",
2753 |        "      <td>0.919232</td>\n",
2754 |        "      <td>00:01</td>\n",
2755 |        "    </tr>\n",
2756 |        "    <tr>\n",
2757 |        "      <td>53</td>\n",
2758 |        "      <td>0.001536</td>\n",
2759 |        "      <td>0.470243</td>\n",
2760 |        "      <td>0.918832</td>\n",
2761 |        "      <td>00:01</td>\n",
2762 |        "    </tr>\n",
2763 |        "    <tr>\n",
2764 |        "      <td>54</td>\n",
2765 |        "      <td>0.001243</td>\n",
2766 |        "      <td>0.469594</td>\n",
2767 |        "      <td>0.917633</td>\n",
2768 |        "      <td>00:01</td>\n",
2769 |        "    </tr>\n",
2770 |        "    <tr>\n",
2771 |        "      <td>55</td>\n",
2772 |        "      <td>0.000890</td>\n",
2773 |        "      <td>0.474230</td>\n",
2774 |        "      <td>0.917033</td>\n",
2775 |        "      <td>00:01</td>\n",
2776 |        "    </tr>\n",
2777 |        "    <tr>\n",
2778 |        "      <td>56</td>\n",
2779 |        "      <td>0.000883</td>\n",
2780 |        "      <td>0.480228</td>\n",
2781 |        "      <td>0.919832</td>\n",
2782 |        "      <td>00:01</td>\n",
2783 |        "    </tr>\n",
2784 |        "    <tr>\n",
2785 |        "      <td>57</td>\n",
2786 |        "      <td>0.000940</td>\n",
2787 |        "      <td>0.478531</td>\n",
2788 |        "      <td>0.917433</td>\n",
2789 |        "      <td>00:01</td>\n",
2790 |        "    </tr>\n",
2791 |        "    <tr>\n",
2792 |        "      <td>58</td>\n",
2793 |        "      <td>0.000858</td>\n",
2794 |        "      <td>0.478818</td>\n",
2795 |        "      <td>0.915434</td>\n",
2796 |        "      <td>00:01</td>\n",
2797 |        "    </tr>\n",
2798 |        "    <tr>\n",
2799 |        "      <td>59</td>\n",
2800 |        "      <td>0.003246</td>\n",
2801 |        "      <td>0.471925</td>\n",
2802 |        "      <td>0.917233</td>\n",
2803 |        "      <td>00:01</td>\n",
2804 |        "    </tr>\n",
2805 |        "  </tbody>\n",
2806 |        "</table>"
2807 |       ],
2808 |       "text/plain": [
2809 |        "<IPython.core.display.HTML object>"
2810 |       ]
2811 |      },
2812 |      "metadata": {},
2813 |      "output_type": "display_data"
2814 |     }
2815 |    ],
2816 |    "source": [
2817 |     "learn.fit_one_cycle(cyc_len=cycles, max_lr=max_lr, wd=w_decay)"
2818 |    ]
2819 |   },
2820 |   {
2821 |    "cell_type": "code",
2822 |    "execution_count": 45,
2823 |    "metadata": {
2824 |     "ExecuteTime": {
2825 |      "end_time": "2020-02-04T08:00:15.883521Z",
2826 |      "start_time": "2020-02-04T08:00:15.822953Z"
2827 |     }
2828 |    },
2829 |    "outputs": [],
2830 |    "source": [
2831 |     "learn.save('no_reg_save_0917')\n",
2832 |     "learn.export('no_reg_0917')"
2833 |    ]
2834 |   },
2835 |   {
2836 |    "cell_type": "markdown",
2837 |    "metadata": {},
2838 |    "source": [
2839 |     "### Test"
2840 |    ]
2841 |   },
2842 |   {
2843 |    "cell_type": "code",
2844 |    "execution_count": 46,
2845 |    "metadata": {
2846 |     "ExecuteTime": {
2847 |      "end_time": "2020-02-04T08:00:29.345047Z",
2848 |      "start_time": "2020-02-04T08:00:28.132602Z"
2849 |     }
2850 |    },
2851 |    "outputs": [],
2852 |    "source": [
2853 |     "test_df = ld_var(name='test_df', path=path)"
2854 |    ]
2855 |   },
2856 |   {
2857 |    "cell_type": "code",
2858 |    "execution_count": 47,
2859 |    "metadata": {
2860 |     "ExecuteTime": {
2861 |      "end_time": "2020-02-04T08:00:30.571916Z",
2862 |      "start_time": "2020-02-04T08:00:30.340314Z"
2863 |     }
2864 |    },
2865 |    "outputs": [
2866 |     {
2867 |      "data": {
2868 |       "text/html": [
2869 |        "<div>\n",
2870 |        "<style scoped>\n",
2871 |        "    .dataframe tbody tr th:only-of-type {\n",
2872 |        "        vertical-align: middle;\n",
2873 |        "    }\n",
2874 |        "\n",
2875 |        "    .dataframe tbody tr th {\n",
2876 |        "        vertical-align: top;\n",
2877 |        "    }\n",
2878 |        "\n",
2879 |        "    .dataframe thead th {\n",
2880 |        "        text-align: right;\n",
2881 |        "    }\n",
2882 |        "</style>\n",
2883 |        "<table border=\"1\" class=\"dataframe\">\n",
2884 |        "  <thead>\n",
2885 |        "    <tr style=\"text-align: right;\">\n",
2886 |        "      <th></th>\n",
2887 |        "      <th>id</th>\n",
2888 |        "      <th>S1</th>\n",
2889 |        "      <th>C1</th>\n",
2890 |        "      <th>S2</th>\n",
2891 |        "      <th>C2</th>\n",
2892 |        "      <th>S3</th>\n",
2893 |        "      <th>C3</th>\n",
2894 |        "      <th>S4</th>\n",
2895 |        "      <th>C4</th>\n",
2896 |        "      <th>S5</th>\n",
2897 |        "      <th>C5</th>\n",
2898 |        "      <th>cards</th>\n",
2899 |        "      <th>new_hand</th>\n",
2900 |        "    </tr>\n",
2901 |        "  </thead>\n",
2902 |        "  <tbody>\n",
2903 |        "    <tr>\n",
2904 |        "      <th>679436</th>\n",
2905 |        "      <td>679437</td>\n",
2906 |        "      <td>Diamonds</td>\n",
2907 |        "      <td>10</td>\n",
2908 |        "      <td>Spades</td>\n",
2909 |        "      <td>2</td>\n",
2910 |        "      <td>Hearts</td>\n",
2911 |        "      <td>King</td>\n",
2912 |        "      <td>Clubs</td>\n",
2913 |        "      <td>Jack</td>\n",
2914 |        "      <td>Clubs</td>\n",
2915 |        "      <td>3</td>\n",
2916 |        "      <td>[2, 3, 10, 11, 13]</td>\n",
2917 |        "      <td>Nothing</td>\n",
2918 |        "    </tr>\n",
2919 |        "    <tr>\n",
2920 |        "      <th>607096</th>\n",
2921 |        "      <td>607097</td>\n",
2922 |        "      <td>Diamonds</td>\n",
2923 |        "      <td>3</td>\n",
2924 |        "      <td>Spades</td>\n",
2925 |        "      <td>Ace</td>\n",
2926 |        "      <td>Clubs</td>\n",
2927 |        "      <td>8</td>\n",
2928 |        "      <td>Hearts</td>\n",
2929 |        "      <td>6</td>\n",
2930 |        "      <td>Diamonds</td>\n",
2931 |        "      <td>8</td>\n",
2932 |        "      <td>[1, 3, 6, 8, 8, 14]</td>\n",
2933 |        "      <td>Pair</td>\n",
2934 |        "    </tr>\n",
2935 |        "    <tr>\n",
2936 |        "      <th>690751</th>\n",
2937 |        "      <td>690752</td>\n",
2938 |        "      <td>Spades</td>\n",
2939 |        "      <td>Queen</td>\n",
2940 |        "      <td>Diamonds</td>\n",
2941 |        "      <td>Jack</td>\n",
2942 |        "      <td>Hearts</td>\n",
2943 |        "      <td>Queen</td>\n",
2944 |        "      <td>Spades</td>\n",
2945 |        "      <td>8</td>\n",
2946 |        "      <td>Hearts</td>\n",
2947 |        "      <td>Jack</td>\n",
2948 |        "      <td>[8, 11, 11, 12, 12]</td>\n",
2949 |        "      <td>Two pairs</td>\n",
2950 |        "    </tr>\n",
2951 |        "    <tr>\n",
2952 |        "      <th>887951</th>\n",
2953 |        "      <td>887952</td>\n",
2954 |        "      <td>Hearts</td>\n",
2955 |        "      <td>8</td>\n",
2956 |        "      <td>Hearts</td>\n",
2957 |        "      <td>2</td>\n",
2958 |        "      <td>Hearts</td>\n",
2959 |        "      <td>6</td>\n",
2960 |        "      <td>Clubs</td>\n",
2961 |        "      <td>7</td>\n",
2962 |        "      <td>Hearts</td>\n",
2963 |        "      <td>3</td>\n",
2964 |        "      <td>[2, 3, 6, 7, 8]</td>\n",
2965 |        "      <td>Nothing</td>\n",
2966 |        "    </tr>\n",
2967 |        "    <tr>\n",
2968 |        "      <th>667297</th>\n",
2969 |        "      <td>667298</td>\n",
2970 |        "      <td>Clubs</td>\n",
2971 |        "      <td>Ace</td>\n",
2972 |        "      <td>Hearts</td>\n",
2973 |        "      <td>9</td>\n",
2974 |        "      <td>Hearts</td>\n",
2975 |        "      <td>3</td>\n",
2976 |        "      <td>Spades</td>\n",
2977 |        "      <td>Jack</td>\n",
2978 |        "      <td>Spades</td>\n",
2979 |        "      <td>Queen</td>\n",
2980 |        "      <td>[1, 3, 9, 11, 12, 14]</td>\n",
2981 |        "      <td>Nothing</td>\n",
2982 |        "    </tr>\n",
2983 |        "  </tbody>\n",
2984 |        "</table>\n",
2985 |        "</div>"
2986 |       ],
2987 |       "text/plain": [
2988 |        "            id        S1     C1        S2    C2      S3     C3      S4    C4  \\\n",
2989 |        "679436  679437  Diamonds     10    Spades     2  Hearts   King   Clubs  Jack   \n",
2990 |        "607096  607097  Diamonds      3    Spades   Ace   Clubs      8  Hearts     6   \n",
2991 |        "690751  690752    Spades  Queen  Diamonds  Jack  Hearts  Queen  Spades     8   \n",
2992 |        "887951  887952    Hearts      8    Hearts     2  Hearts      6   Clubs     7   \n",
2993 |        "667297  667298     Clubs    Ace    Hearts     9  Hearts      3  Spades  Jack   \n",
2994 |        "\n",
2995 |        "              S5     C5                  cards   new_hand  \n",
2996 |        "679436     Clubs      3     [2, 3, 10, 11, 13]    Nothing  \n",
2997 |        "607096  Diamonds      8    [1, 3, 6, 8, 8, 14]       Pair  \n",
2998 |        "690751    Hearts   Jack    [8, 11, 11, 12, 12]  Two pairs  \n",
2999 |        "887951    Hearts      3        [2, 3, 6, 7, 8]    Nothing  \n",
3000 |        "667297    Spades  Queen  [1, 3, 9, 11, 12, 14]    Nothing  "
3001 |       ]
3002 |      },
3003 |      "execution_count": 47,
3004 |      "metadata": {},
3005 |      "output_type": "execute_result"
3006 |     }
3007 |    ],
3008 |    "source": [
3009 |     "test_df.sample(5)"
3010 |    ]
3011 |   },
3012 |   {
3013 |    "cell_type": "code",
3014 |    "execution_count": 48,
3015 |    "metadata": {
3016 |     "ExecuteTime": {
3017 |      "end_time": "2020-02-04T08:00:38.664736Z",
3018 |      "start_time": "2020-02-04T08:00:38.644077Z"
3019 |     }
3020 |    },
3021 |    "outputs": [],
3022 |    "source": [
3023 |     "learn_test = copy(learn)"
3024 |    ]
3025 |   },
3026 |   {
3027 |    "cell_type": "code",
3028 |    "execution_count": 49,
3029 |    "metadata": {
3030 |     "ExecuteTime": {
3031 |      "end_time": "2020-02-04T08:00:42.753519Z",
3032 |      "start_time": "2020-02-04T08:00:42.733048Z"
3033 |     }
3034 |    },
3035 |    "outputs": [],
3036 |    "source": [
3037 |     "n = 100000"
3038 |    ]
3039 |   },
3040 |   {
3041 |    "cell_type": "code",
3042 |    "execution_count": 50,
3043 |    "metadata": {
3044 |     "ExecuteTime": {
3045 |      "end_time": "2020-02-04T08:00:44.121349Z",
3046 |      "start_time": "2020-02-04T08:00:43.572327Z"
3047 |     }
3048 |    },
3049 |    "outputs": [],
3050 |    "source": [
3051 |     "np.random.seed(1001)\n",
3052 |     "preds = get_cust_preds(df=test_df.iloc[:n], learn=learn_test, bs=BS)"
3053 |    ]
3054 |   },
3055 |   {
3056 |    "cell_type": "code",
3057 |    "execution_count": 51,
3058 |    "metadata": {
3059 |     "ExecuteTime": {
3060 |      "end_time": "2020-02-04T08:00:45.393955Z",
3061 |      "start_time": "2020-02-04T08:00:45.371880Z"
3062 |     }
3063 |    },
3064 |    "outputs": [],
3065 |    "source": [
3066 |     "y_hat = np.argmax(preds, axis = 1)"
3067 |    ]
3068 |   },
3069 |   {
3070 |    "cell_type": "code",
3071 |    "execution_count": 52,
3072 |    "metadata": {
3073 |     "ExecuteTime": {
3074 |      "end_time": "2020-02-04T08:00:46.145068Z",
3075 |      "start_time": "2020-02-04T08:00:46.124356Z"
3076 |     }
3077 |    },
3078 |    "outputs": [
3079 |     {
3080 |      "data": {
3081 |       "text/plain": [
3082 |        "100000"
3083 |       ]
3084 |      },
3085 |      "execution_count": 52,
3086 |      "metadata": {},
3087 |      "output_type": "execute_result"
3088 |     }
3089 |    ],
3090 |    "source": [
3091 |     "len(y_hat)"
3092 |    ]
3093 |   },
3094 |   {
3095 |    "cell_type": "code",
3096 |    "execution_count": 53,
3097 |    "metadata": {
3098 |     "ExecuteTime": {
3099 |      "end_time": "2020-02-04T08:00:46.921427Z",
3100 |      "start_time": "2020-02-04T08:00:46.900461Z"
3101 |     }
3102 |    },
3103 |    "outputs": [
3104 |     {
3105 |      "data": {
3106 |       "text/plain": [
3107 |        "{'Flush': 0,\n",
3108 |        " 'Four of a kind': 1,\n",
3109 |        " 'Full house': 2,\n",
3110 |        " 'Nothing': 3,\n",
3111 |        " 'Pair': 4,\n",
3112 |        " 'Royal flush': 5,\n",
3113 |        " 'Straight': 6,\n",
3114 |        " 'Straight flush': 7,\n",
3115 |        " 'Three of a kind': 8,\n",
3116 |        " 'Two pairs': 9}"
3117 |       ]
3118 |      },
3119 |      "execution_count": 53,
3120 |      "metadata": {},
3121 |      "output_type": "execute_result"
3122 |     }
3123 |    ],
3124 |    "source": [
3125 |     "c2i = learn_test.data.train_ds.c2i\n",
3126 |     "c2i"
3127 |    ]
3128 |   },
3129 |   {
3130 |    "cell_type": "code",
3131 |    "execution_count": 54,
3132 |    "metadata": {
3133 |     "ExecuteTime": {
3134 |      "end_time": "2020-02-04T08:00:49.227012Z",
3135 |      "start_time": "2020-02-04T08:00:49.180522Z"
3136 |     }
3137 |    },
3138 |    "outputs": [],
3139 |    "source": [
3140 |     "y = test_df.iloc[:n]['new_hand']\n",
3141 |     "y = y.replace(c2i)"
3142 |    ]
3143 |   },
3144 |   {
3145 |    "cell_type": "code",
3146 |    "execution_count": 55,
3147 |    "metadata": {
3148 |     "ExecuteTime": {
3149 |      "end_time": "2020-02-04T08:00:50.305792Z",
3150 |      "start_time": "2020-02-04T08:00:50.284309Z"
3151 |     }
3152 |    },
3153 |    "outputs": [],
3154 |    "source": [
3155 |     "tr = np.count_nonzero(y==y_hat)"
3156 |    ]
3157 |   },
3158 |   {
3159 |    "cell_type": "code",
3160 |    "execution_count": 56,
3161 |    "metadata": {
3162 |     "ExecuteTime": {
3163 |      "end_time": "2020-02-04T08:00:51.104537Z",
3164 |      "start_time": "2020-02-04T08:00:51.084501Z"
3165 |     }
3166 |    },
3167 |    "outputs": [],
3168 |    "source": [
3169 |     "accuracy = tr/len(y)"
3170 |    ]
3171 |   },
3172 |   {
3173 |    "cell_type": "code",
3174 |    "execution_count": 57,
3175 |    "metadata": {
3176 |     "ExecuteTime": {
3177 |      "end_time": "2020-02-04T08:00:51.951914Z",
3178 |      "start_time": "2020-02-04T08:00:51.931661Z"
3179 |     }
3180 |    },
3181 |    "outputs": [
3182 |     {
3183 |      "data": {
3184 |       "text/plain": [
3185 |        "0.91744"
3186 |       ]
3187 |      },
3188 |      "execution_count": 57,
3189 |      "metadata": {},
3190 |      "output_type": "execute_result"
3191 |     }
3192 |    ],
3193 |    "source": [
3194 |     "accuracy"
3195 |    ]
3196 |   },
3197 |   {
3198 |    "cell_type": "markdown",
3199 |    "metadata": {},
3200 |    "source": [
3201 |     "### 91%"
3202 |    ]
3203 |   }
3204 |  ],
3205 |  "metadata": {
3206 |   "kernelspec": {
3207 |    "display_name": "Python 3",
3208 |    "language": "python",
3209 |    "name": "python3"
3210 |   },
3211 |   "language_info": {
3212 |    "codemirror_mode": {
3213 |     "name": "ipython",
3214 |     "version": 3
3215 |    },
3216 |    "file_extension": ".py",
3217 |    "mimetype": "text/x-python",
3218 |    "name": "python",
3219 |    "nbconvert_exporter": "python",
3220 |    "pygments_lexer": "ipython3",
3221 |    "version": "3.7.3"
3222 |   }
3223 |  },
3224 |  "nbformat": 4,
3225 |  "nbformat_minor": 2
3226 | }
3227 | 


--------------------------------------------------------------------------------
/test_tablr_mixup_quick_n_dirty_messy_code.ipynb:
--------------------------------------------------------------------------------
   1 | {
   2 |  "cells": [
   3 |   {
   4 |    "cell_type": "markdown",
   5 |    "metadata": {},
   6 |    "source": [
   7 |     "### Mixup Test - proof of concept (doesn't work)"
   8 |    ]
   9 |   },
  10 |   {
  11 |    "cell_type": "markdown",
  12 |    "metadata": {},
  13 |    "source": [
  14 |     "If we split our model into 2 parts embedding + rest_of_the_model, then we can use the second part as a model and just shift the input of it (in dataloader or callback). We just pass out initial data though embeddings layer and then blend the result. That will be our inputs. I think it’s fair to call in this case the second part (rest_of_the_model) as ‘the model’ as only this part can be trained (I cannot think of the way how to train embeddings as well in a mixup). And feedforward though embeddings is now just a part of preprocessing step. Definetly, first of all we have to train your model in a normal way, as we want to produce our embeddings. Then we can use the_rest_of_the_model and retrain it or throw it away and use only embeddings (and new the_rest_of_the_model) for a mixup training."
  15 |    ]
  16 |   },
  17 |   {
  18 |    "cell_type": "code",
  19 |    "execution_count": 1,
  20 |    "metadata": {
  21 |     "ExecuteTime": {
  22 |      "end_time": "2019-08-08T22:40:50.726941Z",
  23 |      "start_time": "2019-08-08T22:40:50.712470Z"
  24 |     }
  25 |    },
  26 |    "outputs": [],
  27 |    "source": [
  28 |     "%reload_ext autoreload\n",
  29 |     "%autoreload 2"
  30 |    ]
  31 |   },
  32 |   {
  33 |    "cell_type": "code",
  34 |    "execution_count": 2,
  35 |    "metadata": {
  36 |     "ExecuteTime": {
  37 |      "end_time": "2019-08-08T22:40:52.966895Z",
  38 |      "start_time": "2019-08-08T22:40:51.645281Z"
  39 |     }
  40 |    },
  41 |    "outputs": [],
  42 |    "source": [
  43 |     "from fastai.tabular import *"
  44 |    ]
  45 |   },
  46 |   {
  47 |    "cell_type": "code",
  48 |    "execution_count": 3,
  49 |    "metadata": {
  50 |     "ExecuteTime": {
  51 |      "end_time": "2019-08-08T22:40:53.127382Z",
  52 |      "start_time": "2019-08-08T22:40:52.969777Z"
  53 |     }
  54 |    },
  55 |    "outputs": [],
  56 |    "source": [
  57 |     "from exp.nb_ import *"
  58 |    ]
  59 |   },
  60 |   {
  61 |    "cell_type": "code",
  62 |    "execution_count": 4,
  63 |    "metadata": {
  64 |     "ExecuteTime": {
  65 |      "end_time": "2019-08-08T22:40:55.252254Z",
  66 |      "start_time": "2019-08-08T22:40:53.129235Z"
  67 |     }
  68 |    },
  69 |    "outputs": [],
  70 |    "source": [
  71 |     "path=Path('data/')\n",
  72 |     "train_df = pd.read_pickle(path/'train_clean.zip', compression='zip')\n",
  73 |     "test_df = pd.read_pickle(path/'test_clean')"
  74 |    ]
  75 |   },
  76 |   {
  77 |    "cell_type": "code",
  78 |    "execution_count": 5,
  79 |    "metadata": {
  80 |     "ExecuteTime": {
  81 |      "end_time": "2019-08-08T22:40:55.281407Z",
  82 |      "start_time": "2019-08-08T22:40:55.254653Z"
  83 |     }
  84 |    },
  85 |    "outputs": [],
  86 |    "source": [
  87 |     "procs=[FillMissing, Categorify, Normalize]"
  88 |    ]
  89 |   },
  90 |   {
  91 |    "cell_type": "code",
  92 |    "execution_count": 6,
  93 |    "metadata": {
  94 |     "ExecuteTime": {
  95 |      "end_time": "2019-08-08T22:40:55.316131Z",
  96 |      "start_time": "2019-08-08T22:40:55.283465Z"
  97 |     }
  98 |    },
  99 |    "outputs": [],
 100 |    "source": [
 101 |     "cat_vars_tpl = ('Store', 'DayOfWeek', 'Year', 'Month', 'Day', 'StateHoliday', 'CompetitionMonthsOpen',\n",
 102 |     "    'Promo2Weeks', 'StoreType', 'Assortment', 'PromoInterval', 'CompetitionOpenSinceYear', 'Promo2SinceYear',\n",
 103 |     "    'State', 'Week', 'Events', 'Promo_fw', 'Promo_bw', 'StateHoliday_fw', 'StateHoliday_bw',\n",
 104 |     "    'SchoolHoliday_fw', 'SchoolHoliday_bw')\n",
 105 |     "\n",
 106 |     "cont_vars_tpl = ('CompetitionDistance', 'Max_TemperatureC', 'Mean_TemperatureC', 'Min_TemperatureC',\n",
 107 |     "   'Max_Humidity', 'Mean_Humidity', 'Min_Humidity', 'Max_Wind_SpeedKm_h', \n",
 108 |     "   'Mean_Wind_SpeedKm_h', 'CloudCover', 'trend', 'trend_DE',\n",
 109 |     "   'AfterStateHoliday', 'BeforeStateHoliday', 'Promo', 'SchoolHoliday')\n",
 110 |     "cat_vars = list(cat_vars_tpl)\n",
 111 |     "cont_vars = list(cont_vars_tpl)\n",
 112 |     "all_vars = cat_vars + cont_vars"
 113 |    ]
 114 |   },
 115 |   {
 116 |    "cell_type": "code",
 117 |    "execution_count": 7,
 118 |    "metadata": {
 119 |     "ExecuteTime": {
 120 |      "end_time": "2019-08-08T22:40:57.494560Z",
 121 |      "start_time": "2019-08-08T22:40:56.983581Z"
 122 |     }
 123 |    },
 124 |    "outputs": [],
 125 |    "source": [
 126 |     "dep_var = 'Sales'\n",
 127 |     "df = train_df[cat_vars + cont_vars + [dep_var,'Date']].copy()"
 128 |    ]
 129 |   },
 130 |   {
 131 |    "cell_type": "code",
 132 |    "execution_count": 8,
 133 |    "metadata": {
 134 |     "ExecuteTime": {
 135 |      "end_time": "2019-08-08T22:40:58.835333Z",
 136 |      "start_time": "2019-08-08T22:40:58.354100Z"
 137 |     }
 138 |    },
 139 |    "outputs": [],
 140 |    "source": [
 141 |     "#this step reduces the data as whole dataset doesn't fit into my memory after preprocessing\n",
 142 |     "np.random.seed(1001)\n",
 143 |     "coef = 0.3\n",
 144 |     "ln = len(df)\n",
 145 |     "part_idx = np.random.choice(ln, int(ln*coef), replace=False)\n",
 146 |     "df = df.iloc[part_idx]\n",
 147 |     "df.sort_values(by='Date', ascending=False, inplace=True)\n",
 148 |     "df = df.reset_index()"
 149 |    ]
 150 |   },
 151 |   {
 152 |    "cell_type": "code",
 153 |    "execution_count": 11,
 154 |    "metadata": {
 155 |     "ExecuteTime": {
 156 |      "end_time": "2019-08-08T22:42:30.120648Z",
 157 |      "start_time": "2019-08-08T22:42:30.080530Z"
 158 |     }
 159 |    },
 160 |    "outputs": [
 161 |     {
 162 |      "data": {
 163 |       "text/plain": [
 164 |        "12443"
 165 |       ]
 166 |      },
 167 |      "execution_count": 11,
 168 |      "metadata": {},
 169 |      "output_type": "execute_result"
 170 |     }
 171 |    ],
 172 |    "source": [
 173 |     "cut = df['Date'][(df['Date'] == df['Date'][int(len(test_df)*coef)])].index.max()\n",
 174 |     "cut"
 175 |    ]
 176 |   },
 177 |   {
 178 |    "cell_type": "code",
 179 |    "execution_count": 12,
 180 |    "metadata": {
 181 |     "ExecuteTime": {
 182 |      "end_time": "2019-08-08T22:42:48.932050Z",
 183 |      "start_time": "2019-08-08T22:42:48.902394Z"
 184 |     }
 185 |    },
 186 |    "outputs": [
 187 |     {
 188 |      "data": {
 189 |       "text/plain": [
 190 |        "range(0, 12443)"
 191 |       ]
 192 |      },
 193 |      "execution_count": 12,
 194 |      "metadata": {},
 195 |      "output_type": "execute_result"
 196 |     }
 197 |    ],
 198 |    "source": [
 199 |     "valid_idx = range(cut)\n",
 200 |     "valid_idx"
 201 |    ]
 202 |   },
 203 |   {
 204 |    "cell_type": "code",
 205 |    "execution_count": 13,
 206 |    "metadata": {
 207 |     "ExecuteTime": {
 208 |      "end_time": "2019-08-08T22:42:51.887831Z",
 209 |      "start_time": "2019-08-08T22:42:51.862088Z"
 210 |     }
 211 |    },
 212 |    "outputs": [],
 213 |    "source": [
 214 |     "BS = 1024"
 215 |    ]
 216 |   },
 217 |   {
 218 |    "cell_type": "code",
 219 |    "execution_count": 14,
 220 |    "metadata": {
 221 |     "ExecuteTime": {
 222 |      "end_time": "2019-08-08T22:42:54.362351Z",
 223 |      "start_time": "2019-08-08T22:42:52.853880Z"
 224 |     }
 225 |    },
 226 |    "outputs": [],
 227 |    "source": [
 228 |     "data = (TabularList.from_df(df, path=path, cat_names=cat_vars, cont_names=cont_vars, procs=procs)\n",
 229 |     "             .split_by_idx(valid_idx)\n",
 230 |     "             .label_from_df(cols=dep_var, label_cls=FloatList, log=True)\n",
 231 |     "             .databunch(bs=BS))"
 232 |    ]
 233 |   },
 234 |   {
 235 |    "cell_type": "code",
 236 |    "execution_count": 15,
 237 |    "metadata": {
 238 |     "ExecuteTime": {
 239 |      "end_time": "2019-08-08T22:42:57.955043Z",
 240 |      "start_time": "2019-08-08T22:42:55.174795Z"
 241 |     }
 242 |    },
 243 |    "outputs": [],
 244 |    "source": [
 245 |     "max_log_y = np.log(np.max(train_df['Sales'])*1.2)\n",
 246 |     "y_range = torch.tensor([0, max_log_y], device=defaults.device)"
 247 |    ]
 248 |   },
 249 |   {
 250 |    "cell_type": "code",
 251 |    "execution_count": 16,
 252 |    "metadata": {
 253 |     "ExecuteTime": {
 254 |      "end_time": "2019-08-08T22:42:59.064136Z",
 255 |      "start_time": "2019-08-08T22:42:58.926096Z"
 256 |     }
 257 |    },
 258 |    "outputs": [],
 259 |    "source": [
 260 |     "np.random.seed(1001)\n",
 261 |     "learn = tabular_learner(data, layers=[1000,500], ps=[0.001,0.01], emb_drop=0.04, \n",
 262 |     "                        y_range=y_range, metrics=exp_rmspe)"
 263 |    ]
 264 |   },
 265 |   {
 266 |    "cell_type": "code",
 267 |    "execution_count": 17,
 268 |    "metadata": {
 269 |     "ExecuteTime": {
 270 |      "end_time": "2019-08-08T22:43:40.416017Z",
 271 |      "start_time": "2019-08-08T22:43:00.904031Z"
 272 |     }
 273 |    },
 274 |    "outputs": [
 275 |     {
 276 |      "data": {
 277 |       "text/html": [
 278 |        "Total time: 00:39 <p><table style='width:375px; margin-bottom:10px'>\n",
 279 |        "  <tr>\n",
 280 |        "    <th>epoch</th>\n",
 281 |        "    <th>train_loss</th>\n",
 282 |        "    <th>valid_loss</th>\n",
 283 |        "    <th>exp_rmspe</th>\n",
 284 |        "    <th>time</th>\n",
 285 |        "  </tr>\n",
 286 |        "  <tr>\n",
 287 |        "    <th>0</th>\n",
 288 |        "    <th>0.231496</th>\n",
 289 |        "    <th>0.091658</th>\n",
 290 |        "    <th>0.375547</th>\n",
 291 |        "    <th>00:07</th>\n",
 292 |        "  </tr>\n",
 293 |        "  <tr>\n",
 294 |        "    <th>1</th>\n",
 295 |        "    <th>0.026047</th>\n",
 296 |        "    <th>0.018567</th>\n",
 297 |        "    <th>0.139769</th>\n",
 298 |        "    <th>00:06</th>\n",
 299 |        "  </tr>\n",
 300 |        "  <tr>\n",
 301 |        "    <th>2</th>\n",
 302 |        "    <th>0.018347</th>\n",
 303 |        "    <th>0.020124</th>\n",
 304 |        "    <th>0.153870</th>\n",
 305 |        "    <th>00:06</th>\n",
 306 |        "  </tr>\n",
 307 |        "  <tr>\n",
 308 |        "    <th>3</th>\n",
 309 |        "    <th>0.015385</th>\n",
 310 |        "    <th>0.022024</th>\n",
 311 |        "    <th>0.162026</th>\n",
 312 |        "    <th>00:06</th>\n",
 313 |        "  </tr>\n",
 314 |        "  <tr>\n",
 315 |        "    <th>4</th>\n",
 316 |        "    <th>0.011140</th>\n",
 317 |        "    <th>0.012428</th>\n",
 318 |        "    <th>0.113320</th>\n",
 319 |        "    <th>00:06</th>\n",
 320 |        "  </tr>\n",
 321 |        "  <tr>\n",
 322 |        "    <th>5</th>\n",
 323 |        "    <th>0.008664</th>\n",
 324 |        "    <th>0.012298</th>\n",
 325 |        "    <th>0.108537</th>\n",
 326 |        "    <th>00:06</th>\n",
 327 |        "  </tr>\n",
 328 |        "</table>\n"
 329 |       ],
 330 |       "text/plain": [
 331 |        "<IPython.core.display.HTML object>"
 332 |       ]
 333 |      },
 334 |      "metadata": {},
 335 |      "output_type": "display_data"
 336 |     }
 337 |    ],
 338 |    "source": [
 339 |     "learn.fit_one_cycle(6, 1e-2, wd=0.2)"
 340 |    ]
 341 |   },
 342 |   {
 343 |    "cell_type": "code",
 344 |    "execution_count": 18,
 345 |    "metadata": {
 346 |     "ExecuteTime": {
 347 |      "end_time": "2019-08-08T22:44:23.400878Z",
 348 |      "start_time": "2019-08-08T22:43:44.887710Z"
 349 |     }
 350 |    },
 351 |    "outputs": [
 352 |     {
 353 |      "data": {
 354 |       "text/html": [
 355 |        "Total time: 00:38 <p><table style='width:375px; margin-bottom:10px'>\n",
 356 |        "  <tr>\n",
 357 |        "    <th>epoch</th>\n",
 358 |        "    <th>train_loss</th>\n",
 359 |        "    <th>valid_loss</th>\n",
 360 |        "    <th>exp_rmspe</th>\n",
 361 |        "    <th>time</th>\n",
 362 |        "  </tr>\n",
 363 |        "  <tr>\n",
 364 |        "    <th>0</th>\n",
 365 |        "    <th>0.008030</th>\n",
 366 |        "    <th>0.012363</th>\n",
 367 |        "    <th>0.108429</th>\n",
 368 |        "    <th>00:06</th>\n",
 369 |        "  </tr>\n",
 370 |        "  <tr>\n",
 371 |        "    <th>1</th>\n",
 372 |        "    <th>0.007976</th>\n",
 373 |        "    <th>0.012201</th>\n",
 374 |        "    <th>0.108119</th>\n",
 375 |        "    <th>00:06</th>\n",
 376 |        "  </tr>\n",
 377 |        "  <tr>\n",
 378 |        "    <th>2</th>\n",
 379 |        "    <th>0.007839</th>\n",
 380 |        "    <th>0.012210</th>\n",
 381 |        "    <th>0.107686</th>\n",
 382 |        "    <th>00:06</th>\n",
 383 |        "  </tr>\n",
 384 |        "  <tr>\n",
 385 |        "    <th>3</th>\n",
 386 |        "    <th>0.007839</th>\n",
 387 |        "    <th>0.012034</th>\n",
 388 |        "    <th>0.107568</th>\n",
 389 |        "    <th>00:06</th>\n",
 390 |        "  </tr>\n",
 391 |        "  <tr>\n",
 392 |        "    <th>4</th>\n",
 393 |        "    <th>0.007604</th>\n",
 394 |        "    <th>0.012183</th>\n",
 395 |        "    <th>0.108370</th>\n",
 396 |        "    <th>00:06</th>\n",
 397 |        "  </tr>\n",
 398 |        "  <tr>\n",
 399 |        "    <th>5</th>\n",
 400 |        "    <th>0.007520</th>\n",
 401 |        "    <th>0.012203</th>\n",
 402 |        "    <th>0.108599</th>\n",
 403 |        "    <th>00:06</th>\n",
 404 |        "  </tr>\n",
 405 |        "</table>\n"
 406 |       ],
 407 |       "text/plain": [
 408 |        "<IPython.core.display.HTML object>"
 409 |       ]
 410 |      },
 411 |      "metadata": {},
 412 |      "output_type": "display_data"
 413 |     }
 414 |    ],
 415 |    "source": [
 416 |     "learn.fit_one_cycle(6, 1e-4, wd=0.2)"
 417 |    ]
 418 |   },
 419 |   {
 420 |    "cell_type": "markdown",
 421 |    "metadata": {},
 422 |    "source": [
 423 |     "### Santity test"
 424 |    ]
 425 |   },
 426 |   {
 427 |    "cell_type": "markdown",
 428 |    "metadata": {},
 429 |    "source": [
 430 |     "Here we try to separate embeddings from the model. First of all we preprocess the data (normalize, categorize and fill missing if needed) Then we take a model and feed it all our data (train and valid in separate dataframes) to embedding layers only. Then we concat these values with cont values. So now we have a bunch of floats for each row of data. This is what our NN (apart from embeddings) really gets as input. Our last step is to pretend that these floats are just a bunch of cont values and try to teach NN in a normal way (without preprocessing (!)) If we will get the similar results as in normal training, then our methon does work and we can think of a mixup."
 431 |    ]
 432 |   },
 433 |   {
 434 |    "cell_type": "markdown",
 435 |    "metadata": {},
 436 |    "source": [
 437 |     "By the way we already have a function that makes all the preprocess and outputs the 'real model input'. I've made it for Random Forrest with embedding case (RF vs NN) in https://github.com/Pak911/fastai-shared-notebooks/blob/master/interpret_tabular.ipynb"
 438 |    ]
 439 |   },
 440 |   {
 441 |    "cell_type": "code",
 442 |    "execution_count": 57,
 443 |    "metadata": {
 444 |     "ExecuteTime": {
 445 |      "end_time": "2019-08-08T22:57:43.262470Z",
 446 |      "start_time": "2019-08-08T22:57:43.183749Z"
 447 |     }
 448 |    },
 449 |    "outputs": [],
 450 |    "source": [
 451 |     "ln = len(df)\n",
 452 |     "train_idx = list_diff(list1=range(ln), list2=valid_idx)"
 453 |    ]
 454 |   },
 455 |   {
 456 |    "cell_type": "code",
 457 |    "execution_count": 58,
 458 |    "metadata": {
 459 |     "ExecuteTime": {
 460 |      "end_time": "2019-08-08T22:57:44.027688Z",
 461 |      "start_time": "2019-08-08T22:57:43.924000Z"
 462 |     }
 463 |    },
 464 |    "outputs": [],
 465 |    "source": [
 466 |     "tr_df = df.iloc[train_idx]\n",
 467 |     "val_df = df.iloc[valid_idx]"
 468 |    ]
 469 |   },
 470 |   {
 471 |    "cell_type": "code",
 472 |    "execution_count": 59,
 473 |    "metadata": {
 474 |     "ExecuteTime": {
 475 |      "end_time": "2019-08-08T22:57:58.953878Z",
 476 |      "start_time": "2019-08-08T22:57:57.487145Z"
 477 |     }
 478 |    },
 479 |    "outputs": [],
 480 |    "source": [
 481 |     "tr_data_inner = to_np(get_inner_repr(df=tr_df[all_vars], learn=learn))"
 482 |    ]
 483 |   },
 484 |   {
 485 |    "cell_type": "code",
 486 |    "execution_count": 60,
 487 |    "metadata": {
 488 |     "ExecuteTime": {
 489 |      "end_time": "2019-08-08T22:57:59.118763Z",
 490 |      "start_time": "2019-08-08T22:57:58.956303Z"
 491 |     }
 492 |    },
 493 |    "outputs": [],
 494 |    "source": [
 495 |     "val_data_inner = to_np(get_inner_repr(df=val_df[all_vars], learn=learn))"
 496 |    ]
 497 |   },
 498 |   {
 499 |    "cell_type": "code",
 500 |    "execution_count": 61,
 501 |    "metadata": {
 502 |     "ExecuteTime": {
 503 |      "end_time": "2019-08-08T22:57:59.886874Z",
 504 |      "start_time": "2019-08-08T22:57:59.845032Z"
 505 |     }
 506 |    },
 507 |    "outputs": [
 508 |     {
 509 |      "data": {
 510 |       "text/plain": [
 511 |        "(240858, 12443)"
 512 |       ]
 513 |      },
 514 |      "execution_count": 61,
 515 |      "metadata": {},
 516 |      "output_type": "execute_result"
 517 |     }
 518 |    ],
 519 |    "source": [
 520 |     "len(tr_data_inner), len(val_data_inner)"
 521 |    ]
 522 |   },
 523 |   {
 524 |    "cell_type": "code",
 525 |    "execution_count": 62,
 526 |    "metadata": {
 527 |     "ExecuteTime": {
 528 |      "end_time": "2019-08-08T22:58:04.878227Z",
 529 |      "start_time": "2019-08-08T22:58:04.839808Z"
 530 |     }
 531 |    },
 532 |    "outputs": [
 533 |     {
 534 |      "data": {
 535 |       "text/plain": [
 536 |        "array([-0.041985, -0.018466, -0.071389, -0.03445 , ..., -0.12327 ,  0.193699,  0.361726, -0.061271], dtype=float32)"
 537 |       ]
 538 |      },
 539 |      "execution_count": 62,
 540 |      "metadata": {},
 541 |      "output_type": "execute_result"
 542 |     }
 543 |    ],
 544 |    "source": [
 545 |     "tr_data_inner[0]"
 546 |    ]
 547 |   },
 548 |   {
 549 |    "cell_type": "code",
 550 |    "execution_count": 63,
 551 |    "metadata": {
 552 |     "ExecuteTime": {
 553 |      "end_time": "2019-08-08T22:58:05.967112Z",
 554 |      "start_time": "2019-08-08T22:58:05.937636Z"
 555 |     }
 556 |    },
 557 |    "outputs": [
 558 |     {
 559 |      "data": {
 560 |       "text/plain": [
 561 |        "(233, 233)"
 562 |       ]
 563 |      },
 564 |      "execution_count": 63,
 565 |      "metadata": {},
 566 |      "output_type": "execute_result"
 567 |     }
 568 |    ],
 569 |    "source": [
 570 |     "len(tr_data_inner[0]), len(val_data_inner[0])"
 571 |    ]
 572 |   },
 573 |   {
 574 |    "cell_type": "code",
 575 |    "execution_count": 64,
 576 |    "metadata": {
 577 |     "ExecuteTime": {
 578 |      "end_time": "2019-08-08T22:58:07.301877Z",
 579 |      "start_time": "2019-08-08T22:58:07.273359Z"
 580 |     }
 581 |    },
 582 |    "outputs": [],
 583 |    "source": [
 584 |     "tr_inner_df = pd.DataFrame(tr_data_inner)\n",
 585 |     "val_inner_df = pd.DataFrame(val_data_inner)"
 586 |    ]
 587 |   },
 588 |   {
 589 |    "cell_type": "code",
 590 |    "execution_count": 65,
 591 |    "metadata": {
 592 |     "ExecuteTime": {
 593 |      "end_time": "2019-08-08T22:58:08.046808Z",
 594 |      "start_time": "2019-08-08T22:58:07.964978Z"
 595 |     }
 596 |    },
 597 |    "outputs": [],
 598 |    "source": [
 599 |     "tr_inner_df[dep_var] = tr_df.reset_index()[dep_var]\n",
 600 |     "val_inner_df[dep_var] = val_df.reset_index()[dep_var]"
 601 |    ]
 602 |   },
 603 |   {
 604 |    "cell_type": "code",
 605 |    "execution_count": 66,
 606 |    "metadata": {
 607 |     "ExecuteTime": {
 608 |      "end_time": "2019-08-08T22:58:09.359024Z",
 609 |      "start_time": "2019-08-08T22:58:09.223079Z"
 610 |     }
 611 |    },
 612 |    "outputs": [],
 613 |    "source": [
 614 |     "merge_inner_df = pd.concat([tr_inner_df, val_inner_df])"
 615 |    ]
 616 |   },
 617 |   {
 618 |    "cell_type": "code",
 619 |    "execution_count": 67,
 620 |    "metadata": {
 621 |     "ExecuteTime": {
 622 |      "end_time": "2019-08-08T22:58:09.933757Z",
 623 |      "start_time": "2019-08-08T22:58:09.905949Z"
 624 |     }
 625 |    },
 626 |    "outputs": [],
 627 |    "source": [
 628 |     "inner_val_idx = range(len(tr_inner_df), len(merge_inner_df))"
 629 |    ]
 630 |   },
 631 |   {
 632 |    "cell_type": "code",
 633 |    "execution_count": 68,
 634 |    "metadata": {
 635 |     "ExecuteTime": {
 636 |      "end_time": "2019-08-08T22:58:10.698564Z",
 637 |      "start_time": "2019-08-08T22:58:10.670942Z"
 638 |     }
 639 |    },
 640 |    "outputs": [],
 641 |    "source": [
 642 |     "inner_cont_vars = list_diff(merge_inner_df.columns, [dep_var])"
 643 |    ]
 644 |   },
 645 |   {
 646 |    "cell_type": "code",
 647 |    "execution_count": 69,
 648 |    "metadata": {
 649 |     "ExecuteTime": {
 650 |      "end_time": "2019-08-08T22:58:11.914443Z",
 651 |      "start_time": "2019-08-08T22:58:11.887842Z"
 652 |     }
 653 |    },
 654 |    "outputs": [],
 655 |    "source": [
 656 |     "inner_procs=[]"
 657 |    ]
 658 |   },
 659 |   {
 660 |    "cell_type": "code",
 661 |    "execution_count": 70,
 662 |    "metadata": {
 663 |     "ExecuteTime": {
 664 |      "end_time": "2019-08-08T22:58:14.550660Z",
 665 |      "start_time": "2019-08-08T22:58:12.453987Z"
 666 |     }
 667 |    },
 668 |    "outputs": [],
 669 |    "source": [
 670 |     "inner_data = (TabularList.from_df(merge_inner_df, path=path, cat_names=[], cont_names=inner_cont_vars, procs=inner_procs)\n",
 671 |     "             .split_by_idx(inner_val_idx)\n",
 672 |     "             .label_from_df(cols=dep_var, label_cls=FloatList, log=True)\n",
 673 |     "             .databunch(bs=BS))"
 674 |    ]
 675 |   },
 676 |   {
 677 |    "cell_type": "code",
 678 |    "execution_count": 71,
 679 |    "metadata": {
 680 |     "ExecuteTime": {
 681 |      "end_time": "2019-08-08T22:58:14.666037Z",
 682 |      "start_time": "2019-08-08T22:58:14.552706Z"
 683 |     }
 684 |    },
 685 |    "outputs": [],
 686 |    "source": [
 687 |     "np.random.seed(1001)\n",
 688 |     "inner_learn = tabular_learner(inner_data, layers=[1000,500], ps=[0.001,0.01], emb_drop=0.04, \n",
 689 |     "                        y_range=y_range, metrics=exp_rmspe)"
 690 |    ]
 691 |   },
 692 |   {
 693 |    "cell_type": "code",
 694 |    "execution_count": 72,
 695 |    "metadata": {
 696 |     "ExecuteTime": {
 697 |      "end_time": "2019-08-08T22:58:56.539386Z",
 698 |      "start_time": "2019-08-08T22:58:14.667901Z"
 699 |     }
 700 |    },
 701 |    "outputs": [
 702 |     {
 703 |      "data": {
 704 |       "text/html": [
 705 |        "Total time: 00:41 <p><table style='width:375px; margin-bottom:10px'>\n",
 706 |        "  <tr>\n",
 707 |        "    <th>epoch</th>\n",
 708 |        "    <th>train_loss</th>\n",
 709 |        "    <th>valid_loss</th>\n",
 710 |        "    <th>exp_rmspe</th>\n",
 711 |        "    <th>time</th>\n",
 712 |        "  </tr>\n",
 713 |        "  <tr>\n",
 714 |        "    <th>0</th>\n",
 715 |        "    <th>0.224578</th>\n",
 716 |        "    <th>0.023641</th>\n",
 717 |        "    <th>0.158642</th>\n",
 718 |        "    <th>00:07</th>\n",
 719 |        "  </tr>\n",
 720 |        "  <tr>\n",
 721 |        "    <th>1</th>\n",
 722 |        "    <th>0.019842</th>\n",
 723 |        "    <th>0.031679</th>\n",
 724 |        "    <th>0.186901</th>\n",
 725 |        "    <th>00:06</th>\n",
 726 |        "  </tr>\n",
 727 |        "  <tr>\n",
 728 |        "    <th>2</th>\n",
 729 |        "    <th>0.014821</th>\n",
 730 |        "    <th>0.021796</th>\n",
 731 |        "    <th>0.162090</th>\n",
 732 |        "    <th>00:06</th>\n",
 733 |        "  </tr>\n",
 734 |        "  <tr>\n",
 735 |        "    <th>3</th>\n",
 736 |        "    <th>0.011455</th>\n",
 737 |        "    <th>0.013880</th>\n",
 738 |        "    <th>0.113809</th>\n",
 739 |        "    <th>00:07</th>\n",
 740 |        "  </tr>\n",
 741 |        "  <tr>\n",
 742 |        "    <th>4</th>\n",
 743 |        "    <th>0.009395</th>\n",
 744 |        "    <th>0.012489</th>\n",
 745 |        "    <th>0.108613</th>\n",
 746 |        "    <th>00:07</th>\n",
 747 |        "  </tr>\n",
 748 |        "  <tr>\n",
 749 |        "    <th>5</th>\n",
 750 |        "    <th>0.007642</th>\n",
 751 |        "    <th>0.011904</th>\n",
 752 |        "    <th>0.107223</th>\n",
 753 |        "    <th>00:07</th>\n",
 754 |        "  </tr>\n",
 755 |        "</table>\n"
 756 |       ],
 757 |       "text/plain": [
 758 |        "<IPython.core.display.HTML object>"
 759 |       ]
 760 |      },
 761 |      "metadata": {},
 762 |      "output_type": "display_data"
 763 |     }
 764 |    ],
 765 |    "source": [
 766 |     "inner_learn.fit_one_cycle(6, 1e-2, wd=0.2)"
 767 |    ]
 768 |   },
 769 |   {
 770 |    "cell_type": "code",
 771 |    "execution_count": 73,
 772 |    "metadata": {
 773 |     "ExecuteTime": {
 774 |      "end_time": "2019-08-08T22:59:36.306310Z",
 775 |      "start_time": "2019-08-08T22:58:56.542125Z"
 776 |     }
 777 |    },
 778 |    "outputs": [
 779 |     {
 780 |      "data": {
 781 |       "text/html": [
 782 |        "Total time: 00:39 <p><table style='width:375px; margin-bottom:10px'>\n",
 783 |        "  <tr>\n",
 784 |        "    <th>epoch</th>\n",
 785 |        "    <th>train_loss</th>\n",
 786 |        "    <th>valid_loss</th>\n",
 787 |        "    <th>exp_rmspe</th>\n",
 788 |        "    <th>time</th>\n",
 789 |        "  </tr>\n",
 790 |        "  <tr>\n",
 791 |        "    <th>0</th>\n",
 792 |        "    <th>0.007268</th>\n",
 793 |        "    <th>0.012054</th>\n",
 794 |        "    <th>0.106923</th>\n",
 795 |        "    <th>00:06</th>\n",
 796 |        "  </tr>\n",
 797 |        "  <tr>\n",
 798 |        "    <th>1</th>\n",
 799 |        "    <th>0.007465</th>\n",
 800 |        "    <th>0.012356</th>\n",
 801 |        "    <th>0.107672</th>\n",
 802 |        "    <th>00:06</th>\n",
 803 |        "  </tr>\n",
 804 |        "  <tr>\n",
 805 |        "    <th>2</th>\n",
 806 |        "    <th>0.007291</th>\n",
 807 |        "    <th>0.011856</th>\n",
 808 |        "    <th>0.106594</th>\n",
 809 |        "    <th>00:06</th>\n",
 810 |        "  </tr>\n",
 811 |        "  <tr>\n",
 812 |        "    <th>3</th>\n",
 813 |        "    <th>0.007155</th>\n",
 814 |        "    <th>0.012197</th>\n",
 815 |        "    <th>0.107029</th>\n",
 816 |        "    <th>00:06</th>\n",
 817 |        "  </tr>\n",
 818 |        "  <tr>\n",
 819 |        "    <th>4</th>\n",
 820 |        "    <th>0.006992</th>\n",
 821 |        "    <th>0.012017</th>\n",
 822 |        "    <th>0.106820</th>\n",
 823 |        "    <th>00:07</th>\n",
 824 |        "  </tr>\n",
 825 |        "  <tr>\n",
 826 |        "    <th>5</th>\n",
 827 |        "    <th>0.006967</th>\n",
 828 |        "    <th>0.012135</th>\n",
 829 |        "    <th>0.106943</th>\n",
 830 |        "    <th>00:06</th>\n",
 831 |        "  </tr>\n",
 832 |        "</table>\n"
 833 |       ],
 834 |       "text/plain": [
 835 |        "<IPython.core.display.HTML object>"
 836 |       ]
 837 |      },
 838 |      "metadata": {},
 839 |      "output_type": "display_data"
 840 |     }
 841 |    ],
 842 |    "source": [
 843 |     "inner_learn.fit_one_cycle(6, 1e-4, wd=0.2)"
 844 |    ]
 845 |   },
 846 |   {
 847 |    "cell_type": "markdown",
 848 |    "metadata": {},
 849 |    "source": [
 850 |     "So now we see that this method produce pretty the same result.\n",
 851 |     "\n",
 852 |     "Let's try to incorporate mixup here"
 853 |    ]
 854 |   },
 855 |   {
 856 |    "cell_type": "markdown",
 857 |    "metadata": {},
 858 |    "source": [
 859 |     "### Mixup"
 860 |    ]
 861 |   },
 862 |   {
 863 |    "cell_type": "markdown",
 864 |    "metadata": {},
 865 |    "source": [
 866 |     "And here we just add some interpolation in data (and depended valiable as we have regression here)"
 867 |    ]
 868 |   },
 869 |   {
 870 |    "cell_type": "code",
 871 |    "execution_count": 74,
 872 |    "metadata": {
 873 |     "ExecuteTime": {
 874 |      "end_time": "2019-08-08T22:59:36.340253Z",
 875 |      "start_time": "2019-08-08T22:59:36.309182Z"
 876 |     }
 877 |    },
 878 |    "outputs": [],
 879 |    "source": [
 880 |     "alpha = 0.2"
 881 |    ]
 882 |   },
 883 |   {
 884 |    "cell_type": "code",
 885 |    "execution_count": 75,
 886 |    "metadata": {
 887 |     "ExecuteTime": {
 888 |      "end_time": "2019-08-08T22:59:36.373120Z",
 889 |      "start_time": "2019-08-08T22:59:36.343066Z"
 890 |     }
 891 |    },
 892 |    "outputs": [],
 893 |    "source": [
 894 |     "def interp(var1, var2, alpha):\n",
 895 |     "    lam = np.random.beta(alpha, alpha)\n",
 896 |     "    return lam*var1 + (1.-lam)*var2"
 897 |    ]
 898 |   },
 899 |   {
 900 |    "cell_type": "code",
 901 |    "execution_count": 76,
 902 |    "metadata": {
 903 |     "ExecuteTime": {
 904 |      "end_time": "2019-08-08T22:59:36.400959Z",
 905 |      "start_time": "2019-08-08T22:59:36.374779Z"
 906 |     }
 907 |    },
 908 |    "outputs": [
 909 |     {
 910 |      "data": {
 911 |       "text/plain": [
 912 |        "range(240858, 253301)"
 913 |       ]
 914 |      },
 915 |      "execution_count": 76,
 916 |      "metadata": {},
 917 |      "output_type": "execute_result"
 918 |     }
 919 |    ],
 920 |    "source": [
 921 |     "inner_val_idx"
 922 |    ]
 923 |   },
 924 |   {
 925 |    "cell_type": "code",
 926 |    "execution_count": 77,
 927 |    "metadata": {
 928 |     "ExecuteTime": {
 929 |      "end_time": "2019-08-08T22:59:36.488045Z",
 930 |      "start_time": "2019-08-08T22:59:36.402398Z"
 931 |     }
 932 |    },
 933 |    "outputs": [],
 934 |    "source": [
 935 |     "inner_tr_idx = list_diff(list1=range(len(merge_inner_df)), list2=inner_val_idx)"
 936 |    ]
 937 |   },
 938 |   {
 939 |    "cell_type": "code",
 940 |    "execution_count": 78,
 941 |    "metadata": {
 942 |     "ExecuteTime": {
 943 |      "end_time": "2019-08-08T22:59:37.252769Z",
 944 |      "start_time": "2019-08-08T22:59:36.489737Z"
 945 |     }
 946 |    },
 947 |    "outputs": [],
 948 |    "source": [
 949 |     "np_merge_df = merge_inner_df.iloc[inner_tr_idx].to_numpy()"
 950 |    ]
 951 |   },
 952 |   {
 953 |    "cell_type": "code",
 954 |    "execution_count": 79,
 955 |    "metadata": {
 956 |     "ExecuteTime": {
 957 |      "end_time": "2019-08-08T22:59:37.279645Z",
 958 |      "start_time": "2019-08-08T22:59:37.254797Z"
 959 |     }
 960 |    },
 961 |    "outputs": [],
 962 |    "source": [
 963 |     "augmented = []"
 964 |    ]
 965 |   },
 966 |   {
 967 |    "cell_type": "code",
 968 |    "execution_count": 80,
 969 |    "metadata": {
 970 |     "ExecuteTime": {
 971 |      "end_time": "2019-08-08T22:59:43.325030Z",
 972 |      "start_time": "2019-08-08T22:59:37.281214Z"
 973 |     }
 974 |    },
 975 |    "outputs": [],
 976 |    "source": [
 977 |     "for _ in range(6):\n",
 978 |     "    shfld = np_merge_df.copy()\n",
 979 |     "    np.random.shuffle(shfld)\n",
 980 |     "    augmented.append(pd.DataFrame(interp(shfld, np_merge_df, alpha)))"
 981 |    ]
 982 |   },
 983 |   {
 984 |    "cell_type": "code",
 985 |    "execution_count": 83,
 986 |    "metadata": {
 987 |     "ExecuteTime": {
 988 |      "end_time": "2019-08-08T23:00:40.489800Z",
 989 |      "start_time": "2019-08-08T23:00:40.460802Z"
 990 |     }
 991 |    },
 992 |    "outputs": [],
 993 |    "source": [
 994 |     "del np_merge_df; del shfld"
 995 |    ]
 996 |   },
 997 |   {
 998 |    "cell_type": "code",
 999 |    "execution_count": 84,
1000 |    "metadata": {
1001 |     "ExecuteTime": {
1002 |      "end_time": "2019-08-08T23:00:48.173024Z",
1003 |      "start_time": "2019-08-08T23:00:47.478772Z"
1004 |     }
1005 |    },
1006 |    "outputs": [],
1007 |    "source": [
1008 |     "augmented = pd.concat(augmented)"
1009 |    ]
1010 |   },
1011 |   {
1012 |    "cell_type": "code",
1013 |    "execution_count": 85,
1014 |    "metadata": {
1015 |     "ExecuteTime": {
1016 |      "end_time": "2019-08-08T23:00:54.078941Z",
1017 |      "start_time": "2019-08-08T23:00:49.094286Z"
1018 |     }
1019 |    },
1020 |    "outputs": [],
1021 |    "source": [
1022 |     "augmented.rename(columns={augmented.columns[-1]:dep_var}, inplace = True)"
1023 |    ]
1024 |   },
1025 |   {
1026 |    "cell_type": "code",
1027 |    "execution_count": 86,
1028 |    "metadata": {
1029 |     "ExecuteTime": {
1030 |      "end_time": "2019-08-08T23:00:54.109139Z",
1031 |      "start_time": "2019-08-08T23:00:54.080985Z"
1032 |     }
1033 |    },
1034 |    "outputs": [
1035 |     {
1036 |      "data": {
1037 |       "text/plain": [
1038 |        "1445148"
1039 |       ]
1040 |      },
1041 |      "execution_count": 86,
1042 |      "metadata": {},
1043 |      "output_type": "execute_result"
1044 |     }
1045 |    ],
1046 |    "source": [
1047 |     "len(augmented)"
1048 |    ]
1049 |   },
1050 |   {
1051 |    "cell_type": "code",
1052 |    "execution_count": 87,
1053 |    "metadata": {
1054 |     "ExecuteTime": {
1055 |      "end_time": "2019-08-08T23:00:56.035243Z",
1056 |      "start_time": "2019-08-08T23:00:55.310475Z"
1057 |     }
1058 |    },
1059 |    "outputs": [],
1060 |    "source": [
1061 |     "merge_inner_df = pd.concat([augmented, val_inner_df])"
1062 |    ]
1063 |   },
1064 |   {
1065 |    "cell_type": "code",
1066 |    "execution_count": 88,
1067 |    "metadata": {
1068 |     "ExecuteTime": {
1069 |      "end_time": "2019-08-08T23:00:57.658692Z",
1070 |      "start_time": "2019-08-08T23:00:57.629383Z"
1071 |     }
1072 |    },
1073 |    "outputs": [],
1074 |    "source": [
1075 |     "inner_val_idx = range(len(augmented), len(merge_inner_df))"
1076 |    ]
1077 |   },
1078 |   {
1079 |    "cell_type": "code",
1080 |    "execution_count": 89,
1081 |    "metadata": {
1082 |     "ExecuteTime": {
1083 |      "end_time": "2019-08-08T23:01:00.166661Z",
1084 |      "start_time": "2019-08-08T23:01:00.052413Z"
1085 |     }
1086 |    },
1087 |    "outputs": [],
1088 |    "source": [
1089 |     "del augmented"
1090 |    ]
1091 |   },
1092 |   {
1093 |    "cell_type": "code",
1094 |    "execution_count": 90,
1095 |    "metadata": {
1096 |     "ExecuteTime": {
1097 |      "end_time": "2019-08-08T23:01:03.510495Z",
1098 |      "start_time": "2019-08-08T23:01:03.478078Z"
1099 |     }
1100 |    },
1101 |    "outputs": [],
1102 |    "source": [
1103 |     "inner_cont_vars = list_diff(merge_inner_df.columns, [dep_var])"
1104 |    ]
1105 |   },
1106 |   {
1107 |    "cell_type": "code",
1108 |    "execution_count": 91,
1109 |    "metadata": {
1110 |     "ExecuteTime": {
1111 |      "end_time": "2019-08-08T23:01:26.734526Z",
1112 |      "start_time": "2019-08-08T23:01:06.150737Z"
1113 |     }
1114 |    },
1115 |    "outputs": [],
1116 |    "source": [
1117 |     "inner_data = (TabularList.from_df(merge_inner_df, path=path, cat_names=[], cont_names=inner_cont_vars, procs=inner_procs)\n",
1118 |     "             .split_by_idx(inner_val_idx)\n",
1119 |     "             .label_from_df(cols=dep_var, label_cls=FloatList, log=True)\n",
1120 |     "             .databunch(bs=BS))"
1121 |    ]
1122 |   },
1123 |   {
1124 |    "cell_type": "code",
1125 |    "execution_count": 92,
1126 |    "metadata": {
1127 |     "ExecuteTime": {
1128 |      "end_time": "2019-08-08T23:01:32.282150Z",
1129 |      "start_time": "2019-08-08T23:01:31.918102Z"
1130 |     }
1131 |    },
1132 |    "outputs": [],
1133 |    "source": [
1134 |     "np.random.seed(1001)\n",
1135 |     "inner_learn = tabular_learner(inner_data, layers=[1000,500], ps=[0.001,0.01], emb_drop=0.04, \n",
1136 |     "                        y_range=y_range, metrics=exp_rmspe)"
1137 |    ]
1138 |   },
1139 |   {
1140 |    "cell_type": "code",
1141 |    "execution_count": 93,
1142 |    "metadata": {
1143 |     "ExecuteTime": {
1144 |      "end_time": "2019-08-08T23:05:08.028289Z",
1145 |      "start_time": "2019-08-08T23:01:40.010934Z"
1146 |     }
1147 |    },
1148 |    "outputs": [
1149 |     {
1150 |      "data": {
1151 |       "text/html": [
1152 |        "Total time: 03:27 <p><table style='width:375px; margin-bottom:10px'>\n",
1153 |        "  <tr>\n",
1154 |        "    <th>epoch</th>\n",
1155 |        "    <th>train_loss</th>\n",
1156 |        "    <th>valid_loss</th>\n",
1157 |        "    <th>exp_rmspe</th>\n",
1158 |        "    <th>time</th>\n",
1159 |        "  </tr>\n",
1160 |        "  <tr>\n",
1161 |        "    <th>0</th>\n",
1162 |        "    <th>0.013896</th>\n",
1163 |        "    <th>0.017968</th>\n",
1164 |        "    <th>0.141169</th>\n",
1165 |        "    <th>00:34</th>\n",
1166 |        "  </tr>\n",
1167 |        "  <tr>\n",
1168 |        "    <th>1</th>\n",
1169 |        "    <th>0.012299</th>\n",
1170 |        "    <th>0.015937</th>\n",
1171 |        "    <th>0.120862</th>\n",
1172 |        "    <th>00:35</th>\n",
1173 |        "  </tr>\n",
1174 |        "  <tr>\n",
1175 |        "    <th>2</th>\n",
1176 |        "    <th>0.010756</th>\n",
1177 |        "    <th>0.015844</th>\n",
1178 |        "    <th>0.127601</th>\n",
1179 |        "    <th>00:35</th>\n",
1180 |        "  </tr>\n",
1181 |        "  <tr>\n",
1182 |        "    <th>3</th>\n",
1183 |        "    <th>0.009529</th>\n",
1184 |        "    <th>0.013752</th>\n",
1185 |        "    <th>0.114903</th>\n",
1186 |        "    <th>00:34</th>\n",
1187 |        "  </tr>\n",
1188 |        "  <tr>\n",
1189 |        "    <th>4</th>\n",
1190 |        "    <th>0.006879</th>\n",
1191 |        "    <th>0.011683</th>\n",
1192 |        "    <th>0.109530</th>\n",
1193 |        "    <th>00:34</th>\n",
1194 |        "  </tr>\n",
1195 |        "  <tr>\n",
1196 |        "    <th>5</th>\n",
1197 |        "    <th>0.005538</th>\n",
1198 |        "    <th>0.011651</th>\n",
1199 |        "    <th>0.107221</th>\n",
1200 |        "    <th>00:34</th>\n",
1201 |        "  </tr>\n",
1202 |        "</table>\n"
1203 |       ],
1204 |       "text/plain": [
1205 |        "<IPython.core.display.HTML object>"
1206 |       ]
1207 |      },
1208 |      "metadata": {},
1209 |      "output_type": "display_data"
1210 |     }
1211 |    ],
1212 |    "source": [
1213 |     "inner_learn.fit_one_cycle(6, 1e-2, wd=0.2)"
1214 |    ]
1215 |   },
1216 |   {
1217 |    "cell_type": "code",
1218 |    "execution_count": 94,
1219 |    "metadata": {
1220 |     "ExecuteTime": {
1221 |      "end_time": "2019-08-08T23:08:40.335039Z",
1222 |      "start_time": "2019-08-08T23:05:08.030842Z"
1223 |     }
1224 |    },
1225 |    "outputs": [
1226 |     {
1227 |      "data": {
1228 |       "text/html": [
1229 |        "Total time: 03:32 <p><table style='width:375px; margin-bottom:10px'>\n",
1230 |        "  <tr>\n",
1231 |        "    <th>epoch</th>\n",
1232 |        "    <th>train_loss</th>\n",
1233 |        "    <th>valid_loss</th>\n",
1234 |        "    <th>exp_rmspe</th>\n",
1235 |        "    <th>time</th>\n",
1236 |        "  </tr>\n",
1237 |        "  <tr>\n",
1238 |        "    <th>0</th>\n",
1239 |        "    <th>0.005624</th>\n",
1240 |        "    <th>0.011775</th>\n",
1241 |        "    <th>0.108276</th>\n",
1242 |        "    <th>00:33</th>\n",
1243 |        "  </tr>\n",
1244 |        "  <tr>\n",
1245 |        "    <th>1</th>\n",
1246 |        "    <th>0.005547</th>\n",
1247 |        "    <th>0.011859</th>\n",
1248 |        "    <th>0.108505</th>\n",
1249 |        "    <th>00:38</th>\n",
1250 |        "  </tr>\n",
1251 |        "  <tr>\n",
1252 |        "    <th>2</th>\n",
1253 |        "    <th>0.005325</th>\n",
1254 |        "    <th>0.012078</th>\n",
1255 |        "    <th>0.108924</th>\n",
1256 |        "    <th>00:34</th>\n",
1257 |        "  </tr>\n",
1258 |        "  <tr>\n",
1259 |        "    <th>3</th>\n",
1260 |        "    <th>0.005032</th>\n",
1261 |        "    <th>0.012131</th>\n",
1262 |        "    <th>0.110331</th>\n",
1263 |        "    <th>00:34</th>\n",
1264 |        "  </tr>\n",
1265 |        "  <tr>\n",
1266 |        "    <th>4</th>\n",
1267 |        "    <th>0.005008</th>\n",
1268 |        "    <th>0.012284</th>\n",
1269 |        "    <th>0.110623</th>\n",
1270 |        "    <th>00:35</th>\n",
1271 |        "  </tr>\n",
1272 |        "  <tr>\n",
1273 |        "    <th>5</th>\n",
1274 |        "    <th>0.004999</th>\n",
1275 |        "    <th>0.012265</th>\n",
1276 |        "    <th>0.110361</th>\n",
1277 |        "    <th>00:34</th>\n",
1278 |        "  </tr>\n",
1279 |        "</table>\n"
1280 |       ],
1281 |       "text/plain": [
1282 |        "<IPython.core.display.HTML object>"
1283 |       ]
1284 |      },
1285 |      "metadata": {},
1286 |      "output_type": "display_data"
1287 |     }
1288 |    ],
1289 |    "source": [
1290 |     "inner_learn.fit_one_cycle(6, 1e-4, wd=0.2)"
1291 |    ]
1292 |   },
1293 |   {
1294 |    "cell_type": "markdown",
1295 |    "metadata": {},
1296 |    "source": [
1297 |     "So here we don't see any improvments in terms of validation error :("
1298 |    ]
1299 |   }
1300 |  ],
1301 |  "metadata": {
1302 |   "kernelspec": {
1303 |    "display_name": "Python [conda env:fastai] *",
1304 |    "language": "python",
1305 |    "name": "conda-env-fastai-py"
1306 |   },
1307 |   "language_info": {
1308 |    "codemirror_mode": {
1309 |     "name": "ipython",
1310 |     "version": 3
1311 |    },
1312 |    "file_extension": ".py",
1313 |    "mimetype": "text/x-python",
1314 |    "name": "python",
1315 |    "nbconvert_exporter": "python",
1316 |    "pygments_lexer": "ipython3",
1317 |    "version": "3.6.8"
1318 |   }
1319 |  },
1320 |  "nbformat": 4,
1321 |  "nbformat_minor": 2
1322 | }
1323 | 


--------------------------------------------------------------------------------