├── .gitignore ├── README.md ├── bash └── train-all-cfgs.sh ├── cfgs ├── train-0-notebook.yaml └── train-1.yaml ├── doc ├── imgs │ └── fitgraph.jpg └── tips_tricks │ ├── README.md │ └── vscode_setup.md ├── notebooks ├── eda.ipynb ├── references │ └── optimization-approaches-for-transformers.ipynb └── training.ipynb ├── requirements.txt ├── scripts └── train_model.py └── src ├── __init__.py ├── dataloading ├── __init__.py ├── load_data.py ├── load_datasets.py ├── preprocess.py └── stratify.py ├── models ├── __init__.py └── llm_multiclass.py ├── training ├── __init__.py ├── losses.py ├── metrics.py ├── optimizers.py └── single_fold.py ├── utils.py └── visualization.py /.gitignore: -------------------------------------------------------------------------------- 1 | prod.env 2 | .venv 3 | .vscode 4 | __pycache__/ 5 | .ipynb_checkpoints/ 6 | data/ 7 | hf_download/ 8 | *.pt 9 | *.pickle -------------------------------------------------------------------------------- /README.md: -------------------------------------------------------------------------------- 1 |

2 | 5 | PyTorch Workflow for Large Language Models (LLM) 6 |

7 | 8 |

Utilize this repository for a basic framework to tailor Large Language Models (LLM) with PyTorch. 9 |

10 | 11 |

20 | 21 |

22 | 23 | 24 | 25 | 26 | 27 | 28 |

29 | 30 | # Introduction 31 | This workflow helps you get accustomed to LLM project structure and PyTorch for custom model creation, showcasing a multi-class classification using a public dataset and an LLM model from Hugging Face Hub. 32 | 33 | ### Workflow Advantages 34 | Key advantages of this workflow not commonly found elsewhere include: 35 | - **PyTorch Models**: It employs a custom PyTorch class for LLM fine-tuning, allowing custom layers, activation functions, layer freezing, model heads, loss functions, etc. through a [PyTorch Module](https://pytorch.org/docs/stable/generated/torch.nn.Module.html), unlike typical [HuggingFace Tasks](https://huggingface.co/tasks). 36 | - **Python Modules and Directory Structure**: The organized directory structure supports [Python modules](https://docs.python.org/3/tutorial/modules.html) and config files for versatility, inspired by [Joel Grus' presentation](https://www.youtube.com/watch?v=7jiPeIFXb6U) on Jupyter Notebooks. 37 | - **Configuration Files for Input Parameters**: For script execution via CLI or Cron scheduling, configuration files enable flexible pipeline variations and automated execution. 38 | - **Updated PyTorch and LLM Packages**: This workflow includes recent NLP advancements and open-source software, like the post-2022 release of ChatGPT. 39 | - **Integrated Feature Set**: The repository provides a comprehensive feature set for quick pipeline development and modification. 40 | 41 | **NOTE**: This workflow can be adapted for many PyTorch deep learning applications, not just LLMs. 42 | 43 | 44 | # Getting Started 45 | 46 | To understand this workflow, proceed with the use case in the following order: 47 | 48 | ### [1.) EDA - Jupyter Notebook](./notebooks/eda.ipynb) 49 | Review this [EDA - Jupyter Notebook](./notebooks/eda.ipynb) for a brief exploration of the CFPB data, featuring model features, target distributions, text tokens count, and data reduction. 50 | 51 | ### [2.) Model Training Walkthrough - Jupyter Notebook](https://nbviewer.org/github/mddunlap924/PyTorch-LLM/blob/main/notebooks/training.ipynb) 52 | Use this notebook to train a model via a [single configuration file](./cfgs/train-0-notebook.yaml), with supplementary pre-training tasks and further analysis techniques for model selection. 53 | 54 | ### [3.) Model Training Script - Python Script](./scripts/train_model.py) 55 | This script offers robust long-term training routines across various [configuration files](./cfgs/train-1.yaml) and can be paired with this [bash shell script](./bash/train-all-cfgs.sh) for full automation of model development and experiments, ideal for prolonged runs and allowing your computer to work autonomously. 56 | 57 | 58 | # Generic Workflow 59 | THe Pseudo Code provided below guides this repository and outlines a cross-validation training process using PyTorch. 60 | 61 | ``` 62 | INPUT: YAML config. file 63 | OUTPUT: Model checkpoints, training log 64 | 65 | 1. Load YAML config. 66 | 2. C.V. data Folds 67 | 3. Loop over each data fold: 68 | A.) Training module 69 | * Dataloader with custom preprocessing and collator 70 | * Train a custom PyTorch model 71 | * Standard PyTorch training loop with: save checkpoints, log training metrics, etc. 72 | ``` 73 | 74 | The standard PyTorch training loop, shown below, is used here. Additional modifications are implemented in the training loop to improve model performance and training/inference speed are also implemented. 75 | 76 | ```python 77 | # loop through batches 78 | for (inputs, labels) in data_loader: 79 | 80 | # extract inputs and labels 81 | inputs = inputs.to(device) 82 | labels = labels.to(device) 83 | 84 | # passes and weights update 85 | with torch.set_grad_enabled(True): 86 | 87 | # forward pass 88 | preds = model(inputs) 89 | loss = criterion(preds, labels) 90 | 91 | # backward pass 92 | loss.backward() 93 | 94 | # weights update 95 | optimizer.step() 96 | optimizer.zero_grad() 97 | ``` 98 | 99 | # Use Case 100 | The NLP dataset used here is obtained from [The Consumer Financial Protection Bureau (CFPB)](https://www.consumerfinance.gov/), available on [Kaggle](https://www.kaggle.com/datasets/selener/consumer-complaint-database), featuring consumer complaints about financial providers. 101 | 102 | ### Model Training Objective 103 | We're performing multi-class classification on this dataset, where the five product categories represent the *target* variable, and three *source* variables are used as input for the LLM model. 104 | - **NOTE**: The input variables used in this example include `unstructured text` and `categorical variables`, showcasing how to combine mixed data types for LLM model fine-tuning, while selection of these variables for prediction performance wasn't the primary focus. 105 | 106 | ### Metrics 107 | The classification performance was evaluated using MultiClass: [F1 Score](https://pytorch.org/torcheval/stable/generated/torcheval.metrics.MulticlassF1Score.html#torcheval.metrics.MulticlassF1Score), [Precision](https://pytorch.org/torcheval/stable/generated/torcheval.metrics.MulticlassPrecision.html#torcheval.metrics.MulticlassPrecision), and [Recall](https://pytorch.org/torcheval/stable/generated/torcheval.metrics.MulticlassRecall.html#torcheval.metrics.MulticlassRecall), but other metrics could be used as well. 108 | 109 | 110 | # Deep Learning Techniques 111 | Below are a list of deep learning techniques and tools utilized throughout this repository. 112 | - PyTorch: 113 | - [PyTorch Code structure](https://pytorch.org/tutorials/beginner/basics/intro.html) 114 | - [Datasets and Dataloaders](https://pytorch.org/tutorials/beginner/basics/data_tutorial.html) 115 | - [Custom Collator for Efficient RAM Dynamic Padding](https://huggingface.co/docs/transformers/main/main_classes/data_collator) 116 | - [Loss Functions](https://pytorch.org/docs/stable/nn.html#loss-functions) 117 | - [Learning Rate Schedulers](https://pytorch.org/docs/stable/optim.html#how-to-adjust-learning-rate) 118 | - [Learning Rate Finder](https://github.com/davidtvs/pytorch-lr-finder) 119 | - [Torch Metrics](https://torchmetrics.readthedocs.io/en/latest/) 120 | - [The Unofficial PyTorch Optimization Song](https://www.youtube.com/watch?v=Nutpusq_AFw) 121 | - [Gradient Checkpointing](https://medium.com/geekculture/training-larger-models-over-your-average-gpu-with-gradient-checkpointing-in-pytorch-571b4b5c2068) 122 | - Hugging Face 123 | - [HuggingFace Transformers](https://huggingface.co/docs/transformers/index) 124 | - [Fast Tokenizers](https://huggingface.co/docs/transformers/v4.19.3/en/model_doc/auto#transformers.AutoTokenizer.from_pretrained.use_fast) 125 | - [Padding Truncation](https://huggingface.co/docs/transformers/pad_truncation) 126 | - [HuggingFace Bert](https://huggingface.co/docs/transformers/model_doc/bert) 127 | - [HF Model Card for: bert-base-uncased](https://huggingface.co/bert-base-uncased) 128 | - [Dynamic Padding](https://www.youtube.com/watch?v=7q5NyFT8REg) 129 | - Basics 130 | - [Combining Mixed Data Types](https://mccormickml.com/2021/06/29/combining-categorical-numerical-features-with-bert/) 131 | - [Cross-Validation Training](https://neptune.ai/blog/cross-validation-in-machine-learning-how-to-do-it-right) 132 | - [Visualizing Learning Curves for Model Diagnosis](https://rstudio-conf-2020.github.io/dl-keras-tf/notebooks/learning-curve-diagnostics.nb.html#:~:text=Overfit%20learning%20curves,a%20greater%20number%20of%20parameters.) 133 | 134 | # Issues 135 | This repository is will do its best to be maintained. If you face any issue or want to make improvements please raise an issue or make a Pull Request. :smiley: 136 | 137 | # TODOs 138 | - [ ] [Unit tests](https://docs.python.org/3/library/unittest.html) for Python modules 139 | - [ ] Parameter-Efficient Fine-Tuning [(PEFT)](https://github.com/huggingface/peft) methods (e.g. LoRA or QLoRA) 140 | - [ ] Quantize Transformer Models using [bitsandbytes](https://github.com/TimDettmers/bitsandbytes) 141 | - [ ] [Gradient Accumulation in PyTorch](https://kozodoi.me/blog/20210219/gradient-accumulation#:~:text=Gradient%20accumulation%20modifies%20the%20last,been%20processed%20by%20the%20model.) 142 | 143 | 144 | #### Liked the work? Please give a star! 145 | -------------------------------------------------------------------------------- /bash/train-all-cfgs.sh: -------------------------------------------------------------------------------- 1 | #!/bin/bash 2 | 3 | # Shell script to execute customized model training. 4 | # YAML configurations files are used to control the training pipeline such as datasets, models, hyperparameters, etc. 5 | 6 | cfgfiles=`ls ./cfgs/tune/*.yaml` 7 | for cfgfile in $cfgfiles 8 | do 9 | echo "$(basename "$cfgfile")" 10 | FILENAME="$(basename "$cfgfile")" 11 | python ./src/train_model.py --dir ./cfgs/tune/ --name $FILENAME 12 | done -------------------------------------------------------------------------------- /cfgs/train-0-notebook.yaml: -------------------------------------------------------------------------------- 1 | # YAML file listing config. parameters 2 | seed: 42 3 | 4 | # Paths 5 | paths: 6 | data: 7 | base_dir: ../data 8 | data: cfpb_partial.csv 9 | debug_data: cfpb_debug.csv 10 | partial: cfpb.csv 11 | save_results: 12 | apply_model: False # Save model weights [boolean: True/False] 13 | apply_metric: True # Save performance metrics [boolean: True/False] 14 | base_dir: ../logs 15 | 16 | # DEBUG [True or False]; if False it will load the debug_data 17 | # Use for pipeline development 18 | debug: False 19 | 20 | # DATA 21 | data_info: 22 | source_fields: 23 | - Consumer complaint narrative 24 | - ZIP code 25 | - Sub-issue 26 | target: Product 27 | 28 | # Stratification Technique 29 | stratify: 30 | technique: stratified_kfold 31 | 32 | # Cross-Validation Folds 33 | cv: 34 | num_folds: 2 35 | val_folds: [1] #[list of integers] (start counting at 1) 36 | 37 | # Preprocessing 38 | preprocessing: 39 | apply_techniques: 40 | - LabelEncoder 41 | LabelEncoder: 42 | fields: 43 | - Product 44 | OneHotEncoder: 45 | fields: 46 | - Product 47 | 48 | # Model and Tokenizer 49 | model_tokenizer: 50 | base_dir: ../hf_download 51 | name: bert-base-uncased 52 | 53 | # Model 54 | model: 55 | freeze: 56 | apply: False 57 | # Number of layers to freeze starting from layer 1 58 | num_layers: 0 59 | mean_pooling: 60 | apply: True 61 | gradient_checkpointing: False 62 | 63 | # Tokenizer 64 | tokenizer: 65 | abbreviations: 66 | - Null 67 | add_special_tokens: True 68 | max_length: 512 69 | padding: True 70 | truncation: True 71 | return_tensors: pt 72 | 73 | # Optimizer 74 | optimizer: 75 | name: AdamW 76 | lr: 77 | max: 1.0E-4 78 | 79 | # Learning Rate Scheduler 80 | lr_scheduler: 81 | name: CosineAnnealingLR 82 | OneCycleLR: 83 | pct_start: 0.1 84 | CosineAnnealingLR: 85 | eta_min: 1.0E-5 86 | 87 | # Tuning 88 | epochs: 30 89 | batch_size: 16 90 | num_workers: 8 91 | eval_metric: 92 | name: loss -------------------------------------------------------------------------------- /cfgs/train-1.yaml: -------------------------------------------------------------------------------- 1 | # YAML file listing config. parameters 2 | 3 | # Paths 4 | paths: 5 | data: 6 | base_dir: ../data 7 | data: cfpb_partial.csv 8 | debug_data: cfpb_debug.csv 9 | partial: cfpb.csv 10 | save_results: 11 | apply_model: False # Save model weights [boolean: True/False] 12 | apply_metric: True # Save performance metrics [boolean: True/False] 13 | base_dir: ../logs 14 | 15 | # DEBUG [True or False]; if False it will load the debug_data 16 | # Use for pipeline development 17 | debug: False 18 | 19 | # DATA 20 | data_info: 21 | source_fields: 22 | - Consumer complaint narrative 23 | - ZIP code 24 | - Sub-issue 25 | target: Product 26 | 27 | # Stratification Technique 28 | stratify: 29 | technique: stratified_kfold 30 | 31 | # Cross-Validation Folds 32 | cv: 33 | num_folds: 5 34 | val_folds: [1, 2] #[list of integers] (start counting at 1) 35 | 36 | # Preprocessing 37 | preprocessing: 38 | apply_techniques: 39 | - LabelEncoder 40 | LabelEncoder: 41 | fields: 42 | - Product 43 | OneHotEncoder: 44 | fields: 45 | - Product 46 | 47 | # Model and Tokenizer 48 | model_tokenizer: 49 | base_dir: ../hf_download 50 | name: bert-base-uncased 51 | 52 | # Model 53 | model: 54 | freeze: 55 | apply: True 56 | # Number of layers to freeze starting from layer 1 57 | num_layers: 10 58 | # Custom LLM Pooling 59 | mean_pooling: 60 | apply: True 61 | # Gradient checkpointing 62 | gradient_checkpointing: False 63 | 64 | # Tokenizer parameters 65 | tokenizer: 66 | abbreviations: 67 | - Null 68 | add_special_tokens: True 69 | max_length: 512 70 | padding: True 71 | truncation: True 72 | return_tensors: pt 73 | 74 | # Optimizer 75 | optimizer: 76 | name: AdamW 77 | lr: 78 | max: 1.0E-4 79 | 80 | # Learning Rate Scheduler 81 | lr_scheduler: 82 | name: CosineAnnealingLR 83 | OneCycleLR: 84 | pct_start: 0.1 85 | CosineAnnealingLR: 86 | eta_min: 1.0E-5 87 | 88 | 89 | # Model Tuning 90 | epochs: 10 91 | batch_size: 16 92 | num_workers: 8 93 | eval_metric: 94 | name: loss 95 | -------------------------------------------------------------------------------- /doc/imgs/fitgraph.jpg: -------------------------------------------------------------------------------- https://raw.githubusercontent.com/mddunlap924/PyTorch-LLM/5c3fcfd608715063ce259a713ec05acbd95cfe31/doc/imgs/fitgraph.jpg -------------------------------------------------------------------------------- /doc/tips_tricks/README.md: -------------------------------------------------------------------------------- 1 | # Introduction 2 | 3 | This directory is used to collect various tips and tricks that are helpful for data science projects. The below are a list of the write-up contained in this directory and a brief description of each. 4 | 5 | - [VSCode Setup](./vscode_setup.md): this describes how the IDE VSCode was setup and used in this project. Environment variables were defined following instructions from official VS Code website. For example, HuggingFace was set to run in offline mode and cache objects at specified locations using VSCode settings. -------------------------------------------------------------------------------- /doc/tips_tricks/vscode_setup.md: -------------------------------------------------------------------------------- 1 | # VSCode Setup 2 | VSCode provides robust setup for projects. Listed below are some of links to relevant VSCode documentation. 3 | - [User and Workspace Settings](https://code.visualstudio.com/docs/getstarted/settings) 4 | - [Environment Variables](https://code.visualstudio.com/docs/python/environments#_environment-variables) 5 | - [Python settings reference](https://code.visualstudio.com/docs/python/settings-reference) 6 | 7 | # HuggingFace Cache Setup and Offline Mode 8 | HuggingFace (HF) can be setup to download pretrained models to specified locations as well as setup to run in offline mode. Please refer to the HF website to read about the [Cache Setup](https://huggingface.co/docs/transformers/installation#cache-setup) and [Offline mode](https://huggingface.co/docs/transformers/installation#offline-mode). 9 | 10 | To implement both the Cache setup and Offline mode the following was added in the project's folder: 11 | ### Step 1. 12 | 13 | Create a `prod.env` file at the same directory level as the `${workspaceFolder}`. Inside this file the following was written: 14 | 15 | ```env 16 | # prod.env - production configuration 17 | 18 | # HF cache setup 19 | TRANSFORMERS_CACHE=/PATH/WHERE/HF/WILL/CACHE/OBJECTS 20 | 21 | # HF offline mode 22 | TRANSFORMERS_OFFLINE=1 23 | 24 | # HF Parallelism 25 | TOKENIZERS_PARALLELISM=True 26 | 27 | # HF No Advisory Warnings 28 | TRANSFORMERS_NO_ADVISORY_WARNINGS=True 29 | ``` 30 | 31 | ### Step 2. 32 | 33 | Inside the `.vscode` folder located at the same directory level as the file from Step 1 open the `settings.json` file. Set the variable `python.envFile` as shown in the below snippet. Additional [Python settings reference](https://code.visualstudio.com/docs/python/settings-reference) can also be setup. 34 | 35 | ```json 36 | "python.envFile": "${workspaceFolder}/prod.env", 37 | ``` -------------------------------------------------------------------------------- /notebooks/eda.ipynb: -------------------------------------------------------------------------------- 1 | { 2 | "cells": [ 3 | { 4 | "cell_type": "markdown", 5 | "metadata": {}, 6 | "source": [ 7 | "# Exploratory Data Analysis (EDA)\n", 8 | "\n", 9 | "This notebook performs a very rudimentary EDA on the original CFPB dataset. The objectives of this notebook are to:\n", 10 | "1. **Introduce the dependent and independent variables** that will be used in the modeling approach.\n", 11 | " - The independent variables will be mixed to showcase how this can be modeling using a custom PyTorch Module. The independent variables will consist of: A) unstructured text field and B) some categorical fields.\n", 12 | "2. **Remove null** values from the dataset for future modeling tasks.\n", 13 | " - This preprocessed dataset will be saved back to disk for use in modeling.\n", 14 | "3. **Save a reduced dataset** which will be used for the debugging feature in pipeline development.\n", 15 | " - This is a trick that can be used to tremendously speed up pipeline/code development.\n", 16 | "4. **Save about 10% of data** to disk for experimenting/working with because the full dataset takes too long to process for demonstrations." 17 | ] 18 | }, 19 | { 20 | "cell_type": "code", 21 | "execution_count": 1, 22 | "metadata": {}, 23 | "outputs": [], 24 | "source": [ 25 | "# Import Libraries\n", 26 | "import os\n", 27 | "import pandas as pd\n", 28 | "import matplotlib.pyplot as plt\n", 29 | "from transformers import AutoTokenizer\n", 30 | "from torch.utils.data import Dataset, DataLoader\n", 31 | "\n", 32 | "# Allow HF tokenizer parallelism\n", 33 | "os.environ['TOKENIZERS_PARALLELISM'] = 'True'" 34 | ] 35 | }, 36 | { 37 | "cell_type": "markdown", 38 | "metadata": {}, 39 | "source": [ 40 | "# User Inputs" 41 | ] 42 | }, 43 | { 44 | "cell_type": "code", 45 | "execution_count": 2, 46 | "metadata": {}, 47 | "outputs": [], 48 | "source": [ 49 | "# Path to Data\n", 50 | "PATHS = {'data': '../data/rows.csv',\n", 51 | " 'hf_cache': os.environ['TRANSFORMERS_CACHE'],\n", 52 | " 'save_processed_data': '../data/cfpb.csv',\n", 53 | " 'save_debug_data': '../data/cfpb_debug.csv',\n", 54 | " 'save_partial_data': '../data/cfpb_partial.csv'}\n", 55 | "\n", 56 | "# Name of the model\n", 57 | "model_name = 'bert-base-uncased'" 58 | ] 59 | }, 60 | { 61 | "cell_type": "markdown", 62 | "metadata": {}, 63 | "source": [ 64 | "# Load Data and Basic EDA\n", 65 | "\n", 66 | "The basic EDA will be to view the number of unique values, remove nulls, and select a few different source fields that could be used to predicting the target variable." 67 | ] 68 | }, 69 | { 70 | "cell_type": "code", 71 | "execution_count": 3, 72 | "metadata": {}, 73 | "outputs": [ 74 | { 75 | "name": "stdout", 76 | "output_type": "stream", 77 | "text": [ 78 | "CFPB Data Shape: (1,282,355, 18)\n" 79 | ] 80 | }, 81 | { 82 | "data": { 83 | "text/html": [ 84 | "

\n", 85 | "\n", 98 | "\n", 99 | " \n", 100 | " \n", 101 | " \n", 102 | " \n", 103 | " \n", 104 | " \n", 105 | " \n", 106 | " \n", 107 | " \n", 108 | " \n", 109 | " \n", 110 | " \n", 111 | " \n", 112 | " \n", 113 | " \n", 114 | " \n", 115 | " \n", 116 | " \n", 117 | " \n", 118 | " \n", 119 | " \n", 120 | " \n", 121 | " \n", 122 | " \n", 123 | " \n", 124 | " \n", 125 | " \n", 126 | " \n", 127 | " \n", 128 | " \n", 129 | " \n", 130 | " \n", 131 | " \n", 132 | " \n", 133 | " \n", 134 | " \n", 135 | " \n", 136 | " \n", 137 | " \n", 138 | " \n", 139 | " \n", 140 | " \n", 141 | " \n", 142 | " \n", 143 | " \n", 144 | " \n", 145 | " \n", 146 | " \n", 147 | " \n", 148 | " \n", 149 | " \n", 150 | " \n", 151 | " \n", 152 | " \n", 153 | " \n", 154 | " \n", 155 | " \n", 156 | " \n", 157 | " \n", 158 | " \n", 159 | " \n", 160 | " \n", 161 | " \n", 162 | " \n", 163 | " \n", 164 | " \n", 165 | " \n", 166 | "

	Date received	Product	Sub-product	Issue	Sub-issue	Consumer complaint narrative	Company public response	Company	State	ZIP code	Tags	Consumer consent provided?	Submitted via	Date sent to company	Company response to consumer	Timely response?	Consumer disputed?	Complaint ID
0	05/10/2019	Checking or savings account	Checking account	Managing an account	Problem using a debit or ATM card	NaN	NaN	NAVY FEDERAL CREDIT UNION	FL	328XX	Older American	NaN	Web	05/10/2019	In progress	Yes	NaN	3238275
1	05/10/2019	Checking or savings account	Other banking product or service	Managing an account	Deposits and withdrawals	NaN	NaN	BOEING EMPLOYEES CREDIT UNION	WA	98204	NaN	NaN	Referral	05/10/2019	Closed with explanation	Yes	NaN	3238228

\n", 167 | "

" 168 | ], 169 | "text/plain": [ 170 | " Date received Product \\\n", 171 | "0 05/10/2019 Checking or savings account \n", 172 | "1 05/10/2019 Checking or savings account \n", 173 | "\n", 174 | " Sub-product Issue \\\n", 175 | "0 Checking account Managing an account \n", 176 | "1 Other banking product or service Managing an account \n", 177 | "\n", 178 | " Sub-issue Consumer complaint narrative \\\n", 179 | "0 Problem using a debit or ATM card NaN \n", 180 | "1 Deposits and withdrawals NaN \n", 181 | "\n", 182 | " Company public response Company State ZIP code \\\n", 183 | "0 NaN NAVY FEDERAL CREDIT UNION FL 328XX \n", 184 | "1 NaN BOEING EMPLOYEES CREDIT UNION WA 98204 \n", 185 | "\n", 186 | " Tags Consumer consent provided? Submitted via \\\n", 187 | "0 Older American NaN Web \n", 188 | "1 NaN NaN Referral \n", 189 | "\n", 190 | " Date sent to company Company response to consumer Timely response? \\\n", 191 | "0 05/10/2019 In progress Yes \n", 192 | "1 05/10/2019 Closed with explanation Yes \n", 193 | "\n", 194 | " Consumer disputed? Complaint ID \n", 195 | "0 NaN 3238275 \n", 196 | "1 NaN 3238228 " 197 | ] 198 | }, 199 | "metadata": {}, 200 | "output_type": "display_data" 201 | } 202 | ], 203 | "source": [ 204 | "# Load Data\n", 205 | "df = pd.read_csv(PATHS['data'], low_memory=False)\n", 206 | "\n", 207 | "# Display data shape and some rows\n", 208 | "print(f'CFPB Data Shape: ({df.shape[0]:,}, {df.shape[1]})')\n", 209 | "display(df.head(2))" 210 | ] 211 | }, 212 | { 213 | "cell_type": "code", 214 | "execution_count": 4, 215 | "metadata": {}, 216 | "outputs": [ 217 | { 218 | "data": { 219 | "text/html": [ 220 | "\n", 222 | "\n", 223 | " \n", 224 | " \n", 225 | " \n", 226 | " \n", 227 | " \n", 228 | " \n", 229 | " \n", 230 | " \n", 231 | " \n", 232 | " \n", 233 | " \n", 234 | " \n", 235 | " \n", 236 | " \n", 237 | " \n", 238 | " \n", 239 | " \n", 240 | " \n", 241 | " \n", 242 | " \n", 243 | " \n", 244 | " \n", 245 | " \n", 246 | " \n", 247 | " \n", 248 | " \n", 249 | " \n", 250 | " \n", 251 | " \n", 252 | " \n", 253 | " \n", 254 | " \n", 255 | " \n", 256 | " \n", 257 | " \n", 258 | " \n", 259 | " \n", 260 | " \n", 261 | " \n", 262 | " \n", 263 | " \n", 264 | " \n", 265 | " \n", 266 | " \n", 267 | " \n", 268 | " \n", 269 | " \n", 270 | " \n", 271 | " \n", 272 | " \n", 273 | " \n", 274 | " \n", 275 | " \n", 276 | " \n", 277 | " \n", 278 | " \n", 279 | " \n", 280 | " \n", 281 | " \n", 282 | " \n", 283 | " \n", 284 | " \n", 285 | " \n", 286 | " \n", 287 | " \n", 288 | " \n", 289 | " \n", 290 | " \n", 291 | " \n", 292 | " \n", 293 | " \n", 294 | " \n", 295 | " \n", 296 | " \n", 297 | " \n", 298 | " \n", 299 | " \n", 300 | " \n", 301 | " \n", 302 | " \n", 303 | "

	unique
Date received	2,717
Product	18
Sub-product	76
Issue	167
Sub-issue	218
Consumer complaint narrative	366,945
Company public response	10
Company	5,275
State	63
ZIP code	22,591
Tags	3
Consumer consent provided?	4
Submitted via	6
Date sent to company	2,666
Company response to consumer	8
Timely response?	2
Consumer disputed?	2
Complaint ID	nan

\n" 304 | ], 305 | "text/plain": [ 306 | "" 307 | ] 308 | }, 309 | "metadata": {}, 310 | "output_type": "display_data" 311 | } 312 | ], 313 | "source": [ 314 | "# Uniques for each field\n", 315 | "tmp = df.describe(include='all').loc['unique', :]\n", 316 | "display(tmp.to_frame().style.format(\"{:,.0f}\"))\n", 317 | "del tmp" 318 | ] 319 | }, 320 | { 321 | "cell_type": "code", 322 | "execution_count": 5, 323 | "metadata": {}, 324 | "outputs": [ 325 | { 326 | "name": "stdout", 327 | "output_type": "stream", 328 | "text": [ 329 | "Number of Non-Nulls in Each Column BEFORE Removing Nulls\n", 330 | "\tConsumer complaint narrative: 383,564\n", 331 | "\tZIP code: 1,167,057\n", 332 | "\tSub-issue: 751,169\n", 333 | "CFPB Data Shape After Removing Nulls:(209,586, 18)\n", 334 | "Number of Non-Nulls in Each Column AFTER Removing Nulls\n", 335 | "\tConsumer complaint narrative: 209,586\n", 336 | "\tZIP code: 209,586\n", 337 | "\tSub-issue: 209,586\n" 338 | ] 339 | } 340 | ], 341 | "source": [ 342 | "# Number of nulls in source fields\n", 343 | "source_fields = ['Consumer complaint narrative',\n", 344 | " 'ZIP code',\n", 345 | " 'Sub-issue']\n", 346 | "target = 'Product'\n", 347 | "print(f'Number of Non-Nulls in Each Column BEFORE Removing Nulls')\n", 348 | "n_rows = len(df)\n", 349 | "for col in source_fields:\n", 350 | " print(f'\\t{col}: {n_rows - df[col].isnull().sum():,}')\n", 351 | "\n", 352 | "# Reduce the dataframe to only non-null consumer complaints\n", 353 | "data = (df.dropna(subset=source_fields)\n", 354 | " .reset_index(drop=True))\n", 355 | "print((f'CFPB Data Shape After Removing Nulls:'\n", 356 | " f'({data.shape[0]:,}, {data.shape[1]})'))\n", 357 | "\n", 358 | "# Number of nulls in source fields AFTER removing Nulls\n", 359 | "print(f'Number of Non-Nulls in Each Column AFTER Removing Nulls')\n", 360 | "n_rows = len(data)\n", 361 | "for col in source_fields:\n", 362 | " print(f'\\t{col}: {n_rows - data[col].isnull().sum():,}')" 363 | ] 364 | }, 365 | { 366 | "cell_type": "code", 367 | "execution_count": 6, 368 | "metadata": {}, 369 | "outputs": [ 370 | { 371 | "name": "stdout", 372 | "output_type": "stream", 373 | "text": [ 374 | "Product\n" 375 | ] 376 | }, 377 | { 378 | "data": { 379 | "text/html": [ 380 | "\n", 382 | "\n", 383 | " \n", 384 | " \n", 385 | " \n", 386 | " \n", 387 | " \n", 388 | " \n", 389 | " \n", 390 | " \n", 391 | " \n", 392 | " \n", 393 | " \n", 394 | " \n", 395 | " \n", 396 | " \n", 397 | " \n", 398 | " \n", 399 | " \n", 400 | " \n", 401 | " \n", 402 | " \n", 403 | " \n", 404 | " \n", 405 | " \n", 406 | " \n", 407 | " \n", 408 | " \n", 409 | " \n", 410 | " \n", 411 | " \n", 412 | " \n", 413 | " \n", 414 | " \n", 415 | " \n", 416 | " \n", 417 | " \n", 418 | " \n", 419 | " \n", 420 | " \n", 421 | " \n", 422 | " \n", 423 | " \n", 424 | " \n", 425 | " \n", 426 | " \n", 427 | "

	count
Product
Credit reporting, credit repair services, or other personal consumer reports	71,813
Debt collection	66,702
Credit reporting	24,524
Credit card or prepaid card	15,992
Student loan	15,846
Checking or savings account	10,130
Vehicle loan or lease	4,387
Payday loan, title loan, or personal loan	192

\n" 428 | ], 429 | "text/plain": [ 430 | "" 431 | ] 432 | }, 433 | "metadata": {}, 434 | "output_type": "display_data" 435 | } 436 | ], 437 | "source": [ 438 | "# Value counts for the target 'Product'\n", 439 | "for col in [target]:\n", 440 | " print(col)\n", 441 | " tmp = data[col].value_counts().to_frame().style.format(\"{:,.0f}\")\n", 442 | " display(tmp)\n", 443 | " del tmp" 444 | ] 445 | }, 446 | { 447 | "cell_type": "code", 448 | "execution_count": 7, 449 | "metadata": {}, 450 | "outputs": [ 451 | { 452 | "name": "stdout", 453 | "output_type": "stream", 454 | "text": [ 455 | "CFPB Data Shape: (127,451, 18)\n" 456 | ] 457 | }, 458 | { 459 | "data": { 460 | "text/plain": [ 461 | "Product\n", 462 | "Debt collection 66702\n", 463 | "Credit reporting 24524\n", 464 | "Credit card or prepaid card 15992\n", 465 | "Student loan 15846\n", 466 | "Vehicle loan or lease 4387\n", 467 | "Name: count, dtype: int64" 468 | ] 469 | }, 470 | "metadata": {}, 471 | "output_type": "display_data" 472 | } 473 | ], 474 | "source": [ 475 | "# https://esource.dbs.ie/bitstream/handle/10788/4224/msc_shivaprasad_vm_2020.pdf?sequence=1&isAllowed=y\n", 476 | "# Reduce the \"Product\" categories for quicker processing\n", 477 | "keep_products = ['Debt collection',\n", 478 | " 'Credit reporting',\n", 479 | " 'Credit card or prepaid card',\n", 480 | " 'Student loan',\n", 481 | " 'Vehicle loan or lease',\n", 482 | " ]\n", 483 | "data = data[data['Product'].isin(keep_products)].reset_index(drop=True)\n", 484 | "print(f'CFPB Data Shape: ({data.shape[0]:,}, {data.shape[1]})')\n", 485 | "display(data['Product'].value_counts())" 486 | ] 487 | }, 488 | { 489 | "cell_type": "markdown", 490 | "metadata": {}, 491 | "source": [ 492 | "# Number of Tokens Distribution\n", 493 | "\n", 494 | "The field `Consumer complaint narrative` is the unstructured text source field that will be used to predict the target variable. The `bert-base-uncased` model used in this example only allows for a maximum of 512 tokens. Text past this point will be truncated. There are other methods (e.g., sliding windows) that can handle longer text but will not be implemented in this repository. Therefore, we can check the distribution of the number tokens for this field. " 495 | ] 496 | }, 497 | { 498 | "cell_type": "code", 499 | "execution_count": 8, 500 | "metadata": {}, 501 | "outputs": [ 502 | { 503 | "name": "stdout", 504 | "output_type": "stream", 505 | "text": [ 506 | "{\n", 507 | " \"architectures\": [\n", 508 | " \"BertForMaskedLM\"\n", 509 | " ],\n", 510 | " \"attention_probs_dropout_prob\": 0.1,\n", 511 | " \"gradient_checkpointing\": false,\n", 512 | " \"hidden_act\": \"gelu\",\n", 513 | " \"hidden_dropout_prob\": 0.1,\n", 514 | " \"hidden_size\": 768,\n", 515 | " \"initializer_range\": 0.02,\n", 516 | " \"intermediate_size\": 3072,\n", 517 | " \"layer_norm_eps\": 1e-12,\n", 518 | " \"max_position_embeddings\": 512,\n", 519 | " \"model_type\": \"bert\",\n", 520 | " \"num_attention_heads\": 12,\n", 521 | " \"num_hidden_layers\": 12,\n", 522 | " \"pad_token_id\": 0,\n", 523 | " \"position_embedding_type\": \"absolute\",\n", 524 | " \"transformers_version\": \"4.6.0.dev0\",\n", 525 | " \"type_vocab_size\": 2,\n", 526 | " \"use_cache\": true,\n", 527 | " \"vocab_size\": 30522\n", 528 | "}\n" 529 | ] 530 | }, 531 | { 532 | "data": { 533 | "text/plain": [ 534 | "0" 535 | ] 536 | }, 537 | "execution_count": 8, 538 | "metadata": {}, 539 | "output_type": "execute_result" 540 | } 541 | ], 542 | "source": [ 543 | "# Load the tokenizer\n", 544 | "tokenizer = AutoTokenizer.from_pretrained(f'{PATHS[\"hf_cache\"]}/'\n", 545 | " f'{model_name}')\n", 546 | "\n", 547 | "# View the Model configuration JSON\n", 548 | "os.system(f'cat {PATHS[\"hf_cache\"]}/{model_name}/config.json')" 549 | ] 550 | }, 551 | { 552 | "cell_type": "markdown", 553 | "metadata": {}, 554 | "source": [ 555 | "In the above cell the `max_position_embeddings=512` parameter for the BERT model means BERT can only take input sequences up to 512 tokens in length. There are solutions for handling longer text as discussed in this article by [Salt Data Labs](https://www.saltdatalabs.com/blog/bert-how-to-handle-long-documents#:~:text=However%2C%20BERT%20can%20only%20take,much%20longer%20than%20512%20words.).\n", 556 | "\n", 557 | "A few observations about the below cell:\n", 558 | "- To speedup calculations the Torch Dataset and DataLoader modules will be used which allows for multi-core processing using parameter `num_workers`. This provides over an ~8X speed up on my computer versus using a simple pandas.apply() function call (i.e., single core use).\n", 559 | "- Notice how the Torch Dataset and DataLoader modules can be modified to create custom solutions; like in the example below they are being used to count the number of tokens in the field `Consumer complaint narrative`." 560 | ] 561 | }, 562 | { 563 | "cell_type": "code", 564 | "execution_count": 9, 565 | "metadata": {}, 566 | "outputs": [ 567 | { 568 | "name": "stdout", 569 | "output_type": "stream", 570 | "text": [ 571 | "Number of token distribution:\n" 572 | ] 573 | }, 574 | { 575 | "data": { 576 | "text/plain": [ 577 | "count 127451.000000\n", 578 | "mean 223.945312\n", 579 | "std 249.286584\n", 580 | "min 4.000000\n", 581 | "25% 81.000000\n", 582 | "50% 152.000000\n", 583 | "75% 281.000000\n", 584 | "max 8756.000000\n", 585 | "Name: num_tokens, dtype: float64" 586 | ] 587 | }, 588 | "metadata": {}, 589 | "output_type": "display_data" 590 | }, 591 | { 592 | "data": { 593 | "image/png": "iVBORw0KGgoAAAANSUhEUgAAAlUAAAGdCAYAAAA7VYb2AAAAOXRFWHRTb2Z0d2FyZQBNYXRwbG90bGliIHZlcnNpb24zLjcuMiwgaHR0cHM6Ly9tYXRwbG90bGliLm9yZy8pXeV/AAAACXBIWXMAAA9hAAAPYQGoP6dpAAAwVklEQVR4nO3dfVRVdb7H8Q8P8qB5wIc4yIjKpPkQpimGqHVvV66U1M2HmaVGZcbkVFAqlmEPZNMDpldHzZKaKbWVpnlvOaZFMVhaSaioKRbYg42WHrRBOEqJyNn3jxb7egYrxZ/BwfdrrbNWZ/++Z+/v3r+WfNY+e+/jZ1mWJQAAAJwT/8ZuAAAAoDkgVAEAABhAqAIAADCAUAUAAGAAoQoAAMAAQhUAAIABhCoAAAADCFUAAAAGBDZ2AxcSj8ejAwcOqHXr1vLz82vsdgAAwBmwLEtHjx5VVFSU/P1/+nwUoepXdODAAUVHRzd2GwAAoAH279+vjh07/uQ4oepX1Lp1a0k/TorD4WjkbgAAwJlwu92Kjo62/47/FELVr6juKz+Hw0GoAgDAx/zSpTtcqA4AAGAAoQoAAMAAQhUAAIABhCoAAAADCFUAAAAGEKoAAAAMIFQBAAAYQKgCAAAwgFAFAABgAKEKAADAAEIVAACAAYQqAAAAAwhVAAAABhCqAAAADAhs7AZgRpfMdUbW8/XMZCPrAQDgQsOZKgAAAAMIVQAAAAYQqgAAAAwgVAEAABhAqAIAADCAUAUAAGAAoQoAAMAAQhUAAIABhCoAAAADCFUAAAAGEKoAAAAMIFQBAAAYQKgCAAAwoFFD1caNG3XDDTcoKipKfn5+Wr16tde4ZVnKyspShw4dFBoaqsTERH3++edeNeXl5UpJSZHD4VB4eLhSU1N17Ngxr5qdO3fqqquuUkhIiKKjozVr1qx6vaxatUo9evRQSEiIevfurbfeeuusewEAABeuRg1VVVVV6tOnj5599tnTjs+aNUsLFixQTk6OCgsL1apVKyUlJen48eN2TUpKinbv3q28vDytXbtWGzdu1MSJE+1xt9utYcOGqXPnzioqKtLs2bM1Y8YMvfDCC3bNpk2bNG7cOKWmpmr79u0aMWKERowYoeLi4rPqBQAAXLj8LMuyGrsJSfLz89Mbb7yhESNGSPrxzFBUVJSmTp2q++67T5JUWVkpp9OpJUuWaOzYsfrss8/Uq1cvbdmyRXFxcZKk3NxcDR8+XN98842ioqK0aNEiPfTQQ3K5XAoKCpIkZWZmavXq1SopKZEkjRkzRlVVVVq7dq3dz8CBA9W3b1/l5OScUS9nwu12KywsTJWVlXI4HEaOW50umeuMrOfrmclG1gMAQHNxpn+/m+w1VXv37pXL5VJiYqK9LCwsTPHx8SooKJAkFRQUKDw83A5UkpSYmCh/f38VFhbaNVdffbUdqCQpKSlJpaWlOnLkiF1z6nbqauq2cya9nE51dbXcbrfXCwAANE9NNlS5XC5JktPp9FrudDrtMZfLpYiICK/xwMBAtW3b1qvmdOs4dRs/VXPq+C/1cjrZ2dkKCwuzX9HR0b+w1wAAwFc12VDVHEyfPl2VlZX2a//+/Y3dEgAAOE+abKiKjIyUJJWVlXktLysrs8ciIyN16NAhr/GTJ0+qvLzcq+Z06zh1Gz9Vc+r4L/VyOsHBwXI4HF4vAADQPDXZUBUTE6PIyEjl5+fby9xutwoLC5WQkCBJSkhIUEVFhYqKiuya9evXy+PxKD4+3q7ZuHGjampq7Jq8vDx1795dbdq0sWtO3U5dTd12zqQXAABwYWvUUHXs2DHt2LFDO3bskPTjBeE7duzQvn375Ofnp8mTJ+uJJ57QmjVrtGvXLt16662Kioqy7xDs2bOnrr32Wt1xxx3avHmzPvroI6Wnp2vs2LGKioqSJN10000KCgpSamqqdu/erZUrV2r+/PnKyMiw+5g0aZJyc3M1Z84clZSUaMaMGdq6davS09Ml6Yx6AQAAF7bAxtz41q1bdc0119jv64LO+PHjtWTJEk2bNk1VVVWaOHGiKioqNGTIEOXm5iokJMT+zLJly5Senq6hQ4fK399fo0eP1oIFC+zxsLAwvfvuu0pLS1P//v3Vvn17ZWVleT3LatCgQVq+fLkefvhhPfjgg+rWrZtWr16t2NhYu+ZMegEAABeuJvOcqgsBz6kCAMD3+PxzqgAAAHwJoQoAAMAAQhUAAIABhCoAAAADCFUAAAAGEKoAAAAMIFQBAAAYQKgCAAAwgFAFAABgAKEKAADAAEIVAACAAYQqAAAAAwhVAAAABhCqAAAADCBUAQAAGECoAgAAMIBQBQAAYAChCgAAwABCFQAAgAGEKgAAAAMIVQAAAAYQqgAAAAwgVAEAABhAqAIAADCAUAUAAGAAoQoAAMAAQhUAAIABhCoAAAADCFUAAAAGEKoAAAAMIFQBAAAYQKgCAAAwgFAFAABgAKEKAADAAEIVAACAAYQqAAAAAwhVAAAABhCqAAAADCBUAQAAGECoAgAAMIBQBQAAYAChCgAAwABCFQAAgAGEKgAAAAMIVQAAAAYQqgAAAAwgVAEAABhAqAIAADCAUAUAAGAAoQoAAMAAQhUAAIABhCoAAAADCFUAAAAGEKoAAAAMIFQBAAAY0KRDVW1trR555BHFxMQoNDRUl1xyiR5//HFZlmXXWJalrKwsdejQQaGhoUpMTNTnn3/utZ7y8nKlpKTI4XAoPDxcqampOnbsmFfNzp07ddVVVykkJETR0dGaNWtWvX5WrVqlHj16KCQkRL1799Zbb711fnYcAAD4nCYdqp5++mktWrRICxcu1Geffaann35as2bN0jPPPGPXzJo1SwsWLFBOTo4KCwvVqlUrJSUl6fjx43ZNSkqKdu/erby8PK1du1YbN27UxIkT7XG3261hw4apc+fOKioq0uzZszVjxgy98MILds2mTZs0btw4paamavv27RoxYoRGjBih4uLiX+dgAACAJs3POvW0TxNz/fXXy+l06sUXX7SXjR49WqGhoXrllVdkWZaioqI0depU3XfffZKkyspKOZ1OLVmyRGPHjtVnn32mXr16acuWLYqLi5Mk5ebmavjw4frmm28UFRWlRYsW6aGHHpLL5VJQUJAkKTMzU6tXr1ZJSYkkacyYMaqqqtLatWvtXgYOHKi+ffsqJyfnjPbH7XYrLCxMlZWVcjgcRo5RnS6Z64ys5+uZyUbWAwBAc3Gmf7+b9JmqQYMGKT8/X3v27JEkffLJJ/rwww913XXXSZL27t0rl8ulxMRE+zNhYWGKj49XQUGBJKmgoEDh4eF2oJKkxMRE+fv7q7Cw0K65+uqr7UAlSUlJSSotLdWRI0fsmlO3U1dTtx0AAHBhC2zsBn5OZmam3G63evTooYCAANXW1urJJ59USkqKJMnlckmSnE6n1+ecTqc95nK5FBER4TUeGBiotm3betXExMTUW0fdWJs2beRyuX52O6dTXV2t6upq+73b7T7jfQcAAL6lSZ+peu2117Rs2TItX75c27Zt09KlS/Xf//3fWrp0aWO3dkays7MVFhZmv6Kjoxu7JQAAcJ406VB1//33KzMzU2PHjlXv3r11yy23aMqUKcrOzpYkRUZGSpLKysq8PldWVmaPRUZG6tChQ17jJ0+eVHl5uVfN6dZx6jZ+qqZu/HSmT5+uyspK+7V///6z2n8AAOA7mnSo+v777+Xv791iQECAPB6PJCkmJkaRkZHKz8+3x91utwoLC5WQkCBJSkhIUEVFhYqKiuya9evXy+PxKD4+3q7ZuHGjampq7Jq8vDx1795dbdq0sWtO3U5dTd12Tic4OFgOh8PrBQAAmqcmHapuuOEGPfnkk1q3bp2+/vprvfHGG5o7d65GjhwpSfLz89PkyZP1xBNPaM2aNdq1a5duvfVWRUVFacSIEZKknj176tprr9Udd9yhzZs366OPPlJ6errGjh2rqKgoSdJNN92koKAgpaamavfu3Vq5cqXmz5+vjIwMu5dJkyYpNzdXc+bMUUlJiWbMmKGtW7cqPT39Vz8uAACg6WnSF6o/88wzeuSRR3T33Xfr0KFDioqK0h//+EdlZWXZNdOmTVNVVZUmTpyoiooKDRkyRLm5uQoJCbFrli1bpvT0dA0dOlT+/v4aPXq0FixYYI+HhYXp3XffVVpamvr376/27dsrKyvL61lWgwYN0vLly/Xwww/rwQcfVLdu3bR69WrFxsb+OgcDAAA0aU36OVXNDc+pAgDA9zSL51QBAAD4CkIVAACAAYQqAAAAAwhVAAAABhCqAAAADCBUAQAAGECoAgAAMIBQBQAAYAChCgAAwABCFQAAgAGEKgAAAAMIVQAAAAYQqgAAAAwgVAEAABhAqAIAADCAUAUAAGAAoQoAAMAAQhUAAIABhCoAAAADCFUAAAAGEKoAAAAMIFQBAAAYQKgCAAAwgFAFAABgAKEKAADAAEIVAACAAYQqAAAAAwhVAAAABhCqAAAADCBUAQAAGECoAgAAMIBQBQAAYAChCgAAwABCFQAAgAGEKgAAAAMIVQAAAAYQqgAAAAwgVAEAABhAqAIAADCAUAUAAGAAoQoAAMAAQhUAAIABhCoAAAADCFUAAAAGNChUffXVV6b7AAAA8GkNClVdu3bVNddco1deeUXHjx833RMAAIDPaVCo2rZtmy6//HJlZGQoMjJSf/zjH7V582bTvQEAAPiMBoWqvn37av78+Tpw4IBeeuklHTx4UEOGDFFsbKzmzp2rw4cPm+4TAACgSTunC9UDAwM1atQorVq1Sk8//bS++OIL3XfffYqOjtatt96qgwcPmuoTAACgSTunULV161bdfffd6tChg+bOnav77rtPX375pfLy8nTgwAHdeOONpvoEAABo0gIb8qG5c+dq8eLFKi0t1fDhw/Xyyy9r+PDh8vf/MaPFxMRoyZIl6tKli8leAQAAmqwGhapFixbp9ttv12233aYOHTqctiYiIkIvvvjiOTUHAADgKxoUqj7//PNfrAkKCtL48eMbsnoAAACf06BrqhYvXqxVq1bVW75q1SotXbr0nJsCAADwNQ0KVdnZ2Wrfvn295REREXrqqafOuSkAAABf06BQtW/fPsXExNRb3rlzZ+3bt++cmwIAAPA1DQpVERER2rlzZ73ln3zyidq1a3fOTZ3q22+/1c0336x27dopNDRUvXv31tatW+1xy7KUlZWlDh06KDQ0VImJifWu+SovL1dKSoocDofCw8OVmpqqY8eOedXs3LlTV111lUJCQhQdHa1Zs2bV62XVqlXq0aOHQkJC1Lt3b7311ltG9xUAAPiuBoWqcePG6d5779V7772n2tpa1dbWav369Zo0aZLGjh1rrLkjR45o8ODBatGihd5++219+umnmjNnjtq0aWPXzJo1SwsWLFBOTo4KCwvVqlUrJSUlef0mYUpKinbv3q28vDytXbtWGzdu1MSJE+1xt9utYcOGqXPnzioqKtLs2bM1Y8YMvfDCC3bNpk2bNG7cOKWmpmr79u0aMWKERowYoeLiYmP7CwAAfJefZVnW2X7oxIkTuuWWW7Rq1SoFBv54A6HH49Gtt96qnJwcBQUFGWkuMzNTH330kT744IPTjluWpaioKE2dOlX33XefJKmyslJOp1NLlizR2LFj9dlnn6lXr17asmWL4uLiJEm5ubkaPny4vvnmG0VFRWnRokV66KGH5HK57N4zMzO1evVqlZSUSJLGjBmjqqoqrV271t7+wIED1bdvX+Xk5JzR/rjdboWFhamyslIOh6PBx+V0umSuM7Ker2cmG1kPAADNxZn+/W7QmaqgoCCtXLlSJSUlWrZsmV5//XV9+eWXeumll4wFKklas2aN4uLi9Pvf/14RERG64oor9Je//MUe37t3r1wulxITE+1lYWFhio+PV0FBgSSpoKBA4eHhdqCSpMTERPn7+6uwsNCuufrqq716T0pKUmlpqY4cOWLXnLqdupq67QAAgAtbg55TVefSSy/VpZdeaqqXer766istWrRIGRkZevDBB7Vlyxbde++99jOwXC6XJMnpdHp9zul02mMul0sRERFe44GBgWrbtq1Xzb9eeF+3TpfLpTZt2sjlcv3sdk6nurpa1dXV9nu32302uw8AAHxIg0JVbW2tlixZovz8fB06dEgej8drfP369Uaa83g8iouLsx/TcMUVV6i4uFg5OTk+8WDR7OxsPfbYY43dBgAA+BU06Ou/SZMmadKkSaqtrVVsbKz69Onj9TKlQ4cO6tWrl9eynj172o9tiIyMlCSVlZV51ZSVldljkZGROnTokNf4yZMnVV5e7lVzunWcuo2fqqkbP53p06ersrLSfu3fv/+XdxoAAPikBp2pWrFihV577TUNHz7cdD9eBg8erNLSUq9le/bsUefOnSX9+MPNkZGRys/PV9++fSX9+BVbYWGh7rrrLklSQkKCKioqVFRUpP79+0v68Uyax+NRfHy8XfPQQw+ppqZGLVq0kCTl5eWpe/fu9p2GCQkJys/P1+TJk+1e8vLylJCQ8JP9BwcHKzg4+NwPBAAAaPIafKF6165dTfdSz5QpU/Txxx/rqaee0hdffKHly5frhRdeUFpamiTJz89PkydP1hNPPKE1a9Zo165duvXWWxUVFaURI0ZI+vHM1rXXXqs77rhDmzdv1kcffaT09HSNHTtWUVFRkqSbbrpJQUFBSk1N1e7du7Vy5UrNnz9fGRkZdi+TJk1Sbm6u5syZo5KSEs2YMUNbt25Venr6eT8OAACg6WtQqJo6darmz5+vBjyN4awMGDBAb7zxhl599VXFxsbq8ccf17x585SSkmLXTJs2Tffcc48mTpyoAQMG6NixY8rNzVVISIhds2zZMvXo0UNDhw7V8OHDNWTIEK9nUIWFhendd9/V3r171b9/f02dOlVZWVlez7IaNGiQHer69Omj//mf/9Hq1asVGxt7Xo8BAADwDQ16TtXIkSP13nvvqW3btrrsssvsr8zqvP7668YabE54ThUAAL7nTP9+N+iaqvDwcI0cObLBzQEAADQ3DQpVixcvNt0HAACAT2vQNVXSj48l+Pvf/67nn39eR48elSQdOHCg3g8VAwAAXAgadKbqH//4h6699lrt27dP1dXV+s///E+1bt1aTz/9tKqrq8/4t/AAAACaiwY//DMuLk5HjhxRaGiovXzkyJHKz8831hwAAICvaNCZqg8++ECbNm2q9+PJXbp00bfffmukMQAAAF/SoDNVHo9HtbW19ZZ/8803at269Tk3BQAA4GsaFKqGDRumefPm2e/9/Px07NgxPfroo+f9p2sAAACaogZ9/TdnzhwlJSWpV69eOn78uG666SZ9/vnnat++vV599VXTPQIAADR5DQpVHTt21CeffKIVK1Zo586dOnbsmFJTU5WSkuJ14ToAAMCFokGhSpICAwN18803m+wFAADAZzUoVL388ss/O37rrbc2qBkAAABf1aBQNWnSJK/3NTU1+v777xUUFKSWLVsSqgAAwAWnQXf/HTlyxOt17NgxlZaWasiQIVyoDgAALkgN/u2/f9WtWzfNnDmz3lksAACAC4GxUCX9ePH6gQMHTK4SAADAJzTomqo1a9Z4vbcsSwcPHtTChQs1ePBgI40BAAD4kgaFqhEjRni99/Pz08UXX6z/+I//0Jw5c0z0BQAA4FMaFKo8Ho/pPgAAAHya0WuqAAAALlQNOlOVkZFxxrVz585tyCYAAAB8SoNC1fbt27V9+3bV1NSoe/fukqQ9e/YoICBA/fr1s+v8/PzMdAkAANDENShU3XDDDWrdurWWLl2qNm3aSPrxgaATJkzQVVddpalTpxptEgAAoKlr0DVVc+bMUXZ2th2oJKlNmzZ64oknuPsPAABckBoUqtxutw4fPlxv+eHDh3X06NFzbgoAAMDXNChUjRw5UhMmTNDrr7+ub775Rt98843+93//V6mpqRo1apTpHgEAAJq8Bl1TlZOTo/vuu0833XSTampqflxRYKBSU1M1e/Zsow0CAAD4ggaFqpYtW+q5557T7Nmz9eWXX0qSLrnkErVq1cpocwAAAL7inB7+efDgQR08eFDdunVTq1atZFmWqb4AAAB8SoNC1T//+U8NHTpUl156qYYPH66DBw9KklJTU3mcAgAAuCA1KFRNmTJFLVq00L59+9SyZUt7+ZgxY5Sbm2usOQAAAF/RoGuq3n33Xb3zzjvq2LGj1/Ju3brpH//4h5HGAAAAfEmDzlRVVVV5naGqU15eruDg4HNuCgAAwNc0KFRdddVVevnll+33fn5+8ng8mjVrlq655hpjzQEAAPiKBn39N2vWLA0dOlRbt27ViRMnNG3aNO3evVvl5eX66KOPTPcIAADQ5DXoTFVsbKz27NmjIUOG6MYbb1RVVZVGjRql7du365JLLjHdIwAAQJN31meqampqdO211yonJ0cPPfTQ+egJAADA55z1maoWLVpo586d56MXAAAAn9Wgr/9uvvlmvfjii6Z7AQAA8FkNulD95MmTeumll/T3v/9d/fv3r/ebf3PnzjXSHAAAgK84q1D11VdfqUuXLiouLla/fv0kSXv27PGq8fPzM9cdAACAjzirUNWtWzcdPHhQ7733nqQff5ZmwYIFcjqd56U5AAAAX3FW11RZluX1/u2331ZVVZXRhgAAAHxRgy5Ur/OvIQsAAOBCdVahys/Pr941U1xDBQAAcJbXVFmWpdtuu83+0eTjx4/rzjvvrHf33+uvv26uQwAAAB9wVqFq/PjxXu9vvvlmo80AAAD4qrMKVYsXLz5ffQAAAPi0c7pQHQAAAD8iVAEAABhAqAIAADCAUAUAAGAAoQoAAMAAQhUAAIABhCoAAAADCFUAAAAG+FSomjlzpvz8/DR58mR72fHjx5WWlqZ27drpoosu0ujRo1VWVub1uX379ik5OVktW7ZURESE7r//fp08edKr5v3331e/fv0UHBysrl27asmSJfW2/+yzz6pLly4KCQlRfHy8Nm/efD52EwAA+CCfCVVbtmzR888/r8svv9xr+ZQpU/Tmm29q1apV2rBhgw4cOKBRo0bZ47W1tUpOTtaJEye0adMmLV26VEuWLFFWVpZds3fvXiUnJ+uaa67Rjh07NHnyZP3hD3/QO++8Y9esXLlSGRkZevTRR7Vt2zb16dNHSUlJOnTo0PnfeQAA0OT5WZZlNXYTv+TYsWPq16+fnnvuOT3xxBPq27ev5s2bp8rKSl188cVavny5fve730mSSkpK1LNnTxUUFGjgwIF6++23df311+vAgQNyOp2SpJycHD3wwAM6fPiwgoKC9MADD2jdunUqLi62tzl27FhVVFQoNzdXkhQfH68BAwZo4cKFkiSPx6Po6Gjdc889yszMPKP9cLvdCgsLU2VlpRwOh8lDpC6Z64ys5+uZyUbWAwBAc3Gmf7994kxVWlqakpOTlZiY6LW8qKhINTU1Xst79OihTp06qaCgQJJUUFCg3r1724FKkpKSkuR2u7V792675l/XnZSUZK/jxIkTKioq8qrx9/dXYmKiXXM61dXVcrvdXi8AANA8ndUPKjeGFStWaNu2bdqyZUu9MZfLpaCgIIWHh3stdzqdcrlcds2pgapuvG7s52rcbrd++OEHHTlyRLW1taetKSkp+cnes7Oz9dhjj53ZjgIAAJ/WpM9U7d+/X5MmTdKyZcsUEhLS2O2ctenTp6uystJ+7d+/v7FbAgAA50mTDlVFRUU6dOiQ+vXrp8DAQAUGBmrDhg1asGCBAgMD5XQ6deLECVVUVHh9rqysTJGRkZKkyMjIencD1r3/pRqHw6HQ0FC1b99eAQEBp62pW8fpBAcHy+FweL0AAEDz1KRD1dChQ7Vr1y7t2LHDfsXFxSklJcX+7xYtWig/P9/+TGlpqfbt26eEhARJUkJCgnbt2uV1l15eXp4cDod69epl15y6jrqaunUEBQWpf//+XjUej0f5+fl2DQAAuLA16WuqWrdurdjYWK9lrVq1Urt27ezlqampysjIUNu2beVwOHTPPfcoISFBAwcOlCQNGzZMvXr10i233KJZs2bJ5XLp4YcfVlpamoKDgyVJd955pxYuXKhp06bp9ttv1/r16/Xaa69p3br/v6MuIyND48ePV1xcnK688krNmzdPVVVVmjBhwq90NAAAQFPWpEPVmfjzn/8sf39/jR49WtXV1UpKStJzzz1njwcEBGjt2rW66667lJCQoFatWmn8+PH605/+ZNfExMRo3bp1mjJliubPn6+OHTvqr3/9q5KSkuyaMWPG6PDhw8rKypLL5VLfvn2Vm5tb7+J1AABwYfKJ51Q1FzynCgAA39OsnlMFAADQ1BGqAAAADCBUAQAAGECoAgAAMIBQBQAAYAChCgAAwABCFQAAgAGEKgAAAAMIVQAAAAYQqgAAAAwgVAEAABhAqAIAADCAUAUAAGAAoQoAAMAAQhUAAIABhCoAAAADCFUAAAAGEKoAAAAMIFQBAAAYQKgCAAAwgFAFAABgAKEKAADAAEIVAACAAYQqAAAAAwhVAAAABhCqAAAADCBUAQAAGECoAgAAMIBQBQAAYAChCgAAwABCFQAAgAGEKgAAAAMIVQAAAAYQqgAAAAwgVAEAABhAqAIAADCAUAUAAGAAoQoAAMAAQhUAAIABhCoAAAADCFUAAAAGEKoAAAAMIFQBAAAYQKgCAAAwgFAFAABgAKEKAADAAEIVAACAAYQqAAAAAwhVAAAABhCqAAAADCBUAQAAGECoAgAAMIBQBQAAYAChCgAAwABCFQAAgAGEKgAAAAOadKjKzs7WgAED1Lp1a0VERGjEiBEqLS31qjl+/LjS0tLUrl07XXTRRRo9erTKysq8avbt26fk5GS1bNlSERERuv/++3Xy5Emvmvfff1/9+vVTcHCwunbtqiVLltTr59lnn1WXLl0UEhKi+Ph4bd682fg+AwAA39SkQ9WGDRuUlpamjz/+WHl5eaqpqdGwYcNUVVVl10yZMkVvvvmmVq1apQ0bNujAgQMaNWqUPV5bW6vk5GSdOHFCmzZt0tKlS7VkyRJlZWXZNXv37lVycrKuueYa7dixQ5MnT9Yf/vAHvfPOO3bNypUrlZGRoUcffVTbtm1Tnz59lJSUpEOHDv06BwMAADRpfpZlWY3dxJk6fPiwIiIitGHDBl199dWqrKzUxRdfrOXLl+t3v/udJKmkpEQ9e/ZUQUGBBg4cqLffflvXX3+9Dhw4IKfTKUnKycnRAw88oMOHDysoKEgPPPCA1q1bp+LiYntbY8eOVUVFhXJzcyVJ8fHxGjBggBYuXChJ8ng8io6O1j333KPMzMwz6t/tdissLEyVlZVyOBwmD426ZK4zsp6vZyYbWQ8AAM3Fmf79btJnqv5VZWWlJKlt27aSpKKiItXU1CgxMdGu6dGjhzp16qSCggJJUkFBgXr37m0HKklKSkqS2+3W7t277ZpT11FXU7eOEydOqKioyKvG399fiYmJds3pVFdXy+12e70AAEDz5DOhyuPxaPLkyRo8eLBiY2MlSS6XS0FBQQoPD/eqdTqdcrlcds2pgapuvG7s52rcbrd++OEHfffdd6qtrT1tTd06Tic7O1thYWH2Kzo6+ux3HAAA+ASfCVVpaWkqLi7WihUrGruVMzZ9+nRVVlbar/379zd2SwAA4DwJbOwGzkR6errWrl2rjRs3qmPHjvbyyMhInThxQhUVFV5nq8rKyhQZGWnX/OtdenV3B55a8693DJaVlcnhcCg0NFQBAQEKCAg4bU3dOk4nODhYwcHBZ7/DAADA5zTpM1WWZSk9PV1vvPGG1q9fr5iYGK/x/v37q0WLFsrPz7eXlZaWat++fUpISJAkJSQkaNeuXV536eXl5cnhcKhXr152zanrqKupW0dQUJD69+/vVePxeJSfn2/XAACAC1uTPlOVlpam5cuX629/+5tat25tX78UFham0NBQhYWFKTU1VRkZGWrbtq0cDofuueceJSQkaODAgZKkYcOGqVevXrrllls0a9YsuVwuPfzww0pLS7PPIt15551auHChpk2bpttvv13r16/Xa6+9pnXr/v+OuoyMDI0fP15xcXG68sorNW/ePFVVVWnChAm//oEBAABNTpMOVYsWLZIk/fu//7vX8sWLF+u2226TJP35z3+Wv7+/Ro8ererqaiUlJem5556zawMCArR27VrdddddSkhIUKtWrTR+/Hj96U9/smtiYmK0bt06TZkyRfPnz1fHjh3117/+VUlJSXbNmDFjdPjwYWVlZcnlcqlv377Kzc2td/E6AAC4MPnUc6p8Hc+pAgDA9zTL51QBAAA0VYQqAAAAAwhVAAAABhCqAAAADGjSd//h12fqgneJi94BABcWzlQBAAAYQKgCAAAwgFAFAABgAKEKAADAAEIVAACAAYQqAAAAAwhVAAAABhCqAAAADCBUAQAAGECoAgAAMIBQBQAAYAChCgAAwABCFQAAgAGEKgAAAAMIVQAAAAYQqgAAAAwgVAEAABhAqAIAADCAUAUAAGAAoQoAAMAAQhUAAIABhCoAAAADCFUAAAAGEKoAAAAMIFQBAAAYQKgCAAAwgFAFAABgAKEKAADAAEIVAACAAYQqAAAAAwhVAAAABhCqAAAADCBUAQAAGECoAgAAMIBQBQAAYAChCgAAwABCFQAAgAGEKgAAAAMIVQAAAAYQqgAAAAwgVAEAABhAqAIAADAgsLEbQPPVJXOdkfV8PTPZyHoAADifOFMFAABgAKEKAADAAEIVAACAAYQqAAAAAwhVAAAABhCqAAAADCBUAQAAGECoAgAAMIBQdZaeffZZdenSRSEhIYqPj9fmzZsbuyUAANAEEKrOwsqVK5WRkaFHH31U27ZtU58+fZSUlKRDhw41dmsAAKCR+VmWZTV2E74iPj5eAwYM0MKFCyVJHo9H0dHRuueee5SZmfmLn3e73QoLC1NlZaUcDofR3kz9JExzxs/dAAAa4kz/fvPbf2foxIkTKioq0vTp0+1l/v7+SkxMVEFBwWk/U11drerqavt9ZWWlpB8nxzRP9ffG19ncdJqyysh6ih9LMrIeAIBvqPu7/UvnoQhVZ+i7775TbW2tnE6n13Kn06mSkpLTfiY7O1uPPfZYveXR0dHnpUf8OsLmNXYHAIDGcPToUYWFhf3kOKHqPJo+fboyMjLs9x6PR+Xl5WrXrp38/PyMbcftdis6Olr79+83/rUizg1z03QxN00Xc9N0XahzY1mWjh49qqioqJ+tI1Sdofbt2ysgIEBlZWVey8vKyhQZGXnazwQHBys4ONhrWXh4+PlqUQ6H44L6n9yXMDdNF3PTdDE3TdeFODc/d4aqDnf/naGgoCD1799f+fn59jKPx6P8/HwlJCQ0YmcAAKAp4EzVWcjIyND48eMVFxenK6+8UvPmzVNVVZUmTJjQ2K0BAIBGRqg6C2PGjNHhw4eVlZUll8ulvn37Kjc3t97F67+24OBgPfroo/W+akTjY26aLuam6WJumi7m5ufxnCoAAAADuKYKAADAAEIVAACAAYQqAAAAAwhVAAAABhCqmoFnn31WXbp0UUhIiOLj47V58+bGbqlZyc7O1oABA9S6dWtFRERoxIgRKi0t9ao5fvy40tLS1K5dO1100UUaPXp0vQfF7tu3T8nJyWrZsqUiIiJ0//336+TJk14177//vvr166fg4GB17dpVS5YsOd+716zMnDlTfn5+mjx5sr2MuWk83377rW6++Wa1a9dOoaGh6t27t7Zu3WqPW5alrKwsdejQQaGhoUpMTNTnn3/utY7y8nKlpKTI4XAoPDxcqampOnbsmFfNzp07ddVVVykkJETR0dGaNWvWr7J/vqq2tlaPPPKIYmJiFBoaqksuuUSPP/641+/aMTcNZMGnrVixwgoKCrJeeukla/fu3dYdd9xhhYeHW2VlZY3dWrORlJRkLV682CouLrZ27NhhDR8+3OrUqZN17Ngxu+bOO++0oqOjrfz8fGvr1q3WwIEDrUGDBtnjJ0+etGJjY63ExERr+/bt1ltvvWW1b9/emj59ul3z1VdfWS1btrQyMjKsTz/91HrmmWesgIAAKzc391fdX1+1efNmq0uXLtbll19uTZo0yV7O3DSO8vJyq3PnztZtt91mFRYWWl999ZX1zjvvWF988YVdM3PmTCssLMxavXq19cknn1j/9V//ZcXExFg//PCDXXPttddaffr0sT7++GPrgw8+sLp27WqNGzfOHq+srLScTqeVkpJiFRcXW6+++qoVGhpqPf/887/q/vqSJ5980mrXrp21du1aa+/evdaqVausiy66yJo/f75dw9w0DKHKx1155ZVWWlqa/b62ttaKioqysrOzG7Gr5u3QoUOWJGvDhg2WZVlWRUWF1aJFC2vVqlV2zWeffWZJsgoKCizLsqy33nrL8vf3t1wul12zaNEiy+FwWNXV1ZZlWda0adOsyy67zGtbY8aMsZKSks73Lvm8o0ePWt26dbPy8vKsf/u3f7NDFXPTeB544AFryJAhPznu8XisyMhIa/bs2fayiooKKzg42Hr11Vcty7KsTz/91JJkbdmyxa55++23LT8/P+vbb7+1LMuynnvuOatNmzb2XNVtu3v37qZ3qdlITk62br/9dq9lo0aNslJSUizLYm7OBV//+bATJ06oqKhIiYmJ9jJ/f38lJiaqoKCgETtr3iorKyVJbdu2lSQVFRWppqbGax569OihTp062fNQUFCg3r17ez0oNikpSW63W7t377ZrTl1HXQ1z+cvS0tKUnJxc7/gxN41nzZo1iouL0+9//3tFREToiiuu0F/+8hd7fO/evXK5XF7HNSwsTPHx8V5zEx4erri4OLsmMTFR/v7+KiwstGuuvvpqBQUF2TVJSUkqLS3VkSNHzvdu+qRBgwYpPz9fe/bskSR98skn+vDDD3XddddJYm7OBU9U92Hfffedamtr6z3R3el0qqSkpJG6at48Ho8mT56swYMHKzY2VpLkcrkUFBRU78eynU6nXC6XXXO6eaob+7kat9utH374QaGhoedjl3zeihUrtG3bNm3ZsqXeGHPTeL766istWrRIGRkZevDBB7Vlyxbde++9CgoK0vjx4+1je7rjeupxj4iI8BoPDAxU27ZtvWpiYmLqraNurE2bNudl/3xZZmam3G63evTooYCAANXW1urJJ59USkqKJDE354BQBZyFtLQ0FRcX68MPP2zsViBp//79mjRpkvLy8hQSEtLY7eAUHo9HcXFxeuqppyRJV1xxhYqLi5WTk6Px48c3cncXttdee03Lli3T8uXLddlll2nHjh2aPHmyoqKimJtzxNd/Pqx9+/YKCAiodydTWVmZIiMjG6mr5is9PV1r167Ve++9p44dO9rLIyMjdeLECVVUVHjVnzoPkZGRp52nurGfq3E4HJwJ+QlFRUU6dOiQ+vXrp8DAQAUGBmrDhg1asGCBAgMD5XQ6mZtG0qFDB/Xq1ctrWc+ePbVv3z5J/39sf+7fr8jISB06dMhr/OTJkyovLz+r+YO3+++/X5mZmRo7dqx69+6tW265RVOmTFF2drYk5uZcEKp8WFBQkPr376/8/Hx7mcfjUX5+vhISEhqxs+bFsiylp6frjTfe0Pr16+udzu7fv79atGjhNQ+lpaXat2+fPQ8JCQnatWuX1z9CeXl5cjgc9h+ehIQEr3XU1TCXP23o0KHatWuXduzYYb/i4uKUkpJi/zdz0zgGDx5c79Eje/bsUefOnSVJMTExioyM9DqubrdbhYWFXnNTUVGhoqIiu2b9+vXyeDyKj4+3azZu3Kiamhq7Ji8vT927d2+WXy+Z8P3338vf3/vPf0BAgDwejyTm5pw09pXyODcrVqywgoODrSVLlliffvqpNXHiRCs8PNzrTiacm7vuussKCwuz3n//fevgwYP26/vvv7dr7rzzTqtTp07W+vXrra1bt1oJCQlWQkKCPV532/6wYcOsHTt2WLm5udbFF1982tv277//fuuzzz6znn32WW7bb4BT7/6zLOamsWzevNkKDAy0nnzySevzzz+3li1bZrVs2dJ65ZVX7JqZM2da4eHh1t/+9jdr586d1o033nja2/avuOIKq7Cw0Prwww+tbt26ed22X1FRYTmdTuuWW26xiouLrRUrVlgtW7Zs1rftn6vx48dbv/nNb+xHKrz++utW+/btrWnTptk1zE3DEKqagWeeecbq1KmTFRQUZF155ZXWxx9/3NgtNSuSTvtavHixXfPDDz9Yd999t9WmTRurZcuW1siRI62DBw96refrr7+2rrvuOis0NNRq3769NXXqVKumpsar5r333rP69u1rBQUFWb/97W+9toEz86+hirlpPG+++aYVGxtrBQcHWz169LBeeOEFr3GPx2M98sgjltPptIKDg62hQ4dapaWlXjX//Oc/rXHjxlkXXXSR5XA4rAkTJlhHjx71qvnkk0+sIUOGWMHBwdZvfvMba+bMmed933yZ2+22Jk2aZHXq1MkKCQmxfvvb31oPPfSQ16MPmJuG8bOsUx6hCgAAgAbhmioAAAADCFUAAAAGEKoAAAAMIFQBAAAYQKgCAAAwgFAFAABgAKEKAADAAEIVAACAAYQqAAAAAwhVAAAABhCqAAAADCBUAQAAGPB/y+tu61Au9y0AAAAASUVORK5CYII=", 594 | "text/plain": [ 595 | "