├── .github
    └── workflows
    │   └── python-publish.yml
├── .gitignore
├── .travis.yml
├── LICENSE
├── MANIFEST.in
├── README.md
├── bayesian_bootstrap
    ├── __init__.py
    ├── demos
    │   ├── __init__.py
    │   ├── demos.py
    │   ├── group_mean_secret_weapon.py
    │   ├── linear_regression.py
    │   ├── readme_exponential.png
    │   └── readme_regression.png
    └── tests
    │   └── test_bootstrap.py
├── docs
    ├── bootstrap_documentation.html
    └── build.py
├── requirements.txt
└── setup.py


/.github/workflows/python-publish.yml:
--------------------------------------------------------------------------------
 1 | # This workflow will upload a Python Package using Twine when a release is created
 2 | # For more information see: https://help.github.com/en/actions/language-and-framework-guides/using-python-with-github-actions#publishing-to-package-registries
 3 | 
 4 | # This workflow uses actions that are not certified by GitHub.
 5 | # They are provided by a third-party and are governed by
 6 | # separate terms of service, privacy policy, and support
 7 | # documentation.
 8 | 
 9 | name: Upload Python Package
10 | 
11 | on:
12 |   release:
13 |     types: [published]
14 | 
15 | jobs:
16 |   deploy:
17 | 
18 |     runs-on: ubuntu-latest
19 | 
20 |     steps:
21 |     - uses: actions/checkout@v2
22 |     - name: Set up Python
23 |       uses: actions/setup-python@v2
24 |       with:
25 |         python-version: '3.x'
26 |     - name: Install dependencies
27 |       run: |
28 |         python -m pip install --upgrade pip
29 |         pip install build
30 |     - name: Build package
31 |       run: python -m build
32 |     - name: Publish package
33 |       uses: pypa/gh-action-pypi-publish@27b31702a0e7fc50959f5ad993c78deac1bdfc29
34 |       with:
35 |         user: __token__
36 |         password: ${{ secrets.PYPI_API_TOKEN }}
37 | 


--------------------------------------------------------------------------------
/.gitignore:
--------------------------------------------------------------------------------
  1 | 
  2 | # Created by https://www.toptal.com/developers/gitignore/api/macos,python,vim
  3 | # Edit at https://www.toptal.com/developers/gitignore?templates=macos,python,vim
  4 | 
  5 | ### macOS ###
  6 | # General
  7 | .DS_Store
  8 | .AppleDouble
  9 | .LSOverride
 10 | 
 11 | # Icon must end with two \r
 12 | Icon
 13 | 
 14 | # Thumbnails
 15 | ._*
 16 | 
 17 | # Files that might appear in the root of a volume
 18 | .DocumentRevisions-V100
 19 | .fseventsd
 20 | .Spotlight-V100
 21 | .TemporaryItems
 22 | .Trashes
 23 | .VolumeIcon.icns
 24 | .com.apple.timemachine.donotpresent
 25 | 
 26 | # Directories potentially created on remote AFP share
 27 | .AppleDB
 28 | .AppleDesktop
 29 | Network Trash Folder
 30 | Temporary Items
 31 | .apdisk
 32 | 
 33 | ### Python ###
 34 | # Byte-compiled / optimized / DLL files
 35 | __pycache__/
 36 | *.py[cod]
 37 | *$py.class
 38 | 
 39 | # C extensions
 40 | *.so
 41 | 
 42 | # Distribution / packaging
 43 | .Python
 44 | build/
 45 | develop-eggs/
 46 | dist/
 47 | downloads/
 48 | eggs/
 49 | .eggs/
 50 | lib/
 51 | lib64/
 52 | parts/
 53 | sdist/
 54 | var/
 55 | wheels/
 56 | share/python-wheels/
 57 | *.egg-info/
 58 | .installed.cfg
 59 | *.egg
 60 | MANIFEST
 61 | 
 62 | # PyInstaller
 63 | #  Usually these files are written by a python script from a template
 64 | #  before PyInstaller builds the exe, so as to inject date/other infos into it.
 65 | *.manifest
 66 | *.spec
 67 | 
 68 | # Installer logs
 69 | pip-log.txt
 70 | pip-delete-this-directory.txt
 71 | 
 72 | # Unit test / coverage reports
 73 | htmlcov/
 74 | .tox/
 75 | .nox/
 76 | .coverage
 77 | .coverage.*
 78 | .cache
 79 | nosetests.xml
 80 | coverage.xml
 81 | *.cover
 82 | *.py,cover
 83 | .hypothesis/
 84 | .pytest_cache/
 85 | cover/
 86 | 
 87 | # Translations
 88 | *.mo
 89 | *.pot
 90 | 
 91 | # Django stuff:
 92 | *.log
 93 | local_settings.py
 94 | db.sqlite3
 95 | db.sqlite3-journal
 96 | 
 97 | # Flask stuff:
 98 | instance/
 99 | .webassets-cache
100 | 
101 | # Scrapy stuff:
102 | .scrapy
103 | 
104 | # Sphinx documentation
105 | docs/_build/
106 | 
107 | # PyBuilder
108 | .pybuilder/
109 | target/
110 | 
111 | # Jupyter Notebook
112 | .ipynb_checkpoints
113 | 
114 | # IPython
115 | profile_default/
116 | ipython_config.py
117 | 
118 | # pyenv
119 | #   For a library or package, you might want to ignore these files since the code is
120 | #   intended to run in multiple environments; otherwise, check them in:
121 | # .python-version
122 | 
123 | # pipenv
124 | #   According to pypa/pipenv#598, it is recommended to include Pipfile.lock in version control.
125 | #   However, in case of collaboration, if having platform-specific dependencies or dependencies
126 | #   having no cross-platform support, pipenv may install dependencies that don't work, or not
127 | #   install all needed dependencies.
128 | #Pipfile.lock
129 | 
130 | # poetry
131 | #   Similar to Pipfile.lock, it is generally recommended to include poetry.lock in version control.
132 | #   This is especially recommended for binary packages to ensure reproducibility, and is more
133 | #   commonly ignored for libraries.
134 | #   https://python-poetry.org/docs/basic-usage/#commit-your-poetrylock-file-to-version-control
135 | #poetry.lock
136 | 
137 | # PEP 582; used by e.g. github.com/David-OConnor/pyflow
138 | __pypackages__/
139 | 
140 | # Celery stuff
141 | celerybeat-schedule
142 | celerybeat.pid
143 | 
144 | # SageMath parsed files
145 | *.sage.py
146 | 
147 | # Environments
148 | .env
149 | .venv
150 | env/
151 | venv/
152 | ENV/
153 | env.bak/
154 | venv.bak/
155 | 
156 | # Spyder project settings
157 | .spyderproject
158 | .spyproject
159 | 
160 | # Rope project settings
161 | .ropeproject
162 | 
163 | # mkdocs documentation
164 | /site
165 | 
166 | # mypy
167 | .mypy_cache/
168 | .dmypy.json
169 | dmypy.json
170 | 
171 | # Pyre type checker
172 | .pyre/
173 | 
174 | # pytype static type analyzer
175 | .pytype/
176 | 
177 | # Cython debug symbols
178 | cython_debug/
179 | 
180 | # PyCharm
181 | #  JetBrains specific template is maintainted in a separate JetBrains.gitignore that can
182 | #  be found at https://github.com/github/gitignore/blob/main/Global/JetBrains.gitignore
183 | #  and can be added to the global gitignore or merged into this file.  For a more nuclear
184 | #  option (not recommended) you can uncomment the following to ignore the entire idea folder.
185 | #.idea/
186 | 
187 | ### Vim ###
188 | # Swap
189 | [._]*.s[a-v][a-z]
190 | !*.svg  # comment out if you don't need vector files
191 | [._]*.sw[a-p]
192 | [._]s[a-rt-v][a-z]
193 | [._]ss[a-gi-z]
194 | [._]sw[a-p]
195 | 
196 | # Session
197 | Session.vim
198 | Sessionx.vim
199 | 
200 | # Temporary
201 | .netrwhist
202 | *~
203 | # Auto-generated tag files
204 | tags
205 | # Persistent undo
206 | [._]*.un~
207 | 
208 | # End of https://www.toptal.com/developers/gitignore/api/macos,python,vim
209 | 


--------------------------------------------------------------------------------
/.travis.yml:
--------------------------------------------------------------------------------
 1 | language: python
 2 | python:
 3 |   - "3.5"
 4 |   - "3.6"
 5 |   - "3.7"
 6 |   - "3.8"
 7 | addons:
 8 |   apt:
 9 |     packages:
10 |     - libblas-dev
11 |     - liblapack-dev
12 |     - gfortran
13 |     - graphviz
14 | before_install:
15 |   - pip install -U pip setuptools wheel
16 | install:
17 |   - travis_wait travis_retry pip install -r requirements.txt
18 | script: "nosetests bayesian_bootstrap/tests"
19 | 


--------------------------------------------------------------------------------
/LICENSE:
--------------------------------------------------------------------------------
 1 | MIT License
 2 | 
 3 | Copyright (c) 2019 Louis Cialdella
 4 | 
 5 | Permission is hereby granted, free of charge, to any person obtaining a copy
 6 | of this software and associated documentation files (the "Software"), to deal
 7 | in the Software without restriction, including without limitation the rights
 8 | to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
 9 | copies of the Software, and to permit persons to whom the Software is
10 | furnished to do so, subject to the following conditions:
11 | 
12 | The above copyright notice and this permission notice shall be included in all
13 | copies or substantial portions of the Software.
14 | 
15 | THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
16 | IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
17 | FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
18 | AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
19 | LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
20 | OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
21 | SOFTWARE.
22 | 


--------------------------------------------------------------------------------
/MANIFEST.in:
--------------------------------------------------------------------------------
1 | # file GENERATED by distutils, do NOT edit
2 | include setup.py
3 | include bayesian_bootstrap\__init__.py
4 | include bayesian_bootstrap\bootstrap.py
5 | include README.md
6 | include requirements.txt
7 | include bayesian_bootstrap\docs\bootstrap_documentation.html


--------------------------------------------------------------------------------
/README.md:
--------------------------------------------------------------------------------
  1 | # `bayesian_bootstrap` ![test badge](https://travis-ci.org/lmc2179/bayesian_bootstrap.svg?branch=master) [![PyPI version](https://badge.fury.io/py/bayesian_bootstrap.svg)](https://badge.fury.io/py/bayesian_bootstrap)
  2 | 
  3 | `bayesian_bootstrap` is a package for Bayesian bootstrapping in Python. For an overview of the Bayesian bootstrap, I highly recommend reading [Rasmus Bååth's writeup](http://www.sumsar.net/blog/2015/04/the-non-parametric-bootstrap-as-a-bayesian-model/).  This Python package is similar to his [R package](http://www.sumsar.net/blog/2016/02/bayesboot-an-r-package/). 
  4 | 
  5 | This README contains some examples, below. For the documentation of the package's API, see the [docs](http://htmlpreview.github.io/?https://github.com/lmc2179/bayesian_bootstrap/blob/master/docs/bootstrap_documentation.html).
  6 | 
  7 | This package is on pypi - you can install it with `pip install bayesian_bootstrap`.
  8 | 
  9 | # Overview of the `bayesian_bootstrap` module
 10 | 
 11 | This module contains tools for doing approximate bayesian inference using the Bayesian Bootstrap introduced in [Rubin's _The Bayesian Bootstrap_](https://projecteuclid.org/euclid.aos/1176345338).
 12 | 
 13 | It contains the following:
 14 | 
 15 | * The `mean` and `var` functions, which simulate the posterior distributions of the mean and variance
 16 | 
 17 | * The `bayesian_bootstrap` function, which simulates the posterior distribution of an arbitrary statistic
 18 | 
 19 | * The `BayesianBootstrapBagging` class, a wrapper allowing users to generate ensembles of regressors/classifiers
 20 | using Bayesian Bootstrap resampling. A base class with a scikit-learn like estimator needs to be provided. See also 
 21 | the `bayesian_bootstrap_regression` function.
 22 | 
 23 | * The `central_credible_interval` and `highest_density_interval` functions, which compute credible intervals from
 24 | posterior samples.
 25 | 
 26 | For more information about the function signatures above, see the examples below or the docstrings of each function/class.
 27 | 
 28 | One thing that's worth making clear is the interpretation of the parameters of the `bayesian_bootstrap`, `BayesianBootstrapBagging`, and `bayesian_bootstrap_regression` functions, which all do sampling within each bootstrap replication:
 29 | 
 30 | * The number of replications is the number of times the statistic of interested will be replicated. If we think about the classical bootstrap, this is the number of times your dataset is resampled. If we think about it from a bayesian point of view, this is the number of draws from the posterior distribution.
 31 | 
 32 | * The resample size is the size of the dataset used to calculate the statistic of interest in each replication. More is better - you'll probably want this to be at least as large as your original dataset.
 33 | 
 34 | # Example: Estimating the mean
 35 | Let's say that we observe some data points, and we wish to simulate the posterior distribution of their mean.
 36 | 
 37 | The following code draws four data points from an exponential distribution:
 38 | ```
 39 | X = np.random.exponential(7, 4)
 40 | ```
 41 | Now, we are going to simulate draws from the posterior of the mean. `bayesian_bootstrap` includes a `mean` function in 
 42 | the `bootstrap` module that will do this for you.
 43 | 
 44 | The code below performs the simulation and calculates the 95% highest density interval using 10,000 bootstrap replications. It also uses the wonderful 
 45 | `seaborn` library to visualize the histogram with a Kernel density estimate. 
 46 | 
 47 | Included for reference in the image is the same dataset used in a classical bootstrap, to illustrate the comparative 
 48 | smoothness of the bayesian version.
 49 | ```
 50 | from bayesian_bootstrap import mean, highest_density_interval
 51 | posterior_samples = mean(X, 10000)
 52 | l, r = highest_density_interval(posterior_samples)
 53 | 
 54 | plt.title('Bayesian Bootstrap of mean')
 55 | sns.distplot(posterior_samples, label='Bayesian Bootstrap Samples')
 56 | plt.plot([l, r], [0, 0], linewidth=5.0, marker='o', label='95% HDI')
 57 | ```
 58 | 
 59 | The above code uses the `mean` method to simulate the posterior distribution of the mean. However, it is a special 
 60 | (if very common) case, along with `var` - all other statistics should use the `bayesian_bootstrap` method. The
 61 |  following code demonstrates doing this for the posterior of the mean:
 62 | 
 63 | ```
 64 | from bayesian_bootstrap import bayesian_bootstrap
 65 | posterior_samples = bayesian_bootstrap(X, np.mean, 10000, 100)
 66 | ```
 67 | 
 68 | ![Posterior](bayesian_bootstrap/demos/readme_exponential.png)
 69 | 
 70 | # Example: Regression modelling
 71 | <!--
 72 | Problem setup
 73 | 
 74 | Sample data points
 75 | 
 76 | Show scatterplot + code
 77 | 
 78 | Show posterior samples for slope
 79 | 
 80 | Show show scatterplot with prediction bands
 81 | -->
 82 | Let's take another example - fitting a linear regression model. The following code samples a few points in the plane.
 83 | The mean is y = x, and normally distributed noise is added.
 84 | ```
 85 | X = np.random.normal(0, 1, 5).reshape(-1, 1)
 86 | y = X.reshape(1, -1).reshape(5) + np.random.normal(0, 1, 5)
 87 | ```
 88 | We build models via bootstrap resampling, creating an ensemble of models via bootstrap aggregating. A 
 89 | `BayesianBootstrapBagging` wrapper class is available in the library, which is a bayesian analogue to scikit-learn's 
 90 | `BaggingRegressor` and `BaggingClassifer` classes.
 91 | ```
 92 | m = BayesianBootstrapBagging(LinearRegression(), 10000, 1000)
 93 | m.fit(X, y)
 94 | ```
 95 | Once we've got our ensemble trained, we can make interval predictions for new inputs by calculating their HDIs under the
 96 | ensemble:
 97 | ```
 98 | X_plot = np.linspace(min(X), max(X))
 99 | y_predicted = m.predict(X_plot.reshape(-1, 1))
100 | y_predicted_interval = m.predict_highest_density_interval(X_plot.reshape(-1, 1), 0.05)
101 | 
102 | plt.scatter(X.reshape(1, -1), y)
103 | plt.plot(X_plot, y_predicted, label='Mean')
104 | plt.plot(X_plot, y_predicted_interval[:,0], label='95% HDI Lower bound')
105 | plt.plot(X_plot, y_predicted_interval[:,1], label='95% HDI Upper bound')
106 | plt.legend()
107 | plt.savefig('readme_regression.png', bbox_inches='tight')
108 | ```
109 | ![Posterior](bayesian_bootstrap/demos/readme_regression.png)
110 | 
111 | Users interested in accessing the base models can do so via the `base_models_` attribute of the object.
112 | 
113 | # Contributions
114 | 
115 | Interested in contributing? We'd love to have your help! Please keep the following in mind:
116 | 
117 | * Bug fixes are welcome! Make sure you reference the issue number that is being resolved, and that all test cases in `tests` pass.
118 | 
119 | * New features are welcome as well! Any new features should include docstrings and unit tests in the `tests` directory.
120 | 
121 | * If you want to contribute a case study or other documentation, feel free to write up a github-flavored markdown document or ipython notebook and put it in the `examples` folder before issuing a pull request.
122 | 
123 | Credit for past contributions:
124 | 
125 | * [roya0045](https://github.com/roya0045) implemented the original version of the low-memory optimizations.
126 | * [JulianWgs](https://github.com/JulianWgs) implemented the Bayesian machine learning model using weight distributions instead of resampling and a weighted Pearson correlation coefficient. He also refactored the weighted mean and covariance function to accept weight matrices.
127 | * [genos](https://github.com/genos) simplified importing and updated the RNG usage to the current numpy standard.
128 | 
129 | # Further reading
130 | 
131 | * [_The Bayesian Bootstrap_, Rubin, 1981](https://projecteuclid.org/euclid.aos/1176345338)
132 | 
133 | * [Rasmus Bååth's original writeup on the Bayesian Bootstrap](http://www.sumsar.net/blog/2015/04/the-non-parametric-bootstrap-as-a-bayesian-model/)
134 | 


--------------------------------------------------------------------------------
/bayesian_bootstrap/__init__.py:
--------------------------------------------------------------------------------
  1 | import numpy as np
  2 | from copy import deepcopy
  3 | 
  4 | 
  5 | def mean(X, n_replications, seed=None):
  6 |     """Simulate the posterior distribution of the mean.
  7 | 
  8 |     Parameter X: The observed data (array like)
  9 | 
 10 |     Parameter n_replications: The number of bootstrap replications to perform (positive integer)
 11 | 
 12 |     Parameter seed: Seed for PRNG (default None)
 13 | 
 14 |     Returns: Samples from the posterior
 15 |     """
 16 |     weights = np.random.default_rng(seed).dirichlet(np.ones(len(X)), n_replications)
 17 |     return np.dot(X, weights.T)
 18 | 
 19 | 
 20 | def var(X, n_replications, seed=None):
 21 |     """Simulate the posterior distribution of the variance.
 22 | 
 23 |     Parameter X: The observed data (array like)
 24 | 
 25 |     Parameter n_replications: The number of bootstrap replications to perform (positive integer)
 26 | 
 27 |     Parameter seed: Seed for PRNG (default None)
 28 | 
 29 |     Returns: Samples from the posterior
 30 |     """
 31 |     samples = []
 32 |     weights = np.random.default_rng(seed).dirichlet([1] * len(X), n_replications)
 33 |     for w in weights:
 34 |         samples.append(np.dot([x ** 2 for x in X], w) - np.dot(X, w) ** 2)
 35 |     return samples
 36 | 
 37 | 
 38 | def covar(X, Y, n_replications, seed=None):
 39 |     """Simulate the posterior distribution of the covariance.
 40 | 
 41 |     Parameter X: The observed data, first variable (array like)
 42 | 
 43 |     Parameter Y: The observed data, second (array like)
 44 | 
 45 |     Parameter n_replications: The number of bootstrap replications to perform (positive integer)
 46 | 
 47 |     Parameter seed: Seed for PRNG (default None)
 48 | 
 49 |     Returns: Samples from the posterior
 50 |     """
 51 |     samples = []
 52 |     weights = np.random.default_rng(seed).dirichlet([1] * len(X), n_replications)
 53 |     for w in weights:
 54 |         cv = _weighted_covariance(X, Y, w)
 55 |         samples.append(cv)
 56 |     return samples
 57 | 
 58 | 
 59 | def pearsonr(X, Y, n_replications, seed=None):
 60 |     """
 61 |     Pearson correlation coefficient and p-value for testing non-correlation.
 62 | 
 63 |     https://docs.scipy.org/doc/scipy/reference/generated/scipy.stats.pearsonr.html
 64 | 
 65 |     """
 66 |     weights = np.random.default_rng(seed).dirichlet(np.ones(len(X)), n_replications)
 67 |     return _weighted_pearsonr(X, Y, weights)
 68 | 
 69 | 
 70 | def _weighted_covariance(X, Y, w):
 71 |     X_mean = np.dot(X, w.T).reshape(-1, 1)
 72 |     Y_mean = np.dot(Y, w.T).reshape(-1, 1)
 73 |     # Another approach, but less efficient
 74 |     # np.diag(np.dot(w, (x - X_mean) * (y - Y_mean)).T)
 75 |     # https://stackoverflow.com/a/14759273
 76 |     return (w * ((X - X_mean) * (Y - Y_mean))).sum(-1)
 77 | 
 78 | 
 79 | def _weighted_pearsonr(X, Y, w):
 80 |     """
 81 |     Weighted Pearson correlation.
 82 | 
 83 |     """
 84 |     return _weighted_covariance(X, Y, w) / np.sqrt(_weighted_covariance(X, X, w) * _weighted_covariance(Y, Y, w))
 85 | 
 86 | 
 87 | def _weighted_ls(X, w, y):
 88 |     x_rows, x_cols = X.shape
 89 |     w_matrix = np.array(w) * np.eye(x_rows)
 90 |     coef = np.dot(
 91 |         np.dot(np.dot(np.linalg.inv(np.dot(np.dot(X.T, w_matrix), X)), X.T), w_matrix),
 92 |         y,
 93 |     )
 94 |     return coef
 95 | 
 96 | 
 97 | def linear_regression(X, y, n_replications, seed=None):
 98 |     coef_samples = []
 99 |     weights = np.random.default_rng(seed).dirichlet([1] * len(X), n_replications)
100 |     for w in weights:
101 |         coef_samples.append(_weighted_ls(X, w, y))
102 |     return np.vstack(coef_samples)
103 | 
104 | 
105 | def bayesian_bootstrap(X, statistic, n_replications, resample_size, low_mem=False, seed=None):
106 |     """Simulate the posterior distribution of the given statistic.
107 | 
108 |     Parameter X: The observed data (array like)
109 | 
110 |     Parameter statistic: A function of the data to use in simulation (Function mapping array-like to number)
111 | 
112 |     Parameter n_replications: The number of bootstrap replications to perform (positive integer)
113 | 
114 |     Parameter resample_size: The size of the dataset in each replication
115 | 
116 |     Parameter low_mem(bool): Generate the weights for each iteration lazily instead of in a single batch. Will use
117 |     less memory, but will run slower as a result.
118 | 
119 |     Parameter seed: Seed for PRNG (default None)
120 | 
121 |     Returns: Samples from the posterior
122 |     """
123 |     if isinstance(X, list):
124 |         X = np.array(X)
125 |     samples = []
126 |     rng = np.random.default_rng(seed)
127 |     if low_mem:
128 |         weights = (rng.dirichlet([1] * len(X)) for _ in range(n_replications))
129 |     else:
130 |         weights = rng.dirichlet([1] * len(X), n_replications)
131 |     for w in weights:
132 |         sample_index = rng.choice(range(len(X)), p=w, size=resample_size)
133 |         resample_X = X[sample_index]
134 |         s = statistic(resample_X)
135 |         samples.append(s)
136 |     return samples
137 | 
138 | 
139 | def bayesian_bootstrap_regression(X, y, statistic, n_replications, resample_size, low_mem=False, seed=None):
140 |     """Simulate the posterior distribution of a statistic that uses dependent and independent variables.
141 | 
142 |     Parameter X: The observed data, independent variables (matrix like)
143 | 
144 |     Parameter y: The observed data, dependent variable (array like)
145 | 
146 |     Parameter statistic: A function of the data to use in simulation (Function mapping array-like to number)
147 | 
148 |     Parameter n_replications: The number of bootstrap replications to perform (positive integer)
149 | 
150 |     Parameter resample_size: The size of the dataset in each replication
151 | 
152 |     Parameter low_mem(bool): Use looping instead of generating all the dirichlet, use if program use too much memory
153 | 
154 |     Parameter seed: Seed for PRNG (default None)
155 | 
156 |     Returns: Samples from the posterior
157 |     """
158 |     samples = []
159 |     X_arr = np.array(X)
160 |     y_arr = np.array(y)
161 |     rng = np.random.default_rng(seed)
162 |     if low_mem:
163 |         weights = (rng.dirichlet([1] * len(X)) for _ in range(n_replications))
164 |     else:
165 |         weights = rng.dirichlet([1] * len(X), n_replications)
166 |     for w in weights:
167 |         if resample_size is None:
168 |             s = statistic(X, y, w)
169 |         else:
170 |             resample_i = rng.choice(range(len(X_arr)), p=w, size=resample_size)
171 |             resample_X = X_arr[resample_i]
172 |             resample_y = y_arr[resample_i]
173 |             s = statistic(resample_X, resample_y)
174 |         samples.append(s)
175 | 
176 |     return samples
177 | 
178 | 
179 | class BayesianBootstrapBagging:
180 |     """A bootstrap aggregating model using the bayesian bootstrap. Similar to scikit-learn's BaggingRegressor."""
181 | 
182 |     def __init__(self, base_learner, n_replications, resample_size=None, low_mem=False, seed=None):
183 |         """Initialize the base learners of the ensemble.
184 | 
185 |         Parameter base_learner: A scikit-learn like estimator. This object should implement a fit() and predict()
186 |         method.
187 | 
188 |         Parameter n_replications: The number of bootstrap replications to perform (positive integer)
189 | 
190 |         Parameter resample_size: The size of the dataset in each replication
191 | 
192 |         Parameter low_mem(bool): Generate the weights for each iteration lazily instead of in a single batch. Will use
193 |         less memory, but will run slower as a result.
194 | 
195 |         Parameter seed: Seed for PRNG (default None)
196 |         """
197 |         self.base_learner = base_learner
198 |         self.n_replications = n_replications
199 |         self.resample_size = resample_size
200 |         self.memo = low_mem
201 |         self.seed = seed
202 | 
203 |     def fit(self, X, y):
204 |         """Fit the base learners of the ensemble on a dataset.
205 | 
206 |         Parameter X: The observed data, independent variables (matrix like)
207 | 
208 |         Parameter y: The observed data, dependent variable (array like)
209 | 
210 |         Returns: Fitted model
211 |         """
212 |         if self.resample_size is None:
213 |             statistic = lambda X, y, w: deepcopy(self.base_learner).fit(X, y, w)  # noqa: E731
214 |         else:
215 |             statistic = lambda X, y: deepcopy(self.base_learner).fit(X, y)  # noqa: E731
216 |         self.base_models_ = bayesian_bootstrap_regression(
217 |             X, y, statistic, self.n_replications, self.resample_size, low_mem=self.memo, seed=self.seed
218 |         )
219 |         return self
220 | 
221 |     def predict(self, X):
222 |         """Make average predictions for a collection of observations.
223 | 
224 |         Parameter X: The observed data, independent variables (matrix like)
225 | 
226 |         Returns: The predicted dependent variable values (array like)
227 |         """
228 |         y_posterior_samples = self.predict_posterior_samples(X)
229 |         return np.array([np.mean(r) for r in y_posterior_samples])
230 | 
231 |     def predict_posterior_samples(self, X):
232 |         """Simulate posterior samples for a collection of observations.
233 | 
234 |         Parameter X: The observed data, independent variables (matrix like)
235 | 
236 |         Returns: The simulated posterior mean (matrix like)
237 |         """
238 |         # Return a X_r x self.n_replications matrix
239 |         y_posterior_samples = np.zeros((len(X), self.n_replications))
240 |         for i, m in enumerate(self.base_models_):
241 |             y_posterior_samples[:, i] = m.predict(X)
242 |         return y_posterior_samples
243 | 
244 |     def predict_central_interval(self, X, alpha=0.05):
245 |         """The equal-tailed interval prediction containing a (1-alpha) fraction of the posterior samples.
246 | 
247 |         Parameter X: The observed data, independent variables (matrix like)
248 | 
249 |         Parameter alpha: The total size of the tails (Float between 0 and 1)
250 | 
251 |         Returns: Left and right interval bounds for each input (matrix like)
252 |         """
253 |         y_posterior_samples = self.predict_posterior_samples(X)
254 |         return np.array([central_credible_interval(r, alpha=alpha) for r in y_posterior_samples])
255 | 
256 |     def predict_highest_density_interval(self, X, alpha=0.05):
257 |         """The highest density interval prediction containing a (1-alpha) fraction of the posterior samples.
258 | 
259 |         Parameter X: The observed data, independent variables (matrix like)
260 | 
261 |         Parameter alpha: The total size of the tails (Float between 0 and 1)
262 | 
263 |         Returns: Left and right interval bounds for each input (matrix like):
264 |         """
265 |         y_posterior_samples = self.predict_posterior_samples(X)
266 |         return np.array([highest_density_interval(r, alpha=alpha) for r in y_posterior_samples])
267 | 
268 | 
269 | def central_credible_interval(samples, alpha=0.05):
270 |     """The equal-tailed interval containing a (1-alpha) fraction of the posterior samples.
271 | 
272 |     Parameter samples: The posterior samples (array like)
273 | 
274 |     Parameter alpha: The total size of the tails (Float between 0 and 1)
275 | 
276 |     Returns: Left and right interval bounds (tuple)
277 |     """
278 |     return np.quantile(samples, alpha / 2), np.quantile(samples, 1 - alpha / 2)
279 | 
280 | 
281 | def highest_density_interval(samples, alpha=0.05):
282 |     """The highest-density interval containing a (1-alpha) fraction of the posterior samples.
283 | 
284 |     Parameter samples: The posterior samples (array like)
285 | 
286 |     Parameter alpha: The total size of the tails (Float between 0 and 1)
287 | 
288 |     Returns: Left and right interval bounds (tuple)
289 |     """
290 |     samples_sorted = sorted(samples)
291 |     window_size = int(len(samples) - round(len(samples) * alpha))
292 |     smallest_window = (None, None)
293 |     smallest_window_length = float("inf")
294 |     for i in range(len(samples_sorted) - window_size):
295 |         window = samples_sorted[i + window_size - 1], samples_sorted[i]
296 |         window_length = samples_sorted[i + window_size - 1] - samples_sorted[i]
297 |         if window_length < smallest_window_length:
298 |             smallest_window_length = window_length
299 |             smallest_window = window
300 |     return smallest_window[1], smallest_window[0]
301 | 
302 | 
303 | def _bootstrap_replicate(X, seed=None):
304 |     random_points = sorted(np.random.default_rng(seed).uniform(0, 1, len(X) - 1))
305 |     random_points.append(1)
306 |     random_points.insert(0, 0)
307 |     gaps = [right - left for left, right in zip(random_points[:-1], random_points[1:])]
308 |     return np.array(gaps)
309 | 


--------------------------------------------------------------------------------
/bayesian_bootstrap/demos/__init__.py:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/lmc2179/bayesian_bootstrap/93b8cf41b0675ec24a18e554f5011cdd07de7d91/bayesian_bootstrap/demos/__init__.py


--------------------------------------------------------------------------------
/bayesian_bootstrap/demos/demos.py:
--------------------------------------------------------------------------------
  1 | from matplotlib import pyplot as plt
  2 | import seaborn as sns
  3 | from sklearn.linear_model import LinearRegression
  4 | from sklearn.utils import resample
  5 | from bayesian_bootstrap import (
  6 |     mean,
  7 |     var,
  8 |     bayesian_bootstrap,
  9 |     bayesian_bootstrap_regression,
 10 |     BayesianBootstrapBagging,
 11 |     highest_density_interval,
 12 |     covar,
 13 | )
 14 | from tqdm import tqdm
 15 | import numpy as np
 16 | 
 17 | 
 18 | def plot_mean_bootstrap():
 19 |     X = [-1, 0, 1]
 20 |     posterior_samples = mean(X, 10000)
 21 |     sns.distplot(posterior_samples)
 22 |     classical_samples = [np.mean(resample(X)) for _ in range(10000)]
 23 |     sns.distplot(classical_samples)
 24 |     plt.show()
 25 | 
 26 | 
 27 | def plot_mean_resample_bootstrap():
 28 |     X = [-1, 0, 1]
 29 |     posterior_samples = bayesian_bootstrap(X, np.mean, 10000, 100)
 30 |     sns.distplot(posterior_samples)
 31 |     classical_samples = [np.mean(resample(X)) for _ in range(10000)]
 32 |     sns.distplot(classical_samples)
 33 |     plt.show()
 34 | 
 35 | 
 36 | def plot_median():
 37 |     X = np.random.uniform(-1, 1, 10)
 38 |     posterior_samples = bayesian_bootstrap(X, np.median, 10000, 100)
 39 |     sns.distplot(posterior_samples)
 40 |     classical_samples = [np.median(resample(X)) for _ in range(10000)]
 41 |     sns.distplot(classical_samples)
 42 |     plt.show()
 43 | 
 44 | 
 45 | def plot_var_bootstrap():
 46 |     X = np.random.uniform(-1, 1, 100)
 47 |     posterior_samples = var(X, 10000)
 48 |     sns.distplot(posterior_samples)
 49 |     classical_samples = [np.var(resample(X)) for _ in range(10000)]
 50 |     sns.distplot(classical_samples)
 51 |     plt.show()
 52 | 
 53 | 
 54 | def plot_self_covar_bootstrap():
 55 |     X = np.random.uniform(-1, 1, 100)
 56 |     posterior_samples = covar(X, X, 10000)
 57 |     sns.distplot(posterior_samples)
 58 |     plt.show()
 59 | 
 60 | 
 61 | def plot_covar_bootstrap():
 62 |     X = np.random.normal(0, 1, 100)
 63 |     Y = np.random.normal(0, 1, 100)
 64 |     posterior_samples = covar(X, Y, 10000)
 65 |     sns.distplot(posterior_samples)
 66 |     plt.show()
 67 | 
 68 | 
 69 | def plot_var_resample_bootstrap():
 70 |     X = np.random.uniform(-1, 1, 100)
 71 |     posterior_samples = bayesian_bootstrap(X, np.var, 10000, 500)
 72 |     sns.distplot(posterior_samples)
 73 |     classical_samples = [np.var(resample(X)) for _ in range(10000)]
 74 |     sns.distplot(classical_samples)
 75 |     plt.show()
 76 | 
 77 | 
 78 | def plot_mean_method_comparison():
 79 |     X = np.random.exponential(scale=1, size=8)
 80 |     classical_samples = [np.mean(resample(X)) for _ in range(10000)]
 81 |     posterior_samples_resample = bayesian_bootstrap(X, np.mean, 10000, 1000)
 82 |     posterior_samples_weighted = mean(X, 10000)
 83 |     sns.distplot(classical_samples)
 84 |     sns.distplot(posterior_samples_resample)
 85 |     sns.distplot(posterior_samples_weighted)
 86 |     plt.show()
 87 | 
 88 | 
 89 | def plot_regression_bootstrap():
 90 |     X = np.array([[0], [1], [2], [3]])
 91 |     y = np.array([0, 1, 2, 3]) + np.random.normal(0, 1, 4)
 92 |     classical_samples = [LinearRegression().fit(*resample(X, y)).coef_ for _ in tqdm(range(10000))]
 93 |     posterior_samples = bayesian_bootstrap_regression(
 94 |         X, y, lambda X, y: LinearRegression().fit(X, y).coef_, 10000, 1000
 95 |     )
 96 |     plt.scatter(X.reshape(-1, 1), y)
 97 |     plt.show()
 98 |     sns.distplot(classical_samples)
 99 |     sns.distplot(posterior_samples)
100 |     plt.show()
101 | 
102 | 
103 | def plot_regression_wrapper_bootstrap():
104 |     X = np.array([[0], [1], [2], [3]])
105 |     y = np.array([0, 1, 2, 3]) + np.random.normal(0, 1, 4)
106 |     m = BayesianBootstrapBagging(LinearRegression(), 10000, 1000)
107 |     m.fit(X, y)
108 |     y_predicted = m.predict(X)
109 |     y_predicted_interval = m.predict_central_interval(X, 0.05)
110 |     plt.scatter(X.reshape(-1, 1), y)
111 |     plt.plot(X.reshape(-1, 1), y_predicted)
112 |     plt.plot(X.reshape(-1, 1), y_predicted_interval[:, 0])
113 |     plt.plot(X.reshape(-1, 1), y_predicted_interval[:, 1])
114 |     plt.show()
115 | 
116 | 
117 | def plot_mean_bootstrap_exponential_readme():
118 |     X = np.random.exponential(7, 4)
119 |     classical_samples = [np.mean(resample(X)) for _ in range(10000)]
120 |     posterior_samples = mean(X, 10000)
121 |     l, r = highest_density_interval(posterior_samples)
122 |     classical_l, classical_r = highest_density_interval(classical_samples)
123 |     plt.subplot(2, 1, 1)
124 |     plt.title("Bayesian Bootstrap of mean")
125 |     sns.distplot(posterior_samples, label="Bayesian Bootstrap Samples")
126 |     plt.plot([l, r], [0, 0], linewidth=5.0, marker="o", label="95% HDI")
127 |     plt.xlim(-1, 18)
128 |     plt.legend()
129 |     plt.subplot(2, 1, 2)
130 |     plt.title("Classical Bootstrap of mean")
131 |     sns.distplot(classical_samples, label="Classical Bootstrap Samples")
132 |     plt.plot([classical_l, classical_r], [0, 0], linewidth=5.0, marker="o", label="95% HDI")
133 |     plt.xlim(-1, 18)
134 |     plt.legend()
135 |     plt.savefig("readme_exponential.png", bbox_inches="tight")
136 | 
137 | 
138 | def plot_regression_slope_distribution_readme():
139 |     X = np.random.normal(0, 1, 5).reshape(-1, 1)
140 |     y = X.reshape(1, -1).reshape(5) + np.random.normal(0, 1, 5)
141 |     m = BayesianBootstrapBagging(LinearRegression(), 10000, 1000)
142 |     m.fit(X, y)
143 |     X_plot = np.linspace(min(X), max(X))
144 |     y_predicted = m.predict(X_plot.reshape(-1, 1))
145 |     y_predicted_interval = m.predict_highest_density_interval(X_plot.reshape(-1, 1), 0.05)
146 |     plt.scatter(X.reshape(1, -1), y)
147 |     plt.plot(X_plot, y_predicted, label="Mean")
148 |     plt.plot(X_plot, y_predicted_interval[:, 0], label="95% HDI Lower bound")
149 |     plt.plot(X_plot, y_predicted_interval[:, 1], label="95% HDI Upper bound")
150 |     plt.legend()
151 |     plt.savefig("readme_regression.png", bbox_inches="tight")
152 | 
153 | 
154 | if __name__ == "__main__":
155 |     # plot_mean_bootstrap()
156 |     # plot_mean_resample_bootstrap()
157 |     # plot_median()
158 |     # plot_var_bootstrap()
159 |     # plot_self_covar_bootstrap()
160 |     plot_covar_bootstrap()
161 |     # plot_var_resample_bootstrap()
162 |     # plot_mean_method_comparison()
163 |     # plot_regression_bootstrap()
164 |     # plot_regression_wrapper_bootstrap()
165 |     # plot_mean_bootstrap_exponential_readme()
166 |     # plot_regression_slope_distribution_readme()
167 | 


--------------------------------------------------------------------------------
/bayesian_bootstrap/demos/group_mean_secret_weapon.py:
--------------------------------------------------------------------------------
 1 | import numpy as np
 2 | from bayesian_bootstrap import mean, highest_density_interval
 3 | from matplotlib import pyplot as plt
 4 | import seaborn as sns  # noqa: F401
 5 | 
 6 | 
 7 | def plot_group_hdis(samples, labels, alpha, n_replications):
 8 |     for i, (s, l) in enumerate(zip(samples, labels)):
 9 |         posterior = mean(s, n_replications)
10 |         l, r = highest_density_interval(posterior)
11 |         plt.plot([i, i], [l, r])
12 |         plt.plot([i], [np.mean(posterior)], marker="o")
13 |     plt.xticks(range(len(labels)), labels)
14 | 
15 | 
16 | if __name__ == "__main__":
17 |     samples = [
18 |         np.random.normal(0, 1, 100),
19 |         np.random.normal(0, 2, 100),
20 |         np.random.normal(1, 1, 100),
21 |     ]
22 |     labels = ["0,1", "0,2", "1,1"]
23 |     plot_group_hdis(samples, labels, 0.05, 10000)
24 |     plt.show()
25 | 


--------------------------------------------------------------------------------
/bayesian_bootstrap/demos/linear_regression.py:
--------------------------------------------------------------------------------
 1 | import numpy as np
 2 | from matplotlib import pyplot as plt
 3 | import seaborn as sns
 4 | from bayesian_bootstrap import linear_regression
 5 | 
 6 | X = np.linspace(-5, 5, 50)
 7 | y = 2 * X + np.random.normal(0, 1, 50)
 8 | results = linear_regression(X.reshape(-1, 1), y, 1000)
 9 | sns.distplot(results[:, 0])
10 | plt.show()
11 | 


--------------------------------------------------------------------------------
/bayesian_bootstrap/demos/readme_exponential.png:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/lmc2179/bayesian_bootstrap/93b8cf41b0675ec24a18e554f5011cdd07de7d91/bayesian_bootstrap/demos/readme_exponential.png


--------------------------------------------------------------------------------
/bayesian_bootstrap/demos/readme_regression.png:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/lmc2179/bayesian_bootstrap/93b8cf41b0675ec24a18e554f5011cdd07de7d91/bayesian_bootstrap/demos/readme_regression.png


--------------------------------------------------------------------------------
/bayesian_bootstrap/tests/test_bootstrap.py:
--------------------------------------------------------------------------------
  1 | import unittest
  2 | import numpy as np
  3 | import scipy
  4 | import bayesian_bootstrap as bb
  5 | from bayesian_bootstrap import (
  6 |     mean,
  7 |     var,
  8 |     bayesian_bootstrap,
  9 |     central_credible_interval,
 10 |     highest_density_interval,
 11 |     BayesianBootstrapBagging,
 12 |     covar,
 13 | )
 14 | from sklearn.linear_model import LinearRegression
 15 | 
 16 | RNG = np.random.default_rng(1337)  # repeatable pseudorandomness
 17 | 
 18 | 
 19 | class TestMoments(unittest.TestCase):
 20 |     def test_mean(self):
 21 |         X = [-1, 0, 1]
 22 |         posterior_samples = mean(X, 10000)
 23 |         self.assertAlmostEqual(np.mean(posterior_samples), 0, delta=0.015)
 24 |         self.assertAlmostEqual(len([s for s in posterior_samples if s < 0]), 5000, delta=1000)
 25 | 
 26 |     def test_variance(self):
 27 |         X = RNG.uniform(-1, 1, 500)
 28 |         posterior_samples = var(X, 10000)
 29 |         self.assertAlmostEqual(np.mean(posterior_samples), 1 / 3.0, delta=0.05)
 30 | 
 31 |     def test_self_covar(self):
 32 |         X = RNG.uniform(-1, 1, 500)
 33 |         posterior_samples = covar(X, X, 10000)
 34 |         self.assertAlmostEqual(np.mean(posterior_samples), np.var(X), delta=0.05)
 35 | 
 36 |     def test_covar(self):
 37 |         X = RNG.uniform(-1, 1, 500)
 38 |         Y = RNG.uniform(-1, 1, 500)
 39 |         posterior_samples = covar(X, Y, 10000)
 40 |         self.assertAlmostEqual(np.mean(posterior_samples), 0, delta=0.05)
 41 | 
 42 |     def test_mean_resample(self):
 43 |         X = [-1, 0, 1]
 44 |         posterior_samples = bayesian_bootstrap(X, np.mean, 10000, 100, low_mem=True)
 45 |         self.assertAlmostEqual(np.mean(posterior_samples), 0, delta=0.01)
 46 |         self.assertAlmostEqual(len([s for s in posterior_samples if s < 0]), 5000, delta=1000)
 47 |         posterior_samples = bayesian_bootstrap(X, np.mean, 10000, 100, low_mem=False)
 48 |         self.assertAlmostEqual(np.mean(posterior_samples), 0, delta=0.01)
 49 |         self.assertAlmostEqual(len([s for s in posterior_samples if s < 0]), 5000, delta=1000)
 50 | 
 51 |     def test_var_resample(self):
 52 |         X = RNG.uniform(-1, 1, 500)
 53 |         posterior_samples = bayesian_bootstrap(X, np.var, 10000, 5000, low_mem=True)
 54 |         self.assertAlmostEqual(np.mean(posterior_samples), 1 / 3.0, delta=0.05)
 55 |         X = RNG.uniform(-1, 1, 500)
 56 |         posterior_samples = bayesian_bootstrap(X, np.var, 10000, 5000, low_mem=False)
 57 |         self.assertAlmostEqual(np.mean(posterior_samples), 1 / 3.0, delta=0.05)
 58 | 
 59 | 
 60 | class TestIntervals(unittest.TestCase):
 61 |     def test_central_credible_interval(self):
 62 |         l, r = central_credible_interval(self._shuffle(range(10)), alpha=0.2)
 63 |         self.assertEqual(l, 0.9)
 64 |         self.assertEqual(r, 8.1)
 65 |         l, r = central_credible_interval(self._shuffle(range(10)), alpha=0.19)
 66 |         self.assertEqual(l, 0.855)
 67 |         self.assertEqual(r, 8.145)
 68 |         l, r = central_credible_interval(self._shuffle(range(20)), alpha=0.1)
 69 |         self.assertAlmostEqual(l, 0.95)
 70 |         self.assertEqual(r, 18.05)
 71 | 
 72 |     def test_hpdi(self):
 73 |         l, r = highest_density_interval(self._shuffle([0, 10, 1] + [1.1] * 7), alpha=0.2)
 74 |         self.assertEqual(l, 1)
 75 |         self.assertEqual(r, 1.1)
 76 |         l, r = highest_density_interval(self._shuffle([0, 10, 1.1, 1]), alpha=0.5)
 77 |         self.assertEqual(l, 1)
 78 |         self.assertEqual(r, 1.1)
 79 | 
 80 |     def _shuffle(self, x):
 81 |         x = list(x)
 82 |         RNG.shuffle(x)
 83 |         return x
 84 | 
 85 | 
 86 | class TestRegression(unittest.TestCase):
 87 |     def test_parameter_estimation_resampling_low_memory(self):
 88 |         X = RNG.uniform(0, 4, 1000)
 89 |         y = X + RNG.normal(0, 1, 1000)
 90 |         m = BayesianBootstrapBagging(LinearRegression(), 10000, 1000, low_mem=True)
 91 |         m.fit(X.reshape(-1, 1), y)
 92 |         coef_samples = [b.coef_ for b in m.base_models_]
 93 |         intercept_samples = [b.intercept_ for b in m.base_models_]
 94 |         self.assertAlmostEqual(np.mean(coef_samples), 1, delta=0.3)
 95 |         l, r = central_credible_interval(coef_samples, alpha=0.05)
 96 |         self.assertLess(l, 1)
 97 |         self.assertGreater(r, 1)
 98 |         l, r = highest_density_interval(coef_samples, alpha=0.05)
 99 |         self.assertLess(l, 1)
100 |         self.assertGreater(r, 1)
101 |         self.assertAlmostEqual(np.mean(intercept_samples), 0, delta=0.3)
102 |         l, r = central_credible_interval(intercept_samples, alpha=0.05)
103 |         self.assertLess(l, 0)
104 |         self.assertGreater(r, 0)
105 |         self.assertAlmostEqual(np.mean(intercept_samples), 0, delta=0.3)
106 |         l, r = highest_density_interval(intercept_samples, alpha=0.05)
107 |         self.assertLess(l, 0)
108 |         self.assertGreater(r, 0)
109 | 
110 |     def test_parameter_estimation_resampling(self):
111 |         X = RNG.uniform(0, 4, 1000)
112 |         y = X + RNG.normal(0, 1, 1000)
113 |         m = BayesianBootstrapBagging(LinearRegression(), 10000, 1000, low_mem=False)
114 |         m.fit(X.reshape(-1, 1), y)
115 |         coef_samples = [b.coef_ for b in m.base_models_]
116 |         intercept_samples = [b.intercept_ for b in m.base_models_]
117 |         self.assertAlmostEqual(np.mean(coef_samples), 1, delta=0.3)
118 |         l, r = central_credible_interval(coef_samples, alpha=0.05)
119 |         self.assertLess(l, 1)
120 |         self.assertGreater(r, 1)
121 |         l, r = highest_density_interval(coef_samples, alpha=0.05)
122 |         self.assertLess(l, 1)
123 |         self.assertGreater(r, 1)
124 |         self.assertAlmostEqual(np.mean(intercept_samples), 0, delta=0.3)
125 |         l, r = central_credible_interval(intercept_samples, alpha=0.05)
126 |         self.assertLess(l, 0)
127 |         self.assertGreater(r, 0)
128 |         self.assertAlmostEqual(np.mean(intercept_samples), 0, delta=0.3)
129 |         l, r = highest_density_interval(intercept_samples, alpha=0.05)
130 |         self.assertLess(l, 0)
131 |         self.assertGreater(r, 0)
132 | 
133 |     def test_parameter_estimation_bayes(self):
134 |         X = RNG.uniform(0, 4, 1000)
135 |         y = X + RNG.normal(0, 1, 1000)
136 |         m = BayesianBootstrapBagging(LinearRegression(), 10000, low_mem=False)
137 |         m.fit(X.reshape(-1, 1), y)
138 |         coef_samples = [b.coef_ for b in m.base_models_]
139 |         intercept_samples = [b.intercept_ for b in m.base_models_]
140 |         self.assertAlmostEqual(np.mean(coef_samples), 1, delta=0.3)
141 |         l, r = central_credible_interval(coef_samples, alpha=0.05)
142 |         self.assertLess(l, 1)
143 |         self.assertGreater(r, 1)
144 |         l, r = highest_density_interval(coef_samples, alpha=0.05)
145 |         self.assertLess(l, 1)
146 |         self.assertGreater(r, 1)
147 |         self.assertAlmostEqual(np.mean(intercept_samples), 0, delta=0.3)
148 |         l, r = central_credible_interval(intercept_samples, alpha=0.05)
149 |         self.assertLess(l, 0)
150 |         self.assertGreater(r, 0)
151 |         self.assertAlmostEqual(np.mean(intercept_samples), 0, delta=0.3)
152 |         l, r = highest_density_interval(intercept_samples, alpha=0.05)
153 |         self.assertLess(l, 0)
154 |         self.assertGreater(r, 0)
155 | 
156 |     def test_parameter_estimation_bayes_low_memory(self):
157 |         X = RNG.uniform(0, 4, 1000)
158 |         y = X + RNG.normal(0, 1, 1000)
159 |         m = BayesianBootstrapBagging(LinearRegression(), 10000, low_mem=True)
160 |         m.fit(X.reshape(-1, 1), y)
161 |         coef_samples = [b.coef_ for b in m.base_models_]
162 |         intercept_samples = [b.intercept_ for b in m.base_models_]
163 |         self.assertAlmostEqual(np.mean(coef_samples), 1, delta=0.3)
164 |         l, r = central_credible_interval(coef_samples, alpha=0.05)
165 |         self.assertLess(l, 1)
166 |         self.assertGreater(r, 1)
167 |         l, r = highest_density_interval(coef_samples, alpha=0.05)
168 |         self.assertLess(l, 1)
169 |         self.assertGreater(r, 1)
170 |         self.assertAlmostEqual(np.mean(intercept_samples), 0, delta=0.3)
171 |         l, r = central_credible_interval(intercept_samples, alpha=0.05)
172 |         self.assertLess(l, 0)
173 |         self.assertGreater(r, 0)
174 |         self.assertAlmostEqual(np.mean(intercept_samples), 0, delta=0.3)
175 |         l, r = highest_density_interval(intercept_samples, alpha=0.05)
176 |         self.assertLess(l, 0)
177 |         self.assertGreater(r, 0)
178 | 
179 | 
180 | def test_pearsonr():
181 |     x = np.linspace(0, 5, 10)
182 |     y = np.linspace(0, 5, 10)
183 |     assert np.mean(bb.pearsonr(x, y, 10000)) == 1
184 |     assert np.mean(bb.pearsonr(x, -y, 10000)) == -1
185 | 
186 |     x = [0, 1, 3, 6]
187 |     y = [1, 2, 5, 7]
188 |     assert np.isclose(np.mean(bb.pearsonr(x, y, 10000)), scipy.stats.pearsonr(x, y)[0], atol=0.001)
189 | 
190 |     x = np.linspace(-10, 10, 10000)
191 |     y = np.abs(x)
192 |     assert np.isclose(scipy.stats.pearsonr(x, y)[0], np.mean(bb.pearsonr(x, y, 1000)), atol=0.001)
193 | 
194 | 
195 | if __name__ == "__main__":
196 |     unittest.main()
197 | 


--------------------------------------------------------------------------------
/docs/bootstrap_documentation.html:
--------------------------------------------------------------------------------
   1 | <!doctype html>
   2 | <head>
   3 |   <meta http-equiv="Content-Type" content="text/html; charset=utf-8" />
   4 |   <meta name="viewport" content="width=device-width, initial-scale=1, minimum-scale=1" />
   5 | 
   6 |     <title>bayesian_bootstrap.bootstrap API documentation</title>
   7 |     <meta name="description" content="" />
   8 | 
   9 |   <link href='http://fonts.googleapis.com/css?family=Source+Sans+Pro:400,300' rel='stylesheet' type='text/css'>
  10 |   
  11 |   <style type="text/css">
  12 |   
  13 | * {
  14 |   box-sizing: border-box;
  15 | }
  16 | /*! normalize.css v1.1.1 | MIT License | git.io/normalize */
  17 | 
  18 | /* ==========================================================================
  19 |    HTML5 display definitions
  20 |    ========================================================================== */
  21 | 
  22 | /**
  23 |  * Correct `block` display not defined in IE 6/7/8/9 and Firefox 3.
  24 |  */
  25 | 
  26 | article,
  27 | aside,
  28 | details,
  29 | figcaption,
  30 | figure,
  31 | footer,
  32 | header,
  33 | hgroup,
  34 | main,
  35 | nav,
  36 | section,
  37 | summary {
  38 |     display: block;
  39 | }
  40 | 
  41 | /**
  42 |  * Correct `inline-block` display not defined in IE 6/7/8/9 and Firefox 3.
  43 |  */
  44 | 
  45 | audio,
  46 | canvas,
  47 | video {
  48 |     display: inline-block;
  49 |     *display: inline;
  50 |     *zoom: 1;
  51 | }
  52 | 
  53 | /**
  54 |  * Prevent modern browsers from displaying `audio` without controls.
  55 |  * Remove excess height in iOS 5 devices.
  56 |  */
  57 | 
  58 | audio:not([controls]) {
  59 |     display: none;
  60 |     height: 0;
  61 | }
  62 | 
  63 | /**
  64 |  * Address styling not present in IE 7/8/9, Firefox 3, and Safari 4.
  65 |  * Known issue: no IE 6 support.
  66 |  */
  67 | 
  68 | [hidden] {
  69 |     display: none;
  70 | }
  71 | 
  72 | /* ==========================================================================
  73 |    Base
  74 |    ========================================================================== */
  75 | 
  76 | /**
  77 |  * 1. Prevent system color scheme's background color being used in Firefox, IE,
  78 |  *    and Opera.
  79 |  * 2. Prevent system color scheme's text color being used in Firefox, IE, and
  80 |  *    Opera.
  81 |  * 3. Correct text resizing oddly in IE 6/7 when body `font-size` is set using
  82 |  *    `em` units.
  83 |  * 4. Prevent iOS text size adjust after orientation change, without disabling
  84 |  *    user zoom.
  85 |  */
  86 | 
  87 | html {
  88 |     background: #fff; /* 1 */
  89 |     color: #000; /* 2 */
  90 |     font-size: 100%; /* 3 */
  91 |     -webkit-text-size-adjust: 100%; /* 4 */
  92 |     -ms-text-size-adjust: 100%; /* 4 */
  93 | }
  94 | 
  95 | /**
  96 |  * Address `font-family` inconsistency between `textarea` and other form
  97 |  * elements.
  98 |  */
  99 | 
 100 | html,
 101 | button,
 102 | input,
 103 | select,
 104 | textarea {
 105 |     font-family: sans-serif;
 106 | }
 107 | 
 108 | /**
 109 |  * Address margins handled incorrectly in IE 6/7.
 110 |  */
 111 | 
 112 | body {
 113 |     margin: 0;
 114 | }
 115 | 
 116 | /* ==========================================================================
 117 |    Links
 118 |    ========================================================================== */
 119 | 
 120 | /**
 121 |  * Address `outline` inconsistency between Chrome and other browsers.
 122 |  */
 123 | 
 124 | a:focus {
 125 |     outline: thin dotted;
 126 | }
 127 | 
 128 | /**
 129 |  * Improve readability when focused and also mouse hovered in all browsers.
 130 |  */
 131 | 
 132 | a:active,
 133 | a:hover {
 134 |     outline: 0;
 135 | }
 136 | 
 137 | /* ==========================================================================
 138 |    Typography
 139 |    ========================================================================== */
 140 | 
 141 | /**
 142 |  * Address font sizes and margins set differently in IE 6/7.
 143 |  * Address font sizes within `section` and `article` in Firefox 4+, Safari 5,
 144 |  * and Chrome.
 145 |  */
 146 | 
 147 | h1 {
 148 |     font-size: 2em;
 149 |     margin: 0.67em 0;
 150 | }
 151 | 
 152 | h2 {
 153 |     font-size: 1.5em;
 154 |     margin: 0.83em 0;
 155 | }
 156 | 
 157 | h3 {
 158 |     font-size: 1.17em;
 159 |     margin: 1em 0;
 160 | }
 161 | 
 162 | h4 {
 163 |     font-size: 1em;
 164 |     margin: 1.33em 0;
 165 | }
 166 | 
 167 | h5 {
 168 |     font-size: 0.83em;
 169 |     margin: 1.67em 0;
 170 | }
 171 | 
 172 | h6 {
 173 |     font-size: 0.67em;
 174 |     margin: 2.33em 0;
 175 | }
 176 | 
 177 | /**
 178 |  * Address styling not present in IE 7/8/9, Safari 5, and Chrome.
 179 |  */
 180 | 
 181 | abbr[title] {
 182 |     border-bottom: 1px dotted;
 183 | }
 184 | 
 185 | /**
 186 |  * Address style set to `bolder` in Firefox 3+, Safari 4/5, and Chrome.
 187 |  */
 188 | 
 189 | b,
 190 | strong {
 191 |     font-weight: bold;
 192 | }
 193 | 
 194 | blockquote {
 195 |     margin: 1em 40px;
 196 | }
 197 | 
 198 | /**
 199 |  * Address styling not present in Safari 5 and Chrome.
 200 |  */
 201 | 
 202 | dfn {
 203 |     font-style: italic;
 204 | }
 205 | 
 206 | /**
 207 |  * Address differences between Firefox and other browsers.
 208 |  * Known issue: no IE 6/7 normalization.
 209 |  */
 210 | 
 211 | hr {
 212 |     -moz-box-sizing: content-box;
 213 |     box-sizing: content-box;
 214 |     height: 0;
 215 | }
 216 | 
 217 | /**
 218 |  * Address styling not present in IE 6/7/8/9.
 219 |  */
 220 | 
 221 | mark {
 222 |     background: #ff0;
 223 |     color: #000;
 224 | }
 225 | 
 226 | /**
 227 |  * Address margins set differently in IE 6/7.
 228 |  */
 229 | 
 230 | p,
 231 | pre {
 232 |     margin: 1em 0;
 233 | }
 234 | 
 235 | /**
 236 |  * Correct font family set oddly in IE 6, Safari 4/5, and Chrome.
 237 |  */
 238 | 
 239 | code,
 240 | kbd,
 241 | pre,
 242 | samp {
 243 |     font-family: monospace, serif;
 244 |     _font-family: 'courier new', monospace;
 245 |     font-size: 1em;
 246 | }
 247 | 
 248 | /**
 249 |  * Improve readability of pre-formatted text in all browsers.
 250 |  */
 251 | 
 252 | pre {
 253 |     white-space: pre;
 254 |     white-space: pre-wrap;
 255 |     word-wrap: break-word;
 256 | }
 257 | 
 258 | /**
 259 |  * Address CSS quotes not supported in IE 6/7.
 260 |  */
 261 | 
 262 | q {
 263 |     quotes: none;
 264 | }
 265 | 
 266 | /**
 267 |  * Address `quotes` property not supported in Safari 4.
 268 |  */
 269 | 
 270 | q:before,
 271 | q:after {
 272 |     content: '';
 273 |     content: none;
 274 | }
 275 | 
 276 | /**
 277 |  * Address inconsistent and variable font size in all browsers.
 278 |  */
 279 | 
 280 | small {
 281 |     font-size: 80%;
 282 | }
 283 | 
 284 | /**
 285 |  * Prevent `sub` and `sup` affecting `line-height` in all browsers.
 286 |  */
 287 | 
 288 | sub,
 289 | sup {
 290 |     font-size: 75%;
 291 |     line-height: 0;
 292 |     position: relative;
 293 |     vertical-align: baseline;
 294 | }
 295 | 
 296 | sup {
 297 |     top: -0.5em;
 298 | }
 299 | 
 300 | sub {
 301 |     bottom: -0.25em;
 302 | }
 303 | 
 304 | /* ==========================================================================
 305 |    Lists
 306 |    ========================================================================== */
 307 | 
 308 | /**
 309 |  * Address margins set differently in IE 6/7.
 310 |  */
 311 | 
 312 | dl,
 313 | menu,
 314 | ol,
 315 | ul {
 316 |     margin: 1em 0;
 317 | }
 318 | 
 319 | dd {
 320 |     margin: 0 0 0 40px;
 321 | }
 322 | 
 323 | /**
 324 |  * Address paddings set differently in IE 6/7.
 325 |  */
 326 | 
 327 | menu,
 328 | ol,
 329 | ul {
 330 |     padding: 0 0 0 40px;
 331 | }
 332 | 
 333 | /**
 334 |  * Correct list images handled incorrectly in IE 7.
 335 |  */
 336 | 
 337 | nav ul,
 338 | nav ol {
 339 |     list-style: none;
 340 |     list-style-image: none;
 341 | }
 342 | 
 343 | /* ==========================================================================
 344 |    Embedded content
 345 |    ========================================================================== */
 346 | 
 347 | /**
 348 |  * 1. Remove border when inside `a` element in IE 6/7/8/9 and Firefox 3.
 349 |  * 2. Improve image quality when scaled in IE 7.
 350 |  */
 351 | 
 352 | img {
 353 |     border: 0; /* 1 */
 354 |     -ms-interpolation-mode: bicubic; /* 2 */
 355 | }
 356 | 
 357 | /**
 358 |  * Correct overflow displayed oddly in IE 9.
 359 |  */
 360 | 
 361 | svg:not(:root) {
 362 |     overflow: hidden;
 363 | }
 364 | 
 365 | /* ==========================================================================
 366 |    Figures
 367 |    ========================================================================== */
 368 | 
 369 | /**
 370 |  * Address margin not present in IE 6/7/8/9, Safari 5, and Opera 11.
 371 |  */
 372 | 
 373 | figure {
 374 |     margin: 0;
 375 | }
 376 | 
 377 | /* ==========================================================================
 378 |    Forms
 379 |    ========================================================================== */
 380 | 
 381 | /**
 382 |  * Correct margin displayed oddly in IE 6/7.
 383 |  */
 384 | 
 385 | form {
 386 |     margin: 0;
 387 | }
 388 | 
 389 | /**
 390 |  * Define consistent border, margin, and padding.
 391 |  */
 392 | 
 393 | fieldset {
 394 |     border: 1px solid #c0c0c0;
 395 |     margin: 0 2px;
 396 |     padding: 0.35em 0.625em 0.75em;
 397 | }
 398 | 
 399 | /**
 400 |  * 1. Correct color not being inherited in IE 6/7/8/9.
 401 |  * 2. Correct text not wrapping in Firefox 3.
 402 |  * 3. Correct alignment displayed oddly in IE 6/7.
 403 |  */
 404 | 
 405 | legend {
 406 |     border: 0; /* 1 */
 407 |     padding: 0;
 408 |     white-space: normal; /* 2 */
 409 |     *margin-left: -7px; /* 3 */
 410 | }
 411 | 
 412 | /**
 413 |  * 1. Correct font size not being inherited in all browsers.
 414 |  * 2. Address margins set differently in IE 6/7, Firefox 3+, Safari 5,
 415 |  *    and Chrome.
 416 |  * 3. Improve appearance and consistency in all browsers.
 417 |  */
 418 | 
 419 | button,
 420 | input,
 421 | select,
 422 | textarea {
 423 |     font-size: 100%; /* 1 */
 424 |     margin: 0; /* 2 */
 425 |     vertical-align: baseline; /* 3 */
 426 |     *vertical-align: middle; /* 3 */
 427 | }
 428 | 
 429 | /**
 430 |  * Address Firefox 3+ setting `line-height` on `input` using `!important` in
 431 |  * the UA stylesheet.
 432 |  */
 433 | 
 434 | button,
 435 | input {
 436 |     line-height: normal;
 437 | }
 438 | 
 439 | /**
 440 |  * Address inconsistent `text-transform` inheritance for `button` and `select`.
 441 |  * All other form control elements do not inherit `text-transform` values.
 442 |  * Correct `button` style inheritance in Chrome, Safari 5+, and IE 6+.
 443 |  * Correct `select` style inheritance in Firefox 4+ and Opera.
 444 |  */
 445 | 
 446 | button,
 447 | select {
 448 |     text-transform: none;
 449 | }
 450 | 
 451 | /**
 452 |  * 1. Avoid the WebKit bug in Android 4.0.* where (2) destroys native `audio`
 453 |  *    and `video` controls.
 454 |  * 2. Correct inability to style clickable `input` types in iOS.
 455 |  * 3. Improve usability and consistency of cursor style between image-type
 456 |  *    `input` and others.
 457 |  * 4. Remove inner spacing in IE 7 without affecting normal text inputs.
 458 |  *    Known issue: inner spacing remains in IE 6.
 459 |  */
 460 | 
 461 | button,
 462 | html input[type="button"], /* 1 */
 463 | input[type="reset"],
 464 | input[type="submit"] {
 465 |     -webkit-appearance: button; /* 2 */
 466 |     cursor: pointer; /* 3 */
 467 |     *overflow: visible;  /* 4 */
 468 | }
 469 | 
 470 | /**
 471 |  * Re-set default cursor for disabled elements.
 472 |  */
 473 | 
 474 | button[disabled],
 475 | html input[disabled] {
 476 |     cursor: default;
 477 | }
 478 | 
 479 | /**
 480 |  * 1. Address box sizing set to content-box in IE 8/9.
 481 |  * 2. Remove excess padding in IE 8/9.
 482 |  * 3. Remove excess padding in IE 7.
 483 |  *    Known issue: excess padding remains in IE 6.
 484 |  */
 485 | 
 486 | input[type="checkbox"],
 487 | input[type="radio"] {
 488 |     box-sizing: border-box; /* 1 */
 489 |     padding: 0; /* 2 */
 490 |     *height: 13px; /* 3 */
 491 |     *width: 13px; /* 3 */
 492 | }
 493 | 
 494 | /**
 495 |  * 1. Address `appearance` set to `searchfield` in Safari 5 and Chrome.
 496 |  * 2. Address `box-sizing` set to `border-box` in Safari 5 and Chrome
 497 |  *    (include `-moz` to future-proof).
 498 |  */
 499 | 
 500 | input[type="search"] {
 501 |     -webkit-appearance: textfield; /* 1 */
 502 |     -moz-box-sizing: content-box;
 503 |     -webkit-box-sizing: content-box; /* 2 */
 504 |     box-sizing: content-box;
 505 | }
 506 | 
 507 | /**
 508 |  * Remove inner padding and search cancel button in Safari 5 and Chrome
 509 |  * on OS X.
 510 |  */
 511 | 
 512 | input[type="search"]::-webkit-search-cancel-button,
 513 | input[type="search"]::-webkit-search-decoration {
 514 |     -webkit-appearance: none;
 515 | }
 516 | 
 517 | /**
 518 |  * Remove inner padding and border in Firefox 3+.
 519 |  */
 520 | 
 521 | button::-moz-focus-inner,
 522 | input::-moz-focus-inner {
 523 |     border: 0;
 524 |     padding: 0;
 525 | }
 526 | 
 527 | /**
 528 |  * 1. Remove default vertical scrollbar in IE 6/7/8/9.
 529 |  * 2. Improve readability and alignment in all browsers.
 530 |  */
 531 | 
 532 | textarea {
 533 |     overflow: auto; /* 1 */
 534 |     vertical-align: top; /* 2 */
 535 | }
 536 | 
 537 | /* ==========================================================================
 538 |    Tables
 539 |    ========================================================================== */
 540 | 
 541 | /**
 542 |  * Remove most spacing between table cells.
 543 |  */
 544 | 
 545 | table {
 546 |     border-collapse: collapse;
 547 |     border-spacing: 0;
 548 | }
 549 | 
 550 |   </style>
 551 | 
 552 |   <style type="text/css">
 553 |   
 554 |   html, body {
 555 |     margin: 0;
 556 |     padding: 0;
 557 |     min-height: 100%;
 558 |   }
 559 |   body {
 560 |     background: #fff;
 561 |     font-family: "Source Sans Pro", "Helvetica Neueue", Helvetica, sans;
 562 |     font-weight: 300;
 563 |     font-size: 16px;
 564 |     line-height: 1.6em;
 565 |   }
 566 |   #content {
 567 |     width: 70%;
 568 |     max-width: 850px;
 569 |     float: left;
 570 |     padding: 30px 60px;
 571 |     border-left: 1px solid #ddd;
 572 |   }
 573 |   #sidebar {
 574 |     width: 25%;
 575 |     float: left;
 576 |     padding: 30px;
 577 |     overflow: hidden;
 578 |   }
 579 |   #nav {
 580 |     font-size: 130%;
 581 |     margin: 0 0 15px 0;
 582 |   }
 583 | 
 584 |   #top {
 585 |     display: block;
 586 |     position: fixed;
 587 |     bottom: 5px;
 588 |     left: 5px;
 589 |     font-size: .85em;
 590 |     text-transform: uppercase;
 591 |   }
 592 | 
 593 |   #footer {
 594 |     font-size: .75em;
 595 |     padding: 5px 30px;
 596 |     border-top: 1px solid #ddd;
 597 |     text-align: right;
 598 |   }
 599 |     #footer p {
 600 |       margin: 0 0 0 30px;
 601 |       display: inline-block;
 602 |     }
 603 | 
 604 |   h1, h2, h3, h4, h5 {
 605 |     font-weight: 300;
 606 |   }
 607 |   h1 {
 608 |     font-size: 2.5em;
 609 |     line-height: 1.1em;
 610 |     margin: 0 0 .50em 0;
 611 |   }
 612 | 
 613 |   h2 {
 614 |     font-size: 1.75em;
 615 |     margin: 1em 0 .50em 0;
 616 |   }
 617 | 
 618 |   h3 {
 619 |     margin: 25px 0 10px 0;
 620 |   }
 621 | 
 622 |   h4 {
 623 |     margin: 0;
 624 |     font-size: 105%;
 625 |   }
 626 | 
 627 |   a {
 628 |     color: #058;
 629 |     text-decoration: none;
 630 |     transition: color .3s ease-in-out;
 631 |   }
 632 | 
 633 |   a:hover {
 634 |     color: #e08524;
 635 |     transition: color .3s ease-in-out;
 636 |   }
 637 | 
 638 |   pre, code, .mono, .name {
 639 |     font-family: "Ubuntu Mono", "Cousine", "DejaVu Sans Mono", monospace;
 640 |   }
 641 | 
 642 |   .title .name {
 643 |     font-weight: bold;
 644 |   }
 645 |   .section-title {
 646 |     margin-top: 2em;
 647 |   }
 648 |   .ident {
 649 |     color: #900;
 650 |   }
 651 | 
 652 |   code {
 653 |     background: #f9f9f9;
 654 |   } 
 655 | 
 656 |   pre {
 657 |     background: #fefefe;
 658 |     border: 1px solid #ddd;
 659 |     box-shadow: 2px 2px 0 #f3f3f3;
 660 |     margin: 0 30px;
 661 |     padding: 15px 30px;
 662 |   }
 663 | 
 664 |   .codehilite {
 665 |     margin: 0 30px 10px 30px;
 666 |   }
 667 | 
 668 |     .codehilite pre {
 669 |       margin: 0;
 670 |     }
 671 |     .codehilite .err { background: #ff3300; color: #fff !important; } 
 672 | 
 673 |   table#module-list {
 674 |     font-size: 110%;
 675 |   }
 676 | 
 677 |     table#module-list tr td:first-child {
 678 |       padding-right: 10px;
 679 |       white-space: nowrap;
 680 |     }
 681 | 
 682 |     table#module-list td {
 683 |       vertical-align: top;
 684 |       padding-bottom: 8px;
 685 |     }
 686 | 
 687 |       table#module-list td p {
 688 |         margin: 0 0 7px 0;
 689 |       }
 690 | 
 691 |   .def {
 692 |     display: table;
 693 |   }
 694 | 
 695 |     .def p {
 696 |       display: table-cell;
 697 |       vertical-align: top;
 698 |       text-align: left;
 699 |     }
 700 | 
 701 |     .def p:first-child {
 702 |       white-space: nowrap;
 703 |     }
 704 | 
 705 |     .def p:last-child {
 706 |       width: 100%;
 707 |     }
 708 | 
 709 | 
 710 |   #index {
 711 |     list-style-type: none;
 712 |     margin: 0;
 713 |     padding: 0;
 714 |   }
 715 |     ul#index .class_name {
 716 |       /* font-size: 110%; */
 717 |       font-weight: bold;
 718 |     }
 719 |     #index ul {
 720 |       margin: 0;
 721 |     }
 722 | 
 723 |   .item {
 724 |     margin: 0 0 15px 0;
 725 |   }
 726 | 
 727 |     .item .class {
 728 |       margin: 0 0 25px 30px;
 729 |     }
 730 | 
 731 |       .item .class ul.class_list {
 732 |         margin: 0 0 20px 0;
 733 |       }
 734 | 
 735 |     .item .name {
 736 |       background: #fafafa;
 737 |       margin: 0;
 738 |       font-weight: bold;
 739 |       padding: 5px 10px;
 740 |       border-radius: 3px;
 741 |       display: inline-block;
 742 |       min-width: 40%;
 743 |     }
 744 |       .item .name:hover {
 745 |         background: #f6f6f6;
 746 |       }
 747 | 
 748 |     .item .empty_desc {
 749 |       margin: 0 0 5px 0;
 750 |       padding: 0;
 751 |     }
 752 | 
 753 |     .item .inheritance {
 754 |       margin: 3px 0 0 30px;
 755 |     }
 756 | 
 757 |     .item .inherited {
 758 |       color: #666;
 759 |     }
 760 | 
 761 |     .item .desc {
 762 |       padding: 0 8px;
 763 |       margin: 0;
 764 |     }
 765 | 
 766 |       .item .desc p {
 767 |         margin: 0 0 10px 0;
 768 |       }
 769 | 
 770 |     .source_cont {
 771 |       margin: 0;
 772 |       padding: 0;
 773 |     }
 774 | 
 775 |     .source_link a {
 776 |       background: #ffc300;
 777 |       font-weight: 400;
 778 |       font-size: .75em;
 779 |       text-transform: uppercase;
 780 |       color: #fff;
 781 |       text-shadow: 1px 1px 0 #f4b700;
 782 |       
 783 |       padding: 3px 8px;
 784 |       border-radius: 2px;
 785 |       transition: background .3s ease-in-out;
 786 |     }
 787 |       .source_link a:hover {
 788 |         background: #FF7200;
 789 |         text-shadow: none;
 790 |         transition: background .3s ease-in-out;
 791 |       }
 792 | 
 793 |     .source {
 794 |       display: none;
 795 |       max-height: 600px;
 796 |       overflow-y: scroll;
 797 |       margin-bottom: 15px;
 798 |     }
 799 | 
 800 |       .source .codehilite {
 801 |         margin: 0;
 802 |       }
 803 | 
 804 |   .desc h1, .desc h2, .desc h3 {
 805 |     font-size: 100% !important;
 806 |   }
 807 |   .clear {
 808 |     clear: both;
 809 |   }
 810 | 
 811 |   @media all and (max-width: 950px) {
 812 |     #sidebar {
 813 |       width: 35%;
 814 |     }
 815 |     #content {
 816 |       width: 65%;
 817 |     }
 818 |   }
 819 |   @media all and (max-width: 650px) {
 820 |     #top {
 821 |       display: none;
 822 |     }
 823 |     #sidebar {
 824 |       float: none;
 825 |       width: auto;
 826 |     }
 827 |     #content {
 828 |       float: none;
 829 |       width: auto;
 830 |       padding: 30px;
 831 |     }
 832 | 
 833 |     #index ul {
 834 |       padding: 0;
 835 |       margin-bottom: 15px;
 836 |     }
 837 |     #index ul li {
 838 |       display: inline-block;
 839 |       margin-right: 30px;
 840 |     }
 841 |     #footer {
 842 |       text-align: left;
 843 |     }
 844 |     #footer p {
 845 |       display: block;
 846 |       margin: inherit;
 847 |     }
 848 |   }
 849 | 
 850 |   /*****************************/
 851 | 
 852 |   </style>
 853 | 
 854 |   <style type="text/css">
 855 |   .codehilite .hll { background-color: #ffffcc }
 856 | .codehilite  { background: #f8f8f8; }
 857 | .codehilite .c { color: #408080; font-style: italic } /* Comment */
 858 | .codehilite .err { border: 1px solid #FF0000 } /* Error */
 859 | .codehilite .k { color: #008000; font-weight: bold } /* Keyword */
 860 | .codehilite .o { color: #666666 } /* Operator */
 861 | .codehilite .ch { color: #408080; font-style: italic } /* Comment.Hashbang */
 862 | .codehilite .cm { color: #408080; font-style: italic } /* Comment.Multiline */
 863 | .codehilite .cp { color: #BC7A00 } /* Comment.Preproc */
 864 | .codehilite .cpf { color: #408080; font-style: italic } /* Comment.PreprocFile */
 865 | .codehilite .c1 { color: #408080; font-style: italic } /* Comment.Single */
 866 | .codehilite .cs { color: #408080; font-style: italic } /* Comment.Special */
 867 | .codehilite .gd { color: #A00000 } /* Generic.Deleted */
 868 | .codehilite .ge { font-style: italic } /* Generic.Emph */
 869 | .codehilite .gr { color: #FF0000 } /* Generic.Error */
 870 | .codehilite .gh { color: #000080; font-weight: bold } /* Generic.Heading */
 871 | .codehilite .gi { color: #00A000 } /* Generic.Inserted */
 872 | .codehilite .go { color: #888888 } /* Generic.Output */
 873 | .codehilite .gp { color: #000080; font-weight: bold } /* Generic.Prompt */
 874 | .codehilite .gs { font-weight: bold } /* Generic.Strong */
 875 | .codehilite .gu { color: #800080; font-weight: bold } /* Generic.Subheading */
 876 | .codehilite .gt { color: #0044DD } /* Generic.Traceback */
 877 | .codehilite .kc { color: #008000; font-weight: bold } /* Keyword.Constant */
 878 | .codehilite .kd { color: #008000; font-weight: bold } /* Keyword.Declaration */
 879 | .codehilite .kn { color: #008000; font-weight: bold } /* Keyword.Namespace */
 880 | .codehilite .kp { color: #008000 } /* Keyword.Pseudo */
 881 | .codehilite .kr { color: #008000; font-weight: bold } /* Keyword.Reserved */
 882 | .codehilite .kt { color: #B00040 } /* Keyword.Type */
 883 | .codehilite .m { color: #666666 } /* Literal.Number */
 884 | .codehilite .s { color: #BA2121 } /* Literal.String */
 885 | .codehilite .na { color: #7D9029 } /* Name.Attribute */
 886 | .codehilite .nb { color: #008000 } /* Name.Builtin */
 887 | .codehilite .nc { color: #0000FF; font-weight: bold } /* Name.Class */
 888 | .codehilite .no { color: #880000 } /* Name.Constant */
 889 | .codehilite .nd { color: #AA22FF } /* Name.Decorator */
 890 | .codehilite .ni { color: #999999; font-weight: bold } /* Name.Entity */
 891 | .codehilite .ne { color: #D2413A; font-weight: bold } /* Name.Exception */
 892 | .codehilite .nf { color: #0000FF } /* Name.Function */
 893 | .codehilite .nl { color: #A0A000 } /* Name.Label */
 894 | .codehilite .nn { color: #0000FF; font-weight: bold } /* Name.Namespace */
 895 | .codehilite .nt { color: #008000; font-weight: bold } /* Name.Tag */
 896 | .codehilite .nv { color: #19177C } /* Name.Variable */
 897 | .codehilite .ow { color: #AA22FF; font-weight: bold } /* Operator.Word */
 898 | .codehilite .w { color: #bbbbbb } /* Text.Whitespace */
 899 | .codehilite .mb { color: #666666 } /* Literal.Number.Bin */
 900 | .codehilite .mf { color: #666666 } /* Literal.Number.Float */
 901 | .codehilite .mh { color: #666666 } /* Literal.Number.Hex */
 902 | .codehilite .mi { color: #666666 } /* Literal.Number.Integer */
 903 | .codehilite .mo { color: #666666 } /* Literal.Number.Oct */
 904 | .codehilite .sb { color: #BA2121 } /* Literal.String.Backtick */
 905 | .codehilite .sc { color: #BA2121 } /* Literal.String.Char */
 906 | .codehilite .sd { color: #BA2121; font-style: italic } /* Literal.String.Doc */
 907 | .codehilite .s2 { color: #BA2121 } /* Literal.String.Double */
 908 | .codehilite .se { color: #BB6622; font-weight: bold } /* Literal.String.Escape */
 909 | .codehilite .sh { color: #BA2121 } /* Literal.String.Heredoc */
 910 | .codehilite .si { color: #BB6688; font-weight: bold } /* Literal.String.Interpol */
 911 | .codehilite .sx { color: #008000 } /* Literal.String.Other */
 912 | .codehilite .sr { color: #BB6688 } /* Literal.String.Regex */
 913 | .codehilite .s1 { color: #BA2121 } /* Literal.String.Single */
 914 | .codehilite .ss { color: #19177C } /* Literal.String.Symbol */
 915 | .codehilite .bp { color: #008000 } /* Name.Builtin.Pseudo */
 916 | .codehilite .vc { color: #19177C } /* Name.Variable.Class */
 917 | .codehilite .vg { color: #19177C } /* Name.Variable.Global */
 918 | .codehilite .vi { color: #19177C } /* Name.Variable.Instance */
 919 | .codehilite .il { color: #666666 } /* Literal.Number.Integer.Long */
 920 |   </style>
 921 | 
 922 |   <style type="text/css">
 923 |   
 924 | /* ==========================================================================
 925 |    EXAMPLE Media Queries for Responsive Design.
 926 |    These examples override the primary ('mobile first') styles.
 927 |    Modify as content requires.
 928 |    ========================================================================== */
 929 | 
 930 | @media only screen and (min-width: 35em) {
 931 |     /* Style adjustments for viewports that meet the condition */
 932 | }
 933 | 
 934 | @media print,
 935 |        (-o-min-device-pixel-ratio: 5/4),
 936 |        (-webkit-min-device-pixel-ratio: 1.25),
 937 |        (min-resolution: 120dpi) {
 938 |     /* Style adjustments for high resolution devices */
 939 | }
 940 | 
 941 | /* ==========================================================================
 942 |    Print styles.
 943 |    Inlined to avoid required HTTP connection: h5bp.com/r
 944 |    ========================================================================== */
 945 | 
 946 | @media print {
 947 |     * {
 948 |         background: transparent !important;
 949 |         color: #000 !important; /* Black prints faster: h5bp.com/s */
 950 |         box-shadow: none !important;
 951 |         text-shadow: none !important;
 952 |     }
 953 | 
 954 |     a,
 955 |     a:visited {
 956 |         text-decoration: underline;
 957 |     }
 958 | 
 959 |     a[href]:after {
 960 |         content: " (" attr(href) ")";
 961 |     }
 962 | 
 963 |     abbr[title]:after {
 964 |         content: " (" attr(title) ")";
 965 |     }
 966 | 
 967 |     /*
 968 |      * Don't show links for images, or javascript/internal links
 969 |      */
 970 | 
 971 |     .ir a:after,
 972 |     a[href^="javascript:"]:after,
 973 |     a[href^="#"]:after {
 974 |         content: "";
 975 |     }
 976 | 
 977 |     pre,
 978 |     blockquote {
 979 |         border: 1px solid #999;
 980 |         page-break-inside: avoid;
 981 |     }
 982 | 
 983 |     thead {
 984 |         display: table-header-group; /* h5bp.com/t */
 985 |     }
 986 | 
 987 |     tr,
 988 |     img {
 989 |         page-break-inside: avoid;
 990 |     }
 991 | 
 992 |     img {
 993 |         max-width: 100% !important;
 994 |     }
 995 | 
 996 |     @page {
 997 |         margin: 0.5cm;
 998 |     }
 999 | 
1000 |     p,
1001 |     h2,
1002 |     h3 {
1003 |         orphans: 3;
1004 |         widows: 3;
1005 |     }
1006 | 
1007 |     h2,
1008 |     h3 {
1009 |         page-break-after: avoid;
1010 |     }
1011 | }
1012 | 
1013 |   </style>
1014 | 
1015 |   <script type="text/javascript">
1016 |   function toggle(id, $link) {
1017 |     $node = document.getElementById(id);
1018 |     if (!$node)
1019 |     return;
1020 |     if (!$node.style.display || $node.style.display == 'none') {
1021 |     $node.style.display = 'block';
1022 |     $link.innerHTML = 'Hide source &nequiv;';
1023 |     } else {
1024 |     $node.style.display = 'none';
1025 |     $link.innerHTML = 'Show source &equiv;';
1026 |     }
1027 |   }
1028 |   </script>
1029 | </head>
1030 | <body>
1031 | <a href="#" id="top">Top</a>
1032 | 
1033 | <div id="container">
1034 |     
1035 |   
1036 |   <div id="sidebar">
1037 |     <h1>Index</h1>
1038 |     <ul id="index">
1039 | 
1040 |     <li class="set"><h3><a href="#header-functions">Functions</a></h3>
1041 |       
1042 |   <ul>
1043 |     <li class="mono"><a href="#bayesian_bootstrap.bootstrap.bayesian_bootstrap">bayesian_bootstrap</a></li>
1044 |     <li class="mono"><a href="#bayesian_bootstrap.bootstrap.bayesian_bootstrap_regression">bayesian_bootstrap_regression</a></li>
1045 |     <li class="mono"><a href="#bayesian_bootstrap.bootstrap.central_credible_interval">central_credible_interval</a></li>
1046 |     <li class="mono"><a href="#bayesian_bootstrap.bootstrap.covar">covar</a></li>
1047 |     <li class="mono"><a href="#bayesian_bootstrap.bootstrap.highest_density_interval">highest_density_interval</a></li>
1048 |     <li class="mono"><a href="#bayesian_bootstrap.bootstrap.mean">mean</a></li>
1049 |     <li class="mono"><a href="#bayesian_bootstrap.bootstrap.var">var</a></li>
1050 |   </ul>
1051 | 
1052 |     </li>
1053 | 
1054 |     <li class="set"><h3><a href="#header-classes">Classes</a></h3>
1055 |       <ul>
1056 |         <li class="mono">
1057 |         <span class="class_name"><a href="#bayesian_bootstrap.bootstrap.BayesianBootstrapBagging">BayesianBootstrapBagging</a></span>
1058 |         
1059 |           
1060 |   <ul>
1061 |     <li class="mono"><a href="#bayesian_bootstrap.bootstrap.BayesianBootstrapBagging.__init__">__init__</a></li>
1062 |     <li class="mono"><a href="#bayesian_bootstrap.bootstrap.BayesianBootstrapBagging.fit">fit</a></li>
1063 |     <li class="mono"><a href="#bayesian_bootstrap.bootstrap.BayesianBootstrapBagging.predict">predict</a></li>
1064 |     <li class="mono"><a href="#bayesian_bootstrap.bootstrap.BayesianBootstrapBagging.predict_central_interval">predict_central_interval</a></li>
1065 |     <li class="mono"><a href="#bayesian_bootstrap.bootstrap.BayesianBootstrapBagging.predict_highest_density_interval">predict_highest_density_interval</a></li>
1066 |     <li class="mono"><a href="#bayesian_bootstrap.bootstrap.BayesianBootstrapBagging.predict_posterior_samples">predict_posterior_samples</a></li>
1067 |   </ul>
1068 | 
1069 |         </li>
1070 |       </ul>
1071 |     </li>
1072 | 
1073 |     </ul>
1074 |   </div>
1075 | 
1076 |     <article id="content">
1077 |       
1078 |   
1079 | 
1080 |   
1081 | 
1082 | 
1083 |   <header id="section-intro">
1084 |   <h1 class="title"><span class="name">bayesian_bootstrap.bootstrap</span> module</h1>
1085 |   
1086 |   
1087 |   <p class="source_link"><a href="javascript:void(0);" onclick="toggle('source-bayesian_bootstrap.bootstrap', this);">Show source &equiv;</a></p>
1088 |   <div id="source-bayesian_bootstrap.bootstrap" class="source">
1089 |     <div class="codehilite"><pre><span></span><span class="kn">import</span> <span class="nn">numpy</span> <span class="kn">as</span> <span class="nn">np</span>
1090 | <span class="kn">from</span> <span class="nn">copy</span> <span class="kn">import</span> <span class="n">deepcopy</span>
1091 | 
1092 | <span class="k">def</span> <span class="nf">mean</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">n_replications</span><span class="p">):</span>
1093 |     <span class="sd">&quot;&quot;&quot;Simulate the posterior distribution of the mean.</span>
1094 | 
1095 | <span class="sd">    Parameter X: The observed data (array like)</span>
1096 | 
1097 | <span class="sd">    Parameter n_replications: The number of bootstrap replications to perform (positive integer)</span>
1098 | 
1099 | <span class="sd">    Returns: Samples from the posterior</span>
1100 | <span class="sd">    &quot;&quot;&quot;</span>
1101 |     <span class="n">samples</span> <span class="o">=</span> <span class="p">[]</span>
1102 |     <span class="n">weights</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">dirichlet</span><span class="p">([</span><span class="mi">1</span><span class="p">]</span><span class="o">*</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">),</span> <span class="n">n_replications</span><span class="p">)</span>
1103 |     <span class="k">for</span> <span class="n">w</span> <span class="ow">in</span> <span class="n">weights</span><span class="p">:</span>
1104 |         <span class="n">samples</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">w</span><span class="p">))</span>
1105 |     <span class="k">return</span> <span class="n">samples</span>
1106 | 
1107 | <span class="k">def</span> <span class="nf">var</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">n_replications</span><span class="p">):</span>
1108 |     <span class="sd">&quot;&quot;&quot;Simulate the posterior distribution of the variance.</span>
1109 | 
1110 | <span class="sd">    Parameter X: The observed data (array like)</span>
1111 | 
1112 | <span class="sd">    Parameter n_replications: The number of bootstrap replications to perform (positive integer)</span>
1113 | 
1114 | <span class="sd">    Returns: Samples from the posterior</span>
1115 | <span class="sd">    &quot;&quot;&quot;</span>
1116 |     <span class="n">samples</span> <span class="o">=</span> <span class="p">[]</span>
1117 |     <span class="n">weights</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">dirichlet</span><span class="p">([</span><span class="mi">1</span><span class="p">]</span><span class="o">*</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">),</span> <span class="n">n_replications</span><span class="p">)</span>
1118 |     <span class="k">for</span> <span class="n">w</span> <span class="ow">in</span> <span class="n">weights</span><span class="p">:</span>
1119 |         <span class="n">samples</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">([</span><span class="n">x</span> <span class="o">**</span> <span class="mi">2</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">X</span><span class="p">],</span> <span class="n">w</span><span class="p">)</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">w</span><span class="p">)</span> <span class="o">**</span> <span class="mi">2</span><span class="p">)</span>
1120 |     <span class="k">return</span> <span class="n">samples</span>
1121 | 
1122 | <span class="k">def</span> <span class="nf">covar</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">Y</span><span class="p">,</span> <span class="n">n_replications</span><span class="p">):</span>
1123 |     <span class="sd">&quot;&quot;&quot;Simulate the posterior distribution of the covariance.</span>
1124 | 
1125 | <span class="sd">        Parameter X: The observed data, first variable (array like)</span>
1126 | 
1127 | <span class="sd">        Parameter Y: The observed data, second (array like)</span>
1128 | 
1129 | <span class="sd">        Parameter n_replications: The number of bootstrap replications to perform (positive integer)</span>
1130 | 
1131 | <span class="sd">        Returns: Samples from the posterior</span>
1132 | <span class="sd">    &quot;&quot;&quot;</span>
1133 |     <span class="n">samples</span> <span class="o">=</span> <span class="p">[]</span>
1134 |     <span class="n">weights</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">dirichlet</span><span class="p">([</span><span class="mi">1</span><span class="p">]</span><span class="o">*</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">),</span> <span class="n">n_replications</span><span class="p">)</span>
1135 |     <span class="k">for</span> <span class="n">w</span> <span class="ow">in</span> <span class="n">weights</span><span class="p">:</span>
1136 |         <span class="n">X_mean</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">w</span><span class="p">)</span>
1137 |         <span class="n">Y_mean</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">(</span><span class="n">Y</span><span class="p">,</span> <span class="n">w</span><span class="p">)</span>
1138 |         <span class="n">samples</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">(</span><span class="n">w</span><span class="p">,</span> <span class="p">(</span><span class="n">X</span> <span class="o">-</span> <span class="n">X_mean</span><span class="p">)</span><span class="o">*</span><span class="p">(</span><span class="n">Y</span> <span class="o">-</span> <span class="n">Y_mean</span><span class="p">)))</span>
1139 |     <span class="k">return</span> <span class="n">samples</span>
1140 | 
1141 | <span class="k">def</span> <span class="nf">bayesian_bootstrap</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">statistic</span><span class="p">,</span> <span class="n">n_replications</span><span class="p">,</span> <span class="n">resample_size</span><span class="p">,</span><span class="n">low_mem</span><span class="o">=</span><span class="bp">False</span><span class="p">):</span>
1142 |     <span class="sd">&quot;&quot;&quot;Simulate the posterior distribution of the given statistic.</span>
1143 | 
1144 | <span class="sd">    Parameter X: The observed data (array like)</span>
1145 | 
1146 | <span class="sd">    Parameter statistic: A function of the data to use in simulation (Function mapping array-like to number)</span>
1147 | 
1148 | <span class="sd">    Parameter n_replications: The number of bootstrap replications to perform (positive integer)</span>
1149 | 
1150 | <span class="sd">    Parameter resample_size: The size of the dataset in each replication</span>
1151 | <span class="sd">    </span>
1152 | <span class="sd">    Parameter low_mem(bool): Generate the weights for each iteration lazily instead of in a single batch. Will use</span>
1153 | <span class="sd">    less memory, but will run slower as a result.</span>
1154 | 
1155 | <span class="sd">    Returns: Samples from the posterior</span>
1156 | <span class="sd">    &quot;&quot;&quot;</span>
1157 |     <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
1158 |         <span class="n">X</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
1159 |     <span class="n">samples</span> <span class="o">=</span> <span class="p">[]</span>
1160 |     <span class="k">if</span> <span class="n">low_mem</span><span class="p">:</span>
1161 |         <span class="n">weights</span> <span class="o">=</span> <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">dirichlet</span><span class="p">([</span><span class="mi">1</span><span class="p">]</span> <span class="o">*</span> <span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">))</span> <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_replications</span><span class="p">))</span>
1162 |     <span class="k">else</span><span class="p">:</span>
1163 |         <span class="n">weights</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">dirichlet</span><span class="p">([</span><span class="mi">1</span><span class="p">]</span> <span class="o">*</span> <span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">),</span> <span class="n">n_replications</span><span class="p">)</span>
1164 |     <span class="k">for</span> <span class="n">w</span> <span class="ow">in</span> <span class="n">weights</span><span class="p">:</span>
1165 |         <span class="n">sample_index</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">)),</span> <span class="n">p</span><span class="o">=</span><span class="n">w</span><span class="p">,</span> <span class="n">size</span><span class="o">=</span><span class="n">resample_size</span><span class="p">)</span>
1166 |         <span class="n">resample_X</span> <span class="o">=</span> <span class="n">X</span><span class="p">[</span><span class="n">sample_index</span><span class="p">]</span>
1167 |         <span class="n">s</span> <span class="o">=</span> <span class="n">statistic</span><span class="p">(</span><span class="n">resample_X</span><span class="p">)</span>
1168 |         <span class="n">samples</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">s</span><span class="p">)</span>
1169 |     <span class="k">return</span> <span class="n">samples</span>
1170 | 
1171 | <span class="k">def</span> <span class="nf">bayesian_bootstrap_regression</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">statistic</span><span class="p">,</span> <span class="n">n_replications</span><span class="p">,</span> <span class="n">resample_size</span><span class="p">,</span><span class="n">low_mem</span><span class="o">=</span><span class="bp">False</span><span class="p">):</span>
1172 |     <span class="sd">&quot;&quot;&quot;Simulate the posterior distribution of a statistic that uses dependent and independent variables.</span>
1173 | 
1174 | <span class="sd">    Parameter X: The observed data, independent variables (matrix like)</span>
1175 | 
1176 | <span class="sd">    Parameter y: The observed data, dependent variable (array like)</span>
1177 | 
1178 | <span class="sd">    Parameter statistic: A function of the data to use in simulation (Function mapping array-like to number)</span>
1179 | 
1180 | <span class="sd">    Parameter n_replications: The number of bootstrap replications to perform (positive integer)</span>
1181 | 
1182 | <span class="sd">    Parameter resample_size: The size of the dataset in each replication</span>
1183 | <span class="sd">    </span>
1184 | <span class="sd">    Parameter low_mem(bool): Use looping instead of generating all the dirichlet, use if program use too much memory</span>
1185 | 
1186 | <span class="sd">    Returns: Samples from the posterior</span>
1187 | <span class="sd">    &quot;&quot;&quot;</span>
1188 |     <span class="n">samples</span> <span class="o">=</span> <span class="p">[]</span>
1189 |     <span class="n">X_arr</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
1190 |     <span class="n">y_arr</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">y</span><span class="p">)</span>
1191 |     <span class="k">if</span> <span class="n">low_mem</span><span class="p">:</span>
1192 |         <span class="n">weights</span> <span class="o">=</span> <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">dirichlet</span><span class="p">([</span><span class="mi">1</span><span class="p">]</span> <span class="o">*</span> <span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">))</span> <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_replications</span><span class="p">))</span>
1193 |     <span class="k">else</span><span class="p">:</span>
1194 |         <span class="n">weights</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">dirichlet</span><span class="p">([</span><span class="mi">1</span><span class="p">]</span> <span class="o">*</span> <span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">),</span> <span class="n">n_replications</span><span class="p">)</span>
1195 |     <span class="k">for</span> <span class="n">w</span> <span class="ow">in</span> <span class="n">weights</span><span class="p">:</span>
1196 |         <span class="n">resample_i</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X_arr</span><span class="p">)),</span> <span class="n">p</span><span class="o">=</span><span class="n">w</span><span class="p">,</span> <span class="n">size</span><span class="o">=</span><span class="n">resample_size</span><span class="p">)</span>
1197 |         <span class="n">resample_X</span> <span class="o">=</span> <span class="n">X_arr</span><span class="p">[</span><span class="n">resample_i</span><span class="p">]</span>
1198 |         <span class="n">resample_y</span> <span class="o">=</span> <span class="n">y_arr</span><span class="p">[</span><span class="n">resample_i</span><span class="p">]</span>
1199 |         <span class="n">s</span> <span class="o">=</span> <span class="n">statistic</span><span class="p">(</span><span class="n">resample_X</span><span class="p">,</span> <span class="n">resample_y</span><span class="p">)</span>
1200 |         <span class="n">samples</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">s</span><span class="p">)</span>
1201 | 
1202 |     <span class="k">return</span> <span class="n">samples</span>
1203 | 
1204 | <span class="k">class</span> <span class="nc">BayesianBootstrapBagging</span><span class="p">(</span><span class="nb">object</span><span class="p">):</span>
1205 |     <span class="sd">&quot;&quot;&quot;A bootstrap aggregating model using the bayesian bootstrap. Similar to scikit-learn&#39;s BaggingRegressor.&quot;&quot;&quot;</span>
1206 |     <span class="k">def</span> <span class="nf">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">base_learner</span><span class="p">,</span> <span class="n">n_replications</span><span class="p">,</span> <span class="n">resample_size</span><span class="p">,</span> <span class="n">low_mem</span><span class="o">=</span><span class="bp">False</span><span class="p">):</span>
1207 |         <span class="sd">&quot;&quot;&quot;Initialize the base learners of the ensemble.</span>
1208 | 
1209 | <span class="sd">        Parameter base_learner: A scikit-learn like estimator. This object should implement a fit() and predict()</span>
1210 | <span class="sd">        method.</span>
1211 | 
1212 | <span class="sd">        Parameter n_replications: The number of bootstrap replications to perform (positive integer)</span>
1213 | 
1214 | <span class="sd">        Parameter resample_size: The size of the dataset in each replication</span>
1215 | <span class="sd">        </span>
1216 | <span class="sd">        Parameter low_mem(bool): Generate the weights for each iteration lazily instead of in a single batch. Will use</span>
1217 | <span class="sd">        less memory, but will run slower as a result.</span>
1218 | <span class="sd">        &quot;&quot;&quot;</span>
1219 |         <span class="bp">self</span><span class="o">.</span><span class="n">base_learner</span> <span class="o">=</span> <span class="n">base_learner</span>
1220 |         <span class="bp">self</span><span class="o">.</span><span class="n">n_replications</span> <span class="o">=</span> <span class="n">n_replications</span>
1221 |         <span class="bp">self</span><span class="o">.</span><span class="n">resample_size</span> <span class="o">=</span> <span class="n">resample_size</span>
1222 |         <span class="bp">self</span><span class="o">.</span><span class="n">memo</span> <span class="o">=</span> <span class="n">low_mem</span>
1223 | 
1224 |     <span class="k">def</span> <span class="nf">fit</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">):</span>
1225 |         <span class="sd">&quot;&quot;&quot;Fit the base learners of the ensemble on a dataset.</span>
1226 | 
1227 | <span class="sd">        Parameter X: The observed data, independent variables (matrix like)</span>
1228 | 
1229 | <span class="sd">        Parameter y: The observed data, dependent variable (array like)</span>
1230 | 
1231 | <span class="sd">        Returns: Fitted model</span>
1232 | <span class="sd">        &quot;&quot;&quot;</span>
1233 |         <span class="bp">self</span><span class="o">.</span><span class="n">base_models_</span> <span class="o">=</span> <span class="n">bayesian_bootstrap_regression</span><span class="p">(</span><span class="n">X</span><span class="p">,</span>
1234 |                                                           <span class="n">y</span><span class="p">,</span>
1235 |                                                           <span class="k">lambda</span> <span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">:</span> <span class="n">deepcopy</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">base_learner</span><span class="p">)</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">),</span>
1236 |                                                           <span class="bp">self</span><span class="o">.</span><span class="n">n_replications</span><span class="p">,</span>
1237 |                                                           <span class="bp">self</span><span class="o">.</span><span class="n">resample_size</span><span class="p">,</span>
1238 |                                                           <span class="n">low_mem</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">memo</span><span class="p">)</span>
1239 |         <span class="k">return</span> <span class="bp">self</span>
1240 | 
1241 |     <span class="k">def</span> <span class="nf">predict</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">X</span><span class="p">):</span>
1242 |         <span class="sd">&quot;&quot;&quot;Make average predictions for a collection of observations.</span>
1243 | 
1244 | <span class="sd">        Parameter X: The observed data, independent variables (matrix like)</span>
1245 | 
1246 | <span class="sd">        Returns: The predicted dependent variable values (array like)</span>
1247 | <span class="sd">        &quot;&quot;&quot;</span>
1248 |         <span class="n">y_posterior_samples</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">predict_posterior_samples</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
1249 |         <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">r</span><span class="p">)</span> <span class="k">for</span> <span class="n">r</span> <span class="ow">in</span> <span class="n">y_posterior_samples</span><span class="p">])</span>
1250 | 
1251 |     <span class="k">def</span> <span class="nf">predict_posterior_samples</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">X</span><span class="p">):</span>
1252 |         <span class="sd">&quot;&quot;&quot;Simulate posterior samples for a collection of observations.</span>
1253 | 
1254 | <span class="sd">        Parameter X: The observed data, independent variables (matrix like)</span>
1255 | 
1256 | <span class="sd">        Returns: The simulated posterior mean (matrix like)</span>
1257 | <span class="sd">        &quot;&quot;&quot;</span>
1258 |         <span class="c1"># Return a X_r x self.n_replications matrix</span>
1259 |         <span class="n">y_posterior_samples</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros</span><span class="p">((</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">),</span> <span class="bp">self</span><span class="o">.</span><span class="n">n_replications</span><span class="p">))</span>
1260 |         <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">m</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">base_models_</span><span class="p">):</span>
1261 |             <span class="n">y_posterior_samples</span><span class="p">[:,</span><span class="n">i</span><span class="p">]</span> <span class="o">=</span> <span class="n">m</span><span class="o">.</span><span class="n">predict</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
1262 |         <span class="k">return</span> <span class="n">y_posterior_samples</span>
1263 | 
1264 |     <span class="k">def</span> <span class="nf">predict_central_interval</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">X</span><span class="p">,</span> <span class="n">alpha</span><span class="o">=</span><span class="mf">0.05</span><span class="p">):</span>
1265 |         <span class="sd">&quot;&quot;&quot;The equal-tailed interval prediction containing a (1-alpha) fraction of the posterior samples.</span>
1266 | 
1267 | <span class="sd">        Parameter X: The observed data, independent variables (matrix like)</span>
1268 | 
1269 | <span class="sd">        Parameter alpha: The total size of the tails (Float between 0 and 1)</span>
1270 | 
1271 | <span class="sd">        Returns: Left and right interval bounds for each input (matrix like)</span>
1272 | <span class="sd">        &quot;&quot;&quot;</span>
1273 |         <span class="n">y_posterior_samples</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">predict_posterior_samples</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
1274 |         <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="n">central_credible_interval</span><span class="p">(</span><span class="n">r</span><span class="p">,</span> <span class="n">alpha</span><span class="o">=</span><span class="n">alpha</span><span class="p">)</span> <span class="k">for</span> <span class="n">r</span> <span class="ow">in</span> <span class="n">y_posterior_samples</span><span class="p">])</span>
1275 | 
1276 |     <span class="k">def</span> <span class="nf">predict_highest_density_interval</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">X</span><span class="p">,</span> <span class="n">alpha</span><span class="o">=</span><span class="mf">0.05</span><span class="p">):</span>
1277 |         <span class="sd">&quot;&quot;&quot;The highest density interval prediction containing a (1-alpha) fraction of the posterior samples.</span>
1278 | 
1279 | <span class="sd">        Parameter X: The observed data, independent variables (matrix like)</span>
1280 | 
1281 | <span class="sd">        Parameter alpha: The total size of the tails (Float between 0 and 1)</span>
1282 | 
1283 | <span class="sd">        Returns: Left and right interval bounds for each input (matrix like):</span>
1284 | <span class="sd">        &quot;&quot;&quot;</span>
1285 |         <span class="n">y_posterior_samples</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">predict_posterior_samples</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
1286 |         <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="n">highest_density_interval</span><span class="p">(</span><span class="n">r</span><span class="p">,</span> <span class="n">alpha</span><span class="o">=</span><span class="n">alpha</span><span class="p">)</span> <span class="k">for</span> <span class="n">r</span> <span class="ow">in</span> <span class="n">y_posterior_samples</span><span class="p">])</span>
1287 | 
1288 | <span class="k">def</span> <span class="nf">central_credible_interval</span><span class="p">(</span><span class="n">samples</span><span class="p">,</span> <span class="n">alpha</span><span class="o">=</span><span class="mf">0.05</span><span class="p">):</span>
1289 |     <span class="sd">&quot;&quot;&quot;The equal-tailed interval containing a (1-alpha) fraction of the posterior samples.</span>
1290 | 
1291 | <span class="sd">    Parameter samples: The posterior samples (array like)</span>
1292 | 
1293 | <span class="sd">    Parameter alpha: The total size of the tails (Float between 0 and 1)</span>
1294 | 
1295 | <span class="sd">    Returns: Left and right interval bounds (tuple)</span>
1296 | <span class="sd">    &quot;&quot;&quot;</span>
1297 |     <span class="n">tail_size</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="nb">round</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">samples</span><span class="p">)</span><span class="o">*</span><span class="p">(</span><span class="n">alpha</span><span class="o">/</span><span class="mi">2</span><span class="p">)))</span>
1298 |     <span class="n">samples_sorted</span> <span class="o">=</span> <span class="nb">sorted</span><span class="p">(</span><span class="n">samples</span><span class="p">)</span>
1299 |     <span class="k">return</span> <span class="n">samples_sorted</span><span class="p">[</span><span class="n">tail_size</span><span class="p">],</span><span class="n">samples_sorted</span><span class="p">[</span><span class="o">-</span><span class="n">tail_size</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span>
1300 | 
1301 | <span class="k">def</span> <span class="nf">highest_density_interval</span><span class="p">(</span><span class="n">samples</span><span class="p">,</span> <span class="n">alpha</span><span class="o">=</span><span class="mf">0.05</span><span class="p">):</span>
1302 |     <span class="sd">&quot;&quot;&quot;The highest-density interval containing a (1-alpha) fraction of the posterior samples.</span>
1303 | 
1304 | <span class="sd">    Parameter samples: The posterior samples (array like)</span>
1305 | 
1306 | <span class="sd">    Parameter alpha: The total size of the tails (Float between 0 and 1)</span>
1307 | 
1308 | <span class="sd">    Returns: Left and right interval bounds (tuple)</span>
1309 | <span class="sd">    &quot;&quot;&quot;</span>
1310 |     <span class="n">samples_sorted</span> <span class="o">=</span> <span class="nb">sorted</span><span class="p">(</span><span class="n">samples</span><span class="p">)</span>
1311 |     <span class="n">window_size</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">samples</span><span class="p">)</span> <span class="o">-</span> <span class="nb">round</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">samples</span><span class="p">)</span><span class="o">*</span><span class="n">alpha</span><span class="p">))</span>
1312 |     <span class="n">smallest_window</span> <span class="o">=</span> <span class="p">(</span><span class="bp">None</span><span class="p">,</span> <span class="bp">None</span><span class="p">)</span>
1313 |     <span class="n">smallest_window_length</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">)</span>
1314 |     <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">samples_sorted</span><span class="p">)</span> <span class="o">-</span> <span class="n">window_size</span><span class="p">):</span>
1315 |         <span class="n">window</span> <span class="o">=</span> <span class="n">samples_sorted</span><span class="p">[</span><span class="n">i</span><span class="o">+</span><span class="n">window_size</span><span class="o">-</span><span class="mi">1</span><span class="p">],</span> <span class="n">samples_sorted</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
1316 |         <span class="n">window_length</span> <span class="o">=</span> <span class="n">samples_sorted</span><span class="p">[</span><span class="n">i</span><span class="o">+</span><span class="n">window_size</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span> <span class="o">-</span> <span class="n">samples_sorted</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
1317 |         <span class="k">if</span> <span class="n">window_length</span> <span class="o">&lt;</span> <span class="n">smallest_window_length</span><span class="p">:</span>
1318 |             <span class="n">smallest_window_length</span> <span class="o">=</span> <span class="n">window_length</span>
1319 |             <span class="n">smallest_window</span> <span class="o">=</span> <span class="n">window</span>
1320 |     <span class="k">return</span> <span class="n">smallest_window</span><span class="p">[</span><span class="mi">1</span><span class="p">],</span> <span class="n">smallest_window</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
1321 | 
1322 | <span class="k">def</span> <span class="nf">_bootstrap_replicate</span><span class="p">(</span><span class="n">X</span><span class="p">):</span>
1323 |     <span class="n">random_points</span> <span class="o">=</span> <span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">+</span> <span class="nb">sorted</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">uniform</span><span class="p">(</span><span class="mi">0</span><span class="p">,</span> <span class="mi">1</span><span class="p">,</span> <span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">)</span> <span class="o">-</span> <span class="mi">1</span><span class="p">))</span> <span class="o">+</span> <span class="p">[</span><span class="mi">1</span><span class="p">]</span>
1324 |     <span class="n">gaps</span> <span class="o">=</span> <span class="p">[</span><span class="n">r</span> <span class="o">-</span> <span class="n">l</span> <span class="k">for</span> <span class="n">l</span><span class="p">,</span> <span class="n">r</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">random_points</span><span class="p">[:</span><span class="o">-</span><span class="mi">1</span><span class="p">],</span> <span class="n">random_points</span><span class="p">[</span><span class="mi">1</span><span class="p">:])]</span>
1325 |     <span class="k">return</span> <span class="n">gaps</span>
1326 | </pre></div>
1327 | 
1328 |   </div>
1329 | 
1330 |   </header>
1331 | 
1332 |   <section id="section-items">
1333 | 
1334 |     <h2 class="section-title" id="header-functions">Functions</h2>
1335 |       
1336 |   <div class="item">
1337 |     <div class="name def" id="bayesian_bootstrap.bootstrap.bayesian_bootstrap">
1338 |     <p>def <span class="ident">bayesian_bootstrap</span>(</p><p>X, statistic, n_replications, resample_size, low_mem=False)</p>
1339 |     </div>
1340 |     
1341 | 
1342 |     
1343 |   
1344 |     <div class="desc"><p>Simulate the posterior distribution of the given statistic.</p>
1345 | <p>Parameter X: The observed data (array like)</p>
1346 | <p>Parameter statistic: A function of the data to use in simulation (Function mapping array-like to number)</p>
1347 | <p>Parameter n_replications: The number of bootstrap replications to perform (positive integer)</p>
1348 | <p>Parameter resample_size: The size of the dataset in each replication</p>
1349 | <p>Parameter low_mem(bool): Generate the weights for each iteration lazily instead of in a single batch. Will use
1350 | less memory, but will run slower as a result.</p>
1351 | <p>Returns: Samples from the posterior</p></div>
1352 |   <div class="source_cont">
1353 |   <p class="source_link"><a href="javascript:void(0);" onclick="toggle('source-bayesian_bootstrap.bootstrap.bayesian_bootstrap', this);">Show source &equiv;</a></p>
1354 |   <div id="source-bayesian_bootstrap.bootstrap.bayesian_bootstrap" class="source">
1355 |     <div class="codehilite"><pre><span></span><span class="k">def</span> <span class="nf">bayesian_bootstrap</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">statistic</span><span class="p">,</span> <span class="n">n_replications</span><span class="p">,</span> <span class="n">resample_size</span><span class="p">,</span><span class="n">low_mem</span><span class="o">=</span><span class="bp">False</span><span class="p">):</span>
1356 |     <span class="sd">&quot;&quot;&quot;Simulate the posterior distribution of the given statistic.</span>
1357 | 
1358 | <span class="sd">    Parameter X: The observed data (array like)</span>
1359 | 
1360 | <span class="sd">    Parameter statistic: A function of the data to use in simulation (Function mapping array-like to number)</span>
1361 | 
1362 | <span class="sd">    Parameter n_replications: The number of bootstrap replications to perform (positive integer)</span>
1363 | 
1364 | <span class="sd">    Parameter resample_size: The size of the dataset in each replication</span>
1365 | <span class="sd">    </span>
1366 | <span class="sd">    Parameter low_mem(bool): Generate the weights for each iteration lazily instead of in a single batch. Will use</span>
1367 | <span class="sd">    less memory, but will run slower as a result.</span>
1368 | 
1369 | <span class="sd">    Returns: Samples from the posterior</span>
1370 | <span class="sd">    &quot;&quot;&quot;</span>
1371 |     <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="nb">list</span><span class="p">):</span>
1372 |         <span class="n">X</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
1373 |     <span class="n">samples</span> <span class="o">=</span> <span class="p">[]</span>
1374 |     <span class="k">if</span> <span class="n">low_mem</span><span class="p">:</span>
1375 |         <span class="n">weights</span> <span class="o">=</span> <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">dirichlet</span><span class="p">([</span><span class="mi">1</span><span class="p">]</span> <span class="o">*</span> <span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">))</span> <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_replications</span><span class="p">))</span>
1376 |     <span class="k">else</span><span class="p">:</span>
1377 |         <span class="n">weights</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">dirichlet</span><span class="p">([</span><span class="mi">1</span><span class="p">]</span> <span class="o">*</span> <span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">),</span> <span class="n">n_replications</span><span class="p">)</span>
1378 |     <span class="k">for</span> <span class="n">w</span> <span class="ow">in</span> <span class="n">weights</span><span class="p">:</span>
1379 |         <span class="n">sample_index</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">)),</span> <span class="n">p</span><span class="o">=</span><span class="n">w</span><span class="p">,</span> <span class="n">size</span><span class="o">=</span><span class="n">resample_size</span><span class="p">)</span>
1380 |         <span class="n">resample_X</span> <span class="o">=</span> <span class="n">X</span><span class="p">[</span><span class="n">sample_index</span><span class="p">]</span>
1381 |         <span class="n">s</span> <span class="o">=</span> <span class="n">statistic</span><span class="p">(</span><span class="n">resample_X</span><span class="p">)</span>
1382 |         <span class="n">samples</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">s</span><span class="p">)</span>
1383 |     <span class="k">return</span> <span class="n">samples</span>
1384 | </pre></div>
1385 | 
1386 |   </div>
1387 | </div>
1388 | 
1389 |   </div>
1390 |   
1391 |       
1392 |   <div class="item">
1393 |     <div class="name def" id="bayesian_bootstrap.bootstrap.bayesian_bootstrap_regression">
1394 |     <p>def <span class="ident">bayesian_bootstrap_regression</span>(</p><p>X, y, statistic, n_replications, resample_size, low_mem=False)</p>
1395 |     </div>
1396 |     
1397 | 
1398 |     
1399 |   
1400 |     <div class="desc"><p>Simulate the posterior distribution of a statistic that uses dependent and independent variables.</p>
1401 | <p>Parameter X: The observed data, independent variables (matrix like)</p>
1402 | <p>Parameter y: The observed data, dependent variable (array like)</p>
1403 | <p>Parameter statistic: A function of the data to use in simulation (Function mapping array-like to number)</p>
1404 | <p>Parameter n_replications: The number of bootstrap replications to perform (positive integer)</p>
1405 | <p>Parameter resample_size: The size of the dataset in each replication</p>
1406 | <p>Parameter low_mem(bool): Use looping instead of generating all the dirichlet, use if program use too much memory</p>
1407 | <p>Returns: Samples from the posterior</p></div>
1408 |   <div class="source_cont">
1409 |   <p class="source_link"><a href="javascript:void(0);" onclick="toggle('source-bayesian_bootstrap.bootstrap.bayesian_bootstrap_regression', this);">Show source &equiv;</a></p>
1410 |   <div id="source-bayesian_bootstrap.bootstrap.bayesian_bootstrap_regression" class="source">
1411 |     <div class="codehilite"><pre><span></span><span class="k">def</span> <span class="nf">bayesian_bootstrap_regression</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="n">statistic</span><span class="p">,</span> <span class="n">n_replications</span><span class="p">,</span> <span class="n">resample_size</span><span class="p">,</span><span class="n">low_mem</span><span class="o">=</span><span class="bp">False</span><span class="p">):</span>
1412 |     <span class="sd">&quot;&quot;&quot;Simulate the posterior distribution of a statistic that uses dependent and independent variables.</span>
1413 | 
1414 | <span class="sd">    Parameter X: The observed data, independent variables (matrix like)</span>
1415 | 
1416 | <span class="sd">    Parameter y: The observed data, dependent variable (array like)</span>
1417 | 
1418 | <span class="sd">    Parameter statistic: A function of the data to use in simulation (Function mapping array-like to number)</span>
1419 | 
1420 | <span class="sd">    Parameter n_replications: The number of bootstrap replications to perform (positive integer)</span>
1421 | 
1422 | <span class="sd">    Parameter resample_size: The size of the dataset in each replication</span>
1423 | <span class="sd">    </span>
1424 | <span class="sd">    Parameter low_mem(bool): Use looping instead of generating all the dirichlet, use if program use too much memory</span>
1425 | 
1426 | <span class="sd">    Returns: Samples from the posterior</span>
1427 | <span class="sd">    &quot;&quot;&quot;</span>
1428 |     <span class="n">samples</span> <span class="o">=</span> <span class="p">[]</span>
1429 |     <span class="n">X_arr</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
1430 |     <span class="n">y_arr</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">(</span><span class="n">y</span><span class="p">)</span>
1431 |     <span class="k">if</span> <span class="n">low_mem</span><span class="p">:</span>
1432 |         <span class="n">weights</span> <span class="o">=</span> <span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">dirichlet</span><span class="p">([</span><span class="mi">1</span><span class="p">]</span> <span class="o">*</span> <span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">))</span> <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_replications</span><span class="p">))</span>
1433 |     <span class="k">else</span><span class="p">:</span>
1434 |         <span class="n">weights</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">dirichlet</span><span class="p">([</span><span class="mi">1</span><span class="p">]</span> <span class="o">*</span> <span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">),</span> <span class="n">n_replications</span><span class="p">)</span>
1435 |     <span class="k">for</span> <span class="n">w</span> <span class="ow">in</span> <span class="n">weights</span><span class="p">:</span>
1436 |         <span class="n">resample_i</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">choice</span><span class="p">(</span><span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">X_arr</span><span class="p">)),</span> <span class="n">p</span><span class="o">=</span><span class="n">w</span><span class="p">,</span> <span class="n">size</span><span class="o">=</span><span class="n">resample_size</span><span class="p">)</span>
1437 |         <span class="n">resample_X</span> <span class="o">=</span> <span class="n">X_arr</span><span class="p">[</span><span class="n">resample_i</span><span class="p">]</span>
1438 |         <span class="n">resample_y</span> <span class="o">=</span> <span class="n">y_arr</span><span class="p">[</span><span class="n">resample_i</span><span class="p">]</span>
1439 |         <span class="n">s</span> <span class="o">=</span> <span class="n">statistic</span><span class="p">(</span><span class="n">resample_X</span><span class="p">,</span> <span class="n">resample_y</span><span class="p">)</span>
1440 |         <span class="n">samples</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">s</span><span class="p">)</span>
1441 | 
1442 |     <span class="k">return</span> <span class="n">samples</span>
1443 | </pre></div>
1444 | 
1445 |   </div>
1446 | </div>
1447 | 
1448 |   </div>
1449 |   
1450 |       
1451 |   <div class="item">
1452 |     <div class="name def" id="bayesian_bootstrap.bootstrap.central_credible_interval">
1453 |     <p>def <span class="ident">central_credible_interval</span>(</p><p>samples, alpha=0.05)</p>
1454 |     </div>
1455 |     
1456 | 
1457 |     
1458 |   
1459 |     <div class="desc"><p>The equal-tailed interval containing a (1-alpha) fraction of the posterior samples.</p>
1460 | <p>Parameter samples: The posterior samples (array like)</p>
1461 | <p>Parameter alpha: The total size of the tails (Float between 0 and 1)</p>
1462 | <p>Returns: Left and right interval bounds (tuple)</p></div>
1463 |   <div class="source_cont">
1464 |   <p class="source_link"><a href="javascript:void(0);" onclick="toggle('source-bayesian_bootstrap.bootstrap.central_credible_interval', this);">Show source &equiv;</a></p>
1465 |   <div id="source-bayesian_bootstrap.bootstrap.central_credible_interval" class="source">
1466 |     <div class="codehilite"><pre><span></span><span class="k">def</span> <span class="nf">central_credible_interval</span><span class="p">(</span><span class="n">samples</span><span class="p">,</span> <span class="n">alpha</span><span class="o">=</span><span class="mf">0.05</span><span class="p">):</span>
1467 |     <span class="sd">&quot;&quot;&quot;The equal-tailed interval containing a (1-alpha) fraction of the posterior samples.</span>
1468 | 
1469 | <span class="sd">    Parameter samples: The posterior samples (array like)</span>
1470 | 
1471 | <span class="sd">    Parameter alpha: The total size of the tails (Float between 0 and 1)</span>
1472 | 
1473 | <span class="sd">    Returns: Left and right interval bounds (tuple)</span>
1474 | <span class="sd">    &quot;&quot;&quot;</span>
1475 |     <span class="n">tail_size</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="nb">round</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">samples</span><span class="p">)</span><span class="o">*</span><span class="p">(</span><span class="n">alpha</span><span class="o">/</span><span class="mi">2</span><span class="p">)))</span>
1476 |     <span class="n">samples_sorted</span> <span class="o">=</span> <span class="nb">sorted</span><span class="p">(</span><span class="n">samples</span><span class="p">)</span>
1477 |     <span class="k">return</span> <span class="n">samples_sorted</span><span class="p">[</span><span class="n">tail_size</span><span class="p">],</span><span class="n">samples_sorted</span><span class="p">[</span><span class="o">-</span><span class="n">tail_size</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span>
1478 | </pre></div>
1479 | 
1480 |   </div>
1481 | </div>
1482 | 
1483 |   </div>
1484 |   
1485 |       
1486 |   <div class="item">
1487 |     <div class="name def" id="bayesian_bootstrap.bootstrap.covar">
1488 |     <p>def <span class="ident">covar</span>(</p><p>X, Y, n_replications)</p>
1489 |     </div>
1490 |     
1491 | 
1492 |     
1493 |   
1494 |     <div class="desc"><p>Simulate the posterior distribution of the covariance.</p>
1495 | <p>Parameter X: The observed data, first variable (array like)</p>
1496 | <p>Parameter Y: The observed data, second (array like)</p>
1497 | <p>Parameter n_replications: The number of bootstrap replications to perform (positive integer)</p>
1498 | <p>Returns: Samples from the posterior</p></div>
1499 |   <div class="source_cont">
1500 |   <p class="source_link"><a href="javascript:void(0);" onclick="toggle('source-bayesian_bootstrap.bootstrap.covar', this);">Show source &equiv;</a></p>
1501 |   <div id="source-bayesian_bootstrap.bootstrap.covar" class="source">
1502 |     <div class="codehilite"><pre><span></span><span class="k">def</span> <span class="nf">covar</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">Y</span><span class="p">,</span> <span class="n">n_replications</span><span class="p">):</span>
1503 |     <span class="sd">&quot;&quot;&quot;Simulate the posterior distribution of the covariance.</span>
1504 | 
1505 | <span class="sd">        Parameter X: The observed data, first variable (array like)</span>
1506 | 
1507 | <span class="sd">        Parameter Y: The observed data, second (array like)</span>
1508 | 
1509 | <span class="sd">        Parameter n_replications: The number of bootstrap replications to perform (positive integer)</span>
1510 | 
1511 | <span class="sd">        Returns: Samples from the posterior</span>
1512 | <span class="sd">    &quot;&quot;&quot;</span>
1513 |     <span class="n">samples</span> <span class="o">=</span> <span class="p">[]</span>
1514 |     <span class="n">weights</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">dirichlet</span><span class="p">([</span><span class="mi">1</span><span class="p">]</span><span class="o">*</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">),</span> <span class="n">n_replications</span><span class="p">)</span>
1515 |     <span class="k">for</span> <span class="n">w</span> <span class="ow">in</span> <span class="n">weights</span><span class="p">:</span>
1516 |         <span class="n">X_mean</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">w</span><span class="p">)</span>
1517 |         <span class="n">Y_mean</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">(</span><span class="n">Y</span><span class="p">,</span> <span class="n">w</span><span class="p">)</span>
1518 |         <span class="n">samples</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">(</span><span class="n">w</span><span class="p">,</span> <span class="p">(</span><span class="n">X</span> <span class="o">-</span> <span class="n">X_mean</span><span class="p">)</span><span class="o">*</span><span class="p">(</span><span class="n">Y</span> <span class="o">-</span> <span class="n">Y_mean</span><span class="p">)))</span>
1519 |     <span class="k">return</span> <span class="n">samples</span>
1520 | </pre></div>
1521 | 
1522 |   </div>
1523 | </div>
1524 | 
1525 |   </div>
1526 |   
1527 |       
1528 |   <div class="item">
1529 |     <div class="name def" id="bayesian_bootstrap.bootstrap.highest_density_interval">
1530 |     <p>def <span class="ident">highest_density_interval</span>(</p><p>samples, alpha=0.05)</p>
1531 |     </div>
1532 |     
1533 | 
1534 |     
1535 |   
1536 |     <div class="desc"><p>The highest-density interval containing a (1-alpha) fraction of the posterior samples.</p>
1537 | <p>Parameter samples: The posterior samples (array like)</p>
1538 | <p>Parameter alpha: The total size of the tails (Float between 0 and 1)</p>
1539 | <p>Returns: Left and right interval bounds (tuple)</p></div>
1540 |   <div class="source_cont">
1541 |   <p class="source_link"><a href="javascript:void(0);" onclick="toggle('source-bayesian_bootstrap.bootstrap.highest_density_interval', this);">Show source &equiv;</a></p>
1542 |   <div id="source-bayesian_bootstrap.bootstrap.highest_density_interval" class="source">
1543 |     <div class="codehilite"><pre><span></span><span class="k">def</span> <span class="nf">highest_density_interval</span><span class="p">(</span><span class="n">samples</span><span class="p">,</span> <span class="n">alpha</span><span class="o">=</span><span class="mf">0.05</span><span class="p">):</span>
1544 |     <span class="sd">&quot;&quot;&quot;The highest-density interval containing a (1-alpha) fraction of the posterior samples.</span>
1545 | 
1546 | <span class="sd">    Parameter samples: The posterior samples (array like)</span>
1547 | 
1548 | <span class="sd">    Parameter alpha: The total size of the tails (Float between 0 and 1)</span>
1549 | 
1550 | <span class="sd">    Returns: Left and right interval bounds (tuple)</span>
1551 | <span class="sd">    &quot;&quot;&quot;</span>
1552 |     <span class="n">samples_sorted</span> <span class="o">=</span> <span class="nb">sorted</span><span class="p">(</span><span class="n">samples</span><span class="p">)</span>
1553 |     <span class="n">window_size</span> <span class="o">=</span> <span class="nb">int</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">samples</span><span class="p">)</span> <span class="o">-</span> <span class="nb">round</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">samples</span><span class="p">)</span><span class="o">*</span><span class="n">alpha</span><span class="p">))</span>
1554 |     <span class="n">smallest_window</span> <span class="o">=</span> <span class="p">(</span><span class="bp">None</span><span class="p">,</span> <span class="bp">None</span><span class="p">)</span>
1555 |     <span class="n">smallest_window_length</span> <span class="o">=</span> <span class="nb">float</span><span class="p">(</span><span class="s1">&#39;inf&#39;</span><span class="p">)</span>
1556 |     <span class="k">for</span> <span class="n">i</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">samples_sorted</span><span class="p">)</span> <span class="o">-</span> <span class="n">window_size</span><span class="p">):</span>
1557 |         <span class="n">window</span> <span class="o">=</span> <span class="n">samples_sorted</span><span class="p">[</span><span class="n">i</span><span class="o">+</span><span class="n">window_size</span><span class="o">-</span><span class="mi">1</span><span class="p">],</span> <span class="n">samples_sorted</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
1558 |         <span class="n">window_length</span> <span class="o">=</span> <span class="n">samples_sorted</span><span class="p">[</span><span class="n">i</span><span class="o">+</span><span class="n">window_size</span><span class="o">-</span><span class="mi">1</span><span class="p">]</span> <span class="o">-</span> <span class="n">samples_sorted</span><span class="p">[</span><span class="n">i</span><span class="p">]</span>
1559 |         <span class="k">if</span> <span class="n">window_length</span> <span class="o">&lt;</span> <span class="n">smallest_window_length</span><span class="p">:</span>
1560 |             <span class="n">smallest_window_length</span> <span class="o">=</span> <span class="n">window_length</span>
1561 |             <span class="n">smallest_window</span> <span class="o">=</span> <span class="n">window</span>
1562 |     <span class="k">return</span> <span class="n">smallest_window</span><span class="p">[</span><span class="mi">1</span><span class="p">],</span> <span class="n">smallest_window</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span>
1563 | </pre></div>
1564 | 
1565 |   </div>
1566 | </div>
1567 | 
1568 |   </div>
1569 |   
1570 |       
1571 |   <div class="item">
1572 |     <div class="name def" id="bayesian_bootstrap.bootstrap.mean">
1573 |     <p>def <span class="ident">mean</span>(</p><p>X, n_replications)</p>
1574 |     </div>
1575 |     
1576 | 
1577 |     
1578 |   
1579 |     <div class="desc"><p>Simulate the posterior distribution of the mean.</p>
1580 | <p>Parameter X: The observed data (array like)</p>
1581 | <p>Parameter n_replications: The number of bootstrap replications to perform (positive integer)</p>
1582 | <p>Returns: Samples from the posterior</p></div>
1583 |   <div class="source_cont">
1584 |   <p class="source_link"><a href="javascript:void(0);" onclick="toggle('source-bayesian_bootstrap.bootstrap.mean', this);">Show source &equiv;</a></p>
1585 |   <div id="source-bayesian_bootstrap.bootstrap.mean" class="source">
1586 |     <div class="codehilite"><pre><span></span><span class="k">def</span> <span class="nf">mean</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">n_replications</span><span class="p">):</span>
1587 |     <span class="sd">&quot;&quot;&quot;Simulate the posterior distribution of the mean.</span>
1588 | 
1589 | <span class="sd">    Parameter X: The observed data (array like)</span>
1590 | 
1591 | <span class="sd">    Parameter n_replications: The number of bootstrap replications to perform (positive integer)</span>
1592 | 
1593 | <span class="sd">    Returns: Samples from the posterior</span>
1594 | <span class="sd">    &quot;&quot;&quot;</span>
1595 |     <span class="n">samples</span> <span class="o">=</span> <span class="p">[]</span>
1596 |     <span class="n">weights</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">dirichlet</span><span class="p">([</span><span class="mi">1</span><span class="p">]</span><span class="o">*</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">),</span> <span class="n">n_replications</span><span class="p">)</span>
1597 |     <span class="k">for</span> <span class="n">w</span> <span class="ow">in</span> <span class="n">weights</span><span class="p">:</span>
1598 |         <span class="n">samples</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">w</span><span class="p">))</span>
1599 |     <span class="k">return</span> <span class="n">samples</span>
1600 | </pre></div>
1601 | 
1602 |   </div>
1603 | </div>
1604 | 
1605 |   </div>
1606 |   
1607 |       
1608 |   <div class="item">
1609 |     <div class="name def" id="bayesian_bootstrap.bootstrap.var">
1610 |     <p>def <span class="ident">var</span>(</p><p>X, n_replications)</p>
1611 |     </div>
1612 |     
1613 | 
1614 |     
1615 |   
1616 |     <div class="desc"><p>Simulate the posterior distribution of the variance.</p>
1617 | <p>Parameter X: The observed data (array like)</p>
1618 | <p>Parameter n_replications: The number of bootstrap replications to perform (positive integer)</p>
1619 | <p>Returns: Samples from the posterior</p></div>
1620 |   <div class="source_cont">
1621 |   <p class="source_link"><a href="javascript:void(0);" onclick="toggle('source-bayesian_bootstrap.bootstrap.var', this);">Show source &equiv;</a></p>
1622 |   <div id="source-bayesian_bootstrap.bootstrap.var" class="source">
1623 |     <div class="codehilite"><pre><span></span><span class="k">def</span> <span class="nf">var</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">n_replications</span><span class="p">):</span>
1624 |     <span class="sd">&quot;&quot;&quot;Simulate the posterior distribution of the variance.</span>
1625 | 
1626 | <span class="sd">    Parameter X: The observed data (array like)</span>
1627 | 
1628 | <span class="sd">    Parameter n_replications: The number of bootstrap replications to perform (positive integer)</span>
1629 | 
1630 | <span class="sd">    Returns: Samples from the posterior</span>
1631 | <span class="sd">    &quot;&quot;&quot;</span>
1632 |     <span class="n">samples</span> <span class="o">=</span> <span class="p">[]</span>
1633 |     <span class="n">weights</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">random</span><span class="o">.</span><span class="n">dirichlet</span><span class="p">([</span><span class="mi">1</span><span class="p">]</span><span class="o">*</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">),</span> <span class="n">n_replications</span><span class="p">)</span>
1634 |     <span class="k">for</span> <span class="n">w</span> <span class="ow">in</span> <span class="n">weights</span><span class="p">:</span>
1635 |         <span class="n">samples</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">([</span><span class="n">x</span> <span class="o">**</span> <span class="mi">2</span> <span class="k">for</span> <span class="n">x</span> <span class="ow">in</span> <span class="n">X</span><span class="p">],</span> <span class="n">w</span><span class="p">)</span> <span class="o">-</span> <span class="n">np</span><span class="o">.</span><span class="n">dot</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">w</span><span class="p">)</span> <span class="o">**</span> <span class="mi">2</span><span class="p">)</span>
1636 |     <span class="k">return</span> <span class="n">samples</span>
1637 | </pre></div>
1638 | 
1639 |   </div>
1640 | </div>
1641 | 
1642 |   </div>
1643 |   
1644 | 
1645 |     <h2 class="section-title" id="header-classes">Classes</h2>
1646 |       
1647 |       <div class="item">
1648 |       <p id="bayesian_bootstrap.bootstrap.BayesianBootstrapBagging" class="name">class <span class="ident">BayesianBootstrapBagging</span></p>
1649 |       
1650 |   
1651 |     <div class="desc"><p>A bootstrap aggregating model using the bayesian bootstrap. Similar to scikit-learn's BaggingRegressor.</p></div>
1652 |   <div class="source_cont">
1653 |   <p class="source_link"><a href="javascript:void(0);" onclick="toggle('source-bayesian_bootstrap.bootstrap.BayesianBootstrapBagging', this);">Show source &equiv;</a></p>
1654 |   <div id="source-bayesian_bootstrap.bootstrap.BayesianBootstrapBagging" class="source">
1655 |     <div class="codehilite"><pre><span></span><span class="k">class</span> <span class="nc">BayesianBootstrapBagging</span><span class="p">(</span><span class="nb">object</span><span class="p">):</span>
1656 |     <span class="sd">&quot;&quot;&quot;A bootstrap aggregating model using the bayesian bootstrap. Similar to scikit-learn&#39;s BaggingRegressor.&quot;&quot;&quot;</span>
1657 |     <span class="k">def</span> <span class="nf">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">base_learner</span><span class="p">,</span> <span class="n">n_replications</span><span class="p">,</span> <span class="n">resample_size</span><span class="p">,</span> <span class="n">low_mem</span><span class="o">=</span><span class="bp">False</span><span class="p">):</span>
1658 |         <span class="sd">&quot;&quot;&quot;Initialize the base learners of the ensemble.</span>
1659 | 
1660 | <span class="sd">        Parameter base_learner: A scikit-learn like estimator. This object should implement a fit() and predict()</span>
1661 | <span class="sd">        method.</span>
1662 | 
1663 | <span class="sd">        Parameter n_replications: The number of bootstrap replications to perform (positive integer)</span>
1664 | 
1665 | <span class="sd">        Parameter resample_size: The size of the dataset in each replication</span>
1666 | <span class="sd">        </span>
1667 | <span class="sd">        Parameter low_mem(bool): Generate the weights for each iteration lazily instead of in a single batch. Will use</span>
1668 | <span class="sd">        less memory, but will run slower as a result.</span>
1669 | <span class="sd">        &quot;&quot;&quot;</span>
1670 |         <span class="bp">self</span><span class="o">.</span><span class="n">base_learner</span> <span class="o">=</span> <span class="n">base_learner</span>
1671 |         <span class="bp">self</span><span class="o">.</span><span class="n">n_replications</span> <span class="o">=</span> <span class="n">n_replications</span>
1672 |         <span class="bp">self</span><span class="o">.</span><span class="n">resample_size</span> <span class="o">=</span> <span class="n">resample_size</span>
1673 |         <span class="bp">self</span><span class="o">.</span><span class="n">memo</span> <span class="o">=</span> <span class="n">low_mem</span>
1674 | 
1675 |     <span class="k">def</span> <span class="nf">fit</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">):</span>
1676 |         <span class="sd">&quot;&quot;&quot;Fit the base learners of the ensemble on a dataset.</span>
1677 | 
1678 | <span class="sd">        Parameter X: The observed data, independent variables (matrix like)</span>
1679 | 
1680 | <span class="sd">        Parameter y: The observed data, dependent variable (array like)</span>
1681 | 
1682 | <span class="sd">        Returns: Fitted model</span>
1683 | <span class="sd">        &quot;&quot;&quot;</span>
1684 |         <span class="bp">self</span><span class="o">.</span><span class="n">base_models_</span> <span class="o">=</span> <span class="n">bayesian_bootstrap_regression</span><span class="p">(</span><span class="n">X</span><span class="p">,</span>
1685 |                                                           <span class="n">y</span><span class="p">,</span>
1686 |                                                           <span class="k">lambda</span> <span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">:</span> <span class="n">deepcopy</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">base_learner</span><span class="p">)</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">),</span>
1687 |                                                           <span class="bp">self</span><span class="o">.</span><span class="n">n_replications</span><span class="p">,</span>
1688 |                                                           <span class="bp">self</span><span class="o">.</span><span class="n">resample_size</span><span class="p">,</span>
1689 |                                                           <span class="n">low_mem</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">memo</span><span class="p">)</span>
1690 |         <span class="k">return</span> <span class="bp">self</span>
1691 | 
1692 |     <span class="k">def</span> <span class="nf">predict</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">X</span><span class="p">):</span>
1693 |         <span class="sd">&quot;&quot;&quot;Make average predictions for a collection of observations.</span>
1694 | 
1695 | <span class="sd">        Parameter X: The observed data, independent variables (matrix like)</span>
1696 | 
1697 | <span class="sd">        Returns: The predicted dependent variable values (array like)</span>
1698 | <span class="sd">        &quot;&quot;&quot;</span>
1699 |         <span class="n">y_posterior_samples</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">predict_posterior_samples</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
1700 |         <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">r</span><span class="p">)</span> <span class="k">for</span> <span class="n">r</span> <span class="ow">in</span> <span class="n">y_posterior_samples</span><span class="p">])</span>
1701 | 
1702 |     <span class="k">def</span> <span class="nf">predict_posterior_samples</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">X</span><span class="p">):</span>
1703 |         <span class="sd">&quot;&quot;&quot;Simulate posterior samples for a collection of observations.</span>
1704 | 
1705 | <span class="sd">        Parameter X: The observed data, independent variables (matrix like)</span>
1706 | 
1707 | <span class="sd">        Returns: The simulated posterior mean (matrix like)</span>
1708 | <span class="sd">        &quot;&quot;&quot;</span>
1709 |         <span class="c1"># Return a X_r x self.n_replications matrix</span>
1710 |         <span class="n">y_posterior_samples</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros</span><span class="p">((</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">),</span> <span class="bp">self</span><span class="o">.</span><span class="n">n_replications</span><span class="p">))</span>
1711 |         <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">m</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">base_models_</span><span class="p">):</span>
1712 |             <span class="n">y_posterior_samples</span><span class="p">[:,</span><span class="n">i</span><span class="p">]</span> <span class="o">=</span> <span class="n">m</span><span class="o">.</span><span class="n">predict</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
1713 |         <span class="k">return</span> <span class="n">y_posterior_samples</span>
1714 | 
1715 |     <span class="k">def</span> <span class="nf">predict_central_interval</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">X</span><span class="p">,</span> <span class="n">alpha</span><span class="o">=</span><span class="mf">0.05</span><span class="p">):</span>
1716 |         <span class="sd">&quot;&quot;&quot;The equal-tailed interval prediction containing a (1-alpha) fraction of the posterior samples.</span>
1717 | 
1718 | <span class="sd">        Parameter X: The observed data, independent variables (matrix like)</span>
1719 | 
1720 | <span class="sd">        Parameter alpha: The total size of the tails (Float between 0 and 1)</span>
1721 | 
1722 | <span class="sd">        Returns: Left and right interval bounds for each input (matrix like)</span>
1723 | <span class="sd">        &quot;&quot;&quot;</span>
1724 |         <span class="n">y_posterior_samples</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">predict_posterior_samples</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
1725 |         <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="n">central_credible_interval</span><span class="p">(</span><span class="n">r</span><span class="p">,</span> <span class="n">alpha</span><span class="o">=</span><span class="n">alpha</span><span class="p">)</span> <span class="k">for</span> <span class="n">r</span> <span class="ow">in</span> <span class="n">y_posterior_samples</span><span class="p">])</span>
1726 | 
1727 |     <span class="k">def</span> <span class="nf">predict_highest_density_interval</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">X</span><span class="p">,</span> <span class="n">alpha</span><span class="o">=</span><span class="mf">0.05</span><span class="p">):</span>
1728 |         <span class="sd">&quot;&quot;&quot;The highest density interval prediction containing a (1-alpha) fraction of the posterior samples.</span>
1729 | 
1730 | <span class="sd">        Parameter X: The observed data, independent variables (matrix like)</span>
1731 | 
1732 | <span class="sd">        Parameter alpha: The total size of the tails (Float between 0 and 1)</span>
1733 | 
1734 | <span class="sd">        Returns: Left and right interval bounds for each input (matrix like):</span>
1735 | <span class="sd">        &quot;&quot;&quot;</span>
1736 |         <span class="n">y_posterior_samples</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">predict_posterior_samples</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
1737 |         <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="n">highest_density_interval</span><span class="p">(</span><span class="n">r</span><span class="p">,</span> <span class="n">alpha</span><span class="o">=</span><span class="n">alpha</span><span class="p">)</span> <span class="k">for</span> <span class="n">r</span> <span class="ow">in</span> <span class="n">y_posterior_samples</span><span class="p">])</span>
1738 | </pre></div>
1739 | 
1740 |   </div>
1741 | </div>
1742 | 
1743 | 
1744 |       <div class="class">
1745 |           <h3>Ancestors (in MRO)</h3>
1746 |           <ul class="class_list">
1747 |           <li><a href="#bayesian_bootstrap.bootstrap.BayesianBootstrapBagging">BayesianBootstrapBagging</a></li>
1748 |           <li>builtins.object</li>
1749 |           </ul>
1750 |           <h3>Static methods</h3>
1751 |             
1752 |   <div class="item">
1753 |     <div class="name def" id="bayesian_bootstrap.bootstrap.BayesianBootstrapBagging.__init__">
1754 |     <p>def <span class="ident">__init__</span>(</p><p>self, base_learner, n_replications, resample_size, low_mem=False)</p>
1755 |     </div>
1756 |     
1757 | 
1758 |     
1759 |   
1760 |     <div class="desc"><p>Initialize the base learners of the ensemble.</p>
1761 | <p>Parameter base_learner: A scikit-learn like estimator. This object should implement a fit() and predict()
1762 | method.</p>
1763 | <p>Parameter n_replications: The number of bootstrap replications to perform (positive integer)</p>
1764 | <p>Parameter resample_size: The size of the dataset in each replication</p>
1765 | <p>Parameter low_mem(bool): Generate the weights for each iteration lazily instead of in a single batch. Will use
1766 | less memory, but will run slower as a result.</p></div>
1767 |   <div class="source_cont">
1768 |   <p class="source_link"><a href="javascript:void(0);" onclick="toggle('source-bayesian_bootstrap.bootstrap.BayesianBootstrapBagging.__init__', this);">Show source &equiv;</a></p>
1769 |   <div id="source-bayesian_bootstrap.bootstrap.BayesianBootstrapBagging.__init__" class="source">
1770 |     <div class="codehilite"><pre><span></span><span class="k">def</span> <span class="nf">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">base_learner</span><span class="p">,</span> <span class="n">n_replications</span><span class="p">,</span> <span class="n">resample_size</span><span class="p">,</span> <span class="n">low_mem</span><span class="o">=</span><span class="bp">False</span><span class="p">):</span>
1771 |     <span class="sd">&quot;&quot;&quot;Initialize the base learners of the ensemble.</span>
1772 | <span class="sd">    Parameter base_learner: A scikit-learn like estimator. This object should implement a fit() and predict()</span>
1773 | <span class="sd">    method.</span>
1774 | <span class="sd">    Parameter n_replications: The number of bootstrap replications to perform (positive integer)</span>
1775 | <span class="sd">    Parameter resample_size: The size of the dataset in each replication</span>
1776 | <span class="sd">    </span>
1777 | <span class="sd">    Parameter low_mem(bool): Generate the weights for each iteration lazily instead of in a single batch. Will use</span>
1778 | <span class="sd">    less memory, but will run slower as a result.</span>
1779 | <span class="sd">    &quot;&quot;&quot;</span>
1780 |     <span class="bp">self</span><span class="o">.</span><span class="n">base_learner</span> <span class="o">=</span> <span class="n">base_learner</span>
1781 |     <span class="bp">self</span><span class="o">.</span><span class="n">n_replications</span> <span class="o">=</span> <span class="n">n_replications</span>
1782 |     <span class="bp">self</span><span class="o">.</span><span class="n">resample_size</span> <span class="o">=</span> <span class="n">resample_size</span>
1783 |     <span class="bp">self</span><span class="o">.</span><span class="n">memo</span> <span class="o">=</span> <span class="n">low_mem</span>
1784 | </pre></div>
1785 | 
1786 |   </div>
1787 | </div>
1788 | 
1789 |   </div>
1790 |   
1791 |             
1792 |   <div class="item">
1793 |     <div class="name def" id="bayesian_bootstrap.bootstrap.BayesianBootstrapBagging.fit">
1794 |     <p>def <span class="ident">fit</span>(</p><p>self, X, y)</p>
1795 |     </div>
1796 |     
1797 | 
1798 |     
1799 |   
1800 |     <div class="desc"><p>Fit the base learners of the ensemble on a dataset.</p>
1801 | <p>Parameter X: The observed data, independent variables (matrix like)</p>
1802 | <p>Parameter y: The observed data, dependent variable (array like)</p>
1803 | <p>Returns: Fitted model</p></div>
1804 |   <div class="source_cont">
1805 |   <p class="source_link"><a href="javascript:void(0);" onclick="toggle('source-bayesian_bootstrap.bootstrap.BayesianBootstrapBagging.fit', this);">Show source &equiv;</a></p>
1806 |   <div id="source-bayesian_bootstrap.bootstrap.BayesianBootstrapBagging.fit" class="source">
1807 |     <div class="codehilite"><pre><span></span><span class="k">def</span> <span class="nf">fit</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">):</span>
1808 |     <span class="sd">&quot;&quot;&quot;Fit the base learners of the ensemble on a dataset.</span>
1809 | <span class="sd">    Parameter X: The observed data, independent variables (matrix like)</span>
1810 | <span class="sd">    Parameter y: The observed data, dependent variable (array like)</span>
1811 | <span class="sd">    Returns: Fitted model</span>
1812 | <span class="sd">    &quot;&quot;&quot;</span>
1813 |     <span class="bp">self</span><span class="o">.</span><span class="n">base_models_</span> <span class="o">=</span> <span class="n">bayesian_bootstrap_regression</span><span class="p">(</span><span class="n">X</span><span class="p">,</span>
1814 |                                                       <span class="n">y</span><span class="p">,</span>
1815 |                                                       <span class="k">lambda</span> <span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">:</span> <span class="n">deepcopy</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">base_learner</span><span class="p">)</span><span class="o">.</span><span class="n">fit</span><span class="p">(</span><span class="n">X</span><span class="p">,</span> <span class="n">y</span><span class="p">),</span>
1816 |                                                       <span class="bp">self</span><span class="o">.</span><span class="n">n_replications</span><span class="p">,</span>
1817 |                                                       <span class="bp">self</span><span class="o">.</span><span class="n">resample_size</span><span class="p">,</span>
1818 |                                                       <span class="n">low_mem</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">memo</span><span class="p">)</span>
1819 |     <span class="k">return</span> <span class="bp">self</span>
1820 | </pre></div>
1821 | 
1822 |   </div>
1823 | </div>
1824 | 
1825 |   </div>
1826 |   
1827 |             
1828 |   <div class="item">
1829 |     <div class="name def" id="bayesian_bootstrap.bootstrap.BayesianBootstrapBagging.predict">
1830 |     <p>def <span class="ident">predict</span>(</p><p>self, X)</p>
1831 |     </div>
1832 |     
1833 | 
1834 |     
1835 |   
1836 |     <div class="desc"><p>Make average predictions for a collection of observations.</p>
1837 | <p>Parameter X: The observed data, independent variables (matrix like)</p>
1838 | <p>Returns: The predicted dependent variable values (array like)</p></div>
1839 |   <div class="source_cont">
1840 |   <p class="source_link"><a href="javascript:void(0);" onclick="toggle('source-bayesian_bootstrap.bootstrap.BayesianBootstrapBagging.predict', this);">Show source &equiv;</a></p>
1841 |   <div id="source-bayesian_bootstrap.bootstrap.BayesianBootstrapBagging.predict" class="source">
1842 |     <div class="codehilite"><pre><span></span><span class="k">def</span> <span class="nf">predict</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">X</span><span class="p">):</span>
1843 |     <span class="sd">&quot;&quot;&quot;Make average predictions for a collection of observations.</span>
1844 | <span class="sd">    Parameter X: The observed data, independent variables (matrix like)</span>
1845 | <span class="sd">    Returns: The predicted dependent variable values (array like)</span>
1846 | <span class="sd">    &quot;&quot;&quot;</span>
1847 |     <span class="n">y_posterior_samples</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">predict_posterior_samples</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
1848 |     <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="n">np</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span><span class="n">r</span><span class="p">)</span> <span class="k">for</span> <span class="n">r</span> <span class="ow">in</span> <span class="n">y_posterior_samples</span><span class="p">])</span>
1849 | </pre></div>
1850 | 
1851 |   </div>
1852 | </div>
1853 | 
1854 |   </div>
1855 |   
1856 |             
1857 |   <div class="item">
1858 |     <div class="name def" id="bayesian_bootstrap.bootstrap.BayesianBootstrapBagging.predict_central_interval">
1859 |     <p>def <span class="ident">predict_central_interval</span>(</p><p>self, X, alpha=0.05)</p>
1860 |     </div>
1861 |     
1862 | 
1863 |     
1864 |   
1865 |     <div class="desc"><p>The equal-tailed interval prediction containing a (1-alpha) fraction of the posterior samples.</p>
1866 | <p>Parameter X: The observed data, independent variables (matrix like)</p>
1867 | <p>Parameter alpha: The total size of the tails (Float between 0 and 1)</p>
1868 | <p>Returns: Left and right interval bounds for each input (matrix like)</p></div>
1869 |   <div class="source_cont">
1870 |   <p class="source_link"><a href="javascript:void(0);" onclick="toggle('source-bayesian_bootstrap.bootstrap.BayesianBootstrapBagging.predict_central_interval', this);">Show source &equiv;</a></p>
1871 |   <div id="source-bayesian_bootstrap.bootstrap.BayesianBootstrapBagging.predict_central_interval" class="source">
1872 |     <div class="codehilite"><pre><span></span><span class="k">def</span> <span class="nf">predict_central_interval</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">X</span><span class="p">,</span> <span class="n">alpha</span><span class="o">=</span><span class="mf">0.05</span><span class="p">):</span>
1873 |     <span class="sd">&quot;&quot;&quot;The equal-tailed interval prediction containing a (1-alpha) fraction of the posterior samples.</span>
1874 | <span class="sd">    Parameter X: The observed data, independent variables (matrix like)</span>
1875 | <span class="sd">    Parameter alpha: The total size of the tails (Float between 0 and 1)</span>
1876 | <span class="sd">    Returns: Left and right interval bounds for each input (matrix like)</span>
1877 | <span class="sd">    &quot;&quot;&quot;</span>
1878 |     <span class="n">y_posterior_samples</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">predict_posterior_samples</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
1879 |     <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="n">central_credible_interval</span><span class="p">(</span><span class="n">r</span><span class="p">,</span> <span class="n">alpha</span><span class="o">=</span><span class="n">alpha</span><span class="p">)</span> <span class="k">for</span> <span class="n">r</span> <span class="ow">in</span> <span class="n">y_posterior_samples</span><span class="p">])</span>
1880 | </pre></div>
1881 | 
1882 |   </div>
1883 | </div>
1884 | 
1885 |   </div>
1886 |   
1887 |             
1888 |   <div class="item">
1889 |     <div class="name def" id="bayesian_bootstrap.bootstrap.BayesianBootstrapBagging.predict_highest_density_interval">
1890 |     <p>def <span class="ident">predict_highest_density_interval</span>(</p><p>self, X, alpha=0.05)</p>
1891 |     </div>
1892 |     
1893 | 
1894 |     
1895 |   
1896 |     <div class="desc"><p>The highest density interval prediction containing a (1-alpha) fraction of the posterior samples.</p>
1897 | <p>Parameter X: The observed data, independent variables (matrix like)</p>
1898 | <p>Parameter alpha: The total size of the tails (Float between 0 and 1)</p>
1899 | <p>Returns: Left and right interval bounds for each input (matrix like):</p></div>
1900 |   <div class="source_cont">
1901 |   <p class="source_link"><a href="javascript:void(0);" onclick="toggle('source-bayesian_bootstrap.bootstrap.BayesianBootstrapBagging.predict_highest_density_interval', this);">Show source &equiv;</a></p>
1902 |   <div id="source-bayesian_bootstrap.bootstrap.BayesianBootstrapBagging.predict_highest_density_interval" class="source">
1903 |     <div class="codehilite"><pre><span></span><span class="k">def</span> <span class="nf">predict_highest_density_interval</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">X</span><span class="p">,</span> <span class="n">alpha</span><span class="o">=</span><span class="mf">0.05</span><span class="p">):</span>
1904 |     <span class="sd">&quot;&quot;&quot;The highest density interval prediction containing a (1-alpha) fraction of the posterior samples.</span>
1905 | <span class="sd">    Parameter X: The observed data, independent variables (matrix like)</span>
1906 | <span class="sd">    Parameter alpha: The total size of the tails (Float between 0 and 1)</span>
1907 | <span class="sd">    Returns: Left and right interval bounds for each input (matrix like):</span>
1908 | <span class="sd">    &quot;&quot;&quot;</span>
1909 |     <span class="n">y_posterior_samples</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">predict_posterior_samples</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
1910 |     <span class="k">return</span> <span class="n">np</span><span class="o">.</span><span class="n">array</span><span class="p">([</span><span class="n">highest_density_interval</span><span class="p">(</span><span class="n">r</span><span class="p">,</span> <span class="n">alpha</span><span class="o">=</span><span class="n">alpha</span><span class="p">)</span> <span class="k">for</span> <span class="n">r</span> <span class="ow">in</span> <span class="n">y_posterior_samples</span><span class="p">])</span>
1911 | </pre></div>
1912 | 
1913 |   </div>
1914 | </div>
1915 | 
1916 |   </div>
1917 |   
1918 |             
1919 |   <div class="item">
1920 |     <div class="name def" id="bayesian_bootstrap.bootstrap.BayesianBootstrapBagging.predict_posterior_samples">
1921 |     <p>def <span class="ident">predict_posterior_samples</span>(</p><p>self, X)</p>
1922 |     </div>
1923 |     
1924 | 
1925 |     
1926 |   
1927 |     <div class="desc"><p>Simulate posterior samples for a collection of observations.</p>
1928 | <p>Parameter X: The observed data, independent variables (matrix like)</p>
1929 | <p>Returns: The simulated posterior mean (matrix like)</p></div>
1930 |   <div class="source_cont">
1931 |   <p class="source_link"><a href="javascript:void(0);" onclick="toggle('source-bayesian_bootstrap.bootstrap.BayesianBootstrapBagging.predict_posterior_samples', this);">Show source &equiv;</a></p>
1932 |   <div id="source-bayesian_bootstrap.bootstrap.BayesianBootstrapBagging.predict_posterior_samples" class="source">
1933 |     <div class="codehilite"><pre><span></span><span class="k">def</span> <span class="nf">predict_posterior_samples</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">X</span><span class="p">):</span>
1934 |     <span class="sd">&quot;&quot;&quot;Simulate posterior samples for a collection of observations.</span>
1935 | <span class="sd">    Parameter X: The observed data, independent variables (matrix like)</span>
1936 | <span class="sd">    Returns: The simulated posterior mean (matrix like)</span>
1937 | <span class="sd">    &quot;&quot;&quot;</span>
1938 |     <span class="c1"># Return a X_r x self.n_replications matrix</span>
1939 |     <span class="n">y_posterior_samples</span> <span class="o">=</span> <span class="n">np</span><span class="o">.</span><span class="n">zeros</span><span class="p">((</span><span class="nb">len</span><span class="p">(</span><span class="n">X</span><span class="p">),</span> <span class="bp">self</span><span class="o">.</span><span class="n">n_replications</span><span class="p">))</span>
1940 |     <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">m</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">base_models_</span><span class="p">):</span>
1941 |         <span class="n">y_posterior_samples</span><span class="p">[:,</span><span class="n">i</span><span class="p">]</span> <span class="o">=</span> <span class="n">m</span><span class="o">.</span><span class="n">predict</span><span class="p">(</span><span class="n">X</span><span class="p">)</span>
1942 |     <span class="k">return</span> <span class="n">y_posterior_samples</span>
1943 | </pre></div>
1944 | 
1945 |   </div>
1946 | </div>
1947 | 
1948 |   </div>
1949 |   
1950 |           <h3>Instance variables</h3>
1951 |             <div class="item">
1952 |             <p id="bayesian_bootstrap.bootstrap.BayesianBootstrapBagging.base_learner" class="name">var <span class="ident">base_learner</span></p>
1953 |             
1954 | 
1955 |             
1956 |   
1957 |   <div class="source_cont">
1958 | </div>
1959 | 
1960 |             </div>
1961 |             <div class="item">
1962 |             <p id="bayesian_bootstrap.bootstrap.BayesianBootstrapBagging.memo" class="name">var <span class="ident">memo</span></p>
1963 |             
1964 | 
1965 |             
1966 |   
1967 |   <div class="source_cont">
1968 | </div>
1969 | 
1970 |             </div>
1971 |             <div class="item">
1972 |             <p id="bayesian_bootstrap.bootstrap.BayesianBootstrapBagging.n_replications" class="name">var <span class="ident">n_replications</span></p>
1973 |             
1974 | 
1975 |             
1976 |   
1977 |   <div class="source_cont">
1978 | </div>
1979 | 
1980 |             </div>
1981 |             <div class="item">
1982 |             <p id="bayesian_bootstrap.bootstrap.BayesianBootstrapBagging.resample_size" class="name">var <span class="ident">resample_size</span></p>
1983 |             
1984 | 
1985 |             
1986 |   
1987 |   <div class="source_cont">
1988 | </div>
1989 | 
1990 |             </div>
1991 |       </div>
1992 |       </div>
1993 | 
1994 |   </section>
1995 | 
1996 |     </article>
1997 |   <div class="clear"> </div>
1998 |   <footer id="footer">
1999 |     <p>
2000 |       Documentation generated by
2001 |       <a href="https://github.com/BurntSushi/pdoc">pdoc 0.3.2</a>
2002 |     </p>
2003 | 
2004 |     <p>pdoc is in the public domain with the
2005 |       <a href="http://unlicense.org">UNLICENSE</a></p>
2006 | 
2007 |     <p>Design by <a href="http://nadh.in">Kailash Nadh</a></p>
2008 |   </footer>
2009 | </div>
2010 | </body>
2011 | </html>


--------------------------------------------------------------------------------
/docs/build.py:
--------------------------------------------------------------------------------
1 | import pdoc
2 | s = pdoc.html('bayesian_bootstrap.bootstrap')
3 | with open('bootstrap_documentation.html', 'w') as f:
4 |     f.write(s)


--------------------------------------------------------------------------------
/requirements.txt:
--------------------------------------------------------------------------------
1 | numpy>=1.22.1
2 | scipy>=1.7.3
3 | scikit-learn>=1.0.2
4 | tqdm>=4.62.3
5 | 


--------------------------------------------------------------------------------
/setup.py:
--------------------------------------------------------------------------------
 1 | from distutils.core import setup
 2 | 
 3 | with open("./requirements.txt") as f:
 4 |     REQUIRES = [line.strip() for line in f]
 5 | 
 6 | setup(
 7 |     name = "bayesian_bootstrap",
 8 |     packages = ["bayesian_bootstrap"],
 9 |     version = "1.1.0",
10 |     description = "Bayesian Bootstrapping for statistics and regression models",
11 |     author = "Louis Cialdella",
12 |     author_email = "louiscialdella@gmail.com",
13 |     url = "https://github.com/lmc2179/bayesian_bootstrap",
14 |     download_url = "https://github.com/lmc2179/bayesian_bootstrap/archive/master.zip",
15 |     keywords = ["statistics", "bayesian", "machine learning", "bootstrap", "bayes", "probability", "inference"],
16 |     install_requires=REQUIRES,
17 |     classifiers = [
18 |         "Programming Language :: Python",
19 |         "Programming Language :: Python :: 3",
20 |         "Intended Audience :: Developers",
21 |         "Intended Audience :: Science/Research",
22 |         "Topic :: Software Development :: Libraries :: Python Modules",
23 |         "Topic :: Software Development :: Libraries :: Python Modules",
24 |         "Topic :: Scientific/Engineering",
25 |         "Operating System :: OS Independent",
26 |         "Topic :: Scientific/Engineering :: Mathematics",
27 |         "Topic :: Scientific/Engineering :: Artificial Intelligence"
28 |         ],
29 |     long_description = """bayesian_bootstrap is a package for Bayesian bootstrapping in Python. For more information about this package and its usage, visit https://github.com/lmc2179/bayesian_bootstrap."""
30 | )
31 | 


--------------------------------------------------------------------------------