├── readme.md
├── 第七章 时间序列分析
    ├── 7-1.xlsx
    ├── 7-3.xlsx
    ├── 7-4 .xlsx
    ├── 7-5.xlsx
    ├── 7-7.xlsx
    └── 第七章 时间序列分析.ipynb
├── 第三章 概率计算与随机抽样
    └── 第三章 概率计算与随机抽样.ipynb
├── 第二章 描述性统计分析
    ├── 2-1.xlsx
    ├── 2-10.xlsx
    ├── 2-2.xlsx
    ├── 2-7.xlsx
    ├── 2-8.xlsx
    └── 第二章 描述性统计分析.ipynb
├── 第五章 方差分析
    ├── 5-1.xlsx
    ├── 5-2.xlsx
    ├── 5-3.xlsx
    └── 第五章 方差分析.ipynb
├── 第六章 相关与回归分析
    ├── 6-1.xlsx
    ├── 6-5.xlsx
    ├── 6-6.xlsx
    └── 第六章 相关与回归分析.ipynb
└── 第四章 参数估计与假设检验
    ├── 4-10.xlsx
    ├── 4-13.xlsx
    ├── 4-14.xlsx
    ├── 4-15.xlsx
    ├── 4-16.xlsx
    ├── 4-17.xlsx
    ├── 4-18.xlsx
    ├── 4-19.xlsx
    ├── 4-2.xlsx
    ├── 4-6.xlsx
    ├── 4-7.xlsx
    ├── 4-9.xlsx
    └── 第四章 参数估计与假设检验.ipynb


/readme.md:
--------------------------------------------------------------------------------
  1 | # 《统计学原理实验教程（Python）》书中代码实现
  2 | 
  3 | ## 简介
  4 | 
  5 | 《统计学原理实验教程（Python）》是厦门大学出版社在2019年出版的图书，主要通过python来实现统计学中最基本的检验方法。个人觉得本书内容较为基础，适合初学者进行学习。结构体系化，由浅入深。是一本很好的入门教科书。
  6 | 
  7 | 个人认为本书适合，具有基本的统计学知识且以python作为数据分析工具的人进行入门，了解如何通过python实现统计学中最基本的一些方法。
  8 | 
  9 | 这本书比较薄，其中，回归分析和时间序列分析的篇幅较小，介绍较浅，这部分可以自行深入了解。
 10 | 
 11 | 感谢本书的编著者！
 12 | 
 13 | ## 注意
 14 | 
 15 | 有些数据内容我可能会有所改动，但不影响什么。
 16 | 
 17 | 尽可能加上注释，力求清晰易读，增强代码可复用性。
 18 | 
 19 | 个人建议在阅读之前可以复习下相关基础概念，便于更好地理解。
 20 | 
 21 | ## 目录
 22 | ### 第二章 描述性统计分析
 23 | 
 24 | 第一节 分布数列
 25 | 
 26 | 实验2-1 连续变量分布数列的编制
 27 | 
 28 | 实验2-2 离散变量分布数列的编制
 29 | 
 30 | 第二节 统计图
 31 | 
 32 | 第三节 描述统计量
 33 | 
 34 | 实验2-7 计算描述统计量
 35 | 
 36 | 实验2-8 使用分类汇总计算描述统计量
 37 | 
 38 | 实验2-9 使用数据透视表方法计算描述统计量
 39 | 
 40 | 实验2-10 计算分组资料的描述统计量
 41 | 
 42 | ### 第三章 概率计算与随机抽样
 43 | 
 44 | 第一节 概率计算
 45 | 
 46 | 实验3-1 二项分布概率的计算
 47 | 
 48 | 实验3-2 泊松分布概率计算
 49 | 
 50 | 实验3-3 超几何分布概率计算
 51 | 
 52 | 实验3-4 正态分布概率计算
 53 | 
 54 | 实验3-5 卡方分布概率计算
 55 | 
 56 | 实验3-6 t分布概率计算
 57 | 
 58 | 实验3-7 F分布概率计算
 59 | 
 60 | 实验3-8 排列组合与阶乘函数计算概率
 61 | 
 62 | 实验3-9 概率密度函数图的绘制
 63 | 
 64 | 第二节 随机抽样
 65 | 
 66 | 实验3-10 使用随机数发生器创建随机数
 67 | 
 68 | 实验3-11 使用随机数函数创建随机数
 69 | 
 70 | 实验3-12 正态分布的模拟
 71 | 
 72 | 实验3-13 随机抽样
 73 | 
 74 | ### 第四章 参数估计与假设检验
 75 | 
 76 | 第一节 参数估计
 77 | 
 78 | 实验4-1 总体均值的区间估计：大样本
 79 | 
 80 | 实验4-2 总体均值的区间估计：小样本
 81 | 
 82 | 实验4-3 总体成数的估计
 83 | 
 84 | 实验4-4 总体方差的估计
 85 | 
 86 | 第二节 参数检验
 87 | 
 88 | 实验4-5 单一总体均值检验：大样本
 89 | 
 90 | 实验4-6 单一总体均值检验：正态总体，方差已知
 91 | 
 92 | 实验4-7 单一总体均值检验：正态总体，方差未知
 93 | 
 94 | 实验4-8 两个总体的均值检验：总体方差未知，大样本
 95 | 
 96 | 实验4-8 两个总体的均值检验：总体方差未知，大样本
 97 | 
 98 | 实验4-10 配对样本t检验
 99 | 
100 | 实验4-11 单一总体成数的假设检验
101 | 
102 | 实验4-12 两个总体的成数检验
103 | 
104 | 实验4-13 单一总体方差的假设检验
105 | 
106 | 实验4-14 两个总体的方差检验
107 | 
108 | 第三节 非参数检验
109 | 
110 | 实验4-15 卡方检验
111 | 
112 | 实验4-16 单样本符号检验
113 | 
114 | 实验4-17 配对样本的符号检验
115 | 
116 | 实验4-18 秩和检验
117 | 
118 | 实验4-19 游程检验
119 | 
120 | ### 第五章 方差分析
121 | 
122 | 第一节 单因素方差分析
123 | 
124 | 实验5-1 单因素方差分析
125 | 
126 | 第二节 双因素方差分析
127 | 
128 | 实验5-2 无交互作用的双因素方差分析
129 | 
130 | 实验5-3 有交互作用的双因素方差分析
131 | 
132 | ### 第六章 相关与回归分析
133 | 
134 | 第一节 相关分析
135 | 
136 | 实验6-1 计算协方差
137 | 
138 | 实验6-2 计算相关系数
139 | 
140 | 实验6-3 绘制相关图
141 | 
142 | 第二节 回归分析
143 | 
144 | 实验6-4 一元线性回归分析与预测
145 | 
146 | 实验6-5 多元线性回归分析和预测
147 | 
148 | 实验6-6 非线性回归分析
149 | 
150 | ### 第七章 时间序列分析
151 | 
152 | 第一节 平均发展速度
153 | 
154 | 实验7-1 基于几何法的平均发展速度
155 | 
156 | 实验7-2 基于方程式法的平均发展速度
157 | 
158 | 第二节 长期趋势的测定
159 | 
160 | 实验7-3 移动平均测定长期趋势
161 | 
162 | 实验7-4 趋势模型法测定长期趋势
163 | 
164 | 第三节 季节变动与循环变动的测定
165 | 
166 | 实验7-5 季节变动的测定
167 | 
168 | 实验7-6 循环变动的测定
169 | 
170 | 第四节 时间序列预测
171 | 
172 | 实验7-7 时间序列模型的预测
173 | 


--------------------------------------------------------------------------------
/第七章 时间序列分析/7-1.xlsx:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/AirFin/Statistics_Python_Codes/684c651552e0012d085e72301c4fd210748e4a93/第七章 时间序列分析/7-1.xlsx


--------------------------------------------------------------------------------
/第七章 时间序列分析/7-3.xlsx:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/AirFin/Statistics_Python_Codes/684c651552e0012d085e72301c4fd210748e4a93/第七章 时间序列分析/7-3.xlsx


--------------------------------------------------------------------------------
/第七章 时间序列分析/7-4 .xlsx:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/AirFin/Statistics_Python_Codes/684c651552e0012d085e72301c4fd210748e4a93/第七章 时间序列分析/7-4 .xlsx


--------------------------------------------------------------------------------
/第七章 时间序列分析/7-5.xlsx:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/AirFin/Statistics_Python_Codes/684c651552e0012d085e72301c4fd210748e4a93/第七章 时间序列分析/7-5.xlsx


--------------------------------------------------------------------------------
/第七章 时间序列分析/7-7.xlsx:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/AirFin/Statistics_Python_Codes/684c651552e0012d085e72301c4fd210748e4a93/第七章 时间序列分析/7-7.xlsx


--------------------------------------------------------------------------------
/第三章 概率计算与随机抽样/第三章 概率计算与随机抽样.ipynb:
--------------------------------------------------------------------------------
  1 | {
  2 |  "cells": [
  3 |   {
  4 |    "cell_type": "markdown",
  5 |    "metadata": {},
  6 |    "source": [
  7 |     "# 第一节 概率计算"
  8 |    ]
  9 |   },
 10 |   {
 11 |    "cell_type": "code",
 12 |    "execution_count": null,
 13 |    "metadata": {},
 14 |    "outputs": [],
 15 |    "source": []
 16 |   },
 17 |   {
 18 |    "cell_type": "markdown",
 19 |    "metadata": {},
 20 |    "source": [
 21 |     "这一节主要介绍各种概率分布：二项分布、泊松分布、正态分布等等。具体概念这里不过多赘述，直接拿案例进行实验。"
 22 |    ]
 23 |   },
 24 |   {
 25 |    "cell_type": "markdown",
 26 |    "metadata": {},
 27 |    "source": [
 28 |     "## 实验3-1 二项分布概率的计算"
 29 |    ]
 30 |   },
 31 |   {
 32 |    "cell_type": "raw",
 33 |    "metadata": {},
 34 |    "source": [
 35 |     "利用scipy统计模块计算二项分布概率\n",
 36 |     "\n",
 37 |     "假设有6个顾客进入某服装店，任一顾客购买的概率是0.30。计算下列事件的概率\n",
 38 |     "1.恰有4个顾客购买\n",
 39 |     "2.购买的顾客不超过一半\n",
 40 |     "3.至少有1个顾客购买"
 41 |    ]
 42 |   },
 43 |   {
 44 |    "cell_type": "code",
 45 |    "execution_count": 3,
 46 |    "metadata": {},
 47 |    "outputs": [],
 48 |    "source": [
 49 |     "from scipy import stats"
 50 |    ]
 51 |   },
 52 |   {
 53 |    "cell_type": "code",
 54 |    "execution_count": 4,
 55 |    "metadata": {},
 56 |    "outputs": [],
 57 |    "source": [
 58 |     "n = 6\n",
 59 |     "p = 0.3"
 60 |    ]
 61 |   },
 62 |   {
 63 |    "cell_type": "code",
 64 |    "execution_count": 5,
 65 |    "metadata": {},
 66 |    "outputs": [
 67 |     {
 68 |      "data": {
 69 |       "text/plain": [
 70 |        "0.05953499999999999"
 71 |       ]
 72 |      },
 73 |      "execution_count": 5,
 74 |      "metadata": {},
 75 |      "output_type": "execute_result"
 76 |     }
 77 |    ],
 78 |    "source": [
 79 |     "# 1.恰有4个顾客购买\n",
 80 |     "k = 4\n",
 81 |     "prob = stats.binom.pmf(k,n,p)\n",
 82 |     "prob"
 83 |    ]
 84 |   },
 85 |   {
 86 |    "cell_type": "code",
 87 |    "execution_count": 6,
 88 |    "metadata": {},
 89 |    "outputs": [
 90 |     {
 91 |      "data": {
 92 |       "text/plain": [
 93 |        "0.92953"
 94 |       ]
 95 |      },
 96 |      "execution_count": 6,
 97 |      "metadata": {},
 98 |      "output_type": "execute_result"
 99 |     }
100 |    ],
101 |    "source": [
102 |     "# 2.购买的顾客不超过一半\n",
103 |     "k = 3\n",
104 |     "prob = stats.binom.cdf(k,n,p)\n",
105 |     "prob"
106 |    ]
107 |   },
108 |   {
109 |    "cell_type": "code",
110 |    "execution_count": 7,
111 |    "metadata": {},
112 |    "outputs": [
113 |     {
114 |      "data": {
115 |       "text/plain": [
116 |        "0.882351"
117 |       ]
118 |      },
119 |      "execution_count": 7,
120 |      "metadata": {},
121 |      "output_type": "execute_result"
122 |     }
123 |    ],
124 |    "source": [
125 |     "# 3.至少有1个顾客购买，相当于1-没有买的的概率\n",
126 |     "k = 0\n",
127 |     "prob = 1 - stats.binom.cdf(k,n,p)\n",
128 |     "prob"
129 |    ]
130 |   },
131 |   {
132 |    "cell_type": "markdown",
133 |    "metadata": {},
134 |    "source": [
135 |     "## 实验3-2 泊松分布概率计算"
136 |    ]
137 |   },
138 |   {
139 |    "cell_type": "markdown",
140 |    "metadata": {},
141 |    "source": [
142 |     "利用scipy统计模块计算泊松分布概率\n",
143 |     "\n",
144 |     "某航空公司的订票处每60分钟有48次电话。求5分钟内接到3次电话的概率。"
145 |    ]
146 |   },
147 |   {
148 |    "cell_type": "code",
149 |    "execution_count": 8,
150 |    "metadata": {},
151 |    "outputs": [],
152 |    "source": [
153 |     "from scipy import stats"
154 |    ]
155 |   },
156 |   {
157 |    "cell_type": "code",
158 |    "execution_count": 10,
159 |    "metadata": {},
160 |    "outputs": [
161 |     {
162 |      "data": {
163 |       "text/plain": [
164 |        "4.0"
165 |       ]
166 |      },
167 |      "execution_count": 10,
168 |      "metadata": {},
169 |      "output_type": "execute_result"
170 |     }
171 |    ],
172 |    "source": [
173 |     "x = 3\n",
174 |     "mu =(48/60)*5\n",
175 |     "mu\n",
176 |     "# 注意mu的计算"
177 |    ]
178 |   },
179 |   {
180 |    "cell_type": "code",
181 |    "execution_count": 11,
182 |    "metadata": {},
183 |    "outputs": [
184 |     {
185 |      "data": {
186 |       "text/plain": [
187 |        "0.19536681481316454"
188 |       ]
189 |      },
190 |      "execution_count": 11,
191 |      "metadata": {},
192 |      "output_type": "execute_result"
193 |     }
194 |    ],
195 |    "source": [
196 |     "prob = stats.poisson.pmf(x,mu)\n",
197 |     "prob"
198 |    ]
199 |   },
200 |   {
201 |    "cell_type": "markdown",
202 |    "metadata": {},
203 |    "source": [
204 |     "## 超几何分布概率计算"
205 |    ]
206 |   },
207 |   {
208 |    "cell_type": "raw",
209 |    "metadata": {},
210 |    "source": [
211 |     "利用scipy统计模块计算超几何分布概率\n",
212 |     "\n",
213 |     "10人中，6人喜欢可口可乐，4人喜欢百事可乐，从这些人中选出一个3人的随机样本。求\n",
214 |     "1.恰有2人喜欢可口可乐的概率是多少？\n",
215 |     "2.2或3个人喜欢百事可乐的概率是多少？\n",
216 |     "\n",
217 |     "简单理解超几何分布:它描述了从有限M个物件（其中包含n个指定种类的物件）中抽出N个物件，成功抽出该指定种类的物件的次数（不放回）。"
218 |    ]
219 |   },
220 |   {
221 |    "cell_type": "code",
222 |    "execution_count": 12,
223 |    "metadata": {},
224 |    "outputs": [],
225 |    "source": [
226 |     "from scipy import stats"
227 |    ]
228 |   },
229 |   {
230 |    "cell_type": "code",
231 |    "execution_count": 13,
232 |    "metadata": {},
233 |    "outputs": [],
234 |    "source": [
235 |     "N = 3\n",
236 |     "M = 10\n",
237 |     "n = 6\n",
238 |     "# n=6 这里是6人喜欢可口可乐的意思"
239 |    ]
240 |   },
241 |   {
242 |    "cell_type": "code",
243 |    "execution_count": 14,
244 |    "metadata": {},
245 |    "outputs": [
246 |     {
247 |      "data": {
248 |       "text/plain": [
249 |        "0.4999999999999997"
250 |       ]
251 |      },
252 |      "execution_count": 14,
253 |      "metadata": {},
254 |      "output_type": "execute_result"
255 |     }
256 |    ],
257 |    "source": [
258 |     "# 1.恰有2人喜欢可口可乐的概率是多少？\n",
259 |     "k1 = 2\n",
260 |     "prob = stats.hypergeom.pmf(k1,M,n,N)\n",
261 |     "prob"
262 |    ]
263 |   },
264 |   {
265 |    "cell_type": "code",
266 |    "execution_count": 16,
267 |    "metadata": {},
268 |    "outputs": [
269 |     {
270 |      "data": {
271 |       "text/plain": [
272 |        "0.3333333333333335"
273 |       ]
274 |      },
275 |      "execution_count": 16,
276 |      "metadata": {},
277 |      "output_type": "execute_result"
278 |     }
279 |    ],
280 |    "source": [
281 |     "# 2或3个人喜欢百事可乐的概率是多少？\n",
282 |     "k1 = 2\n",
283 |     "k2 = 3\n",
284 |     "n = 4 \n",
285 |     "# n=6 这里是4人喜欢百事可乐的意思\n",
286 |     "prob = stats.hypergeom.pmf(k1,M,n,N) + stats.hypergeom.pmf(k2,M,n,N)\n",
287 |     "prob"
288 |    ]
289 |   },
290 |   {
291 |    "cell_type": "markdown",
292 |    "metadata": {},
293 |    "source": [
294 |     "## 实验3-4 正态分布概率计算"
295 |    ]
296 |   },
297 |   {
298 |    "cell_type": "raw",
299 |    "metadata": {},
300 |    "source": [
301 |     "利用scipy统计模块计算正态分布概率\n",
302 |     "\n",
303 |     "人们第一次结婚的平均年龄是26岁。假设第一次结婚的年龄为正态分布，标准差为4年。求\n",
304 |     "1.一个人第一次结婚时的年龄小于23岁的概率多大？\n",
305 |     "2.一个人人第一次结婚时的年龄在20-30岁之间的概率多大？\n",
306 |     "3.95%的人在什么年龄前第一次结婚"
307 |    ]
308 |   },
309 |   {
310 |    "cell_type": "code",
311 |    "execution_count": 17,
312 |    "metadata": {},
313 |    "outputs": [],
314 |    "source": [
315 |     "from scipy import stats"
316 |    ]
317 |   },
318 |   {
319 |    "cell_type": "code",
320 |    "execution_count": 18,
321 |    "metadata": {},
322 |    "outputs": [],
323 |    "source": [
324 |     "mu = 26\n",
325 |     "sigma = 4"
326 |    ]
327 |   },
328 |   {
329 |    "cell_type": "code",
330 |    "execution_count": 20,
331 |    "metadata": {},
332 |    "outputs": [
333 |     {
334 |      "data": {
335 |       "text/plain": [
336 |        "0.2266273523768682"
337 |       ]
338 |      },
339 |      "execution_count": 20,
340 |      "metadata": {},
341 |      "output_type": "execute_result"
342 |     }
343 |    ],
344 |    "source": [
345 |     "# 1.一个人第一次结婚时的年龄小于23岁的概率多大？\n",
346 |     "x1 = 23\n",
347 |     "prob = stats.norm.cdf(x1,mu,sigma)\n",
348 |     "prob"
349 |    ]
350 |   },
351 |   {
352 |    "cell_type": "code",
353 |    "execution_count": 21,
354 |    "metadata": {},
355 |    "outputs": [
356 |     {
357 |      "data": {
358 |       "text/plain": [
359 |        "0.7745375447996848"
360 |       ]
361 |      },
362 |      "execution_count": 21,
363 |      "metadata": {},
364 |      "output_type": "execute_result"
365 |     }
366 |    ],
367 |    "source": [
368 |     "# 2.一个人人第一次结婚时的年龄在20-30岁之间的概率多大？\n",
369 |     "x2 = 20\n",
370 |     "x3 = 30\n",
371 |     "prob = stats.norm.cdf(x3,mu,sigma) - stats.norm.cdf(x2,mu,sigma)\n",
372 |     "prob"
373 |    ]
374 |   },
375 |   {
376 |    "cell_type": "code",
377 |    "execution_count": 24,
378 |    "metadata": {},
379 |    "outputs": [
380 |     {
381 |      "data": {
382 |       "text/plain": [
383 |        "32.579414507805886"
384 |       ]
385 |      },
386 |      "execution_count": 24,
387 |      "metadata": {},
388 |      "output_type": "execute_result"
389 |     }
390 |    ],
391 |    "source": [
392 |     "# 3.95%的人在什么年龄前第一次结婚\n",
393 |     "x4 = 0.95\n",
394 |     "prob = stats.norm.ppf(x4,mu,sigma)\n",
395 |     "prob"
396 |    ]
397 |   },
398 |   {
399 |    "cell_type": "markdown",
400 |    "metadata": {},
401 |    "source": [
402 |     "## 实验3-5 卡方分布概率计算"
403 |    ]
404 |   },
405 |   {
406 |    "cell_type": "raw",
407 |    "metadata": {},
408 |    "source": [
409 |     "利用scipy.stats.chi2进行计算\n",
410 |     "\n",
411 |     "from scipy import stats\n",
412 |     "stats.chi2.cdf(x,n)\n",
413 |     "stats.chi2.pdf(x,n)\n",
414 |     "\n",
415 |     "cdf返回随机变量X小于x的累积概率，即P(X<x)\n",
416 |     "pdf返回随机变量X在x处的概率密度"
417 |    ]
418 |   },
419 |   {
420 |    "cell_type": "markdown",
421 |    "metadata": {},
422 |    "source": [
423 |     "## 实验3-6 t分布概率计算"
424 |    ]
425 |   },
426 |   {
427 |    "cell_type": "raw",
428 |    "metadata": {},
429 |    "source": [
430 |     "利用scipy.stats.t进行计算\n",
431 |     "\n",
432 |     "from scipy import stats\n",
433 |     "stats.t.cdf(x,n)\n",
434 |     "stats.t.pdf(x,n)\n",
435 |     "\n",
436 |     "x为需要计算概率的数值(>0)，n表示自由度"
437 |    ]
438 |   },
439 |   {
440 |    "cell_type": "markdown",
441 |    "metadata": {},
442 |    "source": [
443 |     "# 实验3-7 F分布概率计算"
444 |    ]
445 |   },
446 |   {
447 |    "cell_type": "raw",
448 |    "metadata": {},
449 |    "source": [
450 |     "利用scipy.stats.f进行计算\n",
451 |     "\n",
452 |     "from scipy import stats\n",
453 |     "stats.f.cdf(x,m,n)\n",
454 |     "stats.f.pdf(x,m,n)\n",
455 |     "\n",
456 |     "x：用来计算F分布的概率数值\n",
457 |     "m：分子自由度\n",
458 |     "n：分母自由度\n",
459 |     "\n",
460 |     "cdf返回随机变量X小于x的累积概率，即P(X<x)\n",
461 |     "pdf返回随机变量X在x处的概率密度"
462 |    ]
463 |   },
464 |   {
465 |    "cell_type": "markdown",
466 |    "metadata": {},
467 |    "source": [
468 |     "## 实验3-8 排列组合与阶乘函数计算概率"
469 |    ]
470 |   },
471 |   {
472 |    "cell_type": "markdown",
473 |    "metadata": {},
474 |    "source": [
475 |     "n个人，求至少两人生日相同（设为事件A）的概率"
476 |    ]
477 |   },
478 |   {
479 |    "cell_type": "code",
480 |    "execution_count": 27,
481 |    "metadata": {},
482 |    "outputs": [],
483 |    "source": [
484 |     "import math\n",
485 |     "from scipy import special"
486 |    ]
487 |   },
488 |   {
489 |    "cell_type": "code",
490 |    "execution_count": 29,
491 |    "metadata": {},
492 |    "outputs": [
493 |     {
494 |      "data": {
495 |       "text/plain": [
496 |        "0.997190478966976"
497 |       ]
498 |      },
499 |      "execution_count": 29,
500 |      "metadata": {},
501 |      "output_type": "execute_result"
502 |     }
503 |    ],
504 |    "source": [
505 |     "# 假设有64个同学，即 n=64\n",
506 |     "n = 64\n",
507 |     "prob = 1 - special.comb(365,n) * math.factorial(n) / 365 ** n\n",
508 |     "prob\n",
509 |     "# 说明只要有64人，那么至少有2人生日相同概率几乎为1"
510 |    ]
511 |   },
512 |   {
513 |    "cell_type": "markdown",
514 |    "metadata": {},
515 |    "source": [
516 |     "## 实验3-9 概率密度函数图的绘制"
517 |    ]
518 |   },
519 |   {
520 |    "cell_type": "code",
521 |    "execution_count": null,
522 |    "metadata": {},
523 |    "outputs": [],
524 |    "source": []
525 |   },
526 |   {
527 |    "cell_type": "markdown",
528 |    "metadata": {},
529 |    "source": [
530 |     "绘制正态分布N(10,2)和N(12,3)的概率密度函数图"
531 |    ]
532 |   },
533 |   {
534 |    "cell_type": "code",
535 |    "execution_count": 31,
536 |    "metadata": {},
537 |    "outputs": [],
538 |    "source": [
539 |     "\n",
540 |     "\n",
541 |     "import pandas as pd\n",
542 |     "import numpy as np"
543 |    ]
544 |   },
545 |   {
546 |    "cell_type": "code",
547 |    "execution_count": 33,
548 |    "metadata": {},
549 |    "outputs": [],
550 |    "source": [
551 |     "%matplotlib inline\n",
552 |     "import matplotlib.pyplot as plt\n",
553 |     "plt.rcParams['font.sans-serif'] = ['SimHei'] # 步骤一（替换sans-serif字体）\n",
554 |     "plt.rcParams['axes.unicode_minus'] = False   # 步骤二（解决坐标轴负数的负号显示问题）\n",
555 |     "plt.rcParams['savefig.dpi'] = 100 # 图片质量"
556 |    ]
557 |   },
558 |   {
559 |    "cell_type": "code",
560 |    "execution_count": 41,
561 |    "metadata": {},
562 |    "outputs": [],
563 |    "source": [
564 |     "mu1 = 10\n",
565 |     "sigma1 = 2\n",
566 |     "mu2 = 12\n",
567 |     "sigma2 = 3"
568 |    ]
569 |   },
570 |   {
571 |    "cell_type": "code",
572 |    "execution_count": 45,
573 |    "metadata": {},
574 |    "outputs": [],
575 |    "source": [
576 |     "# 定义函数求概率密度，这个函数其实就是正态分布的公式\n",
577 |     "def norm_fun(x,mu,sigma):\n",
578 |     "    return np.exp(-((x - mu)**2)/(2*sigma**2))/(sigma*np.sqrt(2*np.pi))"
579 |    ]
580 |   },
581 |   {
582 |    "cell_type": "code",
583 |    "execution_count": 44,
584 |    "metadata": {},
585 |    "outputs": [
586 |     {
587 |      "data": {
588 |       "image/png": "iVBORw0KGgoAAAANSUhEUgAAAYoAAAECCAYAAADgnZClAAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADh0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uMy4xLjEsIGh0dHA6Ly9tYXRwbG90bGliLm9yZy8QZhcZAAAgAElEQVR4nO3dd3hUZfbA8e9JI4HQwQCiAoodEIMCihpEUBSVooh9bdhQfurqorKKiLo27Mqq6Co2wIK6WABlFAREEFFkxQYiCtJLIJCQnN8f74yJkDKTzJ07yZzP88wzN5Nb3jeTuWfeLqqKMcYYU5YkvxNgjDEmvlmgMMYYUy4LFMYYY8plgcIYY0y5LFAYY4wpV4rfCfBCkyZNtFWrVmzdupU6der4nRxfJHLeIbHzn8h5h8TOf1XyPn/+/LWq2rS039XIQNGqVSvmzZtHIBAgJyfH7+T4IpHzDomd/0TOOyR2/quSdxH5pazfWdWTMcaYclmgMMYYUy4LFMYYY8pVI9sojDEmXAUFBaxYsYLt27f7nZQqq1+/Pv/73//K3Sc9PZ2WLVuSmpoa9nktUBhjEtqKFSuoW7curVq1QkT8Tk6VbNmyhbp165b5e1Vl3bp1rFixgtatW4d9Xqt6MsYktO3bt9O4ceNqHyTCISI0btw44tKTZ4FCRMaKyGwRGV7G7+uLyPsiMkVE3hKRtLKOq+hcxhhTFYkQJEIqk1dPAoWI9AeSVbUr0EZE2pay27nAaFXtBawCTirtuDDPZQyowvjxMHAge736Kvz6q98pMiYqli1bFva+P//8c9Sv71UbRQ4wIbg9BegG/FByB1V9ssSPTYHVwDmlHNexonMBiMhgYDBAVlYWgUCA3NxcAoFA1XNTDSVa3uv8+CNtH3uMBl9/DcC+AE8/zcYOHfjh2mvZ2qaNr+mLpUR773cVaf7r16/Pli1bvEtQFT300EPsu+++NG7cuMJ9CwsLeeSRR+jduzdHH310mftt3749sv8RVY36AxgLdAhu9wKGlbNvV+Cjso6L5FyhR3Z2tqqqTp8+XRNVQuX92WdVk5JUQbVJE9W779Y/jjtONT3dvbbXXqpr1vidyphJqPe+FJHmf/Hixd4kJEIbN27U7t2763HHHadvvvmmqqouXbpUr7766nKPW7VqlXbr1k1VVTdv3qwFBQU6YMAALSwsLPOY0vIMzNMy7qletVHkAhnB7UzKqOISkUbAY8DF5RwX1rlMgvrxR7jmGigqgquvhu+/h5tvZvGIEfDHH9Cli6uCOvtsKCz0O7XGlGnhwoUcddRRBAIB+vXrB8C4ceO4+uqryzxmw4YNXHjhhWzduvXP11JSUujRowefffZZ1NLm1U13Pq6KCKADsGzXHYKN1xOBm1X1l3KOq/BcJkEVFcHFF0NeHpxzDjz+ODRsWPz7evVg4kTYYw+YNg1uu82/tJrqQcSbRwUeeeQRrr32Wl566SVycnJYs2YNAD/99BMHHXQQADNnzuTMM8+kqKiIrl278uuvv5KcnMz48eOpV6/eX87XpUsXFixYELU/i1dtFJOAGSLSAugNDBKRUapastfSJcDhwK0icivwVCnHdQG0lNeMgSeegBkzICsLHn209H1atnQN3CecAHffDV27Qp8+sU2nMRUYOnQoHTp0IBAIMGLEiFL36datG2PHjmXIkCH07duXvfbaq8zzZWRkkJeXF7X0eRIoVHWziOQAPYH7VHUVsHCXfZ7CBYe/2OW4TWW9ZhLcTz/BsGFue8wYKK+hLyfHBYl//AP+/nc4+WRIshpMUwrXFho3MjIyyM3NJTMzE4Crr76arl27/lniKMvSpUvLDSSR8uzToqobVHVCMEhU6bjKnsvUYDfdBNu2ubaHvn0r3v+662DvvWHJEnjnHe/TZ0wUnHzyybzxxht//jxq1Chuvvlm7rzzznKPmzRpEr169YpaOuxrlal+fvkFJk2C1FR48MHwjklNheuvd9v33ht33xyNKU2fPn2YPHkyq1ev5vXXX6dFixaMHDmSb7/9li+//LLUY2bOnEnTpk1p0qRJ1NJhcz2Z6uepp1xD9qBB0Lx5+MddeimMHAlz5ri2jWOP9S6NxkQoJydnt0WHRITRo0czbdo0zjnnHM444wwAPvjgg7/sV3JMxNy5c7n99tujmjYrUZjqJS8PnnnGbV9zTWTH1qkDQ4a47XvvjW66jPFIy5YtOeecc8Le//rrr49oZthwWKAw1curr8L69dCpE3TuHPnx11wDGRnw3nvwzTfRT58xNZAFClN9qMJjj7ntIUPC6p++myZNXBUUwOjR0UubMTWYBQpTfcyaBV995W72Z51V+fNce617fuMNV5VljCmXBQpTfTwZnEdy8GBIT6/8efbbD7KzYcsWeP/96KTNGA/5PXusBQpTPeTlwdtvu+1Q1VFVDBrknsePr/q5jPHQvffeW2ZX2NK8++67vPLKK1FNgwUKUz1MnQpbt7qSQARLOJZp4ED3/O67kJtb9fMZU0WbNm3i+OOPJycnh7feegtwJYlff/2V/v37l3lM79696dWrF/369SM/P5+hQ4cyefLkqE6dboHCVA+h0allfGAitvfebt6nvDz473+jc05jqqAys8e+/PLLXH/99UyZMoVmzZoxbdo0AM477zwmTZoUtbRZoDDxr6CgeNqNAQOid16rfjK78Gny2ErPHnvVVVfRs2dPANasWfPnaOxozx5rgcLEv+nTYeNGOPhgOOCA6J33jDPcp/i992CTzTVp/DN06FAefvhh/va3vxEIBGjatOlu+3Tr1o3MzMxSZ4+dPXs2GzZs4MgjjwSqyeyxxkTVm2+652iWJgBatIDjjoNAwDWUX3BBdM9vqp14mwIsnNlj169fzzXXXPOXyQOrzeyxxkRFYSEEG/ai1j5RUmg8xoQJ5e9njA8qmj02Pz+fM888k3vuuYd99tnnz/0mTJhAnyiuu2KBwsS3WbNg9Wpo0wY6dIj++YONhnz8MWzfHv3zG1MFFc0eO3bsWL788kvuuusucnJyeOONN/j+++/57bffaN++fdTS4VnVk4iMBQ4GJqvqqDL2yQJeV9Vjgj/fARwX/HUz4AXgReBz4Mfg62eqavmrdpiao2Rvp8pM2VGRrCzo2BEWLHAzygYbBo2JtcrMHnv44Ydz5ZVX/rn/li1bePnll3nggQeimjZPShQi0h9IVtWuQBsRaVvKPg1xgaBO6DVVvV1Vc1Q1B1iECxKdgbtCr1uQSDCh3k5eVDuFnHiie95l6mZj4kGks8deccUVu62hXVVelShygFCl7xSgG/DDLvsUAmcBb+96sIgcAaxQ1d9EpAvQQ0QuAz5Q1VtKu6CIDAYGA2RlZREIBMjNzf3LPO2JpCbkPf333+mydCkFdevy2bZtrtE5TJHkv0FWFocBW998ky9OPbVSaY0nNeG9r4pI81+/fv2oDk7zU2FhYVh52b59e2T/I6oa9QcwFugQ3O4FDCtn30Apr70E7Bvc7g7UBZKB6UD7iq6fnZ2tqqrTp0/XRFUj8j5mjCqoDhgQ8aER5X/HDtXMTHet5csjvla8qRHvfRVEmv/FixdrUVGRN4mJsc2bN1e4T1FRkS5evHi314F5WsY91avG7FwgI7idSQRVXCLSANhDVX8KvjRLVbeoaiGwANitGsvUUFOnumev2w3S0uD44932lCneXsvEnfT0dNatWxf6klqjqSrr1q0jPcJJNb2qepqPq26aA3QAlkRw7OnAeyV+/lBEzgY24Uon/45WIk0cKyx0PZEgNg3MJ53k2kM++AAuucT765m40bJlS1asWPGXsQnV1fbt2ysMAunp6bRs2TKi83oVKCYBM0SkBdAbGCQio1R1eBjHngiUbLK/A1fllA+MUdVIgo6prr78EjZscBMAtmnj/fVCDdrTpsHOnZBiY1ETRWpqKq2jMdFkHAgEAnTs2DHq5/Xk06Cqm0UkB+gJ3Keqq4CFZeybs8vP5+zy83TgQC/SaeJYrKqdQtq0cetU/PgjzJ0LRx0Vm+saUw14NuBOVTeo6oRgkDAmMrEOFOCqnwA+/DB21zSmGrCR2Sb+bN3qRmSLQPfusbuujacwplQWKEz8mTED8vPdIkWNG8fuujk5kJwM8+e7ZVKNMYAFChOPQtVOJ5wQ2+tmZrrgVFjoSjTGGMAChYlHwVW6fJl36dhj3fOnn8b+2sbEKQsUJr6sXw9ff+0GwfnR8+i44JyUn3wS+2sbE6csUJj4EqryOfJIiHD0aFR06+Ya0efOdetpG2MsUJg4M2OGez7mGH+u36CBW/eioAA+/9yfNBgTZyxQmPjid6CA4nYKq34yBrBAYeJJXh7Mm+eqfvwcGR1qp7AGbWMACxQmnnz+uavyad8e6tf3Lx2h0szs2W48hzEJzgKFiR/xUO0E0LQpHHxwcQnHmARngcLEj3gJFGDjKYwpwQKFiQ87d7qqHoiPQGHjKYz5kwUKEx8WLoTcXNh3X2je3O/UFJcoPvvMTelhTAKzQGHiQzxVOwG0aAGtWrnJARcv9js1xvjKAoWJD/EWKAC6dnXPNkGgSXCeBQoRGSsis0WkzOVPRSRLRGaU+HlPEVkhIoHgo2m45zLVmCrMnOm24zFQhNpOjElQngQKEekPJKtqV6CNiLQtZZ+GwAtAnRIvdwbuUtWc4GNNOOcy1dzPP8Pq1a5b6n77+Z2aYqFBf1aiMAnOqxXkc4AJwe0pQDfgh132KQTOAt4u8VoXoIeIXAZ8oKq3hHkuRGQwMBggKyuLQCBAbm4ugUAgCtmpfqpT3veYOpWDgbVt27IoSr2MopF/2bmTbrVqkfzDD3z29tsU+DkIMALV6b33QiLn36u8exUo6gC/BbfXA4fvuoOqbgYQkZIvvw/cCWwDpolI+3DOFTzf08DTAJ06ddKcnBwCgQA5OTlVzUu1VK3y/vrrADTp0ydqaY5a/jt3hk8/5ejkZLcCXjVQrd57DyRy/r3Ku1dtFLlARnA7M4LrzFLVLapaCCwA2lbhXKa6mDPHPYfaBOKJVT8Z49lNdz6uigigA7AszOM+FJHmIlIb6AUsqsK5THWwbZsbQ5GUBJ06+Z2a3VmDtjGeVT1NAmaISAugNzBIREapakW9lu4ApgP5wBhVXSIiK3c5VxeP0mz8MH++G5V92GFuzep40yX47zZ3rktnilcfGWPilyclimD7Qw4wB+iuqgvLChKqmlNie7qqHqiq7VX18TLOtcmLNBufhL6pd4nT+L/HHq4n1rZtbolWYxKQZ/X9qrpBVSeo6qp4OpeJM6FAEY/tEyFW/WQSnDUMG/+oFjdkx2uJAmyEtkl4FiiMf375BVatgsaNoW0cj6MM9XyyEoVJUBYojH9Klib+Op4mvhx6qGtoX7oU/vjD79QYE3MWKIx/4r0hOyQ5ubjr7ty5/qbFGB9YoDD+ieeBdrvq3Nk9f/65v+kwxgcWKIw/tm+HBQtcldMRR/idmopZoDAJzAKF8ceCBVBQAIccAvXq+Z2aih15pHueOxeKivxNizExZoHC+CNU1x+6Ace7Pfd0j82bYckSv1NjTExZoDD+CFXhhKp0qoNQWq1B2yQYm7jG+KOalSgKCmBes358Qls+vS2blQ9DRoZ7tGgBffpA797VoxbNmEhZoDCxt3Yt/PSTu8seeqjfqSnXjh3wzDNw112watV57sXlwUcJL70Eqalw0kkwahS0bx/zpBrjGat6MrH3xRfuOTs7bmdjVYVx42D//eGaa9wA8v32LeJy/s0rSecxb+Z2Zs6EqVNh9Gi31PfOnfDuu9CxIwwZAuvX+50LY6LDAoWJvThvn9i2Df72N7jgAli+3HXMevNN+P6HJMa0f5Kzi14mm/kcfTSccAJcdx18+imsXAnXXut6/D7xhAsy06b5nRtjqs4ChYm9OG6f+PlnN7XTiy9C7drw7LNuXaV+/YKzjJQzniIrCx55BL76yq2aum6dq4p6+umYZsGYqLNAYWJLtThQxFmJYsECN1PHwoVuCYo5c+CSS9wMHn8Ko+fToYfCRx/BP/4BhYVw+eVwww1u25jqyAKFia2ff3ZftffYA/be2+/U/Ombb6BnT9iwAU4+GebNg3btStkxVAqqYIR2UhL861/w3HOuGWb0aNduoRr9tBvjNc8ChYiMFZHZIlLm8qcikiUiM0r8vLeIBETkYxF5Wpw9RWRF8PWAiDT1Ks0mBkq2T8TJjLHffefaGtatg1NOgbfegvr1y9j54IPdTLLLloU1k+xFF8EHH0CtWjBmDIwYEc2UGxMbngQKEekPJKtqV6CNiOy22ICINAReAOqUePly4EpVPR7YC2gHdAbuUtWc4GONF2k2MRJn7RMrVkCPHrB6tStRvP46pKWVc0DJmWRDvbcq0KMHjB/vShkjR8Jjj1U93cbEkld9E3OACcHtKUA34Idd9ikEzgLeDr2gqreW+H1jYC1wHtBDRC4DPlDVW0q7oIgMBgYDZGVlEQgEyM3NJRAIVDkz1VG85r3j1KnUBxamp7PBw/SFk//8fGHo0I78/ns92rffyPXXf82cORXP49SmWTP2BpZNmMCyzMyw0lO/PtxwQzPuv/9Arr0WNm5cxDHHrA3r2EjF63sfK4mcf8/yrqpRfwBjgQ7B7V7AsHL2DZTy2lnA88Ht7kBdIBmYDrSv6PrZ2dmqqjp9+nRNVHGZ9x07VGvVUgXVDRs8vVQ4+b/0UpeUffZRXbs2gpO//ro78MQTI07X3Xe7Q+vVU/3hh4gPD0tcvvcxlMj5r0regXlaxj3VqzaKXCAjuJ1JBFVcItIG+Dvwf8GXZqnqFlUtBBYAcbxmpinX11+7oc777w8NGvialKefdl1f09Ndm0TjxhEcXLLnU4St08OGQf/+bm7BM890s60bE++8ChTzcdVNAB2AZeEcFGy3eBW4WFU3BV/+UESai0htXOlkUZTTamIlTrrFzp/veiCBCxgdO0Z4gj33hObNXRepH3+M6FAR1xNq333deIuhQyO8tjE+8CpQTALOF5HRwEDgWxEZFcZxw4C9gceCPZyOA+7AVTnNAcaoqs3xXF3FQUP29u1uxHVBAVx1FZx/fiVOIvLX9SkiVL8+TJzoekI9/TS8+mol0mBMDHkSKFR1M65Bew7QXVUXqmqp3WRVNafE9j9UtbkW93D6RFWnq+qBqtpeVR/3Ir0mRuJg6o7bboPFi+GAA+CBB6pwoioECnClmEcecdtDhri5pIyJV56No1DVDao6QVXtI2Bg0yY3YCEtzbepVWfOdMEhKQleeMFNXltpUVibYvBg6NXLTR549dU2GM/ELxuZbWJj3jz3fNhhrs4lxrZudRP9qboG5SoXakJjKRYsgPz8Sp1CxE1hnpnpJh2cOLGKaTLGIxYoTGz4XO00YoRbAqN9e1f9VGX168OBB7peXF9/XenT7L033H+/2x4yBNbYcFIThyxQmNjwsSF70SJ4+GH3DX7s2CgWaKrYThEyeDB07+6CxA03RCFdxkSZBQrjPdXiEkWMA4Wqq//fuROuuKK4xigqohQokpJcFVStWm6xpM8+i0LajIkiCxTGeytWuG49DRpA29iOl3zpJbeoUNOmbjnTqIpCg3bIvvvCjTe67SFDbEpyE18sUBjvlax2iuGMsRs3wt//7rbvvx8aNozyBdq3d724vvvO9eqqoptvdm0WX31lix2Z+GKBwnjPp/aJkSPdrLDdurlBdlGXluYGRKiGPZNseWrXdutWAAwf7qY9NyYeWKAw3vOhx9Nvv6Xz+OOuAPPoox4WZMpZGrUy+vd305KvXw///GdUTmlMlVmgMN4qLCweQ3HEETG77DPPtKGgwJUkIp7LKRJRDhShwJaU5KqfltiENSYOWKAw3lq82I1222cfyMqKySVnzYJPPtmDjAwYFc4MY1VRMlBEaWj1wQfDpZe6GHvzzVE5pTFVYoHCeCvG1U6qxWMRbrgBWrb0+IJt2kCTJq4xZNmyqJ12xAjXZvHWW9Zd1vjPAoXx1pw57rlLl5hc7vXX3SUbNsznppticEGRqFc/gZvFPBTwbrzR5oEy/rJAYbwVunnGIFDs3Ol6CwH87W/LqFvX80s6HgQKcAGiaVOYPduVLIzxS4WBQkTqiMh5IvKgiDwhIsNE5NBYJM5Uc5s3w7ffQmqqxy3Kzrhx8P33bvDaySev9Px6f/IoUNStC7ff7rZvucUFQmP8UG6gEJGzgTHAGuBO4HrcokT9RWSMiIS3srxJTF984epMDjvMrTnqoR07XL0+wB13QEpKDOtqQuNDvvyy0jPJlmXwYGjd2vV+euWVqJ7amLCVGShEpDXQVFXPV9UPVXWjqu5Q1e9UdSTwIHBOzFJqqp8Ytk888wwsXw6HHAKDBnl+ub9q0MCthLRjByxcGNVTp6YWlyruuMOtzGdMrJUZKFR1qao+GvpZRPbcZZc6qlrmRAMiMlZEZotIqSvbBffJEpEZJX5OFZF3ReQzEbm4rNdMNRGjHk9btxZ3g73zTkhO9vRypfOo+gng3HNdHPr5Z/jPf6J+emMqFElj9kQRuVFE6onIA8DdZe0oIv2BZFXtCrQRkd1mghORhsALQJ0SL18DzFfVo4EzRKRuGa+ZeKcasxLFE0/AH3+4mWH79vX0UmUL5dGDQJGSUlytduedruBiTCylRLDv0cDjuPaKe1T15HL2zQEmBLenAN2AH3bZpxA4C3h7l+OGBbc/BTqV8dr0XS8oIoOBwQBZWVkEAgFyc3MJBAIVZqwm8jvv6b//Tpc1a8ivX59Zy5fDr796cp28vGTuuqsLkMqZZy7kk082ALHPf2ZyMp2AbYEAcz247h57QOvWnVi6NJObbvqBfv1+K3Nfv997vyVy/j3Lu6qG9cDd+McC2cBbwOPl7DsW6BDc7gUMK2ffQIntj4D6we3BwKDSXqsordnZ2aqqOn36dE1Uvuf9lVdUQbVPH08vc++97jJduqgWFRW/HvP85+erpqe7xKxd68kl3nrLnb55c9W8vLL38/2991ki578qeQfmaRn31Eiqnh5R1UtUdb6q9qOUb/Ul5AKhpeszCb+Kq7TjKnsu46dQtZOH7RNbt8IDD7jtESNiOoP57lJTITvbbXtQ/QRw+umuA9nKlW6lPmNipbxeT/uIyJ81vqq660QCn4hIWf1L5uOqmwA6AMvCTE9px1X2XMZPMWifeOopt3xo587Qq5dnlwnfUUe559mzPTm9SPF63//6l7VVmNgpr9fTL8D+IvKoiBwQel1EaovIBbj2ik/LOHwScL6IjAYGAt+KSDjTs70A3CEijwAHA5+X8ZqJZzt2uNV3RDybMXbrVrjvPrfte2kiJBQoZs3y7BKnnw7t2rlFA59/3rPLGPMX5VbjqOp9uPESZ4rI8yLyHHA/sE5VB6nq72UctxnXCD0H6K6qC1W11G6yqppTYvsXoCfwGXCCqhaW9lqEeTSxtmCBG3h20EFQv74nlxgzxpUmjjwSTjzRk0tErmtX9zx3rmfDqJOSitepuOeeqI/vM6ZUFfZ6Ct6oI56sWVU3UNzzKZLjft/1uNJeM3Es9I06dOOMsry84raJ22+Pk9IEuGnU27RxAx4WLXINCh4YMMBNRb54MbzwAlx2mSeXMeZP4cz1dHrwubH3yTE1Qmhe7KOP9uT0zz0Hq1bB4YdD796eXKLyYlD9VLJUcffdNlrbeC+cHkRDg88TvUyIqSFUi2+SoZtmFOXnw733uu3hw+OoNBESKkV51KAdcuaZsP/+bgmMV1/19FLGhBUoVERGAq1F5LaSD68TZ6qhpUvd1/3Gjd2dLMrGjXNj9w45xDXsxp0YlCjATVMSWv3unnugqMjTy5kEF06g6AdMBTYCAeCTEg9j/qpkaSLKX/d37nQ3RXDTbifF44iaQw+FzEzXTvHHH55e6txz3Qqz330Hb77p6aVMgqvwo6aqm1V1BvC8qn6qqp+EHjFIn6luPGyfGD8efvoJ9tsPBg6M+umjIyWleNpxj6ufUlPhH/9w23ffbavgGe+E/Z1MS8wka0yZPGqfKCpyN0OAYcPc/Thuxaj6CeCii9yyqQsWwPvve345k6DisfBuqqvNm+Gbb9xX3U6donrqd95x3UH32gvOPz+qp44+j0dol5SeXry29qhRVqow3rBAYaJnzhx3pzr8cMjIqHj/MKkWlyZuvBHS0qJ2am+Epi354ouYjIi7/HLXd2D2bPi0rLkSjKkCCxQmekJVLVFun/joI3fPbdoULrkkqqf2RsOGblT6jh2uTshjmZkwNNiJPRRQjYkmCxQmekIN2VFunwjd/K67DmrXjuqpvRMKljNnxuRyQ4a4gDFlCixZYmt7meiyQGGio7CweMbYKAaK2bNh+nQ3ZdRVV0XttN475hj3HKO6oIYN4cor3fbLL+8dk2uaxGGBwkTHN99Abi60bu264URJqDQxZIhn8wt649hj3fPMmTEbDXfddVCrFsyY0ZTFi2NySZMgLFCY6Jgxwz1HsX1i4UL4739du3ioDr7a2Gcf10Vr/Xpidddu3hwuvthth6Y5MSYaLFCY6AhVsYS+SUfBv/7lngcPdg3Z1YpIzKufwPUKS0pSXn7ZzQNlTDRYoDBVp1p8MzzuuKic8ocfYMIENyQjNE6g2gkFzVBpKwZat4YePf6gsLB4YSdjqsqzQCEiY0VktoiUumBRafuIyJUiEgg+vhKRf4tIiogsL/F6O6/SbCrpu+9g9Wpo1gzato3KKe+7z1XtX3CBq8GplkKB4tNPYzoS7pxzlgNuOvaVK2N2WVODeRIoRKQ/kKyqXYE2IrLb3aO0fVT1KVXNCa56NwN4BmgPvBp6XVW/8SLNpgo+CU77ddxxUZkIcMUKtyBPUlLxXEbV0oEHQpMm8PvvbpLAGGnVahv9+rlhHKNHx+yypgbzqkSRQ/GKdFOAbpHsIyJ7AlmqOg/oAvQRkbnBEkg8z/KTmEoGiih48EG3GM+ZZ0atgOKPku0UMax+Aje7LsBTT7n2dGOqwqubbh3gt+D2euDwCPe5GngquP0Fbq3slSLyInAy8M6uJxORwcBggKysLAKBALm5uQQCgSpmpXqKWd5V6Tp1KrWAuRkZbKviNTduTGXMmC5AMiecMI9AILdS5+yI46sAABybSURBVImX975lixbsB6wcP54lrVrF5Jq5ublAgE6d2jNvXiNuuGEpF174S0yuHQ/i5b33g2d5V9WoP4BHgC7B7f7ALeHugyvlzAYk+HOtEsdcC9xQ0fWzs7NVVXX69OmaqGKW9++/VwXVpk1Vi4qqfLpbbnGn69OnaueJm/d+3jyXoX33jdklQ3n/5BN36YYNVTdvjtnlfRc3770PqpJ3YJ6WcU/1quppPsVVSR2AZRHscwzweTDhAONEpIOIJAN9gYVeJNhUUqja6dhjq9w+sWEDPPaY27711iqmK1506AB167qFNH7/PaaXPuYYN6xlwwZXBWVMZXkVKCYB54vIaGAg8K2IjKpgn8nB108ESnY8HwmMA74CZqvqNI/SbCojiu0Tjz8OW7ZAjx7FE7BWeykpxYMQYzy1qwj8859u+8EHYdu2mF7e1CCeBApV3YxrrJ4DdFfVhao6vIJ9NgVfv0VV3yyx3yJVba+q7VS1pnzPrBlUoxYocnPh4Yfd9vAyO1RXUzk57vnjj2N+6V693NIgq1fDs8/G/PKmhvBsHIWqblDVCaq6qir7mDi2bBn8+is0auTWiq6CMWNc75yjjopa56n4ccIJ7nla7AvDIsWB9777XJdZYyJlI7NN5YVKE8cc4wY9VFJeHjzwgNsePjwqQzHiy2GHueldly6N6XiKkFNPhXbt4Lff3PgUYyJlgcJU3tSp7rl79yqd5umn4Y8/3MJ4J50UhXTFm+RkOP54t/3RRzG/fFJScaninnvcGBVjImGBwlROUVFxVUqvXpU+zfbtxTOd3n57DSxNhPTo4Z59qH4CGDAADjjA1Ra+9JIvSTDVmAUKUznffONaSPfc001VUUnPPuvmIzrsMFdFUmOF2ik+/jhm61OUlJxc3ANq1CgrVZjIWKAwlTNlinvu2bPSxYAdO4qnEr/tthpcmgDYbz83u+HatfD1174kYdAg2H9/10zy8su+JMFUUxYoTOWE2ieqUO303HOugbV9ezj99CilK16JFJcqfGingN1LFTt3+pIMUw1ZoDCR2769eJK7UN17hHbscA2r4G5eVeg0VX343E4BrlTRtq0bKG5tFSZcifDxNNE2c6YLFocdBnvsUalTPPusG4Jx6KHQv3+U0xevQoHi008hP9+XJKSkWKnCRM4ChYlcyfaJSsjLg7vuctsjRyZIaQLcwk6HHOLm0pgzx7dknH12canixRd9S4apRhLlI2qiqYrtE2PGuJ5Ohx8OfftGMV3VQaid4sMPfUtCSorrigxwxx02WttUzAKFiczq1fDVV5CeDt1KW4+qfLm5xW0TI0fW8J5Opend2z1Pnlz+fh4bNAgOPhiWL7c5oEzFLFCYyIR67BxzjAsWEXr8cVizBjp3hpNPjnLaqoPjjoM6dWDhQrfmq0+Sk+HOO932qFE2s6wpnwUKE5nQN+FKVDtt2gT33++277wzAUsT4IJrqPrpvfd8TUq/fq76b9UqePJJX5Ni4pwFChO+nTuLb26nnRbx4fff72aIPfbY4ntlQurTxz3/97++JkPElSbADXzcvNnX5Jg4ZoHChO+zz9xyaQcc4Ib4RmDlShg92m3fe2+CliZCQnVuH33kuhn76KST3NTu69a5xY2MKY0FChO+d95xz5UoTYwc6brF9utXg1avq6wWLaBjR9cwEAj4mhSR4mlUHnzQVUMZsyvPAoWIjBWR2SJS5nplu+4jIikislxEAsFHu+Drd4jIFyLyhFfpNRVQrXSg+P57eOYZN14iNH4i4cVJ9RO4fgmnnQZbt7russbsypNAISL9gWRV7Qq0EZG2Ye7THnhVVXOCj29EJBvoBhwJrBaRRK7d9s+SJfDjj9C4MXTtGtGhw4dDYSFcfDEcdJBH6atuTjnFPU+e7IKwz+65xwXyZ55xb7UxJaV4dN4cYEJwewruRv9DGPtkAH1EpDvwDXA5cBzwhqqqiHwI9AZ2myxHRAYDgwGysrIIBALk5uYS8Llo75do532vV19lX2BVdjbfheZ5CsPixXWZODGbtLRCevX6nEAgNlNXxP17X1TEUQ0akLZsGXNfeIFtrVpF7dSVzXvv3vszeXILLrtsDSNHfhu19MRa3L/3HvIs76oa9QcwFugQ3O4FDAtnH+AIoHnwtReB04B/AqcHX9sfGFPR9bOzs1VVdfr06Zqoop73o49WBdXXXw/7kKIi1a5d3WHDhkU3ORWpFu/9hRe6P86//hXV01Y277/9ppqR4ZL02WdRTVJMVYv33iNVyTswT8u4p3rVRpGLKx0AZFJ6FVdp+3ytqiuDr80D2oZ5LuOlNWtg1ixIS4to/MT48TB7NmRlwc03e5i+6io0t/rrr/ubjqAWLeD66932ddf5sr6SiVNe3XTn46qSADoAy8LcZ5yIdBCRZKAvsDDMcxkvvfeeq0c//nioWzesQ/Ly4B//cNujRkG9eh6mr7o66STIzIR589xqQnFg2DBo3hzmzrVpyE0xrwLFJOB8ERkNDAS+FZFRFewzGRgJjAO+Amar6jRgJtBRRB7BVU+96lGaTVkmTnTPEfR2Gj3azSPUoQNcdJFH6aruMjKK/6ahv7HPMjOLu8sOG+bm5jLGk0ChqptxjdVzgO6qulBVh1ewzyZVXaSq7VW1nareGtyvCDgBmAH0VtWlXqTZlGHdOjfTaXIyDBgQ1iErVxZP/Dd6tDvUlGHgQPc8YUL5+8XQeefBkUf+9X00ic2z+n5V3aCqE1S1zCE84ewT3C9PVV9X1fgonyeSN95wU3eccELYixTdcIPrk3/66a62ypTjxBNddd6XX7rux3EgKQkeecRtP/hg3NSKGR9Zw7Ap36vBmr6zzw5r948/doekp8NDD3mYrpoiPb24UTtOqp/AjZ4/7zy3VsXQoXEx1MP4yAKFKdtvv8Enn0CtWm7ujQrk58PVV7vtW2+F1q09Tl9NEYfVT+Dm5KpXzw0ef/ttv1Nj/GSBwpRt/Hj3VfKUU8LqtvTQQ/Ddd26ZzRtvjEH6aopevaB+fbcg1Pff+52aP7VoUTzlyjXXWMN2IrNAYcoWQbXT8uVu4j9wixPVquVhumqaWrWK14QdP97ftOziyishO9utsWTzQCUuCxSmdD/84Pr3161bPC9RGVTh8svdZKhnnFHppbQT26BB7vmFF+JqpFtyslvjXMSVGL/+2u8UGT9YoDClC5Um+vZ1/f3LMW4cfPABNGgAjz4ag7TVRD17wl57wU8/uXahONKpk2t7KiyESy5xneBMYrFAYXZXWAjPPee2zz233F1XrYL/+z+3/dBDblSvqYTkZDe9LsCzz/qbllLcdRfsvbcrZIaWszWJwwKF2d2HH8Ivv7huSz17lrvrkCFu0bsTT4QLL4xR+mqqiy5ydTxvvOHWjI0j9eoVx68RI2DRIl+TY2LMAoXZ3Zgx7vnyy93oqzJMmODuaZmZ8O9/J/jyptGwzz6ugWfHDnj5Zb9Ts5uePWHwYNcN+qKLrAoqkVigMH+1fLlbTCc1tdxJmn791cURgPvuc/c4EwWXXuqen3kmLke53X9/cRVUaE4oU/NZoDB/9eyzrtfNgAFlTtlRWAgXXAAbN7oOUVdcEeM01mSnnQZNmsA337i7cZypVw/GjnXbI0bAnDm+JsfEiAUKU6ygoLgiupy7/4MPQiDg4shzz1mVU1SlpRU39oSqAOPMCSe4+bwKC90Qm02b/E6R8ZoFClPsnXfclKEHHQTHHlvqLvPnuzWwAf7zn7DnCTSRGDzYRd+XXnLvRxy6+243EG/ZMlcFGYe1ZCaKLFCYYqFBEFdcUWoxYf16N6CuoMD1durdO8bpSxT77+/m1srPj9uBKWlpbqhNnTpuMHmoN7WpmSxQGGfGDPj0UzdqrpR+rkVFbjbRZcvcACzrS++xm25yz089BZs3+5uWMrRtC0884bavvtqVNk3NZIHCOKHZ36691k1Qt4s774T334fGjd0Sz+npMU5founcGY47zjUAPP2036kp04UXwmWXuR69/fq55dVNzeNZoBCRsSIyW0SGh7uPiNQXkfdFZIqIvCUiaSKSIiLLRSQQfLTzKs0J64sv3CC7zEwXKHbx3ntuQjgReOUV6wobM6FSxUMPuTtxnHrsMbd+xa+/uhnTbXxFzeNJoBCR/kCyqnYF2ohI2zD3ORcYraq9gFXASUB74FVVzQk+vvEizQktVJq46ipXZChh4UI46yzXWDlypE34F1O9e8Ohh8Lvv7sIHadq1XIDL5s1c73hrr/e7xSZaBP1oLuCiDwKfKCq74nIICBDVZ+PZB8ReR14ADgcuBrYCnwDXK6qu31nEZHBwGCArKys7Ndee43c3FwyMzOjnr/qINy81/npJ4649FIK09KY8+qrFDRq9Ofv1qxJ46qrslm7thY9evzBrbf+r9p0ha0p733WlCkcdM895LVowdznn0fT0io8xq+8L1pUj+uuO4ydO5O48sofGThwRczTADXnva+MquS9e/fu81W1U6m/VNWoP4CxQIfgdi9gWCT7AF2Bj4LbRwDNg9svAqdVdP3s7GxVVZ0+fbomqrDzPmCAKqhee+1fXt6yRfWww9yvunVT3b49+mn0Uo157wsKVA8+2L0RDz4Y1iF+5v3ll11SQfW11/xJQ4157yuhKnkH5mkZ91Sv2ihygdDc1JmUXsVV6j4i0gh4DAhOpcnXqhrqTD4P2K0ay1RSIODqDDIy/rIk3fbt0L+/W3CtbVuYNMkWIvJNSkpxF7M774R16/xNTwXOOcctoQpu9H6czZhuKsmrQDEf6Bbc7gAsC2cfEUkDJgI3q+ovwd+NE5EOIpIM9AUWepTmxLJzZ3HD9c03Q8uWgOu6f+aZMHWqG0w3efJuzRYm1nr3dsOhN250wSLO3XijG2eTnw+nnmrTfNQEXgWKScD5IjIaGAh8KyKjKthnMnAJrk3i1mAPp7OAkcA44CtgtqpO8yjNiWXMGDefUKtW8Pe/Ay52nHsu/Pe/0KgRTJvmShTGZyLwwAPu+Ykn4mpd7dKIwMMPu0X7tmxxU9DPnet3qkxVeBIoVHUzkAPMAbqr6kJVHV7BPptU9SlVbajFPZzGq+oiVW2vqu1U9VYv0ptw1q6Ff/7TbY8eDRkZ5Oe7AXWvv+6GUUydCu2sI3L86NCheG7v66+P+zkzkpPdyodnnunGC/bqFZdzHJoweTaOQlU3qOoEVV1VlX2MB26+2VVj9OwJffuydSucfrqbiqFuXTew7vDD/U6k2c2oUW761smT4cUX/U5NhVJS3LIaAwa4cYM9esD06X6nylSGjcxONO++62aITU2Fhx9mw0ahVy+35nWTJu6D3LWr34k0pWrevHjup2uvdasQxrnUVDcn1MCBrmRx0knuC4mpXixQJJLffitejOiee/g+5WCOOgpmzXKL0cyc6WYENXHsggugb193173oIjcJV5wLBYtrr3UN3IMGuRrPOK89MyVYoEgUhYVw/vmue+WJJ/LBQddx5JHw3XdwyCEuSBxwgN+JNBUScevONm3qin9xOrvsrpKSXAN3qOvsDTe4eaK2bfM3XSY8FigSxb33wvTpFDXN4t5OEznl1CQ2bXJfTmfPhr328juBJmx77OGWSgXXF/Xjj/1NT5hE3PRVr70GtWu7xu6jjoKff/Y7ZaYiFigSwYQJMHw4v9GCnnt+y7C76lJUBLff7sbb1a3rdwJNxE4/3fV+2rnTtRb/739+pyhsZ53lxlbst5+bSyw7201lZVVR8csCRU03bRp67nlM1AG0y/iRj79qTNOmbqzEiBGuSsBUU/fd54qEocXLV6/2O0Vha9fOTVp82mku+eee6wJInA88T1h2m6jJ5s1j6en/R5+dbzGQiWzIy6B3bzfO7pRT/E6cqbLkZLdcaqdOsHQp9OnjliGsJho0cNPDPPOMm+F+4kTXXjZunJUu4o0Fihoqbd5i7jr2Qw7ZNpf3OIV69ZQnn3Rd8LOy/E6diZo6dVyX51at3Ff0Y46hVjVaPUgELr3UVUEdeyz88Yfr2HXssW6uMRMfLFDUMAUFMOaizznjxr4Mz7uVPGpz9llFLFkiXHllqUthm+quWTO3lO0hh8DixXS85hpYssTvVEWkTRvXies//3Ft9TNnukGf550X9zOWJAQLFDXE1q3wxKOFHJi1niv/05mVtCB7j+VM+7CQV15Lolkzv1NoPNWypVvzvGtX0v/4wy05N3Gi36mKSFKS6zK7ZAkMHVo8svvgg+Fvf4Nvv/U7hYnLAkU1t3QpDB8Oe++5kyFDk/l5QyP2ZwmPnPQcc1fuTY9eyX4n0cRKcCbHtUcf7VqIBw50d9jNm/1OWUQaNHBjLr7/3lVLAbzwglvsr2dP1xGjsNDfNCYaCxTV0ObN7ptWjx6uyH7XXbB+UwpH8jkTG13O4veX0/4fbaxHUyKqXZtFd97pZplNT3d32HbtXKN3NRjFXVKrVq6he8kSt0pv7dpuRuNTT3Xjfm66yUoZsWK3kmri99/h+efdh6RpU1d3+/HHkE4e5/ISn3IMcy4dyxk/30fyST39Tq7xk4i7s375pavoX77cjcrv2NF9Ha9mAWPffV3cW7HC9Qjed19YudKt53TooXDQQTBsmBs4aiUNb6T4nQBTuhUr3D/+zJnuW9TixcW/E4o4JuVzzt75ImfzKg06Hwj33APdu/uXYBN/DjrILQQxbhzcdht8/bX7ptG6NVx2mZsrqho1XjVs6Aai//3v7rPxwguuGea779zj3nvdFPmHHHIoAwe6Ud8dOkAYy4ybClig8NmOHfDjj+4ffeFC1yVwwQIXKEqqk7qDnFqz6ZP7Gn2ZRLOdf0DnzjDiNbcyjHVnMqVJTnbtFIMGwZNPwiOPuIatW25xjVtdurhBNSef7KqokuO/TUvEBYGjjoLHH3dfpt5+2xWWfvoJZs1qwqxZbt9atVxB6rDDXPbatYMDD3QzJdtHJnwWKDy0Y4dbI2j1ald1tHKlm8D1l1/cY+lS91xaTUD9tG10rrWQrlun0b1oGl0LZpNWUOD+w885x3UP6djR/ttNeNLT3ZQfQ4fClCluYsH33nNTB8+aBbfe6ka9deoERxzhSiP77+8ecXxXTU11Benu3V0D+C+/wFNPfcfKlQfy+eeufWPOnN2XY61f300h0rq1mzl5r71gzz1dAatZM1e9W79+3GY75jwLFCIyFjgYmKyquy6DWuY+4b4WbRtW7WDRnFwKCqBgJxTkQ8FOIT/fTY28Y4d7bN8B27fDtm3CtjzYulXYkusem3OFTVuS2LglmfWbU8jNq/jPm0Qh+yb/ygFFi2mvC+mAexyQv4SkfHX/qYd3hF43uC4f3bpZWdpUXnKyW4O7d2/XK2LaNDcK86OP3F02EHCPktLT3V10zz1d0GjUyD3q1XMThdWt61qa09MhI8P9f6alubt4aqq7ZkqKe05KKn6IlP0ICWe7hH0y4NTO/+PooxsBsGGjMH9hCl//L5Vv/pfCou+S+f6nZDZtSmL+fJg/v7w/ldKoodKoQRH16yn16yr16iqZddyjdoZ7ZKQr6emQXkupVUuplQapqUpaMPupKUpKCqQk61//FKK7/UmSkkBQREr/E4WyXnK75POmn/MoPLqI5NToNj97EihEpD+QrKpdReQ5EWmrqj9UtA/QLpzXdj1XNHzx/CJOvCW6izGkkk8T1tKEtTRnJS34neasZB9++fPRhp+pVZjvDmjRwrXU7dcVOlzhGiI7dHAfSGOirV496N/fPcANi5471zWCf/+9+zr+449uebqffnKPauDoEtsNgROCjxAF1tCUH2jLcvZmOXvzK3uxkuasohkrac4ampJbWJc1a4U1a6tTn5/erOy0mmbt94jqWUU9mFRFRB4FPlDV90RkEJChqs9XtA/QMZzXdj1X8HyDgcEAWVlZ2a+99hq5ublkZmaGlebf3v2dMY+2IoWdJFNIiuwkjQLSJJ8U2Uk6O6gl+aRJPhlJ26ktedRO2k5G0nYyU7ZROymPzJQ86qdtpV7qVuqn51EnPR/SUilKS6MwI4PC9HQKMzLYWbcuBZmZ7KxXj/xGjchv3Jj8Ro0oimJJIZK810SJnP9o5z05L4+0NWuotXYtqVu2kLJpE6lbtpC8bRvJeXmkbNtG0o4dJOXnu0dBAbJzp3suLPzzgSpSVPSXZ1SR0D0o+HOIlHVvquCepapIyRJHJe9x+ZrKOm3ERm3AZq3LJq3HZq3HVuqQq3XYprXJI4M8TSePDHZoGvnUYgdpFGgq+aRRQAo7NYVCUigghUKSKSSZnZpCEUkUIRSSjCIUkfTntqqgJLltQHH5cT8Xb5d8Dnlm7HwyW9eJOL/du3efr6qdSvudV1VPdYDfgtvrgdJWYC5tn3Bf242qPg08DdCpUyfNyckhEAiQk5MTXopz4NwHw9u1Oogo7zVQIuc/kfMO0ct/GpAJ7FPlM8WOy3v0Z/z0qkyViysNgPtbl3ad0vYJ9zVjjDEx4tVNdz7QLbjdAVgW5j7hvmaMMSZGvKp6mgTMEJEWQG9gkIiMUtXh5ezTBdfOFM5rxhhjYsSTEoWqbgZygDlAd1VduEuQKG2fTeG+5kWajTHGlM6zcRSqugGYEOk+4b5mjDEmNqxh2BhjTLksUBhjjCmXBQpjjDHl8mRktt9EZA3wC9AEWOtzcvySyHmHxM5/IucdEjv/Vcn7PqratLRf1MhAESIi88oakl7TJXLeIbHzn8h5h8TOv1d5t6onY4wx5bJAYYwxplw1PVA87XcCfJTIeYfEzn8i5x0SO/+e5L1Gt1EYY4ypuppeojDGGFNFFiiMMcaUq8YGChEZKyKzRWR4xXvXHCKSIiLLRSQQfLTzO02xIiJZIjIjuJ0qIu+KyGcicrHfafPaLnnfU0RWlPgfKLVvfE0gIvVF5H0RmSIib4lIWqJ89svIuyef/RoZKEquxw20Ca69nSjaA6+qak7w8Y3fCYoFEWkIvIBbERHgGmC+qh4NnCEidX1LnMdKyXtn4K4S/wNr/Eud584FRqtqL2AVMIjE+ezvmvdhePTZr5GBAjcteWi22SkUL3yUCLoAfURkbvCblWczBMeZQuAsYHPw5xyK/wc+BWryAKxd894FuFREvhSRu/1LlvdU9UlVnRr8sSlwHgny2S8l7zvx6LNfUwPFrutsZ/mYllj7AjhBVY8EUoGTfU5PTKjq5l3WKkmY/4FS8v4+LlAeAXQVkfa+JCyGRKQr0BD4lQR530NK5H0qHn32a2qgSOR1tr9W1ZXB7XlATS56lyeR/wdmqeoWVS0EFlDD/wdEpBHwGHAxCfa+75J3zz77NfWPmMjrbI8TkQ4ikgz0BRb6nSCfJPL/wIci0lxEagO9gEV+J8grIpIGTARuVtVfSKD3vZS8e/bZr6n116Wtx50oRgKvAAK8o6rTfE6PX14A3hORY4CDgc99Tk8s3QFMB/KBMaq6xOf0eOkS4HDgVhG5FXgeOD9BPvu75n06MA4PPvs1dmR2sCdIT+BTVV3ld3pM7AVvFt2AD22t9cRhn/3oq7GBwhhjTHTU1DYKY4wxUWKBwhhjTLksUBhjjCmXBQpjjDHlskBhjDGmXBYojIkBEekmIhNFJCk4s+lefqfJmHBZ91hjYkREngfygF9U9V6/02NMuCxQGBMjItIJmA00VdWNfqfHmHBZoDAmRkRkEvA1UEdVb/A7PcaEy9oojIkBETkD+F1VbwMOEZHD/U6TMeGyEoUxxphyWYnCGGNMuSxQGGOMKZcFCmOMMeWyQGGMMaZcFiiMMcaUywKFMcaYcv0/6huo2ScxhQIAAAAASUVORK5CYII=\n",
589 |       "text/plain": [
590 |        "<Figure size 432x288 with 1 Axes>"
591 |       ]
592 |      },
593 |      "metadata": {
594 |       "needs_background": "light"
595 |      },
596 |      "output_type": "display_data"
597 |     }
598 |    ],
599 |    "source": [
600 |     "# 画图\n",
601 |     "x = np.linspace(1,25,100)\n",
602 |     "y1 = norm_fun(x,mu1,sigma1)\n",
603 |     "y2 = norm_fun(x,mu2,sigma2)\n",
604 |     "\n",
605 |     "fig,ax = plt.subplots()\n",
606 |     "ax.plot(x,y1,\"r-\",linewidth=2,label='f(x1)')\n",
607 |     "ax.plot(x,y2,\"b-\",linewidth=2,label='f(x2)')\n",
608 |     "ax.set(ylabel='f(x)',xlabel='x')\n",
609 |     "ax.legend()\n",
610 |     "ax.grid(True)"
611 |    ]
612 |   },
613 |   {
614 |    "cell_type": "markdown",
615 |    "metadata": {},
616 |    "source": [
617 |     "# 第二节 随机抽样"
618 |    ]
619 |   },
620 |   {
621 |    "cell_type": "markdown",
622 |    "metadata": {},
623 |    "source": [
624 |     "## 实验3-10 使用随机数发生器创建随机数"
625 |    ]
626 |   },
627 |   {
628 |    "cell_type": "markdown",
629 |    "metadata": {},
630 |    "source": [
631 |     "创建取值分别为1，2，,3,4，相应概率为0.3,0.2,0.1,0.4的概率分布下，15行8列的离散分布随机数表"
632 |    ]
633 |   },
634 |   {
635 |    "cell_type": "code",
636 |    "execution_count": null,
637 |    "metadata": {},
638 |    "outputs": [],
639 |    "source": [
640 |     "import numpy as np"
641 |    ]
642 |   },
643 |   {
644 |    "cell_type": "code",
645 |    "execution_count": 47,
646 |    "metadata": {},
647 |    "outputs": [
648 |     {
649 |      "data": {
650 |       "text/plain": [
651 |        "array([[4, 3, 4, 4, 2, 1, 2, 1],\n",
652 |        "       [3, 2, 4, 4, 4, 2, 1, 4],\n",
653 |        "       [4, 2, 1, 1, 2, 3, 1, 1],\n",
654 |        "       [4, 4, 1, 2, 4, 2, 1, 4],\n",
655 |        "       [4, 2, 1, 1, 2, 1, 1, 1],\n",
656 |        "       [1, 4, 2, 4, 4, 4, 1, 1],\n",
657 |        "       [2, 2, 4, 1, 1, 4, 2, 4],\n",
658 |        "       [1, 1, 2, 1, 1, 1, 1, 4],\n",
659 |        "       [4, 1, 1, 4, 4, 4, 4, 1],\n",
660 |        "       [4, 1, 2, 4, 1, 1, 4, 1],\n",
661 |        "       [3, 1, 4, 4, 4, 2, 1, 4],\n",
662 |        "       [1, 2, 2, 4, 2, 1, 2, 4],\n",
663 |        "       [1, 1, 4, 3, 4, 1, 4, 3],\n",
664 |        "       [4, 2, 1, 2, 4, 4, 4, 3],\n",
665 |        "       [2, 4, 3, 4, 2, 2, 1, 1]])"
666 |       ]
667 |      },
668 |      "execution_count": 47,
669 |      "metadata": {},
670 |      "output_type": "execute_result"
671 |     }
672 |    ],
673 |    "source": [
674 |     "np.random.choice([1,2,3,4], size=(15,8), p=[0.3,0.2,0.1,0.4])"
675 |    ]
676 |   },
677 |   {
678 |    "cell_type": "markdown",
679 |    "metadata": {},
680 |    "source": [
681 |     "## 实验3-11 使用随机数函数创建随机数"
682 |    ]
683 |   },
684 |   {
685 |    "cell_type": "code",
686 |    "execution_count": 48,
687 |    "metadata": {},
688 |    "outputs": [
689 |     {
690 |      "data": {
691 |       "text/plain": [
692 |        "array([[0.96217097, 0.98366955, 0.74277225, 0.60416228],\n",
693 |        "       [0.06235049, 0.74642095, 0.32462698, 0.69385062],\n",
694 |        "       [0.85452821, 0.12790053, 0.69142201, 0.24191518],\n",
695 |        "       [0.19062622, 0.65556837, 0.44151301, 0.7943343 ]])"
696 |       ]
697 |      },
698 |      "execution_count": 48,
699 |      "metadata": {},
700 |      "output_type": "execute_result"
701 |     }
702 |    ],
703 |    "source": [
704 |     "# 创建一组服从0-1均匀分布的随机数\n",
705 |     "np.random.rand(4,4)"
706 |    ]
707 |   },
708 |   {
709 |    "cell_type": "code",
710 |    "execution_count": 49,
711 |    "metadata": {},
712 |    "outputs": [
713 |     {
714 |      "data": {
715 |       "text/plain": [
716 |        "array([116.76319916, 135.19370917, 109.63489242, 144.82287433,\n",
717 |        "       136.83623471, 105.72656478, 101.95467207, 130.47797445,\n",
718 |        "       131.04471831, 124.04200185, 112.66708126, 134.27049649,\n",
719 |        "       115.19391079, 143.9568004 , 115.83986507, 103.46374113,\n",
720 |        "       131.50326788, 107.43072546, 132.84189222, 127.73643143,\n",
721 |        "       112.44130568, 127.89727523, 110.67101175, 100.78853637,\n",
722 |        "       118.5169953 , 118.54264792, 146.05817162, 115.50604347,\n",
723 |        "       131.63951633, 113.06720324, 125.39585152, 114.22338753,\n",
724 |        "       121.31933932, 147.92981049, 118.1308307 , 140.90040844,\n",
725 |        "       146.10194269, 135.69761576, 128.46450351, 118.35484852,\n",
726 |        "       101.41365076, 114.91153316, 110.17305378, 139.27232063,\n",
727 |        "       116.49425751, 114.79169251, 131.29659205, 141.42651957])"
728 |       ]
729 |      },
730 |      "execution_count": 49,
731 |      "metadata": {},
732 |      "output_type": "execute_result"
733 |     }
734 |    ],
735 |    "source": [
736 |     "# 创建一个均匀分布的，48个在[100,150)中的随机数\n",
737 |     "np.random.uniform(100,150,48)"
738 |    ]
739 |   },
740 |   {
741 |    "cell_type": "markdown",
742 |    "metadata": {},
743 |    "source": [
744 |     "## 实验3-12 正态分布的模拟"
745 |    ]
746 |   },
747 |   {
748 |    "cell_type": "code",
749 |    "execution_count": 50,
750 |    "metadata": {},
751 |    "outputs": [],
752 |    "source": [
753 |     "import numpy as np\n",
754 |     "%matplotlib inline\n",
755 |     "import matplotlib.pyplot as plt"
756 |    ]
757 |   },
758 |   {
759 |    "cell_type": "code",
760 |    "execution_count": 54,
761 |    "metadata": {},
762 |    "outputs": [
763 |     {
764 |      "data": {
765 |       "text/plain": [
766 |        "array([-0.42170056, -0.44939553,  0.15702986, ...,  0.95759534,\n",
767 |        "       -0.01364779,  0.27112559])"
768 |       ]
769 |      },
770 |      "execution_count": 54,
771 |      "metadata": {},
772 |      "output_type": "execute_result"
773 |     }
774 |    ],
775 |    "source": [
776 |     "# loc参数代表均值，scale代表标准差，size代表数量\n",
777 |     "sample = np.random.normal(loc=0,scale=1,size=2000)\n",
778 |     "sample"
779 |    ]
780 |   },
781 |   {
782 |    "cell_type": "code",
783 |    "execution_count": 55,
784 |    "metadata": {},
785 |    "outputs": [
786 |     {
787 |      "data": {
788 |       "text/plain": [
789 |        "(array([ 0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,\n",
790 |        "         0.,  0.,  0.,  0.,  0.,  1.,  1.,  0.,  1.,  1.,  1.,  3.,  3.,\n",
791 |        "         4.,  7., 11., 13., 10., 21., 17., 16., 23., 26., 32., 43., 47.,\n",
792 |        "        48., 65., 66., 51., 62., 70., 74., 62., 78., 81., 90., 75., 74.,\n",
793 |        "        88., 74., 64., 75., 62., 68., 56., 45., 43., 43., 34., 21., 25.,\n",
794 |        "        28., 14., 20., 13.,  7.,  8.,  7.,  9.,  8.,  3.,  4.,  1.,  1.,\n",
795 |        "         1.,  1.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.,\n",
796 |        "         0.,  0.,  0.,  0.,  0.,  0.,  0.,  0.]),\n",
797 |        " array([-5.00000000e+00, -4.90000000e+00, -4.80000000e+00, -4.70000000e+00,\n",
798 |        "        -4.60000000e+00, -4.50000000e+00, -4.40000000e+00, -4.30000000e+00,\n",
799 |        "        -4.20000000e+00, -4.10000000e+00, -4.00000000e+00, -3.90000000e+00,\n",
800 |        "        -3.80000000e+00, -3.70000000e+00, -3.60000000e+00, -3.50000000e+00,\n",
801 |        "        -3.40000000e+00, -3.30000000e+00, -3.20000000e+00, -3.10000000e+00,\n",
802 |        "        -3.00000000e+00, -2.90000000e+00, -2.80000000e+00, -2.70000000e+00,\n",
803 |        "        -2.60000000e+00, -2.50000000e+00, -2.40000000e+00, -2.30000000e+00,\n",
804 |        "        -2.20000000e+00, -2.10000000e+00, -2.00000000e+00, -1.90000000e+00,\n",
805 |        "        -1.80000000e+00, -1.70000000e+00, -1.60000000e+00, -1.50000000e+00,\n",
806 |        "        -1.40000000e+00, -1.30000000e+00, -1.20000000e+00, -1.10000000e+00,\n",
807 |        "        -1.00000000e+00, -9.00000000e-01, -8.00000000e-01, -7.00000000e-01,\n",
808 |        "        -6.00000000e-01, -5.00000000e-01, -4.00000000e-01, -3.00000000e-01,\n",
809 |        "        -2.00000000e-01, -1.00000000e-01, -1.77635684e-14,  1.00000000e-01,\n",
810 |        "         2.00000000e-01,  3.00000000e-01,  4.00000000e-01,  5.00000000e-01,\n",
811 |        "         6.00000000e-01,  7.00000000e-01,  8.00000000e-01,  9.00000000e-01,\n",
812 |        "         1.00000000e+00,  1.10000000e+00,  1.20000000e+00,  1.30000000e+00,\n",
813 |        "         1.40000000e+00,  1.50000000e+00,  1.60000000e+00,  1.70000000e+00,\n",
814 |        "         1.80000000e+00,  1.90000000e+00,  2.00000000e+00,  2.10000000e+00,\n",
815 |        "         2.20000000e+00,  2.30000000e+00,  2.40000000e+00,  2.50000000e+00,\n",
816 |        "         2.60000000e+00,  2.70000000e+00,  2.80000000e+00,  2.90000000e+00,\n",
817 |        "         3.00000000e+00,  3.10000000e+00,  3.20000000e+00,  3.30000000e+00,\n",
818 |        "         3.40000000e+00,  3.50000000e+00,  3.60000000e+00,  3.70000000e+00,\n",
819 |        "         3.80000000e+00,  3.90000000e+00,  4.00000000e+00,  4.10000000e+00,\n",
820 |        "         4.20000000e+00,  4.30000000e+00,  4.40000000e+00,  4.50000000e+00,\n",
821 |        "         4.60000000e+00,  4.70000000e+00,  4.80000000e+00,  4.90000000e+00]),\n",
822 |        " <a list of 99 Patch objects>)"
823 |       ]
824 |      },
825 |      "execution_count": 55,
826 |      "metadata": {},
827 |      "output_type": "execute_result"
828 |     },
829 |     {
830 |      "data": {
831 |       "image/png": "iVBORw0KGgoAAAANSUhEUgAAAW4AAAD2CAYAAAD24G0VAAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADh0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uMy4xLjEsIGh0dHA6Ly9tYXRwbG90bGliLm9yZy8QZhcZAAAK2klEQVR4nO3dX4id+VkH8O9jbCA0WlN2iCy4jYHghUpqGXQjUdKlW9wLFVeUxVovKkRlwUvZYqqlFypLWcVClkZjb/TC9KJSsZWAsrhCFkkovVFLe5GlBIKp2Ua3148XOWsm6UzmZHL+zO+cz+fqnPPmnXneOXO+PHne9/dOdXcAGMf3LLsAAB6N4AYYjOAGGIzgBhiM4AYYzPfO+xs88cQTfezYsXl/G4CVcu3atW9198Z22+Ye3MeOHcvVq1fn/W0AVkpVvbnTNqMSgMEIboDBCG6AwQhugMEIboDBCG6AwQhugMEIboDBCG6Awcx95STsR5/85PaPYQQ6boDBCG6AwQhugMGYccMOzMHZr3TcAIMR3ACDEdwAgxHcAIMR3ACDEdwAgxHcAIMR3ACDEdwAgxHcAIMR3ACDEdwAgxHcAIMR3ACDEdwAg3E/btaGe2qzKh7acVfVkar6UlVdrarPTl67WFVXqurcYkoEYKvdRiUfTfI33b2Z5Puq6veSHOjuU0mOV9WJuVcIwH12C+7/TvJjVfUDSX4oyQ8nuTTZdjnJ6e12qqqzky796q1bt2ZWLAC7B/e/Jnlfkt9N8h9JDia5Mdl2O8nR7Xbq7gvdvdndmxsbG7OqFYDsHtx/mOS3u/tTSf4zya8lOTTZdniK/QGYsd2C90iSH6+qA0l+Ksmf5N545GSS6/MrDYDt7HY54B8n+VzujkuuJPnTJK9X1ZNJnkvy9HzLg8fjEkBW0UODu7v/LcmPbn2tqs4keTbJy919Z36lAbCdR16A091v5d6VJQAsmJOLAIMR3ACDEdwAgxHcAINxd0DW3tZLBvdy+eDj7g+PSscNMBjBDTAYoxJWwqzGFTvtaxzCfqLjBhiM4AYYjOAGGIzgBhiM4AYYjOAGGIzgBhiM4AYYjAU4DMtCGNaVjhtgMIIbYDCCG2AwZtwwJ25MxbzouAEGI7gBBiO4AQYjuAEG4+Qk+86DJ/Kc2IP76bgBBqPjZl/QVcP0dNwAgxHcAIMxKoFHZKzDsum4AQYjuAEGI7gBBmPGzVCmmS8vcwZt/s0i6LgBBiO4AQYzdXBX1fmq+vnJ44tVdaWqzs2vNAC2M1VwV9XPJPnB7v77qno+yYHuPpXkeFWdmGuFANxn1+Cuqncl+Ysk16vqF5OcSXJpsvlyktPb7HO2qq5W1dVbt27NsFwApum4fyPJvyd5OclPJnkxyY3JtttJjj64Q3df6O7N7t7c2NiYVa0AZLrLAX8iyYXuvllVf53kp5Mcmmw7HCc4ARZqmtD9RpLjk8ebSY7l3njkZJLrM68KgB1N03FfTPJXVfVCknfl7oz7i1X1ZJLnkjw9v/IAeNCuwd3d/5vkV7a+VlVnkjyb5OXuvjOf0gDYzp6WvHf3W7l3ZQkAC+TEIsBgBDfAYNwdEBZg610D3UGQx6XjBhiM4AYYjOAGGIzgBhiM4AYYjOAGGIzgBhiM4AYYjOAGGIzgBhiMJe/se5aIw/103ACDEdwAgxHcAIMR3ACDEdwAgxHcAINxOSBL4zI/2BsdN8BgBDfAYIxKWCjjEXh8Om6AwQhugMEIboDBmHHDgm2d85v5sxc6boDBCG6AwQhugMEIboDBODnJ3DkBt7OdfjZ+ZjyMjhtgMIIbYDCCG2AwghtgMFMFd1UdraqvTB5frKorVXVuvqUBsJ1pO+5PJzlUVc8nOdDdp5Icr6oT8ysNgO3sGtxV9UyS7yS5meRMkkuTTZeTnN5hn7NVdbWqrt66dWtGpQKQ7BLcVXUwySeSvDR56d1Jbkwe305ydLv9uvtCd2929+bGxsasagUgu3fcLyU5393fnjx/O8mhyePDU+wPwIzttnLyQ0meqaoXk7w/yVNJvpnkjSQnk3xtvuUB8KCHBnd3/+w7j6vqtSS/kOT1qnoyyXNJnp5rdQB8l6lHHd19prv/J3dPUL6R5IPdfWdehQGwvUe+yVR3v5V7V5YAsGBOLgIMRnADDEZwAwxGcAMMRnADDEZwAwxGcAMMxh8Lhn1o6x8L9oeDeZCOG2AwghtgMIIbYDBm3MyFuSzMj44bYDCCG2AwghtgMIIbYDCCG2AwghtgMIIbYDCCG2AwFuDAoNyIan3puAEGI7gBBiO4AQYjuAEG4+QkM+MEGSyGjhtgMDpuGIj/1ZDouAGGI7gBBiO4AQYjuAEG4+Qkj8XJMlg8HTfAYAQ3wGAEN8BgzLjZkfs97w9+9jxo1467qt5TVV+uqstV9YWqOlhVF6vqSlWdW0SRANwzzajkI0le6e4PJ7mZ5IUkB7r7VJLjVXVingUCcL9dRyXdfX7L040kv57kzybPLyc5neTrW/epqrNJzibJU089NZNCgekYca2+qU9OVtWpJEeSfDPJjcnLt5McffDfdveF7t7s7s2NjY2ZFArAXVMFd1W9N8lnknwsydtJDk02HZ72awAwG9OcnDyY5PNJPt7dbya5lrvjkSQ5meT63KoD4LtM0y3/ZpIPJPn9qnotSSX5aFW9kuRXk/zD/MoD4EHTnJx8NcmrW1+rqi8meTbJy919Z061AbCNPS3A6e63klyacS0ATMHKSabiEjPYP1wRAjAYHTePTMcNy6XjBhiM4AYYjOAGGIzgBhiMk5OwApwwXi86boDB6LixuGaFPfh+en9Xg44bYDCCG2AwghtgMGbca8qsE8al4wYYjOAGGIxRCfcxQoH9T8cNMBgdN3AfC7L2Px03wGB03LCmpumsdd/7k44bYDCCG2AwRiVrwn9zSaYbibD/6bgBBiO4AQYjuAEGI7gBBiO4AQYjuAEG43LAFeYSL+bFisrl0nEDDEbHvQJ0PCyC37P9Q8cNMBjBDTAYwQ0wGDPuJXIPZFbBo/6O+p1+fHvuuKvqYlVdqapzsywIgIfbU3BX1fNJDnT3qSTHq+rEbMsCYCfV3Y++U9WfJ/nH7v5SVb2Q5FB3f27L9rNJzk6e/kiSr82i2AV7Ism3ll3EEqzjca/jMSfredwjHfP7untjuw17nXG/O8mNyePbST6wdWN3X0hyYY9fe1+oqqvdvbnsOhZtHY97HY85Wc/jXpVj3uuM++0khyaPDz/G1wHgEe01cK8lOT15fDLJ9ZlUA8Cu9joq+bskr1fVk0meS/L07EraN4Ye9TyGdTzudTzmZD2PeyWOeU8nJ5Okqo4keTbJv3T3zZlWBcCO9hzcACyHk4oAgxHcD1FVR6vqK8uuY1Gq6j1V9eWqulxVX6iqg8uuad7WbQXwOr7HW63KZ1pwP9ync++yx3XwkSSvdPeHk9xM8nNLrmeu1nQF8Fq9x9tYic+0m0ztoKqeSfKd3P3lXgvdfX7L040k/7WsWhbkTJJLk8eXc/cS168vrZoFWMP3+P+t0mdacCepqs/m7tL8d/xzkg8m+aXcvfRxJW133N39qao6leRId7+xpNIW5aErgFfZGr3HSZLJSOgTWZHPtOBO0t2/tfV5Vf1BkvPd/e2qWlJV8/fgcSdJVb03yWeS/PLiK1q4tVwBvGbv8Tteygp9ptfiF3UPPpTkxap6Lcn7q+ovl1zPQky6ks8n+Xh3v7nsehZg7VYAr+F7/I6V+ky7jnsXVfVad59Zdh2LUFW/k+SPknx18tKr3f23Syxprqrq+5O8nuSfMlkB3N13llvVfK3be7ydVfhMC27WmhXAjEhwAwzGjBtgMIIbYDCCG2AwghtgMIIbYDD/B5lKIWigy8+GAAAAAElFTkSuQmCC\n",
832 |       "text/plain": [
833 |        "<Figure size 432x288 with 1 Axes>"
834 |       ]
835 |      },
836 |      "metadata": {
837 |       "needs_background": "light"
838 |      },
839 |      "output_type": "display_data"
840 |     }
841 |    ],
842 |    "source": [
843 |     "bins = np.arange(-5,5,0.1)\n",
844 |     "plt.hist(sample,bins,color='blue',alpha=0.5)"
845 |    ]
846 |   },
847 |   {
848 |    "cell_type": "markdown",
849 |    "metadata": {},
850 |    "source": [
851 |     "## 实验3-13 随机抽样"
852 |    ]
853 |   },
854 |   {
855 |    "cell_type": "code",
856 |    "execution_count": 59,
857 |    "metadata": {},
858 |    "outputs": [
859 |     {
860 |      "data": {
861 |       "text/plain": [
862 |        "array([ 1,  3,  5,  7,  9, 11, 13, 15, 17, 19])"
863 |       ]
864 |      },
865 |      "execution_count": 59,
866 |      "metadata": {},
867 |      "output_type": "execute_result"
868 |     }
869 |    ],
870 |    "source": [
871 |     "# 这个我照书上的简化了一下\n",
872 |     "import numpy as np\n",
873 |     "all = np.arange(1,20,2)\n",
874 |     "all"
875 |    ]
876 |   },
877 |   {
878 |    "cell_type": "code",
879 |    "execution_count": 60,
880 |    "metadata": {},
881 |    "outputs": [
882 |     {
883 |      "data": {
884 |       "text/plain": [
885 |        "array([17, 11,  7])"
886 |       ]
887 |      },
888 |      "execution_count": 60,
889 |      "metadata": {},
890 |      "output_type": "execute_result"
891 |     }
892 |    ],
893 |    "source": [
894 |     "# 从all中随机抽3个数\n",
895 |     "np.random.choice(all,size=3)"
896 |    ]
897 |   }
898 |  ],
899 |  "metadata": {
900 |   "kernelspec": {
901 |    "display_name": "Python [conda env:root] *",
902 |    "language": "python",
903 |    "name": "conda-root-py"
904 |   },
905 |   "language_info": {
906 |    "codemirror_mode": {
907 |     "name": "ipython",
908 |     "version": 3
909 |    },
910 |    "file_extension": ".py",
911 |    "mimetype": "text/x-python",
912 |    "name": "python",
913 |    "nbconvert_exporter": "python",
914 |    "pygments_lexer": "ipython3",
915 |    "version": "3.7.5"
916 |   }
917 |  },
918 |  "nbformat": 4,
919 |  "nbformat_minor": 2
920 | }
921 | 


--------------------------------------------------------------------------------
/第二章 描述性统计分析/2-1.xlsx:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/AirFin/Statistics_Python_Codes/684c651552e0012d085e72301c4fd210748e4a93/第二章 描述性统计分析/2-1.xlsx


--------------------------------------------------------------------------------
/第二章 描述性统计分析/2-10.xlsx:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/AirFin/Statistics_Python_Codes/684c651552e0012d085e72301c4fd210748e4a93/第二章 描述性统计分析/2-10.xlsx


--------------------------------------------------------------------------------
/第二章 描述性统计分析/2-2.xlsx:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/AirFin/Statistics_Python_Codes/684c651552e0012d085e72301c4fd210748e4a93/第二章 描述性统计分析/2-2.xlsx


--------------------------------------------------------------------------------
/第二章 描述性统计分析/2-7.xlsx:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/AirFin/Statistics_Python_Codes/684c651552e0012d085e72301c4fd210748e4a93/第二章 描述性统计分析/2-7.xlsx


--------------------------------------------------------------------------------
/第二章 描述性统计分析/2-8.xlsx:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/AirFin/Statistics_Python_Codes/684c651552e0012d085e72301c4fd210748e4a93/第二章 描述性统计分析/2-8.xlsx


--------------------------------------------------------------------------------
/第二章 描述性统计分析/第二章 描述性统计分析.ipynb:
--------------------------------------------------------------------------------
   1 | {
   2 |  "cells": [
   3 |   {
   4 |    "cell_type": "markdown",
   5 |    "metadata": {},
   6 |    "source": [
   7 |     "# 第一节 分布数列"
   8 |    ]
   9 |   },
  10 |   {
  11 |    "cell_type": "markdown",
  12 |    "metadata": {},
  13 |    "source": [
  14 |     "## 实验2-1 连续变量分布数列的编制"
  15 |    ]
  16 |   },
  17 |   {
  18 |    "cell_type": "markdown",
  19 |    "metadata": {},
  20 |    "source": [
  21 |     "50个电池寿命如下，请对其寿命编制分布数列，并进行向上和向下累计"
  22 |    ]
  23 |   },
  24 |   {
  25 |    "cell_type": "code",
  26 |    "execution_count": 4,
  27 |    "metadata": {},
  28 |    "outputs": [],
  29 |    "source": [
  30 |     "import numpy as np\n",
  31 |     "import pandas as pd "
  32 |    ]
  33 |   },
  34 |   {
  35 |    "cell_type": "code",
  36 |    "execution_count": 10,
  37 |    "metadata": {},
  38 |    "outputs": [
  39 |     {
  40 |      "data": {
  41 |       "text/html": [
  42 |        "<div>\n",
  43 |        "<style scoped>\n",
  44 |        "    .dataframe tbody tr th:only-of-type {\n",
  45 |        "        vertical-align: middle;\n",
  46 |        "    }\n",
  47 |        "\n",
  48 |        "    .dataframe tbody tr th {\n",
  49 |        "        vertical-align: top;\n",
  50 |        "    }\n",
  51 |        "\n",
  52 |        "    .dataframe thead th {\n",
  53 |        "        text-align: right;\n",
  54 |        "    }\n",
  55 |        "</style>\n",
  56 |        "<table border=\"1\" class=\"dataframe\">\n",
  57 |        "  <thead>\n",
  58 |        "    <tr style=\"text-align: right;\">\n",
  59 |        "      <th></th>\n",
  60 |        "      <th>Hours</th>\n",
  61 |        "    </tr>\n",
  62 |        "  </thead>\n",
  63 |        "  <tbody>\n",
  64 |        "    <tr>\n",
  65 |        "      <th>0</th>\n",
  66 |        "      <td>996</td>\n",
  67 |        "    </tr>\n",
  68 |        "    <tr>\n",
  69 |        "      <th>1</th>\n",
  70 |        "      <td>942</td>\n",
  71 |        "    </tr>\n",
  72 |        "    <tr>\n",
  73 |        "      <th>2</th>\n",
  74 |        "      <td>957</td>\n",
  75 |        "    </tr>\n",
  76 |        "    <tr>\n",
  77 |        "      <th>3</th>\n",
  78 |        "      <td>1400</td>\n",
  79 |        "    </tr>\n",
  80 |        "    <tr>\n",
  81 |        "      <th>4</th>\n",
  82 |        "      <td>1623</td>\n",
  83 |        "    </tr>\n",
  84 |        "  </tbody>\n",
  85 |        "</table>\n",
  86 |        "</div>"
  87 |       ],
  88 |       "text/plain": [
  89 |        "   Hours\n",
  90 |        "0    996\n",
  91 |        "1    942\n",
  92 |        "2    957\n",
  93 |        "3   1400\n",
  94 |        "4   1623"
  95 |       ]
  96 |      },
  97 |      "execution_count": 10,
  98 |      "metadata": {},
  99 |      "output_type": "execute_result"
 100 |     }
 101 |    ],
 102 |    "source": [
 103 |     "life_df = pd.read_excel('2-1.xlsx')\n",
 104 |     "life_df.head()"
 105 |    ]
 106 |   },
 107 |   {
 108 |    "cell_type": "code",
 109 |    "execution_count": 11,
 110 |    "metadata": {},
 111 |    "outputs": [
 112 |     {
 113 |      "data": {
 114 |       "text/html": [
 115 |        "<div>\n",
 116 |        "<style scoped>\n",
 117 |        "    .dataframe tbody tr th:only-of-type {\n",
 118 |        "        vertical-align: middle;\n",
 119 |        "    }\n",
 120 |        "\n",
 121 |        "    .dataframe tbody tr th {\n",
 122 |        "        vertical-align: top;\n",
 123 |        "    }\n",
 124 |        "\n",
 125 |        "    .dataframe thead th {\n",
 126 |        "        text-align: right;\n",
 127 |        "    }\n",
 128 |        "</style>\n",
 129 |        "<table border=\"1\" class=\"dataframe\">\n",
 130 |        "  <thead>\n",
 131 |        "    <tr style=\"text-align: right;\">\n",
 132 |        "      <th></th>\n",
 133 |        "      <th>Hours</th>\n",
 134 |        "    </tr>\n",
 135 |        "  </thead>\n",
 136 |        "  <tbody>\n",
 137 |        "    <tr>\n",
 138 |        "      <th>count</th>\n",
 139 |        "      <td>50.000000</td>\n",
 140 |        "    </tr>\n",
 141 |        "    <tr>\n",
 142 |        "      <th>mean</th>\n",
 143 |        "      <td>1257.700000</td>\n",
 144 |        "    </tr>\n",
 145 |        "    <tr>\n",
 146 |        "      <th>std</th>\n",
 147 |        "      <td>277.948553</td>\n",
 148 |        "    </tr>\n",
 149 |        "    <tr>\n",
 150 |        "      <th>min</th>\n",
 151 |        "      <td>804.000000</td>\n",
 152 |        "    </tr>\n",
 153 |        "    <tr>\n",
 154 |        "      <th>25%</th>\n",
 155 |        "      <td>1002.500000</td>\n",
 156 |        "    </tr>\n",
 157 |        "    <tr>\n",
 158 |        "      <th>50%</th>\n",
 159 |        "      <td>1286.000000</td>\n",
 160 |        "    </tr>\n",
 161 |        "    <tr>\n",
 162 |        "      <th>75%</th>\n",
 163 |        "      <td>1540.250000</td>\n",
 164 |        "    </tr>\n",
 165 |        "    <tr>\n",
 166 |        "      <th>max</th>\n",
 167 |        "      <td>1689.000000</td>\n",
 168 |        "    </tr>\n",
 169 |        "  </tbody>\n",
 170 |        "</table>\n",
 171 |        "</div>"
 172 |       ],
 173 |       "text/plain": [
 174 |        "             Hours\n",
 175 |        "count    50.000000\n",
 176 |        "mean   1257.700000\n",
 177 |        "std     277.948553\n",
 178 |        "min     804.000000\n",
 179 |        "25%    1002.500000\n",
 180 |        "50%    1286.000000\n",
 181 |        "75%    1540.250000\n",
 182 |        "max    1689.000000"
 183 |       ]
 184 |      },
 185 |      "execution_count": 11,
 186 |      "metadata": {},
 187 |      "output_type": "execute_result"
 188 |     }
 189 |    ],
 190 |    "source": [
 191 |     "life_df.describe()"
 192 |    ]
 193 |   },
 194 |   {
 195 |    "cell_type": "code",
 196 |    "execution_count": 13,
 197 |    "metadata": {},
 198 |    "outputs": [
 199 |     {
 200 |      "data": {
 201 |       "text/html": [
 202 |        "<div>\n",
 203 |        "<style scoped>\n",
 204 |        "    .dataframe tbody tr th:only-of-type {\n",
 205 |        "        vertical-align: middle;\n",
 206 |        "    }\n",
 207 |        "\n",
 208 |        "    .dataframe tbody tr th {\n",
 209 |        "        vertical-align: top;\n",
 210 |        "    }\n",
 211 |        "\n",
 212 |        "    .dataframe thead th {\n",
 213 |        "        text-align: right;\n",
 214 |        "    }\n",
 215 |        "</style>\n",
 216 |        "<table border=\"1\" class=\"dataframe\">\n",
 217 |        "  <thead>\n",
 218 |        "    <tr style=\"text-align: right;\">\n",
 219 |        "      <th></th>\n",
 220 |        "      <th>value_counts</th>\n",
 221 |        "    </tr>\n",
 222 |        "  </thead>\n",
 223 |        "  <tbody>\n",
 224 |        "    <tr>\n",
 225 |        "      <th>[800, 900)</th>\n",
 226 |        "      <td>6</td>\n",
 227 |        "    </tr>\n",
 228 |        "    <tr>\n",
 229 |        "      <th>[900, 1000)</th>\n",
 230 |        "      <td>7</td>\n",
 231 |        "    </tr>\n",
 232 |        "    <tr>\n",
 233 |        "      <th>[1000, 1100)</th>\n",
 234 |        "      <td>5</td>\n",
 235 |        "    </tr>\n",
 236 |        "    <tr>\n",
 237 |        "      <th>[1100, 1200)</th>\n",
 238 |        "      <td>4</td>\n",
 239 |        "    </tr>\n",
 240 |        "    <tr>\n",
 241 |        "      <th>[1200, 1300)</th>\n",
 242 |        "      <td>4</td>\n",
 243 |        "    </tr>\n",
 244 |        "    <tr>\n",
 245 |        "      <th>[1300, 1400)</th>\n",
 246 |        "      <td>5</td>\n",
 247 |        "    </tr>\n",
 248 |        "    <tr>\n",
 249 |        "      <th>[1400, 1500)</th>\n",
 250 |        "      <td>5</td>\n",
 251 |        "    </tr>\n",
 252 |        "    <tr>\n",
 253 |        "      <th>[1500, 1600)</th>\n",
 254 |        "      <td>8</td>\n",
 255 |        "    </tr>\n",
 256 |        "    <tr>\n",
 257 |        "      <th>[1600, 1700)</th>\n",
 258 |        "      <td>6</td>\n",
 259 |        "    </tr>\n",
 260 |        "  </tbody>\n",
 261 |        "</table>\n",
 262 |        "</div>"
 263 |       ],
 264 |       "text/plain": [
 265 |        "              value_counts\n",
 266 |        "[800, 900)               6\n",
 267 |        "[900, 1000)              7\n",
 268 |        "[1000, 1100)             5\n",
 269 |        "[1100, 1200)             4\n",
 270 |        "[1200, 1300)             4\n",
 271 |        "[1300, 1400)             5\n",
 272 |        "[1400, 1500)             5\n",
 273 |        "[1500, 1600)             8\n",
 274 |        "[1600, 1700)             6"
 275 |       ]
 276 |      },
 277 |      "execution_count": 13,
 278 |      "metadata": {},
 279 |      "output_type": "execute_result"
 280 |     }
 281 |    ],
 282 |    "source": [
 283 |     "# 利用pandas的cut方法进行分组\n",
 284 |     "\n",
 285 |     "# 这个bins区间，是根据这组数的范围选择的，看情况。\n",
 286 |     "# right=False 表明上限不在内\n",
 287 |     "bins = range(800,1701,100) \n",
 288 |     "life_bin_df = pd.cut(life_df['Hours'],bins,right=False)\n",
 289 |     "life_bin_df = life_bin_df.value_counts().to_frame(name='value_counts').sort_index()\n",
 290 |     "life_bin_df"
 291 |    ]
 292 |   },
 293 |   {
 294 |    "cell_type": "code",
 295 |    "execution_count": 14,
 296 |    "metadata": {},
 297 |    "outputs": [
 298 |     {
 299 |      "data": {
 300 |       "text/html": [
 301 |        "<div>\n",
 302 |        "<style scoped>\n",
 303 |        "    .dataframe tbody tr th:only-of-type {\n",
 304 |        "        vertical-align: middle;\n",
 305 |        "    }\n",
 306 |        "\n",
 307 |        "    .dataframe tbody tr th {\n",
 308 |        "        vertical-align: top;\n",
 309 |        "    }\n",
 310 |        "\n",
 311 |        "    .dataframe thead th {\n",
 312 |        "        text-align: right;\n",
 313 |        "    }\n",
 314 |        "</style>\n",
 315 |        "<table border=\"1\" class=\"dataframe\">\n",
 316 |        "  <thead>\n",
 317 |        "    <tr style=\"text-align: right;\">\n",
 318 |        "      <th></th>\n",
 319 |        "      <th>value_counts</th>\n",
 320 |        "      <th>percentage</th>\n",
 321 |        "      <th>cumsum_up</th>\n",
 322 |        "      <th>cumsum_down</th>\n",
 323 |        "    </tr>\n",
 324 |        "  </thead>\n",
 325 |        "  <tbody>\n",
 326 |        "    <tr>\n",
 327 |        "      <th>[800, 900)</th>\n",
 328 |        "      <td>6</td>\n",
 329 |        "      <td>0.12</td>\n",
 330 |        "      <td>6</td>\n",
 331 |        "      <td>50</td>\n",
 332 |        "    </tr>\n",
 333 |        "    <tr>\n",
 334 |        "      <th>[900, 1000)</th>\n",
 335 |        "      <td>7</td>\n",
 336 |        "      <td>0.14</td>\n",
 337 |        "      <td>13</td>\n",
 338 |        "      <td>44</td>\n",
 339 |        "    </tr>\n",
 340 |        "    <tr>\n",
 341 |        "      <th>[1000, 1100)</th>\n",
 342 |        "      <td>5</td>\n",
 343 |        "      <td>0.10</td>\n",
 344 |        "      <td>18</td>\n",
 345 |        "      <td>37</td>\n",
 346 |        "    </tr>\n",
 347 |        "    <tr>\n",
 348 |        "      <th>[1100, 1200)</th>\n",
 349 |        "      <td>4</td>\n",
 350 |        "      <td>0.08</td>\n",
 351 |        "      <td>22</td>\n",
 352 |        "      <td>32</td>\n",
 353 |        "    </tr>\n",
 354 |        "    <tr>\n",
 355 |        "      <th>[1200, 1300)</th>\n",
 356 |        "      <td>4</td>\n",
 357 |        "      <td>0.08</td>\n",
 358 |        "      <td>26</td>\n",
 359 |        "      <td>28</td>\n",
 360 |        "    </tr>\n",
 361 |        "    <tr>\n",
 362 |        "      <th>[1300, 1400)</th>\n",
 363 |        "      <td>5</td>\n",
 364 |        "      <td>0.10</td>\n",
 365 |        "      <td>31</td>\n",
 366 |        "      <td>24</td>\n",
 367 |        "    </tr>\n",
 368 |        "    <tr>\n",
 369 |        "      <th>[1400, 1500)</th>\n",
 370 |        "      <td>5</td>\n",
 371 |        "      <td>0.10</td>\n",
 372 |        "      <td>36</td>\n",
 373 |        "      <td>19</td>\n",
 374 |        "    </tr>\n",
 375 |        "    <tr>\n",
 376 |        "      <th>[1500, 1600)</th>\n",
 377 |        "      <td>8</td>\n",
 378 |        "      <td>0.16</td>\n",
 379 |        "      <td>44</td>\n",
 380 |        "      <td>14</td>\n",
 381 |        "    </tr>\n",
 382 |        "    <tr>\n",
 383 |        "      <th>[1600, 1700)</th>\n",
 384 |        "      <td>6</td>\n",
 385 |        "      <td>0.12</td>\n",
 386 |        "      <td>50</td>\n",
 387 |        "      <td>6</td>\n",
 388 |        "    </tr>\n",
 389 |        "  </tbody>\n",
 390 |        "</table>\n",
 391 |        "</div>"
 392 |       ],
 393 |       "text/plain": [
 394 |        "              value_counts  percentage  cumsum_up  cumsum_down\n",
 395 |        "[800, 900)               6        0.12          6           50\n",
 396 |        "[900, 1000)              7        0.14         13           44\n",
 397 |        "[1000, 1100)             5        0.10         18           37\n",
 398 |        "[1100, 1200)             4        0.08         22           32\n",
 399 |        "[1200, 1300)             4        0.08         26           28\n",
 400 |        "[1300, 1400)             5        0.10         31           24\n",
 401 |        "[1400, 1500)             5        0.10         36           19\n",
 402 |        "[1500, 1600)             8        0.16         44           14\n",
 403 |        "[1600, 1700)             6        0.12         50            6"
 404 |       ]
 405 |      },
 406 |      "execution_count": 14,
 407 |      "metadata": {},
 408 |      "output_type": "execute_result"
 409 |     }
 410 |    ],
 411 |    "source": [
 412 |     "# 计算频率、向上累计及向下累计，看结果就很容易理解了。\n",
 413 |     "\n",
 414 |     "life_bin_df.loc[:,'percentage'] = life_bin_df.loc[:,'value_counts']/life_bin_df.loc[:,'value_counts'].sum()\n",
 415 |     "life_bin_df.loc[:,'cumsum_up'] = life_bin_df.loc[::,'value_counts'].cumsum()\n",
 416 |     "life_bin_df.loc[:,'cumsum_down'] = life_bin_df.loc[::-1,'value_counts'].cumsum()\n",
 417 |     "life_bin_df"
 418 |    ]
 419 |   },
 420 |   {
 421 |    "cell_type": "markdown",
 422 |    "metadata": {},
 423 |    "source": [
 424 |     "## 实验2-2 离散变量分布数列的编制"
 425 |    ]
 426 |   },
 427 |   {
 428 |    "cell_type": "markdown",
 429 |    "metadata": {},
 430 |    "source": [
 431 |     "这个没啥，看着就能明白"
 432 |    ]
 433 |   },
 434 |   {
 435 |    "cell_type": "code",
 436 |    "execution_count": 15,
 437 |    "metadata": {},
 438 |    "outputs": [
 439 |     {
 440 |      "data": {
 441 |       "text/html": [
 442 |        "<div>\n",
 443 |        "<style scoped>\n",
 444 |        "    .dataframe tbody tr th:only-of-type {\n",
 445 |        "        vertical-align: middle;\n",
 446 |        "    }\n",
 447 |        "\n",
 448 |        "    .dataframe tbody tr th {\n",
 449 |        "        vertical-align: top;\n",
 450 |        "    }\n",
 451 |        "\n",
 452 |        "    .dataframe thead th {\n",
 453 |        "        text-align: right;\n",
 454 |        "    }\n",
 455 |        "</style>\n",
 456 |        "<table border=\"1\" class=\"dataframe\">\n",
 457 |        "  <thead>\n",
 458 |        "    <tr style=\"text-align: right;\">\n",
 459 |        "      <th></th>\n",
 460 |        "      <th>Eval</th>\n",
 461 |        "    </tr>\n",
 462 |        "  </thead>\n",
 463 |        "  <tbody>\n",
 464 |        "    <tr>\n",
 465 |        "      <th>0</th>\n",
 466 |        "      <td>O</td>\n",
 467 |        "    </tr>\n",
 468 |        "    <tr>\n",
 469 |        "      <th>1</th>\n",
 470 |        "      <td>O</td>\n",
 471 |        "    </tr>\n",
 472 |        "    <tr>\n",
 473 |        "      <th>2</th>\n",
 474 |        "      <td>O</td>\n",
 475 |        "    </tr>\n",
 476 |        "    <tr>\n",
 477 |        "      <th>3</th>\n",
 478 |        "      <td>V</td>\n",
 479 |        "    </tr>\n",
 480 |        "    <tr>\n",
 481 |        "      <th>4</th>\n",
 482 |        "      <td>V</td>\n",
 483 |        "    </tr>\n",
 484 |        "    <tr>\n",
 485 |        "      <th>5</th>\n",
 486 |        "      <td>V</td>\n",
 487 |        "    </tr>\n",
 488 |        "    <tr>\n",
 489 |        "      <th>6</th>\n",
 490 |        "      <td>O</td>\n",
 491 |        "    </tr>\n",
 492 |        "    <tr>\n",
 493 |        "      <th>7</th>\n",
 494 |        "      <td>O</td>\n",
 495 |        "    </tr>\n",
 496 |        "    <tr>\n",
 497 |        "      <th>8</th>\n",
 498 |        "      <td>O</td>\n",
 499 |        "    </tr>\n",
 500 |        "    <tr>\n",
 501 |        "      <th>9</th>\n",
 502 |        "      <td>A</td>\n",
 503 |        "    </tr>\n",
 504 |        "    <tr>\n",
 505 |        "      <th>10</th>\n",
 506 |        "      <td>A</td>\n",
 507 |        "    </tr>\n",
 508 |        "    <tr>\n",
 509 |        "      <th>11</th>\n",
 510 |        "      <td>A</td>\n",
 511 |        "    </tr>\n",
 512 |        "    <tr>\n",
 513 |        "      <th>12</th>\n",
 514 |        "      <td>A</td>\n",
 515 |        "    </tr>\n",
 516 |        "    <tr>\n",
 517 |        "      <th>13</th>\n",
 518 |        "      <td>G</td>\n",
 519 |        "    </tr>\n",
 520 |        "    <tr>\n",
 521 |        "      <th>14</th>\n",
 522 |        "      <td>G</td>\n",
 523 |        "    </tr>\n",
 524 |        "    <tr>\n",
 525 |        "      <th>15</th>\n",
 526 |        "      <td>V</td>\n",
 527 |        "    </tr>\n",
 528 |        "    <tr>\n",
 529 |        "      <th>16</th>\n",
 530 |        "      <td>V</td>\n",
 531 |        "    </tr>\n",
 532 |        "    <tr>\n",
 533 |        "      <th>17</th>\n",
 534 |        "      <td>A</td>\n",
 535 |        "    </tr>\n",
 536 |        "    <tr>\n",
 537 |        "      <th>18</th>\n",
 538 |        "      <td>A</td>\n",
 539 |        "    </tr>\n",
 540 |        "    <tr>\n",
 541 |        "      <th>19</th>\n",
 542 |        "      <td>A</td>\n",
 543 |        "    </tr>\n",
 544 |        "  </tbody>\n",
 545 |        "</table>\n",
 546 |        "</div>"
 547 |       ],
 548 |       "text/plain": [
 549 |        "   Eval\n",
 550 |        "0     O\n",
 551 |        "1     O\n",
 552 |        "2     O\n",
 553 |        "3     V\n",
 554 |        "4     V\n",
 555 |        "5     V\n",
 556 |        "6     O\n",
 557 |        "7     O\n",
 558 |        "8     O\n",
 559 |        "9     A\n",
 560 |        "10    A\n",
 561 |        "11    A\n",
 562 |        "12    A\n",
 563 |        "13    G\n",
 564 |        "14    G\n",
 565 |        "15    V\n",
 566 |        "16    V\n",
 567 |        "17    A\n",
 568 |        "18    A\n",
 569 |        "19    A"
 570 |       ]
 571 |      },
 572 |      "execution_count": 15,
 573 |      "metadata": {},
 574 |      "output_type": "execute_result"
 575 |     }
 576 |    ],
 577 |    "source": [
 578 |     "eval_df = pd.read_excel('2-2.xlsx')\n",
 579 |     "eval_df"
 580 |    ]
 581 |   },
 582 |   {
 583 |    "cell_type": "code",
 584 |    "execution_count": 17,
 585 |    "metadata": {},
 586 |    "outputs": [
 587 |     {
 588 |      "data": {
 589 |       "text/plain": [
 590 |        "A    7\n",
 591 |        "O    6\n",
 592 |        "V    5\n",
 593 |        "G    2\n",
 594 |        "Name: Eval, dtype: int64"
 595 |       ]
 596 |      },
 597 |      "execution_count": 17,
 598 |      "metadata": {},
 599 |      "output_type": "execute_result"
 600 |     }
 601 |    ],
 602 |    "source": [
 603 |     "eval_df['Eval'].value_counts()"
 604 |    ]
 605 |   },
 606 |   {
 607 |    "cell_type": "markdown",
 608 |    "metadata": {},
 609 |    "source": [
 610 |     "总结：其实就是 value_counts()这个函数的运用"
 611 |    ]
 612 |   },
 613 |   {
 614 |    "cell_type": "markdown",
 615 |    "metadata": {},
 616 |    "source": [
 617 |     "# 第二节 统计图"
 618 |    ]
 619 |   },
 620 |   {
 621 |    "cell_type": "markdown",
 622 |    "metadata": {},
 623 |    "source": [
 624 |     "这个教程很多，这里写的也很简单，就省略不写了。唯一要注意的是matplotlib中文显示问题。这里给出一种方法。"
 625 |    ]
 626 |   },
 627 |   {
 628 |    "cell_type": "code",
 629 |    "execution_count": 19,
 630 |    "metadata": {},
 631 |    "outputs": [],
 632 |    "source": [
 633 |     "%matplotlib inline\n",
 634 |     "import matplotlib.pyplot as plt\n",
 635 |     "plt.rcParams['font.sans-serif'] = ['SimHei'] # 步骤一（替换sans-serif字体）\n",
 636 |     "plt.rcParams['axes.unicode_minus'] = False   # 步骤二（解决坐标轴负数的负号显示问题）\n",
 637 |     "plt.rcParams['savefig.dpi'] = 100 # 图片质量"
 638 |    ]
 639 |   },
 640 |   {
 641 |    "cell_type": "markdown",
 642 |    "metadata": {},
 643 |    "source": [
 644 |     "# 第三节 描述统计量"
 645 |    ]
 646 |   },
 647 |   {
 648 |    "cell_type": "markdown",
 649 |    "metadata": {},
 650 |    "source": [
 651 |     "描述统计量是什么，就不过多赘述了，哪一个指标忘记了，上网搜索即可。这部分内容比较简单，通常一个函数即可。"
 652 |    ]
 653 |   },
 654 |   {
 655 |    "cell_type": "markdown",
 656 |    "metadata": {},
 657 |    "source": [
 658 |     "## 实验2-7 计算描述统计量"
 659 |    ]
 660 |   },
 661 |   {
 662 |    "cell_type": "code",
 663 |    "execution_count": 21,
 664 |    "metadata": {},
 665 |    "outputs": [],
 666 |    "source": [
 667 |     "import numpy as np\n",
 668 |     "import pandas as pd "
 669 |    ]
 670 |   },
 671 |   {
 672 |    "cell_type": "code",
 673 |    "execution_count": 22,
 674 |    "metadata": {},
 675 |    "outputs": [
 676 |     {
 677 |      "data": {
 678 |       "text/html": [
 679 |        "<div>\n",
 680 |        "<style scoped>\n",
 681 |        "    .dataframe tbody tr th:only-of-type {\n",
 682 |        "        vertical-align: middle;\n",
 683 |        "    }\n",
 684 |        "\n",
 685 |        "    .dataframe tbody tr th {\n",
 686 |        "        vertical-align: top;\n",
 687 |        "    }\n",
 688 |        "\n",
 689 |        "    .dataframe thead th {\n",
 690 |        "        text-align: right;\n",
 691 |        "    }\n",
 692 |        "</style>\n",
 693 |        "<table border=\"1\" class=\"dataframe\">\n",
 694 |        "  <thead>\n",
 695 |        "    <tr style=\"text-align: right;\">\n",
 696 |        "      <th></th>\n",
 697 |        "      <th>Score</th>\n",
 698 |        "    </tr>\n",
 699 |        "  </thead>\n",
 700 |        "  <tbody>\n",
 701 |        "    <tr>\n",
 702 |        "      <th>0</th>\n",
 703 |        "      <td>95</td>\n",
 704 |        "    </tr>\n",
 705 |        "    <tr>\n",
 706 |        "      <th>1</th>\n",
 707 |        "      <td>63</td>\n",
 708 |        "    </tr>\n",
 709 |        "    <tr>\n",
 710 |        "      <th>2</th>\n",
 711 |        "      <td>78</td>\n",
 712 |        "    </tr>\n",
 713 |        "    <tr>\n",
 714 |        "      <th>3</th>\n",
 715 |        "      <td>94</td>\n",
 716 |        "    </tr>\n",
 717 |        "    <tr>\n",
 718 |        "      <th>4</th>\n",
 719 |        "      <td>60</td>\n",
 720 |        "    </tr>\n",
 721 |        "    <tr>\n",
 722 |        "      <th>5</th>\n",
 723 |        "      <td>96</td>\n",
 724 |        "    </tr>\n",
 725 |        "    <tr>\n",
 726 |        "      <th>6</th>\n",
 727 |        "      <td>83</td>\n",
 728 |        "    </tr>\n",
 729 |        "    <tr>\n",
 730 |        "      <th>7</th>\n",
 731 |        "      <td>68</td>\n",
 732 |        "    </tr>\n",
 733 |        "    <tr>\n",
 734 |        "      <th>8</th>\n",
 735 |        "      <td>88</td>\n",
 736 |        "    </tr>\n",
 737 |        "    <tr>\n",
 738 |        "      <th>9</th>\n",
 739 |        "      <td>90</td>\n",
 740 |        "    </tr>\n",
 741 |        "    <tr>\n",
 742 |        "      <th>10</th>\n",
 743 |        "      <td>95</td>\n",
 744 |        "    </tr>\n",
 745 |        "    <tr>\n",
 746 |        "      <th>11</th>\n",
 747 |        "      <td>93</td>\n",
 748 |        "    </tr>\n",
 749 |        "    <tr>\n",
 750 |        "      <th>12</th>\n",
 751 |        "      <td>67</td>\n",
 752 |        "    </tr>\n",
 753 |        "    <tr>\n",
 754 |        "      <th>13</th>\n",
 755 |        "      <td>83</td>\n",
 756 |        "    </tr>\n",
 757 |        "    <tr>\n",
 758 |        "      <th>14</th>\n",
 759 |        "      <td>82</td>\n",
 760 |        "    </tr>\n",
 761 |        "    <tr>\n",
 762 |        "      <th>15</th>\n",
 763 |        "      <td>72</td>\n",
 764 |        "    </tr>\n",
 765 |        "    <tr>\n",
 766 |        "      <th>16</th>\n",
 767 |        "      <td>85</td>\n",
 768 |        "    </tr>\n",
 769 |        "    <tr>\n",
 770 |        "      <th>17</th>\n",
 771 |        "      <td>81</td>\n",
 772 |        "    </tr>\n",
 773 |        "    <tr>\n",
 774 |        "      <th>18</th>\n",
 775 |        "      <td>61</td>\n",
 776 |        "    </tr>\n",
 777 |        "    <tr>\n",
 778 |        "      <th>19</th>\n",
 779 |        "      <td>87</td>\n",
 780 |        "    </tr>\n",
 781 |        "  </tbody>\n",
 782 |        "</table>\n",
 783 |        "</div>"
 784 |       ],
 785 |       "text/plain": [
 786 |        "    Score\n",
 787 |        "0      95\n",
 788 |        "1      63\n",
 789 |        "2      78\n",
 790 |        "3      94\n",
 791 |        "4      60\n",
 792 |        "5      96\n",
 793 |        "6      83\n",
 794 |        "7      68\n",
 795 |        "8      88\n",
 796 |        "9      90\n",
 797 |        "10     95\n",
 798 |        "11     93\n",
 799 |        "12     67\n",
 800 |        "13     83\n",
 801 |        "14     82\n",
 802 |        "15     72\n",
 803 |        "16     85\n",
 804 |        "17     81\n",
 805 |        "18     61\n",
 806 |        "19     87"
 807 |       ]
 808 |      },
 809 |      "execution_count": 22,
 810 |      "metadata": {},
 811 |      "output_type": "execute_result"
 812 |     }
 813 |    ],
 814 |    "source": [
 815 |     "score_df = pd.read_excel('2-7.xlsx')\n",
 816 |     "score_df"
 817 |    ]
 818 |   },
 819 |   {
 820 |    "cell_type": "code",
 821 |    "execution_count": 24,
 822 |    "metadata": {},
 823 |    "outputs": [
 824 |     {
 825 |      "data": {
 826 |       "text/plain": [
 827 |        "81.05"
 828 |       ]
 829 |      },
 830 |      "execution_count": 24,
 831 |      "metadata": {},
 832 |      "output_type": "execute_result"
 833 |     }
 834 |    ],
 835 |    "source": [
 836 |     "# 平均数\n",
 837 |     "score_df['Score'].mean()"
 838 |    ]
 839 |   },
 840 |   {
 841 |    "cell_type": "code",
 842 |    "execution_count": 25,
 843 |    "metadata": {},
 844 |    "outputs": [
 845 |     {
 846 |      "data": {
 847 |       "text/plain": [
 848 |        "83.0"
 849 |       ]
 850 |      },
 851 |      "execution_count": 25,
 852 |      "metadata": {},
 853 |      "output_type": "execute_result"
 854 |     }
 855 |    ],
 856 |    "source": [
 857 |     "# 中位数\n",
 858 |     "score_df['Score'].median()"
 859 |    ]
 860 |   },
 861 |   {
 862 |    "cell_type": "code",
 863 |    "execution_count": 26,
 864 |    "metadata": {},
 865 |    "outputs": [
 866 |     {
 867 |      "data": {
 868 |       "text/plain": [
 869 |        "0    83\n",
 870 |        "1    95\n",
 871 |        "dtype: int64"
 872 |       ]
 873 |      },
 874 |      "execution_count": 26,
 875 |      "metadata": {},
 876 |      "output_type": "execute_result"
 877 |     }
 878 |    ],
 879 |    "source": [
 880 |     "# 众数\n",
 881 |     "score_df['Score'].mode()"
 882 |    ]
 883 |   },
 884 |   {
 885 |    "cell_type": "code",
 886 |    "execution_count": 38,
 887 |    "metadata": {},
 888 |    "outputs": [
 889 |     {
 890 |      "data": {
 891 |       "text/plain": [
 892 |        "12.010850357730277"
 893 |       ]
 894 |      },
 895 |      "execution_count": 38,
 896 |      "metadata": {},
 897 |      "output_type": "execute_result"
 898 |     }
 899 |    ],
 900 |    "source": [
 901 |     "# 标准差\n",
 902 |     "source_std = score_df['Score'].std()\n",
 903 |     "source_std "
 904 |    ]
 905 |   },
 906 |   {
 907 |    "cell_type": "code",
 908 |    "execution_count": 28,
 909 |    "metadata": {},
 910 |    "outputs": [
 911 |     {
 912 |      "data": {
 913 |       "text/plain": [
 914 |        "144.26052631578952"
 915 |       ]
 916 |      },
 917 |      "execution_count": 28,
 918 |      "metadata": {},
 919 |      "output_type": "execute_result"
 920 |     }
 921 |    ],
 922 |    "source": [
 923 |     "# 方差\n",
 924 |     "score_df['Score'].var()"
 925 |    ]
 926 |   },
 927 |   {
 928 |    "cell_type": "code",
 929 |    "execution_count": 29,
 930 |    "metadata": {},
 931 |    "outputs": [
 932 |     {
 933 |      "data": {
 934 |       "text/plain": [
 935 |        "-1.0283438185619334"
 936 |       ]
 937 |      },
 938 |      "execution_count": 29,
 939 |      "metadata": {},
 940 |      "output_type": "execute_result"
 941 |     }
 942 |    ],
 943 |    "source": [
 944 |     "# 峰度\n",
 945 |     "score_df['Score'].kurt()"
 946 |    ]
 947 |   },
 948 |   {
 949 |    "cell_type": "code",
 950 |    "execution_count": 30,
 951 |    "metadata": {},
 952 |    "outputs": [
 953 |     {
 954 |      "data": {
 955 |       "text/plain": [
 956 |        "-0.5077502334495104"
 957 |       ]
 958 |      },
 959 |      "execution_count": 30,
 960 |      "metadata": {},
 961 |      "output_type": "execute_result"
 962 |     }
 963 |    ],
 964 |    "source": [
 965 |     "# 偏度\n",
 966 |     "score_df['Score'].skew()"
 967 |    ]
 968 |   },
 969 |   {
 970 |    "cell_type": "code",
 971 |    "execution_count": 31,
 972 |    "metadata": {},
 973 |    "outputs": [
 974 |     {
 975 |      "data": {
 976 |       "text/plain": [
 977 |        "96"
 978 |       ]
 979 |      },
 980 |      "execution_count": 31,
 981 |      "metadata": {},
 982 |      "output_type": "execute_result"
 983 |     }
 984 |    ],
 985 |    "source": [
 986 |     "# 最大值\n",
 987 |     "score_df['Score'].max()"
 988 |    ]
 989 |   },
 990 |   {
 991 |    "cell_type": "code",
 992 |    "execution_count": 32,
 993 |    "metadata": {},
 994 |    "outputs": [
 995 |     {
 996 |      "data": {
 997 |       "text/plain": [
 998 |        "60"
 999 |       ]
1000 |      },
1001 |      "execution_count": 32,
1002 |      "metadata": {},
1003 |      "output_type": "execute_result"
1004 |     }
1005 |    ],
1006 |    "source": [
1007 |     "# 最小值\n",
1008 |     "score_df['Score'].min()"
1009 |    ]
1010 |   },
1011 |   {
1012 |    "cell_type": "code",
1013 |    "execution_count": 34,
1014 |    "metadata": {},
1015 |    "outputs": [
1016 |     {
1017 |      "data": {
1018 |       "text/plain": [
1019 |        "36"
1020 |       ]
1021 |      },
1022 |      "execution_count": 34,
1023 |      "metadata": {},
1024 |      "output_type": "execute_result"
1025 |     }
1026 |    ],
1027 |    "source": [
1028 |     "# 区域\n",
1029 |     "score_area = score_df['Score'].max() - score_df['Score'].min()\n",
1030 |     "score_area"
1031 |    ]
1032 |   },
1033 |   {
1034 |    "cell_type": "code",
1035 |    "execution_count": 35,
1036 |    "metadata": {},
1037 |    "outputs": [
1038 |     {
1039 |      "data": {
1040 |       "text/plain": [
1041 |        "1621"
1042 |       ]
1043 |      },
1044 |      "execution_count": 35,
1045 |      "metadata": {},
1046 |      "output_type": "execute_result"
1047 |     }
1048 |    ],
1049 |    "source": [
1050 |     "# 求和\n",
1051 |     "score_df['Score'].sum()"
1052 |    ]
1053 |   },
1054 |   {
1055 |    "cell_type": "code",
1056 |    "execution_count": 37,
1057 |    "metadata": {},
1058 |    "outputs": [
1059 |     {
1060 |      "data": {
1061 |       "text/plain": [
1062 |        "20"
1063 |       ]
1064 |      },
1065 |      "execution_count": 37,
1066 |      "metadata": {},
1067 |      "output_type": "execute_result"
1068 |     }
1069 |    ],
1070 |    "source": [
1071 |     "# 观测数\n",
1072 |     "score_count = score_df['Score'].count()\n",
1073 |     "score_count"
1074 |    ]
1075 |   },
1076 |   {
1077 |    "cell_type": "code",
1078 |    "execution_count": 41,
1079 |    "metadata": {},
1080 |    "outputs": [
1081 |     {
1082 |      "data": {
1083 |       "text/plain": [
1084 |        "2.6857077867462564"
1085 |       ]
1086 |      },
1087 |      "execution_count": 41,
1088 |      "metadata": {},
1089 |      "output_type": "execute_result"
1090 |     }
1091 |    ],
1092 |    "source": [
1093 |     "# 标准误差\n",
1094 |     "score_se = source_std  / (np.sqrt(score_count))\n",
1095 |     "score_se"
1096 |    ]
1097 |   },
1098 |   {
1099 |    "cell_type": "code",
1100 |    "execution_count": 42,
1101 |    "metadata": {},
1102 |    "outputs": [
1103 |     {
1104 |      "data": {
1105 |       "text/plain": [
1106 |        "5.386847637006618"
1107 |       ]
1108 |      },
1109 |      "execution_count": 42,
1110 |      "metadata": {},
1111 |      "output_type": "execute_result"
1112 |     }
1113 |    ],
1114 |    "source": [
1115 |     "# 置信度（95%）\n",
1116 |     "score_confidence = 2.005745995 * score_se\n",
1117 |     "score_confidence"
1118 |    ]
1119 |   },
1120 |   {
1121 |    "cell_type": "markdown",
1122 |    "metadata": {},
1123 |    "source": [
1124 |     "## 实验2-8 使用分类汇总计算描述统计量"
1125 |    ]
1126 |   },
1127 |   {
1128 |    "cell_type": "markdown",
1129 |    "metadata": {},
1130 |    "source": [
1131 |     "请按子公司分类统计员工的平均销售量"
1132 |    ]
1133 |   },
1134 |   {
1135 |    "cell_type": "code",
1136 |    "execution_count": 44,
1137 |    "metadata": {},
1138 |    "outputs": [
1139 |     {
1140 |      "data": {
1141 |       "text/html": [
1142 |        "<div>\n",
1143 |        "<style scoped>\n",
1144 |        "    .dataframe tbody tr th:only-of-type {\n",
1145 |        "        vertical-align: middle;\n",
1146 |        "    }\n",
1147 |        "\n",
1148 |        "    .dataframe tbody tr th {\n",
1149 |        "        vertical-align: top;\n",
1150 |        "    }\n",
1151 |        "\n",
1152 |        "    .dataframe thead th {\n",
1153 |        "        text-align: right;\n",
1154 |        "    }\n",
1155 |        "</style>\n",
1156 |        "<table border=\"1\" class=\"dataframe\">\n",
1157 |        "  <thead>\n",
1158 |        "    <tr style=\"text-align: right;\">\n",
1159 |        "      <th></th>\n",
1160 |        "      <th>子公司</th>\n",
1161 |        "      <th>员工</th>\n",
1162 |        "      <th>性别</th>\n",
1163 |        "      <th>销售量</th>\n",
1164 |        "    </tr>\n",
1165 |        "  </thead>\n",
1166 |        "  <tbody>\n",
1167 |        "    <tr>\n",
1168 |        "      <th>0</th>\n",
1169 |        "      <td>子公司1</td>\n",
1170 |        "      <td>A1</td>\n",
1171 |        "      <td>男</td>\n",
1172 |        "      <td>1009</td>\n",
1173 |        "    </tr>\n",
1174 |        "    <tr>\n",
1175 |        "      <th>1</th>\n",
1176 |        "      <td>子公司1</td>\n",
1177 |        "      <td>A2</td>\n",
1178 |        "      <td>男</td>\n",
1179 |        "      <td>2125</td>\n",
1180 |        "    </tr>\n",
1181 |        "    <tr>\n",
1182 |        "      <th>2</th>\n",
1183 |        "      <td>子公司2</td>\n",
1184 |        "      <td>A3</td>\n",
1185 |        "      <td>男</td>\n",
1186 |        "      <td>1157</td>\n",
1187 |        "    </tr>\n",
1188 |        "    <tr>\n",
1189 |        "      <th>3</th>\n",
1190 |        "      <td>子公司2</td>\n",
1191 |        "      <td>A4</td>\n",
1192 |        "      <td>女</td>\n",
1193 |        "      <td>2045</td>\n",
1194 |        "    </tr>\n",
1195 |        "    <tr>\n",
1196 |        "      <th>4</th>\n",
1197 |        "      <td>子公司2</td>\n",
1198 |        "      <td>A5</td>\n",
1199 |        "      <td>女</td>\n",
1200 |        "      <td>2964</td>\n",
1201 |        "    </tr>\n",
1202 |        "    <tr>\n",
1203 |        "      <th>5</th>\n",
1204 |        "      <td>子公司3</td>\n",
1205 |        "      <td>A6</td>\n",
1206 |        "      <td>男</td>\n",
1207 |        "      <td>2769</td>\n",
1208 |        "    </tr>\n",
1209 |        "    <tr>\n",
1210 |        "      <th>6</th>\n",
1211 |        "      <td>子公司3</td>\n",
1212 |        "      <td>A7</td>\n",
1213 |        "      <td>女</td>\n",
1214 |        "      <td>1665</td>\n",
1215 |        "    </tr>\n",
1216 |        "    <tr>\n",
1217 |        "      <th>7</th>\n",
1218 |        "      <td>子公司4</td>\n",
1219 |        "      <td>A8</td>\n",
1220 |        "      <td>女</td>\n",
1221 |        "      <td>2745</td>\n",
1222 |        "    </tr>\n",
1223 |        "    <tr>\n",
1224 |        "      <th>8</th>\n",
1225 |        "      <td>子公司4</td>\n",
1226 |        "      <td>A9</td>\n",
1227 |        "      <td>男</td>\n",
1228 |        "      <td>1415</td>\n",
1229 |        "    </tr>\n",
1230 |        "    <tr>\n",
1231 |        "      <th>9</th>\n",
1232 |        "      <td>子公司4</td>\n",
1233 |        "      <td>A10</td>\n",
1234 |        "      <td>男</td>\n",
1235 |        "      <td>1306</td>\n",
1236 |        "    </tr>\n",
1237 |        "  </tbody>\n",
1238 |        "</table>\n",
1239 |        "</div>"
1240 |       ],
1241 |       "text/plain": [
1242 |        "    子公司   员工 性别   销售量\n",
1243 |        "0  子公司1   A1  男  1009\n",
1244 |        "1  子公司1   A2  男  2125\n",
1245 |        "2  子公司2   A3  男  1157\n",
1246 |        "3  子公司2   A4  女  2045\n",
1247 |        "4  子公司2   A5  女  2964\n",
1248 |        "5  子公司3   A6  男  2769\n",
1249 |        "6  子公司3   A7  女  1665\n",
1250 |        "7  子公司4   A8  女  2745\n",
1251 |        "8  子公司4   A9  男  1415\n",
1252 |        "9  子公司4  A10  男  1306"
1253 |       ]
1254 |      },
1255 |      "execution_count": 44,
1256 |      "metadata": {},
1257 |      "output_type": "execute_result"
1258 |     }
1259 |    ],
1260 |    "source": [
1261 |     "sale_df = pd.read_excel('2-8.xlsx')\n",
1262 |     "sale_df"
1263 |    ]
1264 |   },
1265 |   {
1266 |    "cell_type": "code",
1267 |    "execution_count": 47,
1268 |    "metadata": {},
1269 |    "outputs": [
1270 |     {
1271 |      "data": {
1272 |       "text/plain": [
1273 |        "子公司\n",
1274 |        "子公司1    1567.000000\n",
1275 |        "子公司2    2055.333333\n",
1276 |        "子公司3    2217.000000\n",
1277 |        "子公司4    1822.000000\n",
1278 |        "Name: 销售量, dtype: float64"
1279 |       ]
1280 |      },
1281 |      "execution_count": 47,
1282 |      "metadata": {},
1283 |      "output_type": "execute_result"
1284 |     }
1285 |    ],
1286 |    "source": [
1287 |     "# 使用pandas的groupby进行分组聚类，并计算每组平均值\n",
1288 |     "sale_grounped = sale_df['销售量'].groupby(sale_df['子公司'])\n",
1289 |     "sale_grounped.mean()\n",
1290 |     "# 还可以用sum、count等方法进行不同的分类汇总"
1291 |    ]
1292 |   },
1293 |   {
1294 |    "cell_type": "markdown",
1295 |    "metadata": {},
1296 |    "source": [
1297 |     "## 实验2-9 使用数据透视表方法计算描述统计量"
1298 |    ]
1299 |   },
1300 |   {
1301 |    "cell_type": "markdown",
1302 |    "metadata": {},
1303 |    "source": [
1304 |     "根据实验2-8的数据，请按所在子公司和性别，对员工的平均销售量进行统计"
1305 |    ]
1306 |   },
1307 |   {
1308 |    "cell_type": "code",
1309 |    "execution_count": 48,
1310 |    "metadata": {},
1311 |    "outputs": [
1312 |     {
1313 |      "data": {
1314 |       "text/html": [
1315 |        "<div>\n",
1316 |        "<style scoped>\n",
1317 |        "    .dataframe tbody tr th:only-of-type {\n",
1318 |        "        vertical-align: middle;\n",
1319 |        "    }\n",
1320 |        "\n",
1321 |        "    .dataframe tbody tr th {\n",
1322 |        "        vertical-align: top;\n",
1323 |        "    }\n",
1324 |        "\n",
1325 |        "    .dataframe thead th {\n",
1326 |        "        text-align: right;\n",
1327 |        "    }\n",
1328 |        "</style>\n",
1329 |        "<table border=\"1\" class=\"dataframe\">\n",
1330 |        "  <thead>\n",
1331 |        "    <tr style=\"text-align: right;\">\n",
1332 |        "      <th></th>\n",
1333 |        "      <th></th>\n",
1334 |        "      <th>销售量</th>\n",
1335 |        "    </tr>\n",
1336 |        "    <tr>\n",
1337 |        "      <th>子公司</th>\n",
1338 |        "      <th>性别</th>\n",
1339 |        "      <th></th>\n",
1340 |        "    </tr>\n",
1341 |        "  </thead>\n",
1342 |        "  <tbody>\n",
1343 |        "    <tr>\n",
1344 |        "      <th>子公司1</th>\n",
1345 |        "      <th>男</th>\n",
1346 |        "      <td>1567.0</td>\n",
1347 |        "    </tr>\n",
1348 |        "    <tr>\n",
1349 |        "      <th rowspan=\"2\" valign=\"top\">子公司2</th>\n",
1350 |        "      <th>女</th>\n",
1351 |        "      <td>2504.5</td>\n",
1352 |        "    </tr>\n",
1353 |        "    <tr>\n",
1354 |        "      <th>男</th>\n",
1355 |        "      <td>1157.0</td>\n",
1356 |        "    </tr>\n",
1357 |        "    <tr>\n",
1358 |        "      <th rowspan=\"2\" valign=\"top\">子公司3</th>\n",
1359 |        "      <th>女</th>\n",
1360 |        "      <td>1665.0</td>\n",
1361 |        "    </tr>\n",
1362 |        "    <tr>\n",
1363 |        "      <th>男</th>\n",
1364 |        "      <td>2769.0</td>\n",
1365 |        "    </tr>\n",
1366 |        "    <tr>\n",
1367 |        "      <th rowspan=\"2\" valign=\"top\">子公司4</th>\n",
1368 |        "      <th>女</th>\n",
1369 |        "      <td>2745.0</td>\n",
1370 |        "    </tr>\n",
1371 |        "    <tr>\n",
1372 |        "      <th>男</th>\n",
1373 |        "      <td>1360.5</td>\n",
1374 |        "    </tr>\n",
1375 |        "  </tbody>\n",
1376 |        "</table>\n",
1377 |        "</div>"
1378 |       ],
1379 |       "text/plain": [
1380 |        "            销售量\n",
1381 |        "子公司  性别        \n",
1382 |        "子公司1 男   1567.0\n",
1383 |        "子公司2 女   2504.5\n",
1384 |        "     男   1157.0\n",
1385 |        "子公司3 女   1665.0\n",
1386 |        "     男   2769.0\n",
1387 |        "子公司4 女   2745.0\n",
1388 |        "     男   1360.5"
1389 |       ]
1390 |      },
1391 |      "execution_count": 48,
1392 |      "metadata": {},
1393 |      "output_type": "execute_result"
1394 |     }
1395 |    ],
1396 |    "source": [
1397 |     "# 使用pandas中的pivot_table\n",
1398 |     "pd.pivot_table(sale_df,index=['子公司','性别'],values=['销售量'],aggfunc=np.mean)"
1399 |    ]
1400 |   },
1401 |   {
1402 |    "cell_type": "code",
1403 |    "execution_count": 50,
1404 |    "metadata": {},
1405 |    "outputs": [
1406 |     {
1407 |      "data": {
1408 |       "text/html": [
1409 |        "<div>\n",
1410 |        "<style scoped>\n",
1411 |        "    .dataframe tbody tr th:only-of-type {\n",
1412 |        "        vertical-align: middle;\n",
1413 |        "    }\n",
1414 |        "\n",
1415 |        "    .dataframe tbody tr th {\n",
1416 |        "        vertical-align: top;\n",
1417 |        "    }\n",
1418 |        "\n",
1419 |        "    .dataframe thead tr th {\n",
1420 |        "        text-align: left;\n",
1421 |        "    }\n",
1422 |        "\n",
1423 |        "    .dataframe thead tr:last-of-type th {\n",
1424 |        "        text-align: right;\n",
1425 |        "    }\n",
1426 |        "</style>\n",
1427 |        "<table border=\"1\" class=\"dataframe\">\n",
1428 |        "  <thead>\n",
1429 |        "    <tr>\n",
1430 |        "      <th></th>\n",
1431 |        "      <th></th>\n",
1432 |        "      <th>sum</th>\n",
1433 |        "      <th>mean</th>\n",
1434 |        "      <th>len</th>\n",
1435 |        "    </tr>\n",
1436 |        "    <tr>\n",
1437 |        "      <th></th>\n",
1438 |        "      <th></th>\n",
1439 |        "      <th>销售量</th>\n",
1440 |        "      <th>销售量</th>\n",
1441 |        "      <th>销售量</th>\n",
1442 |        "    </tr>\n",
1443 |        "    <tr>\n",
1444 |        "      <th>子公司</th>\n",
1445 |        "      <th>性别</th>\n",
1446 |        "      <th></th>\n",
1447 |        "      <th></th>\n",
1448 |        "      <th></th>\n",
1449 |        "    </tr>\n",
1450 |        "  </thead>\n",
1451 |        "  <tbody>\n",
1452 |        "    <tr>\n",
1453 |        "      <th>子公司1</th>\n",
1454 |        "      <th>男</th>\n",
1455 |        "      <td>3134</td>\n",
1456 |        "      <td>1567.0</td>\n",
1457 |        "      <td>2</td>\n",
1458 |        "    </tr>\n",
1459 |        "    <tr>\n",
1460 |        "      <th rowspan=\"2\" valign=\"top\">子公司2</th>\n",
1461 |        "      <th>女</th>\n",
1462 |        "      <td>5009</td>\n",
1463 |        "      <td>2504.5</td>\n",
1464 |        "      <td>2</td>\n",
1465 |        "    </tr>\n",
1466 |        "    <tr>\n",
1467 |        "      <th>男</th>\n",
1468 |        "      <td>1157</td>\n",
1469 |        "      <td>1157.0</td>\n",
1470 |        "      <td>1</td>\n",
1471 |        "    </tr>\n",
1472 |        "    <tr>\n",
1473 |        "      <th rowspan=\"2\" valign=\"top\">子公司3</th>\n",
1474 |        "      <th>女</th>\n",
1475 |        "      <td>1665</td>\n",
1476 |        "      <td>1665.0</td>\n",
1477 |        "      <td>1</td>\n",
1478 |        "    </tr>\n",
1479 |        "    <tr>\n",
1480 |        "      <th>男</th>\n",
1481 |        "      <td>2769</td>\n",
1482 |        "      <td>2769.0</td>\n",
1483 |        "      <td>1</td>\n",
1484 |        "    </tr>\n",
1485 |        "    <tr>\n",
1486 |        "      <th rowspan=\"2\" valign=\"top\">子公司4</th>\n",
1487 |        "      <th>女</th>\n",
1488 |        "      <td>2745</td>\n",
1489 |        "      <td>2745.0</td>\n",
1490 |        "      <td>1</td>\n",
1491 |        "    </tr>\n",
1492 |        "    <tr>\n",
1493 |        "      <th>男</th>\n",
1494 |        "      <td>2721</td>\n",
1495 |        "      <td>1360.5</td>\n",
1496 |        "      <td>2</td>\n",
1497 |        "    </tr>\n",
1498 |        "  </tbody>\n",
1499 |        "</table>\n",
1500 |        "</div>"
1501 |       ],
1502 |       "text/plain": [
1503 |        "          sum    mean len\n",
1504 |        "          销售量     销售量 销售量\n",
1505 |        "子公司  性别                  \n",
1506 |        "子公司1 男   3134  1567.0   2\n",
1507 |        "子公司2 女   5009  2504.5   2\n",
1508 |        "     男   1157  1157.0   1\n",
1509 |        "子公司3 女   1665  1665.0   1\n",
1510 |        "     男   2769  2769.0   1\n",
1511 |        "子公司4 女   2745  2745.0   1\n",
1512 |        "     男   2721  1360.5   2"
1513 |       ]
1514 |      },
1515 |      "execution_count": 50,
1516 |      "metadata": {},
1517 |      "output_type": "execute_result"
1518 |     }
1519 |    ],
1520 |    "source": [
1521 |     "# 使用pandas中的pivot_table，aggfunc参数可接受一个列表，进行各类统计汇总\n",
1522 |     "pd.pivot_table(sale_df,index=['子公司','性别'],values=['销售量'],aggfunc=[np.sum,np.mean,len])"
1523 |    ]
1524 |   },
1525 |   {
1526 |    "cell_type": "code",
1527 |    "execution_count": 58,
1528 |    "metadata": {},
1529 |    "outputs": [
1530 |     {
1531 |      "data": {
1532 |       "text/html": [
1533 |        "<div>\n",
1534 |        "<style scoped>\n",
1535 |        "    .dataframe tbody tr th:only-of-type {\n",
1536 |        "        vertical-align: middle;\n",
1537 |        "    }\n",
1538 |        "\n",
1539 |        "    .dataframe tbody tr th {\n",
1540 |        "        vertical-align: top;\n",
1541 |        "    }\n",
1542 |        "\n",
1543 |        "    .dataframe thead tr th {\n",
1544 |        "        text-align: left;\n",
1545 |        "    }\n",
1546 |        "\n",
1547 |        "    .dataframe thead tr:last-of-type th {\n",
1548 |        "        text-align: right;\n",
1549 |        "    }\n",
1550 |        "</style>\n",
1551 |        "<table border=\"1\" class=\"dataframe\">\n",
1552 |        "  <thead>\n",
1553 |        "    <tr>\n",
1554 |        "      <th></th>\n",
1555 |        "      <th colspan=\"3\" halign=\"left\">销售量</th>\n",
1556 |        "    </tr>\n",
1557 |        "    <tr>\n",
1558 |        "      <th>性别</th>\n",
1559 |        "      <th>女</th>\n",
1560 |        "      <th>男</th>\n",
1561 |        "      <th>All</th>\n",
1562 |        "    </tr>\n",
1563 |        "    <tr>\n",
1564 |        "      <th>子公司</th>\n",
1565 |        "      <th></th>\n",
1566 |        "      <th></th>\n",
1567 |        "      <th></th>\n",
1568 |        "    </tr>\n",
1569 |        "  </thead>\n",
1570 |        "  <tbody>\n",
1571 |        "    <tr>\n",
1572 |        "      <th>子公司1</th>\n",
1573 |        "      <td>0.00</td>\n",
1574 |        "      <td>1567.000000</td>\n",
1575 |        "      <td>1567.000000</td>\n",
1576 |        "    </tr>\n",
1577 |        "    <tr>\n",
1578 |        "      <th>子公司2</th>\n",
1579 |        "      <td>2504.50</td>\n",
1580 |        "      <td>1157.000000</td>\n",
1581 |        "      <td>2055.333333</td>\n",
1582 |        "    </tr>\n",
1583 |        "    <tr>\n",
1584 |        "      <th>子公司3</th>\n",
1585 |        "      <td>1665.00</td>\n",
1586 |        "      <td>2769.000000</td>\n",
1587 |        "      <td>2217.000000</td>\n",
1588 |        "    </tr>\n",
1589 |        "    <tr>\n",
1590 |        "      <th>子公司4</th>\n",
1591 |        "      <td>2745.00</td>\n",
1592 |        "      <td>1360.500000</td>\n",
1593 |        "      <td>1822.000000</td>\n",
1594 |        "    </tr>\n",
1595 |        "    <tr>\n",
1596 |        "      <th>All</th>\n",
1597 |        "      <td>2354.75</td>\n",
1598 |        "      <td>1630.166667</td>\n",
1599 |        "      <td>1920.000000</td>\n",
1600 |        "    </tr>\n",
1601 |        "  </tbody>\n",
1602 |        "</table>\n",
1603 |        "</div>"
1604 |       ],
1605 |       "text/plain": [
1606 |        "          销售量                          \n",
1607 |        "性别          女            男          All\n",
1608 |        "子公司                                    \n",
1609 |        "子公司1     0.00  1567.000000  1567.000000\n",
1610 |        "子公司2  2504.50  1157.000000  2055.333333\n",
1611 |        "子公司3  1665.00  2769.000000  2217.000000\n",
1612 |        "子公司4  2745.00  1360.500000  1822.000000\n",
1613 |        "All   2354.75  1630.166667  1920.000000"
1614 |       ]
1615 |      },
1616 |      "execution_count": 58,
1617 |      "metadata": {},
1618 |      "output_type": "execute_result"
1619 |     }
1620 |    ],
1621 |    "source": [
1622 |     "# 使用pandas中的pivot_table，fill_value参数对空值进行填充，这里=0就是填充为0，margins设置为True则增加汇总列，columns就是列\n",
1623 |     "pd.pivot_table(sale_df,\n",
1624 |     "               index=['子公司'],\n",
1625 |     "               columns=['性别'],\n",
1626 |     "               values=['销售量'],\n",
1627 |     "               aggfunc=np.mean,\n",
1628 |     "              fill_value=0,\n",
1629 |     "              margins=True)"
1630 |    ]
1631 |   },
1632 |   {
1633 |    "cell_type": "markdown",
1634 |    "metadata": {},
1635 |    "source": [
1636 |     "## 实验2-10 计算分组资料的描述统计量"
1637 |    ]
1638 |   },
1639 |   {
1640 |    "cell_type": "markdown",
1641 |    "metadata": {},
1642 |    "source": [
1643 |     "个人认为，这一部分书上介绍的意义不大。\n",
1644 |     "下表中，x是每组的中位数，f是每组的数量。\n",
1645 |     "书上要求利用x与f来计算平均值，标准差，偏度以及峰度。\n",
1646 |     "主要是考察对公式的掌握。"
1647 |    ]
1648 |   },
1649 |   {
1650 |    "cell_type": "code",
1651 |    "execution_count": 61,
1652 |    "metadata": {},
1653 |    "outputs": [
1654 |     {
1655 |      "data": {
1656 |       "text/html": [
1657 |        "<div>\n",
1658 |        "<style scoped>\n",
1659 |        "    .dataframe tbody tr th:only-of-type {\n",
1660 |        "        vertical-align: middle;\n",
1661 |        "    }\n",
1662 |        "\n",
1663 |        "    .dataframe tbody tr th {\n",
1664 |        "        vertical-align: top;\n",
1665 |        "    }\n",
1666 |        "\n",
1667 |        "    .dataframe thead th {\n",
1668 |        "        text-align: right;\n",
1669 |        "    }\n",
1670 |        "</style>\n",
1671 |        "<table border=\"1\" class=\"dataframe\">\n",
1672 |        "  <thead>\n",
1673 |        "    <tr style=\"text-align: right;\">\n",
1674 |        "      <th></th>\n",
1675 |        "      <th>bins</th>\n",
1676 |        "      <th>x</th>\n",
1677 |        "      <th>f</th>\n",
1678 |        "    </tr>\n",
1679 |        "  </thead>\n",
1680 |        "  <tbody>\n",
1681 |        "    <tr>\n",
1682 |        "      <th>0</th>\n",
1683 |        "      <td>1000以下</td>\n",
1684 |        "      <td>900</td>\n",
1685 |        "      <td>2</td>\n",
1686 |        "    </tr>\n",
1687 |        "    <tr>\n",
1688 |        "      <th>1</th>\n",
1689 |        "      <td>1000-1200</td>\n",
1690 |        "      <td>1100</td>\n",
1691 |        "      <td>8</td>\n",
1692 |        "    </tr>\n",
1693 |        "    <tr>\n",
1694 |        "      <th>2</th>\n",
1695 |        "      <td>1200-1400</td>\n",
1696 |        "      <td>1300</td>\n",
1697 |        "      <td>16</td>\n",
1698 |        "    </tr>\n",
1699 |        "    <tr>\n",
1700 |        "      <th>3</th>\n",
1701 |        "      <td>1400-1600</td>\n",
1702 |        "      <td>1500</td>\n",
1703 |        "      <td>35</td>\n",
1704 |        "    </tr>\n",
1705 |        "    <tr>\n",
1706 |        "      <th>4</th>\n",
1707 |        "      <td>1600-1800</td>\n",
1708 |        "      <td>1700</td>\n",
1709 |        "      <td>23</td>\n",
1710 |        "    </tr>\n",
1711 |        "  </tbody>\n",
1712 |        "</table>\n",
1713 |        "</div>"
1714 |       ],
1715 |       "text/plain": [
1716 |        "        bins     x   f\n",
1717 |        "0     1000以下   900   2\n",
1718 |        "1  1000-1200  1100   8\n",
1719 |        "2  1200-1400  1300  16\n",
1720 |        "3  1400-1600  1500  35\n",
1721 |        "4  1600-1800  1700  23"
1722 |       ]
1723 |      },
1724 |      "execution_count": 61,
1725 |      "metadata": {},
1726 |      "output_type": "execute_result"
1727 |     }
1728 |    ],
1729 |    "source": [
1730 |     "lamp_life_df = pd.read_excel('2-10.xlsx')\n",
1731 |     "lamp_life_df"
1732 |    ]
1733 |   },
1734 |   {
1735 |    "cell_type": "code",
1736 |    "execution_count": 63,
1737 |    "metadata": {},
1738 |    "outputs": [
1739 |     {
1740 |      "data": {
1741 |       "text/plain": [
1742 |        "1464.2857142857142"
1743 |       ]
1744 |      },
1745 |      "execution_count": 63,
1746 |      "metadata": {},
1747 |      "output_type": "execute_result"
1748 |     }
1749 |    ],
1750 |    "source": [
1751 |     "# 平均数\n",
1752 |     "lamp_life_mean = (lamp_life_df['x']*lamp_life_df['f']).sum()/lamp_life_df['f'].sum()\n",
1753 |     "lamp_life_mean"
1754 |    ]
1755 |   },
1756 |   {
1757 |    "cell_type": "code",
1758 |    "execution_count": 67,
1759 |    "metadata": {},
1760 |    "outputs": [
1761 |     {
1762 |      "data": {
1763 |       "text/plain": [
1764 |        "202.7447710222652"
1765 |       ]
1766 |      },
1767 |      "execution_count": 67,
1768 |      "metadata": {},
1769 |      "output_type": "execute_result"
1770 |     }
1771 |    ],
1772 |    "source": [
1773 |     "# 标准差\n",
1774 |     "lamp_life_std = np.sqrt((((lamp_life_df['x']-lamp_life_mean)**2)*lamp_life_df['f']).sum()/lamp_life_df['f'].sum())\n",
1775 |     "lamp_life_std"
1776 |    ]
1777 |   },
1778 |   {
1779 |    "cell_type": "code",
1780 |    "execution_count": 70,
1781 |    "metadata": {},
1782 |    "outputs": [
1783 |     {
1784 |      "data": {
1785 |       "text/plain": [
1786 |        "-6121720.116618068"
1787 |       ]
1788 |      },
1789 |      "execution_count": 70,
1790 |      "metadata": {},
1791 |      "output_type": "execute_result"
1792 |     }
1793 |    ],
1794 |    "source": [
1795 |     "# 三阶动差,为计算偏度做准备\n",
1796 |     "lamp_life_three = (((lamp_life_df['x'] - lamp_life_mean)**3)*lamp_life_df['f']).sum()/lamp_life_df['f'].sum()\n",
1797 |     "lamp_life_three"
1798 |    ]
1799 |   },
1800 |   {
1801 |    "cell_type": "code",
1802 |    "execution_count": 71,
1803 |    "metadata": {},
1804 |    "outputs": [
1805 |     {
1806 |      "data": {
1807 |       "text/plain": [
1808 |        "5075925829.515478"
1809 |       ]
1810 |      },
1811 |      "execution_count": 71,
1812 |      "metadata": {},
1813 |      "output_type": "execute_result"
1814 |     }
1815 |    ],
1816 |    "source": [
1817 |     "# 四阶动差，为计算峰度做准备\n",
1818 |     "lamp_life_four = (((lamp_life_df['x'] - lamp_life_mean)**4)*lamp_life_df['f']).sum()/lamp_life_df['f'].sum()\n",
1819 |     "lamp_life_four"
1820 |    ]
1821 |   },
1822 |   {
1823 |    "cell_type": "code",
1824 |    "execution_count": 72,
1825 |    "metadata": {},
1826 |    "outputs": [
1827 |     {
1828 |      "data": {
1829 |       "text/plain": [
1830 |        "-0.734555277612486"
1831 |       ]
1832 |      },
1833 |      "execution_count": 72,
1834 |      "metadata": {},
1835 |      "output_type": "execute_result"
1836 |     }
1837 |    ],
1838 |    "source": [
1839 |     "# 偏度\n",
1840 |     "lamp_life_skew = lamp_life_three/(lamp_life_std**3)\n",
1841 |     "lamp_life_skew"
1842 |    ]
1843 |   },
1844 |   {
1845 |    "cell_type": "code",
1846 |    "execution_count": 75,
1847 |    "metadata": {},
1848 |    "outputs": [
1849 |     {
1850 |      "data": {
1851 |       "text/plain": [
1852 |        "0.0041154496430850784"
1853 |       ]
1854 |      },
1855 |      "execution_count": 75,
1856 |      "metadata": {},
1857 |      "output_type": "execute_result"
1858 |     }
1859 |    ],
1860 |    "source": [
1861 |     "# 峰度\n",
1862 |     "lamp_life_kurt = lamp_life_four/lamp_life_std**4 - 3\n",
1863 |     "lamp_life_kurt"
1864 |    ]
1865 |   },
1866 |   {
1867 |    "cell_type": "markdown",
1868 |    "metadata": {},
1869 |    "source": [
1870 |     "## 总结"
1871 |    ]
1872 |   },
1873 |   {
1874 |    "cell_type": "markdown",
1875 |    "metadata": {},
1876 |    "source": [
1877 |     "第二章作为初始的章节，基本没有难度，需要掌握的理论也比较少。但是这些基本指标，为后面进一步计算打下基础，不能忽视。"
1878 |    ]
1879 |   }
1880 |  ],
1881 |  "metadata": {
1882 |   "kernelspec": {
1883 |    "display_name": "Python [conda env:root] *",
1884 |    "language": "python",
1885 |    "name": "conda-root-py"
1886 |   },
1887 |   "language_info": {
1888 |    "codemirror_mode": {
1889 |     "name": "ipython",
1890 |     "version": 3
1891 |    },
1892 |    "file_extension": ".py",
1893 |    "mimetype": "text/x-python",
1894 |    "name": "python",
1895 |    "nbconvert_exporter": "python",
1896 |    "pygments_lexer": "ipython3",
1897 |    "version": "3.7.5"
1898 |   }
1899 |  },
1900 |  "nbformat": 4,
1901 |  "nbformat_minor": 2
1902 | }
1903 | 


--------------------------------------------------------------------------------
/第五章 方差分析/5-1.xlsx:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/AirFin/Statistics_Python_Codes/684c651552e0012d085e72301c4fd210748e4a93/第五章 方差分析/5-1.xlsx


--------------------------------------------------------------------------------
/第五章 方差分析/5-2.xlsx:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/AirFin/Statistics_Python_Codes/684c651552e0012d085e72301c4fd210748e4a93/第五章 方差分析/5-2.xlsx


--------------------------------------------------------------------------------
/第五章 方差分析/5-3.xlsx:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/AirFin/Statistics_Python_Codes/684c651552e0012d085e72301c4fd210748e4a93/第五章 方差分析/5-3.xlsx


--------------------------------------------------------------------------------
/第五章 方差分析/第五章 方差分析.ipynb:
--------------------------------------------------------------------------------
   1 | {
   2 |  "cells": [
   3 |   {
   4 |    "cell_type": "markdown",
   5 |    "metadata": {},
   6 |    "source": [
   7 |     "# 第一节 单因素方差分析"
   8 |    ]
   9 |   },
  10 |   {
  11 |    "cell_type": "markdown",
  12 |    "metadata": {},
  13 |    "source": [
  14 |     "## 实验5-1 单因素方差分析"
  15 |    ]
  16 |   },
  17 |   {
  18 |    "cell_type": "markdown",
  19 |    "metadata": {},
  20 |    "source": [
  21 |     "检查三家工厂的机器完成生产所需平均时间是否相同。三家工厂机器完成生产所需时间如下\n",
  22 |     "\n",
  23 |     "α=0.05\n",
  24 |     "\n",
  25 |     "H0:三家工厂的机器完成生产所需平均时间相同\n",
  26 |     "    \n",
  27 |     "H1:三家工厂的机器完成生产所需平均时间不同"
  28 |    ]
  29 |   },
  30 |   {
  31 |    "cell_type": "code",
  32 |    "execution_count": 9,
  33 |    "metadata": {},
  34 |    "outputs": [],
  35 |    "source": [
  36 |     "import pandas as pd \n",
  37 |     "import statsmodels.api as sm \n",
  38 |     "from statsmodels.formula.api import ols"
  39 |    ]
  40 |   },
  41 |   {
  42 |    "cell_type": "code",
  43 |    "execution_count": 10,
  44 |    "metadata": {},
  45 |    "outputs": [
  46 |     {
  47 |      "data": {
  48 |       "text/html": [
  49 |        "<div>\n",
  50 |        "<style scoped>\n",
  51 |        "    .dataframe tbody tr th:only-of-type {\n",
  52 |        "        vertical-align: middle;\n",
  53 |        "    }\n",
  54 |        "\n",
  55 |        "    .dataframe tbody tr th {\n",
  56 |        "        vertical-align: top;\n",
  57 |        "    }\n",
  58 |        "\n",
  59 |        "    .dataframe thead th {\n",
  60 |        "        text-align: right;\n",
  61 |        "    }\n",
  62 |        "</style>\n",
  63 |        "<table border=\"1\" class=\"dataframe\">\n",
  64 |        "  <thead>\n",
  65 |        "    <tr style=\"text-align: right;\">\n",
  66 |        "      <th></th>\n",
  67 |        "      <th>1</th>\n",
  68 |        "      <th>2</th>\n",
  69 |        "      <th>3</th>\n",
  70 |        "    </tr>\n",
  71 |        "  </thead>\n",
  72 |        "  <tbody>\n",
  73 |        "    <tr>\n",
  74 |        "      <th>0</th>\n",
  75 |        "      <td>20</td>\n",
  76 |        "      <td>28</td>\n",
  77 |        "      <td>20</td>\n",
  78 |        "    </tr>\n",
  79 |        "    <tr>\n",
  80 |        "      <th>1</th>\n",
  81 |        "      <td>26</td>\n",
  82 |        "      <td>26</td>\n",
  83 |        "      <td>19</td>\n",
  84 |        "    </tr>\n",
  85 |        "    <tr>\n",
  86 |        "      <th>2</th>\n",
  87 |        "      <td>24</td>\n",
  88 |        "      <td>31</td>\n",
  89 |        "      <td>23</td>\n",
  90 |        "    </tr>\n",
  91 |        "    <tr>\n",
  92 |        "      <th>3</th>\n",
  93 |        "      <td>22</td>\n",
  94 |        "      <td>27</td>\n",
  95 |        "      <td>22</td>\n",
  96 |        "    </tr>\n",
  97 |        "  </tbody>\n",
  98 |        "</table>\n",
  99 |        "</div>"
 100 |       ],
 101 |       "text/plain": [
 102 |        "    1   2   3\n",
 103 |        "0  20  28  20\n",
 104 |        "1  26  26  19\n",
 105 |        "2  24  31  23\n",
 106 |        "3  22  27  22"
 107 |       ]
 108 |      },
 109 |      "execution_count": 10,
 110 |      "metadata": {},
 111 |      "output_type": "execute_result"
 112 |     }
 113 |    ],
 114 |    "source": [
 115 |     "productivity_df = pd.read_excel('5-1.xlsx')\n",
 116 |     "productivity_df"
 117 |    ]
 118 |   },
 119 |   {
 120 |    "cell_type": "code",
 121 |    "execution_count": 11,
 122 |    "metadata": {},
 123 |    "outputs": [
 124 |     {
 125 |      "data": {
 126 |       "text/html": [
 127 |        "<div>\n",
 128 |        "<style scoped>\n",
 129 |        "    .dataframe tbody tr th:only-of-type {\n",
 130 |        "        vertical-align: middle;\n",
 131 |        "    }\n",
 132 |        "\n",
 133 |        "    .dataframe tbody tr th {\n",
 134 |        "        vertical-align: top;\n",
 135 |        "    }\n",
 136 |        "\n",
 137 |        "    .dataframe thead th {\n",
 138 |        "        text-align: right;\n",
 139 |        "    }\n",
 140 |        "</style>\n",
 141 |        "<table border=\"1\" class=\"dataframe\">\n",
 142 |        "  <thead>\n",
 143 |        "    <tr style=\"text-align: right;\">\n",
 144 |        "      <th></th>\n",
 145 |        "      <th>factory</th>\n",
 146 |        "      <th>time_spent</th>\n",
 147 |        "    </tr>\n",
 148 |        "  </thead>\n",
 149 |        "  <tbody>\n",
 150 |        "    <tr>\n",
 151 |        "      <th>0</th>\n",
 152 |        "      <td>1</td>\n",
 153 |        "      <td>20</td>\n",
 154 |        "    </tr>\n",
 155 |        "    <tr>\n",
 156 |        "      <th>1</th>\n",
 157 |        "      <td>1</td>\n",
 158 |        "      <td>26</td>\n",
 159 |        "    </tr>\n",
 160 |        "    <tr>\n",
 161 |        "      <th>2</th>\n",
 162 |        "      <td>1</td>\n",
 163 |        "      <td>24</td>\n",
 164 |        "    </tr>\n",
 165 |        "    <tr>\n",
 166 |        "      <th>3</th>\n",
 167 |        "      <td>1</td>\n",
 168 |        "      <td>22</td>\n",
 169 |        "    </tr>\n",
 170 |        "    <tr>\n",
 171 |        "      <th>4</th>\n",
 172 |        "      <td>2</td>\n",
 173 |        "      <td>28</td>\n",
 174 |        "    </tr>\n",
 175 |        "    <tr>\n",
 176 |        "      <th>5</th>\n",
 177 |        "      <td>2</td>\n",
 178 |        "      <td>26</td>\n",
 179 |        "    </tr>\n",
 180 |        "    <tr>\n",
 181 |        "      <th>6</th>\n",
 182 |        "      <td>2</td>\n",
 183 |        "      <td>31</td>\n",
 184 |        "    </tr>\n",
 185 |        "    <tr>\n",
 186 |        "      <th>7</th>\n",
 187 |        "      <td>2</td>\n",
 188 |        "      <td>27</td>\n",
 189 |        "    </tr>\n",
 190 |        "    <tr>\n",
 191 |        "      <th>8</th>\n",
 192 |        "      <td>3</td>\n",
 193 |        "      <td>20</td>\n",
 194 |        "    </tr>\n",
 195 |        "    <tr>\n",
 196 |        "      <th>9</th>\n",
 197 |        "      <td>3</td>\n",
 198 |        "      <td>19</td>\n",
 199 |        "    </tr>\n",
 200 |        "    <tr>\n",
 201 |        "      <th>10</th>\n",
 202 |        "      <td>3</td>\n",
 203 |        "      <td>23</td>\n",
 204 |        "    </tr>\n",
 205 |        "    <tr>\n",
 206 |        "      <th>11</th>\n",
 207 |        "      <td>3</td>\n",
 208 |        "      <td>22</td>\n",
 209 |        "    </tr>\n",
 210 |        "  </tbody>\n",
 211 |        "</table>\n",
 212 |        "</div>"
 213 |       ],
 214 |       "text/plain": [
 215 |        "    factory  time_spent\n",
 216 |        "0         1          20\n",
 217 |        "1         1          26\n",
 218 |        "2         1          24\n",
 219 |        "3         1          22\n",
 220 |        "4         2          28\n",
 221 |        "5         2          26\n",
 222 |        "6         2          31\n",
 223 |        "7         2          27\n",
 224 |        "8         3          20\n",
 225 |        "9         3          19\n",
 226 |        "10        3          23\n",
 227 |        "11        3          22"
 228 |       ]
 229 |      },
 230 |      "execution_count": 11,
 231 |      "metadata": {},
 232 |      "output_type": "execute_result"
 233 |     }
 234 |    ],
 235 |    "source": [
 236 |     "# 将原始数据的宽表转化成便于数据分析的长表\n",
 237 |     "productivity_df_long = productivity_df.melt(var_name='factory' , value_name='time_spent')\n",
 238 |     "productivity_df_long"
 239 |    ]
 240 |   },
 241 |   {
 242 |    "cell_type": "code",
 243 |    "execution_count": 12,
 244 |    "metadata": {},
 245 |    "outputs": [
 246 |     {
 247 |      "data": {
 248 |       "text/html": [
 249 |        "<div>\n",
 250 |        "<style scoped>\n",
 251 |        "    .dataframe tbody tr th:only-of-type {\n",
 252 |        "        vertical-align: middle;\n",
 253 |        "    }\n",
 254 |        "\n",
 255 |        "    .dataframe tbody tr th {\n",
 256 |        "        vertical-align: top;\n",
 257 |        "    }\n",
 258 |        "\n",
 259 |        "    .dataframe thead tr th {\n",
 260 |        "        text-align: left;\n",
 261 |        "    }\n",
 262 |        "\n",
 263 |        "    .dataframe thead tr:last-of-type th {\n",
 264 |        "        text-align: right;\n",
 265 |        "    }\n",
 266 |        "</style>\n",
 267 |        "<table border=\"1\" class=\"dataframe\">\n",
 268 |        "  <thead>\n",
 269 |        "    <tr>\n",
 270 |        "      <th></th>\n",
 271 |        "      <th colspan=\"8\" halign=\"left\">time_spent</th>\n",
 272 |        "    </tr>\n",
 273 |        "    <tr>\n",
 274 |        "      <th></th>\n",
 275 |        "      <th>count</th>\n",
 276 |        "      <th>mean</th>\n",
 277 |        "      <th>std</th>\n",
 278 |        "      <th>min</th>\n",
 279 |        "      <th>25%</th>\n",
 280 |        "      <th>50%</th>\n",
 281 |        "      <th>75%</th>\n",
 282 |        "      <th>max</th>\n",
 283 |        "    </tr>\n",
 284 |        "    <tr>\n",
 285 |        "      <th>factory</th>\n",
 286 |        "      <th></th>\n",
 287 |        "      <th></th>\n",
 288 |        "      <th></th>\n",
 289 |        "      <th></th>\n",
 290 |        "      <th></th>\n",
 291 |        "      <th></th>\n",
 292 |        "      <th></th>\n",
 293 |        "      <th></th>\n",
 294 |        "    </tr>\n",
 295 |        "  </thead>\n",
 296 |        "  <tbody>\n",
 297 |        "    <tr>\n",
 298 |        "      <th>1</th>\n",
 299 |        "      <td>4.0</td>\n",
 300 |        "      <td>23.0</td>\n",
 301 |        "      <td>2.581989</td>\n",
 302 |        "      <td>20.0</td>\n",
 303 |        "      <td>21.50</td>\n",
 304 |        "      <td>23.0</td>\n",
 305 |        "      <td>24.50</td>\n",
 306 |        "      <td>26.0</td>\n",
 307 |        "    </tr>\n",
 308 |        "    <tr>\n",
 309 |        "      <th>2</th>\n",
 310 |        "      <td>4.0</td>\n",
 311 |        "      <td>28.0</td>\n",
 312 |        "      <td>2.160247</td>\n",
 313 |        "      <td>26.0</td>\n",
 314 |        "      <td>26.75</td>\n",
 315 |        "      <td>27.5</td>\n",
 316 |        "      <td>28.75</td>\n",
 317 |        "      <td>31.0</td>\n",
 318 |        "    </tr>\n",
 319 |        "    <tr>\n",
 320 |        "      <th>3</th>\n",
 321 |        "      <td>4.0</td>\n",
 322 |        "      <td>21.0</td>\n",
 323 |        "      <td>1.825742</td>\n",
 324 |        "      <td>19.0</td>\n",
 325 |        "      <td>19.75</td>\n",
 326 |        "      <td>21.0</td>\n",
 327 |        "      <td>22.25</td>\n",
 328 |        "      <td>23.0</td>\n",
 329 |        "    </tr>\n",
 330 |        "  </tbody>\n",
 331 |        "</table>\n",
 332 |        "</div>"
 333 |       ],
 334 |       "text/plain": [
 335 |        "        time_spent                                                \n",
 336 |        "             count  mean       std   min    25%   50%    75%   max\n",
 337 |        "factory                                                           \n",
 338 |        "1              4.0  23.0  2.581989  20.0  21.50  23.0  24.50  26.0\n",
 339 |        "2              4.0  28.0  2.160247  26.0  26.75  27.5  28.75  31.0\n",
 340 |        "3              4.0  21.0  1.825742  19.0  19.75  21.0  22.25  23.0"
 341 |       ]
 342 |      },
 343 |      "execution_count": 12,
 344 |      "metadata": {},
 345 |      "output_type": "execute_result"
 346 |     }
 347 |    ],
 348 |    "source": [
 349 |     "# 用pandas中groupby按工厂进行分组，然后用describe方法对各组进行描述性统计\n",
 350 |     "productivity_df_long.groupby('factory').describe()"
 351 |    ]
 352 |   },
 353 |   {
 354 |    "cell_type": "code",
 355 |    "execution_count": 18,
 356 |    "metadata": {},
 357 |    "outputs": [
 358 |     {
 359 |      "data": {
 360 |       "text/html": [
 361 |        "<div>\n",
 362 |        "<style scoped>\n",
 363 |        "    .dataframe tbody tr th:only-of-type {\n",
 364 |        "        vertical-align: middle;\n",
 365 |        "    }\n",
 366 |        "\n",
 367 |        "    .dataframe tbody tr th {\n",
 368 |        "        vertical-align: top;\n",
 369 |        "    }\n",
 370 |        "\n",
 371 |        "    .dataframe thead th {\n",
 372 |        "        text-align: right;\n",
 373 |        "    }\n",
 374 |        "</style>\n",
 375 |        "<table border=\"1\" class=\"dataframe\">\n",
 376 |        "  <thead>\n",
 377 |        "    <tr style=\"text-align: right;\">\n",
 378 |        "      <th></th>\n",
 379 |        "      <th>df</th>\n",
 380 |        "      <th>sum_sq</th>\n",
 381 |        "      <th>mean_sq</th>\n",
 382 |        "      <th>F</th>\n",
 383 |        "      <th>PR(&gt;F)</th>\n",
 384 |        "    </tr>\n",
 385 |        "  </thead>\n",
 386 |        "  <tbody>\n",
 387 |        "    <tr>\n",
 388 |        "      <th>C(factory)</th>\n",
 389 |        "      <td>2.0</td>\n",
 390 |        "      <td>104.0</td>\n",
 391 |        "      <td>52.000000</td>\n",
 392 |        "      <td>10.636364</td>\n",
 393 |        "      <td>0.00426</td>\n",
 394 |        "    </tr>\n",
 395 |        "    <tr>\n",
 396 |        "      <th>Residual</th>\n",
 397 |        "      <td>9.0</td>\n",
 398 |        "      <td>44.0</td>\n",
 399 |        "      <td>4.888889</td>\n",
 400 |        "      <td>NaN</td>\n",
 401 |        "      <td>NaN</td>\n",
 402 |        "    </tr>\n",
 403 |        "  </tbody>\n",
 404 |        "</table>\n",
 405 |        "</div>"
 406 |       ],
 407 |       "text/plain": [
 408 |        "             df  sum_sq    mean_sq          F   PR(>F)\n",
 409 |        "C(factory)  2.0   104.0  52.000000  10.636364  0.00426\n",
 410 |        "Residual    9.0    44.0   4.888889        NaN      NaN"
 411 |       ]
 412 |      },
 413 |      "execution_count": 18,
 414 |      "metadata": {},
 415 |      "output_type": "execute_result"
 416 |     }
 417 |    ],
 418 |    "source": [
 419 |     "productivity_lm = ols('time_spent~C(factory)' , data=productivity_df_long).fit()\n",
 420 |     "sm.stats.anova_lm(productivity_lm)"
 421 |    ]
 422 |   },
 423 |   {
 424 |    "cell_type": "markdown",
 425 |    "metadata": {},
 426 |    "source": [
 427 |     "结论\n",
 428 |     "\n",
 429 |     "由于p值 0.00426 < 0.05 ，因此在5%显著性水平下，应拒绝原假设，即三个厂机器完成工作时间是有显著差异的"
 430 |    ]
 431 |   },
 432 |   {
 433 |    "cell_type": "markdown",
 434 |    "metadata": {},
 435 |    "source": [
 436 |     "## 第二节 双因素方差分析"
 437 |    ]
 438 |   },
 439 |   {
 440 |    "cell_type": "markdown",
 441 |    "metadata": {},
 442 |    "source": [
 443 |     "## 实验5-2 无交互作用的双因素方差分析"
 444 |    ]
 445 |   },
 446 |   {
 447 |    "cell_type": "markdown",
 448 |    "metadata": {},
 449 |    "source": [
 450 |     "三个品牌的手机在四个地区销售，销售数据如下。显著性水平5%，分析手机销售量是否由于品牌的不同和地区的不同而存在差异。"
 451 |    ]
 452 |   },
 453 |   {
 454 |    "cell_type": "code",
 455 |    "execution_count": 2,
 456 |    "metadata": {},
 457 |    "outputs": [],
 458 |    "source": [
 459 |     "import pandas as pd \n",
 460 |     "import statsmodels.api as sm \n",
 461 |     "from statsmodels.formula.api import ols"
 462 |    ]
 463 |   },
 464 |   {
 465 |    "cell_type": "code",
 466 |    "execution_count": 3,
 467 |    "metadata": {},
 468 |    "outputs": [
 469 |     {
 470 |      "data": {
 471 |       "text/html": [
 472 |        "<div>\n",
 473 |        "<style scoped>\n",
 474 |        "    .dataframe tbody tr th:only-of-type {\n",
 475 |        "        vertical-align: middle;\n",
 476 |        "    }\n",
 477 |        "\n",
 478 |        "    .dataframe tbody tr th {\n",
 479 |        "        vertical-align: top;\n",
 480 |        "    }\n",
 481 |        "\n",
 482 |        "    .dataframe thead th {\n",
 483 |        "        text-align: right;\n",
 484 |        "    }\n",
 485 |        "</style>\n",
 486 |        "<table border=\"1\" class=\"dataframe\">\n",
 487 |        "  <thead>\n",
 488 |        "    <tr style=\"text-align: right;\">\n",
 489 |        "      <th></th>\n",
 490 |        "      <th>地区1</th>\n",
 491 |        "      <th>地区2</th>\n",
 492 |        "      <th>地区3</th>\n",
 493 |        "      <th>地区4</th>\n",
 494 |        "    </tr>\n",
 495 |        "  </thead>\n",
 496 |        "  <tbody>\n",
 497 |        "    <tr>\n",
 498 |        "      <th>品牌1</th>\n",
 499 |        "      <td>4.5</td>\n",
 500 |        "      <td>6.4</td>\n",
 501 |        "      <td>7.2</td>\n",
 502 |        "      <td>6.7</td>\n",
 503 |        "    </tr>\n",
 504 |        "    <tr>\n",
 505 |        "      <th>品牌2</th>\n",
 506 |        "      <td>8.8</td>\n",
 507 |        "      <td>7.8</td>\n",
 508 |        "      <td>9.6</td>\n",
 509 |        "      <td>7.0</td>\n",
 510 |        "    </tr>\n",
 511 |        "    <tr>\n",
 512 |        "      <th>品牌3</th>\n",
 513 |        "      <td>5.9</td>\n",
 514 |        "      <td>6.8</td>\n",
 515 |        "      <td>5.7</td>\n",
 516 |        "      <td>5.2</td>\n",
 517 |        "    </tr>\n",
 518 |        "  </tbody>\n",
 519 |        "</table>\n",
 520 |        "</div>"
 521 |       ],
 522 |       "text/plain": [
 523 |        "     地区1  地区2  地区3  地区4\n",
 524 |        "品牌1  4.5  6.4  7.2  6.7\n",
 525 |        "品牌2  8.8  7.8  9.6  7.0\n",
 526 |        "品牌3  5.9  6.8  5.7  5.2"
 527 |       ]
 528 |      },
 529 |      "execution_count": 3,
 530 |      "metadata": {},
 531 |      "output_type": "execute_result"
 532 |     }
 533 |    ],
 534 |    "source": [
 535 |     "sell_df = pd.read_excel('5-2.xlsx',index_col=0) # 注意索引\n",
 536 |     "sell_df"
 537 |    ]
 538 |   },
 539 |   {
 540 |    "cell_type": "code",
 541 |    "execution_count": 4,
 542 |    "metadata": {},
 543 |    "outputs": [
 544 |     {
 545 |      "data": {
 546 |       "text/html": [
 547 |        "<div>\n",
 548 |        "<style scoped>\n",
 549 |        "    .dataframe tbody tr th:only-of-type {\n",
 550 |        "        vertical-align: middle;\n",
 551 |        "    }\n",
 552 |        "\n",
 553 |        "    .dataframe tbody tr th {\n",
 554 |        "        vertical-align: top;\n",
 555 |        "    }\n",
 556 |        "\n",
 557 |        "    .dataframe thead th {\n",
 558 |        "        text-align: right;\n",
 559 |        "    }\n",
 560 |        "</style>\n",
 561 |        "<table border=\"1\" class=\"dataframe\">\n",
 562 |        "  <thead>\n",
 563 |        "    <tr style=\"text-align: right;\">\n",
 564 |        "      <th></th>\n",
 565 |        "      <th>brand</th>\n",
 566 |        "      <th>地区1</th>\n",
 567 |        "      <th>地区2</th>\n",
 568 |        "      <th>地区3</th>\n",
 569 |        "      <th>地区4</th>\n",
 570 |        "    </tr>\n",
 571 |        "  </thead>\n",
 572 |        "  <tbody>\n",
 573 |        "    <tr>\n",
 574 |        "      <th>0</th>\n",
 575 |        "      <td>品牌1</td>\n",
 576 |        "      <td>4.5</td>\n",
 577 |        "      <td>6.4</td>\n",
 578 |        "      <td>7.2</td>\n",
 579 |        "      <td>6.7</td>\n",
 580 |        "    </tr>\n",
 581 |        "    <tr>\n",
 582 |        "      <th>1</th>\n",
 583 |        "      <td>品牌2</td>\n",
 584 |        "      <td>8.8</td>\n",
 585 |        "      <td>7.8</td>\n",
 586 |        "      <td>9.6</td>\n",
 587 |        "      <td>7.0</td>\n",
 588 |        "    </tr>\n",
 589 |        "    <tr>\n",
 590 |        "      <th>2</th>\n",
 591 |        "      <td>品牌3</td>\n",
 592 |        "      <td>5.9</td>\n",
 593 |        "      <td>6.8</td>\n",
 594 |        "      <td>5.7</td>\n",
 595 |        "      <td>5.2</td>\n",
 596 |        "    </tr>\n",
 597 |        "  </tbody>\n",
 598 |        "</table>\n",
 599 |        "</div>"
 600 |       ],
 601 |       "text/plain": [
 602 |        "  brand  地区1  地区2  地区3  地区4\n",
 603 |        "0   品牌1  4.5  6.4  7.2  6.7\n",
 604 |        "1   品牌2  8.8  7.8  9.6  7.0\n",
 605 |        "2   品牌3  5.9  6.8  5.7  5.2"
 606 |       ]
 607 |      },
 608 |      "execution_count": 4,
 609 |      "metadata": {},
 610 |      "output_type": "execute_result"
 611 |     }
 612 |    ],
 613 |    "source": [
 614 |     "# 清洗数据，变长表\n",
 615 |     "sell_df_n = sell_df.reset_index()\n",
 616 |     "sell_df_n = sell_df_n.rename(index = str , columns = {'index':'brand'})\n",
 617 |     "sell_df_n"
 618 |    ]
 619 |   },
 620 |   {
 621 |    "cell_type": "code",
 622 |    "execution_count": 5,
 623 |    "metadata": {},
 624 |    "outputs": [
 625 |     {
 626 |      "data": {
 627 |       "text/html": [
 628 |        "<div>\n",
 629 |        "<style scoped>\n",
 630 |        "    .dataframe tbody tr th:only-of-type {\n",
 631 |        "        vertical-align: middle;\n",
 632 |        "    }\n",
 633 |        "\n",
 634 |        "    .dataframe tbody tr th {\n",
 635 |        "        vertical-align: top;\n",
 636 |        "    }\n",
 637 |        "\n",
 638 |        "    .dataframe thead th {\n",
 639 |        "        text-align: right;\n",
 640 |        "    }\n",
 641 |        "</style>\n",
 642 |        "<table border=\"1\" class=\"dataframe\">\n",
 643 |        "  <thead>\n",
 644 |        "    <tr style=\"text-align: right;\">\n",
 645 |        "      <th></th>\n",
 646 |        "      <th>brand</th>\n",
 647 |        "      <th>area</th>\n",
 648 |        "      <th>sell</th>\n",
 649 |        "    </tr>\n",
 650 |        "  </thead>\n",
 651 |        "  <tbody>\n",
 652 |        "    <tr>\n",
 653 |        "      <th>0</th>\n",
 654 |        "      <td>品牌1</td>\n",
 655 |        "      <td>地区1</td>\n",
 656 |        "      <td>4.5</td>\n",
 657 |        "    </tr>\n",
 658 |        "    <tr>\n",
 659 |        "      <th>1</th>\n",
 660 |        "      <td>品牌2</td>\n",
 661 |        "      <td>地区1</td>\n",
 662 |        "      <td>8.8</td>\n",
 663 |        "    </tr>\n",
 664 |        "    <tr>\n",
 665 |        "      <th>2</th>\n",
 666 |        "      <td>品牌3</td>\n",
 667 |        "      <td>地区1</td>\n",
 668 |        "      <td>5.9</td>\n",
 669 |        "    </tr>\n",
 670 |        "    <tr>\n",
 671 |        "      <th>3</th>\n",
 672 |        "      <td>品牌1</td>\n",
 673 |        "      <td>地区2</td>\n",
 674 |        "      <td>6.4</td>\n",
 675 |        "    </tr>\n",
 676 |        "    <tr>\n",
 677 |        "      <th>4</th>\n",
 678 |        "      <td>品牌2</td>\n",
 679 |        "      <td>地区2</td>\n",
 680 |        "      <td>7.8</td>\n",
 681 |        "    </tr>\n",
 682 |        "    <tr>\n",
 683 |        "      <th>5</th>\n",
 684 |        "      <td>品牌3</td>\n",
 685 |        "      <td>地区2</td>\n",
 686 |        "      <td>6.8</td>\n",
 687 |        "    </tr>\n",
 688 |        "    <tr>\n",
 689 |        "      <th>6</th>\n",
 690 |        "      <td>品牌1</td>\n",
 691 |        "      <td>地区3</td>\n",
 692 |        "      <td>7.2</td>\n",
 693 |        "    </tr>\n",
 694 |        "    <tr>\n",
 695 |        "      <th>7</th>\n",
 696 |        "      <td>品牌2</td>\n",
 697 |        "      <td>地区3</td>\n",
 698 |        "      <td>9.6</td>\n",
 699 |        "    </tr>\n",
 700 |        "    <tr>\n",
 701 |        "      <th>8</th>\n",
 702 |        "      <td>品牌3</td>\n",
 703 |        "      <td>地区3</td>\n",
 704 |        "      <td>5.7</td>\n",
 705 |        "    </tr>\n",
 706 |        "    <tr>\n",
 707 |        "      <th>9</th>\n",
 708 |        "      <td>品牌1</td>\n",
 709 |        "      <td>地区4</td>\n",
 710 |        "      <td>6.7</td>\n",
 711 |        "    </tr>\n",
 712 |        "    <tr>\n",
 713 |        "      <th>10</th>\n",
 714 |        "      <td>品牌2</td>\n",
 715 |        "      <td>地区4</td>\n",
 716 |        "      <td>7.0</td>\n",
 717 |        "    </tr>\n",
 718 |        "    <tr>\n",
 719 |        "      <th>11</th>\n",
 720 |        "      <td>品牌3</td>\n",
 721 |        "      <td>地区4</td>\n",
 722 |        "      <td>5.2</td>\n",
 723 |        "    </tr>\n",
 724 |        "  </tbody>\n",
 725 |        "</table>\n",
 726 |        "</div>"
 727 |       ],
 728 |       "text/plain": [
 729 |        "   brand area  sell\n",
 730 |        "0    品牌1  地区1   4.5\n",
 731 |        "1    品牌2  地区1   8.8\n",
 732 |        "2    品牌3  地区1   5.9\n",
 733 |        "3    品牌1  地区2   6.4\n",
 734 |        "4    品牌2  地区2   7.8\n",
 735 |        "5    品牌3  地区2   6.8\n",
 736 |        "6    品牌1  地区3   7.2\n",
 737 |        "7    品牌2  地区3   9.6\n",
 738 |        "8    品牌3  地区3   5.7\n",
 739 |        "9    品牌1  地区4   6.7\n",
 740 |        "10   品牌2  地区4   7.0\n",
 741 |        "11   品牌3  地区4   5.2"
 742 |       ]
 743 |      },
 744 |      "execution_count": 5,
 745 |      "metadata": {},
 746 |      "output_type": "execute_result"
 747 |     }
 748 |    ],
 749 |    "source": [
 750 |     "sell_df_long = sell_df_n.melt(id_vars='brand' , var_name='area' , value_name='sell')\n",
 751 |     "sell_df_long"
 752 |    ]
 753 |   },
 754 |   {
 755 |    "cell_type": "code",
 756 |    "execution_count": 6,
 757 |    "metadata": {},
 758 |    "outputs": [
 759 |     {
 760 |      "data": {
 761 |       "text/html": [
 762 |        "<div>\n",
 763 |        "<style scoped>\n",
 764 |        "    .dataframe tbody tr th:only-of-type {\n",
 765 |        "        vertical-align: middle;\n",
 766 |        "    }\n",
 767 |        "\n",
 768 |        "    .dataframe tbody tr th {\n",
 769 |        "        vertical-align: top;\n",
 770 |        "    }\n",
 771 |        "\n",
 772 |        "    .dataframe thead th {\n",
 773 |        "        text-align: right;\n",
 774 |        "    }\n",
 775 |        "</style>\n",
 776 |        "<table border=\"1\" class=\"dataframe\">\n",
 777 |        "  <thead>\n",
 778 |        "    <tr style=\"text-align: right;\">\n",
 779 |        "      <th></th>\n",
 780 |        "      <th>df</th>\n",
 781 |        "      <th>sum_sq</th>\n",
 782 |        "      <th>mean_sq</th>\n",
 783 |        "      <th>F</th>\n",
 784 |        "      <th>PR(&gt;F)</th>\n",
 785 |        "    </tr>\n",
 786 |        "  </thead>\n",
 787 |        "  <tbody>\n",
 788 |        "    <tr>\n",
 789 |        "      <th>C(brand)</th>\n",
 790 |        "      <td>2.0</td>\n",
 791 |        "      <td>13.68</td>\n",
 792 |        "      <td>6.840000</td>\n",
 793 |        "      <td>6.237082</td>\n",
 794 |        "      <td>0.034258</td>\n",
 795 |        "    </tr>\n",
 796 |        "    <tr>\n",
 797 |        "      <th>C(area)</th>\n",
 798 |        "      <td>3.0</td>\n",
 799 |        "      <td>2.82</td>\n",
 800 |        "      <td>0.940000</td>\n",
 801 |        "      <td>0.857143</td>\n",
 802 |        "      <td>0.512185</td>\n",
 803 |        "    </tr>\n",
 804 |        "    <tr>\n",
 805 |        "      <th>Residual</th>\n",
 806 |        "      <td>6.0</td>\n",
 807 |        "      <td>6.58</td>\n",
 808 |        "      <td>1.096667</td>\n",
 809 |        "      <td>NaN</td>\n",
 810 |        "      <td>NaN</td>\n",
 811 |        "    </tr>\n",
 812 |        "  </tbody>\n",
 813 |        "</table>\n",
 814 |        "</div>"
 815 |       ],
 816 |       "text/plain": [
 817 |        "           df  sum_sq   mean_sq         F    PR(>F)\n",
 818 |        "C(brand)  2.0   13.68  6.840000  6.237082  0.034258\n",
 819 |        "C(area)   3.0    2.82  0.940000  0.857143  0.512185\n",
 820 |        "Residual  6.0    6.58  1.096667       NaN       NaN"
 821 |       ]
 822 |      },
 823 |      "execution_count": 6,
 824 |      "metadata": {},
 825 |      "output_type": "execute_result"
 826 |     }
 827 |    ],
 828 |    "source": [
 829 |     "sell_lm = ols('sell~C(brand)+C(area)' , data=sell_df_long).fit()\n",
 830 |     "sm.stats.anova_lm(sell_lm) "
 831 |    ]
 832 |   },
 833 |   {
 834 |    "cell_type": "markdown",
 835 |    "metadata": {},
 836 |    "source": [
 837 |     "结论\n",
 838 |     "\n",
 839 |     "对于品牌因素 p值0.034258 < 0.05 ， 拒绝原假设，即品牌是重要的影响因素。\n",
 840 |     "\n",
 841 |     "对于地区因素 p值0.512185 > 0.05 ， 拒绝无法原假设，即品牌不是重要的影响因素。"
 842 |    ]
 843 |   },
 844 |   {
 845 |    "cell_type": "markdown",
 846 |    "metadata": {},
 847 |    "source": [
 848 |     "## 实验5-3 有交互作用的双因素方差分析"
 849 |    ]
 850 |   },
 851 |   {
 852 |    "cell_type": "markdown",
 853 |    "metadata": {},
 854 |    "source": [
 855 |     "五一与十一两个黄金周，四个旅游线路，旅游情况如下，显著性水平5%\n",
 856 |     "\n",
 857 |     "判断：\n",
 858 |     "\n",
 859 |     "旅游线路之间是否存在差异？\n",
 860 |     "\n",
 861 |     "两个黄金周之间是否存在差异？\n",
 862 |     "\n",
 863 |     "是否存在线路与黄金周交互作用的影响？"
 864 |    ]
 865 |   },
 866 |   {
 867 |    "cell_type": "code",
 868 |    "execution_count": 7,
 869 |    "metadata": {},
 870 |    "outputs": [],
 871 |    "source": [
 872 |     "import pandas as pd \n",
 873 |     "import statsmodels.api as sm \n",
 874 |     "from statsmodels.formula.api import ols"
 875 |    ]
 876 |   },
 877 |   {
 878 |    "cell_type": "code",
 879 |    "execution_count": 8,
 880 |    "metadata": {},
 881 |    "outputs": [
 882 |     {
 883 |      "data": {
 884 |       "text/html": [
 885 |        "<div>\n",
 886 |        "<style scoped>\n",
 887 |        "    .dataframe tbody tr th:only-of-type {\n",
 888 |        "        vertical-align: middle;\n",
 889 |        "    }\n",
 890 |        "\n",
 891 |        "    .dataframe tbody tr th {\n",
 892 |        "        vertical-align: top;\n",
 893 |        "    }\n",
 894 |        "\n",
 895 |        "    .dataframe thead th {\n",
 896 |        "        text-align: right;\n",
 897 |        "    }\n",
 898 |        "</style>\n",
 899 |        "<table border=\"1\" class=\"dataframe\">\n",
 900 |        "  <thead>\n",
 901 |        "    <tr style=\"text-align: right;\">\n",
 902 |        "      <th></th>\n",
 903 |        "      <th>线路A</th>\n",
 904 |        "      <th>线路B</th>\n",
 905 |        "      <th>线路C</th>\n",
 906 |        "      <th>线路D</th>\n",
 907 |        "    </tr>\n",
 908 |        "  </thead>\n",
 909 |        "  <tbody>\n",
 910 |        "    <tr>\n",
 911 |        "      <th>五一</th>\n",
 912 |        "      <td>31</td>\n",
 913 |        "      <td>22</td>\n",
 914 |        "      <td>14</td>\n",
 915 |        "      <td>8</td>\n",
 916 |        "    </tr>\n",
 917 |        "    <tr>\n",
 918 |        "      <th>NaN</th>\n",
 919 |        "      <td>29</td>\n",
 920 |        "      <td>23</td>\n",
 921 |        "      <td>16</td>\n",
 922 |        "      <td>4</td>\n",
 923 |        "    </tr>\n",
 924 |        "    <tr>\n",
 925 |        "      <th>NaN</th>\n",
 926 |        "      <td>32</td>\n",
 927 |        "      <td>26</td>\n",
 928 |        "      <td>20</td>\n",
 929 |        "      <td>6</td>\n",
 930 |        "    </tr>\n",
 931 |        "    <tr>\n",
 932 |        "      <th>NaN</th>\n",
 933 |        "      <td>30</td>\n",
 934 |        "      <td>25</td>\n",
 935 |        "      <td>15</td>\n",
 936 |        "      <td>5</td>\n",
 937 |        "    </tr>\n",
 938 |        "    <tr>\n",
 939 |        "      <th>NaN</th>\n",
 940 |        "      <td>30</td>\n",
 941 |        "      <td>24</td>\n",
 942 |        "      <td>18</td>\n",
 943 |        "      <td>5</td>\n",
 944 |        "    </tr>\n",
 945 |        "    <tr>\n",
 946 |        "      <th>十一</th>\n",
 947 |        "      <td>25</td>\n",
 948 |        "      <td>21</td>\n",
 949 |        "      <td>16</td>\n",
 950 |        "      <td>5</td>\n",
 951 |        "    </tr>\n",
 952 |        "    <tr>\n",
 953 |        "      <th>NaN</th>\n",
 954 |        "      <td>22</td>\n",
 955 |        "      <td>20</td>\n",
 956 |        "      <td>13</td>\n",
 957 |        "      <td>7</td>\n",
 958 |        "    </tr>\n",
 959 |        "    <tr>\n",
 960 |        "      <th>NaN</th>\n",
 961 |        "      <td>27</td>\n",
 962 |        "      <td>16</td>\n",
 963 |        "      <td>15</td>\n",
 964 |        "      <td>8</td>\n",
 965 |        "    </tr>\n",
 966 |        "    <tr>\n",
 967 |        "      <th>NaN</th>\n",
 968 |        "      <td>26</td>\n",
 969 |        "      <td>19</td>\n",
 970 |        "      <td>12</td>\n",
 971 |        "      <td>7</td>\n",
 972 |        "    </tr>\n",
 973 |        "    <tr>\n",
 974 |        "      <th>NaN</th>\n",
 975 |        "      <td>22</td>\n",
 976 |        "      <td>15</td>\n",
 977 |        "      <td>10</td>\n",
 978 |        "      <td>8</td>\n",
 979 |        "    </tr>\n",
 980 |        "  </tbody>\n",
 981 |        "</table>\n",
 982 |        "</div>"
 983 |       ],
 984 |       "text/plain": [
 985 |        "     线路A  线路B  线路C  线路D\n",
 986 |        "五一    31   22   14    8\n",
 987 |        "NaN   29   23   16    4\n",
 988 |        "NaN   32   26   20    6\n",
 989 |        "NaN   30   25   15    5\n",
 990 |        "NaN   30   24   18    5\n",
 991 |        "十一    25   21   16    5\n",
 992 |        "NaN   22   20   13    7\n",
 993 |        "NaN   27   16   15    8\n",
 994 |        "NaN   26   19   12    7\n",
 995 |        "NaN   22   15   10    8"
 996 |       ]
 997 |      },
 998 |      "execution_count": 8,
 999 |      "metadata": {},
1000 |      "output_type": "execute_result"
1001 |     }
1002 |    ],
1003 |    "source": [
1004 |     "tourist_df = pd.read_excel('5-3.xlsx' , index_col=0) # 注意索引\n",
1005 |     "tourist_df"
1006 |    ]
1007 |   },
1008 |   {
1009 |    "cell_type": "code",
1010 |    "execution_count": 9,
1011 |    "metadata": {},
1012 |    "outputs": [
1013 |     {
1014 |      "data": {
1015 |       "text/html": [
1016 |        "<div>\n",
1017 |        "<style scoped>\n",
1018 |        "    .dataframe tbody tr th:only-of-type {\n",
1019 |        "        vertical-align: middle;\n",
1020 |        "    }\n",
1021 |        "\n",
1022 |        "    .dataframe tbody tr th {\n",
1023 |        "        vertical-align: top;\n",
1024 |        "    }\n",
1025 |        "\n",
1026 |        "    .dataframe thead th {\n",
1027 |        "        text-align: right;\n",
1028 |        "    }\n",
1029 |        "</style>\n",
1030 |        "<table border=\"1\" class=\"dataframe\">\n",
1031 |        "  <thead>\n",
1032 |        "    <tr style=\"text-align: right;\">\n",
1033 |        "      <th></th>\n",
1034 |        "      <th>period</th>\n",
1035 |        "      <th>线路A</th>\n",
1036 |        "      <th>线路B</th>\n",
1037 |        "      <th>线路C</th>\n",
1038 |        "      <th>线路D</th>\n",
1039 |        "    </tr>\n",
1040 |        "  </thead>\n",
1041 |        "  <tbody>\n",
1042 |        "    <tr>\n",
1043 |        "      <th>0</th>\n",
1044 |        "      <td>五一</td>\n",
1045 |        "      <td>31</td>\n",
1046 |        "      <td>22</td>\n",
1047 |        "      <td>14</td>\n",
1048 |        "      <td>8</td>\n",
1049 |        "    </tr>\n",
1050 |        "    <tr>\n",
1051 |        "      <th>1</th>\n",
1052 |        "      <td>五一</td>\n",
1053 |        "      <td>29</td>\n",
1054 |        "      <td>23</td>\n",
1055 |        "      <td>16</td>\n",
1056 |        "      <td>4</td>\n",
1057 |        "    </tr>\n",
1058 |        "    <tr>\n",
1059 |        "      <th>2</th>\n",
1060 |        "      <td>五一</td>\n",
1061 |        "      <td>32</td>\n",
1062 |        "      <td>26</td>\n",
1063 |        "      <td>20</td>\n",
1064 |        "      <td>6</td>\n",
1065 |        "    </tr>\n",
1066 |        "    <tr>\n",
1067 |        "      <th>3</th>\n",
1068 |        "      <td>五一</td>\n",
1069 |        "      <td>30</td>\n",
1070 |        "      <td>25</td>\n",
1071 |        "      <td>15</td>\n",
1072 |        "      <td>5</td>\n",
1073 |        "    </tr>\n",
1074 |        "    <tr>\n",
1075 |        "      <th>4</th>\n",
1076 |        "      <td>五一</td>\n",
1077 |        "      <td>30</td>\n",
1078 |        "      <td>24</td>\n",
1079 |        "      <td>18</td>\n",
1080 |        "      <td>5</td>\n",
1081 |        "    </tr>\n",
1082 |        "    <tr>\n",
1083 |        "      <th>5</th>\n",
1084 |        "      <td>十一</td>\n",
1085 |        "      <td>25</td>\n",
1086 |        "      <td>21</td>\n",
1087 |        "      <td>16</td>\n",
1088 |        "      <td>5</td>\n",
1089 |        "    </tr>\n",
1090 |        "    <tr>\n",
1091 |        "      <th>6</th>\n",
1092 |        "      <td>十一</td>\n",
1093 |        "      <td>22</td>\n",
1094 |        "      <td>20</td>\n",
1095 |        "      <td>13</td>\n",
1096 |        "      <td>7</td>\n",
1097 |        "    </tr>\n",
1098 |        "    <tr>\n",
1099 |        "      <th>7</th>\n",
1100 |        "      <td>十一</td>\n",
1101 |        "      <td>27</td>\n",
1102 |        "      <td>16</td>\n",
1103 |        "      <td>15</td>\n",
1104 |        "      <td>8</td>\n",
1105 |        "    </tr>\n",
1106 |        "    <tr>\n",
1107 |        "      <th>8</th>\n",
1108 |        "      <td>十一</td>\n",
1109 |        "      <td>26</td>\n",
1110 |        "      <td>19</td>\n",
1111 |        "      <td>12</td>\n",
1112 |        "      <td>7</td>\n",
1113 |        "    </tr>\n",
1114 |        "    <tr>\n",
1115 |        "      <th>9</th>\n",
1116 |        "      <td>十一</td>\n",
1117 |        "      <td>22</td>\n",
1118 |        "      <td>15</td>\n",
1119 |        "      <td>10</td>\n",
1120 |        "      <td>8</td>\n",
1121 |        "    </tr>\n",
1122 |        "  </tbody>\n",
1123 |        "</table>\n",
1124 |        "</div>"
1125 |       ],
1126 |       "text/plain": [
1127 |        "  period  线路A  线路B  线路C  线路D\n",
1128 |        "0     五一   31   22   14    8\n",
1129 |        "1     五一   29   23   16    4\n",
1130 |        "2     五一   32   26   20    6\n",
1131 |        "3     五一   30   25   15    5\n",
1132 |        "4     五一   30   24   18    5\n",
1133 |        "5     十一   25   21   16    5\n",
1134 |        "6     十一   22   20   13    7\n",
1135 |        "7     十一   27   16   15    8\n",
1136 |        "8     十一   26   19   12    7\n",
1137 |        "9     十一   22   15   10    8"
1138 |       ]
1139 |      },
1140 |      "execution_count": 9,
1141 |      "metadata": {},
1142 |      "output_type": "execute_result"
1143 |     }
1144 |    ],
1145 |    "source": [
1146 |     "# 数据清洗，转换表\n",
1147 |     "tourist_df_n = tourist_df.reset_index()\n",
1148 |     "\n",
1149 |     "# 重命名黄金周变量为period，原变量名为index\n",
1150 |     "tourist_df_n = tourist_df_n.rename(index=str , columns = {'index':'period'})\n",
1151 |     "\n",
1152 |     "# 填充原始数据中黄金周变量的缺失值\n",
1153 |     "tourist_df_n.loc[0:5 , 'period'] = '五一'\n",
1154 |     "tourist_df_n.loc[6:10 , 'period'] = '十一'\n",
1155 |     "\n",
1156 |     "tourist_df_n"
1157 |    ]
1158 |   },
1159 |   {
1160 |    "cell_type": "code",
1161 |    "execution_count": 10,
1162 |    "metadata": {},
1163 |    "outputs": [
1164 |     {
1165 |      "data": {
1166 |       "text/html": [
1167 |        "<div>\n",
1168 |        "<style scoped>\n",
1169 |        "    .dataframe tbody tr th:only-of-type {\n",
1170 |        "        vertical-align: middle;\n",
1171 |        "    }\n",
1172 |        "\n",
1173 |        "    .dataframe tbody tr th {\n",
1174 |        "        vertical-align: top;\n",
1175 |        "    }\n",
1176 |        "\n",
1177 |        "    .dataframe thead th {\n",
1178 |        "        text-align: right;\n",
1179 |        "    }\n",
1180 |        "</style>\n",
1181 |        "<table border=\"1\" class=\"dataframe\">\n",
1182 |        "  <thead>\n",
1183 |        "    <tr style=\"text-align: right;\">\n",
1184 |        "      <th></th>\n",
1185 |        "      <th>period</th>\n",
1186 |        "      <th>plan</th>\n",
1187 |        "      <th>amount</th>\n",
1188 |        "    </tr>\n",
1189 |        "  </thead>\n",
1190 |        "  <tbody>\n",
1191 |        "    <tr>\n",
1192 |        "      <th>0</th>\n",
1193 |        "      <td>五一</td>\n",
1194 |        "      <td>线路A</td>\n",
1195 |        "      <td>31</td>\n",
1196 |        "    </tr>\n",
1197 |        "    <tr>\n",
1198 |        "      <th>1</th>\n",
1199 |        "      <td>五一</td>\n",
1200 |        "      <td>线路A</td>\n",
1201 |        "      <td>29</td>\n",
1202 |        "    </tr>\n",
1203 |        "    <tr>\n",
1204 |        "      <th>2</th>\n",
1205 |        "      <td>五一</td>\n",
1206 |        "      <td>线路A</td>\n",
1207 |        "      <td>32</td>\n",
1208 |        "    </tr>\n",
1209 |        "    <tr>\n",
1210 |        "      <th>3</th>\n",
1211 |        "      <td>五一</td>\n",
1212 |        "      <td>线路A</td>\n",
1213 |        "      <td>30</td>\n",
1214 |        "    </tr>\n",
1215 |        "    <tr>\n",
1216 |        "      <th>4</th>\n",
1217 |        "      <td>五一</td>\n",
1218 |        "      <td>线路A</td>\n",
1219 |        "      <td>30</td>\n",
1220 |        "    </tr>\n",
1221 |        "    <tr>\n",
1222 |        "      <th>5</th>\n",
1223 |        "      <td>十一</td>\n",
1224 |        "      <td>线路A</td>\n",
1225 |        "      <td>25</td>\n",
1226 |        "    </tr>\n",
1227 |        "    <tr>\n",
1228 |        "      <th>6</th>\n",
1229 |        "      <td>十一</td>\n",
1230 |        "      <td>线路A</td>\n",
1231 |        "      <td>22</td>\n",
1232 |        "    </tr>\n",
1233 |        "    <tr>\n",
1234 |        "      <th>7</th>\n",
1235 |        "      <td>十一</td>\n",
1236 |        "      <td>线路A</td>\n",
1237 |        "      <td>27</td>\n",
1238 |        "    </tr>\n",
1239 |        "    <tr>\n",
1240 |        "      <th>8</th>\n",
1241 |        "      <td>十一</td>\n",
1242 |        "      <td>线路A</td>\n",
1243 |        "      <td>26</td>\n",
1244 |        "    </tr>\n",
1245 |        "    <tr>\n",
1246 |        "      <th>9</th>\n",
1247 |        "      <td>十一</td>\n",
1248 |        "      <td>线路A</td>\n",
1249 |        "      <td>22</td>\n",
1250 |        "    </tr>\n",
1251 |        "    <tr>\n",
1252 |        "      <th>10</th>\n",
1253 |        "      <td>五一</td>\n",
1254 |        "      <td>线路B</td>\n",
1255 |        "      <td>22</td>\n",
1256 |        "    </tr>\n",
1257 |        "    <tr>\n",
1258 |        "      <th>11</th>\n",
1259 |        "      <td>五一</td>\n",
1260 |        "      <td>线路B</td>\n",
1261 |        "      <td>23</td>\n",
1262 |        "    </tr>\n",
1263 |        "    <tr>\n",
1264 |        "      <th>12</th>\n",
1265 |        "      <td>五一</td>\n",
1266 |        "      <td>线路B</td>\n",
1267 |        "      <td>26</td>\n",
1268 |        "    </tr>\n",
1269 |        "    <tr>\n",
1270 |        "      <th>13</th>\n",
1271 |        "      <td>五一</td>\n",
1272 |        "      <td>线路B</td>\n",
1273 |        "      <td>25</td>\n",
1274 |        "    </tr>\n",
1275 |        "    <tr>\n",
1276 |        "      <th>14</th>\n",
1277 |        "      <td>五一</td>\n",
1278 |        "      <td>线路B</td>\n",
1279 |        "      <td>24</td>\n",
1280 |        "    </tr>\n",
1281 |        "    <tr>\n",
1282 |        "      <th>15</th>\n",
1283 |        "      <td>十一</td>\n",
1284 |        "      <td>线路B</td>\n",
1285 |        "      <td>21</td>\n",
1286 |        "    </tr>\n",
1287 |        "    <tr>\n",
1288 |        "      <th>16</th>\n",
1289 |        "      <td>十一</td>\n",
1290 |        "      <td>线路B</td>\n",
1291 |        "      <td>20</td>\n",
1292 |        "    </tr>\n",
1293 |        "    <tr>\n",
1294 |        "      <th>17</th>\n",
1295 |        "      <td>十一</td>\n",
1296 |        "      <td>线路B</td>\n",
1297 |        "      <td>16</td>\n",
1298 |        "    </tr>\n",
1299 |        "    <tr>\n",
1300 |        "      <th>18</th>\n",
1301 |        "      <td>十一</td>\n",
1302 |        "      <td>线路B</td>\n",
1303 |        "      <td>19</td>\n",
1304 |        "    </tr>\n",
1305 |        "    <tr>\n",
1306 |        "      <th>19</th>\n",
1307 |        "      <td>十一</td>\n",
1308 |        "      <td>线路B</td>\n",
1309 |        "      <td>15</td>\n",
1310 |        "    </tr>\n",
1311 |        "    <tr>\n",
1312 |        "      <th>20</th>\n",
1313 |        "      <td>五一</td>\n",
1314 |        "      <td>线路C</td>\n",
1315 |        "      <td>14</td>\n",
1316 |        "    </tr>\n",
1317 |        "    <tr>\n",
1318 |        "      <th>21</th>\n",
1319 |        "      <td>五一</td>\n",
1320 |        "      <td>线路C</td>\n",
1321 |        "      <td>16</td>\n",
1322 |        "    </tr>\n",
1323 |        "    <tr>\n",
1324 |        "      <th>22</th>\n",
1325 |        "      <td>五一</td>\n",
1326 |        "      <td>线路C</td>\n",
1327 |        "      <td>20</td>\n",
1328 |        "    </tr>\n",
1329 |        "    <tr>\n",
1330 |        "      <th>23</th>\n",
1331 |        "      <td>五一</td>\n",
1332 |        "      <td>线路C</td>\n",
1333 |        "      <td>15</td>\n",
1334 |        "    </tr>\n",
1335 |        "    <tr>\n",
1336 |        "      <th>24</th>\n",
1337 |        "      <td>五一</td>\n",
1338 |        "      <td>线路C</td>\n",
1339 |        "      <td>18</td>\n",
1340 |        "    </tr>\n",
1341 |        "    <tr>\n",
1342 |        "      <th>25</th>\n",
1343 |        "      <td>十一</td>\n",
1344 |        "      <td>线路C</td>\n",
1345 |        "      <td>16</td>\n",
1346 |        "    </tr>\n",
1347 |        "    <tr>\n",
1348 |        "      <th>26</th>\n",
1349 |        "      <td>十一</td>\n",
1350 |        "      <td>线路C</td>\n",
1351 |        "      <td>13</td>\n",
1352 |        "    </tr>\n",
1353 |        "    <tr>\n",
1354 |        "      <th>27</th>\n",
1355 |        "      <td>十一</td>\n",
1356 |        "      <td>线路C</td>\n",
1357 |        "      <td>15</td>\n",
1358 |        "    </tr>\n",
1359 |        "    <tr>\n",
1360 |        "      <th>28</th>\n",
1361 |        "      <td>十一</td>\n",
1362 |        "      <td>线路C</td>\n",
1363 |        "      <td>12</td>\n",
1364 |        "    </tr>\n",
1365 |        "    <tr>\n",
1366 |        "      <th>29</th>\n",
1367 |        "      <td>十一</td>\n",
1368 |        "      <td>线路C</td>\n",
1369 |        "      <td>10</td>\n",
1370 |        "    </tr>\n",
1371 |        "    <tr>\n",
1372 |        "      <th>30</th>\n",
1373 |        "      <td>五一</td>\n",
1374 |        "      <td>线路D</td>\n",
1375 |        "      <td>8</td>\n",
1376 |        "    </tr>\n",
1377 |        "    <tr>\n",
1378 |        "      <th>31</th>\n",
1379 |        "      <td>五一</td>\n",
1380 |        "      <td>线路D</td>\n",
1381 |        "      <td>4</td>\n",
1382 |        "    </tr>\n",
1383 |        "    <tr>\n",
1384 |        "      <th>32</th>\n",
1385 |        "      <td>五一</td>\n",
1386 |        "      <td>线路D</td>\n",
1387 |        "      <td>6</td>\n",
1388 |        "    </tr>\n",
1389 |        "    <tr>\n",
1390 |        "      <th>33</th>\n",
1391 |        "      <td>五一</td>\n",
1392 |        "      <td>线路D</td>\n",
1393 |        "      <td>5</td>\n",
1394 |        "    </tr>\n",
1395 |        "    <tr>\n",
1396 |        "      <th>34</th>\n",
1397 |        "      <td>五一</td>\n",
1398 |        "      <td>线路D</td>\n",
1399 |        "      <td>5</td>\n",
1400 |        "    </tr>\n",
1401 |        "    <tr>\n",
1402 |        "      <th>35</th>\n",
1403 |        "      <td>十一</td>\n",
1404 |        "      <td>线路D</td>\n",
1405 |        "      <td>5</td>\n",
1406 |        "    </tr>\n",
1407 |        "    <tr>\n",
1408 |        "      <th>36</th>\n",
1409 |        "      <td>十一</td>\n",
1410 |        "      <td>线路D</td>\n",
1411 |        "      <td>7</td>\n",
1412 |        "    </tr>\n",
1413 |        "    <tr>\n",
1414 |        "      <th>37</th>\n",
1415 |        "      <td>十一</td>\n",
1416 |        "      <td>线路D</td>\n",
1417 |        "      <td>8</td>\n",
1418 |        "    </tr>\n",
1419 |        "    <tr>\n",
1420 |        "      <th>38</th>\n",
1421 |        "      <td>十一</td>\n",
1422 |        "      <td>线路D</td>\n",
1423 |        "      <td>7</td>\n",
1424 |        "    </tr>\n",
1425 |        "    <tr>\n",
1426 |        "      <th>39</th>\n",
1427 |        "      <td>十一</td>\n",
1428 |        "      <td>线路D</td>\n",
1429 |        "      <td>8</td>\n",
1430 |        "    </tr>\n",
1431 |        "  </tbody>\n",
1432 |        "</table>\n",
1433 |        "</div>"
1434 |       ],
1435 |       "text/plain": [
1436 |        "   period plan  amount\n",
1437 |        "0      五一  线路A      31\n",
1438 |        "1      五一  线路A      29\n",
1439 |        "2      五一  线路A      32\n",
1440 |        "3      五一  线路A      30\n",
1441 |        "4      五一  线路A      30\n",
1442 |        "5      十一  线路A      25\n",
1443 |        "6      十一  线路A      22\n",
1444 |        "7      十一  线路A      27\n",
1445 |        "8      十一  线路A      26\n",
1446 |        "9      十一  线路A      22\n",
1447 |        "10     五一  线路B      22\n",
1448 |        "11     五一  线路B      23\n",
1449 |        "12     五一  线路B      26\n",
1450 |        "13     五一  线路B      25\n",
1451 |        "14     五一  线路B      24\n",
1452 |        "15     十一  线路B      21\n",
1453 |        "16     十一  线路B      20\n",
1454 |        "17     十一  线路B      16\n",
1455 |        "18     十一  线路B      19\n",
1456 |        "19     十一  线路B      15\n",
1457 |        "20     五一  线路C      14\n",
1458 |        "21     五一  线路C      16\n",
1459 |        "22     五一  线路C      20\n",
1460 |        "23     五一  线路C      15\n",
1461 |        "24     五一  线路C      18\n",
1462 |        "25     十一  线路C      16\n",
1463 |        "26     十一  线路C      13\n",
1464 |        "27     十一  线路C      15\n",
1465 |        "28     十一  线路C      12\n",
1466 |        "29     十一  线路C      10\n",
1467 |        "30     五一  线路D       8\n",
1468 |        "31     五一  线路D       4\n",
1469 |        "32     五一  线路D       6\n",
1470 |        "33     五一  线路D       5\n",
1471 |        "34     五一  线路D       5\n",
1472 |        "35     十一  线路D       5\n",
1473 |        "36     十一  线路D       7\n",
1474 |        "37     十一  线路D       8\n",
1475 |        "38     十一  线路D       7\n",
1476 |        "39     十一  线路D       8"
1477 |       ]
1478 |      },
1479 |      "execution_count": 10,
1480 |      "metadata": {},
1481 |      "output_type": "execute_result"
1482 |     }
1483 |    ],
1484 |    "source": [
1485 |     "# 转换长表\n",
1486 |     "tourist_df_long = tourist_df_n.melt(id_vars='period' , var_name='plan' , value_name='amount')\n",
1487 |     "tourist_df_long"
1488 |    ]
1489 |   },
1490 |   {
1491 |    "cell_type": "code",
1492 |    "execution_count": 11,
1493 |    "metadata": {},
1494 |    "outputs": [
1495 |     {
1496 |      "data": {
1497 |       "text/html": [
1498 |        "<div>\n",
1499 |        "<style scoped>\n",
1500 |        "    .dataframe tbody tr th:only-of-type {\n",
1501 |        "        vertical-align: middle;\n",
1502 |        "    }\n",
1503 |        "\n",
1504 |        "    .dataframe tbody tr th {\n",
1505 |        "        vertical-align: top;\n",
1506 |        "    }\n",
1507 |        "\n",
1508 |        "    .dataframe thead th {\n",
1509 |        "        text-align: right;\n",
1510 |        "    }\n",
1511 |        "</style>\n",
1512 |        "<table border=\"1\" class=\"dataframe\">\n",
1513 |        "  <thead>\n",
1514 |        "    <tr style=\"text-align: right;\">\n",
1515 |        "      <th></th>\n",
1516 |        "      <th>df</th>\n",
1517 |        "      <th>sum_sq</th>\n",
1518 |        "      <th>mean_sq</th>\n",
1519 |        "      <th>F</th>\n",
1520 |        "      <th>PR(&gt;F)</th>\n",
1521 |        "    </tr>\n",
1522 |        "  </thead>\n",
1523 |        "  <tbody>\n",
1524 |        "    <tr>\n",
1525 |        "      <th>C(period)</th>\n",
1526 |        "      <td>1.0</td>\n",
1527 |        "      <td>119.025</td>\n",
1528 |        "      <td>119.025000</td>\n",
1529 |        "      <td>30.617363</td>\n",
1530 |        "      <td>4.208408e-06</td>\n",
1531 |        "    </tr>\n",
1532 |        "    <tr>\n",
1533 |        "      <th>C(plan)</th>\n",
1534 |        "      <td>3.0</td>\n",
1535 |        "      <td>2431.475</td>\n",
1536 |        "      <td>810.491667</td>\n",
1537 |        "      <td>208.486602</td>\n",
1538 |        "      <td>4.475032e-21</td>\n",
1539 |        "    </tr>\n",
1540 |        "    <tr>\n",
1541 |        "      <th>C(period):C(plan)</th>\n",
1542 |        "      <td>3.0</td>\n",
1543 |        "      <td>88.875</td>\n",
1544 |        "      <td>29.625000</td>\n",
1545 |        "      <td>7.620579</td>\n",
1546 |        "      <td>5.564285e-04</td>\n",
1547 |        "    </tr>\n",
1548 |        "    <tr>\n",
1549 |        "      <th>Residual</th>\n",
1550 |        "      <td>32.0</td>\n",
1551 |        "      <td>124.400</td>\n",
1552 |        "      <td>3.887500</td>\n",
1553 |        "      <td>NaN</td>\n",
1554 |        "      <td>NaN</td>\n",
1555 |        "    </tr>\n",
1556 |        "  </tbody>\n",
1557 |        "</table>\n",
1558 |        "</div>"
1559 |       ],
1560 |       "text/plain": [
1561 |        "                     df    sum_sq     mean_sq           F        PR(>F)\n",
1562 |        "C(period)           1.0   119.025  119.025000   30.617363  4.208408e-06\n",
1563 |        "C(plan)             3.0  2431.475  810.491667  208.486602  4.475032e-21\n",
1564 |        "C(period):C(plan)   3.0    88.875   29.625000    7.620579  5.564285e-04\n",
1565 |        "Residual           32.0   124.400    3.887500         NaN           NaN"
1566 |       ]
1567 |      },
1568 |      "execution_count": 11,
1569 |      "metadata": {},
1570 |      "output_type": "execute_result"
1571 |     }
1572 |    ],
1573 |    "source": [
1574 |     "tourist_lm = ols('amount~C(period)+C(plan)+C(period):C(plan)' , data=tourist_df_long).fit()\n",
1575 |     "sm.stats.anova_lm(tourist_lm) "
1576 |    ]
1577 |   },
1578 |   {
1579 |    "cell_type": "markdown",
1580 |    "metadata": {},
1581 |    "source": [
1582 |     "结论\n",
1583 |     "\n",
1584 |     "对于period因素，4.208408e-06 < 0.05 ， 拒绝原假设，即不同时期有显著影响\n",
1585 |     "\n",
1586 |     "对于plan因素，4.475032e-21 < 0.05 ， 拒绝原假设，即不同旅游路线有显著影响\n",
1587 |     "\n",
1588 |     "对于交互因素，5.564285e-04 < 0.05 ， 拒绝原假设，旅游线路与黄金周的交互作用对游客人数产生显著影响（旅游景点具有一定季节性特征，两者相互作用影响游客人数）"
1589 |    ]
1590 |   },
1591 |   {
1592 |    "cell_type": "code",
1593 |    "execution_count": null,
1594 |    "metadata": {},
1595 |    "outputs": [],
1596 |    "source": []
1597 |   }
1598 |  ],
1599 |  "metadata": {
1600 |   "kernelspec": {
1601 |    "display_name": "Python [conda env:root] *",
1602 |    "language": "python",
1603 |    "name": "conda-root-py"
1604 |   },
1605 |   "language_info": {
1606 |    "codemirror_mode": {
1607 |     "name": "ipython",
1608 |     "version": 3
1609 |    },
1610 |    "file_extension": ".py",
1611 |    "mimetype": "text/x-python",
1612 |    "name": "python",
1613 |    "nbconvert_exporter": "python",
1614 |    "pygments_lexer": "ipython3",
1615 |    "version": "3.7.5"
1616 |   }
1617 |  },
1618 |  "nbformat": 4,
1619 |  "nbformat_minor": 2
1620 | }
1621 | 


--------------------------------------------------------------------------------
/第六章 相关与回归分析/6-1.xlsx:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/AirFin/Statistics_Python_Codes/684c651552e0012d085e72301c4fd210748e4a93/第六章 相关与回归分析/6-1.xlsx


--------------------------------------------------------------------------------
/第六章 相关与回归分析/6-5.xlsx:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/AirFin/Statistics_Python_Codes/684c651552e0012d085e72301c4fd210748e4a93/第六章 相关与回归分析/6-5.xlsx


--------------------------------------------------------------------------------
/第六章 相关与回归分析/6-6.xlsx:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/AirFin/Statistics_Python_Codes/684c651552e0012d085e72301c4fd210748e4a93/第六章 相关与回归分析/6-6.xlsx


--------------------------------------------------------------------------------
/第六章 相关与回归分析/第六章 相关与回归分析.ipynb:
--------------------------------------------------------------------------------
   1 | {
   2 |  "cells": [
   3 |   {
   4 |    "cell_type": "markdown",
   5 |    "metadata": {},
   6 |    "source": [
   7 |     "# 第一节 相关分析"
   8 |    ]
   9 |   },
  10 |   {
  11 |    "cell_type": "markdown",
  12 |    "metadata": {},
  13 |    "source": [
  14 |     "## 实验6-1 计算协方差"
  15 |    ]
  16 |   },
  17 |   {
  18 |    "cell_type": "code",
  19 |    "execution_count": 1,
  20 |    "metadata": {},
  21 |    "outputs": [],
  22 |    "source": [
  23 |     "import numpy as np\n",
  24 |     "import pandas as pd "
  25 |    ]
  26 |   },
  27 |   {
  28 |    "cell_type": "code",
  29 |    "execution_count": 2,
  30 |    "metadata": {},
  31 |    "outputs": [
  32 |     {
  33 |      "data": {
  34 |       "text/html": [
  35 |        "<div>\n",
  36 |        "<style scoped>\n",
  37 |        "    .dataframe tbody tr th:only-of-type {\n",
  38 |        "        vertical-align: middle;\n",
  39 |        "    }\n",
  40 |        "\n",
  41 |        "    .dataframe tbody tr th {\n",
  42 |        "        vertical-align: top;\n",
  43 |        "    }\n",
  44 |        "\n",
  45 |        "    .dataframe thead th {\n",
  46 |        "        text-align: right;\n",
  47 |        "    }\n",
  48 |        "</style>\n",
  49 |        "<table border=\"1\" class=\"dataframe\">\n",
  50 |        "  <thead>\n",
  51 |        "    <tr style=\"text-align: right;\">\n",
  52 |        "      <th></th>\n",
  53 |        "      <th>DJIA</th>\n",
  54 |        "      <th>SPX</th>\n",
  55 |        "    </tr>\n",
  56 |        "    <tr>\n",
  57 |        "      <th>Date</th>\n",
  58 |        "      <th></th>\n",
  59 |        "      <th></th>\n",
  60 |        "    </tr>\n",
  61 |        "  </thead>\n",
  62 |        "  <tbody>\n",
  63 |        "    <tr>\n",
  64 |        "      <th>1</th>\n",
  65 |        "      <td>7715</td>\n",
  66 |        "      <td>942</td>\n",
  67 |        "    </tr>\n",
  68 |        "    <tr>\n",
  69 |        "      <th>2</th>\n",
  70 |        "      <td>7442</td>\n",
  71 |        "      <td>915</td>\n",
  72 |        "    </tr>\n",
  73 |        "    <tr>\n",
  74 |        "      <th>3</th>\n",
  75 |        "      <td>7581</td>\n",
  76 |        "      <td>928</td>\n",
  77 |        "    </tr>\n",
  78 |        "    <tr>\n",
  79 |        "      <th>4</th>\n",
  80 |        "      <td>7572</td>\n",
  81 |        "      <td>928</td>\n",
  82 |        "    </tr>\n",
  83 |        "    <tr>\n",
  84 |        "      <th>5</th>\n",
  85 |        "      <td>7881</td>\n",
  86 |        "      <td>963</td>\n",
  87 |        "    </tr>\n",
  88 |        "    <tr>\n",
  89 |        "      <th>6</th>\n",
  90 |        "      <td>7823</td>\n",
  91 |        "      <td>955</td>\n",
  92 |        "    </tr>\n",
  93 |        "    <tr>\n",
  94 |        "      <th>7</th>\n",
  95 |        "      <td>8149</td>\n",
  96 |        "      <td>984</td>\n",
  97 |        "    </tr>\n",
  98 |        "    <tr>\n",
  99 |        "      <th>8</th>\n",
 100 |        "      <td>7838</td>\n",
 101 |        "      <td>953</td>\n",
 102 |        "    </tr>\n",
 103 |        "    <tr>\n",
 104 |        "      <th>9</th>\n",
 105 |        "      <td>7756</td>\n",
 106 |        "      <td>947</td>\n",
 107 |        "    </tr>\n",
 108 |        "    <tr>\n",
 109 |        "      <th>10</th>\n",
 110 |        "      <td>7679</td>\n",
 111 |        "      <td>936</td>\n",
 112 |        "    </tr>\n",
 113 |        "  </tbody>\n",
 114 |        "</table>\n",
 115 |        "</div>"
 116 |       ],
 117 |       "text/plain": [
 118 |        "      DJIA  SPX\n",
 119 |        "Date           \n",
 120 |        "1     7715  942\n",
 121 |        "2     7442  915\n",
 122 |        "3     7581  928\n",
 123 |        "4     7572  928\n",
 124 |        "5     7881  963\n",
 125 |        "6     7823  955\n",
 126 |        "7     8149  984\n",
 127 |        "8     7838  953\n",
 128 |        "9     7756  947\n",
 129 |        "10    7679  936"
 130 |       ]
 131 |      },
 132 |      "execution_count": 2,
 133 |      "metadata": {},
 134 |      "output_type": "execute_result"
 135 |     }
 136 |    ],
 137 |    "source": [
 138 |     "index_df = pd.read_excel('6-1.xlsx', index_col=0) # 注意索引\n",
 139 |     "index_df"
 140 |    ]
 141 |   },
 142 |   {
 143 |    "cell_type": "code",
 144 |    "execution_count": 3,
 145 |    "metadata": {},
 146 |    "outputs": [
 147 |     {
 148 |      "data": {
 149 |       "text/html": [
 150 |        "<div>\n",
 151 |        "<style scoped>\n",
 152 |        "    .dataframe tbody tr th:only-of-type {\n",
 153 |        "        vertical-align: middle;\n",
 154 |        "    }\n",
 155 |        "\n",
 156 |        "    .dataframe tbody tr th {\n",
 157 |        "        vertical-align: top;\n",
 158 |        "    }\n",
 159 |        "\n",
 160 |        "    .dataframe thead th {\n",
 161 |        "        text-align: right;\n",
 162 |        "    }\n",
 163 |        "</style>\n",
 164 |        "<table border=\"1\" class=\"dataframe\">\n",
 165 |        "  <thead>\n",
 166 |        "    <tr style=\"text-align: right;\">\n",
 167 |        "      <th></th>\n",
 168 |        "      <th>DJIA</th>\n",
 169 |        "      <th>SPX</th>\n",
 170 |        "    </tr>\n",
 171 |        "  </thead>\n",
 172 |        "  <tbody>\n",
 173 |        "    <tr>\n",
 174 |        "      <th>DJIA</th>\n",
 175 |        "      <td>38937.377778</td>\n",
 176 |        "      <td>3917.155556</td>\n",
 177 |        "    </tr>\n",
 178 |        "    <tr>\n",
 179 |        "      <th>SPX</th>\n",
 180 |        "      <td>3917.155556</td>\n",
 181 |        "      <td>397.877778</td>\n",
 182 |        "    </tr>\n",
 183 |        "  </tbody>\n",
 184 |        "</table>\n",
 185 |        "</div>"
 186 |       ],
 187 |       "text/plain": [
 188 |        "              DJIA          SPX\n",
 189 |        "DJIA  38937.377778  3917.155556\n",
 190 |        "SPX    3917.155556   397.877778"
 191 |       ]
 192 |      },
 193 |      "execution_count": 3,
 194 |      "metadata": {},
 195 |      "output_type": "execute_result"
 196 |     }
 197 |    ],
 198 |    "source": [
 199 |     "# 无偏估计\n",
 200 |     "index_df.cov()"
 201 |    ]
 202 |   },
 203 |   {
 204 |    "cell_type": "code",
 205 |    "execution_count": 4,
 206 |    "metadata": {},
 207 |    "outputs": [
 208 |     {
 209 |      "data": {
 210 |       "text/plain": [
 211 |        "array([[35043.64,  3525.44],\n",
 212 |        "       [ 3525.44,   358.09]])"
 213 |       ]
 214 |      },
 215 |      "execution_count": 4,
 216 |      "metadata": {},
 217 |      "output_type": "execute_result"
 218 |     }
 219 |    ],
 220 |    "source": [
 221 |     "# 有偏估计\n",
 222 |     "np.cov(index_df.values , rowvar=False , ddof=0)"
 223 |    ]
 224 |   },
 225 |   {
 226 |    "cell_type": "markdown",
 227 |    "metadata": {},
 228 |    "source": [
 229 |     "## 实验6-2 计算相关系数"
 230 |    ]
 231 |   },
 232 |   {
 233 |    "cell_type": "markdown",
 234 |    "metadata": {},
 235 |    "source": [
 236 |     "利用实验6-1的数据"
 237 |    ]
 238 |   },
 239 |   {
 240 |    "cell_type": "code",
 241 |    "execution_count": 5,
 242 |    "metadata": {},
 243 |    "outputs": [
 244 |     {
 245 |      "data": {
 246 |       "text/html": [
 247 |        "<div>\n",
 248 |        "<style scoped>\n",
 249 |        "    .dataframe tbody tr th:only-of-type {\n",
 250 |        "        vertical-align: middle;\n",
 251 |        "    }\n",
 252 |        "\n",
 253 |        "    .dataframe tbody tr th {\n",
 254 |        "        vertical-align: top;\n",
 255 |        "    }\n",
 256 |        "\n",
 257 |        "    .dataframe thead th {\n",
 258 |        "        text-align: right;\n",
 259 |        "    }\n",
 260 |        "</style>\n",
 261 |        "<table border=\"1\" class=\"dataframe\">\n",
 262 |        "  <thead>\n",
 263 |        "    <tr style=\"text-align: right;\">\n",
 264 |        "      <th></th>\n",
 265 |        "      <th>DJIA</th>\n",
 266 |        "      <th>SPX</th>\n",
 267 |        "    </tr>\n",
 268 |        "  </thead>\n",
 269 |        "  <tbody>\n",
 270 |        "    <tr>\n",
 271 |        "      <th>DJIA</th>\n",
 272 |        "      <td>1.000000</td>\n",
 273 |        "      <td>0.995205</td>\n",
 274 |        "    </tr>\n",
 275 |        "    <tr>\n",
 276 |        "      <th>SPX</th>\n",
 277 |        "      <td>0.995205</td>\n",
 278 |        "      <td>1.000000</td>\n",
 279 |        "    </tr>\n",
 280 |        "  </tbody>\n",
 281 |        "</table>\n",
 282 |        "</div>"
 283 |       ],
 284 |       "text/plain": [
 285 |        "          DJIA       SPX\n",
 286 |        "DJIA  1.000000  0.995205\n",
 287 |        "SPX   0.995205  1.000000"
 288 |       ]
 289 |      },
 290 |      "execution_count": 5,
 291 |      "metadata": {},
 292 |      "output_type": "execute_result"
 293 |     }
 294 |    ],
 295 |    "source": [
 296 |     "# 方法1，利用pandas中的corr方法\n",
 297 |     "index_df.corr()"
 298 |    ]
 299 |   },
 300 |   {
 301 |    "cell_type": "code",
 302 |    "execution_count": 6,
 303 |    "metadata": {},
 304 |    "outputs": [
 305 |     {
 306 |      "data": {
 307 |       "text/plain": [
 308 |        "array([[1.        , 0.99520518],\n",
 309 |        "       [0.99520518, 1.        ]])"
 310 |       ]
 311 |      },
 312 |      "execution_count": 6,
 313 |      "metadata": {},
 314 |      "output_type": "execute_result"
 315 |     }
 316 |    ],
 317 |    "source": [
 318 |     "# 方法2，利numpy中的corrcoef方法\n",
 319 |     "np.corrcoef(index_df.values , rowvar=False)"
 320 |    ]
 321 |   },
 322 |   {
 323 |    "cell_type": "markdown",
 324 |    "metadata": {},
 325 |    "source": [
 326 |     "## 实验6-3 绘制相关图"
 327 |    ]
 328 |   },
 329 |   {
 330 |    "cell_type": "code",
 331 |    "execution_count": 7,
 332 |    "metadata": {},
 333 |    "outputs": [],
 334 |    "source": [
 335 |     "%matplotlib inline\n",
 336 |     "import matplotlib.pyplot as plt\n",
 337 |     "plt.rcParams['font.sans-serif'] = ['SimHei'] # 步骤一（替换sans-serif字体）\n",
 338 |     "plt.rcParams['axes.unicode_minus'] = False   # 步骤二（解决坐标轴负数的负号显示问题）\n",
 339 |     "plt.rcParams['savefig.dpi'] = 300 # 图片质量"
 340 |    ]
 341 |   },
 342 |   {
 343 |    "cell_type": "code",
 344 |    "execution_count": 9,
 345 |    "metadata": {},
 346 |    "outputs": [
 347 |     {
 348 |      "data": {
 349 |       "text/plain": [
 350 |        "<matplotlib.axes._subplots.AxesSubplot at 0x2973a7eff08>"
 351 |       ]
 352 |      },
 353 |      "execution_count": 9,
 354 |      "metadata": {},
 355 |      "output_type": "execute_result"
 356 |     },
 357 |     {
 358 |      "data": {
 359 |       "image/png": "iVBORw0KGgoAAAANSUhEUgAAAX8AAAECCAYAAAAW+Nd4AAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADh0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uMy4xLjEsIGh0dHA6Ly9tYXRwbG90bGliLm9yZy8QZhcZAAAV/klEQVR4nO3dfYxd9X3n8ff32pPxyGNgYs86wgMBhJE2m9huOyVYtpMhgmLa4ka4VXbTTaRUXjYRG9TtLri7ZWVRs5syWixFpYlw6u7SNI3WwWpp6tLQJEV4syR0jIyTTfYhbU2xN8jTYSDMYo+G3O/+cY/XY3PngXDug33eL2mUc3/33Hs/M8Gfe+7vnHtOZCaSpGqpdTqAJKn9LH9JqiDLX5IqyPKXpAqy/CWpgpZ2OsBirFq1Kq+66qpOx5CkC8rhw4f/PjMHm913QZT/VVddxdjYWKdjSNIFJSKen+s+p30kqYIsf0mqIMtfkirI8pekCrL8JamCLH9J6lITU9M898LLTExNl/7cF8ShnpJUNY8dOcHOA0fpqdWYqdcZ3b6ObRvWlPb8bvlLUpeZmJpm54GjnJ6p8+r065yeqXPPgaOlfgKw/CWpyxyfPEVP7dx67qnVOD55qrTXsPwlqcsMDfQxU6+fMzZTrzM00Ffaa1j+ktRlVvb3Mrp9Hct6aqzoXcqynhqj29exsr+3tNdwh68kdaFtG9aw6dpVHJ88xdBAX6nFD5a/JHWtlf29pZf+GU77SFIFWf6SVEGWvyRVkOUvSRVk+UtSBZVa/hFxdUQcjIhDEfFgRAxExJ9FxFhEPDxrvX0R8XRE3Fvm60uSFqfsLf8HgN2ZuQUYAj4CfCEzh4EVETEcEbcDSzJzI3BNRKwtOYMkaQFll/91wLPF8kngFeDdEXEZcAXwAjAC7C/WeQLY3OyJIuKO4hPD2Pj4eMkxJanayi7/R4FdEXEbsBV4EngncBfwPeAlYDlwolj/JWB1syfKzL2ZOZyZw4ODgyXHlKRqK/Ubvpl5f0RsBu4GHgF2AR/PzB9GxK8BHwOmgDNnJ+rHnc6S1HatKN4jwJXAHmAAeE9ELAHeCyRwmLNTPeuBYy3IIEmaRyvO7XM3sCczX4uITwH/icbUz9PAF2m84RyKiMuBW4EbWpBBkjSP0ss/M3fNWn4G+EfnrxMRI8DNwGhmvlJ2BknS/DpyVs/MnOTsET+SpDZzZ6skVZDlL0kVZPlLUgVZ/pJUQZa/JFWQ5S9JFWT5S1IFWf6SVEGWvyRVkOUvSRVk+UtSBVn+klRBlr8kVZDlL0kVZPlLUgVZ/pJUQZa/JFWQ5S9JFWT5S1IFlXoN34i4GngIuAR4Bvg+8KHi7suAb2XmP4+IfcC7gIOZeX+ZGSRJCyt7y/8BYHdmbgGGgO9l5khmjgCHgM9FxO3AkszcCFwTEWtLziBJWkDZ5X8d8GyxfBK4FCAi1gCrM3MMGAH2F+s8AWxu9kQRcUdEjEXE2Pj4eMkxJanayi7/R4FdEXEbsBX4WjF+J/DZYnk5cKJYfglY3eyJMnNvZg5n5vDg4GDJMSWp2kot/2L+/nFgB/BIZk5FRA24EXiyWG0K6CuW+8vOIElaWCuK9whwJbCnuL2Fxo7eLG4f5uxUz3rgWAsySJLmUerRPoW7gT2Z+Vpx+xbgqVn3/zFwKCIuB24FbmhBBknSPEov/8zcdd7tf3ve7R9GxAhwMzCama+UnUGSNL9WbPkvKDMnOXvEjySpzdzZKkkVZPlLUgVZ/pJUQZa/JFWQ5S9JFWT5S1IFWf6SVEGWvyRVkOUvSRVk+UtSBVn+0kVmYmqa5154mYmp6U5HURfryLl9JLXGY0dOsPPAUXpqNWbqdUa3r2PbhjWdjqUu5Ja/dJGYmJpm54GjnJ6p8+r065yeqXPPgaN+AlBTlr90kTg+eYqe2rn/pHtqNY5PnupQInUzy1+6SAwN9DFTr58zNlOvMzTQN8cjVGWWv3SRWNnfy+j2dSzrqbGidynLemqMbl/Hyv7eTkdTF3KHr3QR2bZhDZuuXcXxyVMMDfRZ/JqT5S9dZFb291r6WpDTPpJUQZa/JFVQqeUfEVdHxMGIOBQRD84a/0xE3Dbr9r6IeDoi7i3z9SVJi1P2lv8DwO7M3AIMRcRIRGwB3pGZXwaIiNuBJZm5EbgmItaWnEGStICyy/864Nli+SRwKfA54FhE/EIxPgLsL5afADY3e6KIuCMixiJibHx8vOSYklRtZZf/o8CuYopnK3AV8F1gFLg+Ij4JLAdOFOu/BKxu9kSZuTczhzNzeHBwsOSYklRtpZZ/Zt4PPA7sAB4B1gJ7M/NF4A+AG4Ep4MxXDvvLziBJWlgrivcIcCWwB/g+cE0xPgw8Dxzm7FTPeuBYCzJIkubRii953Q3syczXImIf8HsR8Y+BHuAXgVeBQxFxOXArcEMLMkiS5lF6+WfmrlnLrwK/dP46ETEC3AyMZuYrZWeQJM2vI6d3yMxJzh7xI0lqM3e2SlIFWf6SVEGWvyRVkOUvSRVk+UttNDE1zXMvvOxF1dVxXsxFapPHjpxg54Gj9NRqzNTrjG5fx7YNazodSxXllr/UBhNT0+w8cJTTM3VenX6d0zN17jlw1E8A6hjLX2qD45On6Kmd+8+tp1bj+OSpDiVS1Vn+UhsMDfQxU6+fMzZTrzM00DfHI6TWsvylNljZ38vo9nUs66mxoncpy3pqjG5f54XW1THu8JXaZNuGNWy6dhXHJ08xNNB3TvFPTE03HZdaxfKX2mhlf+8byt2jgNQJTvtIHeRRQOoUy1/qII8CUqdY/lIHeRSQOsXylzrIo4DUKe7wlTpsvqOApFax/KUu0OwoIKmV5p32iYj3NRnrjYi7WhdJktRqC8353xkRX42I90fEsoj4l8C3gOVtyCZJapF5p30y80MR8Q+Bg8Ag8CfAezOz6UHIEXE18BBwCfAMsBP4m+IH4JOZ+e2IuA/4WeCZzLyzlN9EkrRoC0377AZ+H/gtYAPwKvBERHxwjoc8AOzOzC3AEHAX8MXMHCl+vh0RPwVsBq4HTkbETSX9LpKkRVpo2ud5YGNm7s3Mv87MjwMfAW6ZY/3rgGeL5ZPAj4Cfj4hnImJfRCwF3g8cyMwEvgJsafZEEXFHRIxFxNj4+Pib/LUkSfNZqPwPAvdFxL0RsQIgM/8uMz8xx/qPArsi4jZgK403gpsy83qgh8ZUz3LgRLH+S8DqZk9UvOEMZ+bw4ODgm/qlJEnzW6j8fx/4LvAy8JmFniwz7wceB3YAj9CY0/9BcfcYsBaYAs58fbF/ERkkSSVbqHjflplfyMyHgCsW+ZxHgCuBPcDnI2J9RCwBPgg8BxymMecPsB449qZTS5LekoW+5DUYEf+ExpvEP4iID5+5IzP/cI7H3A3syczXIuI3gT8EAviTzPxqRNSAT0XEp2lMDW19y7+FJOlNWaj89wMfpjFl8yhwP9ALfJ5Gqb9BZu6atfwdYN1599eLI3x+Dvh0Zv7tj51eegu8gIqqbKHyvwb4QWbeV2ypfxP4DvDTb+VFM/MUjTcTqSO8gIqqbqHyvyIzb4yIa4EbgfWZmRHx9TZkk1pi9gVUTtM4nfI9B46y6dpVfgJQZSy0w3cyIv41jSN3dgPLI+KjrY8ltY4XUJEWLv9/SuNbvZ/KzC8B7wDeBfxyq4NJreIFVKQFyj8zX8vMhzPzT4vb38/MX5917L50wfECKpLn81dFeQEVVZ3lr8ryAiqqMk+tIEkVZPlLUgVZ/pJUQZa/JFWQ5S9JFWT5S1IFWf6SVEGWvy44E1PTPPfCy0xMTXc6inTB8kteuqB4KmapHG7564Ix+1TMr06/zumZOvccOOonAOnHYPnrguGpmKXyWP66YHgqZqk8lr8uGJ6KWSpPqTt8I+Jq4CHgEuCZzPxXxfhq4M8z8yeK2/toXBTmYGbeX2YGXdw8FbNUjrK3/B8AdmfmFmAoIkaK8f8I9AFExO3AkszcCFwTEWtLzqCL3Mr+XtZfcZnFL70FZZf/dcCzxfJJ4NKI+ADwf4EXi/ERYH+x/ASwudkTRcQdETEWEWPj4+Mlx5Skaiu7/B8FdkXEbcBW4C+Bfwf8+qx1lgMniuWXgNXNnigz92bmcGYODw4OlhxTkqqt1PIv5u8fB3YAjwC/CnwmM1+etdoUxRQQ0F92BknSwlpRvEeAK4E9wE3AnRHxJLAhIn4XOMzZqZ71wLEWZJAkzaMVp3e4G9iTma8B7zszGBFPZuaOiLgEOBQRlwO3Aje0IIMkaR6ll39m7ppjfKT43x8WRwHdDIxm5itlZ5Akza8jJ3bLzEnOHvEjSWozd7ZKUgVZ/pJUQZa/OsILskid5cVc1HZekEXqPLf81VZekEXqDpa/2soLskjdwfJXW3lBFqk7WP5qKy/IInUHd/iq7bwgi9R5lr86YmV/r6UvdZDTPpJUQZa/JFWQ5S9JFWT5S1IFWf6SVEGWvyRVkOUvSRVk+UtSBVn+klRBLS//iHh7RNwcEata/VqSpMUptfwj4uqIOBgRhyLiwYgYAP4UuB74y4gYLNbbFxFPR8S9Zb6+JGlxyj63zwPA7sz8ZkT8F+Au4NeK2wPAT0bEcmBJZm6MiN+LiLWZ+b9LziFJmkfZ0z7XAc8WyyeBI0Xxv4/G1v/TwAiwv1jnCWBzsyeKiDsiYiwixsbHx0uOKUnVVnb5PwrsiojbgK3A1yIigA8Bk8AMsBw4Uaz/ErC62RNl5t7MHM7M4cHBwZJjSlK1lVr+mXk/8DiwA3gkM6ey4U7gKLANmALOXLapv+wMkqSFtaJ4jwBXAnsiYmdEfLQYvwx4GTjM2ame9cCxFmSojImpaZ574WUmpqbPWZak+bTiYi53A3sy87WI2Avsj4gdwHdozPGvAA5FxOXArcANLchQCY8dOcHOA0fpqdU4/fqPyEz6epYyU68zun0d2zas6XRESV0qMrP9L9o48udm4KnMfHGh9YeHh3NsbKz1wS4gE1PTbHrg65yeqTe9f1lPjW/s/IBXy5IqLCIOZ+Zws/s6Mt+emZOZuX8xxa/mjk+eoqc29/99PbUaxydPtTGRpAuJO1svUEMDfczUm2/1A8zU6wwN9M15v6Rqs/wvUCv7exndvo5lPTVW9C6lZ0mwtAYrepeyrKfG6PZ1TvlImlMrdviqTbZtWMOma1dxfPLU/9/KP7Ns8Uuaj+V/gVvZ33tO0Vv6khbDaR9JqiDLX5IqyPKXpAqy/CWpgix/Saogy1+SKsjyl6QKsvwlqYIsf0mqIMtfkirI8pekCrL8JamCLH9JqiDLX5IqyPKXpAoqtfwj4uqIOBgRhyLiwYi4NCIej4gnIuKPIuJtxXr7IuLpiLi3zNeXJC1O2Vv+DwC7M3MLMAT8MrAnM38GeBHYGhG3A0sycyNwTUSsLTmDJGkBZZf/dcCzxfJJ4ERm/kVxe7AYGwH2F2NPAJtLziBJWkDZ5f8osCsibgO2Al8DiIiNwEBmfhNYDpwo1n8JWN3siSLijogYi4ix8fHxkmNKUrWVWv6ZeT/wOLADeCQzpyLi7cBvA79SrDYF9BXL/XNlyMy9mTmcmcODg4NlxpSkymvF0T5HgCuBPcUO3i8B/yYzny/uP8zZqZ71wLEWZJAkzWNpC57zbho7eV+LiE8APwn8RkT8BvBZ4I+BQxFxOXArcEMLMkiS5hGZ2f4XjRgAbgaeyswXF1p/eHg4x8bGWh9Mki4iEXE4M4eb3deKLf8FZeYkZ4/4kSS1md/wlaQKsvwlqYIsf0mqIMtfkirI8pekCrroy39iaprnXniZianpTkeRpK7RkUM92+WxIyfYeeAoPbUaM/U6o9vXsW3Dmk7HkqSOu2i3/Cemptl54CinZ+q8Ov06p2fq3HPgqJ8AJImLuPyPT56ip3bur9dTq3F88lSHEklS97hoy39ooI+Zev2csZl6naGBvjkeIUnVcdGW/8r+Xka3r2NZT40VvUtZ1lNjdPs6Vvb3djqaJHXcRb3Dd9uGNWy6dhXHJ08xNNBn8UtS4aIuf2h8ArD0JelcF+20jyRpbpa/JFWQ5S9JFWT5S1IFWf6SVEEduYbvmxUR48Dznc6xgFXA33c6xCKZtTXM2hpm/fG9MzMHm91xQZT/hSAixua6UHK3MWtrmLU1zNoaTvtIUgVZ/pJUQZZ/efZ2OsCbYNbWMGtrmLUFnPOXpApyy1+SKsjyl6QKsvwXEBGfiIgni58jEbEvIv5u1th7ivXui4i/iojfmfXYN4y1OevDxfhnIuK2Wevti4inI+Le+cbanHV6juzdmPXhiPiziBg7k7OLs34lIg5GxKGIeLDLsg6c/3dcbK4uybo6Ig7NWqcnIr4cEd+IiF+Za6xbWP4LyMzPZuZIZo4Ah4CHgS+eGcvMb0fETwGbgeuBkxFxU7OxDmT9XERsAd6RmV8GiIjbgSWZuRG4JiLWNhvrQNZNTbJ3a9YTwBeK47lXRMRwF2ftAXZn5hZgKCJGuiUr8BHO/Tves5hcXZL1p4FHgOWz1vkkcDgzNwG/GBEr5hjrCpb/IkXEGmA1MAz8fEQ8U2x9LAXeDxzIxt7zrwBb5hhrd9bngM8BxyLiF4q7R4D9xfITNN6gmo21NWtmjjW53ZVZgb8G3h0RlwFXAC90cda3A88WwyeBS+fI1Wys1SY49+949SJzdUPWk8CHgB/OWmd2rqdodEWzsa5g+S/encBngb8CbsrM62lsVf0sjXf/E8V6L9H4R9dsrN1ZPwp8FxgFro+IT3Zx1ma3uzXrfwXeCdwFfK/I0a1ZHwV2FdN+W4GvdVHW8/+Ob1tkrm7I+n8y85Xz1umWrIti+S9CRNSAG4EngaOZ+YPirjFgLTAFnLkyfD+Nv2uzsXZn/Qlgb2a+CPxBMd6tWd9wu4uz7gI+npm/CfwP4GPdmjUz7wceB3YAj2TmVBdlPf/v+OFF5uqGrB9rsk63ZF2UrgnS5bYA3yqmcD4fEesjYgnwQRpTK4c5+9FzPXBsjrF2Z/0+cE0xPkzj5HjdmrXZ7W7NOgC8p/hv4L1AdnFWgCPAlcCe4na3ZD3/7/hbi8zVDVmbfUGqW7IuTmb6s8AP8B+A24vldwNHgW8D/74YqwHfAD4N/E8ac5dvGOtA1hXAl2jMNT4NrAEuofGGtYfGx9dLm421O+sct7syK42d+P+dxlbdX9DYouvKrMXt+4CPdNvftcnfcVG5uiRrfzH+5Kx13lms82ka08NLmo2147+Bxfz4Dd+SREQf8HPAs5n5N3ONdYOIGABuBp7KxpRQ07FuYNbW6Nasi83VDVmbiYjLaWzpfyWLfQLNxrqB5S9JFeScvyRVkOUvSRVk+UtSBVn+0hwi4j8X58cZi4h/1uS+zcXyVRHx1fPu3xARf9vOvNKbsbTTAaQu9y9oHE74XER8KzOPLvJxt9A4l851mfm/WhdP+vG45S8tIDMngIPA+97Ew24BfofGKRWkrmP5S4szAVy2mBUjop/GCdV+l8abgNR1LH9pcd4OvBoR75o19qM51v0AsAp4CNgYEb2tDie9WZa/tIDiNL63AptonCwP4Coap3Ju5hbgrmycU/8gbTydt7RYlr80v98G/hzYCfwqsCMivgH8t8w8PsdjbubsmUm/jvP+6kKe3kGSKsgtf0mqIMtfkirI8pekCrL8JamCLH9JqiDLX5Iq6P8BujgOFymysqYAAAAASUVORK5CYII=\n",
 360 |       "text/plain": [
 361 |        "<Figure size 432x288 with 1 Axes>"
 362 |       ]
 363 |      },
 364 |      "metadata": {
 365 |       "needs_background": "light"
 366 |      },
 367 |      "output_type": "display_data"
 368 |     }
 369 |    ],
 370 |    "source": [
 371 |     "index_df.plot.scatter(x='DJIA',y='SPX')"
 372 |    ]
 373 |   },
 374 |   {
 375 |    "cell_type": "markdown",
 376 |    "metadata": {},
 377 |    "source": [
 378 |     "# 第二节 回归分析"
 379 |    ]
 380 |   },
 381 |   {
 382 |    "cell_type": "markdown",
 383 |    "metadata": {},
 384 |    "source": [
 385 |     "## 实验6-4 一元线性回归分析与预测"
 386 |    ]
 387 |   },
 388 |   {
 389 |    "cell_type": "markdown",
 390 |    "metadata": {},
 391 |    "source": [
 392 |     "根据实验6-1的数据，建立用DJIA预测SPX的回归模型，并预测DJIA=8300时，SPX=？"
 393 |    ]
 394 |   },
 395 |   {
 396 |    "cell_type": "code",
 397 |    "execution_count": 11,
 398 |    "metadata": {},
 399 |    "outputs": [],
 400 |    "source": [
 401 |     "from sklearn.linear_model import LinearRegression\n",
 402 |     "import statsmodels.api as sm\n",
 403 |     "import statsmodels.formula.api as smf"
 404 |    ]
 405 |   },
 406 |   {
 407 |    "cell_type": "code",
 408 |    "execution_count": 16,
 409 |    "metadata": {},
 410 |    "outputs": [
 411 |     {
 412 |      "data": {
 413 |       "text/html": [
 414 |        "<div>\n",
 415 |        "<style scoped>\n",
 416 |        "    .dataframe tbody tr th:only-of-type {\n",
 417 |        "        vertical-align: middle;\n",
 418 |        "    }\n",
 419 |        "\n",
 420 |        "    .dataframe tbody tr th {\n",
 421 |        "        vertical-align: top;\n",
 422 |        "    }\n",
 423 |        "\n",
 424 |        "    .dataframe thead th {\n",
 425 |        "        text-align: right;\n",
 426 |        "    }\n",
 427 |        "</style>\n",
 428 |        "<table border=\"1\" class=\"dataframe\">\n",
 429 |        "  <thead>\n",
 430 |        "    <tr style=\"text-align: right;\">\n",
 431 |        "      <th></th>\n",
 432 |        "      <th>const</th>\n",
 433 |        "      <th>DJIA</th>\n",
 434 |        "    </tr>\n",
 435 |        "    <tr>\n",
 436 |        "      <th>Date</th>\n",
 437 |        "      <th></th>\n",
 438 |        "      <th></th>\n",
 439 |        "    </tr>\n",
 440 |        "  </thead>\n",
 441 |        "  <tbody>\n",
 442 |        "    <tr>\n",
 443 |        "      <th>1</th>\n",
 444 |        "      <td>1.0</td>\n",
 445 |        "      <td>7715</td>\n",
 446 |        "    </tr>\n",
 447 |        "    <tr>\n",
 448 |        "      <th>2</th>\n",
 449 |        "      <td>1.0</td>\n",
 450 |        "      <td>7442</td>\n",
 451 |        "    </tr>\n",
 452 |        "    <tr>\n",
 453 |        "      <th>3</th>\n",
 454 |        "      <td>1.0</td>\n",
 455 |        "      <td>7581</td>\n",
 456 |        "    </tr>\n",
 457 |        "    <tr>\n",
 458 |        "      <th>4</th>\n",
 459 |        "      <td>1.0</td>\n",
 460 |        "      <td>7572</td>\n",
 461 |        "    </tr>\n",
 462 |        "    <tr>\n",
 463 |        "      <th>5</th>\n",
 464 |        "      <td>1.0</td>\n",
 465 |        "      <td>7881</td>\n",
 466 |        "    </tr>\n",
 467 |        "    <tr>\n",
 468 |        "      <th>6</th>\n",
 469 |        "      <td>1.0</td>\n",
 470 |        "      <td>7823</td>\n",
 471 |        "    </tr>\n",
 472 |        "    <tr>\n",
 473 |        "      <th>7</th>\n",
 474 |        "      <td>1.0</td>\n",
 475 |        "      <td>8149</td>\n",
 476 |        "    </tr>\n",
 477 |        "    <tr>\n",
 478 |        "      <th>8</th>\n",
 479 |        "      <td>1.0</td>\n",
 480 |        "      <td>7838</td>\n",
 481 |        "    </tr>\n",
 482 |        "    <tr>\n",
 483 |        "      <th>9</th>\n",
 484 |        "      <td>1.0</td>\n",
 485 |        "      <td>7756</td>\n",
 486 |        "    </tr>\n",
 487 |        "    <tr>\n",
 488 |        "      <th>10</th>\n",
 489 |        "      <td>1.0</td>\n",
 490 |        "      <td>7679</td>\n",
 491 |        "    </tr>\n",
 492 |        "  </tbody>\n",
 493 |        "</table>\n",
 494 |        "</div>"
 495 |       ],
 496 |       "text/plain": [
 497 |        "      const  DJIA\n",
 498 |        "Date             \n",
 499 |        "1       1.0  7715\n",
 500 |        "2       1.0  7442\n",
 501 |        "3       1.0  7581\n",
 502 |        "4       1.0  7572\n",
 503 |        "5       1.0  7881\n",
 504 |        "6       1.0  7823\n",
 505 |        "7       1.0  8149\n",
 506 |        "8       1.0  7838\n",
 507 |        "9       1.0  7756\n",
 508 |        "10      1.0  7679"
 509 |       ]
 510 |      },
 511 |      "execution_count": 16,
 512 |      "metadata": {},
 513 |      "output_type": "execute_result"
 514 |     }
 515 |    ],
 516 |    "source": [
 517 |     "x = index_df[['DJIA']]\n",
 518 |     "y = index_df[['SPX']]\n",
 519 |     "X = sm.add_constant(x) # 模型包含截距项，因而需要因变量矩阵增加值为1的常数列\n",
 520 |     "X"
 521 |    ]
 522 |   },
 523 |   {
 524 |    "cell_type": "code",
 525 |    "execution_count": 18,
 526 |    "metadata": {},
 527 |    "outputs": [
 528 |     {
 529 |      "data": {
 530 |       "text/plain": [
 531 |        "const    166.082832\n",
 532 |        "DJIA       0.100601\n",
 533 |        "dtype: float64"
 534 |       ]
 535 |      },
 536 |      "execution_count": 18,
 537 |      "metadata": {},
 538 |      "output_type": "execute_result"
 539 |     }
 540 |    ],
 541 |    "source": [
 542 |     "sm_model = sm.OLS(y, X)\n",
 543 |     "sm_result = sm_model.fit()\n",
 544 |     "sm_result.params"
 545 |    ]
 546 |   },
 547 |   {
 548 |    "cell_type": "markdown",
 549 |    "metadata": {},
 550 |    "source": [
 551 |     "回归直线方程为 Y = 166.082832 + 0.100601X"
 552 |    ]
 553 |   },
 554 |   {
 555 |    "cell_type": "code",
 556 |    "execution_count": 19,
 557 |    "metadata": {},
 558 |    "outputs": [
 559 |     {
 560 |      "data": {
 561 |       "text/plain": [
 562 |        "0.9904333423452636"
 563 |       ]
 564 |      },
 565 |      "execution_count": 19,
 566 |      "metadata": {},
 567 |      "output_type": "execute_result"
 568 |     }
 569 |    ],
 570 |    "source": [
 571 |     "# 计算判定系数\n",
 572 |     "sm_result.rsquared"
 573 |    ]
 574 |   },
 575 |   {
 576 |    "cell_type": "markdown",
 577 |    "metadata": {},
 578 |    "source": [
 579 |     "判定系数很大，说明模型拟合效果较好"
 580 |    ]
 581 |   },
 582 |   {
 583 |    "cell_type": "code",
 584 |    "execution_count": 20,
 585 |    "metadata": {},
 586 |    "outputs": [
 587 |     {
 588 |      "data": {
 589 |       "text/plain": [
 590 |        "array([1001.07463095])"
 591 |       ]
 592 |      },
 593 |      "execution_count": 20,
 594 |      "metadata": {},
 595 |      "output_type": "execute_result"
 596 |     }
 597 |    ],
 598 |    "source": [
 599 |     "# 进行一元线性预测\n",
 600 |     "sm_result.predict([1,8300])"
 601 |    ]
 602 |   },
 603 |   {
 604 |    "cell_type": "markdown",
 605 |    "metadata": {},
 606 |    "source": [
 607 |     "y预测当DJIA=8300时，SPX=1001.07463095"
 608 |    ]
 609 |   },
 610 |   {
 611 |    "cell_type": "code",
 612 |    "execution_count": 21,
 613 |    "metadata": {},
 614 |    "outputs": [
 615 |     {
 616 |      "data": {
 617 |       "text/plain": [
 618 |        "Intercept    166.082832\n",
 619 |        "DJIA           0.100601\n",
 620 |        "dtype: float64"
 621 |       ]
 622 |      },
 623 |      "execution_count": 21,
 624 |      "metadata": {},
 625 |      "output_type": "execute_result"
 626 |     }
 627 |    ],
 628 |    "source": [
 629 |     "# 第二种方法，用statsmodels\n",
 630 |     "sm_model = smf.ols(formula='SPX~DJIA' , data=index_df)\n",
 631 |     "sm_result = sm_model.fit()\n",
 632 |     "sm_result.params"
 633 |    ]
 634 |   },
 635 |   {
 636 |    "cell_type": "code",
 637 |    "execution_count": 22,
 638 |    "metadata": {},
 639 |    "outputs": [
 640 |     {
 641 |      "data": {
 642 |       "text/plain": [
 643 |        "0.9904333423452636"
 644 |       ]
 645 |      },
 646 |      "execution_count": 22,
 647 |      "metadata": {},
 648 |      "output_type": "execute_result"
 649 |     }
 650 |    ],
 651 |    "source": [
 652 |     "sm_result.rsquared"
 653 |    ]
 654 |   },
 655 |   {
 656 |    "cell_type": "code",
 657 |    "execution_count": 23,
 658 |    "metadata": {},
 659 |    "outputs": [
 660 |     {
 661 |      "data": {
 662 |       "text/plain": [
 663 |        "0    1001.074631\n",
 664 |        "dtype: float64"
 665 |       ]
 666 |      },
 667 |      "execution_count": 23,
 668 |      "metadata": {},
 669 |      "output_type": "execute_result"
 670 |     }
 671 |    ],
 672 |    "source": [
 673 |     "sm_result.predict(pd.DataFrame([{'DJIA':8300}]))"
 674 |    ]
 675 |   },
 676 |   {
 677 |    "cell_type": "code",
 678 |    "execution_count": 24,
 679 |    "metadata": {},
 680 |    "outputs": [
 681 |     {
 682 |      "data": {
 683 |       "text/plain": [
 684 |        "166.08283214871528"
 685 |       ]
 686 |      },
 687 |      "execution_count": 24,
 688 |      "metadata": {},
 689 |      "output_type": "execute_result"
 690 |     }
 691 |    ],
 692 |    "source": [
 693 |     "# 第三种方法，用sklearn\n",
 694 |     "sk_model = LinearRegression()\n",
 695 |     "sk_model.fit(x,y)\n",
 696 |     "sk_model.intercept_[0]"
 697 |    ]
 698 |   },
 699 |   {
 700 |    "cell_type": "code",
 701 |    "execution_count": 25,
 702 |    "metadata": {},
 703 |    "outputs": [
 704 |     {
 705 |      "data": {
 706 |       "text/plain": [
 707 |        "0.10060142154182612"
 708 |       ]
 709 |      },
 710 |      "execution_count": 25,
 711 |      "metadata": {},
 712 |      "output_type": "execute_result"
 713 |     }
 714 |    ],
 715 |    "source": [
 716 |     "sk_model.coef_[0][0]"
 717 |    ]
 718 |   },
 719 |   {
 720 |    "cell_type": "code",
 721 |    "execution_count": 27,
 722 |    "metadata": {},
 723 |    "outputs": [
 724 |     {
 725 |      "data": {
 726 |       "text/plain": [
 727 |        "0.9904333423452637"
 728 |       ]
 729 |      },
 730 |      "execution_count": 27,
 731 |      "metadata": {},
 732 |      "output_type": "execute_result"
 733 |     }
 734 |    ],
 735 |    "source": [
 736 |     "# 判定系数\n",
 737 |     "sk_model.score(x,y)"
 738 |    ]
 739 |   },
 740 |   {
 741 |    "cell_type": "code",
 742 |    "execution_count": 28,
 743 |    "metadata": {},
 744 |    "outputs": [
 745 |     {
 746 |      "data": {
 747 |       "text/plain": [
 748 |        "array([[1001.07463095]])"
 749 |       ]
 750 |      },
 751 |      "execution_count": 28,
 752 |      "metadata": {},
 753 |      "output_type": "execute_result"
 754 |     }
 755 |    ],
 756 |    "source": [
 757 |     "# 预测\n",
 758 |     "sk_model.predict([[8300]])"
 759 |    ]
 760 |   },
 761 |   {
 762 |    "cell_type": "markdown",
 763 |    "metadata": {},
 764 |    "source": [
 765 |     "## 实验6-5 多元线性回归分析和预测"
 766 |    ]
 767 |   },
 768 |   {
 769 |    "cell_type": "markdown",
 770 |    "metadata": {},
 771 |    "source": [
 772 |     "Q是因变量，其他是自变量"
 773 |    ]
 774 |   },
 775 |   {
 776 |    "cell_type": "code",
 777 |    "execution_count": 29,
 778 |    "metadata": {},
 779 |    "outputs": [
 780 |     {
 781 |      "data": {
 782 |       "text/html": [
 783 |        "<div>\n",
 784 |        "<style scoped>\n",
 785 |        "    .dataframe tbody tr th:only-of-type {\n",
 786 |        "        vertical-align: middle;\n",
 787 |        "    }\n",
 788 |        "\n",
 789 |        "    .dataframe tbody tr th {\n",
 790 |        "        vertical-align: top;\n",
 791 |        "    }\n",
 792 |        "\n",
 793 |        "    .dataframe thead th {\n",
 794 |        "        text-align: right;\n",
 795 |        "    }\n",
 796 |        "</style>\n",
 797 |        "<table border=\"1\" class=\"dataframe\">\n",
 798 |        "  <thead>\n",
 799 |        "    <tr style=\"text-align: right;\">\n",
 800 |        "      <th></th>\n",
 801 |        "      <th>Q</th>\n",
 802 |        "      <th>P</th>\n",
 803 |        "      <th>M</th>\n",
 804 |        "      <th>PAI</th>\n",
 805 |        "      <th>PBMac</th>\n",
 806 |        "    </tr>\n",
 807 |        "    <tr>\n",
 808 |        "      <th>Month</th>\n",
 809 |        "      <th></th>\n",
 810 |        "      <th></th>\n",
 811 |        "      <th></th>\n",
 812 |        "      <th></th>\n",
 813 |        "      <th></th>\n",
 814 |        "    </tr>\n",
 815 |        "  </thead>\n",
 816 |        "  <tbody>\n",
 817 |        "    <tr>\n",
 818 |        "      <th>1</th>\n",
 819 |        "      <td>1773</td>\n",
 820 |        "      <td>8.65</td>\n",
 821 |        "      <td>25500</td>\n",
 822 |        "      <td>10.55</td>\n",
 823 |        "      <td>1.25</td>\n",
 824 |        "    </tr>\n",
 825 |        "    <tr>\n",
 826 |        "      <th>2</th>\n",
 827 |        "      <td>1863</td>\n",
 828 |        "      <td>8.65</td>\n",
 829 |        "      <td>25600</td>\n",
 830 |        "      <td>10.45</td>\n",
 831 |        "      <td>1.35</td>\n",
 832 |        "    </tr>\n",
 833 |        "    <tr>\n",
 834 |        "      <th>3</th>\n",
 835 |        "      <td>1798</td>\n",
 836 |        "      <td>8.65</td>\n",
 837 |        "      <td>25700</td>\n",
 838 |        "      <td>10.35</td>\n",
 839 |        "      <td>1.55</td>\n",
 840 |        "    </tr>\n",
 841 |        "    <tr>\n",
 842 |        "      <th>4</th>\n",
 843 |        "      <td>1775</td>\n",
 844 |        "      <td>8.65</td>\n",
 845 |        "      <td>25970</td>\n",
 846 |        "      <td>10.30</td>\n",
 847 |        "      <td>1.05</td>\n",
 848 |        "    </tr>\n",
 849 |        "    <tr>\n",
 850 |        "      <th>5</th>\n",
 851 |        "      <td>1796</td>\n",
 852 |        "      <td>8.65</td>\n",
 853 |        "      <td>25970</td>\n",
 854 |        "      <td>10.30</td>\n",
 855 |        "      <td>0.95</td>\n",
 856 |        "    </tr>\n",
 857 |        "  </tbody>\n",
 858 |        "</table>\n",
 859 |        "</div>"
 860 |       ],
 861 |       "text/plain": [
 862 |        "          Q     P      M    PAI  PBMac\n",
 863 |        "Month                                 \n",
 864 |        "1      1773  8.65  25500  10.55   1.25\n",
 865 |        "2      1863  8.65  25600  10.45   1.35\n",
 866 |        "3      1798  8.65  25700  10.35   1.55\n",
 867 |        "4      1775  8.65  25970  10.30   1.05\n",
 868 |        "5      1796  8.65  25970  10.30   0.95"
 869 |       ]
 870 |      },
 871 |      "execution_count": 29,
 872 |      "metadata": {},
 873 |      "output_type": "execute_result"
 874 |     }
 875 |    ],
 876 |    "source": [
 877 |     "pi_df = pd.read_excel('6-5.xlsx', index_col=0)\n",
 878 |     "pi_df "
 879 |    ]
 880 |   },
 881 |   {
 882 |    "cell_type": "code",
 883 |    "execution_count": 33,
 884 |    "metadata": {},
 885 |    "outputs": [
 886 |     {
 887 |      "data": {
 888 |       "text/plain": [
 889 |        "Intercept     976.591186\n",
 890 |        "P            8447.513762\n",
 891 |        "M              -1.709659\n",
 892 |        "PAI         -2652.159091\n",
 893 |        "PBMac        -545.000000\n",
 894 |        "dtype: float64"
 895 |       ]
 896 |      },
 897 |      "execution_count": 33,
 898 |      "metadata": {},
 899 |      "output_type": "execute_result"
 900 |     }
 901 |    ],
 902 |    "source": [
 903 |     "pi_model = smf.ols(formula='Q ~ P + M + PAI + PBMac' , data=pi_df)\n",
 904 |     "pi_result = pi_model.fit()\n",
 905 |     "pi_result.params"
 906 |    ]
 907 |   },
 908 |   {
 909 |    "cell_type": "code",
 910 |    "execution_count": 36,
 911 |    "metadata": {},
 912 |    "outputs": [
 913 |     {
 914 |      "name": "stderr",
 915 |      "output_type": "stream",
 916 |      "text": [
 917 |       "D:\\Anaconda3\\lib\\site-packages\\statsmodels\\stats\\stattools.py:71: ValueWarning: omni_normtest is not valid with less than 8 observations; 5 samples were given.\n",
 918 |       "  \"samples were given.\" % int(n), ValueWarning)\n"
 919 |      ]
 920 |     },
 921 |     {
 922 |      "data": {
 923 |       "text/html": [
 924 |        "<table class=\"simpletable\">\n",
 925 |        "<caption>OLS Regression Results</caption>\n",
 926 |        "<tr>\n",
 927 |        "  <th>Dep. Variable:</th>            <td>Q</td>        <th>  R-squared:         </th> <td>   0.580</td>\n",
 928 |        "</tr>\n",
 929 |        "<tr>\n",
 930 |        "  <th>Model:</th>                   <td>OLS</td>       <th>  Adj. R-squared:    </th> <td>  -0.682</td>\n",
 931 |        "</tr>\n",
 932 |        "<tr>\n",
 933 |        "  <th>Method:</th>             <td>Least Squares</td>  <th>  F-statistic:       </th> <td>  0.4594</td>\n",
 934 |        "</tr>\n",
 935 |        "<tr>\n",
 936 |        "  <th>Date:</th>             <td>Thu, 13 Aug 2020</td> <th>  Prob (F-statistic):</th>  <td> 0.763</td> \n",
 937 |        "</tr>\n",
 938 |        "<tr>\n",
 939 |        "  <th>Time:</th>                 <td>10:22:41</td>     <th>  Log-Likelihood:    </th> <td> -22.362</td>\n",
 940 |        "</tr>\n",
 941 |        "<tr>\n",
 942 |        "  <th>No. Observations:</th>      <td>     5</td>      <th>  AIC:               </th> <td>   52.72</td>\n",
 943 |        "</tr>\n",
 944 |        "<tr>\n",
 945 |        "  <th>Df Residuals:</th>          <td>     1</td>      <th>  BIC:               </th> <td>   51.16</td>\n",
 946 |        "</tr>\n",
 947 |        "<tr>\n",
 948 |        "  <th>Df Model:</th>              <td>     3</td>      <th>                     </th>     <td> </td>   \n",
 949 |        "</tr>\n",
 950 |        "<tr>\n",
 951 |        "  <th>Covariance Type:</th>      <td>nonrobust</td>    <th>                     </th>     <td> </td>   \n",
 952 |        "</tr>\n",
 953 |        "</table>\n",
 954 |        "<table class=\"simpletable\">\n",
 955 |        "<tr>\n",
 956 |        "      <td></td>         <th>coef</th>     <th>std err</th>      <th>t</th>      <th>P>|t|</th>  <th>[0.025</th>    <th>0.975]</th>  \n",
 957 |        "</tr>\n",
 958 |        "<tr>\n",
 959 |        "  <th>Intercept</th> <td>  976.5912</td> <td>  911.512</td> <td>    1.071</td> <td> 0.478</td> <td>-1.06e+04</td> <td> 1.26e+04</td>\n",
 960 |        "</tr>\n",
 961 |        "<tr>\n",
 962 |        "  <th>P</th>         <td> 8447.5138</td> <td> 7884.577</td> <td>    1.071</td> <td> 0.478</td> <td>-9.17e+04</td> <td> 1.09e+05</td>\n",
 963 |        "</tr>\n",
 964 |        "<tr>\n",
 965 |        "  <th>M</th>         <td>   -1.7097</td> <td>    1.632</td> <td>   -1.047</td> <td> 0.485</td> <td>  -22.453</td> <td>   19.033</td>\n",
 966 |        "</tr>\n",
 967 |        "<tr>\n",
 968 |        "  <th>PAI</th>       <td>-2652.1591</td> <td> 2545.723</td> <td>   -1.042</td> <td> 0.487</td> <td> -3.5e+04</td> <td> 2.97e+04</td>\n",
 969 |        "</tr>\n",
 970 |        "<tr>\n",
 971 |        "  <th>PBMac</th>     <td> -545.0000</td> <td>  580.237</td> <td>   -0.939</td> <td> 0.520</td> <td>-7917.610</td> <td> 6827.610</td>\n",
 972 |        "</tr>\n",
 973 |        "</table>\n",
 974 |        "<table class=\"simpletable\">\n",
 975 |        "<tr>\n",
 976 |        "  <th>Omnibus:</th>       <td>   nan</td> <th>  Durbin-Watson:     </th> <td>   3.250</td>\n",
 977 |        "</tr>\n",
 978 |        "<tr>\n",
 979 |        "  <th>Prob(Omnibus):</th> <td>   nan</td> <th>  Jarque-Bera (JB):  </th> <td>   0.723</td>\n",
 980 |        "</tr>\n",
 981 |        "<tr>\n",
 982 |        "  <th>Skew:</th>          <td> 0.593</td> <th>  Prob(JB):          </th> <td>   0.696</td>\n",
 983 |        "</tr>\n",
 984 |        "<tr>\n",
 985 |        "  <th>Kurtosis:</th>      <td> 1.562</td> <th>  Cond. No.          </th> <td>2.10e+20</td>\n",
 986 |        "</tr>\n",
 987 |        "</table><br/><br/>Warnings:<br/>[1] Standard Errors assume that the covariance matrix of the errors is correctly specified.<br/>[2] The smallest eigenvalue is 7.55e-32. This might indicate that there are<br/>strong multicollinearity problems or that the design matrix is singular."
 988 |       ],
 989 |       "text/plain": [
 990 |        "<class 'statsmodels.iolib.summary.Summary'>\n",
 991 |        "\"\"\"\n",
 992 |        "                            OLS Regression Results                            \n",
 993 |        "==============================================================================\n",
 994 |        "Dep. Variable:                      Q   R-squared:                       0.580\n",
 995 |        "Model:                            OLS   Adj. R-squared:                 -0.682\n",
 996 |        "Method:                 Least Squares   F-statistic:                    0.4594\n",
 997 |        "Date:                Thu, 13 Aug 2020   Prob (F-statistic):              0.763\n",
 998 |        "Time:                        10:22:41   Log-Likelihood:                -22.362\n",
 999 |        "No. Observations:                   5   AIC:                             52.72\n",
1000 |        "Df Residuals:                       1   BIC:                             51.16\n",
1001 |        "Df Model:                           3                                         \n",
1002 |        "Covariance Type:            nonrobust                                         \n",
1003 |        "==============================================================================\n",
1004 |        "                 coef    std err          t      P>|t|      [0.025      0.975]\n",
1005 |        "------------------------------------------------------------------------------\n",
1006 |        "Intercept    976.5912    911.512      1.071      0.478   -1.06e+04    1.26e+04\n",
1007 |        "P           8447.5138   7884.577      1.071      0.478   -9.17e+04    1.09e+05\n",
1008 |        "M             -1.7097      1.632     -1.047      0.485     -22.453      19.033\n",
1009 |        "PAI        -2652.1591   2545.723     -1.042      0.487    -3.5e+04    2.97e+04\n",
1010 |        "PBMac       -545.0000    580.237     -0.939      0.520   -7917.610    6827.610\n",
1011 |        "==============================================================================\n",
1012 |        "Omnibus:                          nan   Durbin-Watson:                   3.250\n",
1013 |        "Prob(Omnibus):                    nan   Jarque-Bera (JB):                0.723\n",
1014 |        "Skew:                           0.593   Prob(JB):                        0.696\n",
1015 |        "Kurtosis:                       1.562   Cond. No.                     2.10e+20\n",
1016 |        "==============================================================================\n",
1017 |        "\n",
1018 |        "Warnings:\n",
1019 |        "[1] Standard Errors assume that the covariance matrix of the errors is correctly specified.\n",
1020 |        "[2] The smallest eigenvalue is 7.55e-32. This might indicate that there are\n",
1021 |        "strong multicollinearity problems or that the design matrix is singular.\n",
1022 |        "\"\"\""
1023 |       ]
1024 |      },
1025 |      "execution_count": 36,
1026 |      "metadata": {},
1027 |      "output_type": "execute_result"
1028 |     }
1029 |    ],
1030 |    "source": [
1031 |     "pi_result.summary()"
1032 |    ]
1033 |   },
1034 |   {
1035 |    "cell_type": "raw",
1036 |    "metadata": {},
1037 |    "source": [
1038 |     "注意，看第二个表格中的 coef 与 t 列，\n",
1039 |     "回归方程为 Q = 976.5912 + 8447.5138P -1.7097M -2652.1591PAI -545.0000PBMac\n",
1040 |     "           (1.071)   (1.071)    (-1.047)   (-1.042）  (-0.939)"
1041 |    ]
1042 |   },
1043 |   {
1044 |    "cell_type": "code",
1045 |    "execution_count": 37,
1046 |    "metadata": {},
1047 |    "outputs": [
1048 |     {
1049 |      "data": {
1050 |       "text/html": [
1051 |        "<div>\n",
1052 |        "<style scoped>\n",
1053 |        "    .dataframe tbody tr th:only-of-type {\n",
1054 |        "        vertical-align: middle;\n",
1055 |        "    }\n",
1056 |        "\n",
1057 |        "    .dataframe tbody tr th {\n",
1058 |        "        vertical-align: top;\n",
1059 |        "    }\n",
1060 |        "\n",
1061 |        "    .dataframe thead th {\n",
1062 |        "        text-align: right;\n",
1063 |        "    }\n",
1064 |        "</style>\n",
1065 |        "<table border=\"1\" class=\"dataframe\">\n",
1066 |        "  <thead>\n",
1067 |        "    <tr style=\"text-align: right;\">\n",
1068 |        "      <th></th>\n",
1069 |        "      <th>Q</th>\n",
1070 |        "      <th>P</th>\n",
1071 |        "      <th>M</th>\n",
1072 |        "      <th>PAI</th>\n",
1073 |        "      <th>PBMac</th>\n",
1074 |        "    </tr>\n",
1075 |        "  </thead>\n",
1076 |        "  <tbody>\n",
1077 |        "    <tr>\n",
1078 |        "      <th>Q</th>\n",
1079 |        "      <td>1.000000</td>\n",
1080 |        "      <td>NaN</td>\n",
1081 |        "      <td>-0.285999</td>\n",
1082 |        "      <td>0.135738</td>\n",
1083 |        "      <td>0.343973</td>\n",
1084 |        "    </tr>\n",
1085 |        "    <tr>\n",
1086 |        "      <th>P</th>\n",
1087 |        "      <td>NaN</td>\n",
1088 |        "      <td>NaN</td>\n",
1089 |        "      <td>NaN</td>\n",
1090 |        "      <td>NaN</td>\n",
1091 |        "      <td>NaN</td>\n",
1092 |        "    </tr>\n",
1093 |        "    <tr>\n",
1094 |        "      <th>M</th>\n",
1095 |        "      <td>-0.285999</td>\n",
1096 |        "      <td>NaN</td>\n",
1097 |        "      <td>1.000000</td>\n",
1098 |        "      <td>-0.930529</td>\n",
1099 |        "      <td>-0.683977</td>\n",
1100 |        "    </tr>\n",
1101 |        "    <tr>\n",
1102 |        "      <th>PAI</th>\n",
1103 |        "      <td>0.135738</td>\n",
1104 |        "      <td>NaN</td>\n",
1105 |        "      <td>-0.930529</td>\n",
1106 |        "      <td>1.000000</td>\n",
1107 |        "      <td>0.376746</td>\n",
1108 |        "    </tr>\n",
1109 |        "    <tr>\n",
1110 |        "      <th>PBMac</th>\n",
1111 |        "      <td>0.343973</td>\n",
1112 |        "      <td>NaN</td>\n",
1113 |        "      <td>-0.683977</td>\n",
1114 |        "      <td>0.376746</td>\n",
1115 |        "      <td>1.000000</td>\n",
1116 |        "    </tr>\n",
1117 |        "  </tbody>\n",
1118 |        "</table>\n",
1119 |        "</div>"
1120 |       ],
1121 |       "text/plain": [
1122 |        "              Q   P         M       PAI     PBMac\n",
1123 |        "Q      1.000000 NaN -0.285999  0.135738  0.343973\n",
1124 |        "P           NaN NaN       NaN       NaN       NaN\n",
1125 |        "M     -0.285999 NaN  1.000000 -0.930529 -0.683977\n",
1126 |        "PAI    0.135738 NaN -0.930529  1.000000  0.376746\n",
1127 |        "PBMac  0.343973 NaN -0.683977  0.376746  1.000000"
1128 |       ]
1129 |      },
1130 |      "execution_count": 37,
1131 |      "metadata": {},
1132 |      "output_type": "execute_result"
1133 |     }
1134 |    ],
1135 |    "source": [
1136 |     "# 单相关系数\n",
1137 |     "pi_df.corr()"
1138 |    ]
1139 |   },
1140 |   {
1141 |    "cell_type": "code",
1142 |    "execution_count": 38,
1143 |    "metadata": {},
1144 |    "outputs": [
1145 |     {
1146 |      "data": {
1147 |       "text/plain": [
1148 |        "Intercept     976.591186\n",
1149 |        "P            8447.513762\n",
1150 |        "M              -1.709659\n",
1151 |        "PAI         -2652.159091\n",
1152 |        "PBMac        -545.000000\n",
1153 |        "dtype: float64"
1154 |       ]
1155 |      },
1156 |      "execution_count": 38,
1157 |      "metadata": {},
1158 |      "output_type": "execute_result"
1159 |     }
1160 |    ],
1161 |    "source": [
1162 |     "# 偏相关系数\n",
1163 |     "pi_model_m = smf.ols(formula='Q ~ P + M + PAI + PBMac' , data=pi_df)\n",
1164 |     "pi_result_m = pi_model_m.fit()\n",
1165 |     "pi_result_m.params"
1166 |    ]
1167 |   },
1168 |   {
1169 |    "cell_type": "code",
1170 |    "execution_count": 39,
1171 |    "metadata": {},
1172 |    "outputs": [
1173 |     {
1174 |      "name": "stderr",
1175 |      "output_type": "stream",
1176 |      "text": [
1177 |       "D:\\Anaconda3\\lib\\site-packages\\ipykernel_launcher.py:2: RuntimeWarning: invalid value encountered in sqrt\n",
1178 |       "  \n"
1179 |      ]
1180 |     },
1181 |     {
1182 |      "data": {
1183 |       "text/plain": [
1184 |        "nan"
1185 |       ]
1186 |      },
1187 |      "execution_count": 39,
1188 |      "metadata": {},
1189 |      "output_type": "execute_result"
1190 |     }
1191 |    ],
1192 |    "source": [
1193 |     "# Q与M的偏相关系数为\n",
1194 |     "np.sqrt(pi_result.params[2] * pi_result_m.params[1])"
1195 |    ]
1196 |   },
1197 |   {
1198 |    "cell_type": "markdown",
1199 |    "metadata": {},
1200 |    "source": [
1201 |     "这一部分由于数据不全以及未提及虚拟变量，多重共线性等较深入内容，这一部分暂写至此，日后进行补充整理"
1202 |    ]
1203 |   },
1204 |   {
1205 |    "cell_type": "markdown",
1206 |    "metadata": {},
1207 |    "source": [
1208 |     "## 实验6-6 非线性回归分析"
1209 |    ]
1210 |   },
1211 |   {
1212 |    "cell_type": "code",
1213 |    "execution_count": null,
1214 |    "metadata": {},
1215 |    "outputs": [],
1216 |    "source": [
1217 |     "建立指数回归模型 Y = β0 β1 ^ x"
1218 |    ]
1219 |   },
1220 |   {
1221 |    "cell_type": "code",
1222 |    "execution_count": 40,
1223 |    "metadata": {},
1224 |    "outputs": [
1225 |     {
1226 |      "data": {
1227 |       "text/html": [
1228 |        "<div>\n",
1229 |        "<style scoped>\n",
1230 |        "    .dataframe tbody tr th:only-of-type {\n",
1231 |        "        vertical-align: middle;\n",
1232 |        "    }\n",
1233 |        "\n",
1234 |        "    .dataframe tbody tr th {\n",
1235 |        "        vertical-align: top;\n",
1236 |        "    }\n",
1237 |        "\n",
1238 |        "    .dataframe thead th {\n",
1239 |        "        text-align: right;\n",
1240 |        "    }\n",
1241 |        "</style>\n",
1242 |        "<table border=\"1\" class=\"dataframe\">\n",
1243 |        "  <thead>\n",
1244 |        "    <tr style=\"text-align: right;\">\n",
1245 |        "      <th></th>\n",
1246 |        "      <th>Q</th>\n",
1247 |        "      <th>Month</th>\n",
1248 |        "      <th>Q1</th>\n",
1249 |        "    </tr>\n",
1250 |        "  </thead>\n",
1251 |        "  <tbody>\n",
1252 |        "    <tr>\n",
1253 |        "      <th>0</th>\n",
1254 |        "      <td>33100</td>\n",
1255 |        "      <td>1</td>\n",
1256 |        "      <td>10.407289</td>\n",
1257 |        "    </tr>\n",
1258 |        "    <tr>\n",
1259 |        "      <th>1</th>\n",
1260 |        "      <td>47300</td>\n",
1261 |        "      <td>2</td>\n",
1262 |        "      <td>10.764266</td>\n",
1263 |        "    </tr>\n",
1264 |        "    <tr>\n",
1265 |        "      <th>2</th>\n",
1266 |        "      <td>69000</td>\n",
1267 |        "      <td>3</td>\n",
1268 |        "      <td>11.141862</td>\n",
1269 |        "    </tr>\n",
1270 |        "    <tr>\n",
1271 |        "      <th>3</th>\n",
1272 |        "      <td>102000</td>\n",
1273 |        "      <td>4</td>\n",
1274 |        "      <td>11.532728</td>\n",
1275 |        "    </tr>\n",
1276 |        "    <tr>\n",
1277 |        "      <th>4</th>\n",
1278 |        "      <td>150000</td>\n",
1279 |        "      <td>5</td>\n",
1280 |        "      <td>11.918391</td>\n",
1281 |        "    </tr>\n",
1282 |        "    <tr>\n",
1283 |        "      <th>5</th>\n",
1284 |        "      <td>220000</td>\n",
1285 |        "      <td>6</td>\n",
1286 |        "      <td>12.301383</td>\n",
1287 |        "    </tr>\n",
1288 |        "  </tbody>\n",
1289 |        "</table>\n",
1290 |        "</div>"
1291 |       ],
1292 |       "text/plain": [
1293 |        "        Q  Month         Q1\n",
1294 |        "0   33100      1  10.407289\n",
1295 |        "1   47300      2  10.764266\n",
1296 |        "2   69000      3  11.141862\n",
1297 |        "3  102000      4  11.532728\n",
1298 |        "4  150000      5  11.918391\n",
1299 |        "5  220000      6  12.301383"
1300 |       ]
1301 |      },
1302 |      "execution_count": 40,
1303 |      "metadata": {},
1304 |      "output_type": "execute_result"
1305 |     }
1306 |    ],
1307 |    "source": [
1308 |     "ma_df = pd.read_excel('6-6.xlsx')\n",
1309 |     "ma_df"
1310 |    ]
1311 |   },
1312 |   {
1313 |    "cell_type": "code",
1314 |    "execution_count": 42,
1315 |    "metadata": {},
1316 |    "outputs": [
1317 |     {
1318 |      "data": {
1319 |       "text/html": [
1320 |        "<div>\n",
1321 |        "<style scoped>\n",
1322 |        "    .dataframe tbody tr th:only-of-type {\n",
1323 |        "        vertical-align: middle;\n",
1324 |        "    }\n",
1325 |        "\n",
1326 |        "    .dataframe tbody tr th {\n",
1327 |        "        vertical-align: top;\n",
1328 |        "    }\n",
1329 |        "\n",
1330 |        "    .dataframe thead th {\n",
1331 |        "        text-align: right;\n",
1332 |        "    }\n",
1333 |        "</style>\n",
1334 |        "<table border=\"1\" class=\"dataframe\">\n",
1335 |        "  <thead>\n",
1336 |        "    <tr style=\"text-align: right;\">\n",
1337 |        "      <th></th>\n",
1338 |        "      <th>Q</th>\n",
1339 |        "      <th>Month</th>\n",
1340 |        "      <th>Q1</th>\n",
1341 |        "    </tr>\n",
1342 |        "  </thead>\n",
1343 |        "  <tbody>\n",
1344 |        "    <tr>\n",
1345 |        "      <th>0</th>\n",
1346 |        "      <td>33100</td>\n",
1347 |        "      <td>1</td>\n",
1348 |        "      <td>10.407289</td>\n",
1349 |        "    </tr>\n",
1350 |        "    <tr>\n",
1351 |        "      <th>1</th>\n",
1352 |        "      <td>47300</td>\n",
1353 |        "      <td>2</td>\n",
1354 |        "      <td>10.764266</td>\n",
1355 |        "    </tr>\n",
1356 |        "    <tr>\n",
1357 |        "      <th>2</th>\n",
1358 |        "      <td>69000</td>\n",
1359 |        "      <td>3</td>\n",
1360 |        "      <td>11.141862</td>\n",
1361 |        "    </tr>\n",
1362 |        "    <tr>\n",
1363 |        "      <th>3</th>\n",
1364 |        "      <td>102000</td>\n",
1365 |        "      <td>4</td>\n",
1366 |        "      <td>11.532728</td>\n",
1367 |        "    </tr>\n",
1368 |        "    <tr>\n",
1369 |        "      <th>4</th>\n",
1370 |        "      <td>150000</td>\n",
1371 |        "      <td>5</td>\n",
1372 |        "      <td>11.918391</td>\n",
1373 |        "    </tr>\n",
1374 |        "    <tr>\n",
1375 |        "      <th>5</th>\n",
1376 |        "      <td>220000</td>\n",
1377 |        "      <td>6</td>\n",
1378 |        "      <td>12.301383</td>\n",
1379 |        "    </tr>\n",
1380 |        "  </tbody>\n",
1381 |        "</table>\n",
1382 |        "</div>"
1383 |       ],
1384 |       "text/plain": [
1385 |        "        Q  Month         Q1\n",
1386 |        "0   33100      1  10.407289\n",
1387 |        "1   47300      2  10.764266\n",
1388 |        "2   69000      3  11.141862\n",
1389 |        "3  102000      4  11.532728\n",
1390 |        "4  150000      5  11.918391\n",
1391 |        "5  220000      6  12.301383"
1392 |       ]
1393 |      },
1394 |      "execution_count": 42,
1395 |      "metadata": {},
1396 |      "output_type": "execute_result"
1397 |     }
1398 |    ],
1399 |    "source": [
1400 |     "# 先进性线性化得到线性模型： lnY = lnβ0 + lnβ1 X\n",
1401 |     "ma_df.loc[:,'Q1'] = np.log(ma_df['Q'])\n",
1402 |     "ma_df"
1403 |    ]
1404 |   },
1405 |   {
1406 |    "cell_type": "code",
1407 |    "execution_count": 43,
1408 |    "metadata": {},
1409 |    "outputs": [
1410 |     {
1411 |      "data": {
1412 |       "text/plain": [
1413 |        "Intercept    10.011948\n",
1414 |        "Month         0.380678\n",
1415 |        "dtype: float64"
1416 |       ]
1417 |      },
1418 |      "execution_count": 43,
1419 |      "metadata": {},
1420 |      "output_type": "execute_result"
1421 |     }
1422 |    ],
1423 |    "source": [
1424 |     "ma_model = smf.ols(formula='Q1 ~ Month' , data=ma_df)\n",
1425 |     "ma_result = ma_model.fit()\n",
1426 |     "ma_result.params"
1427 |    ]
1428 |   },
1429 |   {
1430 |    "cell_type": "code",
1431 |    "execution_count": 45,
1432 |    "metadata": {},
1433 |    "outputs": [
1434 |     {
1435 |      "data": {
1436 |       "text/plain": [
1437 |        "22291.22329846538"
1438 |       ]
1439 |      },
1440 |      "execution_count": 45,
1441 |      "metadata": {},
1442 |      "output_type": "execute_result"
1443 |     }
1444 |    ],
1445 |    "source": [
1446 |     "np.power(np.e , ma_result.params[0])"
1447 |    ]
1448 |   },
1449 |   {
1450 |    "cell_type": "code",
1451 |    "execution_count": 46,
1452 |    "metadata": {},
1453 |    "outputs": [
1454 |     {
1455 |      "data": {
1456 |       "text/plain": [
1457 |        "1.4632756281161763"
1458 |       ]
1459 |      },
1460 |      "execution_count": 46,
1461 |      "metadata": {},
1462 |      "output_type": "execute_result"
1463 |     }
1464 |    ],
1465 |    "source": [
1466 |     "np.power(np.e , ma_result.params[1])"
1467 |    ]
1468 |   },
1469 |   {
1470 |    "cell_type": "markdown",
1471 |    "metadata": {},
1472 |    "source": [
1473 |     "lnβ0 估计值为 10.011948\n",
1474 |     "\n",
1475 |     "lnβ1 估计值为 0.380678\n",
1476 |     "\n",
1477 |     "β0 估计值为 22291.22329846538\n",
1478 |     "\n",
1479 |     "β1 估计值为 1.4632756281161763\n",
1480 |     "\n",
1481 |     "模型为 Y = 22291.22329846538 × 1.4632756281161763^x"
1482 |    ]
1483 |   },
1484 |   {
1485 |    "cell_type": "markdown",
1486 |    "metadata": {},
1487 |    "source": [
1488 |     "## 总结"
1489 |    ]
1490 |   },
1491 |   {
1492 |    "cell_type": "markdown",
1493 |    "metadata": {},
1494 |    "source": [
1495 |     "这一章篇幅较短，还有很多详细的深入的内容可以介绍，日后慢慢完善。"
1496 |    ]
1497 |   }
1498 |  ],
1499 |  "metadata": {
1500 |   "kernelspec": {
1501 |    "display_name": "Python [conda env:root] *",
1502 |    "language": "python",
1503 |    "name": "conda-root-py"
1504 |   },
1505 |   "language_info": {
1506 |    "codemirror_mode": {
1507 |     "name": "ipython",
1508 |     "version": 3
1509 |    },
1510 |    "file_extension": ".py",
1511 |    "mimetype": "text/x-python",
1512 |    "name": "python",
1513 |    "nbconvert_exporter": "python",
1514 |    "pygments_lexer": "ipython3",
1515 |    "version": "3.7.5"
1516 |   }
1517 |  },
1518 |  "nbformat": 4,
1519 |  "nbformat_minor": 2
1520 | }
1521 | 


--------------------------------------------------------------------------------
/第四章 参数估计与假设检验/4-10.xlsx:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/AirFin/Statistics_Python_Codes/684c651552e0012d085e72301c4fd210748e4a93/第四章 参数估计与假设检验/4-10.xlsx


--------------------------------------------------------------------------------
/第四章 参数估计与假设检验/4-13.xlsx:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/AirFin/Statistics_Python_Codes/684c651552e0012d085e72301c4fd210748e4a93/第四章 参数估计与假设检验/4-13.xlsx


--------------------------------------------------------------------------------
/第四章 参数估计与假设检验/4-14.xlsx:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/AirFin/Statistics_Python_Codes/684c651552e0012d085e72301c4fd210748e4a93/第四章 参数估计与假设检验/4-14.xlsx


--------------------------------------------------------------------------------
/第四章 参数估计与假设检验/4-15.xlsx:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/AirFin/Statistics_Python_Codes/684c651552e0012d085e72301c4fd210748e4a93/第四章 参数估计与假设检验/4-15.xlsx


--------------------------------------------------------------------------------
/第四章 参数估计与假设检验/4-16.xlsx:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/AirFin/Statistics_Python_Codes/684c651552e0012d085e72301c4fd210748e4a93/第四章 参数估计与假设检验/4-16.xlsx


--------------------------------------------------------------------------------
/第四章 参数估计与假设检验/4-17.xlsx:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/AirFin/Statistics_Python_Codes/684c651552e0012d085e72301c4fd210748e4a93/第四章 参数估计与假设检验/4-17.xlsx


--------------------------------------------------------------------------------
/第四章 参数估计与假设检验/4-18.xlsx:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/AirFin/Statistics_Python_Codes/684c651552e0012d085e72301c4fd210748e4a93/第四章 参数估计与假设检验/4-18.xlsx


--------------------------------------------------------------------------------
/第四章 参数估计与假设检验/4-19.xlsx:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/AirFin/Statistics_Python_Codes/684c651552e0012d085e72301c4fd210748e4a93/第四章 参数估计与假设检验/4-19.xlsx


--------------------------------------------------------------------------------
/第四章 参数估计与假设检验/4-2.xlsx:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/AirFin/Statistics_Python_Codes/684c651552e0012d085e72301c4fd210748e4a93/第四章 参数估计与假设检验/4-2.xlsx


--------------------------------------------------------------------------------
/第四章 参数估计与假设检验/4-6.xlsx:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/AirFin/Statistics_Python_Codes/684c651552e0012d085e72301c4fd210748e4a93/第四章 参数估计与假设检验/4-6.xlsx


--------------------------------------------------------------------------------
/第四章 参数估计与假设检验/4-7.xlsx:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/AirFin/Statistics_Python_Codes/684c651552e0012d085e72301c4fd210748e4a93/第四章 参数估计与假设检验/4-7.xlsx


--------------------------------------------------------------------------------
/第四章 参数估计与假设检验/4-9.xlsx:
--------------------------------------------------------------------------------
https://raw.githubusercontent.com/AirFin/Statistics_Python_Codes/684c651552e0012d085e72301c4fd210748e4a93/第四章 参数估计与假设检验/4-9.xlsx


--------------------------------------------------------------------------------