\n",
267 | "$\\overline{X}-z_{\\frac{\\alpha}{2}}\\dfrac{\\sigma}{\\sqrt{n}}<\\mu<\\overline{X}+z_{\\frac{\\alpha}{2}}\\dfrac{\\sigma}{\\sqrt{n}}$"
268 | ]
269 | },
270 | {
271 | "cell_type": "markdown",
272 | "metadata": {},
273 | "source": [
274 | "$(1-\\alpha) = \\text{nível de confiança}$"
275 | ]
276 | },
277 | {
278 | "cell_type": "markdown",
279 | "metadata": {},
280 | "source": [
281 | "$\\text{IC} \\left(\\mu; 1-\\alpha\\right)= \\left[\\overline{X}-z_{\\frac{\\alpha}{2}}\\dfrac{\\sigma}{\\sqrt{n}};\\overline{X}+z_{\\frac{\\alpha}{2}}\\dfrac{\\sigma}{\\sqrt{n}}\\right]$"
282 | ]
283 | },
284 | {
285 | "cell_type": "markdown",
286 | "metadata": {},
287 | "source": [
288 | "Limites do intervalo de confiança:"
289 | ]
290 | },
291 | {
292 | "cell_type": "markdown",
293 | "metadata": {},
294 | "source": [
295 | "* Limite Inferior: $\\overline{X}-z_{\\frac{\\alpha}{2}}\\dfrac{\\sigma}{\\sqrt{n}}$\n",
296 | "* Limite Superior:$\\overline{X}+z_{\\frac{\\alpha}{2}}\\dfrac{\\sigma}{\\sqrt{n}}$"
297 | ]
298 | },
299 | {
300 | "cell_type": "markdown",
301 | "metadata": {},
302 | "source": [
303 | "Amplitude do intervalo de confiança:"
304 | ]
305 | },
306 | {
307 | "cell_type": "markdown",
308 | "metadata": {},
309 | "source": [
310 | "$A = LS-LI = \\left(\\overline{X}-z_{\\frac{\\alpha}{2}}\\dfrac{\\sigma}{\\sqrt{n}}\\right)-\\left(\\overline{X}+z_{\\frac{\\alpha}{2}}\\dfrac{\\sigma}{\\sqrt{n}}\\right) = 2 \\left(z_{\\frac{\\alpha}{2}} \\dfrac{\\sigma}{\\sqrt{n}}\\right)$"
311 | ]
312 | },
313 | {
314 | "cell_type": "markdown",
315 | "metadata": {},
316 | "source": [
317 | "Intepretação:"
318 | ]
319 | },
320 | {
321 | "cell_type": "markdown",
322 | "metadata": {},
323 | "source": [
324 | "* Obtemos várias amostras de mesmo tamanho;\n",
325 | "* Para cada uma das amostras calculamos os IC correspondentes $1-\\alpha$;\n",
326 | "* A proporção de intervalos que deverão conter o valor da média populacional será igual a $1-\\alpha$."
327 | ]
328 | },
329 | {
330 | "cell_type": "markdown",
331 | "metadata": {},
332 | "source": [
333 | "Exemplo: Suponha que tenhamos obtido um intervalo de 95% de confiança ($\\text{IC}(\\mu) = [\\overline{X}_{LI},\\overline{X}_{LS}]$). A interpretação correta seria: temos 95% de confiança de que o intervalo entre o limite inferior e o limite superior contém a média populacional $\\mu$."
334 | ]
335 | },
336 | {
337 | "cell_type": "markdown",
338 | "metadata": {},
339 | "source": [
340 | "Note ainda que se aumentarmos o tamanho da amostra $n$ aumentaremos a precisão do intervalo, com efeito teremos uma redução do erro."
341 | ]
342 | },
343 | {
344 | "cell_type": "markdown",
345 | "metadata": {},
346 | "source": [
347 | "Q6 - 2004"
348 | ]
349 | },
350 | {
351 | "cell_type": "markdown",
352 | "metadata": {},
353 | "source": [
354 | "Seja $X$ uma variável aleatória normalmente distribuída com média $\\mu$ e variância conhe-\n",
355 | "cida $\\sigma^2 =1$, da qual se obtém a amostra aleatória $X_1 , X_2 , \\dots, X_n$ (com $n$ observações). É\n",
356 | "correto afirmar que:"
357 | ]
358 | },
359 | {
360 | "cell_type": "markdown",
361 | "metadata": {},
362 | "source": [
363 | "0 - A média amostral é uma variável aleatória normalmente distribuída com média μ e\n",
364 | "variância $1/n$.
\n",
365 | "1 - A probabilidade de o intervalo de confiança $[\\overline{X}- 1,96 \\sqrt{n} , \\overline{X}+ 1,96\\sqrt{n} ]$ conter a média da população, $\\mu$, é de 95%.
\n",
366 | "2 - A probabilidade de o intervalo de confiança $[\\overline{X}- 1,96 \\sqrt{n} , \\overline{X}+ 1,96\\sqrt{n} ]$ conter a média amostral, $\\mu$, é de 95%.
\n",
367 | "3 - O intervalo de 95% para a média populacional independe do tamanho da amostra.
\n",
368 | "4- Em um intervalo de confiança de 95% para a média populacional, μ, espera-se que,\n",
369 | "extraindo-se todas as amostras de mesmo tamanho dessa população, esse intervalo\n",
370 | "conterá μ 95% das vezes."
371 | ]
372 | },
373 | {
374 | "cell_type": "markdown",
375 | "metadata": {},
376 | "source": [
377 | "0 - (V)
\n",
378 | "Lembre que: $\\overline{X} \\sim \\left(\\mu,\\dfrac{\\sigma^2}{n}\\right)$
\n",
379 | "$\\mathrm{E}(\\overline{X}) = \\mathrm{E}\\left(\\dfrac{\\sum_{i=1}^{n}X_i}{n}\\right) = \\dfrac{1}{n}\\mathrm{E}\\left(\\sum_{i=1}^{n}X_i\\right) = \\dfrac{1}{n}\\left[\\sum_{i=1}^{n}\\mathrm{E}(X_i)\\right] = \\dfrac{1}{n}n\\mu = \\mu$"
380 | ]
381 | },
382 | {
383 | "cell_type": "markdown",
384 | "metadata": {},
385 | "source": [
386 | "$\\mathrm{Var}(\\overline{X}) = \\mathrm{Var}\\left(\\dfrac{\\sum_{i=1}^{n}X_i}{n}\\right) = \\dfrac{1}{n^2}\\mathrm{Var}\\left(\\sum_{i=1}^{n}X_i\\right) = \\dfrac{1}{n^2} \\sum_{i=1}^{n} \\mathrm{Var}(X_i) = \\dfrac{1}{n^2}n\\sigma^2=\\dfrac{\\sigma^2}{n}$"
387 | ]
388 | },
389 | {
390 | "cell_type": "markdown",
391 | "metadata": {},
392 | "source": [
393 | "Do enunciado temos que $\\sigma^2 = 1$, então: $\\mathrm{Var}(\\overline{X}) = \\dfrac{1}{n}$."
394 | ]
395 | },
396 | {
397 | "cell_type": "markdown",
398 | "metadata": {},
399 | "source": [
400 | "1 - (F)
\n",
401 | "Do que vimos anteriormente:
\n",
402 | "$P(\\overline{X}-1,96\\dfrac{1}{\\sqrt{n}}<\\mu<\\overline{X}+1,96\\dfrac{1}{\\sqrt{n}}) = 0.95$"
403 | ]
404 | },
405 | {
406 | "cell_type": "markdown",
407 | "metadata": {},
408 | "source": [
409 | "Além do que, a interpretação do item acerca do Intervalo de Confiança é incorreta. Uma interpretação mais adequada seria imaginarmos que, se repetirmos a amostragem de $n$ dessas observações (número infitino), em 95% dessas repetições o intervalo de confiança conteria o valor verdadeiro da média populaiconal."
410 | ]
411 | },
412 | {
413 | "cell_type": "markdown",
414 | "metadata": {},
415 | "source": [
416 | "2 - (F)
\n",
417 | "Novamente a interpretação é incorreta e o intervalo é construído para a média amostral."
418 | ]
419 | },
420 | {
421 | "cell_type": "markdown",
422 | "metadata": {},
423 | "source": [
424 | "3 - (F)
\n",
425 | "Note que quanto maior o tamanho da amostra $n$, menor será o intervalo de confiança."
426 | ]
427 | },
428 | {
429 | "cell_type": "markdown",
430 | "metadata": {},
431 | "source": [
432 | "4 - (V)"
433 | ]
434 | },
435 | {
436 | "cell_type": "markdown",
437 | "metadata": {},
438 | "source": [
439 | "Fixação"
440 | ]
441 | },
442 | {
443 | "cell_type": "markdown",
444 | "metadata": {},
445 | "source": [
446 | "Exemplo extraído do Sartoris (2013, p. 195):"
447 | ]
448 | },
449 | {
450 | "cell_type": "markdown",
451 | "metadata": {},
452 | "source": [
453 | "Após entrevistar 49 membros de uma categoria profissional, um pesquisador encontrou um salário médio de 820,00. O desvio padrão dos salários dessa categoria, conhecido, é 140,00. Construa um intervalo de confiança para a média:\n",
454 | "a) com 80% de confiança;\n",
455 | "b) com 90% de confiança."
456 | ]
457 | },
458 | {
459 | "cell_type": "markdown",
460 | "metadata": {},
461 | "source": [
462 | "Intervalo de confiança para a média com variância desconhecida"
463 | ]
464 | },
465 | {
466 | "cell_type": "markdown",
467 | "metadata": {},
468 | "source": [
469 | "Teremos duas possibilidades a depender do tamanho da amostra."
470 | ]
471 | },
472 | {
473 | "cell_type": "markdown",
474 | "metadata": {},
475 | "source": [
476 | "(1) Para $n<30$ teremos:"
477 | ]
478 | },
479 | {
480 | "cell_type": "markdown",
481 | "metadata": {},
482 | "source": [
483 | "Vamos considerar uma amostra aleatória tal que $X_1, X_2, \\dots , X_n$ obtida de uma população normal com média conhecida, mas variância desconhecida. Então temos que:"
484 | ]
485 | },
486 | {
487 | "cell_type": "markdown",
488 | "metadata": {},
489 | "source": [
490 | "$\\overline{X}\\sim T = \\dfrac{\\overline{X}-\\mu}{\\dfrac{S}{\\sqrt{n}}} \\sim t$ com $n-1$ graus de liberdade."
491 | ]
492 | },
493 | {
494 | "cell_type": "markdown",
495 | "metadata": {},
496 | "source": [
497 | "Então temos que:"
498 | ]
499 | },
500 | {
501 | "cell_type": "markdown",
502 | "metadata": {},
503 | "source": [
504 | "$P\\left(\\overline{X}-t_{\\frac{\\alpha}{2},n-1}\\dfrac{S}{\\sqrt{n}}<\\mu<\\overline{X}+t_{\\frac{\\alpha}{2},n-1}\\dfrac{S}{\\sqrt{n}}\\right) = 1-\\alpha$"
505 | ]
506 | },
507 | {
508 | "cell_type": "markdown",
509 | "metadata": {},
510 | "source": [
511 | "$\\text{IC}\\left(\\mu,1-\\alpha\\right) = \\left[\\overline{X}-t_{\\frac{\\alpha}{2}}\\dfrac{S}{\\sqrt{n}};\\overline{X}+t_{\\frac{\\alpha}{2}}\\dfrac{S}{\\sqrt{n}}\\right]$"
512 | ]
513 | },
514 | {
515 | "cell_type": "markdown",
516 | "metadata": {},
517 | "source": [
518 | "(2) Para $n>30$ teremos:"
519 | ]
520 | },
521 | {
522 | "cell_type": "markdown",
523 | "metadata": {},
524 | "source": [
525 | "$\\overline{X} \\sim Z =\\dfrac{\\overline{X}-\\mu}{\\sqrt{\\dfrac{S^2}{n}}} =\\dfrac{\\overline{X}-\\mu}{\\dfrac{S}{\\sqrt{n}}} \\sim N(0,1)$"
526 | ]
527 | },
528 | {
529 | "cell_type": "markdown",
530 | "metadata": {},
531 | "source": [
532 | "$P\\left(\\overline{X}-Z_{\\frac{\\alpha}{2}} \\dfrac{S}{\\sqrt{n}}<\\mu<\\overline{X}+Z_{\\frac{\\alpha}{2}}\\dfrac{S}{\\sqrt{n}}\\right) =1-\\alpha$"
533 | ]
534 | },
535 | {
536 | "cell_type": "markdown",
537 | "metadata": {},
538 | "source": [
539 | "Observações e definições:"
540 | ]
541 | },
542 | {
543 | "cell_type": "markdown",
544 | "metadata": {},
545 | "source": [
546 | "* Margem de erro: $e = Z_{\\frac{\\alpha}{2}} \\dfrac{\\sigma}{\\sqrt{n}}$. Neste caso estamos assumindo que a população seja infinita ou que a amostragem seja feita com reposição (o que significa que nossa população seja grande).\n",
547 | "* Se a população for finita e a amostragem feita sem reposição: $e = Z_{\\frac{\\alpha}{2}} \\dfrac{\\sigma}{\\sqrt{n}}\\sqrt{\\dfrac{N-n}{n-1}}$. Em que: $N$ é o tamanho da população (finita) e $n$ é o tamanho da amostra. "
548 | ]
549 | },
550 | {
551 | "cell_type": "markdown",
552 | "metadata": {},
553 | "source": [
554 | "Intervalo de confiança para a proporção"
555 | ]
556 | },
557 | {
558 | "cell_type": "markdown",
559 | "metadata": {},
560 | "source": [
561 | "Lembre que: $X \\sim \\text{Bernoulli}(p) \\Rightarrow E(X) = p \\text{ e } Var(X) = p(1-p)$"
562 | ]
563 | },
564 | {
565 | "cell_type": "markdown",
566 | "metadata": {},
567 | "source": [
568 | "$\\hat{p} \\sim N\\left(p, \\dfrac{p(1-p)}{n}\\right)$"
569 | ]
570 | },
571 | {
572 | "cell_type": "markdown",
573 | "metadata": {},
574 | "source": [
575 | "$P\\left(\\hat{p}-Z_{\\frac{\\alpha}{2}}\\sqrt{\\dfrac{\\hat{p}\\left(1-\\hat{p}\\right)}{n}}\n",
36 | "$H_a : \\theta \\neq \\theta_0 $"
37 | ]
38 | },
39 | {
40 | "cell_type": "markdown",
41 | "metadata": {},
42 | "source": [
43 | "Monocaudal:"
44 | ]
45 | },
46 | {
47 | "cell_type": "markdown",
48 | "metadata": {},
49 | "source": [
50 | "$H_0: \\theta = \\theta_0$
\n",
51 | "$H_a : \\theta < \\theta_0 $"
52 | ]
53 | },
54 | {
55 | "cell_type": "markdown",
56 | "metadata": {},
57 | "source": [
58 | "$H_0: \\theta = \\theta_0$
\n",
59 | "$H_a : \\theta > \\theta_0 $"
60 | ]
61 | },
62 | {
63 | "cell_type": "markdown",
64 | "metadata": {},
65 | "source": [
66 | "A altura média dos jogadores de basquete que disputam uma determinada liga é 1,95 m. Numa amostra de 36 jogadores, foi encontrada uma média de 1,93 m. Sabe-se que o desvio padrão da altura dos jogadores é 12 cm. Teste, com um nível de significância de 10%, se a afirmação é verdadeira."
67 | ]
68 | },
69 | {
70 | "cell_type": "markdown",
71 | "metadata": {},
72 | "source": [
73 | "$H_0: \\mu = 1,95$
\n",
74 | "$H_a : \\mu \\neq 1,95 $"
75 | ]
76 | },
77 | {
78 | "cell_type": "markdown",
79 | "metadata": {},
80 | "source": [
81 | "Conhecida a distribuição de probabilidade, vamos construir o intervalo de confiança supondo que a hipótese nula seja verdadeira e contenha 90% dos possíveis valores amostrais."
82 | ]
83 | },
84 | {
85 | "cell_type": "markdown",
86 | "metadata": {},
87 | "source": [
88 | "$\\dfrac{|\\overline{X}-\\mu|}{\\sigma_{\\overline{X}}} = 1,645$"
89 | ]
90 | },
91 | {
92 | "cell_type": "markdown",
93 | "metadata": {},
94 | "source": [
95 | "$\\sigma_{\\overline{X}} = \\dfrac{\\sigma}{\\sqrt{n}} = \\dfrac{0,12}{\\sqrt{36}} = 0,02$"
96 | ]
97 | },
98 | {
99 | "cell_type": "markdown",
100 | "metadata": {},
101 | "source": [
102 | "$\\dfrac{|\\overline{X}-\\mu|}{0,02} = 1,645$"
103 | ]
104 | },
105 | {
106 | "cell_type": "markdown",
107 | "metadata": {},
108 | "source": [
109 | "Região de aceitação: os valores que podem ocorrer numa amostra de 36 jogadores, com 90% de probabilidade, estão entre 1,95+0,033 e 1,95-0,033. \n",
110 | "* Se o valor amostral estiver nesse intervalo, então aceitamos a hipótese nula."
111 | ]
112 | },
113 | {
114 | "cell_type": "markdown",
115 | "metadata": {},
116 | "source": [
117 | "$RA = [1,917;1,983]$"
118 | ]
119 | },
120 | {
121 | "cell_type": "markdown",
122 | "metadata": {},
123 | "source": [
124 | "O valor amostral foi 1,93, então aceitamos a hipótese nula."
125 | ]
126 | },
127 | {
128 | "cell_type": "markdown",
129 | "metadata": {},
130 | "source": [
131 | "Em uma amostra com 100 famílias em uma cidade do interior, foi encontrada uma renda média de 580,00 reais. Segundo o prefeito, esta pesquisa está errada, pois a renda média em sua cidade é de, no mínimo, 650 reais. Teste a afirmação do prefeito com 10% de significância, sabendo-se que o desvio padrão da renda é de 120,00 reais."
132 | ]
133 | },
134 | {
135 | "cell_type": "markdown",
136 | "metadata": {},
137 | "source": [
138 | "Temos então um teste monocaudal:"
139 | ]
140 | },
141 | {
142 | "cell_type": "markdown",
143 | "metadata": {},
144 | "source": [
145 | "$H_0: \\mu = 650$
\n",
146 | "$H_a : \\mu < 650 $"
147 | ]
148 | },
149 | {
150 | "cell_type": "markdown",
151 | "metadata": {},
152 | "source": [
153 | "$\\dfrac{|\\overline{X}-\\mu|}{\\sigma_{\\overline{X}}} = 1,28$
\n",
154 | "$\\sigma_{\\overline{X}} = \\dfrac{\\sigma}{\\sqrt{n}} = \\dfrac{120}{\\sqrt{100}} = 12$
\n",
155 | "$\\dfrac{|\\overline{X}-650|}{12} = 1,28$"
156 | ]
157 | },
158 | {
159 | "cell_type": "markdown",
160 | "metadata": {},
161 | "source": [
162 | "$RA = [634,36;\\infty]$"
163 | ]
164 | },
165 | {
166 | "cell_type": "markdown",
167 | "metadata": {},
168 | "source": [
169 | "Portanto, a hipótese nula não aceita."
170 | ]
171 | },
172 | {
173 | "cell_type": "markdown",
174 | "metadata": {},
175 | "source": [
176 | "Fez-se um estudo sobre aluguéis em dois bairros, A e B. No primeiro, em 12 residências, o aluguel médio encontrado foi de 330,00 reais. No segundo, em 19 residências, aluguel médio foi de 280,00 reais. Sabe-se que o desvio padrão dos aluguéis no bairro A é 50 reais e no bairro B é 40 reais. Afirma-se que os aluguéis médios são iguais nos dois bairros. Teste a afirmação com 10% de significância."
177 | ]
178 | },
179 | {
180 | "cell_type": "markdown",
181 | "metadata": {},
182 | "source": [
183 | "Vamos assumir que as variáveis sejam independentes."
184 | ]
185 | },
186 | {
187 | "cell_type": "markdown",
188 | "metadata": {},
189 | "source": [
190 | "$H_0: \\mu_A = \\mu_B$
\n",
191 | "$H_a: \\mu_A \\neq \\mu_B$ "
192 | ]
193 | },
194 | {
195 | "cell_type": "markdown",
196 | "metadata": {},
197 | "source": [
198 | "$H_0: \\mu_A - \\mu_B = 0$
\n",
199 | "$H_a: \\mu_A - \\mu_B \\neq 0$ "
200 | ]
201 | },
202 | {
203 | "cell_type": "markdown",
204 | "metadata": {},
205 | "source": [
206 | "Definimos então $Y = X_A-X_B$."
207 | ]
208 | },
209 | {
210 | "cell_type": "markdown",
211 | "metadata": {},
212 | "source": [
213 | "$\\mathrm{Var(Y)} = \\mathrm{Var(X_A-X_B)} =\\mathrm{Var(X_A)}+\\mathrm{Var(X_B)}-2\\mathrm{cov(X_A,X_B)}$
\n",
214 | "$\\mathrm{Var(Y)} = \\mathrm{Var(X_A-X_B)} = \\mathrm{Var(\\overline{X}_A)}+\\mathrm{Var(\\overline{X}_B)}$
\n",
215 | "$\\mathrm{Var(\\overline{Y})} = \\mathrm{Var(\\overline{X}_A)}+\\mathrm{Var(\\overline{X}_B)}$
\n",
216 | "$\\mathrm{Var(\\overline{X}_A)} = \\dfrac{50^2}{12} \\cong 208,33$
\n",
217 | "$\\mathrm{Var(\\overline{X}_B)} = \\dfrac{40^2}{19} \\cong 84,21$"
218 | ]
219 | },
220 | {
221 | "cell_type": "markdown",
222 | "metadata": {},
223 | "source": [
224 | "$\\mathrm{Var(\\overline{Y})} \\cong = 292,54$
\n",
225 | "$\\sigma_{\\overline{Y}} = \\sqrt{\\mathrm{Var(\\overline{Y})}} \\cong 17,10$
\n",
226 | "$\\dfrac{|\\overline{Y}-0 |}{17,1} = 1,645$
\n",
227 | "$|\\overline{Y}-0| = 28,13$"
228 | ]
229 | },
230 | {
231 | "cell_type": "markdown",
232 | "metadata": {},
233 | "source": [
234 | "Lembrando que $Y = X_A-X_B = 330-280 = 50$"
235 | ]
236 | },
237 | {
238 | "cell_type": "markdown",
239 | "metadata": {},
240 | "source": [
241 | "$RA = [-28,13;28,13]$"
242 | ]
243 | },
244 | {
245 | "cell_type": "markdown",
246 | "metadata": {},
247 | "source": [
248 | "O valor não está contido dentro da região de aceitação, portanto a hipótese nula não é aceita."
249 | ]
250 | },
251 | {
252 | "cell_type": "markdown",
253 | "metadata": {},
254 | "source": [
255 | "#### Testando a variância"
256 | ]
257 | },
258 | {
259 | "cell_type": "markdown",
260 | "metadata": {},
261 | "source": [
262 | "Antes tínhamos um procedimento de fazer um teste para a média, visto que não conhecíamos seu verdadeiro valor populacional. O desvio-padrão era conhecido."
263 | ]
264 | },
265 | {
266 | "cell_type": "markdown",
267 | "metadata": {},
268 | "source": [
269 | "Sabemos que a variância amostral é definida como:"
270 | ]
271 | },
272 | {
273 | "cell_type": "markdown",
274 | "metadata": {},
275 | "source": [
276 | "$S^2 = \\dfrac{\\sum_{i=1}^{n}\\left(X_i-\\overline{X}\\right)^2}{n-1}$"
277 | ]
278 | },
279 | {
280 | "cell_type": "markdown",
281 | "metadata": {},
282 | "source": [
283 | "$\\left(n-1\\right)S^2 = \\sum_{i=1}^{n}\\left(X_i-\\overline{X}\\right)^2$"
284 | ]
285 | },
286 | {
287 | "cell_type": "markdown",
288 | "metadata": {},
289 | "source": [
290 | "Vamos dividir por $\\sigma^2$:"
291 | ]
292 | },
293 | {
294 | "cell_type": "markdown",
295 | "metadata": {},
296 | "source": [
297 | "$\\left(n-1\\right)\\dfrac{S^2 }{\\sigma^2}= \\sum_{i=1}^{n}\\dfrac{\\left(X_i-\\overline{X}\\right)^2}{\\sigma^2}$"
298 | ]
299 | },
300 | {
301 | "cell_type": "markdown",
302 | "metadata": {},
303 | "source": [
304 | "$\\left(n-1\\right)\\dfrac{S^2 }{\\sigma^2}= \\sum_{i=1}^{n}\\left(\\dfrac{X_i-\\overline{X}}{\\sigma}\\right)^2$"
305 | ]
306 | },
307 | {
308 | "cell_type": "markdown",
309 | "metadata": {},
310 | "source": [
311 | "A expressão em parênteses será uma normal padronizada se tivermos a média populacional no lugar da média amostral."
312 | ]
313 | },
314 | {
315 | "cell_type": "markdown",
316 | "metadata": {},
317 | "source": [
318 | "Podemos escrever:"
319 | ]
320 | },
321 | {
322 | "cell_type": "markdown",
323 | "metadata": {},
324 | "source": [
325 | "$\\sum_{i=1}^{n}\\left(X_i-\\overline{X}\\right)^2 = \\sum_{i=1}^{n}\\left(X_i-\\mu+\\mu-\\overline{X}\\right)^2$
\n",
326 | "$\\sum_{i=1}^{n}\\left(X_i-\\overline{X}\\right)^2 = \\sum_{i=1}^{n}\\left(X_i-\\mu\\right)^2-\\sum_{i=1}^{n}\\left(\\overline{X}-\\mu\\right)^2$"
327 | ]
328 | },
329 | {
330 | "cell_type": "markdown",
331 | "metadata": {},
332 | "source": [
333 | "$\\therefore \\sum_{i=1}^{n}\\left(X_i-\\overline{X}\\right)^2 = \\sum_{i=1}^{n}\\left(X_i-\\mu\\right)^2-n\\left(\\overline{X}-\\mu\\right)^2$"
334 | ]
335 | },
336 | {
337 | "cell_type": "markdown",
338 | "metadata": {},
339 | "source": [
340 | "Então:"
341 | ]
342 | },
343 | {
344 | "cell_type": "markdown",
345 | "metadata": {},
346 | "source": [
347 | "$(n-1)\\dfrac{S^2}{\\sigma^2} = \\sum_{i=1}^{n}\\left(\\dfrac{X_i-\\mu}{\\sigma}\\right)^2-n\\left(\\dfrac{\\overline{X}-\\mu}{\\sigma}\\right)^2$"
348 | ]
349 | },
350 | {
351 | "cell_type": "markdown",
352 | "metadata": {},
353 | "source": [
354 | "No lado direito da expressão anterior temos um somatório de $n$ variáveis normais padronizadas, menos uma outra variável normal padronizada ($\\overline{X}$ que tem média $\\mu$ e desvio-padrão $\\frac{\\sigma}{\\sqrt{n}}$). Desta forma, temos uma soma de $n-1$ variáveis normais padronizadas. Sabemos que a distribuição $\\chi^2$ é a distribuição de uma variável que é a soma de variáveis normais padronizadas."
355 | ]
356 | },
357 | {
358 | "cell_type": "markdown",
359 | "metadata": {},
360 | "source": [
361 | "$(n-1)\\dfrac{S^2}{\\sigma^2} \\sim \\chi_{(n-1)}^2$"
362 | ]
363 | },
364 | {
365 | "cell_type": "markdown",
366 | "metadata": {},
367 | "source": [
368 | "Numa determinada empresa, empregados que desempenham a mesma função têm salários diferentes em função do tempo de casa de bonificações por desempenho. Segunda a empresa, o desvio-padrão para o salário de uma certa função é de 150,00 reais. Entrevistando cinco funcionários que desempenham essa função, verificou-se que seus salários eram respectivamente, 1.000,00 , 1.200,00, 1.500,00, 1.300,00 e 900,00. Testemos a afirmação da empresa com significância de 5%, supondo que os salários sejam normalmente distribúidos. A hipótese apresentada pela empresa é de que o desvio-padrão é 150, portanto, a variância é $150^2 = 22.500$."
369 | ]
370 | },
371 | {
372 | "cell_type": "markdown",
373 | "metadata": {},
374 | "source": [
375 | "$H_0: \\sigma^2 = 22.500$
\n",
376 | "$H_a: \\sigma^2 \\neq 22.500$ "
377 | ]
378 | },
379 | {
380 | "cell_type": "markdown",
381 | "metadata": {},
382 | "source": [
383 | "$(n-1) = 5-1 = 4$"
384 | ]
385 | },
386 | {
387 | "cell_type": "markdown",
388 | "metadata": {},
389 | "source": [
390 | "$RA = [0,48,11,14]$"
391 | ]
392 | },
393 | {
394 | "cell_type": "markdown",
395 | "metadata": {},
396 | "source": [
397 | "$\\overline{X} = 1180$"
398 | ]
399 | },
400 | {
401 | "cell_type": "markdown",
402 | "metadata": {},
403 | "source": [
404 | "$S^2=\\dfrac{(1000-1180)^2+(1200-1180)^2+(1500-1180)^2+(1300-1180)^2+(900-1180)^2}{4}=57.000$"
405 | ]
406 | },
407 | {
408 | "cell_type": "markdown",
409 | "metadata": {},
410 | "source": [
411 | "$S^2 = 57.000$"
412 | ]
413 | },
414 | {
415 | "cell_type": "markdown",
416 | "metadata": {},
417 | "source": [
418 | "$(n-1)\\dfrac{S^2}{\\sigma^2} = 4 \\times \\dfrac{57.000}{22.500} \\cong 10,13$"
419 | ]
420 | },
421 | {
422 | "cell_type": "markdown",
423 | "metadata": {},
424 | "source": [
425 | "A hipótese nula é aceita,pois o valor está dentro da região de aceitação. Desta forma, aceitamos a hipótese nula para um nível de 5% de significância."
426 | ]
427 | },
428 | {
429 | "cell_type": "markdown",
430 | "metadata": {},
431 | "source": [
432 | "Uma caixa de fósforos de certa marca vem com a inscrição: 'Contém, em média, 40 palitos'. Segundo a fabricante, o desvio-padrão é de, no máximo, dois palitos. Em uma amostra com 51 caixas, entretando, foi encontrado um desvio-padrão amostral de três palitos. Supondo que o número de palitos por caixa seja uma variável normal, testemos a afirmativa do fabricante utilizando um nível de significância de 1%."
433 | ]
434 | },
435 | {
436 | "cell_type": "markdown",
437 | "metadata": {},
438 | "source": [
439 | "Temos então um teste de comparação entre variâncias monocaudal."
440 | ]
441 | },
442 | {
443 | "cell_type": "markdown",
444 | "metadata": {},
445 | "source": [
446 | "$H_0:\\sigma^2 = 4$
\n",
447 | "$H_a:\\sigma^2 > 4$
\n"
448 | ]
449 | },
450 | {
451 | "cell_type": "markdown",
452 | "metadata": {},
453 | "source": [
454 | "$(n-1)\\dfrac{S^2}{\\sigma^2} = (51-1)\\times \\dfrac{3^2}{2^2} = 112,5$"
455 | ]
456 | },
457 | {
458 | "cell_type": "markdown",
459 | "metadata": {},
460 | "source": [
461 | "$RA = [0;76,15]$"
462 | ]
463 | },
464 | {
465 | "cell_type": "markdown",
466 | "metadata": {},
467 | "source": [
468 | "Rejeitamos a hipótese nula com nível de significância de 1%."
469 | ]
470 | },
471 | {
472 | "cell_type": "markdown",
473 | "metadata": {},
474 | "source": [
475 | "Testando a média quando a variância é desconhecida"
476 | ]
477 | },
478 | {
479 | "cell_type": "markdown",
480 | "metadata": {},
481 | "source": [
482 | "A variância populacional $\\sigma^2$ não é conhecida e, portanto, só é possível obter $S^2$. Neste caso da expressão:"
483 | ]
484 | },
485 | {
486 | "cell_type": "markdown",
487 | "metadata": {},
488 | "source": [
489 | "$\\dfrac{|\\overline{X}-\\mu|}{\\frac{\\sigma}{\\sqrt{n}}}$"
490 | ]
491 | },
492 | {
493 | "cell_type": "markdown",
494 | "metadata": {},
495 | "source": [
496 | "Usaremos:"
497 | ]
498 | },
499 | {
500 | "cell_type": "markdown",
501 | "metadata": {},
502 | "source": [
503 | "$\\dfrac{|\\overline{X}-\\mu|}{\\frac{S}{\\sqrt{n}}}$"
504 | ]
505 | },
506 | {
507 | "cell_type": "markdown",
508 | "metadata": {},
509 | "source": [
510 | "Vamos dividir esta expressão por $\\sigma$:"
511 | ]
512 | },
513 | {
514 | "cell_type": "markdown",
515 | "metadata": {},
516 | "source": [
517 | "$\\sqrt{n}\\dfrac{\\dfrac{|\\overline{X}-\\mu|}{\\sigma}}{\\dfrac{S}{\\sigma}}$"
518 | ]
519 | },
520 | {
521 | "cell_type": "markdown",
522 | "metadata": {},
523 | "source": [
524 | "Sabemos que:"
525 | ]
526 | },
527 | {
528 | "cell_type": "markdown",
529 | "metadata": {},
530 | "source": [
531 | "$\\dfrac{|\\overline{X}-\\mu|}{\\dfrac{S}{\\sqrt{n}}} \\sim t_{(n-1)} \\text{ Distribuição t de Student}$"
532 | ]
533 | },
534 | {
535 | "cell_type": "markdown",
536 | "metadata": {},
537 | "source": [
538 | "#### Erro de poder de um teste"
539 | ]
540 | },
541 | {
542 | "cell_type": "markdown",
543 | "metadata": {},
544 | "source": [
545 | "* Erro tipo I: ocorre quando rejeitamos a hipótese nula quando ela é verdadeira (condenar um inocente).\n",
546 | "* Erro tipo II: aceitamos a hipótese nula quando ela é falsa (absolver um culpado)."
547 | ]
548 | },
549 | {
550 | "cell_type": "markdown",
551 | "metadata": {},
552 | "source": [
553 | "$P(\\text{erro do tipo I}) = \\alpha = \\text{significância do teste}$, a significância do teste é definida a priori."
554 | ]
555 | },
556 | {
557 | "cell_type": "markdown",
558 | "metadata": {},
559 | "source": [
560 | "Poder de um teste é a probabilidade de não cometer o erro do tipo II, ou seja, a probabilidade de rejeitar a hipótese nula quando ela é falsa."
561 | ]
562 | },
563 | {
564 | "cell_type": "markdown",
565 | "metadata": {},
566 | "source": [
567 | "$\\text{Poder do teste} = 1-\\beta, \\beta = P(\\text{erro do tipo II})$"
568 | ]
569 | },
570 | {
571 | "cell_type": "markdown",
572 | "metadata": {},
573 | "source": [
574 | "# Questões ANPEC"
575 | ]
576 | },
577 | {
578 | "cell_type": "markdown",
579 | "metadata": {},
580 | "source": [
581 | "Q5-2003
\n",
582 | "Com relação a testes de hipótese, é correto afirmar que:
\n",
583 | "1 - O nível de significância de um teste é a probabilidade de se cometer o erro tipo I.
\n",
584 | "2 - A potência do teste é a probabilidade de se cometer o erro tipo II.
\n",
585 | "4- O nível de significância de um teste de hipótese cresce com o tamanho da amostra."
586 | ]
587 | },
588 | {
589 | "cell_type": "markdown",
590 | "metadata": {},
591 | "source": [
592 | "1 - (V) É exatamente a definição que vimos anteriormente.
\n",
593 | "2 - (F) Vimos antes que $\\text{Poder do teste} = 1-\\beta$.
\n",
594 | "4 - (F) É definido a priori."
595 | ]
596 | },
597 | {
598 | "cell_type": "markdown",
599 | "metadata": {},
600 | "source": [
601 | "Q6-2005
\n",
602 | "Seja $X_1 , X_2 , X_3 ,\\dots, X_n$ uma amostra aleatória de tamanho $n$ de uma população normal com média $\\mu$ e variância $\\sigma^2$ . Julgue as afirmativas:"
603 | ]
604 | },
605 | {
606 | "cell_type": "markdown",
607 | "metadata": {},
608 | "source": [
609 | "0 - A probabilidade de a média populacional, $\\mu$, estar contida no intervalo de confiança $\\left[\\overline{X}-1,96\\dfrac{\\sigma}{\\sqrt{n}},\\overline{X}+1,96\\dfrac{\\sigma}{\\sqrt{n}}\\right]$ é igual a 95%.
\n",
610 | "1 - Se a variância $\\sigma^2$ é desconhecida, o intervalo de confiança de 95% para a média $\\mu$ será $\\left[\\overline{X}-t_c\\dfrac{s}{\\sqrt{n}},\\overline{X}+t_c\\dfrac{s}{\\sqrt{n}}\\right]$, em que $s$ é o desvio padrão da amostra, $t_c$ é calculado de forma que $P(|t|\n",
611 | "2 - Se construirmos vários intervalos de confiança para a média $\\mu$ com amostras de idêntico tamanho, mesma variância $\\sigma^2$ e mesma margem de confiança, estes terão extremos aleatórios, mas todos terão a mesma amplitude.
\n",
612 | "3 - Num teste de hipótese: $H_0 : \\mu = \\mu_0$ contra $H_a : \\mu \\neq \\mu_0$ , se o intervalo de confiança\n",
613 | "estimado para a média $\\mu$ não contiver o valor de $\\mu_0$ , então deve-se aceitar a hipótese de que $\\mu = \\mu_0 $.
\n",
614 | "4 - Se a amostra aleatória $X_1 , X_2 , X_3 ,\\dots, X_n$ não provém de uma distribuição normal, não se pode construir um intervalo de confiança para a média $\\mu$, ainda que a amostra seja muito grande.
"
615 | ]
616 | },
617 | {
618 | "cell_type": "markdown",
619 | "metadata": {},
620 | "source": [
621 | "0 - (F) Note que a interpretação do IC não está correta.
\n",
622 | "1 - (V)
\n",
623 | "2 - (V) Ilustra a essência do que fazemos ao construir um IC.
\n",
624 | "3 - (F) Não devemos aceitar $\\mu = \\mu_0$.
\n",
625 | "4 - (F) $\\overline{X} \\sim N(\\mu,\\frac{\\sigma^2}{n})$."
626 | ]
627 | },
628 | {
629 | "cell_type": "markdown",
630 | "metadata": {},
631 | "source": [
632 | "Q6-2004
\n",
633 | "Com relação a testes de hipóteses, julgue as afirmativas:
\n",
634 | "0 - Em um teste de hipóteses, comete-se um erro do tipo I quando se rejeita uma hipótese nula verdadeira.
\n",
635 | "1 - O poder de um teste de hipóteses é medido pela probabilidade de se cometer o erro tipo II.
\n",
636 | "2 - A soma das probabilidades dos erros tipo I e tipo II é igual a 1.
\n",
637 | "3 - Quanto maior for o nível de significância de um teste de hipóteses maior será o valor-p a ele associado.
\n",
638 | "4 - Se o valor-p de um teste de hipóteses for igual 0,015, a hipótese nula será rejeitada a 5%, mas não a 1%.
"
639 | ]
640 | },
641 | {
642 | "cell_type": "markdown",
643 | "metadata": {},
644 | "source": [
645 | "Q11-2007
\n",
646 | "Julgue as afirmativas:
\n",
647 | "0 - O valor p de um teste de hipótese é a probabilidade de a hipótese nula ser rejeitada.
\n",
648 | "1 - O poder de um teste de hipótese é a probabilidade de se rejeitar corretamente uma hipótese nula falsa.
"
649 | ]
650 | },
651 | {
652 | "cell_type": "markdown",
653 | "metadata": {},
654 | "source": [
655 | "Q4 - 2008
\n",
656 | "A respeito de testes de hipótese, é correto afirmar:
\n",
657 | "0 - Potência de um teste é a probabilidade de se rejeitar a hipótese nula quando esta for falsa.
\n",
658 | "1 - O nível de significância de um teste é a probabilidade de se cometer um erro tipo 1.
\n",
659 | "2 - O teste F de significância conjunta dos parâmetros em um modelo de regressão linear\n",
660 | "é unilateral.
\n",
661 | "3 - Se uma variável é significativa ao nível de 1%, então ela é significativa ao nível de 5%.\n",
662 | "4 - $p-\\text{valor } = 1 – P(H_0 \\text{ falsa })$, em que $P(A)$ é a probabilidade do evento $A$ ocorrer."
663 | ]
664 | },
665 | {
666 | "cell_type": "markdown",
667 | "metadata": {},
668 | "source": [
669 | "Q8-2009
\n",
670 | "2 - Um intervalo de confiança de 99% para a média μ de uma população, calculado para\n",
671 | "uma amostra aleatória, como [2,75;8,25], pode ser interpretado como: a probabilidade\n",
672 | "de $\\mu$ estar no intervalo calculado é de 99%."
673 | ]
674 | },
675 | {
676 | "cell_type": "markdown",
677 | "metadata": {},
678 | "source": [
679 | "Q1 - 2012
\n",
680 | "Julgue as afirmativas:\n",
681 | "0 - O erro tipo I é definido como a probabilidade de rejeitar a hipótese nula quando a hipótese nula é verdadeira.
\n",
682 | "1 - O erro tipo II é definido como a probabilidade de rejeitar a hipótese nula quando a hipótese nula é verdadeira.
\n",
683 | "2 - O nível de significância de um teste é a probabilidade de rejeitar a hipótese nula quando a hipótese alternativa é verdadeira.
\n",
684 | "3 - Se o p-valor de um teste é maior do que o nível de significância adotado, rejeita-se a hipótese nula."
685 | ]
686 | }
687 | ],
688 | "metadata": {
689 | "kernelspec": {
690 | "display_name": "Python 3",
691 | "language": "python",
692 | "name": "python3"
693 | },
694 | "language_info": {
695 | "codemirror_mode": {
696 | "name": "ipython",
697 | "version": 3
698 | },
699 | "file_extension": ".py",
700 | "mimetype": "text/x-python",
701 | "name": "python",
702 | "nbconvert_exporter": "python",
703 | "pygments_lexer": "ipython3",
704 | "version": "3.8.10"
705 | },
706 | "varInspector": {
707 | "cols": {
708 | "lenName": 16,
709 | "lenType": 16,
710 | "lenVar": 40
711 | },
712 | "kernels_config": {
713 | "python": {
714 | "delete_cmd_postfix": "",
715 | "delete_cmd_prefix": "del ",
716 | "library": "var_list.py",
717 | "varRefreshCmd": "print(var_dic_list())"
718 | },
719 | "r": {
720 | "delete_cmd_postfix": ") ",
721 | "delete_cmd_prefix": "rm(",
722 | "library": "var_list.r",
723 | "varRefreshCmd": "cat(var_dic_list()) "
724 | }
725 | },
726 | "types_to_exclude": [
727 | "module",
728 | "function",
729 | "builtin_function_or_method",
730 | "instance",
731 | "_Feature"
732 | ],
733 | "window_display": false
734 | }
735 | },
736 | "nbformat": 4,
737 | "nbformat_minor": 4
738 | }
739 |
--------------------------------------------------------------------------------
/Formulários/Formulário1.ipynb:
--------------------------------------------------------------------------------
1 | {
2 | "cells": [
3 | {
4 | "cell_type": "markdown",
5 | "metadata": {},
6 | "source": [
7 | "# Fórmulário: Estatística Básica e Números-Índice"
8 | ]
9 | },
10 | {
11 | "cell_type": "markdown",
12 | "metadata": {},
13 | "source": [
14 | "##### Média Aritimética"
15 | ]
16 | },
17 | {
18 | "cell_type": "markdown",
19 | "metadata": {},
20 | "source": [
21 | "$ \\overline{X}= \\dfrac{1}{n}\\sum\\limits_{i=1}^{n}X_{i}$"
22 | ]
23 | },
24 | {
25 | "cell_type": "markdown",
26 | "metadata": {},
27 | "source": [
28 | "##### Média ponderada"
29 | ]
30 | },
31 | {
32 | "cell_type": "markdown",
33 | "metadata": {},
34 | "source": [
35 | "$W = \\dfrac{\\sum\\limits_{i=1}^{n} X_i q_i}{\\sum\\limits_{i=1}^{n} q_i}$"
36 | ]
37 | },
38 | {
39 | "cell_type": "markdown",
40 | "metadata": {},
41 | "source": [
42 | "##### Média Geométrica"
43 | ]
44 | },
45 | {
46 | "cell_type": "markdown",
47 | "metadata": {},
48 | "source": [
49 | "$\\overline{G} = {\\left( \\prod\\limits_{i=1}^{n}X_{i}\\right)}^{\\frac{1}{n}}$"
50 | ]
51 | },
52 | {
53 | "cell_type": "markdown",
54 | "metadata": {},
55 | "source": [
56 | "##### Média Harmônica"
57 | ]
58 | },
59 | {
60 | "cell_type": "markdown",
61 | "metadata": {},
62 | "source": [
63 | "$\\overline{H} = \\dfrac{n}{\\dfrac{1}{X_{1}}+\\dfrac{1}{X_{2}} + \\cdots + \\dfrac{1}{X_{n}}}$"
64 | ]
65 | },
66 | {
67 | "cell_type": "markdown",
68 | "metadata": {},
69 | "source": [
70 | "$\\overline{H} = \\dfrac{n}{\\sum\\limits_{i=1}^{n}\\dfrac{1}{X_{i}}}$"
71 | ]
72 | },
73 | {
74 | "cell_type": "markdown",
75 | "metadata": {},
76 | "source": [
77 | "$\\overline{X} \\ge \\overline{G} \\ge \\overline{H}$"
78 | ]
79 | },
80 | {
81 | "cell_type": "markdown",
82 | "metadata": {},
83 | "source": [
84 | "Amplitude"
85 | ]
86 | },
87 | {
88 | "cell_type": "markdown",
89 | "metadata": {},
90 | "source": [
91 | "$X_{(1)} \\leq X_{(2)} \\leq \\dots \\leq X_{(n-1)} \\leq X_{(n)}$"
92 | ]
93 | },
94 | {
95 | "cell_type": "markdown",
96 | "metadata": {},
97 | "source": [
98 | "$ A = X_{(n)}-X_{(1)}$"
99 | ]
100 | },
101 | {
102 | "cell_type": "markdown",
103 | "metadata": {},
104 | "source": [
105 | "Desvio em relação a média"
106 | ]
107 | },
108 | {
109 | "cell_type": "markdown",
110 | "metadata": {},
111 | "source": [
112 | "$d_i = X_i-\\overline{X}$"
113 | ]
114 | },
115 | {
116 | "cell_type": "markdown",
117 | "metadata": {},
118 | "source": [
119 | "$\\mathrm{\\sigma^2}\n",
120 | "= \\dfrac{\\left(X_{1}-\\mu\\right)^{2}+\n",
121 | "\\left(X_{2}-\\mu \\right)^2+ \\cdots+\n",
122 | "\\left(X_{N}-\\mu\\right)^2\n",
123 | "}{N}$"
124 | ]
125 | },
126 | {
127 | "cell_type": "markdown",
128 | "metadata": {},
129 | "source": [
130 | "$\\sigma^2 = \\dfrac{\\sum_\\limits{i=1}^{N}\\left(X_i-\\mu \\right)^2}{N}$"
131 | ]
132 | },
133 | {
134 | "cell_type": "markdown",
135 | "metadata": {},
136 | "source": [
137 | "Variância amostral"
138 | ]
139 | },
140 | {
141 | "cell_type": "markdown",
142 | "metadata": {},
143 | "source": [
144 | "$S^2 = \\dfrac{\\sum_\\limits{i=1}^{n}\\left(X_i-\\overline{X}\\right)^2}{n-1}$"
145 | ]
146 | },
147 | {
148 | "cell_type": "markdown",
149 | "metadata": {},
150 | "source": [
151 | "Desvio Médio Absoluto"
152 | ]
153 | },
154 | {
155 | "cell_type": "markdown",
156 | "metadata": {},
157 | "source": [
158 | "$\\mathrm{dm(X)} = \\dfrac{\\left|X_1-\\overline{X} \\right|+\\left|X_2-\\overline{X} \\right|+\\cdots+\\left|X_n-\\overline{X} \\right|}{n}$"
159 | ]
160 | },
161 | {
162 | "cell_type": "markdown",
163 | "metadata": {},
164 | "source": [
165 | "$\\mathrm{dm(X)} = \\dfrac{\\sum_\\limits{i=1}^{n}\\left|X_i-\\overline{X} \\right|}{n}$"
166 | ]
167 | },
168 | {
169 | "cell_type": "markdown",
170 | "metadata": {},
171 | "source": [
172 | "Desvio padrão"
173 | ]
174 | },
175 | {
176 | "cell_type": "markdown",
177 | "metadata": {},
178 | "source": [
179 | "$\\sigma = \\sqrt{\\sigma^2} = \\sqrt{\\dfrac{\\sum_\\limits{i=1}^{N}\\left(X_i-\\mu\\right)^2}{N}}$"
180 | ]
181 | },
182 | {
183 | "cell_type": "markdown",
184 | "metadata": {},
185 | "source": [
186 | "$S = \\sqrt{S^2} = \\sqrt{\\dfrac{\\sum_\\limits{i=1}^{n}\\left(X_i-\\overline{X}\\right)^2}{n-1}}$"
187 | ]
188 | },
189 | {
190 | "cell_type": "markdown",
191 | "metadata": {},
192 | "source": [
193 | "Covariância"
194 | ]
195 | },
196 | {
197 | "cell_type": "markdown",
198 | "metadata": {},
199 | "source": [
200 | "$\\mathrm{cov(X,Y)} = \\dfrac{1}{n}\\sum\\limits_{i=1}^{n}\\left( X_{i}-\\overline{X} \\right)\\left(Y_{i}-\\overline{Y} \\right)$"
201 | ]
202 | },
203 | {
204 | "cell_type": "markdown",
205 | "metadata": {},
206 | "source": [
207 | "$\\mathrm{cov(X,Y)} = \\dfrac{1}{n}\\sum\\limits_{i=1}^{n}X_iY_i-\\overline{X}\\overline{Y}$"
208 | ]
209 | },
210 | {
211 | "cell_type": "markdown",
212 | "metadata": {},
213 | "source": [
214 | "##### Coeficiente de correlação"
215 | ]
216 | },
217 | {
218 | "cell_type": "markdown",
219 | "metadata": {},
220 | "source": [
221 | "$\\mathrm{corr(X,Y)} = \\dfrac{\\mathrm{cov(X,Y)}}{\\mathrm{dp(X)}\\mathrm{dp(Y)}}$"
222 | ]
223 | },
224 | {
225 | "cell_type": "markdown",
226 | "metadata": {},
227 | "source": [
228 | "Índice de Laspeyres de preço: "
229 | ]
230 | },
231 | {
232 | "cell_type": "markdown",
233 | "metadata": {},
234 | "source": [
235 | "$L_{p}^{t} = \\dfrac{\\sum_{i=1}^{n}p_{i}^{1}q_{i}^{0}}{\\sum_{i=1}^{n}p_{i}^{0}q_{i}^{0}} = \\dfrac{\\mathbf{p^tq^0}}{\\mathbf{p^0q^0}}$"
236 | ]
237 | },
238 | {
239 | "cell_type": "markdown",
240 | "metadata": {},
241 | "source": [
242 | "Índice de Laspeyres de quantidade: "
243 | ]
244 | },
245 | {
246 | "cell_type": "markdown",
247 | "metadata": {},
248 | "source": [
249 | "$L_{q}^{t} = \\dfrac{\\sum_{i=1}^{n}p_{i}^{0}q_{i}^{t}}{\\sum_{i=1}^{n}p_{i}^{0}q_{i}^{0}} = \\dfrac{\\mathbf{p^{0}q^{t}}}{\\mathbf{p^{0}q^0}}$"
250 | ]
251 | },
252 | {
253 | "cell_type": "markdown",
254 | "metadata": {},
255 | "source": [
256 | "$L = \\sum_{i=1}^{n}\\dfrac{p_i^1}{p_i^0}\\times w_i^{0}$"
257 | ]
258 | },
259 | {
260 | "cell_type": "markdown",
261 | "metadata": {},
262 | "source": [
263 | "$w_i^{0} = \\dfrac{p_i^0q_i^0}{\\sum_{i=1}^{n}p_i^{0}q_i^{0}}$"
264 | ]
265 | },
266 | {
267 | "cell_type": "markdown",
268 | "metadata": {},
269 | "source": [
270 | "Índice de Paasche de preço:"
271 | ]
272 | },
273 | {
274 | "cell_type": "markdown",
275 | "metadata": {},
276 | "source": [
277 | "$P_{p}^{t} = \\dfrac{\\sum_{i=1}^{n}p_{i}^{1}q_{i}^{1}}{\\sum_{i=1}^{n}p_{i}^{0}q_{i}^{1}} = \\dfrac{\\mathbf{p^tq^t}}{\\mathbf{p^0q^t}}$"
278 | ]
279 | },
280 | {
281 | "cell_type": "markdown",
282 | "metadata": {},
283 | "source": [
284 | "Índice de Paasche de quantidade:"
285 | ]
286 | },
287 | {
288 | "cell_type": "markdown",
289 | "metadata": {},
290 | "source": [
291 | "$P_{q}^{t} = \\dfrac{\\sum_{i=1}^{n}p_{i}^{1}q_{i}^{1}}{\\sum_{i=1}^{n}p_{i}^{1}q_{i}^{0}} = \\dfrac{\\mathbf{p^tq^t}}{\\mathbf{p^tq^0}}$"
292 | ]
293 | },
294 | {
295 | "cell_type": "markdown",
296 | "metadata": {},
297 | "source": [
298 | "$P_p = \\dfrac{1}{\\sum_\\limits{i =1}^{n}\\dfrac{p_i^0}{p_i^1}\\times w_i^1}$"
299 | ]
300 | },
301 | {
302 | "cell_type": "markdown",
303 | "metadata": {},
304 | "source": [
305 | "$w_i^1 = \\frac{p_i^1q_i^1}{\\sum_{i=1}^{n}p_i^1q_i^1}$"
306 | ]
307 | },
308 | {
309 | "cell_type": "markdown",
310 | "metadata": {},
311 | "source": [
312 | "Índice Valor"
313 | ]
314 | },
315 | {
316 | "cell_type": "markdown",
317 | "metadata": {},
318 | "source": [
319 | "$I_V = \\dfrac{\\mathbf{p_tq_t}}{\\mathbf{p_0q_0}}$"
320 | ]
321 | },
322 | {
323 | "cell_type": "markdown",
324 | "metadata": {},
325 | "source": [
326 | "Índice de Fisher"
327 | ]
328 | },
329 | {
330 | "cell_type": "markdown",
331 | "metadata": {},
332 | "source": [
333 | "$F = \\sqrt{L \\times P}$"
334 | ]
335 | },
336 | {
337 | "cell_type": "markdown",
338 | "metadata": {},
339 | "source": [
340 | "Propriedades ideais para Números-Índices e outras propriedades"
341 | ]
342 | },
343 | {
344 | "cell_type": "markdown",
345 | "metadata": {},
346 | "source": [
347 | "* Identidade: $I_{00} = 1$ (Todos satisfazem)\n",
348 | "* Reversibilidade no tempo: $I_{t,0} \\times I_{0,t} = 1$\n",
349 | "* Encadeamento (ou circulariadade): $I_{0,1} \\times I_{1,2} \\times I_{2, 3} \\times \\dots \\times I_{t-1, t} = I_{0,t}$\n",
350 | " * $I_{0,1} \\times I_{1,2} = I_{0,2}$\n",
351 | "* Decomposição das causas (ou reversão de fatores): $I_p \\times I_q = I_{V}$\n",
352 | "* $\\rho_{pq} < 0 \\Rightarrow L>P$\n",
353 | "* $\\rho_{pq} > 0 \\Rightarrow P>L$\n",
354 | "* $\\rho_{pq} = 0 \\Rightarrow L=P$\n",
355 | "* $L_{p} \\times P_{q} = I_{V} = P_{p} \\times L_{q}$\n",
356 | "* $P_{p} \\times P_{q} \\le I_{V} \\le L_{p} \\times L_{q}$ "
357 | ]
358 | }
359 | ],
360 | "metadata": {
361 | "kernelspec": {
362 | "display_name": "Python 3",
363 | "language": "python",
364 | "name": "python3"
365 | },
366 | "language_info": {
367 | "codemirror_mode": {
368 | "name": "ipython",
369 | "version": 3
370 | },
371 | "file_extension": ".py",
372 | "mimetype": "text/x-python",
373 | "name": "python",
374 | "nbconvert_exporter": "python",
375 | "pygments_lexer": "ipython3",
376 | "version": "3.8.5"
377 | }
378 | },
379 | "nbformat": 4,
380 | "nbformat_minor": 4
381 | }
382 |
--------------------------------------------------------------------------------
/README.md:
--------------------------------------------------------------------------------
1 | # Statistical
2 | Este repositório armazena notas de aula de Estatística e Econometria. Adicionalmente, busca armazenar resumos teóricos de estatística e aplicações em Python.
3 |
4 | #### 0. [Teoria dos Conjuntos](https://github.com/ronissonlucas/Statistical/blob/main/1.%20N%C3%BAmeros-%C3%ADndices.ipynb)
5 | #### 1. [Números-Índices e Estatística Descritiva](https://github.com/ronissonlucas/Statistical/blob/main/1.%20N%C3%BAmeros-%C3%ADndices.ipynb)
6 | #### 2. [Probabilidade básica](https://github.com/ronissonlucas/Statistical/blob/main/2.%20Probabilidade.ipynb)
7 | #### 3. [Variáveis aleatórias discretas e contínuas](https://github.com/ronissonlucas/Statistical/blob/main/3.%20Vari%C3%A1veis_aleat%C3%B3rias.ipynb)
8 | #### 4. [Distribuições discretas e contínuas](https://github.com/ronissonlucas/Statistical/blob/main/4.%20Distribui%C3%A7%C3%B5es.ipynb)
9 | #### 4. [Distribuições conjuntas](https://github.com/ronissonlucas/Statistical/blob/main/5.%20Distribui%C3%A7%C3%B5es_conjuntas.ipynb)
10 | #### 6. [Inferência estatística: uma introdução](https://github.com/ronissonlucas/Statistical/blob/main/6.%20Introdu%C3%A7%C3%A3o%20%C3%A0%20Infer%C3%AAncia%20Estat%C3%ADstica.ipynb)
11 | #### 7. [Inferência estatística (continuação)](https://github.com/ronissonlucas/Statistical/blob/main/7.%20Continua%C3%A7%C3%A3o%20Infer%C3%AAncia%20e%20Teoremas.ipynb)
12 | #### 8. [Intervalo de confiança](https://github.com/ronissonlucas/Statistical/blob/main/8.%20Intervalo_Confian%C3%A7a.ipynb)
13 | #### 9. [Testes de hipótese](https://github.com/ronissonlucas/Statistical/blob/main/9.%20Testes.ipynb)
14 |
15 | #### Formulários
16 | [Números-índice e estatística básica](https://github.com/ronissonlucas/Statistical/blob/main/3.%20Vari%C3%A1veis_aleat%C3%B3rias.ipynb)
17 |
18 | #### Implementações em Python
19 | * [Regressão linear simples](https://github.com/ronissonlucas/Statistical/blob/main/Econometrics1.ipynb)
20 |
21 |
22 |
--------------------------------------------------------------------------------
/TeoriaConjuntos.ipynb:
--------------------------------------------------------------------------------
1 | {
2 | "cells": [
3 | {
4 | "cell_type": "markdown",
5 | "metadata": {},
6 | "source": [
7 | "# Teoria dos Conjuntos"
8 | ]
9 | },
10 | {
11 | "cell_type": "markdown",
12 | "metadata": {},
13 | "source": [
14 | "Autor: Ronisson Lucas Calmon da Conceição"
15 | ]
16 | },
17 | {
18 | "cell_type": "markdown",
19 | "metadata": {},
20 | "source": [
21 | "Definição: conjunto é uma coleção de elementos de U (denominado conjunto fundamental ou conjunto universal)."
22 | ]
23 | },
24 | {
25 | "cell_type": "markdown",
26 | "metadata": {},
27 | "source": [
28 | "Definição: um conjunto nulo ou vazio é definido como o conjunto que não contém qualquer elemento. Denota-se: $\\emptyset$ ou $\\{\\}$. O conjunto $\\{x \\in \\mathbb{R}|x>0 \\mbox{ e } x<0 \\}$ é vazio, pois não existe um número real que satisfaça tal restrição."
29 | ]
30 | },
31 | {
32 | "cell_type": "markdown",
33 | "metadata": {},
34 | "source": [
35 | "Se $x$ for um elemento de $A$ denotamos $x \\in A$, caso contrário $x \\not\\in A$."
36 | ]
37 | },
38 | {
39 | "cell_type": "markdown",
40 | "metadata": {},
41 | "source": [
42 | "Subconjunto: $A \\subset B$ tal que se $x\\in A$ então, $x \\in B$. Inversamento, se $B \\subset A$ e $x \\in B$, então $x \\in A$."
43 | ]
44 | },
45 | {
46 | "cell_type": "markdown",
47 | "metadata": {},
48 | "source": [
49 | "Igualdade: $A=B$ se, e somente se, $A \\subset B$ e $B \\subset A$. Ou seja, dois conjuntos serã iguais se, e somente se, eles contiverem os mesmo elementos."
50 | ]
51 | },
52 | {
53 | "cell_type": "markdown",
54 | "metadata": {},
55 | "source": [
56 | "Consequências imediatas:\n",
57 | "1. $\\forall A$, temos que $\\emptyset \\subset A$.\n",
58 | "2. Para um dado conjunto fundamental definido, para todo conjunto $A$, considerado da composição de $U$ , temos que $A \\subset U$."
59 | ]
60 | },
61 | {
62 | "cell_type": "markdown",
63 | "metadata": {},
64 | "source": [
65 | "* Exemplo: Seja $ U = \\mathbb{R}$, e os subconjuntos $A, B, C$, tais que $A = \\{x|x^{2}+2x-3=0 \\}$,$B=\\{x|\\left(x-2\\right)\\left(x^{2}+2x-3\\right)=0\\} $ e $C = \\{x|x=-3,1,2 \\}$. Logo, $A\\subset B$ e $B=C$"
66 | ]
67 | },
68 | {
69 | "cell_type": "markdown",
70 | "metadata": {},
71 | "source": [
72 | "Operações com conjuntos"
73 | ]
74 | },
75 | {
76 | "cell_type": "markdown",
77 | "metadata": {},
78 | "source": [
79 | "União (ou soma)
\n",
80 | "$A\\cup B=\\{x\\,|\\, x\\in A \\mbox{ ou }x\\in B\\}$ (ou ambos). Então $A \\cup B$ é composto por todos os elementos que estejam no conjunto $A$, ou em $B$, ou então em ambos."
81 | ]
82 | },
83 | {
84 | "cell_type": "markdown",
85 | "metadata": {},
86 | "source": [
87 | "Interseção
\n",
88 | "$A\\cap B=\\{x\\,|\\, x\\in A \\mbox{ e }x\\in B\\}$. O conjunto $A \\cap B$ é formado por todos os elementos que estão em A e B."
89 | ]
90 | },
91 | {
92 | "cell_type": "markdown",
93 | "metadata": {},
94 | "source": [
95 | "Diferença
\n",
96 | "$A-B = \\{x \\in U |x \\in A \\mbox{ e } x \\not\\in B\\}$"
97 | ]
98 | },
99 | {
100 | "cell_type": "markdown",
101 | "metadata": {},
102 | "source": [
103 | "Definiremos agora o complementar de um conjunto $A$ : $A^{c} = \\overline{A}$ é um conjunto formado por todos os elementos que não estejam em A (mas estejam no conjunto fundamental). Assim: $\\overline{A} = U-A = \\{x|x\\not\\in A \\}$.Temos que: $A \\cup \\overline{A} = U$ e $A \\cap A = \\emptyset$."
104 | ]
105 | },
106 | {
107 | "cell_type": "markdown",
108 | "metadata": {},
109 | "source": [
110 | "* Exemplo: Seja $ U = \\{1,2,3,4,5,6,7,8,9,10\\}$, $A = \\{1,2,3,4\\}$, $B = \\{3,4,5,6\\}$. Então: $\\overline{A} = {5,6,7,8,9,10}$, $A \\cup B = \\{1,2,3,4,5,6\\}$ e $A \\cap B = \\{3,4\\}$."
111 | ]
112 | },
113 | {
114 | "cell_type": "markdown",
115 | "metadata": {},
116 | "source": [
117 | "Conjunto das partes: O conjunto das partes de um dado A, denotado $P(A) = $, como o conjunto dos subconjuntos de A:\n",
118 | "
$P(A) = \\{B\\subset U | B \\subset A \\}$."
119 | ]
120 | },
121 | {
122 | "cell_type": "markdown",
123 | "metadata": {},
124 | "source": [
125 | "Famílias de conjuntos"
126 | ]
127 | },
128 | {
129 | "cell_type": "markdown",
130 | "metadata": {},
131 | "source": [
132 | "Seja $K$ um conjunto, denominado conjunto índice. Então, se $\\forall i \\in K$ existe um conjunto $A_{i}$ associado a $i$, tal que $\\{A_{i}\\}_{i \\in K}$ é uma família de conjuntos. \n",
133 | "Para $K = 1,2,3,\\cdots,n$ denotamos $\\{A_{i}\\}_{i \\in K}$ como uma família finita de conjuntos. \n",
134 | "Já uma família infinita enumerável de conjuntos, para $K = 1,2,3, \\cdots, n$ denotamos $\\{A_{i}\\}_{i=1}^{\\infty}$."
135 | ]
136 | },
137 | {
138 | "cell_type": "markdown",
139 | "metadata": {},
140 | "source": [
141 | "União finita de conjuntos:\n",
142 | "
$A_{1}\\cup A_{2} \\cup A_{3} \\cup \\cdots \\cup A_{n} = \\bigcup_{i=1}^{N} A_n$"
143 | ]
144 | },
145 | {
146 | "cell_type": "markdown",
147 | "metadata": {},
148 | "source": [
149 | "Interseções finitas de conjuntos:"
150 | ]
151 | },
152 | {
153 | "cell_type": "markdown",
154 | "metadata": {},
155 | "source": [
156 | "$A_{1} \\cap A_{2} \\cap A_{3} \\cap \\cdots \\cap A_{n} = \\bigcap_{n=1}^{N} A_{n}$"
157 | ]
158 | },
159 | {
160 | "cell_type": "markdown",
161 | "metadata": {},
162 | "source": [
163 | "Para um conjunto enumerável(ou contável no infinito) temos $\\bigcup_{n=1}^{\\infty}A_{n}$ e $\\bigcap_{n=1}^{\\infty}A_{n}$."
164 | ]
165 | },
166 | {
167 | "cell_type": "markdown",
168 | "metadata": {},
169 | "source": [
170 | "Propriedades:\n",
171 | "1. $A \\cup B = B \\cup A$\n",
172 | "2. $A \\cap B = B \\cap A$\n",
173 | "3. $A \\cup \\left(B \\cup C \\right) = \\left(A \\cup B\\right) \\cup C$\n",
174 | "4. $A \\cap \\left(B \\cap C\\right) = \\left(A \\cap B\\right) \\cap C$\n",
175 | "5. $A \\cup \\left(B\\cap C\\right) = \\left(A \\cup B\\right) \\cap \\left(A \\cup C\\right)$\n",
176 | "6. $A \\cap \\left(B \\cup C \\right) = \\left(A \\cap B \\right) \\cup \\left(A \\cap C\\right) $\n",
177 | "7. $A \\cap \\emptyset = \\emptyset$\n",
178 | "8. $A \\cup \\emptyset = A$\n",
179 | "9. $\\overline{\\left(A \\cap B\\right)} = \\overline{A} \\cup \\overline{B}$\n",
180 | "10. $\\overline{\\left(A \\cup B\\right)} = \\overline{A} \\cap \\overline{B}$\n",
181 | "11. $\\overline{\\overline{A}} = A$"
182 | ]
183 | },
184 | {
185 | "cell_type": "markdown",
186 | "metadata": {},
187 | "source": [
188 | "(1) e (2) são leis comutativas e (3) e (4) são leis associativas. Já (5) e (6) são leis distributivas."
189 | ]
190 | },
191 | {
192 | "cell_type": "markdown",
193 | "metadata": {},
194 | "source": [
195 | "Leis de Morgan:"
196 | ]
197 | },
198 | {
199 | "cell_type": "markdown",
200 | "metadata": {},
201 | "source": [
202 | "1. $\\left(A \\cup B\\right)^{c} = A^{c} \\cap B^{c}$\n",
203 | "2. $\\left(A \\cap B\\right)^{c} = A^{c} \\cup B^{c}$"
204 | ]
205 | },
206 | {
207 | "cell_type": "markdown",
208 | "metadata": {},
209 | "source": [
210 | "Conjuntos disjuntos: A e B são dito disjuntos se $A \\cap B = \\emptyset$."
211 | ]
212 | },
213 | {
214 | "cell_type": "markdown",
215 | "metadata": {},
216 | "source": [
217 | "Produto cartesiano
\n",
218 | "Definição: Sejam dois conjuntos $A$ e $B$. O produto cartesiano de $A$ e $B$, denotado $A \\times B$ é o conjunto $\\{\\left(a,b\\right):a \\in A, b \\in B \\}$, é o conjunto de todos os pares ordenados nos quais o primeiro elemento é tirado de $A$ e o segundo de $B$. Em geral, $A \\times B \\neq B \\times A$. Sejam os conjuntos $A_{1},\\cdots, A_{n}$, então o produto cartesiano $A_{1} \\times A_{2} \\times A_{3} \\times \\cdots \\times A_{n}$ $n$ vezes, $A^{n}$ é dado por $A^{n} = \\{\\left(a_{1},a_{2},a_{3},\\cdots,a_{n}\\right),a_{i} \\in A_{i}\\}$, isto é, o conjunto de todas as ênuplas ordenadas."
219 | ]
220 | },
221 | {
222 | "cell_type": "markdown",
223 | "metadata": {},
224 | "source": [
225 | "Notação:\n",
226 | "
$\\prod\\limits_{i=1}^{n}A_{i} = A_{1}\\times A_{2} \\times A_{3} \\times \\cdots \\times A_{n}$"
227 | ]
228 | },
229 | {
230 | "cell_type": "markdown",
231 | "metadata": {},
232 | "source": [
233 | "* Exemplo: Sejam $A = \\{1,2,3\\}$ e $B = \\{1,2,3,4\\}$. Então: $A \\times B = \\{\\left(1,1\\right),\\left(1,2\\right),\\left(1,2\\right),\\left(1,3\\right),\\left(1,4\\right),\\left(2,1\\right) \\cdots \\left(3,4\\right)\\}$."
234 | ]
235 | },
236 | {
237 | "cell_type": "markdown",
238 | "metadata": {},
239 | "source": [
240 | "Número de elementos de um conjunto"
241 | ]
242 | },
243 | {
244 | "cell_type": "markdown",
245 | "metadata": {},
246 | "source": [
247 | "* Se existir um número finito de elementos no conjunto $A$, $a_{1},a_{2},a_{3}, \\dots a_{n}$, diremos que $A$ é finito.\n",
248 | "* Se existir um número infinito de elementos em $A$, os quais possam ser postos em correspondência biunívoca com os inteiros positivos, então diremos que $A$ é numerável ou infinito numerável.\n",
249 | "* Um conjunto que possui um número infinito de elementos que não podem ser enumerados, é dito conjunto infinito não-numerável."
250 | ]
251 | }
252 | ],
253 | "metadata": {
254 | "kernelspec": {
255 | "display_name": "Python 3",
256 | "language": "python",
257 | "name": "python3"
258 | },
259 | "language_info": {
260 | "codemirror_mode": {
261 | "name": "ipython",
262 | "version": 3
263 | },
264 | "file_extension": ".py",
265 | "mimetype": "text/x-python",
266 | "name": "python",
267 | "nbconvert_exporter": "python",
268 | "pygments_lexer": "ipython3",
269 | "version": "3.8.10"
270 | }
271 | },
272 | "nbformat": 4,
273 | "nbformat_minor": 4
274 | }
275 |
--------------------------------------------------------------------------------