├── 1. Números-índices.ipynb ├── 2. Probabilidade.ipynb ├── 3. Variáveis_aleatórias.ipynb ├── 4. Distribuições.ipynb ├── 5. Distribuições_conjuntas.ipynb ├── 6. Introdução à Inferência Estatística.ipynb ├── 7. Continuação Inferência e Teoremas.ipynb ├── 8. Intervalo_Confiança.ipynb ├── 9. Testes.ipynb ├── Econometrics1.ipynb ├── Formulários ├── Formulário1.html └── Formulário1.ipynb ├── README.md └── TeoriaConjuntos.ipynb /2. Probabilidade.ipynb: -------------------------------------------------------------------------------- 1 | { 2 | "cells": [ 3 | { 4 | "cell_type": "markdown", 5 | "metadata": {}, 6 | "source": [ 7 | "# Probabilidade" 8 | ] 9 | }, 10 | { 11 | "cell_type": "markdown", 12 | "metadata": {}, 13 | "source": [ 14 | "* Modelo determinístico: admite-se que o resultado efetivo (numérico ou de outra espécie) seja determinado pelas condições sob as quais o experimento ou o procedimento seja executado;\n", 15 | "* Modelo não-determinístico (probabilístico ou estocástico): as condições da experimentação determinam somento o comportamento probabilístico (lei probabilística) do resultado observável." 16 | ] 17 | }, 18 | { 19 | "cell_type": "markdown", 20 | "metadata": {}, 21 | "source": [ 22 | "Experimentos aleatórios" 23 | ] 24 | }, 25 | { 26 | "cell_type": "markdown", 27 | "metadata": {}, 28 | "source": [ 29 | "Experimentos que ao serem repetidos nas mesmas condições não produzem o mesmo resultado." 30 | ] 31 | }, 32 | { 33 | "cell_type": "markdown", 34 | "metadata": {}, 35 | "source": [ 36 | "Experimentos determinísticos" 37 | ] 38 | }, 39 | { 40 | "cell_type": "markdown", 41 | "metadata": {}, 42 | "source": [ 43 | "Experimentos que ao serem repetidos nas mesmas condições conduzem ao mesmo resultado." 44 | ] 45 | }, 46 | { 47 | "cell_type": "markdown", 48 | "metadata": {}, 49 | "source": [ 50 | "Espaço amostral" 51 | ] 52 | }, 53 | { 54 | "cell_type": "markdown", 55 | "metadata": {}, 56 | "source": [ 57 | "Definição: para um dado experimento $\\varepsilon$ (estocástico), definimos o espaço amostral $S$ como o conjunto de todos os resultados possíveis deste experimento." 58 | ] 59 | }, 60 | { 61 | "cell_type": "markdown", 62 | "metadata": {}, 63 | "source": [ 64 | "Evento" 65 | ] 66 | }, 67 | { 68 | "cell_type": "markdown", 69 | "metadata": {}, 70 | "source": [ 71 | "Definição: Um evento $A$ é um subconjunto do espaço amostral: $A \\subset S$. Se o espaço amostral for finito ou infinito numerável, todo subconjunto poderá ser considerado um evento, tal que se $S$ possui n elementos, então existirão $2^n$ subconjuntos associados (eventos).Contudo, se o espaço amostral for infinito não-numerável, verifica-se que nem todo subconjunto associado poderá ser considerado um evento deste." 72 | ] 73 | }, 74 | { 75 | "cell_type": "markdown", 76 | "metadata": {}, 77 | "source": [ 78 | "Usando as técnicas da teoria dos conjuntos exposta previamente, se $A$ e $B$ forem eventos, temos que:\n", 79 | "1. $A\\cup B$ será o evento que ocorrerá se, e somente se, $A$ ou $B$ (ou ambos) ocorrerem;\n", 80 | "2. $A \\cap B$ será o evento que ocorrerá se, e somente se, $A$ e $B$ ocorrerem;\n", 81 | "3. $\\overline{A}$ ocorrerá se, e somente se, o evento A não ocorrer;\n", 82 | "4. Sendo $A_1, \\dots A_n$ uma coleção finita de eventos, então o evento $\\bigcup\\limits_{i=1}^{n}A_i$ ocorrerá se, e somente se, ao menos um dos eventos $A_{i}$ ocorrer;\n", 83 | "5. Sendo $A_1, \\dots A_n$ uma coleção finita de eventos, então o evento $\\bigcap\\limits_{i=1}^{n}A_i$ ocorrerá se, e somente se, todos os eventos $A_{i}$ ocorrerem;\n", 84 | "6. Sendo $A_1, \\dots A_n$ uma coleção infinita (numerável) de eventos, então o evento $\\bigcup\\limits_{i=1}^{\\infty}$ ocorrerá se, e somente se, ao menos um dos eventos $A_i$ ocorrer;\n", 85 | "7. Sendo $A_1, \\dots A_n$ uma coleção infinita (numerável) de eventos, então o evento $\\bigcap\\limits_{i=1}^{\\infty}A_i$ ocorrerá se, e somente se, todos os eventos $A_i$ ocorrerem;\n", 86 | "8. Seja $n$ a quantidade de repetições de um experimente $\\varepsilon$ de um espaço amostral $S$, então o conjunto de todos os possíveis resultados quando $\\varepsilon$ for executado $n$ vezes será denotado como: $S \\times S \\times S \\times \\dots \\times S = \\{\\left(s_1,s_2, \\dots ,s_n \\right),s_i \\in S, \\forall i=i, \\dots, n \\}$" 87 | ] 88 | }, 89 | { 90 | "cell_type": "markdown", 91 | "metadata": {}, 92 | "source": [ 93 | "Definição: A e B são denominados eventos mutuamente excludentes (ou disjuntos) se $A \\cap B = \\emptyset$ (não podem ocorrer juntos tal que a interseção entre ambos seja um conjunto vazio)." 94 | ] 95 | }, 96 | { 97 | "cell_type": "markdown", 98 | "metadata": {}, 99 | "source": [ 100 | "Adicionalmente se o evento é um entendido como impossível de ocorrer temos então que $P \\left( A \\right) = 0$, mas se A ocorre com certeza então, $P \\left( A \\right) = 1$. Além do que, a probabilidade de um evento impossível ocorrer é tal que $P \\left( \\emptyset \\right) = 0$." 101 | ] 102 | }, 103 | { 104 | "cell_type": "markdown", 105 | "metadata": {}, 106 | "source": [ 107 | "De forma simplificada podemos definir a probabilidade de ocorrência de um evento A da seguinte forma:
\n", 108 | "$P \\left( A \\right) = \\dfrac{\\text{número de vezes em que A ocorre}}{\\text{número de vezes em que todos os eventos ocorrem}} = \\dfrac{n_A}{n}$" 109 | ] 110 | }, 111 | { 112 | "cell_type": "markdown", 113 | "metadata": {}, 114 | "source": [ 115 | "Definição frequentista de probabilidade, sendo $n$ o número de vezes em que o experimento é feito:
\n", 116 | "$P\\left(A \\right) = \\lim_{n\\rightarrow \\infty} \\frac{n_A}{n}$" 117 | ] 118 | }, 119 | { 120 | "cell_type": "markdown", 121 | "metadata": {}, 122 | "source": [ 123 | "Definição: Seja $\\varepsilon$ um experimento. Seja $S$ um espaço amostral associado a $\\varepsilon$ . A cada evento $A$ associaremos um número real representado por $P(A)$ e denominado probabilidade de $A$, que satisfaça as seguintes propriedades:\n", 124 | "1. $0 \\leq P\\left(A\\right) \\leq 1$\n", 125 | "2. $P(S)=1$\n", 126 | "3. Se $A$ e $B$ forem eventos mutuamente excludentes então $P\\left(A \\cup B \\right) = P\\left(A\\right)+P\\left(B\\right)$\n", 127 | "4. Se $A_1,A_2,\\ldots,A_n,\\ldots$ forem eventos, dois a dois, eventos mutuamente excludentes então: \n", 128 | " $P\\left(\\bigcup_{i=1}^{\\infty}A_i\\right) = P\\left(A_1\\right)+P\\left(A_2\\right)+\\ldots+P\\left(A_n\\right)+\\ldots$" 129 | ] 130 | }, 131 | { 132 | "cell_type": "markdown", 133 | "metadata": {}, 134 | "source": [ 135 | "De (3) decorre que, para um $n$ finito:" 136 | ] 137 | }, 138 | { 139 | "cell_type": "markdown", 140 | "metadata": {}, 141 | "source": [ 142 | "$P\\left(\\bigcup_{i=1}^{n} A_i \\right) = \\sum_{i=1}^{n}P\\left(A_i \\right)$" 143 | ] 144 | }, 145 | { 146 | "cell_type": "markdown", 147 | "metadata": {}, 148 | "source": [ 149 | "* $\\mathrm{P(\\emptyset)} = 0$\n", 150 | "* $P( \\overline{A} ) = 1 - P(A)$\n", 151 | " * $P(S) = P(A \\cup \\overline{A}) = P(A)+P(\\overline{A}) \\Rightarrow 1 = P(A)+P(\\overline{A})$\n", 152 | "* Se $A \\subset B$, então $P(A) \\leq P(B)$.\n", 153 | " " 154 | ] 155 | }, 156 | { 157 | "cell_type": "markdown", 158 | "metadata": {}, 159 | "source": [ 160 | "União e interseção de eventos" 161 | ] 162 | }, 163 | { 164 | "cell_type": "markdown", 165 | "metadata": {}, 166 | "source": [ 167 | "* A união de dois eventos $A$ e $B$, $A \\cup B$, é o evento que ocorre se pelo menos um deles ocorre." 168 | ] 169 | }, 170 | { 171 | "cell_type": "markdown", 172 | "metadata": {}, 173 | "source": [ 174 | " * A interseção de dois eventos $A$ e $B$, $A \\cap B$, é o evento que ocorre se ambos os eventos ocorrem." 175 | ] 176 | }, 177 | { 178 | "cell_type": "markdown", 179 | "metadata": {}, 180 | "source": [ 181 | "Sejam $A$ e $B$ dois eventos quaisquer, então:" 182 | ] 183 | }, 184 | { 185 | "cell_type": "markdown", 186 | "metadata": {}, 187 | "source": [ 188 | "$P \\left( A \\text{ e } B\\right) = P \\left( A \\cap B\\right)$" 189 | ] 190 | }, 191 | { 192 | "cell_type": "markdown", 193 | "metadata": {}, 194 | "source": [ 195 | "$P \\left( A \\text{ ou } B\\right) = P \\left( A \\cup B\\right) = P(A)+P(B)-P(A \\cap B)$" 196 | ] 197 | }, 198 | { 199 | "cell_type": "markdown", 200 | "metadata": {}, 201 | "source": [ 202 | "Sejam $A$,$B$ e $C$ eventos quaisquer, entao:
\n", 203 | "$$P\\left(A \\cup B \\cup C \\right) = P(A)+P(B)+P(C)-P(A \\cap B)-P(A \\cap C)-P(B \\cap C)+P(A \\cap B \\cap C) $$" 204 | ] 205 | }, 206 | { 207 | "cell_type": "markdown", 208 | "metadata": {}, 209 | "source": [ 210 | "Se $A$ e $B$ são eventos mutuamente exclusivos (disjuntos, em que $A \\cap B = \\emptyset$):
$P\\left(A \\cup B\\right) = P(A)+P(B)$." 211 | ] 212 | }, 213 | { 214 | "cell_type": "markdown", 215 | "metadata": {}, 216 | "source": [ 217 | "Se $A$, $B$ e $C$ são eventos mutuamente exclusivos (disjuntos, em que $A \\cap B = \\emptyset$, $A \\cap C = \\emptyset$, $B \\cap C = \\emptyset$ e como implicação $A \\cap B \\cap C = \\emptyset$):\n", 218 | "
$$P\\left(A \\cup B \\cup C\\right) = P(A)+P(B)+P(C)$$" 219 | ] 220 | }, 221 | { 222 | "cell_type": "markdown", 223 | "metadata": {}, 224 | "source": [ 225 | "Exemplo: Duas crianças gêmeas têm o seguinte comportamento: uma delas, a mais chorona, chora 65% do dia; a outra chora 45% do dia, e ambas choram, ao mesmo tempo, 30% do dia. Qual a probabilidade de que pelo menos uma chore? E qual a probabilidade de que nenhuma chore?" 226 | ] 227 | }, 228 | { 229 | "cell_type": "markdown", 230 | "metadata": {}, 231 | "source": [ 232 | "* C1: primeira criança chora\n", 233 | "* C2: segunda criança chora" 234 | ] 235 | }, 236 | { 237 | "cell_type": "markdown", 238 | "metadata": {}, 239 | "source": [ 240 | "$P(C1 \\text{ ou } C2) = P(C1)+P(C2)-P(C1 \\text{ e } C2) = 0,65+0,45-0,3 = 0,8$" 241 | ] 242 | }, 243 | { 244 | "cell_type": "markdown", 245 | "metadata": {}, 246 | "source": [ 247 | "$P(\\text{nenhuma chora}) = 1-P(C1 \\text{ ou } C2) = 1-0,8 = 0,2$" 248 | ] 249 | }, 250 | { 251 | "cell_type": "markdown", 252 | "metadata": {}, 253 | "source": [ 254 | " Probabilidade Condicional e Incondicional" 255 | ] 256 | }, 257 | { 258 | "cell_type": "markdown", 259 | "metadata": {}, 260 | "source": [ 261 | "Qual a probabilidade de $A$ ocorrer dado que $B$ ocorreu (ou vai ocorrer)?" 262 | ] 263 | }, 264 | { 265 | "cell_type": "markdown", 266 | "metadata": {}, 267 | "source": [ 268 | "Sejam $A$ e $B$ dois eventos de um espaço amostral e $P(A)>0$, então a probabilidade condicional de $B$ dado $A$ é definida como segue:" 269 | ] 270 | }, 271 | { 272 | "cell_type": "markdown", 273 | "metadata": {}, 274 | "source": [ 275 | "$$P(B|A) = \\frac{P(A \\cap B)}{P(A)}$$" 276 | ] 277 | }, 278 | { 279 | "cell_type": "markdown", 280 | "metadata": {}, 281 | "source": [ 282 | "De igual modo definimos a probabilidade de $A$ dado $B$, com $P(B)>0$:" 283 | ] 284 | }, 285 | { 286 | "cell_type": "markdown", 287 | "metadata": {}, 288 | "source": [ 289 | "$$P(A|B) = \\frac{P(A \\cap B)}{P(B)}$$" 290 | ] 291 | }, 292 | { 293 | "cell_type": "markdown", 294 | "metadata": {}, 295 | "source": [ 296 | "$$P\\left(A \\cap B \\right) = P\\left(A | B\\right) P\\left(B\\right)$$" 297 | ] 298 | }, 299 | { 300 | "cell_type": "markdown", 301 | "metadata": {}, 302 | "source": [ 303 | "$$P\\left(A \\cap B \\right) = P\\left(B | A\\right) P\\left(A\\right)$$" 304 | ] 305 | }, 306 | { 307 | "cell_type": "markdown", 308 | "metadata": {}, 309 | "source": [ 310 | "Então (Regra da Multiplicação):" 311 | ] 312 | }, 313 | { 314 | "cell_type": "markdown", 315 | "metadata": {}, 316 | "source": [ 317 | "$P(A \\cap B) = P(A|B)P(B) = P(B|A)P(A)$" 318 | ] 319 | }, 320 | { 321 | "cell_type": "markdown", 322 | "metadata": {}, 323 | "source": [ 324 | "E se B nao tiver efeito sobre $P(A)$ (vice-versa)?" 325 | ] 326 | }, 327 | { 328 | "cell_type": "markdown", 329 | "metadata": {}, 330 | "source": [ 331 | "Sejam $A$ e $B$ dois eventos, então o evento $B$ é dito independente do evento $A$ se (ou seja, a ocorrência do evento $A$ não afeta a ocorrência de $B$):" 332 | ] 333 | }, 334 | { 335 | "cell_type": "markdown", 336 | "metadata": {}, 337 | "source": [ 338 | "$$P(B|A) = P(B)$$" 339 | ] 340 | }, 341 | { 342 | "cell_type": "markdown", 343 | "metadata": {}, 344 | "source": [ 345 | "O evento $A$ é dito independente do evento $B$ se:" 346 | ] 347 | }, 348 | { 349 | "cell_type": "markdown", 350 | "metadata": {}, 351 | "source": [ 352 | "$$P(A|B) = P(A)$$" 353 | ] 354 | }, 355 | { 356 | "cell_type": "markdown", 357 | "metadata": {}, 358 | "source": [ 359 | "Logo, se $A$ e $B$ são independentes temos que:" 360 | ] 361 | }, 362 | { 363 | "cell_type": "markdown", 364 | "metadata": {}, 365 | "source": [ 366 | "$$P(A \\cap B) = P(A).P(B)$$" 367 | ] 368 | }, 369 | { 370 | "cell_type": "markdown", 371 | "metadata": {}, 372 | "source": [ 373 | "$$P\\left(A \\cup B\\right) = P(A)+P(B)-P(A).P(B)$$" 374 | ] 375 | }, 376 | { 377 | "cell_type": "markdown", 378 | "metadata": {}, 379 | "source": [ 380 | "Então, os eventos $A$ e $B$ sao ditos independentes (a probabilidade condicional é igual a probabilidade não condicional)." 381 | ] 382 | }, 383 | { 384 | "cell_type": "markdown", 385 | "metadata": {}, 386 | "source": [ 387 | "Se $A$, $B$ e $C$ são eventos independentes, então:
\n", 388 | "$$\\mathrm{P(A \\cap B \\cap C)} = \\mathrm{P(A)P(B)P(C)}$$\n", 389 | "
Se $A$, $B$ e $C$ são dois a dois independentes, vale: $\\mathrm{P(A \\cap B)} = \\mathrm{P(A)P(B)}$, $\\mathrm{P(A \\cap C)} = \\mathrm{P(A)P(C)}$ e $\\mathrm{P(B \\cap C)} = \\mathrm{P(B)P(C)}$ e $\\mathrm{P(A \\cap B \\cap C)} = \\mathrm{P(A)P(B)P(C)}$, então os eventos $A$, $B$ e $C$ são independentes." 390 | ] 391 | }, 392 | { 393 | "cell_type": "markdown", 394 | "metadata": {}, 395 | "source": [ 396 | "Exemplo:" 397 | ] 398 | }, 399 | { 400 | "cell_type": "markdown", 401 | "metadata": {}, 402 | "source": [ 403 | "Foi feita uma pesquisa com 100 pessoas sobre as preferências a respeito de programas na televisão. Os resultados obtidos são mostrados na tabela a seguir." 404 | ] 405 | }, 406 | { 407 | "cell_type": "markdown", 408 | "metadata": {}, 409 | "source": [ 410 | "\n", 411 | " \n", 412 | " \n", 413 | " \n", 414 | " \n", 415 | " \n", 416 | " \n", 417 | " \n", 418 | " \n", 419 | " \n", 420 | " \n", 421 | " \n", 422 | " \n", 423 | " \n", 424 | " \n", 425 | " \n", 426 | " \n", 427 | " \n", 428 | " \n", 429 | " \n", 430 | " \n", 431 | " \n", 432 | " \n", 433 | " \n", 434 | " \n", 435 | "
HomensMulheresTotal
Futebol402060
Novela53540
Total4555100
" 436 | ] 437 | }, 438 | { 439 | "cell_type": "markdown", 440 | "metadata": {}, 441 | "source": [ 442 | "Entre o grupo de entrevistados, qual a probabilidade de preferir novela? E futebol?" 443 | ] 444 | }, 445 | { 446 | "cell_type": "markdown", 447 | "metadata": {}, 448 | "source": [ 449 | "$P(\\text{novela}) = \\dfrac{40}{100} = 0,4 = 40$%" 450 | ] 451 | }, 452 | { 453 | "cell_type": "markdown", 454 | "metadata": {}, 455 | "source": [ 456 | "$P(\\text{futebol}) = \\dfrac{60}{100} = 0,6 = 60$%" 457 | ] 458 | }, 459 | { 460 | "cell_type": "markdown", 461 | "metadata": {}, 462 | "source": [ 463 | "Qual a probabilidade de ser mulher e preferir futebol?" 464 | ] 465 | }, 466 | { 467 | "cell_type": "markdown", 468 | "metadata": {}, 469 | "source": [ 470 | "$P(\\text{mulher e futebol}) = \\dfrac{20}{100} = 0,2 = 20$%" 471 | ] 472 | }, 473 | { 474 | "cell_type": "markdown", 475 | "metadata": {}, 476 | "source": [ 477 | "Qual a probabilidade de,sendo homem, preferir futebol?" 478 | ] 479 | }, 480 | { 481 | "cell_type": "markdown", 482 | "metadata": {}, 483 | "source": [ 484 | "$P(\\text{futebol|homem}) = \\dfrac{P(\\text{homem e futebol})}{P(\\text{homem})} = \\dfrac{\\frac{40}{100}}{\\frac{45}{100}} = 0,888... = 88,88$%" 485 | ] 486 | }, 487 | { 488 | "cell_type": "markdown", 489 | "metadata": {}, 490 | "source": [ 491 | "Qual a probabilidade de, se preferir novela, ser mulher?" 492 | ] 493 | }, 494 | { 495 | "cell_type": "markdown", 496 | "metadata": {}, 497 | "source": [ 498 | "$P(\\text{mulher|novela}) = \\dfrac{P(\\text{mulher e novela})}{P(\\text{novela})} = \\dfrac{\\frac{35}{100}}{\\frac{40}{100}} = 0,875 = 87,5$%" 499 | ] 500 | }, 501 | { 502 | "cell_type": "markdown", 503 | "metadata": {}, 504 | "source": [ 505 | "Partição do Espaço Amostral" 506 | ] 507 | }, 508 | { 509 | "cell_type": "markdown", 510 | "metadata": {}, 511 | "source": [ 512 | "Definimos a partição de um espaço amostral como um conjunto de eventos mutuamente exclusivos cuja união forma o espaço amostral." 513 | ] 514 | }, 515 | { 516 | "cell_type": "markdown", 517 | "metadata": {}, 518 | "source": [ 519 | "* $A_i \\cap A_j = \\emptyset , \\forall i \\neq j$ (eventos mutuamente excludentes)\n", 520 | "* $\\bigcup_{i = 1}^{n}A_i = S$ (união dos eventos corresponde ao espaço amostral)\n", 521 | "* $P(A_i)>0 , \\forall i=1, \\dots, n$" 522 | ] 523 | }, 524 | { 525 | "cell_type": "markdown", 526 | "metadata": {}, 527 | "source": [ 528 | "Teorema da Probabilidade Total" 529 | ] 530 | }, 531 | { 532 | "cell_type": "markdown", 533 | "metadata": {}, 534 | "source": [ 535 | "Se $B_1, \\dots B_k$ formam uma partição do espaço amostral $S$, então qualquer evento $A$ neste espaço amostral satisfaz:" 536 | ] 537 | }, 538 | { 539 | "cell_type": "markdown", 540 | "metadata": {}, 541 | "source": [ 542 | "$\\mathrm{P(A)} = \\sum_{i = 1}^{k}\\mathrm{P(B_i)P(A|B_i)} $" 543 | ] 544 | }, 545 | { 546 | "cell_type": "markdown", 547 | "metadata": {}, 548 | "source": [ 549 | "Podemos escrever $A$ da seguinte forma:" 550 | ] 551 | }, 552 | { 553 | "cell_type": "markdown", 554 | "metadata": {}, 555 | "source": [ 556 | "$A =(A \\cap B_1) \\cup (A \\cap B_2) \\cup \\dots \\cup (A \\cap B_k)$" 557 | ] 558 | }, 559 | { 560 | "cell_type": "markdown", 561 | "metadata": {}, 562 | "source": [ 563 | "$\\mathrm{P(A)}= \\mathrm{P\\left[ (A \\cap B_1) \\cup (A \\cap B_2) \\cup \\dots \\cup (A \\cap B_k)\\right]}$" 564 | ] 565 | }, 566 | { 567 | "cell_type": "markdown", 568 | "metadata": {}, 569 | "source": [ 570 | "$\\mathrm{P(A)}= \\mathrm{P(A \\cap B_1)}+\\mathrm{P(A \\cap B_2)}+\\dots+\\mathrm{P(A \\cap B_k)}$" 571 | ] 572 | }, 573 | { 574 | "cell_type": "markdown", 575 | "metadata": {}, 576 | "source": [ 577 | "Usando: $\\mathrm{P(A \\cap B_i)} = \\mathrm{P(A|B_i)P(B_i)}$" 578 | ] 579 | }, 580 | { 581 | "cell_type": "markdown", 582 | "metadata": {}, 583 | "source": [ 584 | "$\\mathrm{P(A)}= \\mathrm{P(A|B_1)P(B_1)}+\\mathrm{P(A|B_2)P(B_2)}+\\dots+\\mathrm{P(A|B_k)P(B_k)}$" 585 | ] 586 | }, 587 | { 588 | "cell_type": "markdown", 589 | "metadata": {}, 590 | "source": [ 591 | "Regra Bayes" 592 | ] 593 | }, 594 | { 595 | "cell_type": "markdown", 596 | "metadata": {}, 597 | "source": [ 598 | "Do Teorema da Probabilidade Total derivamos:" 599 | ] 600 | }, 601 | { 602 | "cell_type": "markdown", 603 | "metadata": {}, 604 | "source": [ 605 | "$\\mathrm{P(B_i|A)} = \\dfrac{\\mathrm{P(A \\cap B_i)}}{\\mathrm{P(A)}} = \\dfrac{\\mathrm{P(B_i)P(A|B_i)}}{\\sum_{i=1}^{k}P(B_i)P(A|B_i)}$" 606 | ] 607 | }, 608 | { 609 | "cell_type": "markdown", 610 | "metadata": {}, 611 | "source": [ 612 | "Exemplo:" 613 | ] 614 | }, 615 | { 616 | "cell_type": "markdown", 617 | "metadata": {}, 618 | "source": [ 619 | "Suponha que, numa eleição para governador em um estado norte-americano, temos um candidato democrata e um republicano. Entre os eleitores brancos, 30% votam no democrata, proporção que sobe para 60% entre eleitores negros e é de 50% entre os eleitores de outras etnias. Sabendo-se que há 70% de eleitores brancos, 20% de negros e 10% de outras etnias. Qual a probabilidade de o voto ser de um eleitor negro, dado que o voto é para o candidato democrata?" 620 | ] 621 | }, 622 | { 623 | "cell_type": "markdown", 624 | "metadata": {}, 625 | "source": [ 626 | "Notação:\n", 627 | "* B - branco\n", 628 | "* N - negro\n", 629 | "* O - outras etnias\n", 630 | "* D - democrata\n", 631 | "* R - republicano" 632 | ] 633 | }, 634 | { 635 | "cell_type": "markdown", 636 | "metadata": {}, 637 | "source": [ 638 | "* $P(B) = 0,7$\n", 639 | "* $P(N) = 0,2$\n", 640 | "* $P(O) = 0,1$\n", 641 | "* $P(D|N) = 0,6$\n", 642 | "* $P(D|B) = 0,3$\n", 643 | "* $P(D|O) = 0,5$" 644 | ] 645 | }, 646 | { 647 | "cell_type": "markdown", 648 | "metadata": {}, 649 | "source": [ 650 | "$P(N|D) = ?$
\n", 651 | "$P(N|D) = \\dfrac{P(\\text{N e D})}{P(D)}$" 652 | ] 653 | }, 654 | { 655 | "cell_type": "markdown", 656 | "metadata": {}, 657 | "source": [ 658 | "Probabilidade de ser negro e democrata:" 659 | ] 660 | }, 661 | { 662 | "cell_type": "markdown", 663 | "metadata": {}, 664 | "source": [ 665 | "$P(\\text{N e D}) = P(N) \\times P(D|N) = 0,2 \\times 0,6 = 0,12$" 666 | ] 667 | }, 668 | { 669 | "cell_type": "markdown", 670 | "metadata": {}, 671 | "source": [ 672 | "Probabilidade de ser democrata:" 673 | ] 674 | }, 675 | { 676 | "cell_type": "markdown", 677 | "metadata": {}, 678 | "source": [ 679 | "$P(D) = P(\\text{D e B})+P(\\text{D e N})+P(\\text{D e O}) = 0,7 \\times 0,3+0,2 \\times 0,6 +0,1 \\times 0,5 = 0,38$" 680 | ] 681 | }, 682 | { 683 | "cell_type": "markdown", 684 | "metadata": {}, 685 | "source": [ 686 | "$P(N|D) = \\dfrac{0,12}{0,38} = 0,3158 = 31,58$%" 687 | ] 688 | }, 689 | { 690 | "cell_type": "markdown", 691 | "metadata": {}, 692 | "source": [ 693 | "31,58% dos votos democratas são de eleitores negros." 694 | ] 695 | }, 696 | { 697 | "cell_type": "markdown", 698 | "metadata": {}, 699 | "source": [ 700 | "# Questões de fixação" 701 | ] 702 | }, 703 | { 704 | "cell_type": "markdown", 705 | "metadata": {}, 706 | "source": [ 707 | "Q12- 2006
Em uma região, 25% da população são pobres. As mulheres são sobrerrepresentadas neste grupo, pois constituem 75% dos pobres, mas 50% da população. Calcule a proporção de pobres entre as mulheres. Multiplique o resultado por 100 e omita os valores após a vírgula.\n" 708 | ] 709 | }, 710 | { 711 | "cell_type": "markdown", 712 | "metadata": {}, 713 | "source": [ 714 | "$\\mathrm{P}\\left(\\text{Pobre}\\cap\\text{Mulher}\\right) = \\mathrm{P}\\left(\\text{Mulher|Pobre}\\right) \\times \\mathrm{P} \\left(\\text{Pobre}\\right) $" 715 | ] 716 | }, 717 | { 718 | "cell_type": "markdown", 719 | "metadata": {}, 720 | "source": [ 721 | "$\\mathrm{P}\\left(\\text{Pobre|Mulher}\\right) = \\dfrac{\\mathrm{P}\\left(\\text{Pobre} \\cap \\text{Mulher}\\right)}{\\mathrm{P} \\left(\\text{Mulher}\\right)} = \\dfrac{0,75 \\times 0,25}{0,5} = 37,5$" 722 | ] 723 | }, 724 | { 725 | "cell_type": "markdown", 726 | "metadata": {}, 727 | "source": [ 728 | "Q13-2017
Considere dois eventos, $A$ e $B$, os quais são mutuamente excludentes, sendo $P(A)$ a probabilidade de ocorrência de $A$ e $P(B)$ a probabilidade de ocorrência de $B$, então:
\n", 729 | "0 - $\\mathrm{P(A|B)}=0$;
\n", 730 | "1 - $\\mathrm{P(B|A)}=1$;
\n", 731 | "2 - A e B são independentes se, e somente se, $\\mathrm{P(A|B)}=\\mathrm{P(A)}$ e $\\mathrm{P(B|A)} = \\mathrm{P(B)}$;
\n", 732 | "3 - A e B são independentes se $\\mathrm{P(A|B)} = \\mathrm{P(A)}$;
\n", 733 | "4 - A e B são independentes se $\\mathrm{P(B|A)} = \\mathrm{P(B)}$." 734 | ] 735 | }, 736 | { 737 | "cell_type": "markdown", 738 | "metadata": {}, 739 | "source": [ 740 | "$A \\cap B = \\emptyset \\Rightarrow \\mathrm{P(A\\cap B)} = \\mathrm{P(\\emptyset)} = 0$ " 741 | ] 742 | }, 743 | { 744 | "cell_type": "markdown", 745 | "metadata": {}, 746 | "source": [ 747 | "0 - (V)" 748 | ] 749 | }, 750 | { 751 | "cell_type": "markdown", 752 | "metadata": {}, 753 | "source": [ 754 | "$\\mathrm{P(A|B)} = \\dfrac{\\mathrm{P(A \\cap B)}}{\\mathrm{P(B)}} = \\dfrac{0}{\\mathrm{P(B)}} = 0$" 755 | ] 756 | }, 757 | { 758 | "cell_type": "markdown", 759 | "metadata": {}, 760 | "source": [ 761 | "1 - (F)" 762 | ] 763 | }, 764 | { 765 | "cell_type": "markdown", 766 | "metadata": {}, 767 | "source": [ 768 | "$\\mathrm{P(B|A)} = \\dfrac{\\mathrm{P(A \\cap B)}}{\\mathrm{P(A)}} = \\dfrac{0}{\\mathrm{P(A)}} = 0$" 769 | ] 770 | }, 771 | { 772 | "cell_type": "markdown", 773 | "metadata": {}, 774 | "source": [ 775 | "2 - (F)" 776 | ] 777 | }, 778 | { 779 | "cell_type": "markdown", 780 | "metadata": {}, 781 | "source": [ 782 | "Vimos anteriormente que: $\\mathrm{P(A|B)} = \\mathrm{P(B|A)} = 0$. Para que os eventos $A$ e $B$ sejam independentes devemos ter $\\mathrm{P(A \\cap B)} = \\mathrm{P(A)P(B)}$,o que implicaria $\\mathrm{P(A)} = 0$ ou $\\mathrm{P(B)} = 0$." 783 | ] 784 | }, 785 | { 786 | "cell_type": "markdown", 787 | "metadata": {}, 788 | "source": [ 789 | "3 - (F)" 790 | ] 791 | }, 792 | { 793 | "cell_type": "markdown", 794 | "metadata": {}, 795 | "source": [ 796 | "Conforme item (2)." 797 | ] 798 | }, 799 | { 800 | "cell_type": "markdown", 801 | "metadata": {}, 802 | "source": [ 803 | "4 - (F)" 804 | ] 805 | }, 806 | { 807 | "cell_type": "markdown", 808 | "metadata": {}, 809 | "source": [ 810 | "Conforme item (2)." 811 | ] 812 | } 813 | ], 814 | "metadata": { 815 | "kernelspec": { 816 | "display_name": "Python 3", 817 | "language": "python", 818 | "name": "python3" 819 | }, 820 | "language_info": { 821 | "codemirror_mode": { 822 | "name": "ipython", 823 | "version": 3 824 | }, 825 | "file_extension": ".py", 826 | "mimetype": "text/x-python", 827 | "name": "python", 828 | "nbconvert_exporter": "python", 829 | "pygments_lexer": "ipython3", 830 | "version": "3.8.5" 831 | } 832 | }, 833 | "nbformat": 4, 834 | "nbformat_minor": 4 835 | } 836 | -------------------------------------------------------------------------------- /4. Distribuições.ipynb: -------------------------------------------------------------------------------- 1 | { 2 | "cells": [ 3 | { 4 | "cell_type": "markdown", 5 | "metadata": {}, 6 | "source": [ 7 | "# Distribuições discretas" 8 | ] 9 | }, 10 | { 11 | "cell_type": "markdown", 12 | "metadata": {}, 13 | "source": [ 14 | "#### 1. Distribuição de Bernouilli" 15 | ] 16 | }, 17 | { 18 | "cell_type": "markdown", 19 | "metadata": {}, 20 | "source": [ 21 | "Características/uso" 22 | ] 23 | }, 24 | { 25 | "cell_type": "markdown", 26 | "metadata": {}, 27 | "source": [ 28 | "* Caracteriza-se pela existência de dois eventos, sucesso e fracasso, realizados uma única vez, com probabalidade de sucessso $p$ e probabilidade de fracasso $(1-p)$. \n", 29 | "* Exemplo: lançamento de uma moeda uma única vez. A probabilidade de sucesso (cara) é $p=1/2$ e a probabilidade de fracasso (coroa) $(1-p) = 1/2$ (Mostre que neste caso, para $p = 1$: $E(X) = 0.5$,$Var(X) = 0.25$).\n", 30 | " * $E(X) = 1 \\times p +0\\times (1-p) = p$\n", 31 | " * $E(X^2) = 1^2 \\times p+0^2 \\times (1-p) = p$\n", 32 | " * $Var(X) = 1/2 - (1/2)^2 = 1/4$\n", 33 | "* O lançamento de um dado: a aposta em um determinado número implica em uma probabilidade de sucesso $p = 1/6$ e que a probabilidade de fracasso seja $(1-p) = 5/6$\n", 34 | "* v.a.:obter sucesso em uma única rodada." 35 | ] 36 | }, 37 | { 38 | "cell_type": "markdown", 39 | "metadata": {}, 40 | "source": [ 41 | "Forma geral $P(X = k)$" 42 | ] 43 | }, 44 | { 45 | "cell_type": "markdown", 46 | "metadata": {}, 47 | "source": [ 48 | "$P(X = k) = p^{k}\\left(1-p\\right)^{1-k}$,$k=0,1$" 49 | ] 50 | }, 51 | { 52 | "cell_type": "markdown", 53 | "metadata": {}, 54 | "source": [ 55 | "Esperança" 56 | ] 57 | }, 58 | { 59 | "cell_type": "markdown", 60 | "metadata": {}, 61 | "source": [ 62 | "$\\mathrm{E(X)} = 1 \\times p+ 0 \\times (1-p) = p$" 63 | ] 64 | }, 65 | { 66 | "cell_type": "markdown", 67 | "metadata": {}, 68 | "source": [ 69 | "$\\mathrm{E(X)} = p$" 70 | ] 71 | }, 72 | { 73 | "cell_type": "markdown", 74 | "metadata": {}, 75 | "source": [ 76 | "Variância" 77 | ] 78 | }, 79 | { 80 | "cell_type": "markdown", 81 | "metadata": {}, 82 | "source": [ 83 | "$\\mathrm{E(X^2)} = X_1^{2}P(X_1)+X_{2}^{2}P(X_2)$
\n", 84 | "$\\mathrm{E{(X^2)}} = 1^2 \\times p + 0^2 \\times (1-p) = p$
\n", 85 | "$\\mathrm{Var(X)} = \\mathrm{E(X^2)}-\\left[\\mathrm{E(X)}\\right]^2$
\n", 86 | "$\\mathrm{Var(X)} = p-p^2$" 87 | ] 88 | }, 89 | { 90 | "cell_type": "markdown", 91 | "metadata": {}, 92 | "source": [ 93 | "$\\mathrm{Var(X)} = p(1-p)$" 94 | ] 95 | }, 96 | { 97 | "cell_type": "markdown", 98 | "metadata": {}, 99 | "source": [ 100 | "$X \\sim Ber(p)$" 101 | ] 102 | }, 103 | { 104 | "cell_type": "markdown", 105 | "metadata": {}, 106 | "source": [ 107 | "(Q10-2006) 0 - Se a variável aleatória $Y$ segue uma distribuição Bernoulli com parâmetro $p$, então $E(Y) = p$ (V)." 108 | ] 109 | }, 110 | { 111 | "cell_type": "markdown", 112 | "metadata": {}, 113 | "source": [ 114 | "#### 2. Distribuição de Binomial" 115 | ] 116 | }, 117 | { 118 | "cell_type": "markdown", 119 | "metadata": {}, 120 | "source": [ 121 | "Características/uso
\n", 122 | "* Generalização da distribuição de Bernouilli: $p$ é denotada como a probabilidade de sucesso, $(1-p)$ a probabilidade de fracasso, para $n$ experimentos.\n", 123 | "* Número de tentativas independentes de um experimetno com dois resultados, em que a v.a. é obter um determinando número de sucessos em $n$ tentativas." 124 | ] 125 | }, 126 | { 127 | "cell_type": "markdown", 128 | "metadata": {}, 129 | "source": [ 130 | "Forma geral $P(X = k)$" 131 | ] 132 | }, 133 | { 134 | "cell_type": "markdown", 135 | "metadata": {}, 136 | "source": [ 137 | "Então, para um determinado experimento, com $p$ probabilidade de sucesso e $(1-p)$ probabilidade de fracasso, a probabilidade de que, em $n$ repetições, obtenhamos um número $k$ de sucesos é dada por :" 138 | ] 139 | }, 140 | { 141 | "cell_type": "markdown", 142 | "metadata": {}, 143 | "source": [ 144 | "$P(X=k)=\n", 145 | " \\left(\n", 146 | " \\begin{array}{ccc}\n", 147 | " n\\\\\n", 148 | " k\n", 149 | " \\end{array}\n", 150 | " \\right)\n", 151 | " p^k(1-p)^{n-k}$" 152 | ] 153 | }, 154 | { 155 | "cell_type": "markdown", 156 | "metadata": {}, 157 | "source": [ 158 | "$\\left(\n", 159 | " \\begin{array}{ccc}\n", 160 | " n\\\\\n", 161 | " k\n", 162 | " \\end{array}\n", 163 | " \\right) = \\dfrac{n!}{k!(n-k)!}$" 164 | ] 165 | }, 166 | { 167 | "cell_type": "markdown", 168 | "metadata": {}, 169 | "source": [ 170 | "Esperança" 171 | ] 172 | }, 173 | { 174 | "cell_type": "markdown", 175 | "metadata": {}, 176 | "source": [ 177 | "$E(X) = np$" 178 | ] 179 | }, 180 | { 181 | "cell_type": "markdown", 182 | "metadata": {}, 183 | "source": [ 184 | "Variância" 185 | ] 186 | }, 187 | { 188 | "cell_type": "markdown", 189 | "metadata": {}, 190 | "source": [ 191 | "$Var(X) = np(1-p)$" 192 | ] 193 | }, 194 | { 195 | "cell_type": "markdown", 196 | "metadata": {}, 197 | "source": [ 198 | "$X \\sim b(n,p)$" 199 | ] 200 | }, 201 | { 202 | "cell_type": "markdown", 203 | "metadata": {}, 204 | "source": [ 205 | "(Q10-2006)
\n", 206 | "0 - Se a variável aleatória Y segue uma distribuição Bernoulli com parâmetro p, então E(Y) = p (V).
\n", 207 | "1 - Uma soma de variáveis aleatórias Binomiais segue uma distribuição Bernoulli. (F)
" 208 | ] 209 | }, 210 | { 211 | "cell_type": "markdown", 212 | "metadata": {}, 213 | "source": [ 214 | "Em (1) o certo seria afirmar que uma soma de variáveis aleatórias independentes com distribuição de Bernoulli e com mesma probabilidade, seguem uma distribuição Binomial." 215 | ] 216 | }, 217 | { 218 | "cell_type": "markdown", 219 | "metadata": {}, 220 | "source": [ 221 | "#### 3. Distribuição de Geométrica" 222 | ] 223 | }, 224 | { 225 | "cell_type": "markdown", 226 | "metadata": {}, 227 | "source": [ 228 | "Características/uso" 229 | ] 230 | }, 231 | { 232 | "cell_type": "markdown", 233 | "metadata": {}, 234 | "source": [ 235 | "* Número de tentativas independentes de um experimento com dois resultados possíveis.\n", 236 | "* v.a.: número de tentativas até a ocorrência do primeiro sucesso.\n", 237 | " * Probabilidade de que o sucesso ocorra na k-ésima jogada.\n", 238 | " * Qual a probabilidade de que o dado dê sucesso (número desejado) na quarta jogada?\n", 239 | " * Teremos uma sequência de fracassos nas $k-1$ primeiras jogadas e sucesso apenas na k-ésima jogadas." 240 | ] 241 | }, 242 | { 243 | "cell_type": "markdown", 244 | "metadata": {}, 245 | "source": [ 246 | "Forma geral $P(X = k)$" 247 | ] 248 | }, 249 | { 250 | "cell_type": "markdown", 251 | "metadata": {}, 252 | "source": [ 253 | "$p+q = 1 \\Rightarrow q = 1-p$" 254 | ] 255 | }, 256 | { 257 | "cell_type": "markdown", 258 | "metadata": {}, 259 | "source": [ 260 | "$P(X=k)= (q)^{k-1}p = (1-p)^{k-1}p$" 261 | ] 262 | }, 263 | { 264 | "cell_type": "markdown", 265 | "metadata": {}, 266 | "source": [ 267 | "Esperança" 268 | ] 269 | }, 270 | { 271 | "cell_type": "markdown", 272 | "metadata": {}, 273 | "source": [ 274 | "$E(X) = \\dfrac{1}{p}$" 275 | ] 276 | }, 277 | { 278 | "cell_type": "markdown", 279 | "metadata": {}, 280 | "source": [ 281 | "Variância" 282 | ] 283 | }, 284 | { 285 | "cell_type": "markdown", 286 | "metadata": {}, 287 | "source": [ 288 | "$Var(X) = \\dfrac{1-p}{p^2}$" 289 | ] 290 | }, 291 | { 292 | "cell_type": "markdown", 293 | "metadata": {}, 294 | "source": [ 295 | "$X \\sim G(p)$" 296 | ] 297 | }, 298 | { 299 | "cell_type": "markdown", 300 | "metadata": {}, 301 | "source": [ 302 | "#### 4. Distribuição de Hipergeométrica" 303 | ] 304 | }, 305 | { 306 | "cell_type": "markdown", 307 | "metadata": {}, 308 | "source": [ 309 | "Características/uso" 310 | ] 311 | }, 312 | { 313 | "cell_type": "markdown", 314 | "metadata": {}, 315 | "source": [ 316 | "* Podemos aplicar tal distribuição se consideramos extrações casuais feitas sem reposição de uma determinada população dividida por dois atributos. Consideremos um população de $N$ objetos, $r$ dos quais têm o atributo $A$ e $N-r$ atributo B. Um grupo de $n$ elementos é escolhido ao acaso, sem reposição. Nosso interesse é calcular a probabilidade de que esse grupo contenha $k$ elementos com o atributo $A$.\n", 317 | "* v.a.:número de elementos na amostra que têm o atributo $A$." 318 | ] 319 | }, 320 | { 321 | "cell_type": "markdown", 322 | "metadata": {}, 323 | "source": [ 324 | "Forma geral $P(X = k)$" 325 | ] 326 | }, 327 | { 328 | "cell_type": "markdown", 329 | "metadata": {}, 330 | "source": [ 331 | " $P(X=k)=\\dfrac{\\left(\\begin{array}{ccc}r\\\\k\\end{array}\\right) \\left(\\begin{array}{ccc}N-r\\\\n-k\\end{array}\\right)}{\\left(\\begin{array}{ccc}N\\\\n\\end{array}\\right)}$" 332 | ] 333 | }, 334 | { 335 | "cell_type": "markdown", 336 | "metadata": {}, 337 | "source": [ 338 | "Esperança" 339 | ] 340 | }, 341 | { 342 | "cell_type": "markdown", 343 | "metadata": {}, 344 | "source": [ 345 | "$E(X) = np$" 346 | ] 347 | }, 348 | { 349 | "cell_type": "markdown", 350 | "metadata": {}, 351 | "source": [ 352 | "Variância" 353 | ] 354 | }, 355 | { 356 | "cell_type": "markdown", 357 | "metadata": {}, 358 | "source": [ 359 | "$Var(X) = np(1-p)\\dfrac{N-n}{N-1}$" 360 | ] 361 | }, 362 | { 363 | "cell_type": "markdown", 364 | "metadata": {}, 365 | "source": [ 366 | "Em que: $p = \\dfrac{r}{N}$." 367 | ] 368 | }, 369 | { 370 | "cell_type": "markdown", 371 | "metadata": {}, 372 | "source": [ 373 | "$X \\sim hip(N,r,n)$" 374 | ] 375 | }, 376 | { 377 | "cell_type": "markdown", 378 | "metadata": {}, 379 | "source": [ 380 | "#### 5. Distribuição de Poisson" 381 | ] 382 | }, 383 | { 384 | "cell_type": "markdown", 385 | "metadata": {}, 386 | "source": [ 387 | "Características/uso" 388 | ] 389 | }, 390 | { 391 | "cell_type": "markdown", 392 | "metadata": {}, 393 | "source": [ 394 | "* Podemos empregar a distribuição de Poisson quando desejamos contar o número de eventos de certo tipo que ocorrem num intervalo de tempo, ou superfície ou volume.\n", 395 | " * Número de chamadas recebidas por um telefone durante cinco minutos;\n", 396 | " * Número de falhas de um computador em um determinado dia;\n", 397 | " * Número de relatórios de acidentes enviados a uma companhia de seguros em uma dada semana.\n", 398 | "* Partimos de uma distribuição binominal, com o $p$ muito pequeno (tende a zero) e $n$ muito grande (tende a infinito).\n", 399 | "* v.a.:número de sucessos em um intervalo de tempo." 400 | ] 401 | }, 402 | { 403 | "cell_type": "markdown", 404 | "metadata": {}, 405 | "source": [ 406 | "Forma geral $P(X = k)$" 407 | ] 408 | }, 409 | { 410 | "cell_type": "markdown", 411 | "metadata": {}, 412 | "source": [ 413 | "$P(X=k)= \\dfrac{e^{- \\lambda}\\lambda^{k}}{k!}$" 414 | ] 415 | }, 416 | { 417 | "cell_type": "markdown", 418 | "metadata": {}, 419 | "source": [ 420 | "Esperança" 421 | ] 422 | }, 423 | { 424 | "cell_type": "markdown", 425 | "metadata": {}, 426 | "source": [ 427 | "$E(X)= \\lambda $" 428 | ] 429 | }, 430 | { 431 | "cell_type": "markdown", 432 | "metadata": {}, 433 | "source": [ 434 | "Variância" 435 | ] 436 | }, 437 | { 438 | "cell_type": "markdown", 439 | "metadata": {}, 440 | "source": [ 441 | "$Var(X) = \\lambda $" 442 | ] 443 | }, 444 | { 445 | "cell_type": "markdown", 446 | "metadata": {}, 447 | "source": [ 448 | "(Q6-2007) Seja X uma variável aleatória com distribuição de Poisson dada por $p_{x}(X) = \\dfrac{\\lambda^x e^{-\\lambda}}{x!}$ , $x = 0, 1, 2, \\dots$ . É correto afirmar que:
\n", 449 | "0 - $\\mathrm{E(X)} = \\lambda$ e $\\mathrm{Var(X)} = \\lambda^2$.
\n", 450 | "1 - $\\mathrm{E(X^2)} = \\lambda +\\lambda^2$.
\n", 451 | "2 - $\\mathrm{E(X)} = e^{-\\lambda}$.
\n", 452 | "3 - $\\mathrm{E(X)} = \\mathrm{Var(X)} = \\lambda$ .
\n", 453 | "4 - $\\mathrm{E(X)} = \\dfrac{\\lambda}{2}$ e $\\mathrm{Var(X)} = \\lambda$
" 454 | ] 455 | }, 456 | { 457 | "cell_type": "markdown", 458 | "metadata": {}, 459 | "source": [ 460 | "Sabemos que $\\mathrm{E(X)} =\\mathrm{Var(X)} = \\lambda $ e $E(X^2) = \\mathrm{Var(X)}+(\\mathrm{E(X)})^2 = \\lambda+\\lambda^2$. Então é fácil verificar que: 0-(F), 1-(V),2-(F),3-(V) e 4-(F)." 461 | ] 462 | }, 463 | { 464 | "cell_type": "markdown", 465 | "metadata": {}, 466 | "source": [ 467 | "Q3-2005
\n", 468 | "(1) Se $X_1, \\dots, X_n$ são variáveis aleatórias identicamente distribuídas com distribuição Bernoulli com parâmetro $p$, então, $Z = \\sum_{i = 1}^{n}X_i$ segue uma distribuição Poisson (F).
\n", 469 | "(3)Se $X$ é uma variável aleatória Poisson com média $\\lambda$, então, a variância de $X$ é $\\lambda^2$ (F)." 470 | ] 471 | }, 472 | { 473 | "cell_type": "markdown", 474 | "metadata": {}, 475 | "source": [ 476 | "# Distribuições contínuas" 477 | ] 478 | }, 479 | { 480 | "cell_type": "markdown", 481 | "metadata": {}, 482 | "source": [ 483 | "Uma função densidade de probabilidade $f(x)$ deve atender as seguintes restrições:\n", 484 | "1. $f(x) \\geq 0$\n", 485 | "2. $\\int_{-\\infty}^{+\\infty} f(x)dx = 1$" 486 | ] 487 | }, 488 | { 489 | "cell_type": "markdown", 490 | "metadata": {}, 491 | "source": [ 492 | "#### 1. Distribuição Uniforme" 493 | ] 494 | }, 495 | { 496 | "cell_type": "markdown", 497 | "metadata": {}, 498 | "source": [ 499 | "Uma variável aleatória contínua é dita uniforme no intervalo $\\left[a,b \\right]$, se sua fdp é definida como, tal que $X \\sim U\\left(\\left[a,b\\right]\\right)$:" 500 | ] 501 | }, 502 | { 503 | "cell_type": "markdown", 504 | "metadata": {}, 505 | "source": [ 506 | "$f(x) = \n", 507 | "\\begin{cases}\n", 508 | "k, \\;\\textrm{ se } a \\leq x \\leq b \\\\\n", 509 | "0, \\;\\textrm{ caso contrário} \\\\\n", 510 | "\\end{cases}\n", 511 | "$" 512 | ] 513 | }, 514 | { 515 | "cell_type": "markdown", 516 | "metadata": {}, 517 | "source": [ 518 | "Para encontrar o valor de $k$ aplicamos a condição $\\int_{-\\infty}^{\\infty} f(x)dx = 1$ de variável aleatória:" 519 | ] 520 | }, 521 | { 522 | "cell_type": "markdown", 523 | "metadata": {}, 524 | "source": [ 525 | "$\\int_{a}^{b}kdx = 1 \\Rightarrow k\\int_{a}^{b}dx =1 \\Rightarrow kx |_{a}^{b} =1$" 526 | ] 527 | }, 528 | { 529 | "cell_type": "markdown", 530 | "metadata": {}, 531 | "source": [ 532 | "Então:
\n", 533 | "$k(b-a)=1 \\Rightarrow$ $k = \\dfrac{1}{b-a}$" 534 | ] 535 | }, 536 | { 537 | "cell_type": "markdown", 538 | "metadata": {}, 539 | "source": [ 540 | "Logo:" 541 | ] 542 | }, 543 | { 544 | "cell_type": "markdown", 545 | "metadata": {}, 546 | "source": [ 547 | "$ f(x)=\n", 548 | "\\begin{cases}\n", 549 | "\\dfrac{1}{b-a},\\;\\textrm{ se } a \\leq x \\leq b \\\\\n", 550 | "0, \\;\\textrm{ caso contrário} \\\\\n", 551 | "\\end{cases}$" 552 | ] 553 | }, 554 | { 555 | "cell_type": "markdown", 556 | "metadata": {}, 557 | "source": [ 558 | "Forma geral $P(X = k)$" 559 | ] 560 | }, 561 | { 562 | "cell_type": "markdown", 563 | "metadata": {}, 564 | "source": [ 565 | "$f(x) = \\dfrac{1}{b-a}$, $\\forall x \\in \\left[a,b\\right]$" 566 | ] 567 | }, 568 | { 569 | "cell_type": "markdown", 570 | "metadata": {}, 571 | "source": [ 572 | "Esperança" 573 | ] 574 | }, 575 | { 576 | "cell_type": "markdown", 577 | "metadata": {}, 578 | "source": [ 579 | "$E(X) = \\dfrac{a+b}{2}$" 580 | ] 581 | }, 582 | { 583 | "cell_type": "markdown", 584 | "metadata": {}, 585 | "source": [ 586 | "Variância" 587 | ] 588 | }, 589 | { 590 | "cell_type": "markdown", 591 | "metadata": {}, 592 | "source": [ 593 | "$Var(X) = \\dfrac{\\left(b-a \\right)^2}{12}$" 594 | ] 595 | }, 596 | { 597 | "cell_type": "markdown", 598 | "metadata": {}, 599 | "source": [ 600 | "(Q10-2006) 4 - A variância de uma distribuição uniforme entre 0 e 2 é igual a 0,5 (F)." 601 | ] 602 | }, 603 | { 604 | "cell_type": "markdown", 605 | "metadata": {}, 606 | "source": [ 607 | "$\\mathrm{Var(X)} = \\dfrac{(b-a)^2}{12} = \\dfrac{(2-0)^2}{12} = \\dfrac{1}{3}$" 608 | ] 609 | }, 610 | { 611 | "cell_type": "markdown", 612 | "metadata": {}, 613 | "source": [ 614 | "(Q2-2008) 2 - Uma distribuição uniforme no intervalo [0,10] tem variância igual a 25/3. (V)" 615 | ] 616 | }, 617 | { 618 | "cell_type": "markdown", 619 | "metadata": {}, 620 | "source": [ 621 | "$\\mathrm{Var(X)} = \\dfrac{(b-a)^2}{12} = \\dfrac{(10-0)^2}{12} = \\dfrac{100}{12} = \\dfrac{25}{3} $" 622 | ] 623 | }, 624 | { 625 | "cell_type": "markdown", 626 | "metadata": {}, 627 | "source": [ 628 | "(Q1-2019)
\n", 629 | "0 - Uma dada variável aleatória com distribuição uniforme no intervalo [2,5] tem média\n", 630 | "igual a 3,50. (V)
\n", 631 | "1 - Uma dada variável aleatória com distribuição uniforme no intervalo [2,5] tem variância\n", 632 | "igual a 0,75 (V)." 633 | ] 634 | }, 635 | { 636 | "cell_type": "markdown", 637 | "metadata": {}, 638 | "source": [ 639 | "Resolução:" 640 | ] 641 | }, 642 | { 643 | "cell_type": "markdown", 644 | "metadata": {}, 645 | "source": [ 646 | "0 - $\\mathrm{E(X)} = \\dfrac{2+5}{2} = 3,5 (V)$
\n", 647 | "1 - $\\mathrm{Var(X)} = \\dfrac{(5-2)^2}{12} = \\dfrac{3}{4} = 0,75 (V)$" 648 | ] 649 | }, 650 | { 651 | "cell_type": "markdown", 652 | "metadata": {}, 653 | "source": [ 654 | "(Q14-2019) Seja X uma variável aleatória com distribuição uniforme no intervalo [a,b], em que b > a, e\n", 655 | "função densidade de probabilidade dada por:" 656 | ] 657 | }, 658 | { 659 | "cell_type": "markdown", 660 | "metadata": {}, 661 | "source": [ 662 | "$ f(x)=\n", 663 | "\\begin{cases}\n", 664 | "\\dfrac{1}{b-a},\\;\\textrm{ para } a \\leq x \\leq b \\\\\n", 665 | "0, \\;\\textrm{ para qualquer outro valor} \\\\\n", 666 | "\\end{cases}$" 667 | ] 668 | }, 669 | { 670 | "cell_type": "markdown", 671 | "metadata": {}, 672 | "source": [ 673 | "Então, considerando que c e d são constantes, podemos afirmar:
\n", 674 | "0 - A função distribuição acumulada de X é dada por: $F(X) = \\dfrac{x-a}{b-a}$ para $a \\leq x \\leq b$ e $F(X)=1$ para $x \\geq b$.
\n", 675 | "1 - $\\textrm{Prob}(c \\leq X \\leq d) = \\dfrac{d-a}{b-a}$, em que $a \\leq c < d \\leq b$.
\n", 676 | "2 - $E(X) = \\dfrac{a+b}{2}$
\n", 677 | "3 - $Var(X) = \\dfrac{\\left(b-a\\right)^2}{4}$
\n", 678 | "4 - $\\textrm{Prob}(c \\leq X \\leq b) = \\dfrac{b-c}{b-a}$, em que $a \\leq c < b$
" 679 | ] 680 | }, 681 | { 682 | "cell_type": "markdown", 683 | "metadata": {}, 684 | "source": [ 685 | "Resolução:" 686 | ] 687 | }, 688 | { 689 | "cell_type": "markdown", 690 | "metadata": {}, 691 | "source": [ 692 | "0 - $F(X) = \\int_{-\\infty}^{x}f(t)dt = \\int_{a}^{x}\\dfrac{1}{b-a}dt = \\dfrac{1}{b-a}t|_{a}^{x} = \\dfrac{x-a}{b-a}$ (V)
\n", 693 | "1 - $\\textrm{Prob}(c \\leq X \\leq d) = \\int_{c}^{d}\\dfrac{1}{b-a}dx = \\dfrac{d-c}{b-a}$ (F)
\n", 694 | "2 - $\\mathrm{E(X)} = \\dfrac{a+b}{2}$ (V)
\n", 695 | "3 - $\\mathrm{Var(X)} = \\dfrac{(b-a)^2}{12} (F)$
\n", 696 | "4 - $\\textrm{Prob}(c \\leq X \\leq b) = \\dfrac{b-c}{b-a} (V)$
" 697 | ] 698 | }, 699 | { 700 | "cell_type": "markdown", 701 | "metadata": {}, 702 | "source": [ 703 | "Demonstrações:" 704 | ] 705 | }, 706 | { 707 | "cell_type": "markdown", 708 | "metadata": {}, 709 | "source": [ 710 | "\\begin{eqnarray}\n", 711 | "\\mathrm{E(X)} & = & \\int_{a}^{b}\\dfrac{1}{b-a}xdx\\\\\n", 712 | "& = & \\dfrac{1}{b-a}\\dfrac{x^2}{2}|_{a}^{b} \\\\\n", 713 | "& = & \\dfrac{1}{b-a}\\left(\\dfrac{b^2}{2}-\\dfrac{a^2}{2}\\right) \\\\\n", 714 | "& = & \\dfrac{1}{b-a}\\left(\\dfrac{b^2-a^2}{2}\\right) \\\\\n", 715 | "& = & \\dfrac{(b-a)(b+a)}{(b-2)2} \\\\\n", 716 | "& = & \\dfrac{a+b}{2} \\\\\n", 717 | "\\end{eqnarray}" 718 | ] 719 | }, 720 | { 721 | "cell_type": "markdown", 722 | "metadata": {}, 723 | "source": [ 724 | "\\begin{eqnarray}\n", 725 | "\\mathrm{E(X^2)} & = & \\int_{a}^{b}\\dfrac{1}{b-a}x^2dx\\\\\n", 726 | "& = & \\dfrac{1}{b-a}\\dfrac{x^3}{3}|_{a}^{b}\\\\\n", 727 | "& = & \\dfrac{1}{3(b-a)}(b^3-a^3)\n", 728 | "\\end{eqnarray}" 729 | ] 730 | }, 731 | { 732 | "cell_type": "markdown", 733 | "metadata": {}, 734 | "source": [ 735 | "\\begin{eqnarray}\n", 736 | "\\mathrm{Var(X)} & = & \\dfrac{b^3-a^3}{3(b-a)}-\\left(\\dfrac{a+b}{2}\\right)^2 \\\\\n", 737 | "& = & \\dfrac{(b-a)(b^2+ab+a^2)}{3(b-a)}-\\dfrac{a^2+2ab+b^2}{4}\\\\\n", 738 | "& = & \\dfrac{b^2+ab+a^2}{3}-\\dfrac{a^2+2ab+b^2}{4} \\\\\n", 739 | "& = & \\dfrac{(b-a)^2}{12} \\\\\n", 740 | "\\end{eqnarray}" 741 | ] 742 | }, 743 | { 744 | "cell_type": "markdown", 745 | "metadata": {}, 746 | "source": [ 747 | "#### 2. Distribuição Exponencial" 748 | ] 749 | }, 750 | { 751 | "cell_type": "markdown", 752 | "metadata": {}, 753 | "source": [ 754 | "Forma geral $P(X = k)$" 755 | ] 756 | }, 757 | { 758 | "cell_type": "markdown", 759 | "metadata": {}, 760 | "source": [ 761 | "Uma variável $X$ tem distribuição de probablidade exponencial com $\\beta>0$ se, e somente se, sua f.d.p. é dada por, $X \\sim \\textrm{Exp}\\left(\\beta\\right)$:" 762 | ] 763 | }, 764 | { 765 | "cell_type": "markdown", 766 | "metadata": {}, 767 | "source": [ 768 | "$f(x) = \n", 769 | "\\begin{cases}\n", 770 | "\\dfrac{1}{\\beta}e^{(-\\frac{x}{\\beta})}, \\;\\forall x\\geq 0 \\\\\n", 771 | "0, \\;\\textrm{ caso contrário} \\\\\n", 772 | "\\end{cases}\n", 773 | "$" 774 | ] 775 | }, 776 | { 777 | "cell_type": "markdown", 778 | "metadata": {}, 779 | "source": [ 780 | "Esperança: $\\mathrm{E(X)} = \\beta$
\n", 781 | "Variância: $\\mathrm{Var(X)} = \\beta^2$" 782 | ] 783 | }, 784 | { 785 | "cell_type": "markdown", 786 | "metadata": {}, 787 | "source": [ 788 | "Ou ainda se:" 789 | ] 790 | }, 791 | { 792 | "cell_type": "markdown", 793 | "metadata": {}, 794 | "source": [ 795 | "$f(x) = \n", 796 | "\\begin{cases}\n", 797 | "\\beta e^{-\\beta x}, \\;\\forall x\\geq 0 \\\\\n", 798 | "0, \\;\\textrm{ caso contrário} \\\\\n", 799 | "\\end{cases}\n", 800 | "$" 801 | ] 802 | }, 803 | { 804 | "cell_type": "markdown", 805 | "metadata": {}, 806 | "source": [ 807 | "Esperança: $\\mathrm{E(X)} = \\dfrac{1}{\\beta}$
\n", 808 | "Variância: $\\mathrm{Var(X)} = \\dfrac{1}{\\beta^2}$" 809 | ] 810 | }, 811 | { 812 | "cell_type": "markdown", 813 | "metadata": {}, 814 | "source": [ 815 | "#### 3. Distribuição Normal" 816 | ] 817 | }, 818 | { 819 | "cell_type": "markdown", 820 | "metadata": {}, 821 | "source": [ 822 | "Uma v.a. tem distribuição normal com parâmetros $\\mu$ e $\\sigma^2$, ${-\\infty}<\\mu<{+\\infty}$ e $0<\\sigma^2<{\\infty}$ se sua densidade é dada por:" 823 | ] 824 | }, 825 | { 826 | "cell_type": "markdown", 827 | "metadata": {}, 828 | "source": [ 829 | "$$f(X;\\mu,\\sigma^2) = \\dfrac{1}{\\sigma\\sqrt{2\\pi}}e^{-\\left(X-\\mu\\right)^2/2\\sigma^2}, {-\\infty}0$" 890 | ] 891 | }, 892 | { 893 | "cell_type": "markdown", 894 | "metadata": {}, 895 | "source": [ 896 | "Dizemos que uma variável aleatória $X$ tem distribuição lognormal se, e somente se, o seu logaritmo tem distribuição normal (istoe é, uma outra distribuição igual a $Y = \\log{X}$, normalmente distribuída), com parâmetros $\\mu$ (valor esperado) e $\\sigma^2$ (variância).Usamos a notação: $X \\sim \\textrm{Lognormal}\\left(\\mu,\\sigma^2\\right), -\\infty< \\mu < +\\infty, \\sigma>0$. " 897 | ] 898 | }, 899 | { 900 | "cell_type": "markdown", 901 | "metadata": {}, 902 | "source": [ 903 | "$\\mathrm{E(X)} = e^{\\mu+\\sigma^2/2}$" 904 | ] 905 | }, 906 | { 907 | "cell_type": "markdown", 908 | "metadata": {}, 909 | "source": [ 910 | "$\\mathrm{Var(X)} = e^{2(\\mu+\\sigma^2)}-e^{2\\mu+\\sigma^2}$" 911 | ] 912 | }, 913 | { 914 | "cell_type": "markdown", 915 | "metadata": {}, 916 | "source": [ 917 | "$Md(X) = e^{\\mu}$
\n", 918 | "$Mo(X) = e^{\\mu-\\sigma^2}$" 919 | ] 920 | }, 921 | { 922 | "cell_type": "markdown", 923 | "metadata": {}, 924 | "source": [ 925 | "$E(X)>Md(X)>Mo(X) \\Rightarrow \\textrm{ distribuição assimétrica positiva ou assimétrica à direita}$" 926 | ] 927 | }, 928 | { 929 | "cell_type": "markdown", 930 | "metadata": {}, 931 | "source": [ 932 | "(Q3-2005) 4 - Se a variável X = lnY segue uma distribuição Normal, então, Y segue uma distribuição Lognormal (V).É exatamente a definição da distribuição." 933 | ] 934 | }, 935 | { 936 | "cell_type": "markdown", 937 | "metadata": {}, 938 | "source": [ 939 | "(Q10-2006) - Uma distribuição Lognormal é assimétrica à direita. (V)" 940 | ] 941 | }, 942 | { 943 | "cell_type": "markdown", 944 | "metadata": {}, 945 | "source": [ 946 | "(Q6-2012) \n", 947 | "3 - Suponha que $X$ seja uma variável aleatória com distribuição log normal com parâmetros $\\mu$ e $\\sigma$. Então, $Y = \\log(X)\\sim N\\left(\\mu,\\sigma^2\\right)$ (V).
\n", 948 | "4 - Suponha que $X$ seja uma variável aleatória com distribuição log normal com parâmetros $\\mu$ e $\\sigma$. Então, a esperança de $X$ é igual a $\\mu$ (F)." 949 | ] 950 | }, 951 | { 952 | "cell_type": "markdown", 953 | "metadata": {}, 954 | "source": [ 955 | "O item (3) é exatamente a definição da distribuição, então é verdadeiro. Já 4-(F) pois vimos que $\\mathrm{E(X)}= e^{\\left(\\mu+\\dfrac{1}{2}\\sigma^2 \\right)}$." 956 | ] 957 | }, 958 | { 959 | "cell_type": "markdown", 960 | "metadata": {}, 961 | "source": [ 962 | "#### 5. Distribuição Qui-quadrada" 963 | ] 964 | }, 965 | { 966 | "cell_type": "markdown", 967 | "metadata": {}, 968 | "source": [ 969 | "Uma distribuição contínua $X$, com valores positivos, terá distribuição qui-quadrado com $v$ graus de liberdade se sua função densidade for:" 970 | ] 971 | }, 972 | { 973 | "cell_type": "markdown", 974 | "metadata": {}, 975 | "source": [ 976 | "$f(x,v) = \n", 977 | "\\begin{cases}\n", 978 | "\\dfrac{1}{\\Gamma\\left(v/2\\right)2^{\\frac{v}{2}}}x^{(v/2)-1} e^{\\left(-\\frac{x}{2}\\right)},\\; x>0, v>0 \\\\\n", 979 | "0, \\; x<0 \\\\\n", 980 | "\\end{cases}\n", 981 | "$" 982 | ] 983 | }, 984 | { 985 | "cell_type": "markdown", 986 | "metadata": {}, 987 | "source": [ 988 | "$\\mathrm{E(X)}= v$
\n", 989 | "$\\mathrm{Var(X)} = 2v$" 990 | ] 991 | }, 992 | { 993 | "cell_type": "markdown", 994 | "metadata": {}, 995 | "source": [ 996 | "* O quadrado de uma v.a. com distribuição normal padrão é uma v.a. com distribuição $\\chi^2(1)$." 997 | ] 998 | }, 999 | { 1000 | "cell_type": "markdown", 1001 | "metadata": {}, 1002 | "source": [ 1003 | "* Se $X_1, \\dots, X_n$ são variáveis aleatórias independentes, com distribuições normais padronizadas, então, $\\sum_{i=1}^{n}X_i^{2}$ possui distribuição Qui-quadrado com n graus de liberdade." 1004 | ] 1005 | }, 1006 | { 1007 | "cell_type": "markdown", 1008 | "metadata": {}, 1009 | "source": [ 1010 | "(Q3-2005) 0 - Se $X$ é uma variável aleatória com distribuição Normal de média $\\mu$ e variância $\\sigma^2$ , então, $Z = \\dfrac{(X-\\mu)^2}{\\sigma^2}$ segue uma distribuição $\\chi^2$ com 1 grau de liberdade (V)." 1011 | ] 1012 | }, 1013 | { 1014 | "cell_type": "markdown", 1015 | "metadata": {}, 1016 | "source": [ 1017 | "(Q2-2006) 3 - Sejam Y e X variáveis aleatórias com distribuições Qui-quadrado com $p$ e $q$ graus de liberdade, respectivamente. Portanto, $Z = (Y/p)/(X/q)$ segue uma distribuição $F$ com $p$ e $q$ graus de liberdade(F)." 1018 | ] 1019 | }, 1020 | { 1021 | "cell_type": "markdown", 1022 | "metadata": {}, 1023 | "source": [ 1024 | "(Q2-2008) 1 - Se X segue uma distribuição Qui-quadrado com n graus de liberdade, então E(X) = n e\n", 1025 | "V(X) = 2n. (V)" 1026 | ] 1027 | }, 1028 | { 1029 | "cell_type": "markdown", 1030 | "metadata": {}, 1031 | "source": [ 1032 | "#### 6. Distribuição $t$ de Student" 1033 | ] 1034 | }, 1035 | { 1036 | "cell_type": "markdown", 1037 | "metadata": {}, 1038 | "source": [ 1039 | "Sejam Z e Y variáveis independentes, tal que $X \\sim N\\left(0,1\\right)$ e $Y \\sim \\chi^2{(v)} $, então a variável aleatória dada pela expressão a seguir tem distribuição $t$ de Student com $k$ graus de liberdade." 1040 | ] 1041 | }, 1042 | { 1043 | "cell_type": "markdown", 1044 | "metadata": {}, 1045 | "source": [ 1046 | "$t = \\dfrac{X}{\\sqrt{\\dfrac{Y}{v}}}$" 1047 | ] 1048 | }, 1049 | { 1050 | "cell_type": "markdown", 1051 | "metadata": {}, 1052 | "source": [ 1053 | "$\\mathrm{E(X)} = 0$
\n", 1054 | "$\\mathrm{Var(X)} = \\dfrac{v}{\\left(v-2\\right)}$, $v>2$" 1055 | ] 1056 | }, 1057 | { 1058 | "cell_type": "markdown", 1059 | "metadata": {}, 1060 | "source": [ 1061 | "#### 7. Distribuição F de Snedecor" 1062 | ] 1063 | }, 1064 | { 1065 | "cell_type": "markdown", 1066 | "metadata": {}, 1067 | "source": [ 1068 | "Sejam $U$ e $V$ duas v.a. independentes, cada uma com distribuição qui-quadrado, com $v_1$ e $v_2$ graus de liberdade, respectivamente. Então, a v.a. $W = \\dfrac{\\frac{U}{v_1}}{\\frac{V}{v_2}}$ tem distribuição $F$ de Snedecor com $v_1$ e $v_2$ graus de liberdade, $W \\sim F(v_1,v_2)$." 1069 | ] 1070 | }, 1071 | { 1072 | "cell_type": "markdown", 1073 | "metadata": {}, 1074 | "source": [ 1075 | "$U \\sim \\chi_{v1}^{2}$ e $V \\sim \\chi_{v2}^{2}$" 1076 | ] 1077 | }, 1078 | { 1079 | "cell_type": "markdown", 1080 | "metadata": {}, 1081 | "source": [ 1082 | "$E(W) = \\dfrac{v_2}{v_2-2}$" 1083 | ] 1084 | }, 1085 | { 1086 | "cell_type": "markdown", 1087 | "metadata": {}, 1088 | "source": [ 1089 | "$\\mathrm{Var(W)} = \\dfrac{2v_2^{2}\\left(v_1+v_2-2\\right)}{v_1\\left(v_2-2\\right)^2\\left(v_2-4\\right)}$" 1090 | ] 1091 | }, 1092 | { 1093 | "cell_type": "markdown", 1094 | "metadata": {}, 1095 | "source": [ 1096 | "(Q2-2008) 4 - Sejam $X_1$ e $X_2$ duas variáveis aleatórias independentes, com distribuição qui-quadrado com $n_1$ e $n_2$ graus de liberdade, respectivamente. Então $z = \\dfrac{\\frac{x_1}{n_1}}{\\frac{x_2}{n_2}}$ segue uma distribuição $F$ com $n_1$ e $n_2$ graus de liberdade. (V) É exatamente a definição." 1097 | ] 1098 | }, 1099 | { 1100 | "cell_type": "markdown", 1101 | "metadata": {}, 1102 | "source": [ 1103 | "#### 8. Relações importantes" 1104 | ] 1105 | }, 1106 | { 1107 | "cell_type": "markdown", 1108 | "metadata": {}, 1109 | "source": [ 1110 | "* Sejam $Z_i$, para $i = 1, \\cdots , n$, são normais independentes, então $\\sum Z_{i}^{2} \\sim \\chi_{(n)}^{2}$.\n", 1111 | "* Sejam $Z \\sim N(0,1)$ e $X \\sim \\chi_{(v)}^{2}$, independentes. Então : $\\dfrac{Z}{\\sqrt{\\frac{X}{v}}} \\sim t_{(v)}$.\n", 1112 | "* Se $t \\sim t_n$ temos que: $t_n^2 \\sim F(1,n)$.\n", 1113 | "* Se $x_1, \\cdots, x_n$, $n$ variáveis $\\chi_{(1)}^2$ independentes: $\\sum x_i \\sim \\chi_{(n)}^{2}$." 1114 | ] 1115 | }, 1116 | { 1117 | "cell_type": "markdown", 1118 | "metadata": {}, 1119 | "source": [ 1120 | "#### Questões ANPEC" 1121 | ] 1122 | }, 1123 | { 1124 | "cell_type": "markdown", 1125 | "metadata": {}, 1126 | "source": [ 1127 | "Q3-2017.
\n", 1128 | "São corretas as afirmativas:
\n", 1129 | "(0) - Se $X$ é uma variável aleatória com distribuição Binomial com parâmetros $n$ e $p$, em que $n$ é um número inteiro positivo e $0\n", 1130 | "(1) - Seja $X$ uma variável aleatória com distribuição de Poisson. Se $E(X) = \\lambda$, então a variância de $X$ é $\\lambda$.
\n", 1131 | "(2) - Se $X$ é uma variável aleatória uniformemente distribuída em $[-c,c]$, em que $c>0$, então $E(X) = 0$.
\n", 1132 | "(3) - Seja $X$ uma variável aleatória com distribuição de probabilidade $P(X = k) = (1-p)^{k-1}p$, em que $0\n", 1133 | "(4) - Seja $X$ uma variável aleatória com distribuição de probabilidade $P(X = k) = (1-p)^{k-1}p$, em que $0" 1134 | ] 1135 | }, 1136 | { 1137 | "cell_type": "markdown", 1138 | "metadata": {}, 1139 | "source": [ 1140 | "(0) (F) $E(X) = np$ e $Var(X) = np(1-p)$.
\n", 1141 | "(1) (V)
\n", 1142 | "(2) (V) $E(X) = \\dfrac{-c+c}{2} = 0$
\n", 1143 | "(3) Distribuição Geométrica: $E(X) = \\frac{1}{p}$.
\n", 1144 | "(4) (V) Distribuição Geométrica: $Var(X) = \\dfrac{(1-p)}{p^2}$." 1145 | ] 1146 | }, 1147 | { 1148 | "cell_type": "markdown", 1149 | "metadata": {}, 1150 | "source": [ 1151 | "Q14-2017" 1152 | ] 1153 | }, 1154 | { 1155 | "cell_type": "markdown", 1156 | "metadata": {}, 1157 | "source": [ 1158 | "Suponha que as vendas $(Q)$ do produto $X$ são aleatoriamente distribuídas na economia e possuem uma distribuição binomial com parâmetro $p$ (preço), sendo $n$ o número de vendas observado, então:\n", 1159 | "(0) - A esperança matemática de $Q$ é $E(Q) = n(1-p)$;
\n", 1160 | "(1) - A média das vendas é dada por $E(Q) = np$;
\n", 1161 | "(2) - A variância das vendas por $Q$ ou $V(Q) = np(1-p)$;
\n", 1162 | "(3) - O preço que maximiza a variância é $p = \\frac{1}{2}$;
\n", 1163 | "(4) - O preço está no intervalo $0$ e $1$.
" 1164 | ] 1165 | } 1166 | ], 1167 | "metadata": { 1168 | "kernelspec": { 1169 | "display_name": "Python 3", 1170 | "language": "python", 1171 | "name": "python3" 1172 | }, 1173 | "language_info": { 1174 | "codemirror_mode": { 1175 | "name": "ipython", 1176 | "version": 3 1177 | }, 1178 | "file_extension": ".py", 1179 | "mimetype": "text/x-python", 1180 | "name": "python", 1181 | "nbconvert_exporter": "python", 1182 | "pygments_lexer": "ipython3", 1183 | "version": "3.8.5" 1184 | } 1185 | }, 1186 | "nbformat": 4, 1187 | "nbformat_minor": 4 1188 | } 1189 | -------------------------------------------------------------------------------- /5. Distribuições_conjuntas.ipynb: -------------------------------------------------------------------------------- 1 | { 2 | "cells": [ 3 | { 4 | "cell_type": "markdown", 5 | "metadata": {}, 6 | "source": [ 7 | "# Distribuições conjuntas" 8 | ] 9 | }, 10 | { 11 | "cell_type": "markdown", 12 | "metadata": {}, 13 | "source": [ 14 | "#### 1. Distribuição conjunta de variáveis discretas" 15 | ] 16 | }, 17 | { 18 | "cell_type": "markdown", 19 | "metadata": {}, 20 | "source": [ 21 | "Sejam duas variáveis aleatórias discretas $X$ e $Y$, com os respectivos valores $X_1,X_2,\\dots,X_n$,$Y_1,Y_2,\\dots,Y_k$. Então $\\mathrm{P(X_i,Y_j)}$ é a probabilidade associada ao par $(X_i,Y_j)$. O conjunto de valores $X_i$,$Y_j$ e das respectivas probabilidades $P(X_i,Y_j)$ constitui a distribuição conjunta de $X,Y$. Temos ainda: $\\sum_i\\sum_j\\mathrm{P(X_i,Y_j)} = 1$." 22 | ] 23 | }, 24 | { 25 | "cell_type": "markdown", 26 | "metadata": {}, 27 | "source": [ 28 | " Exemplo" 29 | ] 30 | }, 31 | { 32 | "cell_type": "markdown", 33 | "metadata": {}, 34 | "source": [ 35 | "* Um time de vôlei em um campeonato possui probabilidade de ganhar ou perder igual a 0,5.\n", 36 | "* X é o número de vitórias obtidas nos três primeiros jogos.\n", 37 | "* Y assume o valor 1 se a vitória ocorrer no primeiro jogo, e 0 caso contrário.\n", 38 | "* V = vitória; D = derrota." 39 | ] 40 | }, 41 | { 42 | "cell_type": "markdown", 43 | "metadata": {}, 44 | "source": [ 45 | "\n", 46 | " \n", 47 | " \n", 48 | " \n", 49 | " \n", 50 | " \n", 51 | " \n", 52 | " \n", 53 | " \n", 54 | " \n", 55 | " \n", 56 | " \n", 57 | " \n", 58 | " \n", 59 | " \n", 60 | " \n", 61 | " \n", 62 | " \n", 63 | " \n", 64 | " \n", 65 | " \n", 66 | " \n", 67 | " \n", 68 | " \n", 69 | " \n", 70 | " \n", 71 | " \n", 72 | " \n", 73 | " \n", 74 | " \n", 75 | " \n", 76 | " \n", 77 | " \n", 78 | " \n", 79 | " \n", 80 | " \n", 81 | " \n", 82 | " \n", 83 | " \n", 84 | " \n", 85 | " \n", 86 | " \n", 87 | " \n", 88 | " \n", 89 | " \n", 90 | " \n", 91 | "
Resultados possíveisXY
VVV31
VVD21
VDV21
VDD11
DVV20
DDV10
DVD10
DDD00
" 92 | ] 93 | }, 94 | { 95 | "cell_type": "markdown", 96 | "metadata": {}, 97 | "source": [ 98 | "Probabilidades conjuntas de X e Y:" 99 | ] 100 | }, 101 | { 102 | "cell_type": "markdown", 103 | "metadata": {}, 104 | "source": [ 105 | "\n", 106 | " \n", 107 | " \n", 108 | " \n", 109 | " \n", 110 | " \n", 111 | " \n", 112 | " \n", 113 | " \n", 114 | " \n", 115 | " \n", 116 | " \n", 117 | " \n", 118 | " \n", 119 | " \n", 120 | " \n", 121 | " \n", 122 | " \n", 123 | " \n", 124 | " \n", 125 | " \n", 126 | " \n", 127 | " \n", 128 | " \n", 129 | " \n", 130 | " \n", 131 | " \n", 132 | " \n", 133 | " \n", 134 | " \n", 135 | " \n", 136 | " \n", 137 | " \n", 138 | " \n", 139 | " \n", 140 | " \n", 141 | " \n", 142 | " \n", 143 | " \n", 144 | " \n", 145 | " \n", 146 | " \n", 147 | " \n", 148 | " \n", 149 | "
X
0123P(Y)
Y01/82/81/801/2
101/82/81/81/2
P(X)1/83/83/81/81
" 150 | ] 151 | }, 152 | { 153 | "cell_type": "markdown", 154 | "metadata": {}, 155 | "source": [ 156 | "$P(X = 1) = P[(X=1 \\text{ e } Y=0) \\text{ ou } (X=1 \\text{ e } Y = 1)] = \\dfrac{2}{8}+\\dfrac{1}{8} = \\dfrac{3}{8}$" 157 | ] 158 | }, 159 | { 160 | "cell_type": "markdown", 161 | "metadata": {}, 162 | "source": [ 163 | "$P(Y = 0) = P(Y = 0 \\text{ e } X = 0)+P(Y = 0 \\text{ e } X = 1)+P(Y = 0 \\text{ e } X = 2)+P(Y = 0 \\text{ e } X = 3)=\\dfrac{1}{8}+\\dfrac{2}{8}+\\dfrac{1}{8}+0 = \\dfrac{1}{2}$" 164 | ] 165 | }, 166 | { 167 | "cell_type": "markdown", 168 | "metadata": {}, 169 | "source": [ 170 | "$P(X = 1 | Y = 1) = \\dfrac{P(X=1 \\text{ e } Y = 1)}{P(Y = 1)} = \\dfrac{1/8}{1/2} = \\dfrac{1}{4}$" 171 | ] 172 | }, 173 | { 174 | "cell_type": "markdown", 175 | "metadata": {}, 176 | "source": [ 177 | "$P(Y = 0 | X = 2) = \\dfrac{P(Y = 0 | X = 2)}{P(X = 2)} = \\dfrac{1/8}{3/8} = \\dfrac{1}{3}$" 178 | ] 179 | }, 180 | { 181 | "cell_type": "markdown", 182 | "metadata": {}, 183 | "source": [ 184 | "* Probabilidade de $X$ (ou seja, sem considerar $Y$) é a soma das probabilidades ao longo da coluna (distribuição marginal de $X$).\n", 185 | "* A distribuição de $Y$ é obtida da mesma forma somando-se as probabilidades ao longo da linha." 186 | ] 187 | }, 188 | { 189 | "cell_type": "markdown", 190 | "metadata": {}, 191 | "source": [ 192 | "* X e Y são independentes? (intuição)
\n", 193 | " * Se Y é 0, então é impossível que X seja 3;\n", 194 | " * Se Y é 1, então é impossível que X seja 0;\n", 195 | " * Podemos pensar então que X e Y não são independentes.\n", 196 | " " 197 | ] 198 | }, 199 | { 200 | "cell_type": "markdown", 201 | "metadata": {}, 202 | "source": [ 203 | "Vejamos outra forma de verificar se X e Y não são independentes." 204 | ] 205 | }, 206 | { 207 | "cell_type": "markdown", 208 | "metadata": {}, 209 | "source": [ 210 | "$P(X = 1 | Y = 1) = \\dfrac{1}{4}$
\n", 211 | "$P(X = 1) = \\dfrac{3}{8}$
\n", 212 | "Então, temos que $P(X = 1 | Y = 1) \\neq P(X = 1)$, e X e Y são dependentes, visto que a igualdade não se verificou." 213 | ] 214 | }, 215 | { 216 | "cell_type": "markdown", 217 | "metadata": {}, 218 | "source": [ 219 | "Vamos calcular agora $\\mathrm{E(X)}$, $\\mathrm{E(Y)}$, $\\mathrm{Var(X)}$, $\\mathrm{Var(Y)}$, $\\mathrm{Cov(X,Y)}$ e $\\mathrm{Corr(X, Y)}$." 220 | ] 221 | }, 222 | { 223 | "cell_type": "markdown", 224 | "metadata": {}, 225 | "source": [ 226 | "$\\mathrm{E(X)} = \\sum_{i = 1}^{n} X_iP(X_i)$
\n", 227 | "$\\mathrm{Var(X)} = \\mathrm{E(X^2)}-\\left[\\mathrm{E(X)}\\right]^2$
\n", 228 | "$\\mathrm{Var(Y)} = \\mathrm{E(Y^2)}-\\left[\\mathrm{E(Y)}\\right]^2$
\n", 229 | "$\\mathrm{Cov(X,Y)} = \\mathrm{E(XY)} - \\mathrm{E(X)E(Y)}$
\n", 230 | "$\\mathrm{Corr(X,Y)} = \\dfrac{\\mathrm{Cov(X,Y)}}{\\mathrm{dp(X)dp(Y)}}$
\n", 231 | "
\n", 232 | "
\n", 233 | "$\\mathrm{E(X)} = 0 \\times \\dfrac{1}{8} + 1 \\times \\dfrac{3}{8} +2 \\times \\dfrac{3}{8} +3 \\times \\dfrac{1}{8} = \\dfrac{10}{8} = 1,25$
\n", 234 | "$\\mathrm{E(Y)} = 0 \\times \\dfrac{1}{2}+1 \\times \\dfrac{1}{2} = 0,5$
\n", 235 | "\n", 236 | "$\\mathrm{E(X^2)} = 0^2 \\times \\dfrac{1}{8} + 1^2 \\times \\dfrac{3}{8} +2^2 \\times \\dfrac{3}{8} +3^2 \\times \\dfrac{1}{8}= \\dfrac{24}{8} = 3$
\n", 237 | "$\\mathrm{E(Y^2)} = 0^2 \\times \\dfrac{1}{2}+1^2 \\times \\dfrac{1}{2} = 0,5 $
\n", 238 | "$\\mathrm{Var(X)} = 1,4375$
\n", 239 | "$\\mathrm{Var(Y)} = 0,25$" 240 | ] 241 | }, 242 | { 243 | "cell_type": "markdown", 244 | "metadata": {}, 245 | "source": [ 246 | "Calculemos agora $\\mathrm{Cov(X,Y)}$." 247 | ] 248 | }, 249 | { 250 | "cell_type": "markdown", 251 | "metadata": {}, 252 | "source": [ 253 | "\n", 254 | " \n", 255 | " \n", 256 | " \n", 257 | " \n", 258 | " \n", 259 | " \n", 260 | " \n", 261 | " \n", 262 | " \n", 263 | " \n", 264 | " \n", 265 | " \n", 266 | " \n", 267 | " \n", 268 | " \n", 269 | " \n", 270 | " \n", 271 | " \n", 272 | " \n", 273 | " \n", 274 | " \n", 275 | " \n", 276 | " \n", 277 | " \n", 278 | " \n", 279 | " \n", 280 | " \n", 281 | " \n", 282 | " \n", 283 | " \n", 284 | " \n", 285 | " \n", 286 | " \n", 287 | " \n", 288 | " \n", 289 | " \n", 290 | " \n", 291 | " \n", 292 | " \n", 293 | " \n", 294 | " \n", 295 | " \n", 296 | " \n", 297 | " \n", 298 | " \n", 299 | "
XYXY
313
212
212
111
200
100
100
000
" 300 | ] 301 | }, 302 | { 303 | "cell_type": "markdown", 304 | "metadata": {}, 305 | "source": [ 306 | "$\\mathrm{P(XY = 0)} = \\dfrac{4}{8}$
\n", 307 | "$\\mathrm{P(XY = 1)} = \\dfrac{1}{8}$
\n", 308 | "$\\mathrm{P(XY = 2)} = \\dfrac{2}{8}$
\n", 309 | "$\\mathrm{P(XY = 3)} = \\dfrac{1}{8}$
" 310 | ] 311 | }, 312 | { 313 | "cell_type": "markdown", 314 | "metadata": {}, 315 | "source": [ 316 | "$\\mathrm{E(XY)} = 0 \\times \\dfrac{4}{8}+1 \\times \\dfrac{1}{8} +2 \\times \\dfrac{2}{8} +3 \\times \\dfrac{1}{8} =1 $
\n", 317 | "$\\mathrm{Cov(X,Y)} = \\mathrm{E(XY)}-\\mathrm{E(X)E(Y)} = 0,375$
\n", 318 | "$\\mathrm{Corr(X,Y)} = \\dfrac{0,375}{\\sqrt{1,4375 \\times 0,25}} = 0,6255 $" 319 | ] 320 | }, 321 | { 322 | "cell_type": "markdown", 323 | "metadata": {}, 324 | "source": [ 325 | "Vamos calcular $\\mathrm{E(X|Y=0)}$." 326 | ] 327 | }, 328 | { 329 | "cell_type": "markdown", 330 | "metadata": {}, 331 | "source": [ 332 | "$P(X = 0 | Y = 0) = \\dfrac{1/8}{1/2} = \\dfrac{1}{4}$
\n", 333 | "$P(X = 1 | Y = 0) = \\dfrac{1}{2}$
\n", 334 | "$P(X = 2 | Y = 0) = \\dfrac{1}{4}$
\n", 335 | "$P(X = 3 | Y = 0) = 0$
\n", 336 | "$E(X|Y=0) = 0 \\times \\dfrac{1}{4} + 1 \\times \\dfrac{1}{2} + 2 \\times \\dfrac{1}{4}+3 \\times 0 = 1$" 337 | ] 338 | }, 339 | { 340 | "cell_type": "markdown", 341 | "metadata": {}, 342 | "source": [ 343 | "(Q10-2017) Considere a distribuição de probabilidade conjunta das variáveis aleatórias $X$ e $Y$, de acordo com a tabela abaixo:" 344 | ] 345 | }, 346 | { 347 | "cell_type": "markdown", 348 | "metadata": {}, 349 | "source": [ 350 | "\n", 351 | " \n", 352 | " \n", 353 | " \n", 354 | " \n", 355 | " \n", 356 | " \n", 357 | " \n", 358 | " \n", 359 | " \n", 360 | " \n", 361 | " \n", 362 | " \n", 363 | " \n", 364 | " \n", 365 | " \n", 366 | " \n", 367 | " \n", 368 | " \n", 369 | " \n", 370 | " \n", 371 | " \n", 372 | " \n", 373 | " \n", 374 | " \n", 375 | " \n", 376 | " \n", 377 | " \n", 378 | " \n", 379 | " \n", 380 | " \n", 381 | " \n", 382 | "
X
0123
Y11/41/81/81/4
201/81/80
" 383 | ] 384 | }, 385 | { 386 | "cell_type": "markdown", 387 | "metadata": {}, 388 | "source": [ 389 | "Pode-se afirmar que:" 390 | ] 391 | }, 392 | { 393 | "cell_type": "markdown", 394 | "metadata": {}, 395 | "source": [ 396 | "0 - $\\mathrm{E(X)} = \\dfrac{3}{2}$. (V)
\n", 397 | "1 - $\\mathrm{Var(X)} = 1$. (F)
\n", 398 | "2 - $\\mathrm{Cov(X,Y)} = 0$.(V)
\n", 399 | "3 - $\\mathrm{Var(X|Y=2)} = 1$.(F)
\n", 400 | "4 - Se $Z = 2X+4Y$, então $\\mathrm{Var(Z)} = 4$. (F)
" 401 | ] 402 | }, 403 | { 404 | "cell_type": "markdown", 405 | "metadata": {}, 406 | "source": [ 407 | "\n", 408 | " \n", 409 | " \n", 410 | " \n", 411 | " \n", 412 | " \n", 413 | " \n", 414 | " \n", 415 | " \n", 416 | " \n", 417 | " \n", 418 | " \n", 419 | " \n", 420 | " \n", 421 | " \n", 422 | " \n", 423 | " \n", 424 | " \n", 425 | " \n", 426 | " \n", 427 | " \n", 428 | " \n", 429 | " \n", 430 | " \n", 431 | " \n", 432 | " \n", 433 | " \n", 434 | " \n", 435 | " \n", 436 | " \n", 437 | " \n", 438 | " \n", 439 | " \n", 440 | " \n", 441 | " \n", 442 | " \n", 443 | " \n", 444 | " \n", 445 | " \n", 446 | " \n", 447 | " \n", 448 | " \n", 449 | " \n", 450 | " \n", 451 | " \n", 452 | "
X
0123P(Y)
Y11/41/81/81/43/4
201/81/801/4
P(X)1/41/41/41/41
" 453 | ] 454 | }, 455 | { 456 | "cell_type": "markdown", 457 | "metadata": {}, 458 | "source": [ 459 | "0 - $E(X) = 0 \\times \\dfrac{1}{4}+1 \\times \\dfrac{1}{4}+2 \\times \\dfrac{1}{4}+3 \\times \\dfrac{1}{4} = \\dfrac{6}{4} = \\dfrac{3}{2}$
\n", 460 | "1 - Lembrete: $\\mathrm{Var(X)} = \\mathrm{E(X^2)}-\\left[\\mathrm{E(X)}\\right]^2$.
\n", 461 | "$E(X^2) = 0^2 \\times \\dfrac{1}{4}+1^2 \\times \\dfrac{1}{4}+2^2 \\times \\dfrac{1}{4}+3^2 \\times \\dfrac{1}{4} = \\dfrac{14}{4} = \\dfrac{7}{2} $
\n", 462 | "$Var(X) = \\dfrac{7}{2}-\\left(\\dfrac{3}{2}\\right)^2 = \\dfrac{5}{4}$
\n", 463 | "2 - Lembrete: $\\mathrm{Cov(X,Y)} = \\mathrm{E(XY)}-\\mathrm{E(X)E(Y)}$." 464 | ] 465 | }, 466 | { 467 | "cell_type": "markdown", 468 | "metadata": {}, 469 | "source": [ 470 | "$E(XY) = \\frac{1}{4} \\times 1 \\times 0+\\frac{1}{8} \\times 1 \\times 1 + \\frac{1}{8} \\times 2 \\times 1 + \\frac{1}{4} \\times 1 \\times 3+0 \\times 2 \\times 0 +\\frac{1}{8}\\times 2 \\times 1+\\frac{1}{8}\\times 2 \\times 2 +0 \\times 2 \\times 3 = \\frac{15}{8}$" 471 | ] 472 | }, 473 | { 474 | "cell_type": "markdown", 475 | "metadata": {}, 476 | "source": [ 477 | "Precisamos agora calcular $E(Y)$." 478 | ] 479 | }, 480 | { 481 | "cell_type": "markdown", 482 | "metadata": {}, 483 | "source": [ 484 | "$\\mathrm{E(Y)} = \\dfrac{3}{4} \\times 1+ \\dfrac{1}{4}\\times 2 = \\dfrac{5}{4}$
\n", 485 | "$\\mathrm{Cov(X,Y)} = \\dfrac{15}{8}-\\dfrac{3}{2}\\times\\dfrac{5}{4} = 0$" 486 | ] 487 | }, 488 | { 489 | "cell_type": "markdown", 490 | "metadata": {}, 491 | "source": [ 492 | "3 -
$\\mathrm{E(X|Y=2)} = \\dfrac{1}{8} \\times 1 + \\dfrac{1}{8} \\times 2 = \\dfrac{3}{8}$\n", 493 | "
$\\mathrm{E(X^2|Y=2)} = \\dfrac{1}{8} \\times 1^2 + \\dfrac{1}{8} \\times 2^2 = \\dfrac{5}{8}$
\n", 494 | "$\\mathrm{Var(X|Y = 2)} = \\mathrm{E(X^2|Y=2)}-\\left(\\mathrm{E(X|Y=2)}\\right)^2 = \\dfrac{5}{8}-\\left(\\dfrac{3}{8}\\right)^2 = \\dfrac{31}{64}$
\n", 495 | "4 - \n", 496 | "
$\\mathrm{Var(Z)} = \\mathrm{Var(2X+4Y)} = \\mathrm{Var(2X)}+\\mathrm{Var(4Y)}+2\\times2\\times\\times4\\mathrm{Cov(X,Y)} =4\\mathrm{Var(X)}+16\\mathrm{Var(Y)}+16\\mathrm{Cov(X,Y)}$" 497 | ] 498 | }, 499 | { 500 | "cell_type": "markdown", 501 | "metadata": {}, 502 | "source": [ 503 | "Precisamos calcular $\\mathrm{Var(Y)}$." 504 | ] 505 | }, 506 | { 507 | "cell_type": "markdown", 508 | "metadata": {}, 509 | "source": [ 510 | "$E(Y^2) = 1^2 \\times \\dfrac{3}{4}+2^2\\times\\dfrac{1}{4}=\\dfrac{7}{4}$" 511 | ] 512 | }, 513 | { 514 | "cell_type": "markdown", 515 | "metadata": {}, 516 | "source": [ 517 | "$Var(Y) = \\dfrac{7}{4}-\\left(\\dfrac{5}{4}\\right)^2 = \\dfrac{3}{16}$" 518 | ] 519 | }, 520 | { 521 | "cell_type": "markdown", 522 | "metadata": {}, 523 | "source": [ 524 | "$Var(Z) = 4Var(X)+16Var(Y)+16Cov(X,Y) = 4 \\times \\dfrac{5}{4}+16\\times \\dfrac{3}{16}+16 \\times 0 = 8$" 525 | ] 526 | }, 527 | { 528 | "cell_type": "markdown", 529 | "metadata": {}, 530 | "source": [ 531 | "#### 2. Distribuição conjunta de variáveis contínuas" 532 | ] 533 | }, 534 | { 535 | "cell_type": "markdown", 536 | "metadata": {}, 537 | "source": [ 538 | "Seja uma função densidade de probabilidade (f.d.p.) conjunta $f(x,y)$, a probabilidade de que $x$ esteja entre $]a,b[$ e $y$ em $]c,d[$ é:\n", 539 | "$$\\mathrm{P(a\n", 584 | "$g(x)=\\int_{-\\infty}^{+\\infty}f(x,y)dy$
\n", 585 | "$h(y) = \\int_{-\\infty}^{+\\infty}f(x,y)dx$" 586 | ] 587 | }, 588 | { 589 | "cell_type": "markdown", 590 | "metadata": {}, 591 | "source": [ 592 | "Podemos definir então a esperança e a variância em termos das funções marginais definidas anteriormente:" 593 | ] 594 | }, 595 | { 596 | "cell_type": "markdown", 597 | "metadata": {}, 598 | "source": [ 599 | "$\\mathrm{E(X)} = \\int_{-\\infty}^{+\\infty}xg(x)dx$" 600 | ] 601 | }, 602 | { 603 | "cell_type": "markdown", 604 | "metadata": {}, 605 | "source": [ 606 | "$\\mathrm{Var(X)} = \\int_{-\\infty}^{+\\infty}x^2g(x)dx-\\left[ \\int_{-\\infty}^{+\\infty}xg(x)dx \\right]^2$" 607 | ] 608 | }, 609 | { 610 | "cell_type": "markdown", 611 | "metadata": {}, 612 | "source": [ 613 | "A covariância é definida como:
\n", 614 | "$\\mathrm{Cov(X,Y)} = \\mathrm{E(XY)}-\\mathrm{E(X)}\\mathrm{E(Y)}$
\n", 615 | "$\\mathrm{Cov(X,Y)} = \\int_{-\\infty}^{+\\infty}\\left(X-\\mathrm{E(X)}\\right)\\left(Y-\\mathrm{E(Y)}\\right)dx dy = \\int_{-\\infty}^{+\\infty}\\int_{-\\infty}^{+\\infty}xyf(x,y)dxdy-\\left[ \\int_{-\\infty}^{+\\infty}xf(x,y)dxdy \\right]\\left[ \\int_{-\\infty}^{+\\infty}yf(x,y)dxdy \\right]$
\n", 616 | "Podemos ainda definir a covariância em termos das funções marginais:
\n", 617 | "$\\mathrm{Cov(X,Y)} = \\int_{-\\infty}^{+\\infty}\\int_{-\\infty}^{+\\infty}xyf(x,y)dxdy-\\left[\\int_{-\\infty}^{+\\infty}xg(x)dx \\right] \\left[\\int_{-\\infty}^{+\\infty}yh(y)dy \\right]$" 618 | ] 619 | }, 620 | { 621 | "cell_type": "markdown", 622 | "metadata": {}, 623 | "source": [ 624 | "A esperança condicional de $X$ será dada por:
\n", 625 | "$\\mathrm{E(x|y=y_{0})} = \\int_{-\\infty}^{+\\infty}xf_{x|y}dx$" 626 | ] 627 | }, 628 | { 629 | "cell_type": "markdown", 630 | "metadata": {}, 631 | "source": [ 632 | "Lembremos que a probabilidade condicional é definida como $P(A|B)=\\dfrac{P(A \\cap B)}{P(B)}$. Definiremos então a probabilidade condicional de uma v.a. conjunta. Notemos que, $P(A \\cap B)$ é a própria probabilidade conjunta (a probabilidade de $x$ e $y$ é obtida pela f.d.p. conjunta). Então a f.d.p. condicional de $x$ (dado $y$), $f_{x|y}$ é:
\n", 633 | "$f_{x|y} = \\dfrac{f(x,y)}{h(y)}$
\n", 634 | "Igualmente, definimos $f_{y|x}$:
\n", 635 | "$f_{y|x} = \\dfrac{f(x,y)}{g(x)}$" 636 | ] 637 | }, 638 | { 639 | "cell_type": "markdown", 640 | "metadata": {}, 641 | "source": [ 642 | "Se $f_{x|y} = g(x)$ e $f_{y|x} = h(y)$, ou seja, as probabilidades condicionais são iguais às não-condicionais, dizemos que $X$ e $Y$ são independentes tal que $f(x,y)=g(x)h(y)$." 643 | ] 644 | }, 645 | { 646 | "cell_type": "markdown", 647 | "metadata": {}, 648 | "source": [ 649 | "Então, no caso contínuo se $X$ e $Y$ são independentes $f(x,y) = g(x)h(y)$." 650 | ] 651 | }, 652 | { 653 | "cell_type": "markdown", 654 | "metadata": {}, 655 | "source": [ 656 | "Vamos definir agora uma f.d.p conjunta para três variáveis $f: \\mathbb{R}^3 \\rightarrow \\mathbb{R}$, com as propriedades a seguir:
\n", 657 | "1. $f(x,y,z) \\geq 0 $\n", 658 | "2. $\\int_{-\\infty}^{+\\infty}\\int_{-\\infty}^{+\\infty}\\int_{-\\infty}^{+\\infty}f(x,y,z)dxdydz = 1$" 659 | ] 660 | }, 661 | { 662 | "cell_type": "markdown", 663 | "metadata": {}, 664 | "source": [ 665 | "Podemos então definir a probabilidade em intervalo :
\n", 666 | "$P(a\n", 674 | "$g(x) = \\int_{-\\infty}^{+\\infty}\\int_{-\\infty}^{+\\infty}f(x,y,z)dydz = \\int_{z}\\int_{y}f(x,y,z)dydz$
\n", 675 | "$h(y) = \\int_{-\\infty}^{+\\infty}\\int_{-\\infty}^{+\\infty}f(x,y,z)dxdz = \\int_{z}\\int_{x}f(x,y,z)dxdz$
\n", 676 | "$k(z) = \\int_{-\\infty}^{+\\infty}\\int_{-\\infty}^{+\\infty}f(x,y,z)dxdy = \\int_{y}\\int_{x}f(x,y,z)dxdy$
\n" 677 | ] 678 | }, 679 | { 680 | "cell_type": "markdown", 681 | "metadata": {}, 682 | "source": [ 683 | "# Questões Anpec" 684 | ] 685 | }, 686 | { 687 | "cell_type": "markdown", 688 | "metadata": {}, 689 | "source": [ 690 | "Q14-2017" 691 | ] 692 | }, 693 | { 694 | "cell_type": "markdown", 695 | "metadata": {}, 696 | "source": [ 697 | "Suponha que as vendas $(Q)$ do produto $X$ são aleatoriamente distribuídas na economia e possuem uma distribuição binomial com parâmetro $p$ (preço), sendo $n$ o número de vendas observado, então:
\n", 698 | "(0) - A esperança matemática de $Q$ é $E(Q) = n(1-p)$;
\n", 699 | "(1) - A média das vendas é dada por $E(Q) = np$;
\n", 700 | "(2) - A variância das vendas por $Q$ ou $V(Q) = np(1-p)$;
\n", 701 | "(3) - O preço que maximiza a variância é $p = \\frac{1}{2}$;
\n", 702 | "(4) - O preço está no intervalo $0$ e $1$.
" 703 | ] 704 | }, 705 | { 706 | "cell_type": "markdown", 707 | "metadata": {}, 708 | "source": [ 709 | "(0) (F)Se $(Q)$ segue uma distribuição binomial então: $E(Q) = np$.
\n", 710 | "(1) (V)
\n", 711 | "(2) (V) $V(Q) = np(1-p)$
\n", 712 | "(3) $\\max_{p} Var(Q) = np(1-p) = np-np^2$; $\\dfrac{dVar(Q)}{dp} = n-2np = 0 \\Rightarrow p = \\frac{1}{2}$; CSO: $\\dfrac{dVar(Q)}{d^2p} = -2n < 0 $
\n", 713 | "(4) (V) Parâmetro da v.a. que denota a probabilidade de ocorrência de uma venda tal que $p \\in [0,1]$.
" 714 | ] 715 | }, 716 | { 717 | "cell_type": "markdown", 718 | "metadata": {}, 719 | "source": [ 720 | "(Q7-2011) Considere a seguinte função de densidade conjunta de duas variávis aleatórias contínuas X e Y dada por: " 721 | ] 722 | }, 723 | { 724 | "cell_type": "markdown", 725 | "metadata": {}, 726 | "source": [ 727 | "$f_{xy}(x,y) = \n", 728 | "\\begin{cases}\n", 729 | "kx^2y, \\; 0 \\leq x \\leq 1, 0 \\leq y \\leq 1 \\\\\n", 730 | "0, \\;\\textrm{ caso contrário} \\\\\n", 731 | "\\end{cases}\n", 732 | "$" 733 | ] 734 | }, 735 | { 736 | "cell_type": "markdown", 737 | "metadata": {}, 738 | "source": [ 739 | "\n", 740 | "0 - Para que $f_{xy}(x,y)$ satisfaça as propriedades de uma função densidade conjunta, $k=6$. (V)
\n", 741 | "1 - A densidade marginal de $Y$ é dada por $f_{y}(y) = 3y^2$. (F)
\n", 742 | "2 - A densidade de Y, condicional em $X=2$, é igual a $f_{y|x}(y|x=2) = 2y$. (V)
\n", 743 | "3 - X e Y são variáveis aleatórias não correlacionadas.(V)
\n", 744 | "4 - A variância de $Y$, condicional em $X=2$,é igual a $\\dfrac{1}{9}$.(F)
" 745 | ] 746 | }, 747 | { 748 | "cell_type": "markdown", 749 | "metadata": {}, 750 | "source": [ 751 | "(0) (V)- Lembrete: $\\int_{-\\infty}^{+\\infty}\\int_{-\\infty}^{+\\infty}f(x,y)dxdy = 1$." 752 | ] 753 | }, 754 | { 755 | "cell_type": "markdown", 756 | "metadata": {}, 757 | "source": [ 758 | "$\\int_{0}^{1}\\int_{0}^{1} kx^2y dxdy = 1 \\Rightarrow k\\int_{0}^{1}\\left[y\\dfrac{x^3}{3}\\right]_{0}^{1}dy = 1 \\Rightarrow \\dfrac{k}{3}\\int_{0}^{1}ydy = 1 \\Rightarrow \\dfrac{k}{3}\\dfrac{y^2}{2}|_{0}^{1} = 1 \\Rightarrow k = 6$" 759 | ] 760 | }, 761 | { 762 | "cell_type": "markdown", 763 | "metadata": {}, 764 | "source": [ 765 | "(1) (F) - Lembrete: $f(y) = \\int_{-\\infty}^{+\\infty}f(x,y)dx$." 766 | ] 767 | }, 768 | { 769 | "cell_type": "markdown", 770 | "metadata": {}, 771 | "source": [ 772 | "$f_y(y) = \\int_{0}^{1}6x^2y dx = 6y \\int_{0}^{1} x^2 dx = 6y \\dfrac{x^3}{3}|_0^1 = 2y$" 773 | ] 774 | }, 775 | { 776 | "cell_type": "markdown", 777 | "metadata": {}, 778 | "source": [ 779 | "(2) (A) $f_{y|x} = \\dfrac{f(x,y)}{f_x(x)}$" 780 | ] 781 | }, 782 | { 783 | "cell_type": "markdown", 784 | "metadata": {}, 785 | "source": [ 786 | "$f_x(x) = \\int_{0}^{1} 6x^2 y dy = 6x^2 \\int_{0}^{1}ydy = 6x^2 \\dfrac{y^2}{2}|_0^1 = 3x^2$" 787 | ] 788 | }, 789 | { 790 | "cell_type": "markdown", 791 | "metadata": {}, 792 | "source": [ 793 | "$f_{y|x} = \\dfrac{6x^2y}{3x} = 2y , 0 \\le y \\le 1$ e $f_{y|x} = 0$ caso contrário." 794 | ] 795 | }, 796 | { 797 | "cell_type": "markdown", 798 | "metadata": {}, 799 | "source": [ 800 | "Logo: $f_{y|x} = f(y)$." 801 | ] 802 | }, 803 | { 804 | "cell_type": "markdown", 805 | "metadata": {}, 806 | "source": [ 807 | "(3) (V)" 808 | ] 809 | }, 810 | { 811 | "cell_type": "markdown", 812 | "metadata": {}, 813 | "source": [ 814 | "$X$ e $Y$ são independentes, logo não correlacionadas. Note ainda que : $f(x,y) = f_x(x)f_y(y)$." 815 | ] 816 | }, 817 | { 818 | "cell_type": "markdown", 819 | "metadata": {}, 820 | "source": [ 821 | "(4) (F)" 822 | ] 823 | }, 824 | { 825 | "cell_type": "markdown", 826 | "metadata": {}, 827 | "source": [ 828 | "$Var(Y|X) = E(Y^2|X) - \\left[E(Y|X)\\right]^2$" 829 | ] 830 | }, 831 | { 832 | "cell_type": "markdown", 833 | "metadata": {}, 834 | "source": [ 835 | "$E(Y | X) = \\int_{0}^{1} y f(y|x) dy = \\int_{0}^{1} 2y^2 dy = \\dfrac{2}{3}y^3|_0^1 = \\frac{2}{3}$" 836 | ] 837 | }, 838 | { 839 | "cell_type": "markdown", 840 | "metadata": {}, 841 | "source": [ 842 | "$E(Y^2|X) = \\int_{0}^{1}y^2 f(y|x)dy = \\int_{0}^{1} 2y^3 dy = \\frac{1}{2}y^4|_0^1 = \\frac{1}{2}$" 843 | ] 844 | }, 845 | { 846 | "cell_type": "markdown", 847 | "metadata": {}, 848 | "source": [ 849 | "$Var(Y|X) = \\dfrac{1}{2}-\\left(\\dfrac{2}{3}\\right)^2 = \\dfrac{9-8}{18} = \\dfrac{1}{18}$" 850 | ] 851 | }, 852 | { 853 | "cell_type": "markdown", 854 | "metadata": {}, 855 | "source": [ 856 | "(Q14-2003) Considere o vetor aleatório $X = (X_1,X_2,X_3)$ com distribuição de probabilidade:" 857 | ] 858 | }, 859 | { 860 | "cell_type": "markdown", 861 | "metadata": {}, 862 | "source": [ 863 | "$f_{X}(X_1,X_2,X_3) = \n", 864 | "\\begin{cases}\n", 865 | "6x_1x_2^{2}x_3, \\; 0 \\leq x_1 \\leq 1, 0 \\leq x_2 \\leq 1, 0 \\leq x_3 \\leq \\sqrt{2} \\\\\n", 866 | "0, \\;\\textrm{ caso contrário} \\\\\n", 867 | "\\end{cases}\n", 868 | "$" 869 | ] 870 | }, 871 | { 872 | "cell_type": "markdown", 873 | "metadata": {}, 874 | "source": [ 875 | "Encontre a probabilidade de $0 \\leq x_1 \\leq 0,5$. (Multiplique o resultado por 100)." 876 | ] 877 | }, 878 | { 879 | "cell_type": "markdown", 880 | "metadata": {}, 881 | "source": [ 882 | "$ P(0 \\le x_1 \\le \\frac{1}{2}) = \\int_{0}^{\\frac{1}{2}}\\int_{0}^{1}\\int_{0}^{\\sqrt{2}}6x_1x_2^2x_3dx_3dx_2dx_1$" 883 | ] 884 | }, 885 | { 886 | "cell_type": "markdown", 887 | "metadata": {}, 888 | "source": [ 889 | "$ = \\int_{0}^{\\frac{1}{2}}\\int_{0}^{1} \\left[6x_1x_2^2\\frac{x_3^2}{2}|_{0}^{\\sqrt{2}}\\right]dx_2dx_1$" 890 | ] 891 | }, 892 | { 893 | "cell_type": "markdown", 894 | "metadata": {}, 895 | "source": [ 896 | "$ = \\int_{0}^{\\frac{1}{2}}\\int_{0}^{1} \\left[6x_1x_2^2\\frac{(\\sqrt{2})^2-0}{2}\\right]dx_2dx_1$" 897 | ] 898 | }, 899 | { 900 | "cell_type": "markdown", 901 | "metadata": {}, 902 | "source": [ 903 | "$ = \\int_{0}^{\\frac{1}{2}}\\int_{0}^{1} 6x_1x_2^2dx_2dx_1$" 904 | ] 905 | }, 906 | { 907 | "cell_type": "markdown", 908 | "metadata": {}, 909 | "source": [ 910 | "$ = \\int_{0}^{\\frac{1}{2}}\\left[6x_1\\frac{x_2^3}{3}|_0^1\\right]dx_1$" 911 | ] 912 | }, 913 | { 914 | "cell_type": "markdown", 915 | "metadata": {}, 916 | "source": [ 917 | "$ = \\int_{0}^{\\frac{1}{2}} 2x_1dx_1$" 918 | ] 919 | }, 920 | { 921 | "cell_type": "markdown", 922 | "metadata": {}, 923 | "source": [ 924 | "$ = 2\\int_{0}^{\\frac{1}{2}}x_1dx_1$" 925 | ] 926 | }, 927 | { 928 | "cell_type": "markdown", 929 | "metadata": {}, 930 | "source": [ 931 | "$ =2 \\dfrac{x_1^2}{2}|_{0}^{\\frac{1}{2}} = \\left(\\dfrac{1}{2}\\right)^2-0^2 = \\dfrac{1}{4} \\times 100 = 25$" 932 | ] 933 | }, 934 | { 935 | "cell_type": "markdown", 936 | "metadata": {}, 937 | "source": [ 938 | "(Q15 - 2005) Suponha que a função de densidade de probabilidade conjunta da variável aleatória bidimensional $(X,Y)$ seja dada por:" 939 | ] 940 | }, 941 | { 942 | "cell_type": "markdown", 943 | "metadata": {}, 944 | "source": [ 945 | "$f_{(x,y)} = \n", 946 | "\\begin{cases}\n", 947 | "x^2+\\dfrac{xy}{3}, \\; 0 \\leq x \\leq 1, 0 \\leq y \\leq 2 \\\\\n", 948 | "0, \\;\\textrm{ caso contrário} \\\\\n", 949 | "\\end{cases}\n", 950 | "$" 951 | ] 952 | }, 953 | { 954 | "cell_type": "markdown", 955 | "metadata": {}, 956 | "source": [ 957 | "Calcule a $P(YMultiplique o resultado por 48." 958 | ] 959 | }, 960 | { 961 | "cell_type": "markdown", 962 | "metadata": {}, 963 | "source": [ 964 | "$P(Y\n", 965 | "$P(Y\n", 966 | "$P(Y\n", 967 | "$P(Y\n", 976 | "0 - A função densidade de probabilidade marginal de $X$ é: $f(x)= \\dfrac{\\partial f(x,y)}{\\partial y}$.
\n", 977 | "1 - Se $F(y)$ é a função distribuição de probabilidade marginal de $Y$, então $f(y) = dF(Y)/dy$, para $F(Y)$ derivável em todo o $y$.
\n", 978 | "2 - $X$ e $Y$ serão independentes se $f(x) = f(x|y)$.
\n", 979 | "3 - $\\mathrm{E_X\\left[E(Y|x)\\right]} = \\mathrm{E[Y]}$.
" 980 | ] 981 | }, 982 | { 983 | "cell_type": "markdown", 984 | "metadata": {}, 985 | "source": [ 986 | "0 - (F)" 987 | ] 988 | }, 989 | { 990 | "cell_type": "markdown", 991 | "metadata": {}, 992 | "source": [ 993 | "$f(x) = {\\displaystyle \\int_{-\\infty}^{+\\infty}}f(x,y)dy$" 994 | ] 995 | }, 996 | { 997 | "cell_type": "markdown", 998 | "metadata": {}, 999 | "source": [ 1000 | "1 - (V)" 1001 | ] 1002 | }, 1003 | { 1004 | "cell_type": "markdown", 1005 | "metadata": {}, 1006 | "source": [ 1007 | "$f(y) = \\dfrac{dF(y)}{dy}$, sendo F diferenciável em todo o seu domínio." 1008 | ] 1009 | }, 1010 | { 1011 | "cell_type": "markdown", 1012 | "metadata": {}, 1013 | "source": [ 1014 | "2 - (V)" 1015 | ] 1016 | }, 1017 | { 1018 | "cell_type": "markdown", 1019 | "metadata": {}, 1020 | "source": [ 1021 | "Sabemos que: $f_{x|y} = \\dfrac{f(x,y)}{f(y)}$, mas se X e Y são independentes então: $f(x,y) = f(x)f(y)$ e $f_{x|y} = f(x)$." 1022 | ] 1023 | }, 1024 | { 1025 | "cell_type": "markdown", 1026 | "metadata": {}, 1027 | "source": [ 1028 | "3 - (V)" 1029 | ] 1030 | }, 1031 | { 1032 | "cell_type": "markdown", 1033 | "metadata": {}, 1034 | "source": [ 1035 | "$E_x\\left[\\mathrm{E(Y|X)}\\right] = \\mathrm{E(Y)}$" 1036 | ] 1037 | }, 1038 | { 1039 | "cell_type": "markdown", 1040 | "metadata": {}, 1041 | "source": [ 1042 | "Exercícios de fixação" 1043 | ] 1044 | }, 1045 | { 1046 | "cell_type": "markdown", 1047 | "metadata": {}, 1048 | "source": [ 1049 | "1. Seja a f.d.p. $f(x,y)$ definida a seguir, obtenha:
\n", 1050 | "a) Determinar o valor de A para que $f(x,y)$ seja uma f.d.p.
\n", 1051 | "b) $P(0,2 < x<0,4 \\textrm{ e } 0,6\n", 1052 | "c) Determinar as f.d.p. marginais de x e y
\n", 1053 | "d) Determinar a probabilidade de x estar entre 0,3 e 0,7
\n", 1054 | "e) Determinar as f.d.p. condicionais de x e y
\n", 1055 | "f) Determinar $\\mathrm{E(X)}$
\n", 1056 | "g) Determinar $\\mathrm{Var(X)}$
\n", 1057 | "h) Determinar $\\mathrm{Cov(X,Y)}$
" 1058 | ] 1059 | }, 1060 | { 1061 | "cell_type": "markdown", 1062 | "metadata": {}, 1063 | "source": [ 1064 | "$f(x,y) = \n", 1065 | "\\begin{cases}\n", 1066 | "Axy, \\;0\n", 1084 | "$\\int_{0}^{1}\\int_{0}^{1}A xy dxdy = 1 \\Rightarrow \\int_{0}^{1} A y \\int_{0}^{1} x dxdy =1 \\Rightarrow \\int_{0}^{1} A y \\left[ \\dfrac{x^2}{2} \\right]_0^1 dy = 1 $
\n", 1085 | "$\\int_{0}^{1} A y 1/2 dy = 1 \\Rightarrow A/2 \\int_{0}^{1}ydy =1 \\Rightarrow \\dfrac{A}{2}\\left[\\dfrac{y^2}{2} \\right]_0^1 = 1$
\n", 1086 | "$\\dfrac{A}{4} = 1 \\Rightarrow A = 4 $\n" 1087 | ] 1088 | }, 1089 | { 1090 | "cell_type": "markdown", 1091 | "metadata": {}, 1092 | "source": [ 1093 | "b)" 1094 | ] 1095 | }, 1096 | { 1097 | "cell_type": "markdown", 1098 | "metadata": {}, 1099 | "source": [ 1100 | "$P(0,2 < x <0,4 \\textrm{ e } 0,6\n", 1115 | "$h(y) = \\int_{0}^{1} 4xy dx = 2y$" 1116 | ] 1117 | }, 1118 | { 1119 | "cell_type": "markdown", 1120 | "metadata": {}, 1121 | "source": [ 1122 | "d)" 1123 | ] 1124 | }, 1125 | { 1126 | "cell_type": "markdown", 1127 | "metadata": {}, 1128 | "source": [ 1129 | "$P(0,3\n", 1144 | "$f_{y|x} = \\dfrac{4xy}{2x} = 2y$" 1145 | ] 1146 | }, 1147 | { 1148 | "cell_type": "markdown", 1149 | "metadata": {}, 1150 | "source": [ 1151 | "Note que: $f_{x|y} = g(x)$ e $f_{y|x} = h(y)$ e x e y são independentes, tal que $f(x,y) = g(x)h(y) = (2x)(2y) = 4xy$." 1152 | ] 1153 | }, 1154 | { 1155 | "cell_type": "markdown", 1156 | "metadata": {}, 1157 | "source": [ 1158 | "f)" 1159 | ] 1160 | }, 1161 | { 1162 | "cell_type": "markdown", 1163 | "metadata": {}, 1164 | "source": [ 1165 | "$\\mathrm{E(X)} = \\int_{0}^{1}\\int_{0}^{1} x 4xy dxdy = \\dfrac{2}{3}$" 1166 | ] 1167 | }, 1168 | { 1169 | "cell_type": "markdown", 1170 | "metadata": {}, 1171 | "source": [ 1172 | "g)" 1173 | ] 1174 | }, 1175 | { 1176 | "cell_type": "markdown", 1177 | "metadata": {}, 1178 | "source": [ 1179 | "$\\mathrm{Var(X)} = \\int_{0}^{1}\\int_{0}^{1}x^2 4xydxdy-\\left[\\int_{0}^{1}\\int_{0}^{1}x4xydxdy\\right]^2 = \\dfrac{1}{18} $" 1180 | ] 1181 | }, 1182 | { 1183 | "cell_type": "markdown", 1184 | "metadata": {}, 1185 | "source": [ 1186 | "h)" 1187 | ] 1188 | }, 1189 | { 1190 | "cell_type": "markdown", 1191 | "metadata": {}, 1192 | "source": [ 1193 | "$\\mathrm{Cov(X,Y)} = \\int_{0}^{1}\\int_{0}^{1}xy4xydxdy -\\dfrac{2}{3}\\dfrac{2}{3} = 0$" 1194 | ] 1195 | }, 1196 | { 1197 | "cell_type": "markdown", 1198 | "metadata": {}, 1199 | "source": [ 1200 | "2. Seja a f.d.p. $f(x,y)$ definida a seguir, obtenha:
\n", 1201 | "a) Determinar o valor de B para que $f(x,y)$ seja uma f.d.p.
\n", 1202 | "b) Determinar as f.d.p. marginais de $x$ e $y$
\n", 1203 | "c) Determinar as f.d.p. condicionais de $x$ e $y$
\n", 1204 | "d) Verificar se $x$ e $y$ são v.a. independentes \n", 1205 | "e) $P(X<0,5|y=0,5)$
\n", 1206 | "f) $\\mathrm{E(X|y=0,5)}$
" 1207 | ] 1208 | }, 1209 | { 1210 | "cell_type": "markdown", 1211 | "metadata": {}, 1212 | "source": [ 1213 | "$f(x,y) = \n", 1214 | "\\begin{cases}\n", 1215 | "B(x^2+y^2), \\;0\n", 1233 | "$B\\int_{0}^{1}\\int_{0}^{1}\\left(x^2+y^2\\right) dx dy = 1$
\n", 1234 | "$B\\int_{0}^{1}\\left[\\dfrac{x^3}{3}+xy^2 \\right]_{0}^{1} dy = 1$
\n", 1235 | "$B\\int_{0}^{1}\\left(\\dfrac{1}{3}+y^2 \\right) dy = 1$
\n", 1236 | "$B\\left[ \\dfrac{y}{3}+\\dfrac{y^3}{3} \\right]_{0}^{1} dy = 1$
\n", 1237 | "$B\\left[\\dfrac{2}{3} \\right] =1$
\n", 1238 | "$B = \\dfrac{3}{2}$\n" 1239 | ] 1240 | }, 1241 | { 1242 | "cell_type": "markdown", 1243 | "metadata": {}, 1244 | "source": [ 1245 | "b)" 1246 | ] 1247 | }, 1248 | { 1249 | "cell_type": "markdown", 1250 | "metadata": {}, 1251 | "source": [ 1252 | "$g(x) = \\int_{0}^{1}\\dfrac{3}{2} \\left(x^2+y^2 \\right)dy = \\dfrac{3}{2}\\left(x^2+\\dfrac{1}{3} \\right) $
\n", 1253 | "$h(y) = \\int_{0}^{1}\\dfrac{3}{2} \\left(x^2+y^2 \\right)dx = \\dfrac{3}{2}\\left(\\dfrac{1}{3}+y^2 \\right)$" 1254 | ] 1255 | }, 1256 | { 1257 | "cell_type": "markdown", 1258 | "metadata": {}, 1259 | "source": [ 1260 | "c)" 1261 | ] 1262 | }, 1263 | { 1264 | "cell_type": "markdown", 1265 | "metadata": {}, 1266 | "source": [ 1267 | "$f_{x|y} = \\dfrac{\\dfrac{3}{2}\\left(x^2+y^2\\right)}{\\dfrac{3}{2}\\left(\\dfrac{1}{3}+y^2 \\right)} = \\dfrac{x^2+y^2}{\\dfrac{1}{3}+y^2}$
\n", 1268 | "$f_{y|x} = \\dfrac{\\dfrac{3}{2}\\left(x^2+y^2\\right)}{\\dfrac{3}{2}\\left(\\dfrac{1}{3}+x^2 \\right)} = \\dfrac{x^2+y^2}{\\dfrac{1}{3}+x^2}$" 1269 | ] 1270 | }, 1271 | { 1272 | "cell_type": "markdown", 1273 | "metadata": {}, 1274 | "source": [ 1275 | "d)" 1276 | ] 1277 | }, 1278 | { 1279 | "cell_type": "markdown", 1280 | "metadata": {}, 1281 | "source": [ 1282 | "$X$ e $Y$ são dependentes, já que $f_{x|y} \\neq g(x)$ e $f_{y|x} \\neq h(y)$." 1283 | ] 1284 | }, 1285 | { 1286 | "cell_type": "markdown", 1287 | "metadata": {}, 1288 | "source": [ 1289 | "e)" 1290 | ] 1291 | }, 1292 | { 1293 | "cell_type": "markdown", 1294 | "metadata": {}, 1295 | "source": [ 1296 | "$f_{x|y = 0.5} \\Rightarrow f_{x|y} = \\dfrac{x^2+\\left(\\dfrac{1}{2}\\right)^2}{\\dfrac{1}{3}+\\left(\\dfrac{1}{2}\\right)^2} = \\dfrac{12}{7}\\left(x^2+\\dfrac{1}{4}\\right)$" 1297 | ] 1298 | }, 1299 | { 1300 | "cell_type": "markdown", 1301 | "metadata": {}, 1302 | "source": [ 1303 | "$P(X<0,5|y=0,5) = \\dfrac{12}{7}\\int_{0}^{0,5}\\left(x^2+\\dfrac{1}{4} \\right)dx \\cong 0,2857$" 1304 | ] 1305 | }, 1306 | { 1307 | "cell_type": "markdown", 1308 | "metadata": {}, 1309 | "source": [ 1310 | "f)" 1311 | ] 1312 | }, 1313 | { 1314 | "cell_type": "markdown", 1315 | "metadata": {}, 1316 | "source": [ 1317 | "$\\mathrm{E(X|y=y_0)} = \\int_{-\\infty}^{+\\infty}xf_{x|y}dx$" 1318 | ] 1319 | }, 1320 | { 1321 | "cell_type": "markdown", 1322 | "metadata": {}, 1323 | "source": [ 1324 | "$E(X|y=0,5) = \\dfrac{12}{7}\\int_0^1 x \\left(x^2+\\dfrac{1}{4} \\right)dx = \\dfrac{9}{14}$" 1325 | ] 1326 | } 1327 | ], 1328 | "metadata": { 1329 | "kernelspec": { 1330 | "display_name": "Python 3", 1331 | "language": "python", 1332 | "name": "python3" 1333 | }, 1334 | "language_info": { 1335 | "codemirror_mode": { 1336 | "name": "ipython", 1337 | "version": 3 1338 | }, 1339 | "file_extension": ".py", 1340 | "mimetype": "text/x-python", 1341 | "name": "python", 1342 | "nbconvert_exporter": "python", 1343 | "pygments_lexer": "ipython3", 1344 | "version": "3.8.5" 1345 | } 1346 | }, 1347 | "nbformat": 4, 1348 | "nbformat_minor": 4 1349 | } 1350 | -------------------------------------------------------------------------------- /7. Continuação Inferência e Teoremas.ipynb: -------------------------------------------------------------------------------- 1 | { 2 | "cells": [ 3 | { 4 | "cell_type": "markdown", 5 | "metadata": {}, 6 | "source": [ 7 | "# Continuação Inferência estatística e principais Teoremas de probabilidade" 8 | ] 9 | }, 10 | { 11 | "cell_type": "markdown", 12 | "metadata": {}, 13 | "source": [ 14 | "## 1. Estimadores de máxima verossimilhança" 15 | ] 16 | }, 17 | { 18 | "cell_type": "markdown", 19 | "metadata": {}, 20 | "source": [ 21 | "Esta seção baseia-se integralmente no Bussab." 22 | ] 23 | }, 24 | { 25 | "cell_type": "markdown", 26 | "metadata": {}, 27 | "source": [ 28 | "O que seria uma amostra verossímil?\n", 29 | "* Seria uma amostra que fornecesse a melhor informação possível sobre um parâmetro de interesse da população, desconhecido, e que desejamos estimar.\n", 30 | "* O princípio da verossimilhança afirma que devemos escolher aquele valor do parâmetro desconhecido que maximiza a probabilidade de obter a amostra particular observada, ou seja, o valor que torna aquela amostra a “mais provável”.\n", 31 | "* Obtemos então estimadores de máxima verossimilhança que, em geral, têm propriedades muito boas." 32 | ] 33 | }, 34 | { 35 | "cell_type": "markdown", 36 | "metadata": {}, 37 | "source": [ 38 | "Definição (Bussab): " 39 | ] 40 | }, 41 | { 42 | "cell_type": "markdown", 43 | "metadata": {}, 44 | "source": [ 45 | "A função de verossimilhança é definida por:" 46 | ] 47 | }, 48 | { 49 | "cell_type": "markdown", 50 | "metadata": {}, 51 | "source": [ 52 | "$L\\left(\\theta;x_1, \\dots, x_n\\right) = f(x_1; \\theta) \\dots f(x_n;\\theta)$" 53 | ] 54 | }, 55 | { 56 | "cell_type": "markdown", 57 | "metadata": {}, 58 | "source": [ 59 | "que deve ser encarada como uma função de $\\theta$. O estimador de máxima verossimilhança de $\\theta$ é o valor $\\hat{\\theta}_{MV}$ que maximiza a função $L(\\theta; x_i)$." 60 | ] 61 | }, 62 | { 63 | "cell_type": "markdown", 64 | "metadata": {}, 65 | "source": [ 66 | "Outra notação:" 67 | ] 68 | }, 69 | { 70 | "cell_type": "markdown", 71 | "metadata": {}, 72 | "source": [ 73 | "Seja $\\mathbf{x} = \\left(x_1, \\dots , x_n\\right)'$ é o vetor contendo a amostra, podemos então denotar: $L(\\theta|\\mathbf{x})$ e a log-verossimilhança por $l(\\theta|\\mathbf{x})$.\n", 74 | "O parâmetro $\\theta$ pode ser um vetor: com uma média $\\mu$ e variância $\\sigma^2$ de uma distribuição normal temos então $\\theta = (\\mu,\\sigma^2)$." 75 | ] 76 | }, 77 | { 78 | "cell_type": "markdown", 79 | "metadata": {}, 80 | "source": [ 81 | "Exemplo: Seja $X$ uma variável aleatória com distribuição normal (i.i.d.) com média e variância desconhecidas. Para a amostra $\\{x_1, x_2, \\dots, x_n\\}$ determinemos os estimadores de máxima verossimilhança para a média e a variância." 82 | ] 83 | }, 84 | { 85 | "cell_type": "markdown", 86 | "metadata": {}, 87 | "source": [ 88 | "A função de máxima verossimilhança terá a forma funcional de uma distribuição normal multivariada:" 89 | ] 90 | }, 91 | { 92 | "cell_type": "markdown", 93 | "metadata": {}, 94 | "source": [ 95 | "$L(\\mu,\\sigma^2;x_i) = \\dfrac{1}{(2\\pi\\sigma^2)^{\\frac{n}{2}}}\\exp\\left[-\\dfrac{1}{2\\sigma^2}\\sum_{i=1}^{n}(x_i-\\mu)^2\\right] $" 96 | ] 97 | }, 98 | { 99 | "cell_type": "markdown", 100 | "metadata": {}, 101 | "source": [ 102 | "$l(\\mu,\\sigma^2;x_i) \\equiv \\ln\\left[L(\\mu,\\sigma^2;x_i)\\right]$
\n", 103 | "$ = \\ln\\left\\{\\dfrac{1}{(2\\pi\\sigma^2)^{\\frac{n}{2}}}\\exp\\left[-\\dfrac{1}{2\\sigma^2}\\sum_{i=1}^{n}(x_i-\\mu)^2\\right] \\right\\}$

\n", 104 | "$ = \\ln\\left[\\dfrac{1}{(2\\pi\\sigma^2)^{\\frac{n}{2}}}\\right]-\\dfrac{1}{2\\sigma^2}\\sum_{i=1}^{n}\\left(x_i-\\mu\\right)^2$

\n", 105 | "$ = -\\ln\\left(2\\pi\\sigma^2\\right)^{\\frac{n}{2}}-\\dfrac{1}{2\\sigma^2}\\sum_{i=1}^{n}\\left(x_i-\\mu\\right)^2$

\n", 106 | "$ = -\\frac{n}{2}\\ln\\left(2\\pi\\sigma^2\\right)-\\dfrac{1}{2\\sigma^2}\\sum_{i=1}^{n}\\left(x_i-\\mu\\right)^2$

" 107 | ] 108 | }, 109 | { 110 | "cell_type": "markdown", 111 | "metadata": {}, 112 | "source": [ 113 | "$\\therefore l(\\mu,\\sigma^2;x_i) = -\\frac{n}{2}\\ln\\left(2\\pi\\sigma^2\\right)-\\dfrac{1}{2\\sigma^2}\\sum_{i=1}^{n}\\left(x_i-\\mu\\right)^2$

\n", 114 | "Vamos aplicar a condição de primeira ordem:
$\\dfrac{\\partial l (\\mu,\\sigma^2;x_i)}{\\partial \\mu} = 0$

$\\dfrac{\\partial l (\\mu,\\sigma^2;x_i)}{\\partial \\sigma^2} = 0$" 115 | ] 116 | }, 117 | { 118 | "cell_type": "markdown", 119 | "metadata": {}, 120 | "source": [ 121 | "$\\dfrac{\\partial l}{\\partial \\mu} = -\\dfrac{1}{2\\sigma^2} \\times 2 \\sum_{i=1}^{n}\\left(x_i-\\hat{\\mu}\\right) = 0$

\n", 122 | "$\\sum_{i=1}^{n}(x_i-\\hat{\\mu}) = 0 $

\n", 123 | "$\\sum_{i=1}^{n}x_i-\\sum_{i=1}^{n}\\hat{\\mu} = 0$

\n", 124 | "$\\sum_{i=1}^{n}x_i-n\\hat{\\mu} = 0$

\n", 125 | "$\\therefore \\hat{\\mu} = \\dfrac{\\sum_{i=1}^{n}x_i}{n}$" 126 | ] 127 | }, 128 | { 129 | "cell_type": "markdown", 130 | "metadata": {}, 131 | "source": [ 132 | "$\\dfrac{\\partial l }{\\partial \\sigma^2} = -\\dfrac{n}{2}\\dfrac{1}{\\hat{\\sigma}^2}+\\dfrac{1}{4\\hat{\\sigma}^2}\\sum_{i=1}^{n}\\left(x_i-\\overline{x}\\right)^2 = 0$

\n", 133 | "$-n\\hat{\\sigma}^2+\\sum_{i=1}^{n}\\left(x_i-\\overline{x}\\right)^2 = 0$

\n", 134 | "$\\hat{\\sigma}^2 = \\dfrac{\\sum_{i=1}^{n}\\left(x_i-\\overline{x}\\right)^2}{n}$" 135 | ] 136 | }, 137 | { 138 | "cell_type": "markdown", 139 | "metadata": {}, 140 | "source": [ 141 | "O estimador de máxima verossimilhança da média de uma distribuição normal é a própria média amostral $\\overline{X}$.O estimador de máxima verossimilhança da variância de uma distribuição normal é a própria variância amostral $S^2$, sendo um estimador viesado." 142 | ] 143 | }, 144 | { 145 | "cell_type": "markdown", 146 | "metadata": {}, 147 | "source": [ 148 | "Propriedades úteis dos estimadores de máxima verossimilhança:\n", 149 | "* podem ser viesados, embora não sejam assintoticamente viesados;\n", 150 | "* são consistentes;\n", 151 | "* têm distribuição assintótica normal;\n", 152 | "* são assintoticamente eficientes." 153 | ] 154 | }, 155 | { 156 | "cell_type": "markdown", 157 | "metadata": {}, 158 | "source": [ 159 | "## 2. Principais teoremas de probabilidade" 160 | ] 161 | }, 162 | { 163 | "cell_type": "markdown", 164 | "metadata": {}, 165 | "source": [ 166 | "* Lei dos Grandes Números: quando o tamanho da amostra (ou tende a infinito) cresce a média amostral converge para a média populacional. Isso implica que na medida que a amostra cresce, a média amostral estará mais próxima do valor populacional." 167 | ] 168 | }, 169 | { 170 | "cell_type": "markdown", 171 | "metadata": {}, 172 | "source": [ 173 | "* Teorema do Limite Central: Seja $X$ uma variável i.i.d. com médias $\\mu$ e variância $\\sigma^2$, a média amostral $\\overline{X}$ segue (desde que a amostra seja suficientemente grande) uma distribuição normal, com médias $\\mu$ e variância $\\dfrac{\\sigma^2}{n}$, qualquer que seja a distribuição de $X$." 174 | ] 175 | }, 176 | { 177 | "cell_type": "markdown", 178 | "metadata": {}, 179 | "source": [ 180 | "* Se $\\overline{X}$ for padronizada ($\\frac{\\overline{X}-\\mu}{\\sigma}$) obtemos:
\n", 181 | "$\\dfrac{\\overline{X}-\\mu}{\\sqrt{\\frac{\\sigma^2}{n}}} = \\dfrac{\\overline{X}-\\mu}{\\frac{\\sigma}{\\sqrt{n}}} = \\sqrt{n}\\dfrac{\\left(\\overline{X}-\\mu\\right)}{\\sigma}$" 182 | ] 183 | }, 184 | { 185 | "cell_type": "markdown", 186 | "metadata": {}, 187 | "source": [ 188 | "$\\sqrt{n}\\dfrac{\\left(\\overline{X}-\\mu\\right)}{\\sigma} \\rightarrow^{^D} N(0,1)$" 189 | ] 190 | }, 191 | { 192 | "cell_type": "markdown", 193 | "metadata": {}, 194 | "source": [ 195 | "$\\sqrt{n}\\dfrac{\\left(\\overline{X}-\\mu\\right)}{\\sigma}$ converge em distribuição (D) para uma normal padrão." 196 | ] 197 | }, 198 | { 199 | "cell_type": "markdown", 200 | "metadata": {}, 201 | "source": [ 202 | "* Teorema de Chebyshev: com uma f.d.p. de uma variável podemos conhecer sua média e variância. Mas o inverso não é verdade. $x$ é uma variável aleatória $x$ com média $\\mu$ e desvio padrão $\\sigma$. Então, a probabiidade de essa variável estar acima ou abaixo da média, no máximo, $k$ desvios padrão ($k$ é uma constante positiva) é, no mínimo, igual $1-\\frac{1}{k^2}$. Isto é:
\n", 203 | "$P(|x-\\mu| < k\\sigma) \\geq 1-\\frac{1}{k^2} $\n" 204 | ] 205 | }, 206 | { 207 | "cell_type": "markdown", 208 | "metadata": {}, 209 | "source": [ 210 | "A probabilidade de ultrapassar esse valor é, no máximo, $\\frac{1}{k^2}$:" 211 | ] 212 | }, 213 | { 214 | "cell_type": "markdown", 215 | "metadata": {}, 216 | "source": [ 217 | "$P(|x-\\mu|\\geq k\\sigma) \\geq \\dfrac{1}{k^2}$" 218 | ] 219 | }, 220 | { 221 | "cell_type": "markdown", 222 | "metadata": {}, 223 | "source": [ 224 | "## Questões Anpec" 225 | ] 226 | }, 227 | { 228 | "cell_type": "markdown", 229 | "metadata": {}, 230 | "source": [ 231 | "Q5-2006" 232 | ] 233 | }, 234 | { 235 | "cell_type": "markdown", 236 | "metadata": {}, 237 | "source": [ 238 | "São corretas as afirmativas:" 239 | ] 240 | }, 241 | { 242 | "cell_type": "markdown", 243 | "metadata": {}, 244 | "source": [ 245 | "1 - Um estimador não tendencioso pode não ser consistente.
\n", 246 | "2 - Um estimador consistente pode não ser eficiente." 247 | ] 248 | }, 249 | { 250 | "cell_type": "markdown", 251 | "metadata": {}, 252 | "source": [ 253 | "1 - (V) Para ser consistente o estimador deve atender aos seguintes critérios: (i) $\\lim_{n \\to \\infty}\\mathrm{E(\\hat{\\theta})} = \\theta$ ; (ii)$\\lim_{n \\to \\infty}\\mathrm{Var(\\hat{\\theta})} = 0$. O estimador não viesado satisfaz a condição (i), mas pode nã satisfazer a segunda condição." 254 | ] 255 | }, 256 | { 257 | "cell_type": "markdown", 258 | "metadata": {}, 259 | "source": [ 260 | "2 - (V) O estimador pode ser consistente mas não apresentar a menor variância." 261 | ] 262 | }, 263 | { 264 | "cell_type": "markdown", 265 | "metadata": {}, 266 | "source": [ 267 | "Q2-2007" 268 | ] 269 | }, 270 | { 271 | "cell_type": "markdown", 272 | "metadata": {}, 273 | "source": [ 274 | "Considere uma amostra aleatória de $n$ variáveis $x_1, x_2, \\dots, x_n$, normalmente distribuídas com média $\\mu$ e variância $\\sigma^2$. Sejam $\\overline{x} = \\frac{1}{n} \\sum_{i=1}^{n}x_i$ e $s^2 = \\frac{1}{n}\\sum_{i=1}^{n}\\left(x_i-\\overline{x}\\right)^2$. É corretor afirmar que:" 275 | ] 276 | }, 277 | { 278 | "cell_type": "markdown", 279 | "metadata": {}, 280 | "source": [ 281 | "1 - $\\overline{x}$ e $s^2$ são não viesados.
\n", 282 | "2 - $\\overline{x}$ e $s^2$ são consistentes
\n", 283 | "3 - Apenas $\\overline{x}$ é consistente.
\n", 284 | "4 - Apenas $\\overline{x}$ é não viesado.
" 285 | ] 286 | }, 287 | { 288 | "cell_type": "markdown", 289 | "metadata": {}, 290 | "source": [ 291 | "1 - (F) O estimador $s^2$ é viesado.
\n", 292 | "2 - (V) O estimador $s^2$ é viesado, mas consistente, assim como $\\overline{X}$, pois : $\\lim_{n \\to \\infty}\\mathrm{E(\\overline{X})} = \\lim_{n \\to \\infty} \\mu = \\mu$ e $\\lim_{n \\to \\infty}\\mathrm{Var(\\overline{X})} = \\lim_{n \\to \\infty}\\dfrac{\\sigma^2}{n} = 0$.
\n", 293 | "3 - (F) $s^2$ também é consistente.
\n", 294 | "4 - (V) Vimos que $\\overline{x}$ é não viesado.
" 295 | ] 296 | }, 297 | { 298 | "cell_type": "markdown", 299 | "metadata": {}, 300 | "source": [ 301 | "Q4-2010" 302 | ] 303 | }, 304 | { 305 | "cell_type": "markdown", 306 | "metadata": {}, 307 | "source": [ 308 | "4 - Se um estimador convergir em média quadrática para o parâmetro, ele será consistente\n", 309 | "(convergirá em probabilidade para o parâmetro)." 310 | ] 311 | }, 312 | { 313 | "cell_type": "markdown", 314 | "metadata": {}, 315 | "source": [ 316 | "4 - (V) $\\lim_{n \\to \\infty}\\mathrm{EQM(\\hat{\\theta})} = 0$" 317 | ] 318 | }, 319 | { 320 | "cell_type": "markdown", 321 | "metadata": {}, 322 | "source": [ 323 | "Q5-2010" 324 | ] 325 | }, 326 | { 327 | "cell_type": "markdown", 328 | "metadata": {}, 329 | "source": [ 330 | "0 - Considere dois estimadores não tendenciosos, $\\hat{\\theta}_1$ e $\\hat{\\theta}_2$, de um parâmetro $\\theta$. $\\hat{\\theta}_1$ é eficiente relativamente a $\\hat{\\theta}_2$ se $\\mathrm{Var(\\hat{\\theta}_1)} < \\mathrm{Var(\\hat{\\theta_2})}$.
\n", 331 | "1 - Um estimador $\\hat{\\theta}$ de um parâmetro $\\theta$ é consistente se $\\hat{\\theta}$ converge em probabilidade para $\\theta$.
\n", 332 | "2 - Um estimador $\\hat{\\theta}$ de um parâmetro $\\theta$ é consistente se, e somente se, $\\hat{\\theta}$ é não viesado e a variância de $\\hat{\\theta}$ converge para 0 à medida que o tamanho da amostra tende ao infinito.
" 333 | ] 334 | }, 335 | { 336 | "cell_type": "markdown", 337 | "metadata": {}, 338 | "source": [ 339 | "0 - (V) Como não há viés basta comparar a variância.
\n", 340 | "1 - (V) Consistência: $\\hat{\\theta} \\rightarrow^{^P} \\theta$
\n", 341 | "2 - (F) Vimos as condições para $\\hat{\\theta}$ anteriormente. Além da segunda parte do item, temos que ter: $\\lim_{n \\to \\infty} E(\\hat{\\theta}) = \\theta$." 342 | ] 343 | }, 344 | { 345 | "cell_type": "markdown", 346 | "metadata": {}, 347 | "source": [ 348 | "Q4-2017" 349 | ] 350 | }, 351 | { 352 | "cell_type": "markdown", 353 | "metadata": {}, 354 | "source": [ 355 | "Sejam $X_1, X_2, \\dots, X_n$, variáveis aleatórias independentes com distribuição Normal $(\\mu,\\sigma^2)$, em que $\\mu$ e $\\sigma^2$ são desconhecidos e $\\sigma^2>0$. Podemos definir também \n", 356 | "$\\overline{X} = \\frac{1}{n} \\sum_{i=1}^{n}X_i$ e $S^2 = \\frac{1}{n-1}\\sum_{i=1}^{n}\\left(X_i-\\overline{X}\\right)^2$. Podemos afirmar que:" 357 | ] 358 | }, 359 | { 360 | "cell_type": "markdown", 361 | "metadata": {}, 362 | "source": [ 363 | "0 - $S^2$ é um estimador não tendencioso de $\\sigma^2$.
\n", 364 | "1 - A variância de $\\overline{X}$ é igual a $\\dfrac{\\sigma^2}{n}$.
\n", 365 | "2 - $S^2$ é um estimador não tendencioso para a variância de $\\overline{X}$.
\n", 366 | "3 - $S^2$ é um estimador consistente de $\\sigma^2$.
\n", 367 | "4 - $\\overline{X}$ é um estimador consistente de $\\mu$.
" 368 | ] 369 | }, 370 | { 371 | "cell_type": "markdown", 372 | "metadata": {}, 373 | "source": [ 374 | "0 - (V)
\n", 375 | "1 - (V) De fato: $\\mathrm{Var(\\overline{X})} = \\frac{\\sigma^2}{n}$.
\n", 376 | "2 - (F) $S^2$ é um estimador não tendencioso da variância populacional.
\n", 377 | "3 - (V) Temos que: $\\lim_{n \\to \\infty}\\mathrm{E(S^2)} = \\sigma^2$ e $\\lim_{n \\to \\infty} \\mathrm{Var(S^2)} = 0$.
\n", 378 | "4 - (V)
" 379 | ] 380 | }, 381 | { 382 | "cell_type": "markdown", 383 | "metadata": {}, 384 | "source": [ 385 | "Referências:" 386 | ] 387 | }, 388 | { 389 | "cell_type": "markdown", 390 | "metadata": {}, 391 | "source": [ 392 | "SARTORIS, A. Estatística e introdução à econometria. São Paulo: Saraiva, 2013." 393 | ] 394 | }, 395 | { 396 | "cell_type": "markdown", 397 | "metadata": {}, 398 | "source": [ 399 | "MORETTIN, P. A.; BUSSAB, W. O. Estatística Básica. São Paulo: Saraiva, 2010." 400 | ] 401 | } 402 | ], 403 | "metadata": { 404 | "kernelspec": { 405 | "display_name": "Python 3", 406 | "language": "python", 407 | "name": "python3" 408 | }, 409 | "language_info": { 410 | "codemirror_mode": { 411 | "name": "ipython", 412 | "version": 3 413 | }, 414 | "file_extension": ".py", 415 | "mimetype": "text/x-python", 416 | "name": "python", 417 | "nbconvert_exporter": "python", 418 | "pygments_lexer": "ipython3", 419 | "version": "3.8.5" 420 | } 421 | }, 422 | "nbformat": 4, 423 | "nbformat_minor": 4 424 | } 425 | -------------------------------------------------------------------------------- /8. Intervalo_Confiança.ipynb: -------------------------------------------------------------------------------- 1 | { 2 | "cells": [ 3 | { 4 | "cell_type": "markdown", 5 | "metadata": {}, 6 | "source": [ 7 | "# Intervalo de Confiança" 8 | ] 9 | }, 10 | { 11 | "cell_type": "markdown", 12 | "metadata": {}, 13 | "source": [ 14 | "Lembretes:" 15 | ] 16 | }, 17 | { 18 | "cell_type": "markdown", 19 | "metadata": {}, 20 | "source": [ 21 | "Considere $X_i \\sim N(\\mu, \\sigma^2)$ e um $\\sigma^2$ conhecido. Assim teremos:" 22 | ] 23 | }, 24 | { 25 | "cell_type": "markdown", 26 | "metadata": {}, 27 | "source": [ 28 | "$\\overline{X} \\sim \\left(\\mu,\\dfrac{\\sigma^2}{n}\\right)$" 29 | ] 30 | }, 31 | { 32 | "cell_type": "markdown", 33 | "metadata": {}, 34 | "source": [ 35 | "$Z = \\dfrac{\\overline{X}-\\mu}{\\sigma} = \\dfrac{\\overline{X}-\\mu}{\\sqrt{\\dfrac{\\sigma^2}{n}}}= \\dfrac{\\overline{X}-\\mu}{\\dfrac{\\sigma}{\\sqrt{n}}} \\sim N(0,1)$" 36 | ] 37 | }, 38 | { 39 | "cell_type": "markdown", 40 | "metadata": {}, 41 | "source": [ 42 | "#### Distribuição Normal" 43 | ] 44 | }, 45 | { 46 | "cell_type": "markdown", 47 | "metadata": {}, 48 | "source": [ 49 | "Uma v.a. tem distribuição normal com parâmetros $\\mu$ e $\\sigma^2$, ${-\\infty}<\\mu<{+\\infty}$ e $0<\\sigma^2<{\\infty}$ se sua densidade é dada por:" 50 | ] 51 | }, 52 | { 53 | "cell_type": "markdown", 54 | "metadata": {}, 55 | "source": [ 56 | "$$f(X;\\mu,\\sigma^2) = \\dfrac{1}{\\sigma\\sqrt{2\\pi}}e^{-\\left(X-\\mu\\right)^2/2\\sigma^2}, {-\\infty}0, v>0 \\\\\n", 119 | "0, \\; x<0 \\\\\n", 120 | "\\end{cases}\n", 121 | "$" 122 | ] 123 | }, 124 | { 125 | "cell_type": "markdown", 126 | "metadata": {}, 127 | "source": [ 128 | "$\\mathrm{E(X)}= v$
\n", 129 | "$\\mathrm{Var(X)} = 2v$" 130 | ] 131 | }, 132 | { 133 | "cell_type": "markdown", 134 | "metadata": {}, 135 | "source": [ 136 | "* O quadrado de uma v.a. com distribuição normal padrão é uma v.a. com distribuição $\\chi^2(1)$." 137 | ] 138 | }, 139 | { 140 | "cell_type": "markdown", 141 | "metadata": {}, 142 | "source": [ 143 | "* Se $X_1, \\dots, X_n$ são variáveis aleatórias independentes, com distribuições normais padronizadas, então, $\\sum_{i=1}^{n}X_i^{2}$ possui distribuição Qui-quadrado com n graus de liberdade." 144 | ] 145 | }, 146 | { 147 | "cell_type": "markdown", 148 | "metadata": {}, 149 | "source": [ 150 | "* Distribuição assimétrica.\n", 151 | "* Quando aumentamos os graus de liberdade a distribuição se torna menos assimétrica.\n", 152 | "* Seus valores podem ser positivos ou zero, mas nunca poderão ser negativos.\n", 153 | "* Quando o número de graus de liberdade da distribuiçã Qui-Quadrado aumenta, nos aproximamos para uma distribuição normal." 154 | ] 155 | }, 156 | { 157 | "cell_type": "code", 158 | "execution_count": 1, 159 | "metadata": {}, 160 | "outputs": [], 161 | "source": [ 162 | "import numpy as np\n", 163 | "import seaborn as sns" 164 | ] 165 | }, 166 | { 167 | "cell_type": "code", 168 | "execution_count": 5, 169 | "metadata": {}, 170 | "outputs": [], 171 | "source": [ 172 | "n = 10_000\n", 173 | "array1 = np.random.chisquare(10, size = n)\n", 174 | "array2 = np.random.chisquare(50, size = n)" 175 | ] 176 | }, 177 | { 178 | "cell_type": "code", 179 | "execution_count": 3, 180 | "metadata": {}, 181 | "outputs": [], 182 | "source": [ 183 | "array3 = np.random.normal(size = n)" 184 | ] 185 | }, 186 | { 187 | "cell_type": "code", 188 | "execution_count": null, 189 | "metadata": {}, 190 | "outputs": [], 191 | "source": [ 192 | "sns.displot(array1)\n", 193 | "sns.displot(array2)\n", 194 | "sns.displot(array3)" 195 | ] 196 | }, 197 | { 198 | "cell_type": "markdown", 199 | "metadata": {}, 200 | "source": [ 201 | "#### Distribuição $t$ de Student" 202 | ] 203 | }, 204 | { 205 | "cell_type": "markdown", 206 | "metadata": {}, 207 | "source": [ 208 | "Sejam Z e Y variáveis independentes, tal que $X \\sim N\\left(0,1\\right)$ e $Y \\sim \\chi^2{(v)} $, então a variável aleatória dada pela expressão a seguir tem distribuição $t$ de Student com $k$ graus de liberdade." 209 | ] 210 | }, 211 | { 212 | "cell_type": "markdown", 213 | "metadata": {}, 214 | "source": [ 215 | "$t = \\dfrac{X}{\\sqrt{\\dfrac{Y}{v}}}$" 216 | ] 217 | }, 218 | { 219 | "cell_type": "markdown", 220 | "metadata": {}, 221 | "source": [ 222 | "$\\mathrm{E(X)} = 0$
\n", 223 | "$\\mathrm{Var(X)} = \\dfrac{v}{\\left(v-2\\right)}$, $v>2$" 224 | ] 225 | }, 226 | { 227 | "cell_type": "markdown", 228 | "metadata": {}, 229 | "source": [ 230 | "Intervalo de confiança para a média com variância conhecida" 231 | ] 232 | }, 233 | { 234 | "cell_type": "markdown", 235 | "metadata": {}, 236 | "source": [ 237 | "Vamos fixar uma probabilidade $1-\\alpha$ tal que: $P(\\overline{x}_{LI}<\\mu<\\overline{x}_{LS}) = 1-\\alpha$,com $ 0<\\alpha<1$." 238 | ] 239 | }, 240 | { 241 | "cell_type": "markdown", 242 | "metadata": {}, 243 | "source": [ 244 | "$P(|Z|
\n", 266 | "$-z_{\\frac{\\alpha}{2}}\\dfrac{\\sigma}{\\sqrt{n}}<\\overline{X}-\\mu
\n", 267 | "$\\overline{X}-z_{\\frac{\\alpha}{2}}\\dfrac{\\sigma}{\\sqrt{n}}<\\mu<\\overline{X}+z_{\\frac{\\alpha}{2}}\\dfrac{\\sigma}{\\sqrt{n}}$" 268 | ] 269 | }, 270 | { 271 | "cell_type": "markdown", 272 | "metadata": {}, 273 | "source": [ 274 | "$(1-\\alpha) = \\text{nível de confiança}$" 275 | ] 276 | }, 277 | { 278 | "cell_type": "markdown", 279 | "metadata": {}, 280 | "source": [ 281 | "$\\text{IC} \\left(\\mu; 1-\\alpha\\right)= \\left[\\overline{X}-z_{\\frac{\\alpha}{2}}\\dfrac{\\sigma}{\\sqrt{n}};\\overline{X}+z_{\\frac{\\alpha}{2}}\\dfrac{\\sigma}{\\sqrt{n}}\\right]$" 282 | ] 283 | }, 284 | { 285 | "cell_type": "markdown", 286 | "metadata": {}, 287 | "source": [ 288 | "Limites do intervalo de confiança:" 289 | ] 290 | }, 291 | { 292 | "cell_type": "markdown", 293 | "metadata": {}, 294 | "source": [ 295 | "* Limite Inferior: $\\overline{X}-z_{\\frac{\\alpha}{2}}\\dfrac{\\sigma}{\\sqrt{n}}$\n", 296 | "* Limite Superior:$\\overline{X}+z_{\\frac{\\alpha}{2}}\\dfrac{\\sigma}{\\sqrt{n}}$" 297 | ] 298 | }, 299 | { 300 | "cell_type": "markdown", 301 | "metadata": {}, 302 | "source": [ 303 | "Amplitude do intervalo de confiança:" 304 | ] 305 | }, 306 | { 307 | "cell_type": "markdown", 308 | "metadata": {}, 309 | "source": [ 310 | "$A = LS-LI = \\left(\\overline{X}-z_{\\frac{\\alpha}{2}}\\dfrac{\\sigma}{\\sqrt{n}}\\right)-\\left(\\overline{X}+z_{\\frac{\\alpha}{2}}\\dfrac{\\sigma}{\\sqrt{n}}\\right) = 2 \\left(z_{\\frac{\\alpha}{2}} \\dfrac{\\sigma}{\\sqrt{n}}\\right)$" 311 | ] 312 | }, 313 | { 314 | "cell_type": "markdown", 315 | "metadata": {}, 316 | "source": [ 317 | "Intepretação:" 318 | ] 319 | }, 320 | { 321 | "cell_type": "markdown", 322 | "metadata": {}, 323 | "source": [ 324 | "* Obtemos várias amostras de mesmo tamanho;\n", 325 | "* Para cada uma das amostras calculamos os IC correspondentes $1-\\alpha$;\n", 326 | "* A proporção de intervalos que deverão conter o valor da média populacional será igual a $1-\\alpha$." 327 | ] 328 | }, 329 | { 330 | "cell_type": "markdown", 331 | "metadata": {}, 332 | "source": [ 333 | "Exemplo: Suponha que tenhamos obtido um intervalo de 95% de confiança ($\\text{IC}(\\mu) = [\\overline{X}_{LI},\\overline{X}_{LS}]$). A interpretação correta seria: temos 95% de confiança de que o intervalo entre o limite inferior e o limite superior contém a média populacional $\\mu$." 334 | ] 335 | }, 336 | { 337 | "cell_type": "markdown", 338 | "metadata": {}, 339 | "source": [ 340 | "Note ainda que se aumentarmos o tamanho da amostra $n$ aumentaremos a precisão do intervalo, com efeito teremos uma redução do erro." 341 | ] 342 | }, 343 | { 344 | "cell_type": "markdown", 345 | "metadata": {}, 346 | "source": [ 347 | "Q6 - 2004" 348 | ] 349 | }, 350 | { 351 | "cell_type": "markdown", 352 | "metadata": {}, 353 | "source": [ 354 | "Seja $X$ uma variável aleatória normalmente distribuída com média $\\mu$ e variância conhe-\n", 355 | "cida $\\sigma^2 =1$, da qual se obtém a amostra aleatória $X_1 , X_2 , \\dots, X_n$ (com $n$ observações). É\n", 356 | "correto afirmar que:" 357 | ] 358 | }, 359 | { 360 | "cell_type": "markdown", 361 | "metadata": {}, 362 | "source": [ 363 | "0 - A média amostral é uma variável aleatória normalmente distribuída com média μ e\n", 364 | "variância $1/n$.
\n", 365 | "1 - A probabilidade de o intervalo de confiança $[\\overline{X}- 1,96 \\sqrt{n} , \\overline{X}+ 1,96\\sqrt{n} ]$ conter a média da população, $\\mu$, é de 95%.
\n", 366 | "2 - A probabilidade de o intervalo de confiança $[\\overline{X}- 1,96 \\sqrt{n} , \\overline{X}+ 1,96\\sqrt{n} ]$ conter a média amostral, $\\mu$, é de 95%.
\n", 367 | "3 - O intervalo de 95% para a média populacional independe do tamanho da amostra.
\n", 368 | "4- Em um intervalo de confiança de 95% para a média populacional, μ, espera-se que,\n", 369 | "extraindo-se todas as amostras de mesmo tamanho dessa população, esse intervalo\n", 370 | "conterá μ 95% das vezes." 371 | ] 372 | }, 373 | { 374 | "cell_type": "markdown", 375 | "metadata": {}, 376 | "source": [ 377 | "0 - (V)
\n", 378 | "Lembre que: $\\overline{X} \\sim \\left(\\mu,\\dfrac{\\sigma^2}{n}\\right)$

\n", 379 | "$\\mathrm{E}(\\overline{X}) = \\mathrm{E}\\left(\\dfrac{\\sum_{i=1}^{n}X_i}{n}\\right) = \\dfrac{1}{n}\\mathrm{E}\\left(\\sum_{i=1}^{n}X_i\\right) = \\dfrac{1}{n}\\left[\\sum_{i=1}^{n}\\mathrm{E}(X_i)\\right] = \\dfrac{1}{n}n\\mu = \\mu$" 380 | ] 381 | }, 382 | { 383 | "cell_type": "markdown", 384 | "metadata": {}, 385 | "source": [ 386 | "$\\mathrm{Var}(\\overline{X}) = \\mathrm{Var}\\left(\\dfrac{\\sum_{i=1}^{n}X_i}{n}\\right) = \\dfrac{1}{n^2}\\mathrm{Var}\\left(\\sum_{i=1}^{n}X_i\\right) = \\dfrac{1}{n^2} \\sum_{i=1}^{n} \\mathrm{Var}(X_i) = \\dfrac{1}{n^2}n\\sigma^2=\\dfrac{\\sigma^2}{n}$" 387 | ] 388 | }, 389 | { 390 | "cell_type": "markdown", 391 | "metadata": {}, 392 | "source": [ 393 | "Do enunciado temos que $\\sigma^2 = 1$, então: $\\mathrm{Var}(\\overline{X}) = \\dfrac{1}{n}$." 394 | ] 395 | }, 396 | { 397 | "cell_type": "markdown", 398 | "metadata": {}, 399 | "source": [ 400 | "1 - (F)
\n", 401 | "Do que vimos anteriormente:

\n", 402 | "$P(\\overline{X}-1,96\\dfrac{1}{\\sqrt{n}}<\\mu<\\overline{X}+1,96\\dfrac{1}{\\sqrt{n}}) = 0.95$" 403 | ] 404 | }, 405 | { 406 | "cell_type": "markdown", 407 | "metadata": {}, 408 | "source": [ 409 | "Além do que, a interpretação do item acerca do Intervalo de Confiança é incorreta. Uma interpretação mais adequada seria imaginarmos que, se repetirmos a amostragem de $n$ dessas observações (número infitino), em 95% dessas repetições o intervalo de confiança conteria o valor verdadeiro da média populaiconal." 410 | ] 411 | }, 412 | { 413 | "cell_type": "markdown", 414 | "metadata": {}, 415 | "source": [ 416 | "2 - (F)
\n", 417 | "Novamente a interpretação é incorreta e o intervalo é construído para a média amostral." 418 | ] 419 | }, 420 | { 421 | "cell_type": "markdown", 422 | "metadata": {}, 423 | "source": [ 424 | "3 - (F)
\n", 425 | "Note que quanto maior o tamanho da amostra $n$, menor será o intervalo de confiança." 426 | ] 427 | }, 428 | { 429 | "cell_type": "markdown", 430 | "metadata": {}, 431 | "source": [ 432 | "4 - (V)" 433 | ] 434 | }, 435 | { 436 | "cell_type": "markdown", 437 | "metadata": {}, 438 | "source": [ 439 | "Fixação" 440 | ] 441 | }, 442 | { 443 | "cell_type": "markdown", 444 | "metadata": {}, 445 | "source": [ 446 | "Exemplo extraído do Sartoris (2013, p. 195):" 447 | ] 448 | }, 449 | { 450 | "cell_type": "markdown", 451 | "metadata": {}, 452 | "source": [ 453 | "Após entrevistar 49 membros de uma categoria profissional, um pesquisador encontrou um salário médio de 820,00. O desvio padrão dos salários dessa categoria, conhecido, é 140,00. Construa um intervalo de confiança para a média:\n", 454 | "a) com 80% de confiança;\n", 455 | "b) com 90% de confiança." 456 | ] 457 | }, 458 | { 459 | "cell_type": "markdown", 460 | "metadata": {}, 461 | "source": [ 462 | "Intervalo de confiança para a média com variância desconhecida" 463 | ] 464 | }, 465 | { 466 | "cell_type": "markdown", 467 | "metadata": {}, 468 | "source": [ 469 | "Teremos duas possibilidades a depender do tamanho da amostra." 470 | ] 471 | }, 472 | { 473 | "cell_type": "markdown", 474 | "metadata": {}, 475 | "source": [ 476 | "(1) Para $n<30$ teremos:" 477 | ] 478 | }, 479 | { 480 | "cell_type": "markdown", 481 | "metadata": {}, 482 | "source": [ 483 | "Vamos considerar uma amostra aleatória tal que $X_1, X_2, \\dots , X_n$ obtida de uma população normal com média conhecida, mas variância desconhecida. Então temos que:" 484 | ] 485 | }, 486 | { 487 | "cell_type": "markdown", 488 | "metadata": {}, 489 | "source": [ 490 | "$\\overline{X}\\sim T = \\dfrac{\\overline{X}-\\mu}{\\dfrac{S}{\\sqrt{n}}} \\sim t$ com $n-1$ graus de liberdade." 491 | ] 492 | }, 493 | { 494 | "cell_type": "markdown", 495 | "metadata": {}, 496 | "source": [ 497 | "Então temos que:" 498 | ] 499 | }, 500 | { 501 | "cell_type": "markdown", 502 | "metadata": {}, 503 | "source": [ 504 | "$P\\left(\\overline{X}-t_{\\frac{\\alpha}{2},n-1}\\dfrac{S}{\\sqrt{n}}<\\mu<\\overline{X}+t_{\\frac{\\alpha}{2},n-1}\\dfrac{S}{\\sqrt{n}}\\right) = 1-\\alpha$" 505 | ] 506 | }, 507 | { 508 | "cell_type": "markdown", 509 | "metadata": {}, 510 | "source": [ 511 | "$\\text{IC}\\left(\\mu,1-\\alpha\\right) = \\left[\\overline{X}-t_{\\frac{\\alpha}{2}}\\dfrac{S}{\\sqrt{n}};\\overline{X}+t_{\\frac{\\alpha}{2}}\\dfrac{S}{\\sqrt{n}}\\right]$" 512 | ] 513 | }, 514 | { 515 | "cell_type": "markdown", 516 | "metadata": {}, 517 | "source": [ 518 | "(2) Para $n>30$ teremos:" 519 | ] 520 | }, 521 | { 522 | "cell_type": "markdown", 523 | "metadata": {}, 524 | "source": [ 525 | "$\\overline{X} \\sim Z =\\dfrac{\\overline{X}-\\mu}{\\sqrt{\\dfrac{S^2}{n}}} =\\dfrac{\\overline{X}-\\mu}{\\dfrac{S}{\\sqrt{n}}} \\sim N(0,1)$" 526 | ] 527 | }, 528 | { 529 | "cell_type": "markdown", 530 | "metadata": {}, 531 | "source": [ 532 | "$P\\left(\\overline{X}-Z_{\\frac{\\alpha}{2}} \\dfrac{S}{\\sqrt{n}}<\\mu<\\overline{X}+Z_{\\frac{\\alpha}{2}}\\dfrac{S}{\\sqrt{n}}\\right) =1-\\alpha$" 533 | ] 534 | }, 535 | { 536 | "cell_type": "markdown", 537 | "metadata": {}, 538 | "source": [ 539 | "Observações e definições:" 540 | ] 541 | }, 542 | { 543 | "cell_type": "markdown", 544 | "metadata": {}, 545 | "source": [ 546 | "* Margem de erro: $e = Z_{\\frac{\\alpha}{2}} \\dfrac{\\sigma}{\\sqrt{n}}$. Neste caso estamos assumindo que a população seja infinita ou que a amostragem seja feita com reposição (o que significa que nossa população seja grande).\n", 547 | "* Se a população for finita e a amostragem feita sem reposição: $e = Z_{\\frac{\\alpha}{2}} \\dfrac{\\sigma}{\\sqrt{n}}\\sqrt{\\dfrac{N-n}{n-1}}$. Em que: $N$ é o tamanho da população (finita) e $n$ é o tamanho da amostra. " 548 | ] 549 | }, 550 | { 551 | "cell_type": "markdown", 552 | "metadata": {}, 553 | "source": [ 554 | "Intervalo de confiança para a proporção" 555 | ] 556 | }, 557 | { 558 | "cell_type": "markdown", 559 | "metadata": {}, 560 | "source": [ 561 | "Lembre que: $X \\sim \\text{Bernoulli}(p) \\Rightarrow E(X) = p \\text{ e } Var(X) = p(1-p)$" 562 | ] 563 | }, 564 | { 565 | "cell_type": "markdown", 566 | "metadata": {}, 567 | "source": [ 568 | "$\\hat{p} \\sim N\\left(p, \\dfrac{p(1-p)}{n}\\right)$" 569 | ] 570 | }, 571 | { 572 | "cell_type": "markdown", 573 | "metadata": {}, 574 | "source": [ 575 | "$P\\left(\\hat{p}-Z_{\\frac{\\alpha}{2}}\\sqrt{\\dfrac{\\hat{p}\\left(1-\\hat{p}\\right)}{n}}\n", 36 | "$H_a : \\theta \\neq \\theta_0 $" 37 | ] 38 | }, 39 | { 40 | "cell_type": "markdown", 41 | "metadata": {}, 42 | "source": [ 43 | "Monocaudal:" 44 | ] 45 | }, 46 | { 47 | "cell_type": "markdown", 48 | "metadata": {}, 49 | "source": [ 50 | "$H_0: \\theta = \\theta_0$
\n", 51 | "$H_a : \\theta < \\theta_0 $" 52 | ] 53 | }, 54 | { 55 | "cell_type": "markdown", 56 | "metadata": {}, 57 | "source": [ 58 | "$H_0: \\theta = \\theta_0$
\n", 59 | "$H_a : \\theta > \\theta_0 $" 60 | ] 61 | }, 62 | { 63 | "cell_type": "markdown", 64 | "metadata": {}, 65 | "source": [ 66 | "A altura média dos jogadores de basquete que disputam uma determinada liga é 1,95 m. Numa amostra de 36 jogadores, foi encontrada uma média de 1,93 m. Sabe-se que o desvio padrão da altura dos jogadores é 12 cm. Teste, com um nível de significância de 10%, se a afirmação é verdadeira." 67 | ] 68 | }, 69 | { 70 | "cell_type": "markdown", 71 | "metadata": {}, 72 | "source": [ 73 | "$H_0: \\mu = 1,95$
\n", 74 | "$H_a : \\mu \\neq 1,95 $" 75 | ] 76 | }, 77 | { 78 | "cell_type": "markdown", 79 | "metadata": {}, 80 | "source": [ 81 | "Conhecida a distribuição de probabilidade, vamos construir o intervalo de confiança supondo que a hipótese nula seja verdadeira e contenha 90% dos possíveis valores amostrais." 82 | ] 83 | }, 84 | { 85 | "cell_type": "markdown", 86 | "metadata": {}, 87 | "source": [ 88 | "$\\dfrac{|\\overline{X}-\\mu|}{\\sigma_{\\overline{X}}} = 1,645$" 89 | ] 90 | }, 91 | { 92 | "cell_type": "markdown", 93 | "metadata": {}, 94 | "source": [ 95 | "$\\sigma_{\\overline{X}} = \\dfrac{\\sigma}{\\sqrt{n}} = \\dfrac{0,12}{\\sqrt{36}} = 0,02$" 96 | ] 97 | }, 98 | { 99 | "cell_type": "markdown", 100 | "metadata": {}, 101 | "source": [ 102 | "$\\dfrac{|\\overline{X}-\\mu|}{0,02} = 1,645$" 103 | ] 104 | }, 105 | { 106 | "cell_type": "markdown", 107 | "metadata": {}, 108 | "source": [ 109 | "Região de aceitação: os valores que podem ocorrer numa amostra de 36 jogadores, com 90% de probabilidade, estão entre 1,95+0,033 e 1,95-0,033. \n", 110 | "* Se o valor amostral estiver nesse intervalo, então aceitamos a hipótese nula." 111 | ] 112 | }, 113 | { 114 | "cell_type": "markdown", 115 | "metadata": {}, 116 | "source": [ 117 | "$RA = [1,917;1,983]$" 118 | ] 119 | }, 120 | { 121 | "cell_type": "markdown", 122 | "metadata": {}, 123 | "source": [ 124 | "O valor amostral foi 1,93, então aceitamos a hipótese nula." 125 | ] 126 | }, 127 | { 128 | "cell_type": "markdown", 129 | "metadata": {}, 130 | "source": [ 131 | "Em uma amostra com 100 famílias em uma cidade do interior, foi encontrada uma renda média de 580,00 reais. Segundo o prefeito, esta pesquisa está errada, pois a renda média em sua cidade é de, no mínimo, 650 reais. Teste a afirmação do prefeito com 10% de significância, sabendo-se que o desvio padrão da renda é de 120,00 reais." 132 | ] 133 | }, 134 | { 135 | "cell_type": "markdown", 136 | "metadata": {}, 137 | "source": [ 138 | "Temos então um teste monocaudal:" 139 | ] 140 | }, 141 | { 142 | "cell_type": "markdown", 143 | "metadata": {}, 144 | "source": [ 145 | "$H_0: \\mu = 650$
\n", 146 | "$H_a : \\mu < 650 $" 147 | ] 148 | }, 149 | { 150 | "cell_type": "markdown", 151 | "metadata": {}, 152 | "source": [ 153 | "$\\dfrac{|\\overline{X}-\\mu|}{\\sigma_{\\overline{X}}} = 1,28$
\n", 154 | "$\\sigma_{\\overline{X}} = \\dfrac{\\sigma}{\\sqrt{n}} = \\dfrac{120}{\\sqrt{100}} = 12$
\n", 155 | "$\\dfrac{|\\overline{X}-650|}{12} = 1,28$" 156 | ] 157 | }, 158 | { 159 | "cell_type": "markdown", 160 | "metadata": {}, 161 | "source": [ 162 | "$RA = [634,36;\\infty]$" 163 | ] 164 | }, 165 | { 166 | "cell_type": "markdown", 167 | "metadata": {}, 168 | "source": [ 169 | "Portanto, a hipótese nula não aceita." 170 | ] 171 | }, 172 | { 173 | "cell_type": "markdown", 174 | "metadata": {}, 175 | "source": [ 176 | "Fez-se um estudo sobre aluguéis em dois bairros, A e B. No primeiro, em 12 residências, o aluguel médio encontrado foi de 330,00 reais. No segundo, em 19 residências, aluguel médio foi de 280,00 reais. Sabe-se que o desvio padrão dos aluguéis no bairro A é 50 reais e no bairro B é 40 reais. Afirma-se que os aluguéis médios são iguais nos dois bairros. Teste a afirmação com 10% de significância." 177 | ] 178 | }, 179 | { 180 | "cell_type": "markdown", 181 | "metadata": {}, 182 | "source": [ 183 | "Vamos assumir que as variáveis sejam independentes." 184 | ] 185 | }, 186 | { 187 | "cell_type": "markdown", 188 | "metadata": {}, 189 | "source": [ 190 | "$H_0: \\mu_A = \\mu_B$
\n", 191 | "$H_a: \\mu_A \\neq \\mu_B$ " 192 | ] 193 | }, 194 | { 195 | "cell_type": "markdown", 196 | "metadata": {}, 197 | "source": [ 198 | "$H_0: \\mu_A - \\mu_B = 0$
\n", 199 | "$H_a: \\mu_A - \\mu_B \\neq 0$ " 200 | ] 201 | }, 202 | { 203 | "cell_type": "markdown", 204 | "metadata": {}, 205 | "source": [ 206 | "Definimos então $Y = X_A-X_B$." 207 | ] 208 | }, 209 | { 210 | "cell_type": "markdown", 211 | "metadata": {}, 212 | "source": [ 213 | "$\\mathrm{Var(Y)} = \\mathrm{Var(X_A-X_B)} =\\mathrm{Var(X_A)}+\\mathrm{Var(X_B)}-2\\mathrm{cov(X_A,X_B)}$

\n", 214 | "$\\mathrm{Var(Y)} = \\mathrm{Var(X_A-X_B)} = \\mathrm{Var(\\overline{X}_A)}+\\mathrm{Var(\\overline{X}_B)}$

\n", 215 | "$\\mathrm{Var(\\overline{Y})} = \\mathrm{Var(\\overline{X}_A)}+\\mathrm{Var(\\overline{X}_B)}$

\n", 216 | "$\\mathrm{Var(\\overline{X}_A)} = \\dfrac{50^2}{12} \\cong 208,33$

\n", 217 | "$\\mathrm{Var(\\overline{X}_B)} = \\dfrac{40^2}{19} \\cong 84,21$" 218 | ] 219 | }, 220 | { 221 | "cell_type": "markdown", 222 | "metadata": {}, 223 | "source": [ 224 | "$\\mathrm{Var(\\overline{Y})} \\cong = 292,54$

\n", 225 | "$\\sigma_{\\overline{Y}} = \\sqrt{\\mathrm{Var(\\overline{Y})}} \\cong 17,10$

\n", 226 | "$\\dfrac{|\\overline{Y}-0 |}{17,1} = 1,645$
\n", 227 | "$|\\overline{Y}-0| = 28,13$" 228 | ] 229 | }, 230 | { 231 | "cell_type": "markdown", 232 | "metadata": {}, 233 | "source": [ 234 | "Lembrando que $Y = X_A-X_B = 330-280 = 50$" 235 | ] 236 | }, 237 | { 238 | "cell_type": "markdown", 239 | "metadata": {}, 240 | "source": [ 241 | "$RA = [-28,13;28,13]$" 242 | ] 243 | }, 244 | { 245 | "cell_type": "markdown", 246 | "metadata": {}, 247 | "source": [ 248 | "O valor não está contido dentro da região de aceitação, portanto a hipótese nula não é aceita." 249 | ] 250 | }, 251 | { 252 | "cell_type": "markdown", 253 | "metadata": {}, 254 | "source": [ 255 | "#### Testando a variância" 256 | ] 257 | }, 258 | { 259 | "cell_type": "markdown", 260 | "metadata": {}, 261 | "source": [ 262 | "Antes tínhamos um procedimento de fazer um teste para a média, visto que não conhecíamos seu verdadeiro valor populacional. O desvio-padrão era conhecido." 263 | ] 264 | }, 265 | { 266 | "cell_type": "markdown", 267 | "metadata": {}, 268 | "source": [ 269 | "Sabemos que a variância amostral é definida como:" 270 | ] 271 | }, 272 | { 273 | "cell_type": "markdown", 274 | "metadata": {}, 275 | "source": [ 276 | "$S^2 = \\dfrac{\\sum_{i=1}^{n}\\left(X_i-\\overline{X}\\right)^2}{n-1}$" 277 | ] 278 | }, 279 | { 280 | "cell_type": "markdown", 281 | "metadata": {}, 282 | "source": [ 283 | "$\\left(n-1\\right)S^2 = \\sum_{i=1}^{n}\\left(X_i-\\overline{X}\\right)^2$" 284 | ] 285 | }, 286 | { 287 | "cell_type": "markdown", 288 | "metadata": {}, 289 | "source": [ 290 | "Vamos dividir por $\\sigma^2$:" 291 | ] 292 | }, 293 | { 294 | "cell_type": "markdown", 295 | "metadata": {}, 296 | "source": [ 297 | "$\\left(n-1\\right)\\dfrac{S^2 }{\\sigma^2}= \\sum_{i=1}^{n}\\dfrac{\\left(X_i-\\overline{X}\\right)^2}{\\sigma^2}$" 298 | ] 299 | }, 300 | { 301 | "cell_type": "markdown", 302 | "metadata": {}, 303 | "source": [ 304 | "$\\left(n-1\\right)\\dfrac{S^2 }{\\sigma^2}= \\sum_{i=1}^{n}\\left(\\dfrac{X_i-\\overline{X}}{\\sigma}\\right)^2$" 305 | ] 306 | }, 307 | { 308 | "cell_type": "markdown", 309 | "metadata": {}, 310 | "source": [ 311 | "A expressão em parênteses será uma normal padronizada se tivermos a média populacional no lugar da média amostral." 312 | ] 313 | }, 314 | { 315 | "cell_type": "markdown", 316 | "metadata": {}, 317 | "source": [ 318 | "Podemos escrever:" 319 | ] 320 | }, 321 | { 322 | "cell_type": "markdown", 323 | "metadata": {}, 324 | "source": [ 325 | "$\\sum_{i=1}^{n}\\left(X_i-\\overline{X}\\right)^2 = \\sum_{i=1}^{n}\\left(X_i-\\mu+\\mu-\\overline{X}\\right)^2$

\n", 326 | "$\\sum_{i=1}^{n}\\left(X_i-\\overline{X}\\right)^2 = \\sum_{i=1}^{n}\\left(X_i-\\mu\\right)^2-\\sum_{i=1}^{n}\\left(\\overline{X}-\\mu\\right)^2$" 327 | ] 328 | }, 329 | { 330 | "cell_type": "markdown", 331 | "metadata": {}, 332 | "source": [ 333 | "$\\therefore \\sum_{i=1}^{n}\\left(X_i-\\overline{X}\\right)^2 = \\sum_{i=1}^{n}\\left(X_i-\\mu\\right)^2-n\\left(\\overline{X}-\\mu\\right)^2$" 334 | ] 335 | }, 336 | { 337 | "cell_type": "markdown", 338 | "metadata": {}, 339 | "source": [ 340 | "Então:" 341 | ] 342 | }, 343 | { 344 | "cell_type": "markdown", 345 | "metadata": {}, 346 | "source": [ 347 | "$(n-1)\\dfrac{S^2}{\\sigma^2} = \\sum_{i=1}^{n}\\left(\\dfrac{X_i-\\mu}{\\sigma}\\right)^2-n\\left(\\dfrac{\\overline{X}-\\mu}{\\sigma}\\right)^2$" 348 | ] 349 | }, 350 | { 351 | "cell_type": "markdown", 352 | "metadata": {}, 353 | "source": [ 354 | "No lado direito da expressão anterior temos um somatório de $n$ variáveis normais padronizadas, menos uma outra variável normal padronizada ($\\overline{X}$ que tem média $\\mu$ e desvio-padrão $\\frac{\\sigma}{\\sqrt{n}}$). Desta forma, temos uma soma de $n-1$ variáveis normais padronizadas. Sabemos que a distribuição $\\chi^2$ é a distribuição de uma variável que é a soma de variáveis normais padronizadas." 355 | ] 356 | }, 357 | { 358 | "cell_type": "markdown", 359 | "metadata": {}, 360 | "source": [ 361 | "$(n-1)\\dfrac{S^2}{\\sigma^2} \\sim \\chi_{(n-1)}^2$" 362 | ] 363 | }, 364 | { 365 | "cell_type": "markdown", 366 | "metadata": {}, 367 | "source": [ 368 | "Numa determinada empresa, empregados que desempenham a mesma função têm salários diferentes em função do tempo de casa de bonificações por desempenho. Segunda a empresa, o desvio-padrão para o salário de uma certa função é de 150,00 reais. Entrevistando cinco funcionários que desempenham essa função, verificou-se que seus salários eram respectivamente, 1.000,00 , 1.200,00, 1.500,00, 1.300,00 e 900,00. Testemos a afirmação da empresa com significância de 5%, supondo que os salários sejam normalmente distribúidos. A hipótese apresentada pela empresa é de que o desvio-padrão é 150, portanto, a variância é $150^2 = 22.500$." 369 | ] 370 | }, 371 | { 372 | "cell_type": "markdown", 373 | "metadata": {}, 374 | "source": [ 375 | "$H_0: \\sigma^2 = 22.500$
\n", 376 | "$H_a: \\sigma^2 \\neq 22.500$ " 377 | ] 378 | }, 379 | { 380 | "cell_type": "markdown", 381 | "metadata": {}, 382 | "source": [ 383 | "$(n-1) = 5-1 = 4$" 384 | ] 385 | }, 386 | { 387 | "cell_type": "markdown", 388 | "metadata": {}, 389 | "source": [ 390 | "$RA = [0,48,11,14]$" 391 | ] 392 | }, 393 | { 394 | "cell_type": "markdown", 395 | "metadata": {}, 396 | "source": [ 397 | "$\\overline{X} = 1180$" 398 | ] 399 | }, 400 | { 401 | "cell_type": "markdown", 402 | "metadata": {}, 403 | "source": [ 404 | "$S^2=\\dfrac{(1000-1180)^2+(1200-1180)^2+(1500-1180)^2+(1300-1180)^2+(900-1180)^2}{4}=57.000$" 405 | ] 406 | }, 407 | { 408 | "cell_type": "markdown", 409 | "metadata": {}, 410 | "source": [ 411 | "$S^2 = 57.000$" 412 | ] 413 | }, 414 | { 415 | "cell_type": "markdown", 416 | "metadata": {}, 417 | "source": [ 418 | "$(n-1)\\dfrac{S^2}{\\sigma^2} = 4 \\times \\dfrac{57.000}{22.500} \\cong 10,13$" 419 | ] 420 | }, 421 | { 422 | "cell_type": "markdown", 423 | "metadata": {}, 424 | "source": [ 425 | "A hipótese nula é aceita,pois o valor está dentro da região de aceitação. Desta forma, aceitamos a hipótese nula para um nível de 5% de significância." 426 | ] 427 | }, 428 | { 429 | "cell_type": "markdown", 430 | "metadata": {}, 431 | "source": [ 432 | "Uma caixa de fósforos de certa marca vem com a inscrição: 'Contém, em média, 40 palitos'. Segundo a fabricante, o desvio-padrão é de, no máximo, dois palitos. Em uma amostra com 51 caixas, entretando, foi encontrado um desvio-padrão amostral de três palitos. Supondo que o número de palitos por caixa seja uma variável normal, testemos a afirmativa do fabricante utilizando um nível de significância de 1%." 433 | ] 434 | }, 435 | { 436 | "cell_type": "markdown", 437 | "metadata": {}, 438 | "source": [ 439 | "Temos então um teste de comparação entre variâncias monocaudal." 440 | ] 441 | }, 442 | { 443 | "cell_type": "markdown", 444 | "metadata": {}, 445 | "source": [ 446 | "$H_0:\\sigma^2 = 4$
\n", 447 | "$H_a:\\sigma^2 > 4$
\n" 448 | ] 449 | }, 450 | { 451 | "cell_type": "markdown", 452 | "metadata": {}, 453 | "source": [ 454 | "$(n-1)\\dfrac{S^2}{\\sigma^2} = (51-1)\\times \\dfrac{3^2}{2^2} = 112,5$" 455 | ] 456 | }, 457 | { 458 | "cell_type": "markdown", 459 | "metadata": {}, 460 | "source": [ 461 | "$RA = [0;76,15]$" 462 | ] 463 | }, 464 | { 465 | "cell_type": "markdown", 466 | "metadata": {}, 467 | "source": [ 468 | "Rejeitamos a hipótese nula com nível de significância de 1%." 469 | ] 470 | }, 471 | { 472 | "cell_type": "markdown", 473 | "metadata": {}, 474 | "source": [ 475 | "Testando a média quando a variância é desconhecida" 476 | ] 477 | }, 478 | { 479 | "cell_type": "markdown", 480 | "metadata": {}, 481 | "source": [ 482 | "A variância populacional $\\sigma^2$ não é conhecida e, portanto, só é possível obter $S^2$. Neste caso da expressão:" 483 | ] 484 | }, 485 | { 486 | "cell_type": "markdown", 487 | "metadata": {}, 488 | "source": [ 489 | "$\\dfrac{|\\overline{X}-\\mu|}{\\frac{\\sigma}{\\sqrt{n}}}$" 490 | ] 491 | }, 492 | { 493 | "cell_type": "markdown", 494 | "metadata": {}, 495 | "source": [ 496 | "Usaremos:" 497 | ] 498 | }, 499 | { 500 | "cell_type": "markdown", 501 | "metadata": {}, 502 | "source": [ 503 | "$\\dfrac{|\\overline{X}-\\mu|}{\\frac{S}{\\sqrt{n}}}$" 504 | ] 505 | }, 506 | { 507 | "cell_type": "markdown", 508 | "metadata": {}, 509 | "source": [ 510 | "Vamos dividir esta expressão por $\\sigma$:" 511 | ] 512 | }, 513 | { 514 | "cell_type": "markdown", 515 | "metadata": {}, 516 | "source": [ 517 | "$\\sqrt{n}\\dfrac{\\dfrac{|\\overline{X}-\\mu|}{\\sigma}}{\\dfrac{S}{\\sigma}}$" 518 | ] 519 | }, 520 | { 521 | "cell_type": "markdown", 522 | "metadata": {}, 523 | "source": [ 524 | "Sabemos que:" 525 | ] 526 | }, 527 | { 528 | "cell_type": "markdown", 529 | "metadata": {}, 530 | "source": [ 531 | "$\\dfrac{|\\overline{X}-\\mu|}{\\dfrac{S}{\\sqrt{n}}} \\sim t_{(n-1)} \\text{ Distribuição t de Student}$" 532 | ] 533 | }, 534 | { 535 | "cell_type": "markdown", 536 | "metadata": {}, 537 | "source": [ 538 | "#### Erro de poder de um teste" 539 | ] 540 | }, 541 | { 542 | "cell_type": "markdown", 543 | "metadata": {}, 544 | "source": [ 545 | "* Erro tipo I: ocorre quando rejeitamos a hipótese nula quando ela é verdadeira (condenar um inocente).\n", 546 | "* Erro tipo II: aceitamos a hipótese nula quando ela é falsa (absolver um culpado)." 547 | ] 548 | }, 549 | { 550 | "cell_type": "markdown", 551 | "metadata": {}, 552 | "source": [ 553 | "$P(\\text{erro do tipo I}) = \\alpha = \\text{significância do teste}$, a significância do teste é definida a priori." 554 | ] 555 | }, 556 | { 557 | "cell_type": "markdown", 558 | "metadata": {}, 559 | "source": [ 560 | "Poder de um teste é a probabilidade de não cometer o erro do tipo II, ou seja, a probabilidade de rejeitar a hipótese nula quando ela é falsa." 561 | ] 562 | }, 563 | { 564 | "cell_type": "markdown", 565 | "metadata": {}, 566 | "source": [ 567 | "$\\text{Poder do teste} = 1-\\beta, \\beta = P(\\text{erro do tipo II})$" 568 | ] 569 | }, 570 | { 571 | "cell_type": "markdown", 572 | "metadata": {}, 573 | "source": [ 574 | "# Questões ANPEC" 575 | ] 576 | }, 577 | { 578 | "cell_type": "markdown", 579 | "metadata": {}, 580 | "source": [ 581 | "Q5-2003
\n", 582 | "Com relação a testes de hipótese, é correto afirmar que:
\n", 583 | "1 - O nível de significância de um teste é a probabilidade de se cometer o erro tipo I.
\n", 584 | "2 - A potência do teste é a probabilidade de se cometer o erro tipo II.
\n", 585 | "4- O nível de significância de um teste de hipótese cresce com o tamanho da amostra." 586 | ] 587 | }, 588 | { 589 | "cell_type": "markdown", 590 | "metadata": {}, 591 | "source": [ 592 | "1 - (V) É exatamente a definição que vimos anteriormente.
\n", 593 | "2 - (F) Vimos antes que $\\text{Poder do teste} = 1-\\beta$.
\n", 594 | "4 - (F) É definido a priori." 595 | ] 596 | }, 597 | { 598 | "cell_type": "markdown", 599 | "metadata": {}, 600 | "source": [ 601 | "Q6-2005
\n", 602 | "Seja $X_1 , X_2 , X_3 ,\\dots, X_n$ uma amostra aleatória de tamanho $n$ de uma população normal com média $\\mu$ e variância $\\sigma^2$ . Julgue as afirmativas:" 603 | ] 604 | }, 605 | { 606 | "cell_type": "markdown", 607 | "metadata": {}, 608 | "source": [ 609 | "0 - A probabilidade de a média populacional, $\\mu$, estar contida no intervalo de confiança $\\left[\\overline{X}-1,96\\dfrac{\\sigma}{\\sqrt{n}},\\overline{X}+1,96\\dfrac{\\sigma}{\\sqrt{n}}\\right]$ é igual a 95%.
\n", 610 | "1 - Se a variância $\\sigma^2$ é desconhecida, o intervalo de confiança de 95% para a média $\\mu$ será $\\left[\\overline{X}-t_c\\dfrac{s}{\\sqrt{n}},\\overline{X}+t_c\\dfrac{s}{\\sqrt{n}}\\right]$, em que $s$ é o desvio padrão da amostra, $t_c$ é calculado de forma que $P(|t|\n", 611 | "2 - Se construirmos vários intervalos de confiança para a média $\\mu$ com amostras de idêntico tamanho, mesma variância $\\sigma^2$ e mesma margem de confiança, estes terão extremos aleatórios, mas todos terão a mesma amplitude.
\n", 612 | "3 - Num teste de hipótese: $H_0 : \\mu = \\mu_0$ contra $H_a : \\mu \\neq \\mu_0$ , se o intervalo de confiança\n", 613 | "estimado para a média $\\mu$ não contiver o valor de $\\mu_0$ , então deve-se aceitar a hipótese de que $\\mu = \\mu_0 $.
\n", 614 | "4 - Se a amostra aleatória $X_1 , X_2 , X_3 ,\\dots, X_n$ não provém de uma distribuição normal, não se pode construir um intervalo de confiança para a média $\\mu$, ainda que a amostra seja muito grande.
" 615 | ] 616 | }, 617 | { 618 | "cell_type": "markdown", 619 | "metadata": {}, 620 | "source": [ 621 | "0 - (F) Note que a interpretação do IC não está correta.
\n", 622 | "1 - (V)
\n", 623 | "2 - (V) Ilustra a essência do que fazemos ao construir um IC.
\n", 624 | "3 - (F) Não devemos aceitar $\\mu = \\mu_0$.
\n", 625 | "4 - (F) $\\overline{X} \\sim N(\\mu,\\frac{\\sigma^2}{n})$." 626 | ] 627 | }, 628 | { 629 | "cell_type": "markdown", 630 | "metadata": {}, 631 | "source": [ 632 | "Q6-2004
\n", 633 | "Com relação a testes de hipóteses, julgue as afirmativas:
\n", 634 | "0 - Em um teste de hipóteses, comete-se um erro do tipo I quando se rejeita uma hipótese nula verdadeira.
\n", 635 | "1 - O poder de um teste de hipóteses é medido pela probabilidade de se cometer o erro tipo II.
\n", 636 | "2 - A soma das probabilidades dos erros tipo I e tipo II é igual a 1.
\n", 637 | "3 - Quanto maior for o nível de significância de um teste de hipóteses maior será o valor-p a ele associado.
\n", 638 | "4 - Se o valor-p de um teste de hipóteses for igual 0,015, a hipótese nula será rejeitada a 5%, mas não a 1%.
" 639 | ] 640 | }, 641 | { 642 | "cell_type": "markdown", 643 | "metadata": {}, 644 | "source": [ 645 | "Q11-2007
\n", 646 | "Julgue as afirmativas:
\n", 647 | "0 - O valor p de um teste de hipótese é a probabilidade de a hipótese nula ser rejeitada.
\n", 648 | "1 - O poder de um teste de hipótese é a probabilidade de se rejeitar corretamente uma hipótese nula falsa.
" 649 | ] 650 | }, 651 | { 652 | "cell_type": "markdown", 653 | "metadata": {}, 654 | "source": [ 655 | "Q4 - 2008
\n", 656 | "A respeito de testes de hipótese, é correto afirmar:
\n", 657 | "0 - Potência de um teste é a probabilidade de se rejeitar a hipótese nula quando esta for falsa.
\n", 658 | "1 - O nível de significância de um teste é a probabilidade de se cometer um erro tipo 1.
\n", 659 | "2 - O teste F de significância conjunta dos parâmetros em um modelo de regressão linear\n", 660 | "é unilateral.
\n", 661 | "3 - Se uma variável é significativa ao nível de 1%, então ela é significativa ao nível de 5%.\n", 662 | "4 - $p-\\text{valor } = 1 – P(H_0 \\text{ falsa })$, em que $P(A)$ é a probabilidade do evento $A$ ocorrer." 663 | ] 664 | }, 665 | { 666 | "cell_type": "markdown", 667 | "metadata": {}, 668 | "source": [ 669 | "Q8-2009
\n", 670 | "2 - Um intervalo de confiança de 99% para a média μ de uma população, calculado para\n", 671 | "uma amostra aleatória, como [2,75;8,25], pode ser interpretado como: a probabilidade\n", 672 | "de $\\mu$ estar no intervalo calculado é de 99%." 673 | ] 674 | }, 675 | { 676 | "cell_type": "markdown", 677 | "metadata": {}, 678 | "source": [ 679 | "Q1 - 2012
\n", 680 | "Julgue as afirmativas:\n", 681 | "0 - O erro tipo I é definido como a probabilidade de rejeitar a hipótese nula quando a hipótese nula é verdadeira.
\n", 682 | "1 - O erro tipo II é definido como a probabilidade de rejeitar a hipótese nula quando a hipótese nula é verdadeira.
\n", 683 | "2 - O nível de significância de um teste é a probabilidade de rejeitar a hipótese nula quando a hipótese alternativa é verdadeira.
\n", 684 | "3 - Se o p-valor de um teste é maior do que o nível de significância adotado, rejeita-se a hipótese nula." 685 | ] 686 | } 687 | ], 688 | "metadata": { 689 | "kernelspec": { 690 | "display_name": "Python 3", 691 | "language": "python", 692 | "name": "python3" 693 | }, 694 | "language_info": { 695 | "codemirror_mode": { 696 | "name": "ipython", 697 | "version": 3 698 | }, 699 | "file_extension": ".py", 700 | "mimetype": "text/x-python", 701 | "name": "python", 702 | "nbconvert_exporter": "python", 703 | "pygments_lexer": "ipython3", 704 | "version": "3.8.10" 705 | }, 706 | "varInspector": { 707 | "cols": { 708 | "lenName": 16, 709 | "lenType": 16, 710 | "lenVar": 40 711 | }, 712 | "kernels_config": { 713 | "python": { 714 | "delete_cmd_postfix": "", 715 | "delete_cmd_prefix": "del ", 716 | "library": "var_list.py", 717 | "varRefreshCmd": "print(var_dic_list())" 718 | }, 719 | "r": { 720 | "delete_cmd_postfix": ") ", 721 | "delete_cmd_prefix": "rm(", 722 | "library": "var_list.r", 723 | "varRefreshCmd": "cat(var_dic_list()) " 724 | } 725 | }, 726 | "types_to_exclude": [ 727 | "module", 728 | "function", 729 | "builtin_function_or_method", 730 | "instance", 731 | "_Feature" 732 | ], 733 | "window_display": false 734 | } 735 | }, 736 | "nbformat": 4, 737 | "nbformat_minor": 4 738 | } 739 | -------------------------------------------------------------------------------- /Formulários/Formulário1.ipynb: -------------------------------------------------------------------------------- 1 | { 2 | "cells": [ 3 | { 4 | "cell_type": "markdown", 5 | "metadata": {}, 6 | "source": [ 7 | "# Fórmulário: Estatística Básica e Números-Índice" 8 | ] 9 | }, 10 | { 11 | "cell_type": "markdown", 12 | "metadata": {}, 13 | "source": [ 14 | "##### Média Aritimética" 15 | ] 16 | }, 17 | { 18 | "cell_type": "markdown", 19 | "metadata": {}, 20 | "source": [ 21 | "$ \\overline{X}= \\dfrac{1}{n}\\sum\\limits_{i=1}^{n}X_{i}$" 22 | ] 23 | }, 24 | { 25 | "cell_type": "markdown", 26 | "metadata": {}, 27 | "source": [ 28 | "##### Média ponderada" 29 | ] 30 | }, 31 | { 32 | "cell_type": "markdown", 33 | "metadata": {}, 34 | "source": [ 35 | "$W = \\dfrac{\\sum\\limits_{i=1}^{n} X_i q_i}{\\sum\\limits_{i=1}^{n} q_i}$" 36 | ] 37 | }, 38 | { 39 | "cell_type": "markdown", 40 | "metadata": {}, 41 | "source": [ 42 | "##### Média Geométrica" 43 | ] 44 | }, 45 | { 46 | "cell_type": "markdown", 47 | "metadata": {}, 48 | "source": [ 49 | "$\\overline{G} = {\\left( \\prod\\limits_{i=1}^{n}X_{i}\\right)}^{\\frac{1}{n}}$" 50 | ] 51 | }, 52 | { 53 | "cell_type": "markdown", 54 | "metadata": {}, 55 | "source": [ 56 | "##### Média Harmônica" 57 | ] 58 | }, 59 | { 60 | "cell_type": "markdown", 61 | "metadata": {}, 62 | "source": [ 63 | "$\\overline{H} = \\dfrac{n}{\\dfrac{1}{X_{1}}+\\dfrac{1}{X_{2}} + \\cdots + \\dfrac{1}{X_{n}}}$" 64 | ] 65 | }, 66 | { 67 | "cell_type": "markdown", 68 | "metadata": {}, 69 | "source": [ 70 | "$\\overline{H} = \\dfrac{n}{\\sum\\limits_{i=1}^{n}\\dfrac{1}{X_{i}}}$" 71 | ] 72 | }, 73 | { 74 | "cell_type": "markdown", 75 | "metadata": {}, 76 | "source": [ 77 | "$\\overline{X} \\ge \\overline{G} \\ge \\overline{H}$" 78 | ] 79 | }, 80 | { 81 | "cell_type": "markdown", 82 | "metadata": {}, 83 | "source": [ 84 | "Amplitude" 85 | ] 86 | }, 87 | { 88 | "cell_type": "markdown", 89 | "metadata": {}, 90 | "source": [ 91 | "$X_{(1)} \\leq X_{(2)} \\leq \\dots \\leq X_{(n-1)} \\leq X_{(n)}$" 92 | ] 93 | }, 94 | { 95 | "cell_type": "markdown", 96 | "metadata": {}, 97 | "source": [ 98 | "$ A = X_{(n)}-X_{(1)}$" 99 | ] 100 | }, 101 | { 102 | "cell_type": "markdown", 103 | "metadata": {}, 104 | "source": [ 105 | "Desvio em relação a média" 106 | ] 107 | }, 108 | { 109 | "cell_type": "markdown", 110 | "metadata": {}, 111 | "source": [ 112 | "$d_i = X_i-\\overline{X}$" 113 | ] 114 | }, 115 | { 116 | "cell_type": "markdown", 117 | "metadata": {}, 118 | "source": [ 119 | "$\\mathrm{\\sigma^2}\n", 120 | "= \\dfrac{\\left(X_{1}-\\mu\\right)^{2}+\n", 121 | "\\left(X_{2}-\\mu \\right)^2+ \\cdots+\n", 122 | "\\left(X_{N}-\\mu\\right)^2\n", 123 | "}{N}$" 124 | ] 125 | }, 126 | { 127 | "cell_type": "markdown", 128 | "metadata": {}, 129 | "source": [ 130 | "$\\sigma^2 = \\dfrac{\\sum_\\limits{i=1}^{N}\\left(X_i-\\mu \\right)^2}{N}$" 131 | ] 132 | }, 133 | { 134 | "cell_type": "markdown", 135 | "metadata": {}, 136 | "source": [ 137 | "Variância amostral" 138 | ] 139 | }, 140 | { 141 | "cell_type": "markdown", 142 | "metadata": {}, 143 | "source": [ 144 | "$S^2 = \\dfrac{\\sum_\\limits{i=1}^{n}\\left(X_i-\\overline{X}\\right)^2}{n-1}$" 145 | ] 146 | }, 147 | { 148 | "cell_type": "markdown", 149 | "metadata": {}, 150 | "source": [ 151 | "Desvio Médio Absoluto" 152 | ] 153 | }, 154 | { 155 | "cell_type": "markdown", 156 | "metadata": {}, 157 | "source": [ 158 | "$\\mathrm{dm(X)} = \\dfrac{\\left|X_1-\\overline{X} \\right|+\\left|X_2-\\overline{X} \\right|+\\cdots+\\left|X_n-\\overline{X} \\right|}{n}$" 159 | ] 160 | }, 161 | { 162 | "cell_type": "markdown", 163 | "metadata": {}, 164 | "source": [ 165 | "$\\mathrm{dm(X)} = \\dfrac{\\sum_\\limits{i=1}^{n}\\left|X_i-\\overline{X} \\right|}{n}$" 166 | ] 167 | }, 168 | { 169 | "cell_type": "markdown", 170 | "metadata": {}, 171 | "source": [ 172 | "Desvio padrão" 173 | ] 174 | }, 175 | { 176 | "cell_type": "markdown", 177 | "metadata": {}, 178 | "source": [ 179 | "$\\sigma = \\sqrt{\\sigma^2} = \\sqrt{\\dfrac{\\sum_\\limits{i=1}^{N}\\left(X_i-\\mu\\right)^2}{N}}$" 180 | ] 181 | }, 182 | { 183 | "cell_type": "markdown", 184 | "metadata": {}, 185 | "source": [ 186 | "$S = \\sqrt{S^2} = \\sqrt{\\dfrac{\\sum_\\limits{i=1}^{n}\\left(X_i-\\overline{X}\\right)^2}{n-1}}$" 187 | ] 188 | }, 189 | { 190 | "cell_type": "markdown", 191 | "metadata": {}, 192 | "source": [ 193 | "Covariância" 194 | ] 195 | }, 196 | { 197 | "cell_type": "markdown", 198 | "metadata": {}, 199 | "source": [ 200 | "$\\mathrm{cov(X,Y)} = \\dfrac{1}{n}\\sum\\limits_{i=1}^{n}\\left( X_{i}-\\overline{X} \\right)\\left(Y_{i}-\\overline{Y} \\right)$" 201 | ] 202 | }, 203 | { 204 | "cell_type": "markdown", 205 | "metadata": {}, 206 | "source": [ 207 | "$\\mathrm{cov(X,Y)} = \\dfrac{1}{n}\\sum\\limits_{i=1}^{n}X_iY_i-\\overline{X}\\overline{Y}$" 208 | ] 209 | }, 210 | { 211 | "cell_type": "markdown", 212 | "metadata": {}, 213 | "source": [ 214 | "##### Coeficiente de correlação" 215 | ] 216 | }, 217 | { 218 | "cell_type": "markdown", 219 | "metadata": {}, 220 | "source": [ 221 | "$\\mathrm{corr(X,Y)} = \\dfrac{\\mathrm{cov(X,Y)}}{\\mathrm{dp(X)}\\mathrm{dp(Y)}}$" 222 | ] 223 | }, 224 | { 225 | "cell_type": "markdown", 226 | "metadata": {}, 227 | "source": [ 228 | "Índice de Laspeyres de preço: " 229 | ] 230 | }, 231 | { 232 | "cell_type": "markdown", 233 | "metadata": {}, 234 | "source": [ 235 | "$L_{p}^{t} = \\dfrac{\\sum_{i=1}^{n}p_{i}^{1}q_{i}^{0}}{\\sum_{i=1}^{n}p_{i}^{0}q_{i}^{0}} = \\dfrac{\\mathbf{p^tq^0}}{\\mathbf{p^0q^0}}$" 236 | ] 237 | }, 238 | { 239 | "cell_type": "markdown", 240 | "metadata": {}, 241 | "source": [ 242 | "Índice de Laspeyres de quantidade: " 243 | ] 244 | }, 245 | { 246 | "cell_type": "markdown", 247 | "metadata": {}, 248 | "source": [ 249 | "$L_{q}^{t} = \\dfrac{\\sum_{i=1}^{n}p_{i}^{0}q_{i}^{t}}{\\sum_{i=1}^{n}p_{i}^{0}q_{i}^{0}} = \\dfrac{\\mathbf{p^{0}q^{t}}}{\\mathbf{p^{0}q^0}}$" 250 | ] 251 | }, 252 | { 253 | "cell_type": "markdown", 254 | "metadata": {}, 255 | "source": [ 256 | "$L = \\sum_{i=1}^{n}\\dfrac{p_i^1}{p_i^0}\\times w_i^{0}$" 257 | ] 258 | }, 259 | { 260 | "cell_type": "markdown", 261 | "metadata": {}, 262 | "source": [ 263 | "$w_i^{0} = \\dfrac{p_i^0q_i^0}{\\sum_{i=1}^{n}p_i^{0}q_i^{0}}$" 264 | ] 265 | }, 266 | { 267 | "cell_type": "markdown", 268 | "metadata": {}, 269 | "source": [ 270 | "Índice de Paasche de preço:" 271 | ] 272 | }, 273 | { 274 | "cell_type": "markdown", 275 | "metadata": {}, 276 | "source": [ 277 | "$P_{p}^{t} = \\dfrac{\\sum_{i=1}^{n}p_{i}^{1}q_{i}^{1}}{\\sum_{i=1}^{n}p_{i}^{0}q_{i}^{1}} = \\dfrac{\\mathbf{p^tq^t}}{\\mathbf{p^0q^t}}$" 278 | ] 279 | }, 280 | { 281 | "cell_type": "markdown", 282 | "metadata": {}, 283 | "source": [ 284 | "Índice de Paasche de quantidade:" 285 | ] 286 | }, 287 | { 288 | "cell_type": "markdown", 289 | "metadata": {}, 290 | "source": [ 291 | "$P_{q}^{t} = \\dfrac{\\sum_{i=1}^{n}p_{i}^{1}q_{i}^{1}}{\\sum_{i=1}^{n}p_{i}^{1}q_{i}^{0}} = \\dfrac{\\mathbf{p^tq^t}}{\\mathbf{p^tq^0}}$" 292 | ] 293 | }, 294 | { 295 | "cell_type": "markdown", 296 | "metadata": {}, 297 | "source": [ 298 | "$P_p = \\dfrac{1}{\\sum_\\limits{i =1}^{n}\\dfrac{p_i^0}{p_i^1}\\times w_i^1}$" 299 | ] 300 | }, 301 | { 302 | "cell_type": "markdown", 303 | "metadata": {}, 304 | "source": [ 305 | "$w_i^1 = \\frac{p_i^1q_i^1}{\\sum_{i=1}^{n}p_i^1q_i^1}$" 306 | ] 307 | }, 308 | { 309 | "cell_type": "markdown", 310 | "metadata": {}, 311 | "source": [ 312 | "Índice Valor" 313 | ] 314 | }, 315 | { 316 | "cell_type": "markdown", 317 | "metadata": {}, 318 | "source": [ 319 | "$I_V = \\dfrac{\\mathbf{p_tq_t}}{\\mathbf{p_0q_0}}$" 320 | ] 321 | }, 322 | { 323 | "cell_type": "markdown", 324 | "metadata": {}, 325 | "source": [ 326 | "Índice de Fisher" 327 | ] 328 | }, 329 | { 330 | "cell_type": "markdown", 331 | "metadata": {}, 332 | "source": [ 333 | "$F = \\sqrt{L \\times P}$" 334 | ] 335 | }, 336 | { 337 | "cell_type": "markdown", 338 | "metadata": {}, 339 | "source": [ 340 | "Propriedades ideais para Números-Índices e outras propriedades" 341 | ] 342 | }, 343 | { 344 | "cell_type": "markdown", 345 | "metadata": {}, 346 | "source": [ 347 | "* Identidade: $I_{00} = 1$ (Todos satisfazem)\n", 348 | "* Reversibilidade no tempo: $I_{t,0} \\times I_{0,t} = 1$\n", 349 | "* Encadeamento (ou circulariadade): $I_{0,1} \\times I_{1,2} \\times I_{2, 3} \\times \\dots \\times I_{t-1, t} = I_{0,t}$\n", 350 | " * $I_{0,1} \\times I_{1,2} = I_{0,2}$\n", 351 | "* Decomposição das causas (ou reversão de fatores): $I_p \\times I_q = I_{V}$\n", 352 | "* $\\rho_{pq} < 0 \\Rightarrow L>P$\n", 353 | "* $\\rho_{pq} > 0 \\Rightarrow P>L$\n", 354 | "* $\\rho_{pq} = 0 \\Rightarrow L=P$\n", 355 | "* $L_{p} \\times P_{q} = I_{V} = P_{p} \\times L_{q}$\n", 356 | "* $P_{p} \\times P_{q} \\le I_{V} \\le L_{p} \\times L_{q}$ " 357 | ] 358 | } 359 | ], 360 | "metadata": { 361 | "kernelspec": { 362 | "display_name": "Python 3", 363 | "language": "python", 364 | "name": "python3" 365 | }, 366 | "language_info": { 367 | "codemirror_mode": { 368 | "name": "ipython", 369 | "version": 3 370 | }, 371 | "file_extension": ".py", 372 | "mimetype": "text/x-python", 373 | "name": "python", 374 | "nbconvert_exporter": "python", 375 | "pygments_lexer": "ipython3", 376 | "version": "3.8.5" 377 | } 378 | }, 379 | "nbformat": 4, 380 | "nbformat_minor": 4 381 | } 382 | -------------------------------------------------------------------------------- /README.md: -------------------------------------------------------------------------------- 1 | # Statistical 2 | Este repositório armazena notas de aula de Estatística e Econometria. Adicionalmente, busca armazenar resumos teóricos de estatística e aplicações em Python. 3 | 4 | #### 0. [Teoria dos Conjuntos](https://github.com/ronissonlucas/Statistical/blob/main/1.%20N%C3%BAmeros-%C3%ADndices.ipynb) 5 | #### 1. [Números-Índices e Estatística Descritiva](https://github.com/ronissonlucas/Statistical/blob/main/1.%20N%C3%BAmeros-%C3%ADndices.ipynb) 6 | #### 2. [Probabilidade básica](https://github.com/ronissonlucas/Statistical/blob/main/2.%20Probabilidade.ipynb) 7 | #### 3. [Variáveis aleatórias discretas e contínuas](https://github.com/ronissonlucas/Statistical/blob/main/3.%20Vari%C3%A1veis_aleat%C3%B3rias.ipynb) 8 | #### 4. [Distribuições discretas e contínuas](https://github.com/ronissonlucas/Statistical/blob/main/4.%20Distribui%C3%A7%C3%B5es.ipynb) 9 | #### 4. [Distribuições conjuntas](https://github.com/ronissonlucas/Statistical/blob/main/5.%20Distribui%C3%A7%C3%B5es_conjuntas.ipynb) 10 | #### 6. [Inferência estatística: uma introdução](https://github.com/ronissonlucas/Statistical/blob/main/6.%20Introdu%C3%A7%C3%A3o%20%C3%A0%20Infer%C3%AAncia%20Estat%C3%ADstica.ipynb) 11 | #### 7. [Inferência estatística (continuação)](https://github.com/ronissonlucas/Statistical/blob/main/7.%20Continua%C3%A7%C3%A3o%20Infer%C3%AAncia%20e%20Teoremas.ipynb) 12 | #### 8. [Intervalo de confiança](https://github.com/ronissonlucas/Statistical/blob/main/8.%20Intervalo_Confian%C3%A7a.ipynb) 13 | #### 9. [Testes de hipótese](https://github.com/ronissonlucas/Statistical/blob/main/9.%20Testes.ipynb) 14 | 15 | #### Formulários 16 | [Números-índice e estatística básica](https://github.com/ronissonlucas/Statistical/blob/main/3.%20Vari%C3%A1veis_aleat%C3%B3rias.ipynb) 17 | 18 | #### Implementações em Python 19 | * [Regressão linear simples](https://github.com/ronissonlucas/Statistical/blob/main/Econometrics1.ipynb) 20 | 21 | 22 | -------------------------------------------------------------------------------- /TeoriaConjuntos.ipynb: -------------------------------------------------------------------------------- 1 | { 2 | "cells": [ 3 | { 4 | "cell_type": "markdown", 5 | "metadata": {}, 6 | "source": [ 7 | "# Teoria dos Conjuntos" 8 | ] 9 | }, 10 | { 11 | "cell_type": "markdown", 12 | "metadata": {}, 13 | "source": [ 14 | "Autor: Ronisson Lucas Calmon da Conceição" 15 | ] 16 | }, 17 | { 18 | "cell_type": "markdown", 19 | "metadata": {}, 20 | "source": [ 21 | "Definição: conjunto é uma coleção de elementos de U (denominado conjunto fundamental ou conjunto universal)." 22 | ] 23 | }, 24 | { 25 | "cell_type": "markdown", 26 | "metadata": {}, 27 | "source": [ 28 | "Definição: um conjunto nulo ou vazio é definido como o conjunto que não contém qualquer elemento. Denota-se: $\\emptyset$ ou $\\{\\}$. O conjunto $\\{x \\in \\mathbb{R}|x>0 \\mbox{ e } x<0 \\}$ é vazio, pois não existe um número real que satisfaça tal restrição." 29 | ] 30 | }, 31 | { 32 | "cell_type": "markdown", 33 | "metadata": {}, 34 | "source": [ 35 | "Se $x$ for um elemento de $A$ denotamos $x \\in A$, caso contrário $x \\not\\in A$." 36 | ] 37 | }, 38 | { 39 | "cell_type": "markdown", 40 | "metadata": {}, 41 | "source": [ 42 | "Subconjunto: $A \\subset B$ tal que se $x\\in A$ então, $x \\in B$. Inversamento, se $B \\subset A$ e $x \\in B$, então $x \\in A$." 43 | ] 44 | }, 45 | { 46 | "cell_type": "markdown", 47 | "metadata": {}, 48 | "source": [ 49 | "Igualdade: $A=B$ se, e somente se, $A \\subset B$ e $B \\subset A$. Ou seja, dois conjuntos serã iguais se, e somente se, eles contiverem os mesmo elementos." 50 | ] 51 | }, 52 | { 53 | "cell_type": "markdown", 54 | "metadata": {}, 55 | "source": [ 56 | "Consequências imediatas:\n", 57 | "1. $\\forall A$, temos que $\\emptyset \\subset A$.\n", 58 | "2. Para um dado conjunto fundamental definido, para todo conjunto $A$, considerado da composição de $U$ , temos que $A \\subset U$." 59 | ] 60 | }, 61 | { 62 | "cell_type": "markdown", 63 | "metadata": {}, 64 | "source": [ 65 | "* Exemplo: Seja $ U = \\mathbb{R}$, e os subconjuntos $A, B, C$, tais que $A = \\{x|x^{2}+2x-3=0 \\}$,$B=\\{x|\\left(x-2\\right)\\left(x^{2}+2x-3\\right)=0\\} $ e $C = \\{x|x=-3,1,2 \\}$. Logo, $A\\subset B$ e $B=C$" 66 | ] 67 | }, 68 | { 69 | "cell_type": "markdown", 70 | "metadata": {}, 71 | "source": [ 72 | "Operações com conjuntos" 73 | ] 74 | }, 75 | { 76 | "cell_type": "markdown", 77 | "metadata": {}, 78 | "source": [ 79 | "União (ou soma)
\n", 80 | "$A\\cup B=\\{x\\,|\\, x\\in A \\mbox{ ou }x\\in B\\}$ (ou ambos). Então $A \\cup B$ é composto por todos os elementos que estejam no conjunto $A$, ou em $B$, ou então em ambos." 81 | ] 82 | }, 83 | { 84 | "cell_type": "markdown", 85 | "metadata": {}, 86 | "source": [ 87 | "Interseção
\n", 88 | "$A\\cap B=\\{x\\,|\\, x\\in A \\mbox{ e }x\\in B\\}$. O conjunto $A \\cap B$ é formado por todos os elementos que estão em A e B." 89 | ] 90 | }, 91 | { 92 | "cell_type": "markdown", 93 | "metadata": {}, 94 | "source": [ 95 | "Diferença
\n", 96 | "$A-B = \\{x \\in U |x \\in A \\mbox{ e } x \\not\\in B\\}$" 97 | ] 98 | }, 99 | { 100 | "cell_type": "markdown", 101 | "metadata": {}, 102 | "source": [ 103 | "Definiremos agora o complementar de um conjunto $A$ : $A^{c} = \\overline{A}$ é um conjunto formado por todos os elementos que não estejam em A (mas estejam no conjunto fundamental). Assim: $\\overline{A} = U-A = \\{x|x\\not\\in A \\}$.Temos que: $A \\cup \\overline{A} = U$ e $A \\cap A = \\emptyset$." 104 | ] 105 | }, 106 | { 107 | "cell_type": "markdown", 108 | "metadata": {}, 109 | "source": [ 110 | "* Exemplo: Seja $ U = \\{1,2,3,4,5,6,7,8,9,10\\}$, $A = \\{1,2,3,4\\}$, $B = \\{3,4,5,6\\}$. Então: $\\overline{A} = {5,6,7,8,9,10}$, $A \\cup B = \\{1,2,3,4,5,6\\}$ e $A \\cap B = \\{3,4\\}$." 111 | ] 112 | }, 113 | { 114 | "cell_type": "markdown", 115 | "metadata": {}, 116 | "source": [ 117 | "Conjunto das partes: O conjunto das partes de um dado A, denotado $P(A) = $, como o conjunto dos subconjuntos de A:\n", 118 | "
$P(A) = \\{B\\subset U | B \\subset A \\}$." 119 | ] 120 | }, 121 | { 122 | "cell_type": "markdown", 123 | "metadata": {}, 124 | "source": [ 125 | "Famílias de conjuntos" 126 | ] 127 | }, 128 | { 129 | "cell_type": "markdown", 130 | "metadata": {}, 131 | "source": [ 132 | "Seja $K$ um conjunto, denominado conjunto índice. Então, se $\\forall i \\in K$ existe um conjunto $A_{i}$ associado a $i$, tal que $\\{A_{i}\\}_{i \\in K}$ é uma família de conjuntos. \n", 133 | "Para $K = 1,2,3,\\cdots,n$ denotamos $\\{A_{i}\\}_{i \\in K}$ como uma família finita de conjuntos. \n", 134 | "Já uma família infinita enumerável de conjuntos, para $K = 1,2,3, \\cdots, n$ denotamos $\\{A_{i}\\}_{i=1}^{\\infty}$." 135 | ] 136 | }, 137 | { 138 | "cell_type": "markdown", 139 | "metadata": {}, 140 | "source": [ 141 | "União finita de conjuntos:\n", 142 | "
$A_{1}\\cup A_{2} \\cup A_{3} \\cup \\cdots \\cup A_{n} = \\bigcup_{i=1}^{N} A_n$" 143 | ] 144 | }, 145 | { 146 | "cell_type": "markdown", 147 | "metadata": {}, 148 | "source": [ 149 | "Interseções finitas de conjuntos:" 150 | ] 151 | }, 152 | { 153 | "cell_type": "markdown", 154 | "metadata": {}, 155 | "source": [ 156 | "$A_{1} \\cap A_{2} \\cap A_{3} \\cap \\cdots \\cap A_{n} = \\bigcap_{n=1}^{N} A_{n}$" 157 | ] 158 | }, 159 | { 160 | "cell_type": "markdown", 161 | "metadata": {}, 162 | "source": [ 163 | "Para um conjunto enumerável(ou contável no infinito) temos $\\bigcup_{n=1}^{\\infty}A_{n}$ e $\\bigcap_{n=1}^{\\infty}A_{n}$." 164 | ] 165 | }, 166 | { 167 | "cell_type": "markdown", 168 | "metadata": {}, 169 | "source": [ 170 | "Propriedades:\n", 171 | "1. $A \\cup B = B \\cup A$\n", 172 | "2. $A \\cap B = B \\cap A$\n", 173 | "3. $A \\cup \\left(B \\cup C \\right) = \\left(A \\cup B\\right) \\cup C$\n", 174 | "4. $A \\cap \\left(B \\cap C\\right) = \\left(A \\cap B\\right) \\cap C$\n", 175 | "5. $A \\cup \\left(B\\cap C\\right) = \\left(A \\cup B\\right) \\cap \\left(A \\cup C\\right)$\n", 176 | "6. $A \\cap \\left(B \\cup C \\right) = \\left(A \\cap B \\right) \\cup \\left(A \\cap C\\right) $\n", 177 | "7. $A \\cap \\emptyset = \\emptyset$\n", 178 | "8. $A \\cup \\emptyset = A$\n", 179 | "9. $\\overline{\\left(A \\cap B\\right)} = \\overline{A} \\cup \\overline{B}$\n", 180 | "10. $\\overline{\\left(A \\cup B\\right)} = \\overline{A} \\cap \\overline{B}$\n", 181 | "11. $\\overline{\\overline{A}} = A$" 182 | ] 183 | }, 184 | { 185 | "cell_type": "markdown", 186 | "metadata": {}, 187 | "source": [ 188 | "(1) e (2) são leis comutativas e (3) e (4) são leis associativas. Já (5) e (6) são leis distributivas." 189 | ] 190 | }, 191 | { 192 | "cell_type": "markdown", 193 | "metadata": {}, 194 | "source": [ 195 | "Leis de Morgan:" 196 | ] 197 | }, 198 | { 199 | "cell_type": "markdown", 200 | "metadata": {}, 201 | "source": [ 202 | "1. $\\left(A \\cup B\\right)^{c} = A^{c} \\cap B^{c}$\n", 203 | "2. $\\left(A \\cap B\\right)^{c} = A^{c} \\cup B^{c}$" 204 | ] 205 | }, 206 | { 207 | "cell_type": "markdown", 208 | "metadata": {}, 209 | "source": [ 210 | "Conjuntos disjuntos: A e B são dito disjuntos se $A \\cap B = \\emptyset$." 211 | ] 212 | }, 213 | { 214 | "cell_type": "markdown", 215 | "metadata": {}, 216 | "source": [ 217 | "Produto cartesiano
\n", 218 | "Definição: Sejam dois conjuntos $A$ e $B$. O produto cartesiano de $A$ e $B$, denotado $A \\times B$ é o conjunto $\\{\\left(a,b\\right):a \\in A, b \\in B \\}$, é o conjunto de todos os pares ordenados nos quais o primeiro elemento é tirado de $A$ e o segundo de $B$. Em geral, $A \\times B \\neq B \\times A$. Sejam os conjuntos $A_{1},\\cdots, A_{n}$, então o produto cartesiano $A_{1} \\times A_{2} \\times A_{3} \\times \\cdots \\times A_{n}$ $n$ vezes, $A^{n}$ é dado por $A^{n} = \\{\\left(a_{1},a_{2},a_{3},\\cdots,a_{n}\\right),a_{i} \\in A_{i}\\}$, isto é, o conjunto de todas as ênuplas ordenadas." 219 | ] 220 | }, 221 | { 222 | "cell_type": "markdown", 223 | "metadata": {}, 224 | "source": [ 225 | "Notação:\n", 226 | "
$\\prod\\limits_{i=1}^{n}A_{i} = A_{1}\\times A_{2} \\times A_{3} \\times \\cdots \\times A_{n}$" 227 | ] 228 | }, 229 | { 230 | "cell_type": "markdown", 231 | "metadata": {}, 232 | "source": [ 233 | "* Exemplo: Sejam $A = \\{1,2,3\\}$ e $B = \\{1,2,3,4\\}$. Então: $A \\times B = \\{\\left(1,1\\right),\\left(1,2\\right),\\left(1,2\\right),\\left(1,3\\right),\\left(1,4\\right),\\left(2,1\\right) \\cdots \\left(3,4\\right)\\}$." 234 | ] 235 | }, 236 | { 237 | "cell_type": "markdown", 238 | "metadata": {}, 239 | "source": [ 240 | "Número de elementos de um conjunto" 241 | ] 242 | }, 243 | { 244 | "cell_type": "markdown", 245 | "metadata": {}, 246 | "source": [ 247 | "* Se existir um número finito de elementos no conjunto $A$, $a_{1},a_{2},a_{3}, \\dots a_{n}$, diremos que $A$ é finito.\n", 248 | "* Se existir um número infinito de elementos em $A$, os quais possam ser postos em correspondência biunívoca com os inteiros positivos, então diremos que $A$ é numerável ou infinito numerável.\n", 249 | "* Um conjunto que possui um número infinito de elementos que não podem ser enumerados, é dito conjunto infinito não-numerável." 250 | ] 251 | } 252 | ], 253 | "metadata": { 254 | "kernelspec": { 255 | "display_name": "Python 3", 256 | "language": "python", 257 | "name": "python3" 258 | }, 259 | "language_info": { 260 | "codemirror_mode": { 261 | "name": "ipython", 262 | "version": 3 263 | }, 264 | "file_extension": ".py", 265 | "mimetype": "text/x-python", 266 | "name": "python", 267 | "nbconvert_exporter": "python", 268 | "pygments_lexer": "ipython3", 269 | "version": "3.8.10" 270 | } 271 | }, 272 | "nbformat": 4, 273 | "nbformat_minor": 4 274 | } 275 | --------------------------------------------------------------------------------