├── .gitignore ├── Calculus ├── AnalysisFoundation.tex ├── DifferentialCalculusOfMultivariateFunction.tex ├── DifferentialCalculusOfUnaryFunction.tex ├── ImproperIntegral.tex ├── InfiniteSeries.tex ├── IntegralCalculusOfMultivariateFunction.tex ├── IntegralCalculusOfUnaryFunction.tex ├── OrdinaryDifferentialEquation.tex └── SpaceAnalyticGeometry.tex ├── LinearAlgebra ├── Determinant.tex ├── InnerProductSpaceAndOrthogonality.tex ├── LinearSpaceAndLinearMap.tex ├── Matrix.tex ├── QuadraticForm.tex └── VectorAndLinearSystem.tex ├── MathematicalStatistics ├── HypothesisTest.tex ├── ParameterEstimation.tex └── StatisticsAndSamplingDistribution.tex ├── Probability ├── ContinuousRandomVariable.tex ├── DiscreteRandomVariable.tex ├── LimitTheory.tex ├── NumericalCharacteristics.tex └── RandomEventAndProbability.tex ├── README.md └── main.tex /.gitignore: -------------------------------------------------------------------------------- 1 | *.aux 2 | *.log 3 | *.out 4 | *.pdf 5 | *.synctex.gz 6 | *.toc 7 | *.idx 8 | *.ilg 9 | *.ind 10 | -------------------------------------------------------------------------------- /Calculus/AnalysisFoundation.tex: -------------------------------------------------------------------------------- 1 | \chapter{分析基础} 2 | 3 | \section{基础概念} 4 | 这一节主要介绍了邻域的概念和常用的不等式。 5 | 关于函数的基础知识,这里就不再赘述了。 6 | 7 | \subsection{邻域} 8 | 对于实数$a\in\mfR$,定义它的邻域为 9 | $N(a,\delta) = \{ x: |x-a| < \delta \}$, 10 | 其中,实数$\delta > 0$。 11 | 12 | 同样,可以定义$a$的左邻域为 13 | $N(a,\delta)_+ = \{ x: 0 \le x - a < \delta \}$, 14 | 右邻域为 15 | $N(a,\delta)_- = \{ x: -\delta < x - a \le 0 \}$。 16 | 17 | \subsection{常用等式与不等式} 18 | \begin{enumerate} 19 | \item 20 | $1^2+2^2+\dots +n^2 = n(n+1)(2n+1)/6$ 21 | \item 22 | $(\sum_{i}a_i b_i)^2 \le (\sum_{i}a_i^2)(\sum_{i}b_i)^2$ 23 | \item 24 | $\sin x < x < \tan x \quad (0 < x < \pi/2)$ 25 | \item 26 | 若$x_1,\dots,x_n$符号相同且都大于$-1$,那么 27 | \[(1+x_1)(1+x_2)\dots(1+x_n)\ge 1+x_1+x_2+\dots+x_n\] 28 | \end{enumerate} 29 | 30 | \section{极限的概念} 31 | 这一节首先介绍数列极限和函数极限的定义。微积分的大厦自此开始建立。 32 | 然后我们介绍比较重要的函数左极限与右极限的概念, 33 | 这是因为函数极限存在与左极限、右极限之间有一定关系。 34 | 最后,我们介绍函数极限和数列极限的关系, 35 | 从而获得另一个判定函数极限存在的方法。 36 | 37 | \subsection{数列的极限} 38 | 数列的极限主要讨论自变量$n$无限增大时(记为$n\to+\infty$或$n\to\infty$), 39 | 因变量$a_n$的变化趋向。 40 | 当$n\to\infty$时,如果$a_n$无限接近于某一定值, 41 | 则称$\{a_n\}$为\textbf{收敛数列}, 42 | 否则称$\{a_n\}$为\textbf{发散数列}。 43 | 44 | 对于收敛数列,我们用下面的$\epsilon$-$N$语言来定义它的极限。 45 | \begin{definition}[数列极限的$\epsilon$-$N$定义] 46 | \begin{displaymath} 47 | \lim_{n\to\infty}a_n=A 48 | \iff \forall\epsilon>0,\exists N,\forall n>N,|a_n - A|<\epsilon 49 | \end{displaymath} 50 | \end{definition} 51 | \begin{remark} 52 | 当要描述数列不收敛到某一个值时,只要把上面的定义取否命题即可。 53 | \end{remark} 54 | 55 | 对于发散数列,它有四种情况:发散到正无穷,发散到负无穷,绝对值发散到正无穷,以及振荡。 56 | 我们用$G$-$N$语言来描述前三种情况。 57 | \begin{definition}[数列极限的$G$-$N$的定义] 58 | \begin{align*} 59 | &\lim_{n\to\infty}a_n=+\infty 60 | \iff \forall G>0,\exists N,\forall n>N, a_n > G \\ 61 | &\lim_{n\to\infty}a_n=-\infty 62 | \iff \forall G>0,\exists N,\forall n>N, a_n < -G \\ 63 | &\lim_{n\to\infty}a_n=\infty 64 | \iff \forall G>0,\exists N,\forall n>N, |a_n| > G 65 | \end{align*} 66 | \end{definition} 67 | 68 | \subsection{函数的极限} 69 | 函数的极限研究函数在自变量的某变化过程中相应的因变量的变化趋向。 70 | 与数列极限不同的是,数列极限的自变量只有一种变化趋向,即$n\to\infty$, 71 | 而函数极限的自变量有六种变化趋向。 72 | 73 | 对于自变量$x$变化的趋向,我们定义下面两类共6种模板: 74 | \begin{itemize} 75 | \item $\delta$模板: 76 | \begin{align*} 77 | x\to a 78 | &\iff \dots, \exists \delta > 0,\forall x, 0<|x-a|<\delta, \dots \\ 79 | x\to a+0 80 | &\iff \dots, \exists \delta > 0,\forall x, 0 0,\forall x, -\delta 0, \forall x > H, \dots \\ 88 | x\to-\infty 89 | &\iff \dots, \exists H > 0, \forall x < -H, \dots \\ 90 | x\to\infty 91 | &\iff \dots, \exists H > 0, \forall |x| > H, \dots 92 | \end{align*} 93 | \end{itemize} 94 | 95 | 对于因变量$f(x)$,我们定义下面两类共4种模板: 96 | \begin{itemize} 97 | \item $\epsilon$模板 98 | \begin{displaymath} 99 | f(x)\to A 100 | \iff \forall\epsilon>0, \dots, |f(x)-A|<\epsilon 101 | \end{displaymath} 102 | \item $G$模板 103 | \begin{align*} 104 | f(x)\to+\infty 105 | &\iff \forall G>0,\dots, f(x) > G \\ 106 | f(x)\to-\infty 107 | &\iff \forall G>0,\dots, f(x) < -G \\ 108 | f(x)\to\infty 109 | &\iff \forall G>0,\dots, |f(x)| > G 110 | \end{align*} 111 | \end{itemize} 112 | 113 | 以上模板可以组合成函数极限的 114 | ``$\epsilon$-$\delta$''、``$\epsilon$-$H$''、``$G$-$\delta$''、``$G$-$H$''定义。 115 | 以下面将要说明的左极限为例,我们可以组合出左极限的$\epsilon$-$\delta$定义: 116 | \begin{displaymath} 117 | \lim_{x\to a-0}f(x)=A 118 | \iff \forall\epsilon>0,\exists\delta>0,\forall x, -\deltaC$($AC$($f(x) 0$,存在$N$,使得 269 | 对任意$m,n\ge N$,有$|a_m-a_n|\le \epsilon$, 270 | 则$\{a_n\}$有极限。 271 | \end{enumerate} 272 | 以上内容只是做个小拓展。我也理解得不够深刻。 273 | 274 | \subsection{极限的存在准则} 275 | 极限存在的两个准则分别是:夹逼定理(见定理\ref{thrm:squeeze})和单调有界定理。 276 | 277 | \begin{theorem}[数列的单调有界定理] 278 | 单调有界的数列必存在有限极限。 279 | \end{theorem} 280 | 281 | \begin{theorem}[函数的单调有界定理] 282 | 设$f$是定义在区间$I$上的单调有界函数, 283 | 则$f$在$I$的任意一点上都存在有限的单侧极限。 284 | \end{theorem} 285 | 286 | \subsection{两个重要极限} 287 | \begin{displaymath} 288 | \lim_{x\to 0}\frac{\sin x}{x}=1 289 | \end{displaymath} 290 | \begin{displaymath} 291 | \lim_{x\to\infty}\left(1+x\right)^{\frac{1}{x}} = e 292 | \quad\text{或}\quad 293 | \lim_{x\to 0}\left(1+\frac{1}{x}\right)^{x} = e 294 | \end{displaymath} 295 | 296 | \section{连续} 297 | 本小节首先介绍函数连续性的概念(含左连续与右连续)与间断点的类型。 298 | 然后讨论连续函数的性质和初等函数的连续性。 299 | 最后,我们给出闭区间上连续函数的性质, 300 | 包括有界性定理、最值定理、介值定理和零点定理。 301 | 302 | \subsection{连续与间断} 303 | \begin{definition}[函数在点$a$连续与间断] 304 | 设函数在点$a$的某个邻域上有定义。 305 | 如果$\lim_{x\to a}f(x)=f(a)$, 306 | 则称$f$在点$a$\textbf{连续}, 307 | 否则称$f$在点$a$\textbf{间断}。 308 | 若$f(a-0)=f(a)$,则称$f$在点$a$\textbf{左连续}。 309 | 若$f(a+0)=f(a)$,则称$f$在点$a$\textbf{右连续}。 310 | \end{definition} 311 | \begin{remark} 312 | 显然,$f$在点$a$连续的充要条件有 313 | \begin{displaymath} 314 | f(a+0)=f(a-0)=f(a) 315 | \end{displaymath} 316 | \end{remark} 317 | 318 | 函数$f$在点$a$连续有以下等价的说法: 319 | \begin{align*} 320 | \text{$f$在点$a$连续} 321 | &\iff \text{$f$在$a$的某邻域有定义且$\lim_{x\to a}f(x)=a$} \\ 322 | &\iff \lim_{\Delta x\to 0}f(a+\Delta x)=f(a) \\ 323 | &\iff \lim_{\Delta x\to 0}\Delta f = 0 324 | \end{align*} 325 | 326 | 如果函数$f$在点$a$间断,那么可以把间断点分成以下两类: 327 | \begin{center} 328 | \begin{tabular}{|c|l|l|} 329 | \hline 330 | 间断点类型 & \multicolumn{1}{c|}{$f(a+0)$与$f(a-0)$} 331 | & \multicolumn{1}{c|}{说明} \\ 332 | \hline 333 | \multirow{2}{*}{第I类间断点} 334 | & \begin{tabular}[c]{@{}l@{}}存在且相等,\\ 极限值为$A$\end{tabular} 335 | & \begin{tabular}[c]{@{}l@{}}也称\textbf{可去间断点},因$f$在点$a$\\ 336 | 无定义或$f(a)\neq A$引起间断\end{tabular} \\ 337 | \cline{2-3} 338 | & 存在但不相等 & 也称\textbf{跳跃型间断点} \\ 339 | \hline 340 | \multirow{2}{*}{第II间断点} & 至少有一个是无穷大 & 也称\textbf{无穷型间断点} \\ 341 | \cline{2-3} 342 | & 至少有一个不存在 & \\ 343 | \hline 344 | \end{tabular} 345 | \end{center} 346 | 347 | \subsection{连续函数的局部性质与运算法则} 348 | 若函数$f$在点$a$连续,根据\ref{sec:limit-property}节描述的 349 | 存在有限极限的函数的局部性质和运算法则, 350 | 能得到以下定理: 351 | 352 | \begin{theorem}[局部有界性] 353 | 若函数$f$在点$a$连续,则$f$在点$a$的某个邻域里有界。 354 | \end{theorem} 355 | 356 | \begin{theorem}[局部保号性] 357 | 若函数$f$在点$a$连续,且$f(a)\neq 0$, 358 | 则函数$f$在点$a$的某邻域内与$f(a)$同号。 359 | 360 | 又若$f(a)>p(p( 0$时,$[f(a+\Delta x) - f(a)]/\Delta x \le 0$,同样有 311 | \begin{displaymath} 312 | f'(a) = f'_{+}(a) =\lim_{\Delta x\to 0+} 313 | \frac{f(a+\Delta x) - f(a)}{\Delta x} \le 0 314 | \end{displaymath} 315 | 因此只能等号成立,即$f'(a)=0$。 316 | \end{proof} 317 | \begin{remark} 318 | 费马引理给出了极值的必要条件,但不是充分条件。 319 | \end{remark} 320 | 321 | \begin{lemma}[罗尔(Rolle)定理] \label{thrm:rolle} 322 | 设函数$f$满足: 323 | \begin{enumerate} 324 | \item 325 | 在闭区间$[a,b]$上连续; 326 | \item 327 | 在开区间$(a,b)$上可导; 328 | \item 329 | $f(a)=f(b)$。 330 | \end{enumerate} 331 | 则在$(a,b)$内至少存在一个点$\xi$,使得$f'(\xi)=0$。 332 | \end{lemma} 333 | \begin{proof} 334 | 因为$f$在闭区间$[a,b]$上连续, 335 | 所以根据闭区间上连续函数的性质(\ref{thrm:continuous-func-bounded}), 336 | $f$在$[a,b]$上能取到最大值$M$和最小值$m$。下面有两种可能: 337 | \begin{enumerate} 338 | \item 339 | 若$M = m$,则$f$在$[a,b]$上为常数, 340 | 因此对$(a,b)$内的任一点$x$都有$f'(x)=0$, 341 | 即$\xi$可取$(a,b)$内任一点。 342 | \item 343 | 若$M\neq m$,则$M$和$m$中至少有一个不等于$f(a)$, 344 | 不妨设$M\neq f(a)=f(b)$, 345 | 于是至少有一个点$\xi\in(a,b)$,使得$f(\xi)=M$。 346 | 根据费马定理(\ref{thrm:fermat})得到$f'(\xi)=0$。 347 | \end{enumerate} 348 | \end{proof} 349 | 350 | \subsection{中值定理} 351 | \begin{theorem}[拉格朗日(Lagrange)中值定理] \label{thrm-lagrange-mean-value} 352 | 设函数$f$满足: 353 | \begin{enumerate} 354 | \item 355 | 在闭区间$[a,b]$上连续; 356 | \item 357 | 在开区间$(a,b)$上可导。 358 | \end{enumerate} 359 | 则至少存在一点$\xi\in(a,b)$,使得 360 | \begin{displaymath} 361 | f'(\xi)=\frac{f(b)-f(a)}{b-a} 362 | \end{displaymath} 363 | \end{theorem} 364 | 365 | \begin{proof} 366 | 作辅助函数 367 | \begin{displaymath} 368 | F(x) = f(x)-f(a)-\frac{f(b)-f(a)}{b-a}(x-a) 369 | \end{displaymath} 370 | 它是由$f(x)$与端点为$(a,f(a))$、$(b,f(b))$的直线相减得到的。 371 | 这样,就有$F(a)=F(b)=0$, 372 | 且不难验证它满足罗尔定理(\ref{thrm:rolle})的其它条件。 373 | 因此,至少存在一点$\xi\in(a,b)$,使得$F'(\xi)=0$,即 374 | \begin{displaymath} 375 | f'(\xi)-\frac{f(b)-f(a)}{b-a} = 0 376 | \end{displaymath} 377 | 此即为求证的目标式。 378 | \end{proof} 379 | 380 | \begin{remark} 381 | 需要留意辅助函数的构造方法。此外,拉格朗日中值定理还能写成 382 | \begin{align*} 383 | f(x_0 + \Delta x) 384 | &= f(x_0) + f'(\xi)\Delta x &\xi\in(0,x_0+\Delta x)\\ 385 | &= f(x_0) + f'(x_0+\theta \Delta x)\Delta x &\theta\in(0,1) 386 | \end{align*} 387 | \end{remark} 388 | 389 | \begin{theorem}[柯西(Cauchy)中值定理] \label{thrm:cauchy-mean-value} 390 | 设函数$f,g$满足 391 | \begin{enumerate} 392 | \item 393 | 在闭区间$[a,b]$上连续; 394 | \item 395 | 在开区间$(a,b)$上可导,且$g'(x)\neq 0$。 396 | \end{enumerate} 397 | 则至少存在一点$\xi\in(a,b)$,使得 398 | \begin{displaymath} 399 | \frac{f(b)-f(a)}{g(b)-g(a)}=\frac{f'(\xi)}{g'(\xi)} 400 | \end{displaymath} 401 | \end{theorem} 402 | 403 | \begin{proof} 404 | 因为$g'(x)\neq 0$,所以$g(b)-g(a)=g'(\xi)(b-a)\neq 0$, 405 | 所以我们能构造有意义的函数 406 | \begin{displaymath} 407 | F(x)=f(x)-\frac{f(b)-f(a)}{g(b)-g(a)}g(x) 408 | \end{displaymath} 409 | 不难发现$F(a)=F(b)$, 410 | 且$F(x)$满足罗尔定理(\ref{thrm:rolle})的其它条件, 411 | 所以至少存在一点$\xi\in(a,b)$,使得$F'(x)=0$,即 412 | \begin{displaymath} 413 | f'(\xi)-\frac{f(b)-f(a)}{g(b)-g(a)}g'(\xi)=0 414 | \end{displaymath} 415 | 此即为求证的目标式 416 | \end{proof} 417 | 418 | \section{洛必达法则} 419 | 本小节介绍能够求$\frac{0}{0}$和$\frac{\infty}{\infty}$型不定型极限的有效方法 420 | ——洛必达(L'Hospital)法则。 421 | 422 | \subsection{求$\frac{0}{0}$型不定型极限的法则} 423 | \begin{theorem} 424 | 设在去心邻域$U(a,r)-\{a\}$内函数$f,g$满足 425 | \begin{enumerate} 426 | \item 427 | $\lim_{x\to a} f(x) = \lim_{x\to a}g(x) = 0$, 428 | \item 429 | $f',g'$存在且$g'(x) \neq 0$, 430 | \item \label{item:deri-lim-exist} 431 | $\lim_{x\to a} \frac{f'(x)}{g'(x)}=A$(有限或$\pm\infty$)。 432 | \end{enumerate} 433 | 则有 434 | \begin{displaymath} 435 | \lim_{x\to a}\frac{f(x)}{g(x)}=\lim_{x\to a} \frac{f'(x)}{g'(x)} 436 | \end{displaymath} 437 | \end{theorem} 438 | 439 | \begin{remark} 440 | 一些注意点: 441 | \begin{enumerate} 442 | \item 443 | 对单侧极限,该定理仍成立。 444 | \item 445 | 对于$x\to\infty$,该定理也成立。 446 | \item 447 | 定理的条件是充分的,不是必要的。 448 | 即当条件\ref{item:deri-lim-exist}不满足时, 449 | 不能断定极限$\lim \frac{f(x)}{g(x)}$不存在。 450 | \end{enumerate} 451 | \end{remark} 452 | 453 | \subsection{求$\frac{\infty}{\infty}$型不定型极限的法则} 454 | \begin{theorem} 455 | 设在去心邻域$U(a,r)-\{a\}$内函数$f,g$满足 456 | \begin{enumerate} 457 | \item 458 | $\lim_{x\to a} f(x) = \lim_{x\to a}g(x) = \infty$, 459 | \item 460 | $f',g'$存在且$g'(x) \neq 0$, 461 | \item 462 | $\lim_{x\to a} \frac{f'(x)}{g'(x)}=A$(有限或$\pm\infty$)。 463 | \end{enumerate} 464 | 则有 465 | \begin{displaymath} 466 | \lim_{x\to a}\frac{f(x)}{g(x)}=\lim_{x\to a} \frac{f'(x)}{g'(x)} 467 | \end{displaymath} 468 | \end{theorem} 469 | 470 | \subsection{其它五种不定型极限} 471 | 其它五种不定型都可化为$\frac{0}{0}$或$\frac{\infty}{\infty}$型: 472 | \begin{itemize} 473 | \item 474 | $0\cdot\infty$可以化成$\frac{0}{1/\infty}$。 475 | \item 476 | $\infty - \infty$可以进行通分。 477 | \item 478 | $0^0$,$1^{\infty}$,$\infty^0$可以取对数。 479 | \end{itemize} 480 | 481 | \section{泰勒公式} 482 | 本小节介绍泰勒公式,并给出常用的基本初等函数的麦克劳林公式。 483 | 484 | \subsection{泰勒公式} 485 | \begin{theorem}[泰勒(Taylor)公式] 486 | 设函数$f$在点$a$的邻域$U$内存在直到$n+1$阶导数, 487 | 则$f$在$U$上可展成$n$阶泰勒公式 488 | \begin{equation} \label{eq:talor} 489 | f(x) = \sum_{k=0}^{n}\frac{f^{(k)}(a)}{k!}(x-a)^k + r_n(x) 490 | \end{equation} 491 | 其中$r_n(x)$可表达为\textbf{拉格朗日余项}形式 492 | \begin{displaymath} 493 | r_n(x)=\frac{f^{(n+1)}(\xi)}{(n+1)!}(x-a)^{n+1}, 494 | \quad \xi\in(a,x) 495 | \end{displaymath} 496 | 或 497 | \begin{displaymath} 498 | r_n(x)=\frac{f^{(n+1)}(a+\theta(x-a))}{(n+1)!}(x-a)^{n+1}, 499 | \quad \theta\in(0,1) 500 | \end{displaymath} 501 | 这时,称式\eqref{eq:talor}为\textbf{带拉格朗日余项的$n$阶泰勒公式}。 502 | $r_n(x)$也可表达为\textbf{皮亚诺(Peano)余项}形式 503 | \begin{displaymath} 504 | r_n(x)=o\left((x-a)^n\right),\quad((x-a)\to 0) 505 | \end{displaymath} 506 | 这时,称式\eqref{eq:talor}为\textbf{带皮亚诺余项的$n$阶泰勒公式}。 507 | 508 | 特别的,若$a=0$,分别称 509 | \begin{displaymath} 510 | f(x) = \sum_{k=0}^{n}\frac{f^{(k)}(0)}{k!}x^k 511 | + \frac{f^{(n+1)}(\theta x)}{(n+1)!}x^{n+1}, 512 | \quad \theta\in (0,1) 513 | \end{displaymath} 514 | 与 515 | \begin{displaymath} 516 | f(x) = \sum_{k=0}^{n}\frac{f^{(k)}(0)}{k!}x^k 517 | + o(x^n),\quad (x\to 0) 518 | \end{displaymath} 519 | 为带拉格朗日余项与皮亚诺余项的\textbf{$n$阶麦克劳林(Maclaurin)公式}。 520 | \end{theorem} 521 | 522 | \subsection{基本初等函数的麦克劳林公式} 523 | 下面是带拉格朗日余项的初等函数的麦克劳林公式。其中,$\theta\in (0,1)$。 524 | \begin{align*} 525 | e^x &= 1+x+\frac{x^2}{2!}+\dots+\frac{x^n}{n!} 526 | + \frac{e^{\theta x}}{(n+1)!}x^{n+1} \\ 527 | \sin x &= x - \frac{x^3}{3!} + \frac{x^5}{5!} -\dots 528 | + \frac{(-1)^{m-1}}{(2m-1)!}x^{2m-1}\\ 529 | &\quad + \frac{\sin(\theta x + (2m+1)\pi / 2)}{(2m+1)!}x^{2m+1}\\ 530 | \cos x &= 1 - \frac{x^2}{2!} + \frac{x^4}{4!} -\dots 531 | + \frac{(-1)^{m}}{(2m)!}x^{2m}\\ 532 | &\quad + \frac{\cos(\theta x + (m+1)\pi)}{(2m+2)!}x^{2m+2} \\ 533 | \ln(1+x) &= x -\frac{x^2}{2} + \frac{x^3}{3}-\dots 534 | + \frac{(-1)^{n-1}}{n}x^n \\ 535 | &\quad + \frac{(-1)^{n}}{(n+1)(1+\theta x)^{n+1}}x^{n+1} \\ 536 | (1+x)^{\mu} &= 1 + \mu x + \frac{\mu(\mu-1)}{2}x^2+\dots 537 | + \frac{\mu(\mu-1)\dots(\mu-n+1)}{n!}x^n \\ 538 | &\quad + \frac{\mu(\mu-1)\dots(\mu-n)}{(n+1)!} 539 | (1+\theta x)^{\mu-n-1}x^{n+1} 540 | \end{align*} 541 | 542 | \section{利用导数研究函数的性质} 543 | 本小节主要介绍函数的凹凸性与导数的关系。 544 | 至于导数与单调性、极值和最值的关系, 545 | 这些已经在高中阶段学习得很透彻了, 546 | 这里不再多讲。 547 | 548 | \subsection{单调性\ 极值\ 最值} 549 | 高中内容。略。 550 | 551 | \subsection{凹凸性} 552 | \begin{definition}[凸函数] 553 | 设函数$f$在区间$I$上定义。 554 | 如果对$I$上任意两点$x_1,x_2$,以及$\lambda\in[0,1]$,都有 555 | \begin{displaymath} 556 | f(\lambda x_1 + (1-\lambda)x_2)\le 557 | \lambda f(x_1) + (1-\lambda)f(x_2) 558 | \end{displaymath} 559 | 则称$f$为$I$上的\textbf{凸函数}。 560 | 若式中不等号反向,则称$f$为$I$上的\textbf{凹函数}。 561 | 若式中是严格不等式,则称$f$为$I$上的\textbf{严格凸函数}。 562 | \end{definition} 563 | 564 | \begin{theorem}[凸函数的充要条件(一阶可导)] 565 | 设函数$f$在$I$内可导, 566 | 则$f$在$I$内是严格凸函数的充要条件是$f'(x)$在$I$上严格递增。 567 | \end{theorem} 568 | 569 | \begin{theorem}[凸函数的充要条件(二阶可导)] 570 | 设函数$f$在$I$内二阶可导, 571 | 则$f$在$I$内是严格凸函数的充要条件是对任意$x\in I$,$f''(x)>0$。 572 | \end{theorem} 573 | -------------------------------------------------------------------------------- /Calculus/ImproperIntegral.tex: -------------------------------------------------------------------------------- 1 | \chapter{广义积分} 2 | % TODO 3 | -------------------------------------------------------------------------------- /Calculus/InfiniteSeries.tex: -------------------------------------------------------------------------------- 1 | \chapter{无穷级数} 2 | % TODO 3 | -------------------------------------------------------------------------------- /Calculus/IntegralCalculusOfMultivariateFunction.tex: -------------------------------------------------------------------------------- 1 | \chapter{多元函数积分学} 2 | % TODO 3 | -------------------------------------------------------------------------------- /Calculus/IntegralCalculusOfUnaryFunction.tex: -------------------------------------------------------------------------------- 1 | \chapter{一元函数积分学} 2 | % TODO 3 | 4 | -------------------------------------------------------------------------------- /Calculus/OrdinaryDifferentialEquation.tex: -------------------------------------------------------------------------------- 1 | \chapter{常微分方程} 2 | % TODO 3 | -------------------------------------------------------------------------------- /Calculus/SpaceAnalyticGeometry.tex: -------------------------------------------------------------------------------- 1 | \chapter{空间解析几何} 2 | % TODO 3 | -------------------------------------------------------------------------------- /LinearAlgebra/Determinant.tex: -------------------------------------------------------------------------------- 1 | \chapter{行列式} 2 | 3 | \section{行列式} 4 | 本小节开始讨论行列式的概念。 5 | 6 | 首先我们给出了行列式的定义。 7 | 但是,如果我们根据行列式的定义来计算行列式,除了一些特殊矩阵, 8 | 用计算科学的说法,大部分$n$阶行列式的计算复杂度是$O(n!)$, 9 | 因此我们需要探索更高效的方法来计算行列式。 10 | 11 | 接下来,我们给出了行列式的一些基本性质。 12 | 有了这些性质,我们得到了新的行列式计算方法, 13 | 而且稍加分析,就能惊喜地看出这个方法的时间复杂度是$O(n^3)$。 14 | 15 | \subsection{$n$阶行列式} 16 | \begin{definition}[$n$级排列] 17 | $n$个自然数按任意固定的顺序构成的一个排列称为$n$\textbf{级排列}。 18 | 所有$n$级排列构成的集合记作$\pi_n$。 19 | \end{definition} 20 | 21 | \begin{definition}[逆序数] 22 | 在一个$n$级排列$(i_1,i_2,\dots,i_n)$中, 23 | 如果$i_r>i_s$,但是$rj$时,$a_{ij}=0$,则称$\mmA$为\textbf{上三角阵}。 58 | 若当$i 0(<0)$, 178 | 则称这个二次型为\textbf{正定二次型}(\textbf{负定二次型})。 179 | $\mmA$则被称为\textbf{正定矩阵}。 180 | \end{definition} 181 | 182 | \subsection{判定正定二次型与正定矩阵的充要条件} 183 | \begin{theorem}[正定二次型的充要条件] 184 | $n$元实二次型是正定二次型的充要条件是它的正惯性指数为$n$。 185 | \end{theorem} 186 | 187 | \begin{definition}[顺序主子式] 188 | 设$\mmA$为$n$阶矩阵,行列式 189 | \begin{displaymath} 190 | D_i=\mdet{cccc}{ 191 | a_{11} & a_{12} & \cdots & a_{1i} \\ 192 | a_{21} & a_{22} & \cdots & a_{2i} \\ 193 | \vdots & \vdots & \ddots & \vdots \\ 194 | a_{i1} & a_{i2} & \cdots & a_{ii} } 195 | \end{displaymath} 196 | 称为$\mmA$的\textbf{$i$阶顺序主子式}($i=1,\dots,n$)。 197 | \end{definition} 198 | 199 | \begin{theorem}[正定矩阵的充要条件] 200 | 设$\mmA$是$n$阶方阵。以下命题等价: 201 | \begin{enumerate} 202 | \item 203 | $\mmA$是正定矩阵。 204 | \item 205 | $\mmA$的所有特征值为正。 206 | \item 207 | $\mmA$合同于单位矩阵。($\mmA$能写成$\mmP^\mT\mmP$) 208 | \item 209 | $\mmA$的各阶顺序主子式都为正。 210 | \end{enumerate} 211 | \end{theorem} -------------------------------------------------------------------------------- /LinearAlgebra/VectorAndLinearSystem.tex: -------------------------------------------------------------------------------- 1 | \chapter{向量组的线性相关性与线性代数方程组} 2 | 3 | \section{向量组的线性无关} 4 | 在一个方程组中,会有一些方程是``无用的'', 5 | 也就是说,它能由其它方程通过线性运算表示出来。 6 | 向量组的线性无关与此概念紧密联系——向量组即是一个方程的系数矩阵。 7 | 向量组的极大线性无关组也就反应了在方程组中去掉那些无用的方程后得到的方程组。 8 | 向量组的秩即是这些有用的方程的个数。 9 | 10 | \subsection{线性相关与线性无关} 11 | \begin{definition}[线性组合与线性表示] 12 | 设$\alpha,\alpha_1,\alpha_2,\dots,\alpha_r$是一组$n$维向量。 13 | 如果存在数$k_1,k_2,\dots,k_r$,使得 14 | \[ \alpha = k_1\alpha_1+k_2\alpha_2+\dots k_r\alpha_r \] 15 | 则称$\alpha$是$\alpha_1,\alpha_2,\dots,\alpha_r$的\textbf{线性组合}, 16 | 或者说$\alpha$可由$\alpha_1,\alpha_2,\dots,\alpha_r$\textbf{线性表示}, 17 | 其中,$k_1,k_2,\dots,k_r$叫做\textbf{表示系数}。 18 | \end{definition} 19 | 20 | \begin{definition}[线性相关与线性无关] 21 | 设$\alpha_1,\alpha_2,\dots,\alpha_r$是一组$n$维向量。 22 | 如果存在一组\textbf{不全为零}的数$k_1,k_2,\dots,k_r$,使得 23 | \[ k_1\alpha_1+k_2\alpha_2+\dots k_r\alpha_r = \mvZero \] 24 | 则称向量组$\alpha_1,\alpha_2,\dots,\alpha_r$\textbf{线性相关}; 25 | 否则,称\textbf{线性无关}。 26 | \end{definition} 27 | 28 | \begin{theorem}[线性相关与线性组合的联系] 29 | $\alpha_1,\alpha_2,\dots,\alpha_r\ (r\ge 2)$线性相关 30 | 当且仅当至少有一个向量是其它向量的线性组合。 31 | \end{theorem} 32 | 33 | \begin{theorem}[线性相关与线性无关的等价条件] 34 | 设$\alpha_1,\alpha_2,\dots,\alpha_r$是一组$n$维列向量, 35 | $\mvk = (k_1,k_2,\dots,k_r)^\mT$, 36 | 矩阵$\mmA = (\alpha_1,\alpha_2,\dots,\alpha_r)$,那么 37 | \begin{align*} 38 | \alpha_1,\alpha_2,\dots,\alpha_r\ \text{线性相关} 39 | &\iff \mmA\mvk = \mvZero\ \text{有非零解} \\ 40 | &\iff |\mmA|=0 41 | \end{align*} 42 | \begin{align*} 43 | \alpha_1,\alpha_2,\dots,\alpha_r\ \text{线性无关} 44 | &\iff \mmA\mvk = \mvZero\ \text{仅有零解} \\ 45 | &\iff |\mmA|\neq 0 46 | \end{align*} 47 | \end{theorem} 48 | 49 | \subsection{向量组组内关系} 50 | \begin{theorem}[接长与补短] 51 | 设向量组$S_1: \alpha_1,\alpha_2,\dots,\alpha_r$。 52 | 若在每个向量中添加一个分量,把它变成$n+1$维向量组$S_2$, 53 | 那么$S_1$线性无关能推出$S_2$线性无关, 54 | $S_2$线性相关能推出$S_1$线性相关。 55 | \end{theorem} 56 | 57 | \begin{theorem}[部分与整体] 58 | 设向量组 59 | \[ S_1: \alpha_1,\alpha_2,\dots,\alpha_r \] 60 | 与向量组 61 | \[ S_2: \alpha_1,\alpha_2,\dots,\alpha_r,\alpha_{r+1},\dots,\alpha_s \] 62 | 是两个$n$维向量组。 63 | 若$S_1$线性相关,则$S_2$线性相关; 64 | 反之,若$S_2$线性无关,则$S_1$线性无关。 65 | \end{theorem} 66 | 67 | \begin{remark} 68 | 直白地说,就是部分相关可以推出整体相关,整体无关可以推出部分无关。 69 | \end{remark} 70 | 71 | \begin{theorem} 72 | 任意$n+1$个$n$维向量一定线性相关。 73 | \end{theorem} 74 | 75 | \subsection{向量组组间关系} 76 | \begin{definition}[向量组等价] 77 | 设向量组 78 | \[ S_1: \alpha_1,\alpha_2,\dots,\alpha_r \] 79 | \[ S_2: \beta_1,\beta_2,\dots,\beta_s \] 80 | 若$S_1$中每个向量都可以被向量组$S_2$线性表示, 81 | 则称向量组$S_1$可被$S_2$\textbf{线性表出}。 82 | 若$S_1$与$S_2$能互相线性表出,那么称$S_1$和$S_2$\textbf{等价}。 83 | \end{definition} 84 | 85 | \begin{remark} 86 | 向量组的等价是等价关系。 87 | \end{remark} 88 | 89 | \begin{theorem} \label{thrm:vector-set-size} 90 | 设有两个向量组$S_1$和$S_2$,分别含有$r$和$s$个向量。 91 | 若$S_1$能由$S_2$线性表出,且$r > s$,那么$S_1$线性相关。 92 | 反之,若$S_1$线性无关且能由$S_2$线性表出,那么$r \le s$。 93 | \end{theorem} 94 | 95 | \begin{corollary} \label{thrm:vector-set-equiv} 96 | 若两个线性无关的向量组$S_1$和$S_2$等价,那么它们包含的向量个数相同。 97 | \end{corollary} 98 | 99 | \subsection{极大线性无关组与向量组的秩} 100 | \begin{definition} 101 | 若一个向量组中有部分向量$\alpha_1,\alpha_2,\dots,\alpha_s$具有下面两个性质: 102 | \begin{enumerate} 103 | \item 104 | $\alpha_1,\alpha_2,\dots,\alpha_s$线性无关; 105 | \item 106 | 从原向量组中任选一个新向量(如果还有的话)加入到这个向量组中, 107 | 所得的部分向量组就线性相关了。 108 | \end{enumerate} 109 | 那么称$\alpha_1,\alpha_2,\dots,\alpha_s$为原向量组的\textbf{极大线性无关组}。 110 | \end{definition} 111 | 112 | \begin{theorem} \label{thrm:vector-set-self-equiv} 113 | 向量组的任意一个极大线性无关组都与向量组本身等价。 114 | \end{theorem} 115 | 116 | \begin{remark} 117 | 一个向量组的极大线性无关组不一定是唯一的, 118 | 但是根据定理\ref{thrm:vector-set-self-equiv} 119 | 和推论\ref{thrm:vector-set-equiv}可以证明, 120 | 它们的大小一定是相同的。 121 | \end{remark} 122 | 123 | \begin{definition}[向量组的秩] 124 | 向量组$S$的极大线性无关组所含向量的个数称为这个向量组的\textbf{秩}, 125 | 记作$r(S)$。 126 | \end{definition} 127 | 128 | 有的秩的概念,定理\ref{thrm:vector-set-size} 129 | 和推论\ref{thrm:vector-set-equiv}可以做出如下推广: 130 | \begin{theorem} 131 | 设有向量组$S_1$和$S_2$。 132 | \begin{enumerate} 133 | \item 134 | 若$S_1$能由$S_2$线性表出,那么$r(S_1) \le r(S_2)$。 135 | \item 136 | 若$S_1$与$S_2$等价,那么$r(S_1)=r(S_2)$。 137 | \end{enumerate} 138 | \end{theorem} 139 | 140 | \section{矩阵的秩} 141 | 矩阵如果按行划分,或者按列划分,其实都能看成一个向量组。 142 | 既然向量组有秩,那么矩阵的秩也可以因此定义出来。 143 | 我们会发现,不管是按行划分,还是按列划分, 144 | 行向量组与列向量组的秩都是相同的, 145 | 这个同一的值就是矩阵的秩。 146 | 147 | \subsection{矩阵的行秩、列秩和秩} 148 | \begin{definition}[行秩与列秩] 149 | 一个矩阵$\mmA=(a_{ij})_{m\times n}$的行向量组的秩叫做$\mmA$的\textbf{行秩}, 150 | 列向量组的秩叫做$\mmA$的\textbf{列秩}。 151 | \end{definition} 152 | 153 | \begin{theorem}[行秩与列秩的不变性] 154 | 一个矩阵的行秩和列秩在初等变换下保持不变。 155 | \end{theorem} 156 | 157 | \begin{remark} 158 | 因为任何矩阵都能通过初等变换化为标准型,标准型的行秩与列秩相同, 159 | 所以更进一步的结论呼之欲出。 160 | \end{remark} 161 | 162 | \begin{theorem}[行秩与列秩相等] 163 | 一个矩阵的行秩等于列秩。 164 | \end{theorem} 165 | 166 | \begin{remark} 167 | 有了这个定理,我们就能把行秩和列秩统称为秩。 168 | \end{remark} 169 | 170 | \begin{theorem}[秩] 171 | 矩阵$\mmA$的行秩或列秩称为这个矩阵的\textbf{秩},记作$r(\mmA)$。 172 | \end{theorem} 173 | 174 | \subsection{矩阵的秩的性质} 175 | \begin{theorem} 176 | 设$\mmA=(a_{ij})_{m\times s}, \mmB=(b_{jk})_{s\times p}$,则 177 | \[ r(\mmA\mmB) \le \min\{ r(\mmA), r(\mmB) \} \] 178 | \end{theorem} 179 | 180 | \begin{remark} 181 | 根据需要也可以写成$r(\mmA\mmB) \le r(\mmA)$,$r(\mmA\mmB)\le r(\mmB)$。 182 | \end{remark} 183 | 184 | \begin{theorem} 185 | 设$\mmA$是$m\times n$阶矩阵, 186 | $\mmP$是$m$阶可逆方阵,$\mmQ$是$n$阶可逆方阵,则 187 | \[ r(\mmA) = r(\mmP\mmA) = r(\mmA\mmQ) \] 188 | \end{theorem} 189 | 190 | \begin{theorem} 191 | 设$\mmA$和$\mmB$都是$m\times n$阶矩阵,则 192 | \[ r(\mmA+\mmB) \le r(\mmA) + r(\mmB) \] 193 | \end{theorem} 194 | 195 | \section{线性代数方程组} 196 | 先前我们已经讨论过使用行列式与伴随矩阵的方法(克莱姆法则)来解方程组了。 197 | 本小节继上面对向量组相关性的讨论,来研究解线性代数方程组的新方法: 198 | 高斯消元法。 199 | 200 | \subsection{高斯消元} 201 | 对于线性代数方程组$\mmA\mvx=\mvb$,它的增广矩阵$\overline{\mmA}$是 202 | \begin{displaymath} 203 | \mmat{cccc|c}{ 204 | a_{11} & a_{12} & \cdots & a_{1n} & b_1 \\ 205 | a_{21} & a_{22} & \cdots & a_{2n} & b_2 \\ 206 | \vdots & \vdots & \ddots & \vdots & \vdots \\ 207 | a_{m1} & a_{m2} & \cdots & a_{mn} & b_m 208 | } 209 | \end{displaymath} 210 | 通过高斯消元,可以转化为如下形式: 211 | \begin{equation} \label{eq:gauss-elim} 212 | \mmat{cccccc|c}{ 213 | c_{11} & c_{12} & \cdots & c_{1r} & \cdots & c_{1n} & c_1 \\ 214 | & c_{22} & \cdots & c_{2r} & \cdots & c_{2n} & c_2 \\ 215 | & & \ddots & \vdots & & \vdots & \vdots \\ 216 | & & & c_{rr} & \cdots & c_{rn} & c_r \\ 217 | & & & & & & c_{r+1} 218 | } 219 | \end{equation} 220 | 其中$c_{ii}\neq 0\ (i=1,\dots,r)$。 221 | 当$c_{r+1}=0$时,方程组有解。 222 | 当$c_{r+1}\neq 0$时,方程组无解。 223 | 因此有如下结论: 224 | 225 | \begin{theorem}[线性代数方程组有解的充要条件] 226 | 线性代数方程组$\mmA\mvx=\mvb$有解当且仅当 227 | \[ r(\mmA) = r(\overline{\mmA}) \] 228 | 若有解: 229 | \begin{enumerate} 230 | \item 若$r(\mmA)=n$,则有唯一解。 231 | \item 若$r(\mmA) < n$,则有无穷多解。 232 | \end{enumerate} 233 | \end{theorem} 234 | 235 | \begin{remark} 236 | 对于齐次方程组$\mmA\mvx=\mvZero$, 237 | 必有$r(\mmA)=r(\overline{\mmA})$, 238 | 因此齐次方程组一定有解。 239 | 当$r(\mmA)=n$时,则只有零解。 240 | 当$r(\mmA)\neq n$时,则有无穷多解。 241 | \end{remark} 242 | 243 | \subsection{线性代数方程组解的结构} 244 | 经过高斯消元得到的式\eqref{eq:gauss-elim}如果有解(即$c_{r+1}=0$), 245 | 那么可以进一步转化为 246 | \begin{equation} \label{eq:gauss-elim-further} 247 | \mmat{ccccccc|c}{ 248 | 1 & & & & d_{r1} & \cdots & d_{r1} & d_1 \\ 249 | & 1 & & & d_{r2} & \cdots & d_{r2} & d_2 \\ 250 | & & \ddots & & \vdots & \ddots & \vdots & \vdots \\ 251 | & & & 1 & d_{rr+1} & \cdots & d_{rn} & d_r 252 | } 253 | \end{equation} 254 | 方程的解应该是一目了然的了。 255 | 据此,我们开始讨论线性代数方程组解的结构。 256 | 首先是齐次线性方程组。 257 | 258 | \begin{definition}[基础解系] 259 | 齐次线性方程组$\mmA\mvx=\mvZero$的解向量组(构成\textbf{解空间}) 260 | 的一个极大线性无关组 261 | 叫做它的一个\textbf{基础解系}。 262 | \end{definition} 263 | 264 | \begin{theorem} 265 | 若齐次线性方程组的系数矩阵$\mmA$的秩小于$n$, 266 | 则方程组必有基础解系。且基础解系所含解的个数等于$n-r$。 267 | \end{theorem} 268 | 269 | \begin{remark} 270 | 把式\eqref{eq:gauss-elim-further}中$d_1,\dots,d_r$设为0, 271 | 则有如下形式的解: 272 | \begin{displaymath} 273 | \meqs{rcl}{ 274 | x_1 &=& \xi_{11}x_{r+1}+\xi_{12}x_{r+2}+\cdots+\xi_{1n-r}x_{n} \\ 275 | x_2 &=& \xi_{21}x_{r+1}+\xi_{22}x_{r+2}+\cdots+\xi_{2n-r}x_{n} \\ 276 | & \vdots & \\ 277 | x_r &=& \xi_{r1}x_{r+1}+\xi_{r2}x_{r+2}+\cdots+\xi_{rn-r}x_{n} \\ 278 | } 279 | \end{displaymath} 280 | 由此得到一个基础解系为 281 | \begin{displaymath} 282 | \meqs{rcl} { 283 | \xi_1 &=& (\xi_{11}, \xi_{21}, \dots, \xi_{r1}, 1, 0, \dots, 0)^\mT \\ 284 | \xi_2 &=& (\xi_{12}, \xi_{22}, \dots, \xi_{r2}, 0, 1, \dots, 0)^\mT \\ 285 | & \vdots & \\ 286 | \xi_{n-r} &=& (\xi_{1n-r}, \xi_{2n-r}, \dots, \xi_{rn-r}, 0, 0, \dots, 1)^\mT 287 | } 288 | \end{displaymath} 289 | 方程组任何解$\xi$都可以由$\xi_1,\dots,\xi_{n-r}$线性表示。 290 | \end{remark} 291 | 292 | 接下来是非齐次线性方程组的解的结构。 293 | 设非齐次线性方程组为$\mmA\mvx=\mvb$。 294 | 它对应的齐次线性方程组为$\mmA\mvx=\mvZero$, 295 | 称为\textbf{导出组}。它们解的结构有着密切的联系: 296 | \begin{enumerate} 297 | \item 298 | 若$\eta_1,\eta_2$是$\mmA\mvx=\mvb$的解, 299 | 那么$\eta_1-\eta_2$是$\mmA\mvx=\mvZero$的解。 300 | \item 301 | 若$\eta$是$\mmA\mvx=\mvb$的解,$\xi$是$\mmA\mvx=\mvZero$的解, 302 | 那么$\eta+\xi$是$\mmA\mvx=\mvb$的解。 303 | \end{enumerate} 304 | 305 | \begin{theorem}[非齐次线性方程组的通解] 306 | 设$\eta_0$是$\mmA\mvx=\mvb$的一个解,那么方程的任意解$\eta$都能表示为 307 | \[ \eta = \eta_0 + k_1\xi_1 + \cdots + k_{n-r}\xi_{n-r} \] 308 | 其中$\xi_1,\dots,\xi_{n-r}$是方程导出组$\mmA\mvx=\mvZero$的基础解系, 309 | $k_1,\dots,k_{n-r} \in \mfR$。 310 | \end{theorem} 311 | -------------------------------------------------------------------------------- /MathematicalStatistics/HypothesisTest.tex: -------------------------------------------------------------------------------- 1 | \chapter{假设检验} 2 | 3 | \section{假设检验的基本概念} 4 | 本小节介绍假设检验的基本概念, 5 | 包括显著水平,假设检验的一般步骤和假设检验存在的两类错误。 6 | 7 | \subsection{显著水平} 8 | 在假设检验中,我们需要对小概率的说法给出统一界定,通常给出一个上限$\alpha$。 9 | 当一个事件发生的概率小于$\alpha$是,我们认为这是小概率事件, 10 | 而称$\alpha$为\textbf{显著水平}。 11 | 12 | \subsection{假设检验的步骤} 13 | \begin{enumerate} 14 | \item 15 | 根据实际问题,提出原假设$H_0$和备择假设$H_1$; 16 | \item 17 | 确定检验统计量; 18 | \item 19 | 根据显著水平$\alpha$确定拒绝域; 20 | \item 21 | 由样本计算统计值; 22 | \item 23 | 做出判断是否接受$H_0$。 24 | \end{enumerate} 25 | 26 | \subsection{两类错误} 27 | 假设检验可能会出现两类错误: 28 | \begin{enumerate} 29 | \item 30 | 第一类错误:当$H_0$为真时,我们仍有可能拒绝$H_0$,此时犯了``弃真''的错误。 31 | 第一类错误的概率就是显著水平$\alpha$。 32 | \item 33 | 第二类错误:当$H_0$为假时,我们仍有可能接受$H_0$,此时犯了``存伪''的错误。 34 | 第二类错误的概率用$\beta$表示。 35 | \end{enumerate} 36 | 37 | Neyman-Pearson原则: 38 | 在控制第一类错误概率的前提下,尽量减小犯第二类错误的概率。 39 | 40 | \section{正态总体的假设检验} 41 | 本小节给出单正态总体的均值和方差、双正态总体的均值差和方差的检验方法。 42 | 43 | \subsection{单正态总体的均值和方差的检验} 44 | 设$X_1,X_2,\dots,X_n$为正态总体$X\sim N(\mu,\sigma^2)$的一个样本。 45 | \begin{enumerate} 46 | \item 47 | 已知方差$\sigma^2$,检验均值$\mu$: 48 | \begin{displaymath} 49 | H_0:\mu=\mu_0 \qquad 50 | H_1: \begin{cases} 51 | \mu\neq\mu_0 \\ 52 | \mu < \mu_0 \\ 53 | \mu > \mu_0 54 | \end{cases} 55 | \end{displaymath} 56 | \begin{displaymath} 57 | \text{检验统计量}: U=\frac{\mbar{X}-\mu_0}{\sigma/\sqrt{n}}\sim N(0,1) 58 | \end{displaymath} 59 | \begin{displaymath} 60 | \text{拒绝域}: \begin{cases} 61 | |\widetilde{U}| \ge u_{\alpha/2} & (\mu\neq\mu_0) \\ 62 | \widetilde{U} \le -u_\alpha & (\mu < \mu_0) \\ 63 | \widetilde{U} \ge u_\alpha & (\mu < \mu_0) 64 | \end{cases} 65 | \end{displaymath} 66 | \item 67 | 未知方差,检验均值$\mu$: 68 | \begin{displaymath} 69 | H_0:\mu=\mu_0 \qquad 70 | H_1: \begin{cases} 71 | \mu\neq\mu_0 \\ 72 | \mu < \mu_0 \\ 73 | \mu > \mu_0 74 | \end{cases} 75 | \end{displaymath} 76 | \begin{displaymath} 77 | \text{检验统计量}: T=\frac{\mbar{X}-\mu_0}{S_n/\sqrt{n-1}}\sim t(n-1) 78 | \end{displaymath} 79 | \begin{displaymath} 80 | \text{拒绝域}: \begin{cases} 81 | |\widetilde{T}| \ge t_{\alpha/2} & (\mu\neq\mu_0) \\ 82 | \widetilde{T} \le -t_\alpha & (\mu < \mu_0) \\ 83 | \widetilde{T} \ge t_\alpha & (\mu < \mu_0) 84 | \end{cases} 85 | \end{displaymath} 86 | \item 87 | 检验方差$\sigma^2$: 88 | \begin{displaymath} 89 | H_0:\sigma^2=\sigma_0^2 \qquad 90 | H_1: \begin{cases} 91 | \sigma^2\neq\sigma_0^2 \\ 92 | \sigma^2 < \sigma_0^2 \\ 93 | \sigma^2 > \sigma_0^2 94 | \end{cases} 95 | \end{displaymath} 96 | \begin{displaymath} 97 | \text{检验统计量}: \chi^2=\frac{nS_n^2}{\sigma_0^2}\sim \chi^2(n-1) 98 | \end{displaymath} 99 | \begin{displaymath} 100 | \text{拒绝域}: \begin{cases} 101 | \widetilde{\chi^2} \ge \chi^2_{\alpha/2}(n-1) 102 | \ \text{或}\ \widetilde{\chi^2} \le \chi^2_{1-\alpha/2}(n-1) 103 | & (\sigma^2\neq\sigma_0^2) \\ 104 | \widetilde{\chi^2} \le \chi^2_{1-\alpha/2}(n-1) 105 | & (\sigma^2 < \sigma_0^2) \\ 106 | \widetilde{\chi^2} \ge \chi^2_{\alpha/2}(n-1) 107 | & (\sigma^2 > \sigma_0^2) 108 | \end{cases} 109 | \end{displaymath} 110 | \end{enumerate} 111 | 112 | \subsection{双正态总体的均值差和方差的检验} 113 | 设$X_1,X_2,\dots,X_{n_1}$为正态总体$X\sim N(\mu_1,\sigma_1^2)$的样本, 114 | $Y_1,Y_2,\dots,Y_{n_2}$为正态总体$Y\sim N(\mu_2,\sigma_2^2)$的样本。 115 | $\mbar{X},S_1^2,\mbar{Y},S_2^2$分别表示$X,Y$的样本均值与修正样本方差。 116 | 设$X,T$独立。 117 | \begin{enumerate} 118 | \item 119 | 已知$\sigma_1^2,\sigma_2^2$,检验均值$\mu_1=\mu_2$: 120 | \begin{displaymath} 121 | H_0:\mu_1=\mu_2 \qquad 122 | H_1: \begin{cases} 123 | \mu_1\neq\mu_2 \\ 124 | \mu_1 < \mu_2 \\ 125 | \mu_2 > \mu_2 126 | \end{cases} 127 | \end{displaymath} 128 | \begin{displaymath} 129 | \text{检验统计量}: U=\frac{(\mbar{X}-\mbar{Y})} 130 | {\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}\sim N(0,1) 131 | \end{displaymath} 132 | \begin{displaymath} 133 | \text{拒绝域}: \begin{cases} 134 | |\widetilde{U}| \ge u_{\alpha/2} & (\mu_1\neq\mu_2) \\ 135 | \widetilde{U} \le -u_\alpha & (\mu_1 < \mu_2) \\ 136 | \widetilde{U} \ge u_\alpha & (\mu_2 > \mu_2) 137 | \end{cases} 138 | \end{displaymath} 139 | \item 140 | 检验方差$\sigma_1^2=\sigma_2^2$: 141 | \begin{displaymath} 142 | H_0:\sigma_1^2=\sigma_2^2 \qquad 143 | H_1: \begin{cases} 144 | \sigma_1^2\neq\sigma_2^2 \\ 145 | \sigma_1^2 < \sigma_2^2 \\ 146 | \sigma_1^2 > \sigma_2^2 147 | \end{cases} 148 | \end{displaymath} 149 | \begin{displaymath} 150 | \text{检验统计量}: F=\frac{S_1^2}{S_2^2} \sim F(n_1-1,n_2-1) 151 | \end{displaymath} 152 | \begin{displaymath} 153 | \text{拒绝域}: \begin{cases} 154 | \widetilde{F} \ge F_{\alpha/2}(n_1-1,n_2-1)\ \text{或}& \\ 155 | \qquad\widetilde{F} \le F_{1-\alpha/2}(n_1-1,n_2-1) 156 | & (\sigma_1^2\neq\sigma_2^2) \\ 157 | \widetilde{F} \le F_{1-\alpha/2}(n_1-1,n_2-1) 158 | & (\sigma_1^2 < \sigma_2^2) \\ 159 | \widetilde{F} \ge F_{\alpha/2}(n_1-1,n_2-1) 160 | & (\sigma_1^2 > \sigma_2^2) 161 | \end{cases} 162 | \end{displaymath} 163 | \end{enumerate} 164 | -------------------------------------------------------------------------------- /MathematicalStatistics/ParameterEstimation.tex: -------------------------------------------------------------------------------- 1 | \chapter{参数估计} 2 | 3 | \section{点估计} 4 | 本小节首先讨论两种点估计的方法:矩估计和极大似然估计。 5 | 然后讨论估计量的评选标准。 6 | 7 | \subsection{点估计的概念} 8 | 参数的\textbf{点估计}就是对总体分布中的未知参数$\theta$, 9 | 以样本$X_1,X_2,\dots,X_n$构造统计量 10 | $\hat{\theta}(X_1,X_2,\dots,X_n)$作为参数$\theta$的估计, 11 | 称$\hat{\theta}(X_1,X_2,\dots,X_n)$为参数$\theta$\textbf{估计量}。 12 | 13 | 当测得样本值$(x_1,x_2,\dots,x_n)$时, 14 | 代入$\hat{\theta}(X_1,X_2,\dots,X_n)$, 15 | 即可得到参数$\theta$\textbf{估计值}: 16 | $\hat{\theta}(x_1,x_2,\dots,x_n)$。 17 | 18 | \subsection{矩估计} 19 | 矩估计的思想是:以样本矩作为总体矩的估计,从而得到参数的估计量。 20 | 具体方法如下。 21 | 22 | 设$X_1,X_2,\dots,X_n$为来自总体$X$的样本,总体$X$的分布函数为 23 | \begin{displaymath} 24 | F(x;\theta_1,\theta_2,\dots,\theta_k) 25 | \end{displaymath} 26 | 其中$\theta_1,\theta_2,\dots,\theta_k$为未知参数。 27 | 记$\mu_m(\theta_1,\theta_2,\dots,\theta_k)=\mexpect[X^m]$ 28 | 为总体的$m$阶矩, 29 | $A_m=\frac{1}{n}\sum_{i=1}^{n}X_i^m$为样本的$m$阶矩。 30 | 31 | 若$\mu_m\ (m=1,2,\dots,k)$都存在,那么我们联立方程 32 | \begin{displaymath} 33 | \meqs{c}{ 34 | \mu_1(\theta_1,\theta_2,\dots,\theta_k) = A_1 \\ 35 | \vdots \\ 36 | \mu_k(\theta_1,\theta_2,\dots,\theta_k) = A_k 37 | } 38 | \end{displaymath} 39 | 从中解出方程组的解$\hat{\theta}_1,\hat{\theta}_2,\dots,\hat{\theta}_k$。 40 | 41 | 我们把$\hat{\theta}_1,\hat{\theta}_2,\dots,\hat{\theta}_k$ 42 | 作为$\theta_1,\theta_2,\dots,\theta_k$的估计量,称为\textbf{矩估计量}。 43 | 矩估计量的观察值叫做\textbf{矩估计值}。 44 | 45 | \begin{theorem} 46 | 无论总体$X$服从何种分布, 47 | 若总体均值$\mu$和总体方差$\sigma^2$为未知参数, 48 | 那么其矩估计量一定是样本均值和样本方差,即: 49 | \begin{displaymath} 50 | \hat{\mu}=\mbar{X},\quad \hat{\sigma^2}=S_n^2 51 | \end{displaymath} 52 | \end{theorem} 53 | 54 | \begin{remark} 55 | 注意,对于矩估计来说,$\hat{\sigma^2}$和$\hat{\sigma}^2$不一定是相同的。 56 | 前者是方差的矩估计量,后者是标准差矩估计量的平方。 57 | 但对于后面介绍的极大似然估计来说,它们是相同的。 58 | \end{remark} 59 | 60 | \subsection{极大似然估计} 61 | 极大似然估计的思想是: 62 | 以样本$X_1,X_2,\dots,X_n$的观测值$x_1,x_2,\dots,x_n$来 63 | 估计参数$\theta_1,\theta_2,\dots,\theta_k$。 64 | 若选取$\hat{\theta}_1,\hat{\theta}_2,\dots,\hat{\theta}_k$ 65 | 使观测值出现的概率最大,那么把 66 | $\hat{\theta}_1,\hat{\theta}_2,\dots,\hat{\theta}_k$ 67 | 作为参数$\theta_1,\theta_2,\dots,\theta_k$的估计量。 68 | 下面分离散和连续两种情形来讨论具体方法。 69 | 70 | \begin{enumerate} 71 | \item 72 | 若总体$X$为离散型,其分布律的形式已知为 73 | \begin{displaymath} 74 | P(X=x) = f(x; \theta) 75 | \end{displaymath} 76 | 其中$\theta$为待估参数(这里仅讨论一个参数的情况)。 77 | 又设$x_1,x_2,\dots,x_n$是样本$X_1,X_2,\dots,X_n$的一组样本值。 78 | 那么事件$X_1=x_1$,$X_2=x_2$,$\dots$,$X_n=x_n$同时发生的概率为 79 | \begin{displaymath} 80 | L(\theta) = P(X_1=x_1,X_2=x_2,\dots,X_n=x_n) 81 | = \prod_{i=1}^n f(x_i;\theta) 82 | \end{displaymath} 83 | 我们把$L(\theta)$称为样本的\textbf{极大似然函数}。取 84 | \begin{displaymath} 85 | \hat{\theta}(x_1,x_2,\dots,x_n)= \argmax_\theta L(\theta) 86 | \end{displaymath} 87 | 为参数$\theta$的\textbf{极大似然估计值}。 88 | $\hat{\theta}(X_1,X_2,\dots,X_n)$称为$\theta$的\textbf{极大似然估计量}。 89 | \item 90 | 若总体$X$为连续型,其概率密度的形式已知为 91 | \begin{displaymath} 92 | p(x;\theta) 93 | \end{displaymath} 94 | 其中$\theta$为待估参数(这里仅讨论一个参数的情况)。 95 | 设$x_1,x_2,\dots,x_n$是样本$X_1,X_2,\dots,X_n$的一组样本值, 96 | 那么连续型随机变量的极大似然函数为 97 | \begin{displaymath} 98 | L(\theta) = \prod_{i=1}^n p(x_i;\theta) 99 | \end{displaymath} 100 | 其极大似然估计量和估计值的定义和离散型的定义相同。 101 | \end{enumerate} 102 | 103 | 现在我们讨论求解$\hat{\theta}=\argmax_\theta L(\theta)$的方法。 104 | 若极大似然函数$L$只有一个参数,即$L=L(\theta)$, 105 | 那么通过下列方程来解$\theta$: 106 | \begin{displaymath} 107 | \frac{\md L}{\md \theta}=0 108 | \quad\text{或}\quad 109 | \frac{\md \ln L}{\md \theta}=0 110 | \end{displaymath} 111 | 若极大似然函数$L$有多个参数,即$L=L(\theta_1,\theta_2,\dots,\theta_k)$, 112 | 那么通过下列方程组来解$\theta_1,\theta_2,\dots,\theta_k$: 113 | \begin{displaymath} 114 | \meqs{c}{ 115 | \mpartials{\theta_1}{L} = 0\\ 116 | \vdots \\ 117 | \mpartials{\theta_k}{L} = 0 118 | }\quad\text{或}\quad 119 | \meqs{c}{ 120 | \mpartials{\theta_1}{\ln L} = 0\\ 121 | \vdots \\ 122 | \mpartials{\theta_k}{\ln L} = 0 123 | } 124 | \end{displaymath} 125 | 126 | \begin{theorem}[极大似然估计的不变性] 127 | 设$\hat{\theta}$是$\theta$的极大似然估计量, 128 | $u=u(\theta)$是$\theta$的函数,且有单值反函数, 129 | 则$\hat{u}=u(\hat{\theta})$是$u(\theta)$的极大似然估计量。 130 | \end{theorem} 131 | 132 | \subsection{估计量的评选标准} 133 | 134 | \begin{definition}[无偏性] 135 | 设$\theta$的估计量为$\hat{\theta}$。若 136 | $\mexpect[\hat{\theta}]=\theta$, 137 | 则称$\hat{\theta}$是$\theta$的\textbf{无偏估计量}。 138 | \end{definition} 139 | 140 | \begin{remark} 141 | $S_n^2$不是$\sigma^2$的无偏估计量, 142 | 而$S_{n-1}^2$才是$\sigma_2$的无偏估计量, 143 | 但$S_{n-1}$不是$\sigma$的无偏估计量。 144 | 由此也能看出,$\hat{\theta}$是$\theta$的无偏估计量 145 | 不一定能推出$g(\hat{\theta})$是$g(\theta)$的无偏估计量。 146 | \end{remark} 147 | 148 | \begin{definition}[有效性] 149 | 设$\hat{\theta}_1,\hat{\theta}_2$是$\theta$的无偏估计量。 150 | 若$\mvar(\hat{\theta}_2)\le \mvar(\hat{\theta}_1)$, 151 | 则称$\hat{\theta}_2$比$\hat{\theta}_1$\textbf{有效}。 152 | \end{definition} 153 | 154 | \begin{definition}[一致性] 155 | 设$\hat{\theta}_n=\hat{\theta}_n(X_1,X_2,\dots,X_n)$ 156 | 是$\theta$的估计量。 157 | 若$\hat{\theta}_n \mprto \theta$, 158 | 则称$\hat{\theta}_n$是$\theta$的\textbf{一致估计量}。 159 | \end{definition} 160 | 161 | 下面是两个常用的结论: 162 | 163 | \begin{theorem} 164 | 样本的$k$阶矩是总体$k$阶矩的一致性估计量。 165 | \end{theorem} 166 | 167 | \begin{theorem} 168 | 设$\hat{\theta}$是$\theta$的无偏估计量。若 169 | \begin{displaymath} 170 | \lim_{n\to\infty}\mvar(\hat{\theta})=0 171 | \end{displaymath} 172 | 则$\hat{\theta}$是$\theta$的一致估计量。 173 | \end{theorem} 174 | 175 | \begin{remark} 176 | 使用切比雪夫不等式证明。 177 | \end{remark} 178 | 179 | \section{区间估计} 180 | 本小节首先给出区间估计的概念和用来求置信区间的枢轴变量法。 181 | 然后就单正态总体和双正态总体给出求它们一些参数的置信区间的示例。 182 | 最后讨论一下单侧置信区间和非正态总体均值的区间估计。 183 | 184 | \subsection{区间估计的概念} 185 | 参数的\textbf{区间估计}是对总体分布中的未知参数$\theta$, 186 | 以样本$X_1,X_2,\dots,X_n$构造两个统计量 187 | $\hat{\theta}_1(X_1,X_2,\dots,X_n)$和 188 | $\hat{\theta}_2(X_1,X_2,\dots,X_n)$, 189 | 以区间$[\hat{\theta}_1,\hat{\theta}_2]$作为参数$\theta$的估计, 190 | 使得对给定的概率$1-\alpha$,满足: 191 | \begin{displaymath} 192 | P\left(\hat{\theta}_1(X_1,X_2,\dots,X_n) < \theta < 193 | \hat{\theta}_2(X_1,X_2,\dots,X_n)\right) = 1-\alpha 194 | \end{displaymath} 195 | 我们称$[\hat{\theta}_1,\hat{\theta}_2]$为\textbf{置信区间}, 196 | $1-\alpha$为该区间的\textbf{置信度}。 197 | 198 | 几点说明: 199 | \begin{enumerate} 200 | \item 201 | 置信区间的长度$L$反映了估计精度。$L$越小,估计精度越高。 202 | \item 203 | $\alpha$反映了估计的可靠度。 204 | $\alpha$约小越可靠,但这时$L$往往增大,因而估计精度降低。 205 | \item 206 | $\alpha$确定后,置信区间的选取方法不唯一,常选长度最小的一个。 207 | \end{enumerate} 208 | 209 | \subsection{枢轴变量法} 210 | 可以使用如下所述的\textbf{枢轴变量法}来寻找置信区间: 211 | \begin{enumerate} 212 | \item 213 | 先找到一样本函数$U(X_1,X_2,\dots,X_n;\theta)$, 214 | 其包含待估参数$\theta$,而不包含其他未知参数, 215 | 且$U$的分布已知,不依赖于任何未知参数。 216 | $U$被称为\textbf{枢轴变量}。 217 | \item 218 | 给定置信度$1-\alpha$,根据$U$的分布找两个常数$a$和$b$,使得 219 | \begin{displaymath} 220 | P(a\hat{\theta}_1(X_1,X_2,\dots,X_n)\right) = 1-\alpha 312 | \end{displaymath} 313 | 则称$[\hat{\theta}_1,+\infty)$是$\theta$置信度为$1-\alpha$的 314 | \textbf{单侧置信区间}。$\hat{\theta}_1$称为\textbf{单侧置信下限}。 315 | 同样地能定义\textbf{单侧置信上限}。 316 | 317 | 以正态总体的单侧置信区间为例。 318 | 设$X_1,X_2,\dots,X_n$为正态总体$X\sim N(\mu,\sigma^2)$的一个样本。 319 | \begin{enumerate} 320 | \item 321 | 若$\sigma^2$未知,求$\mu$的$1-\alpha$单侧置信下限: 322 | \begin{align*} 323 | &\because \frac{\mbar{X}-\mu}{S_n/\sqrt{n-1}}\sim t(n-1) \\ 324 | &\therefore P\left(\frac{\mbar{X}-\mu}{S_n/\sqrt{n-1}} 325 | \le t_{\alpha}(n-1)\right) = 1-\alpha \\ 326 | &\therefore \text{单侧置信区间为} 327 | \left[\mbar{X}-t_{\alpha}(n-1)\frac{S_n}{\sqrt{n-1}}, 328 | +\infty\right.\Big) 329 | \end{align*} 330 | \item 331 | 求$\sigma^2$的$1-\alpha$单侧置信上限: 332 | \begin{align*} 333 | &\because \frac{nS_n^2}{\sigma^2}\sim \chi^2(n-1) \\ 334 | &\therefore P\left(\frac{nS_n^2}{\sigma^2} 335 | \ge \chi^2_{1-\alpha}(n-1)\right) = 1-\alpha \\ 336 | &\therefore \text{置信区间为} 337 | \Big(\left.-\infty, 338 | \frac{nS_n^2}{\chi^2_{1-\alpha}(n-1)}\right] 339 | \end{align*} 340 | \end{enumerate} 341 | 342 | \subsection{非正态总体均值的区间估计} 343 | 总体分布非正态时,通常很难求出统计量的具体分布。 344 | 若样本量较大,可利用极限定理求出枢轴变量的近似分布,再求出未知参数的区间估计。 345 | 346 | 例如,设$X_1,X_2,\dots,X_n$为来自均值为$\mu$,方差为$\sigma^2$的总体的一组样本。 347 | 如果要求均值$\mu$的置信度为$1-\alpha$的置信区间, 348 | 那么当$n$充分大时,由中心极限定理可知, 349 | \begin{displaymath} 350 | \frac{\mbar{X}-\mu}{\sigma/\sqrt{n}}\stackrel{\text{近似}}{\sim}N(0,1) 351 | \end{displaymath} 352 | 若$\sigma$未知,可以用修正样本标准差$S_{n-1}$代替, 353 | 由此得$\mu$的置信度为$1-\alpha$的置信区间为 354 | \begin{displaymath} 355 | \left[\mbar{X}-u_{\alpha/2}\frac{S_{n-1}}{\sqrt{n}}, 356 | \mbar{X}+u_{\alpha/2}\frac{S_{n-1}}{\sqrt{n}}\right] 357 | \end{displaymath} 358 | -------------------------------------------------------------------------------- /MathematicalStatistics/StatisticsAndSamplingDistribution.tex: -------------------------------------------------------------------------------- 1 | \chapter{统计量与抽样分布} 2 | 3 | \section{统计的基本概念} 4 | 本小节主要介绍了总体,个体,样本,统计量与抽样分布的基本概念。 5 | 6 | \subsection{总体与个体} 7 | \begin{definition}[总体] 8 | 研究对象的某项数量指标的值的全体被称为\textbf{总体}。 9 | \end{definition} 10 | 11 | \begin{definition}[个体] 12 | 总体中的每个元素被称为\textbf{个体}。 13 | \end{definition} 14 | 15 | \begin{definition}[总体分布] 16 | 研究对象的数量指标$X$的取值在客观上有一定的分布, 17 | 因此,可将其看做随机变量,它的分布被称为\textbf{总体分布}。 18 | \end{definition} 19 | 20 | \subsection{样本} 21 | \begin{definition}[样本] 22 | 从总体中随机抽取的一些个体被称为\textbf{样本}。 23 | \end{definition} 24 | 25 | \begin{definition}[抽样] 26 | 抽得样本的过程被称为\textbf{抽样}。 27 | \end{definition} 28 | 29 | \begin{definition}[样本容量] 30 | 样本中个体的数量被称为\textbf{样本容量}。 31 | \end{definition} 32 | 33 | \begin{definition}[样本值] 34 | 对样本观察得到的数值被称为\textbf{样本值}。 35 | \end{definition} 36 | 37 | 就一次具体观察而言,样本值是确定的数。 38 | 但在不同的抽样下,样本值会发生变化,因此可将样本看做是随机变量。 39 | 40 | \begin{definition}[简单随机样本] 41 | 设随机变量$X$的分布函数是$F(x)$。 42 | 若相互独立的随机变量$X_1,X_2,\dots,X_n$具有同一分布函数$F$, 43 | 则称$X_1,X_2,\dots,X_n$为从总体$X$中得到的容量为$n$的\textbf{简单随机样本}, 44 | 简称为样本,其观察值$x_1,x_2,\dots,x_n$称为样本值。 45 | \end{definition} 46 | 47 | 样本的两个特性(对抽样的要求): 48 | \begin{enumerate} 49 | \item 代表性: 50 | 样本的每个分量$X_i$与总体$X$具有相同的分布。 51 | \item 独立性: 52 | $X_1,X_2,\dots,X_n$相互独立。 53 | \end{enumerate} 54 | 55 | \begin{definition}[样本联合分布/密度] 56 | 若$X_1,X_2,\dots,X_n$为$X$的一个样本, 57 | $F(x)$和$p(x)$为$X$的分布函数与密度函数, 58 | 则$X_1,X_2,\dots,X_n$的\textbf{联合分布函数}为 59 | \begin{displaymath} 60 | F^*(x_1,x_2,\dots,x_n)=\prod_{i=1}^n F(x_i) 61 | \end{displaymath} 62 | $X_1,X_2,\dots,X_n$的\textbf{联合概率密度}为 63 | \begin{displaymath} 64 | p^*(x_1,x_2,\dots,x_n)=\prod_{i=1}^n p(x_i) 65 | \end{displaymath} 66 | \end{definition} 67 | 68 | \subsection{统计量} 69 | \begin{definition}[统计量] 70 | 设$X_1,X_2,\dots,X_n$为来自总体$X$的一个样本。 71 | 若$g(x_1,x_2,\dots,x_n)$是连续函数,且$g$中不含任何未知参数,则称 72 | \begin{displaymath} 73 | g(X_1,X_2,\dots,X_n) 74 | \end{displaymath} 75 | 是一个\textbf{统计量}。 76 | 设$x_1,x_2,\dots,x_n$是$X_1,X_2,\dots,X_n$的样本值,则称 77 | \begin{displaymath} 78 | g(x_1,x_2,\dots,x_n) 79 | \end{displaymath} 80 | 是$g(X_1,X_2,\dots,X_n)$的观察值。 81 | \end{definition} 82 | 83 | \begin{remark} 84 | 统计量也是随机变量。 85 | \end{remark} 86 | 87 | \begin{definition}[常用统计量] 88 | 设$X_1,X_2,\dots,X_n$为来自总体$X$的一个样本, 89 | 下面是一些常用统计量的定义: 90 | \begin{enumerate} 91 | \item 样本均值: 92 | \begin{displaymath} 93 | \mbar{X}=\frac{1}{n}\sum_{i=1}^{n}X_i 94 | \end{displaymath} 95 | \item 样本方差: 96 | \begin{displaymath} 97 | S_n^2 = \frac{1}{n}\sum_{i=1}^{n}(X_i-\mbar{X})^2 98 | = \frac{1}{n}\sum_{i=1}^{n}X_i^2- \mbar{X}^2 99 | \end{displaymath} 100 | \item 修正样本方差: 101 | \begin{displaymath} 102 | S_{n-1}^2 = \frac{1}{n-1}\sum_{i=1}^{n}(X_i-\mbar{X})^2 103 | \end{displaymath} 104 | \item 样本标准差: 105 | \begin{displaymath} 106 | S_n = \sqrt{S_n^2} 107 | \end{displaymath} 108 | \item 样本$k$阶(原点)矩: 109 | \begin{displaymath} 110 | A_k = \frac{1}{n}\sum_{i=1}^{n}X_i^k 111 | \end{displaymath} 112 | \item 样本$k$阶中心矩: 113 | \begin{displaymath} 114 | B_k = \frac{1}{n}\sum_{i=1}^{n}(X_i-\mbar{X})^k 115 | \end{displaymath} 116 | \end{enumerate} 117 | \end{definition} 118 | 119 | \subsection{抽样分布} 120 | \begin{definition}[抽样分布] 121 | 统计量的分布称为\textbf{抽样分布}。 122 | \end{definition} 123 | 124 | \section{正态总体的抽样分布} 125 | 本小节首先介绍正态总体的四种抽样分布以及相关的上$\alpha$分为点的概念, 126 | 它们分别是:正态总体样本的线性函数的分布,$\chi^2$分布,$t$分布和$F$分布。 127 | 然后,我们给出四个定理,它们描述了正态总体的统计量的分布。 128 | 129 | \subsection{正态总体样本的线性函数的分布} 130 | \begin{theorem} 131 | 设$X_1,X_2,\dots,X_n$为来自正态总体$X\sim N(\mu,\sigma^2)$的样本, 132 | 则统计量$U=\sum_{i=1}^{n}a_iX_i$服从正态分布 133 | \begin{displaymath} 134 | U\sim N\left(\mu\sum_{i=1}^{n}a_i,\sigma^2\sum_{i=1}^{n}a_i^2\right) 135 | \end{displaymath} 136 | 若取$a_i=1/n\ (i=1,2,\dots,n)$,则 137 | \begin{displaymath} 138 | U = \mbar{X} \sim N(\mu, \frac{\sigma^2}{n}) 139 | \end{displaymath} 140 | \end{theorem} 141 | 142 | \begin{definition}[标准正态分布的上$\alpha$分位点] 143 | 设$X\sim N(0,1)$,$0<\alpha<1$,称满足 144 | \begin{displaymath} 145 | P(X>u_\alpha) = \alpha 146 | \end{displaymath} 147 | 的$u_\alpha$为$N(0,1)$分布的上$\alpha$分位点。 148 | \end{definition} 149 | 150 | \begin{theorem} 151 | 设$u_\alpha$是标准正态分布的上$\alpha$分位点, 152 | 则$\Phi(u_\alpha)=1-\alpha$。 153 | \end{theorem} 154 | 155 | \subsection{$\chi^2$分布} 156 | \begin{definition}[$\chi^2$分布] 157 | 设$X_1,X_n,\dots,X_n$独立同分布于$N(0,1)$,则称随机变量 158 | \begin{displaymath} 159 | \chi^2 = X_1^2+X_2^2+\dots+X_n^2 160 | \end{displaymath} 161 | 所服从的分布为自由度为$n$的$\chi^2$分布, 162 | 记为$\chi^2\sim\chi^2(n)$。 163 | \end{definition} 164 | 165 | \begin{theorem}[$\chi^2$分布的可加性] 166 | 设$X_1\sim\chi^2(n_1), X_2\sim\chi^2(n_2)$, 167 | 且$X_1,X_2$相互独立,则 168 | \begin{displaymath} 169 | X_1+X_2\sim\chi^2(n_1+n_2) 170 | \end{displaymath} 171 | \end{theorem} 172 | 173 | \begin{theorem}[$\chi^2$分布的数字特征] 174 | 若$X\sim\chi^2(n)$,则 175 | \begin{displaymath} 176 | \mexpect[X] = n,\quad \mvar(X) = 2n 177 | \end{displaymath} 178 | \end{theorem} 179 | 180 | \begin{definition}[$\chi^2$分布的上$\alpha$分位点] 181 | 设$X\sim\chi^2(n)$,$0<\alpha<1$,称满足 182 | \begin{displaymath} 183 | P(X>\chi_\alpha^2(n)) = \alpha 184 | \end{displaymath} 185 | 的点$\chi_\alpha^2(n)$为$\chi^2(n)$分布的上$\alpha$分位点。 186 | \end{definition} 187 | 188 | \subsection{$t$分布} 189 | \begin{definition}[$t$分布] 190 | 设$X\sim N(0,1),Y\sim \chi^2(n)$,且$X,Y$相互独立, 191 | 则称随机变量 192 | \begin{displaymath} 193 | T=\frac{X}{\sqrt{Y/n}} 194 | \end{displaymath} 195 | 服从自由度为$n$的$t$分布,记为$T\sim t(n)$。 196 | \end{definition} 197 | 198 | \begin{theorem}[$t$分布的性质] 199 | $t$分布具有下面一些性质: 200 | \begin{enumerate} 201 | \item 202 | $t$分布的密度函数关于$t=0$对称。 203 | \item 204 | 当$n$充分大时,$t$分布的密度函数$p(t)$近似于$N(0,1)$的密度函数$\Phi(t)$。 205 | \end{enumerate} 206 | \end{theorem} 207 | 208 | \begin{definition}[$t$分布的上$\alpha$分位点] 209 | 设$X\sim t(n)$,$0<\alpha<1$,称满足 210 | \begin{displaymath} 211 | P(X>t_\alpha(n)) = \alpha 212 | \end{displaymath} 213 | 的点$t_\alpha(n)$为$t(n)$分布的上$\alpha$分位点, 214 | \end{definition} 215 | 216 | \begin{theorem}[$t$分布的上$\alpha$分位点的性质] 217 | $t_{1-\alpha}(n) = -t_\alpha(n)$。 218 | \end{theorem} 219 | 220 | \subsection{$F$分布} 221 | \begin{definition}[$F$分布] 222 | 设$U\sim\chi^2(n_1), V\sim\chi^2(n_2)$,且$U,V$独立, 223 | 则称随机变量 224 | \begin{displaymath} 225 | F = \frac{U/n_1}{V/n_2} 226 | \end{displaymath} 227 | 服从自由度为$(n_1,n_2)$的$F$分布, 228 | 记为$F\sim F(n_1,n_2)$。 229 | \end{definition} 230 | 231 | \begin{theorem}[$F$分布的性质] 232 | 若$F\sim F(n_1,n_2)$,则 233 | \begin{displaymath} 234 | \frac{1}{F} \sim F(n_2,n_1) 235 | \end{displaymath} 236 | \end{theorem} 237 | 238 | \begin{definition}[$F$分布的上$\alpha$分位点] 239 | 设$X\sim F(n_1,n_2)$,$0<\alpha<1$,称满足 240 | \begin{displaymath} 241 | P(X>F_\alpha(n_1,n_2)) = \alpha 242 | \end{displaymath} 243 | 的点$F_\alpha(n_1,n_2)$为$F(n_1,n_2)$分布的上$\alpha$分位点, 244 | \end{definition} 245 | 246 | \begin{theorem}[$F$分布的上$\alpha$分位点的性质] 247 | $F_{1-\alpha}(n_1,n_2) = 1/F_\alpha(n_2,n_1)$。 248 | \end{theorem} 249 | 250 | \subsection{正态总体的抽样分布的四个定理} 251 | \begin{theorem}[样本均值的分布] 252 | 设$X_1,X_2,\dots,X_n$是来自正态总体$X\sim N(\mu,\sigma^2)$的样本,则 253 | \begin{displaymath} 254 | \frac{\mbar{X}-\mu}{\sigma/\sqrt{n}}\sim N(0,1) 255 | \end{displaymath} 256 | \end{theorem} 257 | 258 | \begin{theorem}[样本方差的分布] 259 | 设$X_1,X_2,\dots,X_n$是来自正态总体$X\sim N(\mu,\sigma^2)$的样本,则 260 | \begin{displaymath} 261 | \frac{nS_n^2}{\sigma^2} = 262 | \frac{\sum_{i=1}^n(X_i-\mbar{X})^2}{\sigma^2} \sim \chi^2(n-1) 263 | \end{displaymath} 264 | 且$\mbar{X}$与$S_n^2$相互独立。 265 | \end{theorem} 266 | 267 | \begin{remark} 268 | 作为对比,我们还能记得,根据$\chi^2$分布的定义有 269 | \begin{displaymath} 270 | \frac{\sum_{i=1}^n(X_i-\mu)^2}{\sigma^2} \sim \chi^2(n) 271 | \end{displaymath} 272 | 把$\mu$换成$\mbar{X}$就会导致自由度的变化。 273 | \end{remark} 274 | 275 | \begin{theorem}[样本均值和样本方差的分布] 276 | 设$X_1,X_2,\dots,X_n$是来自正态总体$X\sim N(\mu,\sigma^2)$的样本,则 277 | \begin{displaymath} 278 | \frac{\mbar{X}-\mu}{S_n/\sqrt{n-1}}\sim t(n-1) 279 | \end{displaymath} 280 | \end{theorem} 281 | 282 | \begin{remark} 283 | 这是由样本均值的分布和样本方差的分布根据$t$分布的定义相除得到的。 284 | \end{remark} 285 | 286 | \begin{theorem}[两总体样本方差比、样本均值差的分布] 287 | 设$X_1,X_2,\dots,X_{n_1}$是来自正态总体$X\sim N(\mu_1,\sigma_1^2)$的样本, 288 | $Y_1,Y_2,\dots,Y_{n_2}$是来自正态总体$Y\sim N(\mu_2,\sigma_2^2)$的样本, 289 | $S_1^2=\frac{1}{n_1-1}\sum_{i=1}^{n_1}(X_i-\mbar{X})^2$和 290 | $S_2^2=\frac{1}{n_2-1}\sum_{i=1}^{n_2}(Y_i-\mbar{Y})^2$ 291 | 分别是$X$和$Y$的修正样本方差,则 292 | \begin{enumerate} 293 | \item 样本方差比: 294 | \begin{displaymath} 295 | \frac{S_1^2/S_2^2}{\sigma_1^2/\sigma_2^2}\sim F(n_1-1,n_2-1) 296 | \end{displaymath} 297 | \item 样本均值差: 298 | \begin{displaymath} 299 | \frac{(\mbar{X}-\mbar{Y})-(\mu_1-\mu_2)} 300 | {\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}} 301 | \sim N(0,1) 302 | \end{displaymath} 303 | \item 若$\sigma_1^2=\sigma_2^2=\sigma^2$,则 304 | \begin{displaymath} 305 | \frac{1}{\sigma^2}\left[(n_1-1)S_1^2+(n_2-1)S_2^1\right] 306 | \sim \chi^2(n_1+n_2-2) 307 | \end{displaymath} 308 | 从而有与方差无关的样本均值差: 309 | \begin{displaymath} 310 | \frac{(\mbar{X}-\mbar{Y})-(\mu_1-\mu_2)} 311 | {S_w\sqrt{\frac{1}{n_1}+\frac{1}{n_2}}} 312 | \sim t(n_1+n_2-2) 313 | \end{displaymath} 314 | 其中,$S_w^2=\frac{(n_1-1)S_1^2+(n_2-1)S_2^2}{n_1+n_2-2}$ 315 | 为$S_1^2$和$S_2^2$的加权平均。 316 | \end{enumerate} 317 | \end{theorem} 318 | -------------------------------------------------------------------------------- /Probability/ContinuousRandomVariable.tex: -------------------------------------------------------------------------------- 1 | \chapter{连续型随机变量} 2 | 3 | \section{连续型随机变量的概念} 4 | 本小节的主要内容为: 5 | 分布函数,连续型随机变量的概率密度与性质,连续型随机变量函数分布的求法, 6 | 二维连续型随机变量的概率密度、边缘密度和条件密度, 7 | 连续型随机变量的独立性,二维随机变量函数分布的求法。 8 | 9 | \subsection{分布函数} 10 | \begin{definition}[分布函数] 11 | 设$X$是一个随机变量,$x$是任意实数,则函数 12 | \begin{displaymath} 13 | F(x)=P(X\le x) 14 | \end{displaymath} 15 | 称为$X$的分布函数。 16 | \end{definition} 17 | 18 | \begin{remark} 19 | 根据定义可以直接得到,对于任意实数$x_1,x_2\ (x_1 0 & a < x < b \\ 90 | 0 & \text{其它} 91 | \end{cases} 92 | \end{displaymath} 93 | 其中$a$可为$-\infty$,$b$可为$+\infty$。 94 | 若$y=g(x)$在$(a,b)$处处可导且单调, 95 | 则$Y=g(X)$也是连续型随机变量,其概率密度为 96 | \begin{displaymath} 97 | p_Y(y)=\begin{cases} 98 | p_X(g^{-1}(y))\cdot |(g^{-1}(y))'| & \alpha < y < \beta \\ 99 | 0 & \text{其它} 100 | \end{cases} 101 | \end{displaymath} 102 | 其中,$\alpha=\min\{g(a), g(b) \}, \beta=\max\{g(a),g(b)\}$。 103 | 104 | \subsection{二维连续型随机变量} 105 | \begin{definition}[联合分布函数] 106 | 设$(X,Y)$是一个二维随机向量,则对于任意实数对$(x,y)$, 107 | \begin{displaymath} 108 | F(x,y) = P(X\le x, Y\le y) 109 | \end{displaymath} 110 | 是$(x,y)$的函数,称为二维随机向量$(X,Y)$的\textbf{联合分布函数}。 111 | \end{definition} 112 | 113 | \begin{theorem}[联合分布函数的性质] 114 | 联合分布函数$F(x,y)$具有以下性质: 115 | \begin{enumerate} 116 | \item 117 | $F(x,y)$分布对每个变量单调非减。 118 | \item 119 | $0\le F(x,y)\le 1$且 120 | \begin{gather*} 121 | F(-\infty,y)=F(x,-\infty) = 0 \\ 122 | F(-\infty,-\infty)=0,\ F(+\infty,+\infty)=1 123 | \end{gather*} 124 | \item 125 | $F(x,y)$关于每个变量右连续,即 126 | $F(x,y)=F(x+0,y)=F(x,y+0)$。 127 | \item 128 | $F(x_2,y_2)-F(x_2,y_1)-F(x_1,y_2)+F(x_1,y_1)\ge 0$, 129 | 其中$x_1\le x_2, y_1 \le y_2$。 130 | \end{enumerate} 131 | \end{theorem} 132 | 133 | \begin{definition}[二维连续型随机变量与联合概率密度函数] 134 | 对于二维随机变量$(X,Y)$的分布函数$F(x,y)$, 135 | 如果存在非负函数$p(x,y)$,使得对于任意的$x,y$有 136 | \begin{displaymath} 137 | F(x,y)=\mintcumto{x}\mintcumto{y}p(u,v)dudv 138 | \end{displaymath} 139 | 则称$(X,Y)$是\textbf{二维连续型随机变量}, 140 | 函数$p(x,y)$称为$(X,Y)$的\textbf{联合概率密度函数}, 141 | 简称\textbf{概率密度}。 142 | \end{definition} 143 | 144 | \begin{theorem}[联合概率密度函数的性质] 145 | 设$p(x,y)$是连续随机向量$(X,Y)$的联合概率密度函数,则 146 | \begin{enumerate} 147 | \item 148 | $p(x,y)\ge 0$ 149 | \item 150 | $\mintall\mintall p(u,v)dudv = 1$ 151 | \item 152 | 若$p(x,y)$在点$(x,y)$连续,则有 153 | \[ \frac{\partial^2 F(x,y)}{\partial x\partial y} = p(x,y) \] 154 | \item 155 | $P\left((X,Y)\in G\right) = \iint_G p(x,y)dxdy$ 156 | \end{enumerate} 157 | \end{theorem} 158 | 159 | \begin{definition}[边缘分布函数] 160 | 设二维随即向量$(X,Y)$的联合分布函数为$F(x,y)$。 161 | 我们定义 162 | \begin{displaymath} 163 | F_X(x)=F(x,+\infty) 164 | \end{displaymath} 165 | 为$X$的\textbf{边缘分布函数}。 166 | 同样地,$F_Y=F(+\infty,y)$为$Y$的边缘分布函数。 167 | \end{definition} 168 | 169 | \begin{definition}[边缘密度] 170 | 设二维随即向量$(X,Y)$的概率密度函数为$p(x,y)$, 171 | 联合分布函数为$F(x,y)$。 172 | 我们定义 173 | \begin{displaymath} 174 | p_X(x)=F'_X(x) = \mintall p(x,y)dy 175 | \end{displaymath} 176 | 为$X$的\textbf{边缘密度}。 177 | 同样地,$p_Y(y)=F'_Y(y) = \mintall p(x,y)dx$ 178 | 为$Y$的边缘密度。 179 | \end{definition} 180 | 181 | \begin{definition}[二维连续型随机变量的条件密度] 182 | 设$(X,Y)$是连续随机向量,则 183 | \begin{displaymath} 184 | F_{Y|X=x}(y)=P(Y\le y|X = x)= 185 | \mintcumto{y}\frac{p(x,v)}{p_X(x)}dv 186 | \end{displaymath} 187 | 为$Y$在$X=x$的条件下的\textbf{条件分布}。而 188 | \begin{displaymath} 189 | p_{Y|X=x}(y)=\frac{p(x,y)}{p_X(x)} 190 | \end{displaymath} 191 | 为$Y$在$X=x$的条件下的\textbf{条件密度},也记为$p_{Y|X}(y|x)$。 192 | \end{definition} 193 | 194 | \begin{theorem}[条件密度的两个公式] 195 | 条件密度也有乘法公式 196 | \begin{displaymath} 197 | p(x,y) = p_X(x)p_{Y|X}(y|x) 198 | \end{displaymath} 199 | 和全概率公式 200 | \begin{displaymath} 201 | p_X(x) = \mintall p(x,y)dy 202 | = \mintall p_{X|Y}(x|y)p_Y(y)dy 203 | \end{displaymath} 204 | \end{theorem} 205 | 206 | \subsection{连续型随机变量的独立性} 207 | \begin{definition}[两个随机变量的独立性] 208 | 设$X,Y$为随机变量。 209 | 若对任意实数$x,y$,随机事件$X\le x$与$Y\le y$相互独立,即 210 | \begin{displaymath} 211 | P(X\le x, Y\le y)=P(X\le x)P(Y\le y) 212 | \end{displaymath} 213 | 或等价地, 214 | \begin{displaymath} 215 | F(x,y)=F_X(x)F_Y(y) 216 | \end{displaymath} 217 | 则称随机变量$X$与$Y$相互独立。 218 | \end{definition} 219 | 220 | \begin{theorem}[两个连续型随机变量相互独立的条件] 221 | 设$X,Y$为连续型随机变量。若 222 | \begin{displaymath} 223 | p(x,y)=p_X(x)p_Y(x) 224 | \end{displaymath} 225 | 则$X,Y$相互独立。 226 | \end{theorem} 227 | 228 | \subsection{二维随机变量函数的分布} 229 | 对于二维随机变量$(X,Y)$,实函数$z=g(x,y)$, 230 | 可定义随机变量$Z=g(X,Y)$。 231 | 232 | 使用类似\ref{subsec:disc-rv-func-distribution}节 233 | 和\ref{subsec:con-rv-func-distribution}节的方法, 234 | 同样可以求出$Z$的分布。 235 | 下面给出两个比较特殊的二维随机变量函数的分布: 236 | \textbf{和分布}以及\textbf{极大极小分布}。 237 | 238 | \begin{description} 239 | \item[和分布] 240 | 如果$Z=X+Y$,$p(x,y)$是$X,Y$的概率密度函数,则 241 | \begin{displaymath} 242 | p_Z(z) = \mintall p(x,z-x)dx 243 | \end{displaymath} 244 | 如果$X,Y$相互独立,则能更进一步化为卷积公式 245 | \begin{displaymath} 246 | p_Z(z) = \mintall p_X(x)p_Y(z-x)dx 247 | \end{displaymath} 248 | \item[极大极小分布] 249 | 如果$X,Y$相互独立。设$M=\max\{X,Y\}$,$N=\min\{X,Y\}$,则 250 | \begin{align*} 251 | F_M(z) &= P(\max\{X,Y\}\le z) = P(X\le z, Y\le z) \\ 252 | &= P(X\le z)P(Y\le z) \\ 253 | &= F_X(z)F_Y(z) 254 | \end{align*} 255 | \begin{align*} 256 | F_N(z) &= P(\min\{X,Y\}\le z) = 1 - P(\min\{X,Y\}>z) \\ 257 | &= 1 - P(X>z,Y>z) = 1 - P(X>z)P(Y>z) \\ 258 | &= 1 - (1-F_X(z))(1-F_Y(z)) 259 | \end{align*} 260 | 推广:如果$X_1,X_2,\dots,X_n$相互独立,则 261 | \begin{gather*} 262 | F_{\max_iX_i}(z) = \prod_{i=1}^{n}F_{X_i}(z) \\ 263 | F_{\min_iX_i}(z) = 1-\prod_{i=1}^{n}(1-F_{X_i}(z)) 264 | \end{gather*} 265 | \end{description} 266 | 267 | \section{常见连续型随机变量的分布} 268 | 本小节主要介绍以下常见的连续型随机变量的分布: 269 | 均匀分布,指数分布,正态分布,二维均匀分布,二维正态分布。 270 | 271 | \subsection{均匀分布} 272 | \begin{definition}[均匀分布] 273 | 设连续型随机变量$X$具有概率密度 274 | \begin{displaymath} 275 | p(x) = \begin{cases} 276 | \frac{1}{b-a} & a < x < b \\ 277 | 0 & \text{其它} 278 | \end{cases} 279 | \end{displaymath} 280 | 则称$X$在区间上$(a,b)$服从\textbf{均匀分布}, 281 | 记为$X\sim U(a,b)$。它的分布函数为 282 | \begin{displaymath} 283 | F(X) = \begin{cases} 284 | 0 & x < a \\ 285 | \frac{x-a}{b-a} & a \le x < b \\ 286 | 1 & x > b 287 | \end{cases} 288 | \end{displaymath} 289 | \end{definition} 290 | 291 | \begin{theorem}[均匀分布的数字特征] 292 | 设随机变量$X\sim U(a,b)$,则 293 | \begin{displaymath} 294 | \mexpect[X]=\frac{a+b}{2},\quad \mvar(X)=\frac{(b-a)^2}{12} 295 | \end{displaymath} 296 | \end{theorem} 297 | 298 | \begin{theorem} 299 | 设连续型随机变量$X$的分布函数$F(x)$严格单调递增。 300 | 令$Y=F(X)$,则$Y\sim U(0,1)$。 301 | \end{theorem} 302 | 303 | \begin{remark} 304 | 该定理告诉我们,可以利用均匀分布来生成其它分布。 305 | \end{remark} 306 | 307 | \subsection{指数分布} 308 | \begin{definition}[指数分布] 309 | 设连续型随机变量$X$的概率密度为 310 | \begin{displaymath} 311 | p(x) = \begin{cases} 312 | \lambda e^{-\lambda x} & x > 0 \\ 313 | 0 & x \le 0 314 | \end{cases} 315 | \end{displaymath} 316 | 其中$\lambda$为常数, 317 | 则称$X$服从参数为$\lambda$的\textbf{指数分布}, 318 | 记为$X\sim E(\lambda)$。 319 | 它的分布函数为 320 | \begin{displaymath} 321 | F(x) = \begin{cases} 322 | 1 - e^{-\lambda x} & x > 0 \\ 323 | 0 & x \le 0 324 | \end{cases} 325 | \end{displaymath} 326 | \end{definition} 327 | 328 | \begin{theorem}[指数分布的数字特征] 329 | 设随机变量$X\sim E(\lambda)$,则 330 | \begin{displaymath} 331 | \mexpect[X] = \frac{1}{\lambda},\quad \mvar(X) = \frac{1}{\lambda^2} 332 | \end{displaymath} 333 | \end{theorem} 334 | 335 | \begin{theorem}[指数分布的无记忆性] 336 | 设$X\sim E(\lambda)$,则对于任意实数$s,t>0$有 337 | \begin{displaymath} 338 | P(X>s+t|X>t) = P(X>s) 339 | \end{displaymath} 340 | \end{theorem} 341 | 342 | \begin{theorem}[多个独立指数分布的极小分布] 343 | 设$X_i\sim E(\lambda_i)\ (i=1,2,\dots,n)$且相互独立。 344 | 令$Y=\min_i X_i$,则$Y\sim E(\sum_{i=1}^{n}\lambda_i)$, 345 | 且$P(\min_i X_i = X_j)= \lambda_j/\sum_{i=1}^{n}\lambda_i$ 346 | \end{theorem} 347 | 348 | \subsection{正态分布} 349 | \begin{definition} 350 | 设连续型随机变量$X$的概率密度为 351 | \begin{displaymath} 352 | p(x)=\frac{1}{\sqrt{2\pi}\sigma} e^{-\frac{(x-\mu)^2}{2\sigma^2}} 353 | \ (-\infty < x < +\infty) 354 | \end{displaymath} 355 | 其中$\mu,\sigma\ (\sigma > 0)$为常数, 356 | 则称$X$服从参数为$\mu,\sigma^2$的\textbf{正态分布}(也叫高斯分布), 357 | 记为$X\sim N(\mu,\sigma^2)$。 358 | \end{definition} 359 | 360 | \begin{theorem}[正态分布的数字特征] 361 | 设随机变量$X\sim N(\mu,\sigma^2)$,则 362 | \begin{displaymath} 363 | \mexpect[X] = \mu,\quad \mvar(X) = \sigma^2 364 | \end{displaymath} 365 | \end{theorem} 366 | 367 | \begin{definition}[标准正态分布] 368 | 我们把$N(0,1)$称为\textbf{标准正态分布}。 369 | 标准正态分布的密度函数记为 370 | \begin{displaymath} 371 | \phi(x) = \frac{1}{\sqrt{2\pi}} e^{-\frac{x^2}{2}} 372 | \ (-\infty < x < +\infty) 373 | \end{displaymath} 374 | 标准正态分布的分布函数记为 375 | \begin{displaymath} 376 | \Phi(x) = \mintcumto{x}\frac{1}{\sqrt{2\pi}} e^{-\frac{t^2}{2}} dt 377 | \end{displaymath} 378 | \end{definition} 379 | 380 | \begin{theorem} 381 | $\forall x\in\mfR$,$\Phi(-x) = 1 - \Phi(x)$ 382 | \end{theorem} 383 | 384 | \begin{theorem} 385 | 若$X\sim N(0,1)$,则 386 | \begin{displaymath} 387 | \mexpect[X^k] = \begin{cases} 388 | (k-1)!! & \text{$k$为偶数} \\ 389 | 0 & \text{$k$为奇数} 390 | \end{cases} 391 | \end{displaymath} 392 | 393 | \end{theorem} 394 | \begin{theorem}[正态分布的性质] 395 | 设$X\sim N(\mu,\sigma^2)$,$Y=aX+b\ (a\neq 0)$,则 396 | \begin{displaymath} 397 | Y \sim N\left(a\mu+b,(a\sigma)^2\right) 398 | \end{displaymath} 399 | \end{theorem} 400 | 401 | \begin{corollary}[标准化] 402 | 若$X\sim N(\mu,\sigma^2)$,则$(X-\mu)/\sigma \sim N(0,1)$ 403 | \end{corollary} 404 | 405 | \begin{remark} 406 | 根据这个推论,任意随机变量$X\sim N(\mu,\sigma^2)$落在在某个区间的概率 407 | 可以转化为标准正态分布来求: 408 | \begin{align*} 409 | P(a \le X \le b) 410 | &= P\left(\frac{a-\mu}{\sigma} \le \frac{X-\mu}{\sigma} 411 | \le \frac{b-\mu}{\sigma}\right) \\ 412 | &= \Phi\left(\frac{a-\mu}{\sigma}\right) 413 | - \Phi\left(\frac{b-\mu}{\sigma}\right) 414 | \end{align*} 415 | 其中$\Phi(x)$可以查表得到。 416 | \end{remark} 417 | 418 | \begin{theorem}[3$\sigma$原理] 419 | 设随机变量$X\sim N(\mu,\sigma^2)$,则 420 | \begin{gather*} 421 | P(|X-\mu|\le\sigma) = 68.26 \% \\ 422 | P(|X-\mu|\le 2\sigma) = 95.44 \% \\ 423 | P(|X-\mu|\le 3\sigma) = 99.74 \% 424 | \end{gather*} 425 | \end{theorem} 426 | 427 | \begin{theorem}[独立正态分布随机变量的和] 428 | 设$X\sim N(\mu_1,\sigma_1^2), Y\sim N(\mu_2,\sigma_2^2)$, 429 | 且两者独立,则 430 | \begin{displaymath} 431 | X + Y \sim N(\mu_1+\mu_2, \sigma_1^2+\sigma_2^2) 432 | \end{displaymath} 433 | \end{theorem} 434 | 435 | \subsection{二维均匀分布} 436 | \begin{definition}[二维均匀分布] 437 | 设$D$是平面上的有界区域,其面积为$A$。 438 | 如果二维随机变量$(X,Y)$的密度函数为 439 | \begin{displaymath} 440 | p(x,y) = \begin{cases} 441 | \frac{1}{A} & (x,y)\in D \\ 442 | 0 & (x,y)\notin D 443 | \end{cases} 444 | \end{displaymath} 445 | 则称$(X,Y)$服从$D$上的二维均匀分布。 446 | \end{definition} 447 | 448 | \subsection{二维正态分布} 449 | \begin{definition}[二维正态分布] 450 | 若二维随机变量$(X,Y)$具有密度函数 451 | \begin{align*} 452 | p(x,y)=&\frac{1}{2\pi\sigma_1\sigma_2\sqrt{1-\rho^2}} 453 | \exp\left\{-\frac{1}{2(1-\rho^2)}\left[ 454 | \left(\frac{x-\mu_1}{\sigma_1}\right)^2\right.\right.\\ 455 | &\left.\left.-2\rho\left(\frac{x-\mu_1}{\sigma_1}\right) 456 | \left(\frac{y-\mu_2}{\sigma_2}\right) 457 | +\left(\frac{y-\mu_2}{\sigma_2}\right)^2\right]\right\} 458 | \end{align*} 459 | 其中$\mu_1,\mu_2,\sigma_1,\sigma_2 > 0, |\rho| < 1$均为常数, 460 | 则称$(X,Y)$服从\textbf{二维正态分布},记作 461 | $(X,Y)\sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)$。 462 | \end{definition} 463 | 464 | \begin{remark} 465 | 这里$\rho$的含义是相关系数,参见\ref{subsec:correlation-coefficent}节。 466 | \end{remark} 467 | 468 | \begin{theorem}[二维正态分布的性质] 469 | 设$(X,Y)\sim N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)$,则 470 | \begin{enumerate} 471 | \item 472 | $X\sim N(\mu_1,\sigma_1^2)$,$Y\sim N(\mu_2,\sigma_2^2)$, 473 | 即二维正态分布的边缘分布仍是正态分布。 474 | \item 475 | $X,Y$相互独立当且仅当$\rho = 0$。 476 | \item 477 | $\mcov(X,Y) = \rho\sigma_1\sigma_2$ 478 | \end{enumerate} 479 | \end{theorem} 480 | -------------------------------------------------------------------------------- /Probability/DiscreteRandomVariable.tex: -------------------------------------------------------------------------------- 1 | \chapter{离散型随机变量} 2 | 3 | \section{离散型随机变量的概念} 4 | 本小节的主要内容为: 5 | 随机变量的定义,离散型随机变量的分布律,随机变量的函数, 6 | 二维离散型随机变量的联合分布律、边缘分布律,离散型随机变量的独立性。 7 | 8 | \subsection{随机变量} 9 | \begin{definition}[随机变量] 10 | 设$\Omega$为样本空间。 11 | 我们把实值函数$X:\Omega\mapsto\mfR$称为\textbf{随机变量},简记为r.v.。 12 | \end{definition} 13 | 14 | 随机变量分为离散型随机变量(定义\ref{def:discrete-rv}) 15 | 和连续型随机变量(定义\ref{def:continuous-rv})。 16 | 17 | \subsection{离散型随机变量与分布律} 18 | \begin{definition}[离散型随机变量] \label{def:discrete-rv} 19 | 若随机变量$X$的取值是有限个或者可列无穷个, 20 | 则称$X$为\textbf{离散型随机变量}。 21 | \end{definition} 22 | 23 | \begin{definition}[离散型随机变量的分布律] 24 | 设离散型随机变量$X$的所有可能取值为 25 | $x_1,x_2,\dots,x_n,\dots$,则称 26 | \begin{displaymath} 27 | P(X=x_i)=p_i\ (i=1,2,\dots) 28 | \end{displaymath} 29 | 为$X$的\textbf{分布律}。常表示为 30 | \begin{center} 31 | \begin{tabular}{c|ccccc} 32 | $X$ & $x_1$ & $x_2$ & $\dots$ & $x_n$ & $\dots$ \\ 33 | \hline 34 | $P$ & $p_1$ & $p_2$ & $\dots$ & $p_n$ & $\dots$ \\ 35 | \end{tabular} 36 | \end{center} 37 | \end{definition} 38 | 39 | \begin{theorem}[离散型随机变量分布律的性质] 40 | 设$P(X=x_i)=p_i\ (i=1,2,\dots)$是随机变量$X$的分布律,则 41 | \begin{enumerate} 42 | \item 43 | $\forall n\in \mfN$,$p_n \ge 0$ 44 | \item 45 | $\sum_{i}p_i = 1$ 46 | \end{enumerate} 47 | \end{theorem} 48 | 49 | \subsection{随机变量的函数} \label{subsec:disc-rv-func-distribution} 50 | \begin{definition}[随机变量的函数] 51 | 设$X$是随机变量,$y=g(x)$是实函数。 52 | 构造另一随机变量$Y$,当$X$取值$x$时,$Y$取值$y=g(x)$, 53 | 则称$Y$是随机变量$X$的函数,记为$Y=g(X)$。 54 | \end{definition} 55 | 56 | 离散型随机变量函数的分布律的求法: 57 | \[ P(Y=y)=\sum_{x:g(x)=y} P(X=x) \] 58 | 59 | 连续型随机变量函数的分布的求法见小节\ref{subsec:con-rv-func-distribution}。 60 | 61 | \subsection{二维离散型随机变量} 62 | \begin{definition}[二维离散型随机变量] 63 | 若二维随机变量$(X,Y)$的取值是有限个或可列无穷多个, 64 | 则称$(X,Y)$为\textbf{二维离散型随机变量}。 65 | \end{definition} 66 | 67 | \begin{definition}[二维离散型随机变量的联合分布律] 68 | 设$(X,Y)$为二维离散型随机变量, 69 | $X,Y$的取值为$(x_i,y_j),\ i,j=1,2,\dots$,则称 70 | \begin{displaymath} 71 | P(X=x_i,Y=y_j)=p_{ij}\ (i,j=1,2\dots) 72 | \end{displaymath} 73 | 为$(X,Y)$的\textbf{联合分布律}。常表示为 74 | \begin{center} 75 | \begin{tabular}{c|ccccc} 76 | \diagbox{$X$}{$Y$} & $y_1$ & $y_2$ & $\dots$ & $y_j$ & $\dots$ \\ 77 | \hline 78 | $x_1$ & $p_{11}$ & $p_{12}$ & $\dots$ & $p_{1j}$ & $\dots$ \\ 79 | $x_2$ & $p_{21}$ & $p_{22}$ & $\dots$ & $p_{2j}$ & $\dots$ \\ 80 | $\vdots$ & $\vdots$ & $\vdots$ & & $\vdots$ & \\ 81 | $x_i$ & $p_{i1}$ & $p_{i2}$ & $\dots$ & $p_{ij}$ & $\dots$ \\ 82 | $\vdots$ & $\vdots$ & $\vdots$ & & $\vdots$ & \\ 83 | \end{tabular} 84 | \end{center} 85 | \end{definition} 86 | 87 | \begin{theorem}[二维离散型随机变量联合分布律的性质] 88 | 设$P(X=x_i,Y=y_j)=p_{ij}\ (i,j=1,2\dots)$ 89 | 是二维随机变量$(X,Y)$的联合分布律,则 90 | \begin{enumerate} 91 | \item 92 | $\forall i,j\in\mfN$,$p_{ij} \ge 0$ 93 | \item 94 | $\sum_{ij}p_{ij}=1$ 95 | \end{enumerate} 96 | \end{theorem} 97 | 98 | \begin{definition} 99 | 设$P(X=x_i,Y=y_j)=p_{ij}\ (i,j=1,2\dots)$ 100 | 是二维随机变量$(X,Y)$的联合分布律,则 101 | \begin{displaymath} 102 | P(X=x_i) = \sum_{j} P(X=x_i,Y=y_j) = \sum_{j=1}^{\infty}p_{ij} 103 | \meqdef p_{i\cdot} 104 | \end{displaymath} 105 | 被称为$X$的边缘分布律, 106 | \begin{displaymath} 107 | P(Y=y_j) = \sum_{i} P(X=x_i,Y=y_j) = \sum_{i=1}^{\infty}p_{ij} 108 | \meqdef p_{\cdot j} 109 | \end{displaymath} 110 | 被称为$Y$的边缘分布律。 111 | \end{definition} 112 | 113 | \subsection{离散型随机变量的独立性} 114 | \begin{definition}[两个离散型随机变量的独立性] 115 | 对于离散型随机变量$X$和$Y$,若对于所有可能取值$x,y$有 116 | \begin{displaymath} 117 | P(X=x,Y=y)=P(X=x)P(Y=y) 118 | \end{displaymath} 119 | 即$p_{ij}=p_{i\cdot}p_{\cdot j}\ (i,j=1,2,\dots)$, 120 | 则称$X$与$Y$独立。 121 | \end{definition} 122 | 123 | \begin{definition}[多离散型随机变量的独立性] 124 | 设$X_1,X_2,\dots,X_n$为离散型随机变量。 125 | \begin{enumerate} 126 | \item 127 | 若对于任意$x_1,x_2,\dots,x_n$,有 128 | \begin{displaymath} 129 | P(X_1=x_1,\dots,X_n=x_n)=\prod_{i=1}^{n}P(X_i=x_i) 130 | \end{displaymath} 131 | 则称$X_1,X_2,\dots,X_n$\textbf{相互独立}。 132 | \item 133 | 若其中任意两个均独立, 134 | 则称$X_1,X_2,\dots,X_n$\textbf{两两独立}。 135 | \end{enumerate} 136 | \end{definition} 137 | 138 | \section{常见离散型随机变量的分布} 139 | 本小节介绍了常见的离散型随机变量的分布及它们的性质, 140 | 其中包含:0-1分布,二项分布,泊松分布,几何分布。 141 | 142 | \subsection{0-1分布} 143 | 144 | \begin{definition}[伯努利试验] 145 | 如果随机试验只有两个结果:$A$与$\mcmpl{A}$, 146 | 则称该试验为\textbf{伯努利试验}(Bernoulli trial)。 147 | \end{definition} 148 | 149 | \begin{definition}[0-1分布] 150 | 定义随机变量 151 | \begin{displaymath} 152 | X = \begin{cases} 153 | 1 & \text{若$A$发生} \\ 154 | 0 & \text{若$A$不发生} 155 | \end{cases} 156 | \end{displaymath} 157 | 记$P(A)=p$,则称$X$服从\textbf{0-1分布} 158 | \begin{center} 159 | \begin{tabular}{c|cc} 160 | $X$ & $0$ & $1$ \\ 161 | \hline 162 | $P$ & $1-p$ & $p$ \\ 163 | \end{tabular} 164 | \end{center} 165 | \end{definition} 166 | 167 | \begin{theorem}[0-1分布的数字特征] 168 | 设$X$服从0-1分布,则 169 | \begin{displaymath} 170 | \mexpect[X]=p,\quad \mvar(X) = p(1-p) 171 | \end{displaymath} 172 | \end{theorem} 173 | 174 | \subsection{二项分布} 175 | \begin{definition}[$n$重伯努利试验] 176 | 有一类独立重复试验概型,具有如下特点: 177 | \begin{enumerate} 178 | \item 每次试验只有两种结果:$A$与$\mcmpl{A}$ 179 | \item 试验进行$n$次,每次试验结果相互独立 180 | \end{enumerate} 181 | 则称该独立重复试验为\textbf{$n$重伯努利试验}。 182 | \end{definition} 183 | 184 | \begin{definition}[二项分布] 185 | 若随机变量$X$的分布律为 186 | \begin{displaymath} 187 | P(X=i) = \binom{n}{i}p^i(1-p)^{n-i}\ (i=1,2,\dots,n) 188 | \end{displaymath} 189 | 其中$n$为自然数,$0\le p \le 1$, 190 | 则称$X$服从参数为$n,p$的\textbf{二项分布}, 191 | 记作$X\sim B(n,p)$。 192 | \end{definition} 193 | 194 | \begin{remark} 195 | 对于给定的$n,p$,函数$P(X=k)$随$k$的增大先递增后递减。 196 | 如果要求$k$取何值时$P(X=k)$最大,我们只需要列出方程组 197 | \begin{displaymath} 198 | \meqs{c}{ 199 | P(X=k) \ge P(X=k-1) \\ 200 | P(X=k) \ge P(X=k+1)} 201 | \end{displaymath} 202 | 就能解得,$k$是区间$[\,(n+1)p-1,\,(n+1)p\,]$的一个整数。 203 | \end{remark} 204 | 205 | \begin{theorem}[二项分布的数字特征] 206 | 设随机变量$X\sim B(n,p)$,则 207 | \begin{displaymath} 208 | \mexpect[X] = np,\quad \mvar(X) = np(1-p) 209 | \end{displaymath} 210 | \end{theorem} 211 | 212 | \begin{theorem}[泊松定理] \label{thrm:poisson} 213 | 如果$np_n\to\lambda(>0) (n\to\infty)$, 214 | 那么对于固定的正整数$k$,有 215 | \begin{displaymath} 216 | \lim_{n\to\infty} \binom{n}{k}p_n^k(1-p_n)^{n-k} = 217 | \frac{\lambda^k}{k!}e^{-\lambda} 218 | \end{displaymath} 219 | \end{theorem} 220 | 221 | \begin{remark} 222 | 当$n$很大时,计算$P_n(k)=\binom{n}{k}p^k(1-p)^{n-k}$比较麻烦。 223 | 但如果$n$很大$(\ge 20)$且$p$很小$(\le 0.1)$时, 224 | 就可以用上面的泊松近似公式来计算。 225 | \end{remark} 226 | 227 | \subsection{泊松分布} 228 | \begin{definition}[泊松分布] 229 | 若随机变量$X$的分布律为 230 | \begin{displaymath} 231 | P(X=k)=\frac{\lambda^k}{k!}e^{-\lambda}\ (k=0,1,2,\dots) 232 | \end{displaymath} 233 | 其中$\lambda > 0$, 234 | 则称随机变量$X$服从参数为$\lambda$的\textbf{泊松分布}, 235 | 记为$X\sim P(\lambda)$。 236 | \end{definition} 237 | 238 | \begin{remark} 239 | 泊松分布通常用于描述大量试验中稀有事件出现次数的概率模型。 240 | 从定理\ref{thrm:poisson}就能看出来这一点。 241 | 参数$\lambda$的物理含义是:事件平均的发生次数。 242 | \end{remark} 243 | 244 | \begin{theorem}[泊松分布的数字特征] 245 | 设随机变量$X\sim P(\lambda)$,则 246 | \begin{displaymath} 247 | \mexpect[X]=\lambda,\quad \mvar(X)=\lambda 248 | \end{displaymath} 249 | \end{theorem} 250 | 251 | \begin{theorem}[泊松分布的和] 252 | 若随机变量$X,Y$独立,且$X\sim P(\lambda_1)$,$Y\sim P(\lambda_2)$, 253 | 则$X+Y \sim P(\lambda_1+\lambda_2)$。 254 | \end{theorem} 255 | 256 | \subsection{几何分布} 257 | \begin{definition}[几何分布] 258 | 在多重伯努利试验中,$P(A)=p$,$P(\mcmpl{A})=1-p\meqdef q$。 259 | 重复独立实验,直到事件$A$首次发生。 260 | 令$X$表示所需要试验的次数,则$X$服从参数为$p$的\textbf{几何分布},即 261 | \begin{displaymath} 262 | P(X=k)=q^{k-1}p\ (k=1,2,\dots) 263 | \end{displaymath} 264 | 记为$X\sim G(p)$。 265 | \end{definition} 266 | 267 | \begin{theorem}[几何分布的无记忆性] 268 | 假设已经经历了$n$次失败,则从当前起直至成功所需次数与$n$无关。 269 | 严格地,若随机变量$X\sim G(p)$,则对任意自然数$s,t$,有 270 | \begin{displaymath} 271 | P(X>s+t|X>s) = P(X>t) 272 | \end{displaymath} 273 | \end{theorem} 274 | 275 | \begin{theorem}[几何分布的数字特征] 276 | 设随机变量$X\sim G(p)$,则 277 | \begin{displaymath} 278 | \mexpect[X] = \frac{1}{p},\quad \mvar(X)=\frac{1-p}{p^2} 279 | \end{displaymath} 280 | \end{theorem} 281 | -------------------------------------------------------------------------------- /Probability/LimitTheory.tex: -------------------------------------------------------------------------------- 1 | \chapter{极限理论} 2 | 3 | \section{大数定律} 4 | 本小节首先给出依概率收敛的概念, 5 | 然后讨论大数定律以及相关的定理。 6 | 7 | \subsection{依概率收敛} 8 | \begin{definition}[依概率收敛] 9 | 设$Y_1,Y_2,\dots,Y_n,\dots$是随机变量序列,$a$是一个常数。 10 | 若对任意$\epsilon >0$,有 11 | \begin{displaymath} 12 | \lim_{n\to\infty}P(|Y_n - a|<\epsilon) = 1 13 | \end{displaymath} 14 | 或 15 | \begin{displaymath} 16 | \lim_{n\to\infty}P(|Y_n-a|\ge\epsilon) = 0 17 | \end{displaymath} 18 | 则称$Y_1,Y_2,\dots,Y_n,\dots$\textbf{依概率收敛}于$a$, 19 | 记为$Y_n \mprto a$。 20 | \end{definition} 21 | 22 | \begin{theorem}[连续映射定理] 23 | 若$X_n\mprto a$,函数$g(\cdot)$在点$a$处连续,则 24 | \begin{displaymath} 25 | g(X_n) \mprto g(a) 26 | \end{displaymath} 27 | 若$X_n\mprto a$,$Y_n\mprto b$, 28 | 函数$g(\cdot,\cdot)$在点$(a,b)$处连续,则 29 | \begin{displaymath} 30 | g(X_n,Y_n) \mprto g(a,b) 31 | \end{displaymath} 32 | \end{theorem} 33 | 34 | \subsection{大数定律的定义} 35 | \begin{definition}[大数定律] 36 | 设$X_1,X_2,\dots$是随机变量序列。若 37 | \begin{displaymath} 38 | \frac{1}{n}\sum_{k=1}^{n}X_k \mprto 39 | \frac{1}{n}\sum_{k=1}^{n}\mexpect[X_k] 40 | \end{displaymath} 41 | 则称$\{X_n\}$服从\textbf{大数定律}。 42 | \end{definition} 43 | 44 | \begin{remark} 45 | 大数定律指的是随机变量的平均值依概率趋向于它们数学期望的平均值。 46 | \end{remark} 47 | 48 | \subsection{大数定律的相关定理} 49 | \begin{theorem}[马尔可夫大数定律] 50 | 若随机序列$\{X_n\}$满足 51 | \begin{displaymath} 52 | \frac{1}{n^2}\mvar\left(\sum_{i=1}^{n}X_i\right)\to 0\ (n\to\infty) 53 | \end{displaymath} 54 | 则$\{X_n\}$服从大数定律。 55 | \end{theorem} 56 | 57 | \begin{remark} 58 | 注意,尽管马尔科夫大数定律叫``定律'',但实质上是``定理''。 59 | 下面几个定律也是这样的。 60 | \end{remark} 61 | 62 | \begin{theorem}[切比雪夫大数定律] 63 | 若$\{X_n\}$为\emph{两两互不相关}的随机变量序列, 64 | 且存在常数$C$,使得对每个随机变量$X_k$, 65 | $\mvar(X_k)\le C\ (k=1,2,\dots)$ 66 | 则$\{X_n\}$服从大数定律。 67 | \end{theorem} 68 | 69 | \begin{theorem}[辛钦大数定律] 70 | 若随机变量序列$\{X_n\}$独立同分布, 71 | 且数学期望$\mexpect[X_k]=\mu\ (k=1,2,\dots)$均存在, 72 | 则$\{X_n\}$服从大数定律,即 73 | \begin{displaymath} 74 | \frac{1}{n}\sum_{k=1}^n X_k \mprto 75 | \frac{1}{n}\sum_{k=1}^{n}\mexpect[X_k] = \mu 76 | \end{displaymath} 77 | \end{theorem} 78 | 79 | \begin{remark} 80 | 该定理从理论上指出:用算术平均值来近似实际真值是合理的。 81 | \end{remark} 82 | 83 | \begin{theorem}[伯努利大数定律] 84 | 设$n_A$为$n$重伯努利试验中事件$A$发生的次数,则 85 | \begin{displaymath} 86 | \frac{n_A}{n}\mprto P(A) 87 | \end{displaymath} 88 | \end{theorem} 89 | 90 | \begin{remark} 91 | 该定理给出了频率的稳定性的严格的数学意义, 92 | 即频率$\mprto$概率。 93 | \end{remark} 94 | 95 | \section{中心极限定理} 96 | 本小节主要讨论中心极限定理的定义和相关定理。 97 | 98 | \subsection{中心极限定理的定义} 99 | \begin{definition}[中心极限定理] 100 | 设$\{X_n\}$为独立随机变量序列, 101 | 且$\mexpect[X_k],\mvar(X_k)\ (k=1,2,\dots)$存在。 102 | 令$Z_n$为$\sum_{k=1}^nX_k$标准化随机变量,即 103 | \begin{displaymath} 104 | Z_n = \frac{\sum_{k=1}^{n}X_k - \sum_{k=1}^{n}\mexpect[X_k]} 105 | {\sqrt{\sum_{k=1}^{n}\mvar(X_k)}} 106 | \end{displaymath} 107 | 若对任意$x\in\mfR$,有 108 | \begin{displaymath} 109 | \lim_{n\to\infty} P(Z_n\le x) = 110 | \frac{1}{2\pi}\mintcumto{x} e^{-\frac{t^2}{2}}dt = \Phi(x) 111 | \end{displaymath} 112 | 则称$\{X_n\}$服从\textbf{中心极限定理}。 113 | \end{definition} 114 | 115 | \begin{remark} 116 | 中心极限定理指的是$\sum_{k=1}^n X_k$的极限分布是正态分布。 117 | 另外注意,尽管中心极限定理叫``定理'',但它和大数定律一样都是``定义''层面上的。 118 | \end{remark} 119 | 120 | \subsection{中心极限定理的相关定理} 121 | 122 | \begin{theorem}[林德贝格-勒维中心极限定理(独立同分布情形)] 123 | 设$\{X_n\}$独立同分布, 124 | 且$\mexpect[X_k]=\mu,\mvar(X_k)=\sigma^2\ (k=1,2,\dots)$, 125 | 则$\{X_n\}$服从中心极限定理,即 126 | \begin{displaymath} 127 | \lim_{n\to\infty}P\left(\frac{\sum_{k=1}^{n}X_k-n\mu}{\sqrt{n}\sigma} 128 | \le x\right) = \Phi(x) 129 | \end{displaymath} 130 | \end{theorem} 131 | 132 | \begin{remark} 133 | 该定理说明,对于独立同分布的随机序列$\{X_n\}$, 134 | 它们的和$\sum_{k=1}^n X_k$近似服从于$N(n\mu, n\sigma^2)$。 135 | \end{remark} 136 | 137 | \begin{theorem}[德莫佛-拉普拉斯中心极限定理(伯努利情形)] 138 | 设$\mu_n$是$n$重伯努利试验中事件$A$发生的次数,记 139 | $p=P(A)$,则对任意$x\in\mfR$,有 140 | \begin{displaymath} 141 | \lim_{n\to\infty}P\left(\frac{\mu_n-np}{\sqrt{np(1-p)}} 142 | \le x\right) = \Phi(x) 143 | \end{displaymath} 144 | \end{theorem} 145 | 146 | \begin{corollary} 147 | 设$\mu_n\sim B(n,p)$。当$n$充分大时, 148 | \begin{displaymath} 149 | P(a < \mu_n \le b) \approx 150 | \Phi\left(\frac{b-np}{\sqrt{np(1-p)}}\right) 151 | - \Phi\left(\frac{a-np}{\sqrt{np(1-p)}}\right) 152 | \end{displaymath} 153 | \end{corollary} 154 | 155 | \begin{remark} 156 | 这个公式给出了$n$较大时二项分布的概率计算方法 157 | \end{remark} 158 | 159 | \subsection{大数定律与中心极限定理的比较} 160 | 对于独立同分布的随机变量序列$\{X_n\}$, 161 | 大数定律描述了其均值(或和)在$n\to\infty$的趋势, 162 | 中心极限定理则能给出给定$n$与$x$时的具体概率近似。 163 | -------------------------------------------------------------------------------- /Probability/NumericalCharacteristics.tex: -------------------------------------------------------------------------------- 1 | \chapter{随机变量的数字特征} 2 | 3 | \section{数学期望} 4 | 本小节首先分别给出离散型和连续型随机变量的数学期望的定义, 5 | 然后讨论数学期望的性质,以及条件期望。 6 | 7 | \subsection{离散型随机变量的数学期望} 8 | \begin{definition}[离散型随机变量的数学期望] 9 | 设$X$为离散型随机变量,分布律为$P(X=x_i)=p_i\ (i=1,2,\dots)$。 10 | 若级数$\sum_{i=1}^{\infty}x_ip_i$绝对收敛, 11 | 则称$\sum_{i=1}^{\infty}x_ip_i$为$X$的\textbf{数学期望}, 12 | 记为$\mexpect[X]$,即 13 | \begin{displaymath} 14 | \mexpect[X] = \sum_{i=1}^{\infty}x_ip_i 15 | \end{displaymath} 16 | 若$\sum_{i=1}^{\infty}|x_i|p_i$发散, 17 | 则称$X$的数学期望不存在。 18 | \end{definition} 19 | 20 | \begin{theorem}[离散非负随机变量的期望的其它计算方法] 21 | 设$X$是取值为非负整数的离散随机变量,则 22 | \begin{displaymath} 23 | \mexpect[X] = \sum_{i=1}^{\infty} P(X\ge i) 24 | \end{displaymath} 25 | \end{theorem} 26 | 27 | \subsection{连续型随机变量的数学期望} 28 | \begin{definition}[连续型随机变量的数学期望] 29 | 设连续型随机变量$X$的概率密度为$p(x)$, 30 | 若积分$\mintall xp(x)dx$绝对收敛, 31 | 则称该积分为$X$的\textbf{数学期望},记为$\mexpect[X]$,即 32 | \begin{displaymath} 33 | \mexpect[X] = \mintall xp(x)dx 34 | \end{displaymath} 35 | 若积分$\mintall |x|p(x)dx$发散, 36 | 则称$X$的数学期望不存在。 37 | \end{definition} 38 | 39 | \subsection{数学期望的性质} 40 | \begin{theorem}[数学期望的性质] 41 | 数学期望有如下一些性质: 42 | \begin{enumerate} 43 | \item 线性性质: 44 | $\mexpect[X+Y] = \mexpect[X] + \mexpect[Y]$, 45 | $\mexpect[cX] = c\mexpect[X]$ 46 | \item 47 | 如果$f(x)$是凸函数,那么 48 | \begin{displaymath} 49 | \mexpect[f(X)] \ge f(\mexpect[X]) 50 | \end{displaymath} 51 | \end{enumerate} 52 | \end{theorem} 53 | 54 | \begin{theorem} 55 | 设连续型随机变量$X$的密度函数为$p(x)$。 56 | 若$g(x)$连续,那么 57 | \begin{displaymath} 58 | \mexpect[g(X)] = \mintall g(x)p(x)dx 59 | \end{displaymath} 60 | 类似地,设$X,Y$是连续型随机变量,联合密度为$p(x,y)$。 61 | 若$g(x,y)$连续,那么 62 | \begin{displaymath} 63 | \mexpect[g(X,Y)] = \mintall\mintall g(x,y)p(x,y)dxdy 64 | \end{displaymath} 65 | \end{theorem} 66 | 67 | \subsection{条件期望} 68 | \begin{definition}[离散型随机变量的条件期望] 69 | 在事件$A$的条件下,离散型随机变量$X$的条件期望定义为 70 | \begin{displaymath} 71 | \mexpect[X|A] = \sum_{x} xP(X=x|A) 72 | \end{displaymath} 73 | \end{definition} 74 | 75 | \begin{theorem}[全期望公式] 76 | 设事件$A_1,A_2,\dots,A_n$是概率空间的一个划分, 77 | 则对于随机变量$X$,有 78 | \begin{displaymath} 79 | \mexpect[X] = \sum_{i=1}^n P(A_i)\mexpect[X|A_i] 80 | \end{displaymath} 81 | \end{theorem} 82 | 83 | \begin{theorem}[条件期望的线性性质] 84 | 对于有限个随机变量$X_1,X_2,\dots,X_n$, 85 | 以及常数$c_1,c_2,\dots,c_n$,有 86 | \begin{displaymath} 87 | \mexpect\left[\sum_{i=1}^{n}c_iX_i\bigg|A\right] = 88 | \sum_{i=1}^{n}c_i\mexpect[X|A] 89 | \end{displaymath} 90 | \end{theorem} 91 | 92 | \begin{theorem}[条件期望定义的随机变量] 93 | 如果$X$和$Y$是随机变量, 94 | 那么$\mexpect[X|Y]$是随机变量$Y$的函数。 95 | 且拥有性质 96 | \begin{displaymath} 97 | \mexpect\left[\mexpect[X|Y]\right] = \mexpect[X] 98 | \end{displaymath} 99 | \end{theorem} 100 | 101 | \section{方差\ 协方差\ 相关系数} 102 | 本小节主要讨论:方差,协方差,相关系数与相关性。 103 | 104 | \subsection{方差} 105 | \begin{definition}[中位数] 106 | 设$X$为随机变量。对于$m\in\mfR$,若 107 | $P(X\ge m) \ge 1/2$且$P(X\le m) \ge 1/2$。 108 | 则称$m$为$X$的\textbf{中位数}。 109 | \end{definition} 110 | 111 | \begin{definition}[方差与标准差] 112 | 设$X$是一个随机变量, 113 | 若$\mexpect[(X-\mexpect[X])^2]$存在, 114 | 则称$\mexpect[(X-\mexpect[X])^2]$为$X$的\textbf{方差}, 115 | 记为$\mvar(X)$,即 116 | \begin{displaymath} 117 | \mvar(X) = \mexpect\left[(X-\mexpect[X])^2\right] 118 | \end{displaymath} 119 | 此外,称$\sqrt{\mvar(X)}$为\textbf{标准差},记为$\msdev(X)$。 120 | \end{definition} 121 | 122 | \begin{theorem}[方差的其它计算方法] 123 | 设$X$是随机变量,则 124 | \begin{displaymath} 125 | \mvar(X) = \mexpect\left[X^2\right]-\mexpect[X]^2 126 | \end{displaymath} 127 | \end{theorem} 128 | 129 | \begin{theorem}[方差的性质] 130 | 设$C$为常数,$X$为随机变量,则: 131 | \begin{enumerate} 132 | \item 133 | $\mvar(C)=0$ 134 | \item 135 | $\mvar(CX)=C^2\mvar(X)$ 136 | \end{enumerate} 137 | \end{theorem} 138 | 139 | \begin{remark} 140 | 方差不具有线性性质。 141 | \end{remark} 142 | 143 | \subsection{协方差} 144 | \begin{definition}[协方差] 145 | 定义随机变量$X$和$Y$间的\textbf{协方差}为 146 | \begin{align*} 147 | \mcov(X,Y) 148 | &=\mexpect[(X-\mexpect[X])(Y-\mexpect[Y])] \\ 149 | &= \mexpect[XY] - \mexpect[X]\mexpect[Y] 150 | \end{align*} 151 | 特别地,$\mcov(X,X)=\mvar(X)$。 152 | \end{definition} 153 | 154 | \begin{theorem}[协方差的性质] 155 | 协方差有如下一些性质: 156 | \begin{enumerate} 157 | \item 158 | $\mcov(X,C) = 0$,其中$C$为常数。 159 | \item 160 | $\mcov(X,Y) = \mcov(Y,X)$ 161 | \item 162 | $\mcov(aX,bY)=ab\mcov(X,Y)$,其中$a,b$为常数。 163 | \item 164 | $\mcov(X_1+X_2,Y)=\mcov(X_1,Y)+\mcov(X_2,Y)$ 165 | \item 166 | $\mvar(X\pm Y)=\mvar(X)+\mvar(Y)\pm 2\mcov(X,Y)$ 167 | \end{enumerate} 168 | \end{theorem} 169 | 170 | \begin{theorem}[相互独立的随机变量的协方差] 171 | 若随机变量$X,Y$独立,则 172 | \begin{displaymath} 173 | \mcov(X,Y) = 0 174 | \end{displaymath} 175 | 亦即$\mexpect[XY]=\mexpect[X]\mexpect[Y]$, 176 | 所以$\mvar(X\pm Y) = \mvar(X)\pm \mvar(Y)$。 177 | \end{theorem} 178 | 179 | \begin{remark} 180 | 反之并不成立,即$\mcov(X,Y)=0$并不意味着$X,Y$相互独立。 181 | \end{remark} 182 | 183 | \begin{theorem}[随机变量和的方差] 184 | 对于有限个随机变量$X_1,X_2,\dots,X_n$, 185 | \begin{align*} 186 | \mvar\left(\sum_{i=1}^{n}X_i\right) 187 | &= \sum_{i=1}^{n}\mvar(X) + 2\sum_{1\le i0,\mvar(Y)>0$均存在,则称 215 | \begin{displaymath} 216 | \rho_{XY}=\frac{\mcov(X,Y)}{\sqrt{\mvar(X)\mvar(Y)}} 217 | \end{displaymath} 218 | 为$X$和$Y$的\textbf{相关系数}。 219 | 在不引起混淆时,记$\rho_{XY}$为$\rho$。 220 | \end{definition} 221 | 222 | \begin{remark} 223 | 记$X,Y$的标准化随机变量为$X^*,Y^*$,则有 224 | \begin{displaymath} 225 | \rho_{XY}=\mcov(X^*,Y^*) 226 | \end{displaymath} 227 | \end{remark} 228 | 229 | \begin{theorem}[柯西-施瓦兹(Cauchy-Schwartz)不等式] 230 | 设$X,Y$为随机变量,则 231 | \begin{displaymath} 232 | \mexpect[XY]^2 \le \mexpect[X^2]\mexpect[Y^2] 233 | \end{displaymath} 234 | \end{theorem} 235 | 236 | \begin{theorem}[相关系数的性质] 237 | 对随机变量$X,Y$,设$\rho_{XY}$为它们的相关系数,则 238 | $|\rho_{XY}|\le 1$,即$\mcov(X,Y)^2 \le \mvar(X)\mvar(Y)$。 239 | \end{theorem} 240 | 241 | \begin{remark} 242 | 由柯西施瓦兹不等式直接得证。 243 | \end{remark} 244 | 245 | \begin{theorem} 246 | $|\rho_{XY}|=1$当且仅当存在常数$a,b$,使得 247 | \[ P(Y=aX+b) = 1 \] 248 | 即$X$与$Y$有线性关系的概率为1。 249 | \end{theorem} 250 | 251 | \begin{theorem}[相关性] 252 | 对随机变量$X,Y$, 253 | \begin{itemize} 254 | \item 255 | 若$|\rho_{XY}|=1$, 256 | 则称$X,Y$\textbf{线性相关}。 257 | \begin{itemize} 258 | \item 259 | 若$\rho_{XY}=1$,则称$X,Y$\textbf{正相关}。 260 | \item 261 | 若$\rho_{XY}=-1$,则称$X,Y$\textbf{负相关}。 262 | \end{itemize} 263 | \item 264 | $|\rho_{XY}|=0$表示$X$与$Y$不存在线性关系,称为\textbf{不相关}。 265 | \end{itemize} 266 | \end{theorem} 267 | 268 | \begin{remark} 269 | $\rho_{XY}$表示$X$与$X$存在线性关系的强弱程度。 270 | $|\rho_{XY}|$越大,则$X$与$Y$线性关系越强,反之越弱。 271 | \end{remark} 272 | 273 | \begin{theorem}[独立与不相关] 274 | 设$X,Y$为随机变量,则 275 | \begin{center} 276 | \begin{tabular}{cccl} 277 | \multirow{4}{*}{$X,Y$独立} & 278 | \multirow{4}{*}{$\Longrightarrow$} & 279 | \multirow{4}{*}{$X,Y$不相关} & 280 | $\iff \rho_{XY}=0$ \\ 281 | & & & $\iff \mcov(X,Y)=0$ \\ 282 | & & & $\iff \mexpect[XY]=\mexpect[X]\mexpect[Y]$ \\ 283 | & & & $\iff \mvar(X+Y)=\mvar(X)+\mvar(Y)$ \\ 284 | \end{tabular} 285 | \end{center} 286 | \end{theorem} 287 | 288 | \begin{remark} 289 | $X,Y$不相关指的是$X,Y$不存在线性关系,不代表$X,Y$独立。 290 | \end{remark} 291 | 292 | \section{集中度(Concentration of measure)} 293 | 本小节主要介绍几个衡量尾分布的不等式。 294 | 295 | \subsection{马尔可夫不等式} 296 | \begin{theorem}[马尔科夫不等式] 297 | 设随机变量$X$非负,则对任意$a>0$,有 298 | \begin{displaymath} 299 | P(X\ge a) \le \frac{\mexpect[X]}{a} 300 | \end{displaymath} 301 | \end{theorem} 302 | 303 | \begin{theorem}[马尔科夫不等式的推广] 304 | 设$X$为随机变量,$f(X)$为取值非负的实函数,则对任意$a>0$,有 305 | \begin{displaymath} 306 | P(f(X)\ge a) \le \frac{\mexpect[f(X)]}{a} 307 | \end{displaymath} 308 | \end{theorem} 309 | 310 | \subsection{切比雪夫不等式} 311 | \begin{theorem}[切比雪夫不等式] 312 | 设$X$为随机变量,则对任意$a>0$,有 313 | \begin{displaymath} 314 | P\left(|X-\mexpect[X]|>a\right) \le \frac{\mvar(X)}{a^2} 315 | \end{displaymath} 316 | \end{theorem} -------------------------------------------------------------------------------- /Probability/RandomEventAndProbability.tex: -------------------------------------------------------------------------------- 1 | \chapter{随机事件与概率} 2 | 3 | \section{随机事件与运算} 4 | 本小节首先用集合的概念来定义样本空间与随机事件。 5 | 然后介绍事件之间的关系与运算——类似于集合的关系与运算。 6 | 7 | \subsection{随机事件与样本空间} 8 | \begin{definition}[随机现象] 9 | 具有不确定性的现象叫做\textbf{随机现象}。 10 | \end{definition} 11 | 12 | \begin{definition}[随机试验] 13 | 对随机现象的一次观测叫做\textbf{随机试验}。 14 | \end{definition} 15 | 16 | \begin{definition}[样本点] 17 | 随机试验的一次结果叫做\textbf{样本点},记作$\omega$。 18 | \end{definition} 19 | 20 | \begin{definition}[样本空间] 21 | 随机试验所有可能的样本点的集合叫做\textbf{样本空间},记作$\Omega$。 22 | \end{definition} 23 | 24 | \begin{definition}[随机事件] 25 | 样本空间的一个子集叫做\textbf{随机事件}。 26 | \end{definition} 27 | 28 | \begin{remark} 29 | 随机事件本质上是集合。 30 | 所以\textbf{必然事件}就是样本空间本身。 31 | \textbf{不可能事件}就是空集。 32 | \end{remark} 33 | 34 | \subsection{事件的关系与运算} 35 | 36 | \begin{definition}[事件的关系] 37 | 事件有如下三种关系: 38 | \begin{description} 39 | \item[包含] 40 | 若事件$A$发生必然导致事件$B$发生,则称$B$包含$A$, 41 | 记作$A\subset B$。 42 | \item[相等] 43 | 若$A\subset B$且$B\subset A$,则称$A$与$B$相等, 44 | 记作$A=B$。 45 | \item[互斥] 46 | 若事件$A$和事件$B$不可能同时发生,即$A\cap B=\varnothing$, 47 | 则称$A$与$B$互斥,也称$A$与$B$互不相容。 48 | \end{description} 49 | \end{definition} 50 | 51 | \begin{definition}[事件的运算] 52 | 事件有如下一些运算: 53 | \begin{description} 54 | \item[事件的并] 55 | 事件$A$和事件$B$至少有一个会发生的事件称为$A$和$B$的并,记作$A\cup B$。 56 | $n$个事件$A_1,\dots,A_n$中至少有一个会发生的事件称为$A_1,\dots,A_n$的并, 57 | 记作$\bigcup_{i=1}^n A_i$。 58 | \item[事件的交] 59 | 事件$A$和事件$B$同时发生的事件称为$A$和$B$的交, 60 | 记作$A\cap B$或简记为$AB$。 61 | $n$个事件$A_1,\dots,A_n$中同时发生的事件称为$A_1,\dots,A_n$的交, 62 | 记作$\bigcap_{i=1}^n A_i$。 63 | \item[对立事件] 64 | 事件$A$不发生的事件称为$A$的对立事件,记作$\mcmpl{A}$。 65 | \item[事件的差] 66 | 事件$A$发生而事件$B$不发生的事件称为$A$与$B$的差, 67 | 记作$A-B$或$A\mcmpl{B}$。 68 | \end{description} 69 | \end{definition} 70 | 71 | 事件运算的规律参考集合运算的规律。 72 | 73 | \section{概率的概念与性质} 74 | 我们首先介绍一下频率的概念,与概率作区分。 75 | 然后使用公理化的方法给出概率的定义。 76 | 最后介绍概率常用的性质。 77 | 78 | \subsection{频率的概念与性质} 79 | \begin{definition}[频率] 80 | 在相同的条件下进行$n$次试验, 81 | 其中事件$A$发生的次数$n_A$称为$A$发生的\textbf{频数}。 82 | 比值$n_A/n$称为$A$发生的\textbf{频率},记作$f_n(A)$,即 83 | \[ f_n(A) = \frac{n_A}{n} \] 84 | \end{definition} 85 | 86 | \begin{theorem}[频率的性质] 87 | 频率满足下面一些性质: 88 | \begin{enumerate} 89 | \item 90 | $0 \le f_n(A) \le 1$ 91 | \item 92 | $f_n(\Omega) = 1$ 93 | \item 94 | 若$A_1,\dots,A_n$两两互不相容,那么 95 | $f_n\left(\bigcup_{i=1}^n A_i\right) = \sum_{i=1}^n f_n(A_i)$。 96 | \end{enumerate} 97 | \end{theorem} 98 | 99 | \subsection{概率的概念与性质} 100 | \begin{definition}[概率] 101 | 在随机试验的样本空间$\Omega$上,对每一个事件$A$赋予一个实数, 102 | 记为$P(A)$,称为事件$A$的\textbf{概率},满足: 103 | \begin{enumerate} 104 | \item 非负性: 105 | $P(A)\ge 0$ 106 | \item 规范型: 107 | $P(\Omega) = 1$ 108 | \item 可列可加性: 109 | 若$A_1,\dots,A_n,\dots$两两互不相容,则 110 | \begin{displaymath} 111 | P\left(\bigcup_{i=1}^\infty A_i\right)=\sum_{i=1}^\infty P(A_i) 112 | \end{displaymath} 113 | \end{enumerate} 114 | \end{definition} 115 | 116 | \begin{theorem}[概率的性质] 117 | 从概率的公理化定义能推出下面的性质: 118 | \begin{enumerate} 119 | \item 120 | $P(\varnothing) = 0$ 121 | \item 122 | 若$A_1,\dots,A_n$两两互不相容,则 123 | \begin{displaymath} 124 | P\left(\bigcup_{i=1}^n A_i\right)=\sum_{i=1}^n P(A_i) 125 | \end{displaymath} 126 | \item 127 | $P(B-A) = P(B) - P(BA)$ 128 | \item 129 | $P(\mcmpl{A}) = 1 - P(A)$ 130 | \item 131 | $P(A\cup B) = P(A) + P(B) - P(AB)$ 132 | \item 133 | 容斥原理: 134 | \begin{align*} 135 | P\left(\bigcup_{i=1}^n A_i\right) 136 | &= \sum_{i=1}^n P(A_i) - \sum_{1\le i0$,则称 182 | \begin{displaymath} 183 | P(A|B) = \frac{P(AB)}{P(B)} 184 | \end{displaymath} 185 | 为事件$B$发生的条件下,事件$A$的\textbf{条件概率}。 186 | \end{definition} 187 | 188 | \begin{remark} 189 | $P(\cdot|B)$满足概率的定义, 190 | 所以概率的性质对条件概率仍使用。 191 | \end{remark} 192 | 193 | \subsection{条件概率的公式} 194 | \begin{theorem}[乘法公式] 195 | 对于事件$A$和$B$,根据条件概率的定义,直接有 196 | \begin{displaymath} 197 | P(AB) = P(A)P(B|A) = P(B)P(A|B) 198 | \end{displaymath} 199 | 推广至事件$A_1,A_2,A_3,\dots,A_n$,有 200 | \begin{displaymath} 201 | P(A_1A_2\cdots A_n) = P(A_1)P(A_2|A_1)P(A_3|A_1A_2) 202 | \cdots P(A_n|A_1A_2\cdots A_{n-1}) 203 | \end{displaymath} 204 | \end{theorem} 205 | 206 | \begin{definition}[样本空间的划分] 207 | 设$\Omega$为试验$E$的样本空间,$A_1,A_2,\dots,A_n$为$E$的一组事件。 208 | 若满足 209 | \begin{enumerate} 210 | \item 211 | $A_1,A_2,\dots,A_n$两两互不相容 212 | \item 213 | $\bigcup_{i=1}^n A_i = \Omega$ 214 | \end{enumerate} 215 | 则称$A_1,A_2,\dots,A_n$为样本空间$\Omega$的一个划分。 216 | \end{definition} 217 | 218 | \begin{theorem}[全概率公式] 219 | 设事件$A_1,A_2,\dots,A_n$是概率空间$\Omega$的一个划分, 220 | 且它们的概率都不为零,则对任意事件$B$,有 221 | \begin{displaymath} 222 | P(B) = \sum_{i=1}^nP(A_i)P(B|A_i) 223 | \end{displaymath} 224 | \end{theorem} 225 | 226 | \begin{remark} 227 | 我们把事件$B$看作某一过程的结果, 228 | 把$A_1,A_2,\dots,A_n$看作该过程的若干个原因。 229 | 全概率公式告诉我们,如果 230 | \begin{enumerate} 231 | \item 232 | 每一原因发生的概率已知(即$P(A_i)$已知), 233 | \item 234 | 每一原因对结果的影响已知(即$P(B|A_i)$已知), 235 | \end{enumerate} 236 | 那么即可求出结果发生的概率$P(B)$。 237 | \end{remark} 238 | \begin{theorem}[贝叶斯公式] 239 | 设事件$A_1,A_2,\dots,A_n$是概率空间$\Omega$的一个划分, 240 | 且它们的概率都不为零,则 241 | \begin{align*} 242 | P(A_i|B) &= \frac{P(A_iB)}{P(B)} \\ 243 | &= \frac{P(A_i)P(B|A_i)}{\sum_{k=1}^n P(A_k)P(B|A_k)} 244 | \end{align*} 245 | \end{theorem} 246 | 247 | \begin{remark} 248 | 我们把事件$B$看作某一过程的结果, 249 | 把$A_1,A_2,\dots,A_n$看作该过程的若干个原因。 250 | 贝叶斯公式告诉我们,如果 251 | \begin{enumerate} 252 | \item 253 | 每一原因发生的概率已知(即$P(A_k)$已知), 254 | \item 255 | 每一原因对结果的影响已知(即$P(B|A_k)$已知), 256 | \end{enumerate} 257 | 那么就能求出$B$由第$i$个原因引起的概率$P(A_i|B)$。 258 | \end{remark} 259 | 260 | \subsection{独立性} 261 | \begin{definition}[两个随机事件的相互独立性] 262 | 若随机事件$A,B$满足 263 | \begin{displaymath} 264 | P(AB)=P(A)P(B) 265 | \end{displaymath} 266 | 则称$A$与$B$\textbf{相互独立}。 267 | \end{definition} 268 | 269 | \begin{theorem}[两个随机事件相互独立的充要条件] 270 | 事件$A,B$相互独立当且仅当 271 | \begin{displaymath} 272 | P(A|B) = P(A) 273 | \end{displaymath} 274 | \end{theorem} 275 | 276 | \begin{theorem}[相互独立与互不相容的关系] 277 | 设$A,B$是两个概率不为零的随机事件,那么 278 | \begin{enumerate} 279 | \item 280 | 若$A,B$相互独立,则它们不可能互不相容。 281 | \item 282 | 若$A,B$互不相容,则它们不可能相互独立。 283 | \end{enumerate} 284 | \end{theorem} 285 | 286 | \begin{definition}[$n$个事件的相互独立性] 287 | 设$A_1,A_2,\dots,A_n$为$n$个随机事件, 288 | 如果对于任意集合$S \subset[n]$,有 289 | \begin{displaymath} 290 | P\left(\bigcap_{i\in S} A_i\right) = \prod_{i\in S}P(A_i) 291 | \end{displaymath} 292 | 则称$A_1,A_2,\dots,A_n$相互独立。 293 | \end{definition} 294 | 295 | \begin{remark} 296 | $n$个事件相互独立,则其中任意$k$个事件也相互独立,反之不成立。 297 | \end{remark} 298 | -------------------------------------------------------------------------------- /README.md: -------------------------------------------------------------------------------- 1 | # 简介 2 | 心血来潮想把之前上的数学课笔记做成电子版, 3 | 于是开了这个坑。希望我能慢慢填完吧, 4 | 毕竟纸质笔记的格式要转换过来不是那么一一对应的。 5 | 详略程度也要适当把握一下。 6 | 7 | # 最新 8 | - (2020/6/10) 要毕业了。大概彻底弃坑了哈哈哈。目前的内容以pdf形式发布在了[Release](https://github.com/QinlinChen/MathNotes/releases)中。 9 | - (2019/7/19) 忘记把笔记本带回家了。咕咕咕。 10 | - (2019/6/10) 这学期太忙了,微积分又断更了Orz。暑假再说吧。 11 | - (2019/3/31) 开始周更微积分。 12 | - (2019/2/8) 今天又想把机器学习相关的数学加进来了。 13 | 说起来做这个笔记的另一个动力就是为了复习机器学习的数学基础, 14 | 没想到还差些矩阵向量求导、SVD等内容。 15 | 不过还是等我忙完要学习的内容再说吧。 16 | - (2019/2/3) 目前已经完成了线性代数、概率论和数理统计部分的笔记。 17 | 接下来会放一段时间。等开学了慢慢补完微积分。 18 | 19 | # 结构 20 | 主要与有四个模块: 21 | - 微积分 (施工中) 22 | - 线性代数 (已完成) 23 | - 概率论 (已完成) 24 | - 数理统计 (已完成) 25 | 26 | 还有一些我上过但当时没做笔记所以如果要整理出来必然是大工程的数学课有: 27 | - 图论 28 | - 抽象代数 29 | 30 | 前四个模块在tex结构中对应的是`part`。 31 | 我为它们建立好了对应的目录。 32 | 每个模块的每一章应该独立成一个tex文件放在对应模块的目录中, 33 | 并通过`\include`指令加入到`main.tex`文件。 34 | 可以查看`main.tex`文件查看我已经部分施工的内容。 35 | 36 | 图论和抽象代数属于计划外,有人愿意的话可以帮我补全吧 37 | 38 | 此外,我在`main.tex`开头也定义了一些数学command。 39 | 命名规则还在探索中。 40 | 41 | # 编译与发布 42 | 为了减少git控制文件的大小,我就不把pdf文件放上来了。 43 | 44 | release里面有按阶段编译的pdf文件, 45 | 但是如果发现有笔误的话,我只会修改tex文件, 46 | 新编译的pdf文件只会时不时地更新到release里面。 47 | 48 | 如果要更新到最新内容,可以自行用`xelatex`指令对`main.tex`编译两次得到pdf文件(或者配置使用TexStudio一件编译)。 -------------------------------------------------------------------------------- /main.tex: -------------------------------------------------------------------------------- 1 | \documentclass[oneside,a4paper,UTF8]{ctexbook} 2 | 3 | \usepackage{amsmath} 4 | \usepackage{amsfonts} 5 | \usepackage{amssymb} 6 | \usepackage{amsthm} 7 | \usepackage{textcomp} 8 | \usepackage{bm} 9 | \usepackage{diagbox} 10 | \usepackage{extarrows} 11 | \usepackage{multirow} 12 | \usepackage{booktabs} 13 | \usepackage{makeidx} 14 | \usepackage{url} 15 | \usepackage[colorlinks,urlcolor=blue]{hyperref} 16 | \makeindex 17 | 18 | \theoremstyle{definition} \newtheorem{definition}{定义}[chapter] 19 | \theoremstyle{definition} \newtheorem{theorem}[definition]{定理} 20 | \theoremstyle{definition} \newtheorem{lemma}[definition]{引理} 21 | \theoremstyle{definition} \newtheorem{corollary}[definition]{推论} 22 | \theoremstyle{remark} \newtheorem*{remark}{Remark} 23 | 24 | % math field begin 25 | \newcommand{\mf}[1]{\mathbb{#1}} 26 | \newcommand{\mfN}{\mf{N}} 27 | \newcommand{\mfZ}{\mf{Z}} 28 | \newcommand{\mfR}{\mf{R}} 29 | \newcommand{\mfQ}{\mf{Q}} 30 | \newcommand{\mfC}{\mf{C}} 31 | \newcommand{\mfF}{\mf{F}} 32 | % math field end 33 | 34 | % math matrix begin 35 | \newcommand{\mm}[1]{\mathbf{#1}} 36 | \newcommand{\mmA}{\mm{A}} 37 | \newcommand{\mmB}{\mm{B}} 38 | \newcommand{\mmC}{\mm{C}} 39 | \newcommand{\mmE}{\mm{E}} 40 | \newcommand{\mmM}{\mm{M}} 41 | \newcommand{\mmI}{\mm{I}} 42 | \newcommand{\mmP}{\mm{P}} 43 | \newcommand{\mmQ}{\mm{Q}} 44 | \newcommand{\mmZero}{\mm{0}} 45 | \newcommand{\mmat}[2]{\left(\begin{array}{#1} #2 \end{array}\right)} 46 | \newcommand{\mdet}[2]{\left|\begin{array}{#1} #2 \end{array}\right|} 47 | \newcommand{\meqs}[2]{\left\{\begin{array}{#1} #2 \end{array}\right.} 48 | % three elementry row transformations and matrices 49 | \newcommand{\mTfRowSwi}[2]{#1 \leftrightarrow #2} 50 | \newcommand{\mTfRowMul}[2]{#1(#2)} 51 | \newcommand{\mTfRowAdd}[3]{#1 #2 (#3)} 52 | \newcommand{\mmRowSwi}[2]{\mmP(\mTfRowSwi{#1}{#2})} 53 | \newcommand{\mmRowMul}[2]{\mmP(\mTfRowMul{#1}{#2})} 54 | \newcommand{\mmRowAdd}[3]{\mmP(\mTfRowAdd{#1}{#2}{#3})} 55 | % Basis matrix % 56 | \newcommand{\mmBasis}[1]{\mmB_{#1}} 57 | % math matrix end 58 | 59 | % math vector begin 60 | \newcommand{\mv}[1]{\bm{#1}} 61 | \newcommand{\mva}{\mv{a}} 62 | \newcommand{\mvb}{\mv{b}} 63 | \newcommand{\mvk}{\mv{k}} 64 | \newcommand{\mvx}{\mv{x}} 65 | \newcommand{\mvy}{\mv{y}} 66 | \newcommand{\mvz}{\mv{z}} 67 | \newcommand{\mvZero}{\mv{0}} 68 | % math vector end 69 | 70 | % math function begin 71 | \newcommand{\mfuncname}[1]{\textrm{#1}} 72 | \newcommand{\mdiag}{\mfuncname{diag}} 73 | \newcommand{\mdim}{\mfuncname{dim}} 74 | \newcommand{\mspan}{\mfuncname{span}} 75 | \newcommand{\mim}{\mfuncname{im}} 76 | \newcommand{\mker}{\mfuncname{ker}} 77 | \newcommand{\mtr}{\mfuncname{tr}} 78 | \newcommand{\mexpect}{\mathbb{E}} 79 | \newcommand{\mvar}{\mfuncname{Var}} 80 | \newcommand{\msdev}{\sigma} 81 | \newcommand{\mcov}{\mfuncname{Cov}} 82 | % math function end 83 | 84 | % math operator beign 85 | \newcommand{\mconj}[1]{\overline{#1}} 86 | \newcommand{\mcmpl}[1]{\overline{#1}} % complement set 87 | \newcommand{\mbar}[1]{\overline{#1}} 88 | \DeclareMathOperator*{\argmax}{arg\,max} 89 | \DeclareMathOperator*{\argmin}{arg\,min} 90 | \newcommand{\mintcumto}[1]{\int_{-\infty}^{#1}} 91 | \newcommand{\mintall}{\mintcumto{+\infty}} 92 | \newcommand{\mpartials}[2]{\frac{\partial #2}{\partial #1}} 93 | \newcommand{\mpartiall}[1]{\frac{\partial}{\partial #1}} 94 | % math operator end 95 | 96 | % math symbol begin 97 | \newcommand{\md}{\textrm{d}} 98 | \newcommand{\mT}{\textrm{T}} 99 | \newcommand{\meqdef}{\overset{\text{def}}{=}} 100 | \newcommand{\mprto}{\xrightarrow{P}} 101 | % math symbol end 102 | 103 | \begin{document} 104 | \author{陈钦霖} 105 | \title{数学笔记} 106 | \date{\today} 107 | 108 | \maketitle 109 | \tableofcontents 110 | 111 | \part{微积分} 112 | \include{Calculus/AnalysisFoundation} 113 | \include{Calculus/DifferentialCalculusOfUnaryFunction} 114 | 115 | \part{线性代数} 116 | \include{LinearAlgebra/Matrix} 117 | \include{LinearAlgebra/Determinant} 118 | \include{LinearAlgebra/VectorAndLinearSystem} 119 | \include{LinearAlgebra/LinearSpaceAndLinearMap} 120 | \include{LinearAlgebra/InnerProductSpaceAndOrthogonality} 121 | \include{LinearAlgebra/QuadraticForm} 122 | 123 | \part{概率论} 124 | \include{Probability/RandomEventAndProbability} 125 | \include{Probability/DiscreteRandomVariable} 126 | \include{Probability/ContinuousRandomVariable} 127 | \include{Probability/NumericalCharacteristics} 128 | \include{Probability/LimitTheory} 129 | 130 | \part{数理统计} 131 | \include{MathematicalStatistics/StatisticsAndSamplingDistribution} 132 | \include{MathematicalStatistics/ParameterEstimation} 133 | \include{MathematicalStatistics/HypothesisTest} 134 | 135 | \include{Calculus/IntegralCalculusOfUnaryFunction} 136 | \include{Calculus/SpaceAnalyticGeometry} 137 | \include{Calculus/DifferentialCalculusOfMultivariateFunction} 138 | \include{Calculus/IntegralCalculusOfMultivariateFunction} 139 | \include{Calculus/ImproperIntegral} 140 | \include{Calculus/InfiniteSeries} 141 | \include{Calculus/OrdinaryDifferentialEquation} 142 | 143 | % TODO: \printindex 144 | 145 | \end{document} --------------------------------------------------------------------------------