01PRA1:Kapitola3: Porovnání verzí
Z WikiSkripta FJFI ČVUT v Praze
(dodatky k rozdělením) |
|||
Řádka 9: | Řádka 9: | ||
\begin{equation} | \begin{equation} | ||
\mathrm{F}_X(x) = \mathrm{P}(X \leq x) = \sum_{m|x_m \leq x} \mathrm{P}(X = x_m) = \sum_{m=1}^{N,\infty} | \mathrm{F}_X(x) = \mathrm{P}(X \leq x) = \sum_{m|x_m \leq x} \mathrm{P}(X = x_m) = \sum_{m=1}^{N,\infty} | ||
− | \mathrm{P}(X = x_m) \mathbb{I}_{ | + | \mathrm{P}(X = x_m) \mathbb{I}_{[x_m,+\infty](x)} |
\end{equation} | \end{equation} | ||
Řádka 29: | Řádka 29: | ||
\mathrm{P}\left( X \neq c \right) = 0 } | \mathrm{P}\left( X \neq c \right) = 0 } | ||
\end{equation} | \end{equation} | ||
+ | Značíme $X \sim \delta_c$. | ||
\end{definition} | \end{definition} | ||
− | \begin{definition}[Alternativní/Bernoulliho rozdělení] | + | \begin{definition}[Alternativní/Bernoulliho rozdělení s parametrem p] |
− | Uvažujme náhodnou veličinu $ X $, která může nabývat pouze dvou hodnot, například $ 0,1 $, a dále nechť platí | + | Nechť $p\in[0,1]$. Uvažujme náhodnou veličinu $ X $, která může nabývat pouze dvou hodnot, například $ 0,1 $, a dále nechť platí |
\begin{equation} | \begin{equation} | ||
\matrix{ \mathrm{P}(X = 1) = p \cr \mathrm{P}(X = 0) = 1 - p } | \matrix{ \mathrm{P}(X = 1) = p \cr \mathrm{P}(X = 0) = 1 - p } | ||
\end{equation} | \end{equation} | ||
+ | Značíme $X \sim A(p)$. | ||
\end{definition} | \end{definition} | ||
Řádka 43: | Řádka 45: | ||
(pravděpodobnost neúspěchu). Počet příznivých jevů při $ n $ opakováních je potom \begin{equation} X = | (pravděpodobnost neúspěchu). Počet příznivých jevů při $ n $ opakováních je potom \begin{equation} X = | ||
\sum_{j=1}^{n} X_j \end{equation} | \sum_{j=1}^{n} X_j \end{equation} | ||
+ | Značíme $X \sim Bi(n,p)$. | ||
\end{definition} | \end{definition} | ||
Verze z 27. 1. 2011, 20:43
[ znovu generovat, | výstup z překladu ] | Kompletní WikiSkriptum včetně všech podkapitol. | |
PDF Této kapitoly | [ znovu generovat, | výstup z překladu ] | Přeložení pouze této kaptioly. |
ZIP | Kompletní zdrojový kód včetně obrázků. |
Součásti dokumentu 01PRA1
součást | akce | popis | poslední editace | soubor | |||
---|---|---|---|---|---|---|---|
Hlavní dokument | editovat | Hlavní stránka dokumentu 01PRA1 | Karel.brinda | 4. 10. 2010 | 23:39 | ||
Řídící stránka | editovat | Definiční stránka dokumentu a vložených obrázků | Admin | 7. 9. 2015 | 14:49 | ||
Header | editovat | Hlavičkový soubor | Karel.brinda | 8. 3. 2011 | 19:28 | header.tex | |
Kapitola0 | editovat | Předmluva | Admin | 4. 8. 2010 | 10:45 | predmluva.tex | |
Kapitola1 | editovat | Motivace | Valapet2 | 5. 3. 2016 | 20:43 | kapitola1.tex | |
Kapitola2 | editovat | Axiomatická definice pravděpodobnosti | Pitrazby | 18. 2. 2012 | 01:46 | kapitola2.tex | |
Kapitola3 | editovat | Diskrétní náhodné veličiny | Snilard | 8. 3. 2011 | 01:55 | kapitola3.tex | |
Kapitola4 | editovat | Absolutně spojitá rozdělení | Pitrazby | 18. 2. 2012 | 02:06 | kapitola4.tex | |
Kapitola5 | editovat | Charakteristiky náhodných veličin | Jakub.flaska | 1. 8. 2010 | 17:49 | kapitola5.tex | |
Kapitola6 | editovat | Limitní věty teorie pravděpodobnosti | Pitrazby | 18. 2. 2012 | 02:30 | kapitola6.tex | |
Kapitola7 | editovat | Statistika | Jakub.flaska | 1. 8. 2010 | 18:22 | kapitola7.tex |
Vložené soubory
soubor | název souboru pro LaTeX |
---|---|
Soubor:01PRA1_kap1_Uloha_na_nedeli.pdf | 01PRA1_kap1_Uloha_na_nedeli.pdf |
Soubor:01PRA1_kap1_Buffonuv_problem.pdf | 01PRA1_kap1_Buffonuv_problem.pdf |
Soubor:01_PRA1_kap1_Bertranduv_paradox.pdf | 01PRA1_kap1_Bertranduv_paradox.pdf |
Zdrojový kód
%\wikiskriptum{01PRA1} \section{Diskrétní náhodné veličiny} \begin{definition}[Diskrétní náhodná veličina] Náhodnou veličinu $ X $ nazýváme diskrétní, pokud obor hodnot $ \mathrm{R}_X $ je nejvýše spočetná množina, tzn. pokud existuje taková posloupnost $ x_1,\dots,x_n,\dots $ že $ X^{-1}\{x_1,\dots,x_n,\dots\} = \Omega $. Distribuční funkci diskrétní náhodné veličiny můžeme zapsat například jako \begin{equation} \mathrm{F}_X(x) = \mathrm{P}(X \leq x) = \sum_{m|x_m \leq x} \mathrm{P}(X = x_m) = \sum_{m=1}^{N,\infty} \mathrm{P}(X = x_m) \mathbb{I}_{[x_m,+\infty](x)} \end{equation} Diskrétní hustota pravděpodobnosti (frekvenční funkce) je funkce definována jako \begin{equation} f_X(x) = \left\{ \matrix{\mathrm{P}(X = x_k) &\ \ & X = x_k \cr 0 &\ \ & \textrm{ jinak }} \right. \end{equation} \end{definition} \begin{note} $ \mathrm{P}\left( X = x_k\right) $ můžeme označit jako $ p_k $. Přitom platí $$ \sum_{k} p_k = 1 $$ \end{note} \begin{definition}[Diracovo rozdělení] Buď $ X $ náhodná veličina, a nechť existuje $ c \in \mathbb{R} $ takové, že \begin{equation} \matrix{\mathrm{P}\left( X = c \right) = 1 \cr \mathrm{P}\left( X \neq c \right) = 0 } \end{equation} Značíme $X \sim \delta_c$. \end{definition} \begin{definition}[Alternativní/Bernoulliho rozdělení s parametrem p] Nechť $p\in[0,1]$. Uvažujme náhodnou veličinu $ X $, která může nabývat pouze dvou hodnot, například $ 0,1 $, a dále nechť platí \begin{equation} \matrix{ \mathrm{P}(X = 1) = p \cr \mathrm{P}(X = 0) = 1 - p } \end{equation} Značíme $X \sim A(p)$. \end{definition} \begin{definition}[Binomické rozdělení] Opakujme $ n $-krát experiment s náhodnou veličinou $ X $, která má alternativní rozdělení, přičemž uvažujeme $ \mathrm{P}(A) = p $ (pravděpodobnost úspěchu) a tedy $ \mathrm{P}\left(A^{\mathbb{C}}\right) = 1 - p $ (pravděpodobnost neúspěchu). Počet příznivých jevů při $ n $ opakováních je potom \begin{equation} X = \sum_{j=1}^{n} X_j \end{equation} Značíme $X \sim Bi(n,p)$. \end{definition} Pro pravděpodobnost poté platí $$ \mathrm{P}_n(X = k) = \mathrm{P}_n\left( \sum_{\pi(\hat{n})} \{X_{i_1} = 1, \dots, X_{i_k} = 1, X_{i_{k+1}} = 0, \dots, X_{i_{n}} = 0 \} \right) = $$ $$ = \sum_{\pi(\hat{n})} \mathrm{P}\left( X_{i_1} = 1,\dots,X_{i_k}=1,X_{i_{k+1}} = 0,\dots,X_{i_n} = 0 \right) = $$ $$ = {n \choose k} \prod_{i=1}^{k}\mathrm{P}(x_i = 1) \prod_{i=k+1}^{n} \mathrm{P}(x_i = 0) = {n \choose k}p^k (1 - p)^{n-k} $$ Z binomické věty také vyplývá, že $$ \sum_{k=0}^{n} {n \choose k} p^k (1-p)^{n-k} = (p + 1 - p)^n = 1 $$ \begin{example} Uvažujme šachovou partii, ve které jsou dva stejně silní soupeři (pravděpodobnost výhry i prohry je $ \frac{1}{2} $). Rozhodněte, zda je pravděpodobnější \begin{enumerate} \item { vyhrát 3 partie ze 4, nebo 5 partií z 8. } \item { vyhrát alespoň 3 partie ze 4, nebo alespoň 5 partií z 8. } \end{enumerate} \end{example} \begin{enumerate} \item { $$ \mathrm{P}\left(X = 3 \right) = \mathrm{P}_4(3) = {4 \choose 3} \left(\frac{1}{2}\right)^{3} \left( \frac{1}{2} \right) = \frac{1}{4} $$ $$ \mathrm{P}\left(X = 5 \right) = \mathrm{P}_8(5) = {8 \choose 5} \left( \frac{1}{2}\right)^{5}\left( \frac{1}{2} \right) = \frac{7}{32} $$ } \item { $$ \mathrm{P}\left(X = 3 \vee X = 4 \right) = \mathrm{P}\left( X = 3 \right) + \mathrm{P}\left( X = 4 \right) \mathrm{P}_4(3) + \mathrm{P}_4(4) = $$ $$ \frac{1}{4} + {4 \choose 4} \left( \frac{1}{2} \right)^{4} = \frac{5}{16} $$ $$ \mathrm{P}\left( X = 5 \vee X = 7 \vee X = 8 \right) = \sum_{k=5}^{8} \mathrm{P}_8\left( k \right) = $$ $$ = \sum_{k=5}^{8} {8 \choose k} \left( \frac{1}{2} \right)^k \left( \frac{1}{2} \right)^{8-k} = \frac{93}{256} $$ } \end{enumerate} \begin{definition}[Geometrické/Pascalovo rozdělení] Uvažujme nekonečnou posloupnost pokusů s veličinou s alternativním rozdělením $$ \mathrm{P}(A) = p $$ $$ \mathrm{P}\left(A^{\mathbb{C}}\right) = 1 - p $$ a buď $ X $ počet pokusů před prvním výskytem jevu $ A $. Platí, že \begin{equation} \mathrm{P}\left(X = k\right) = p (1-p)^k \end{equation} \end{definition} Platí $$ \sum_{k=0}^{\infty} p(1-p)^k = p \sum_{k=0}^{\infty} (1-p)^k = p \frac{1}{1 - (1 - p)} = 1 $$ \begin{definition}[Negativně binomické rozdělení] Opakujme jev nekonečně krát, a nechť náhodná veličina $ Y $ značí počet neúspěchů před $ m $-tým úspěchem, přičemž $ \mathrm{P}(A) = p $. Potom $$ \mathrm{P}\left( Y = k \right) = {k + m - 1 \choose k } p^m (1 - p)^k $$ \end{definition} \begin{definition}[Hypergeometrické rozdělení] Uvažujme zásobníkový model, ve kterém je $ r $ červených a $ N - r $ bílých kuliček. Opakujme $ n $-krát tah bez vracení, a jako náhodnou veličinu $ X $ uvažujme počet červených kuliček v $ n $-tici. \begin{equation} \mathrm{P}\left(X = x\right) = \frac{{r \choose x}{N - r \choose n - x}}{{N \choose n}} \end{equation} \end{definition} \begin{example} Uvažujme rybník, ve kterém je $ N $ ryb, a nechť $ r $ z nich je označeno. Chytněme $ n $ ryb, a jako náhodnou veličinu $ X $ uvažujme počet označených ryb mezi $ n $ chycenými. Jaká je statistika $ N $? \end{example} Chytíme $ n $ ryb, spočítáme označené a odhadneme $ N = \widehat{N} $, protože víme kolik je $ r $. $$ \frac{r}{\widehat{N}} = \frac{x}{n} $$ $$ \widehat{N} = \frac{r}{x}n $$ \begin{theorem} Pro $ N $ velká, $ \frac{n}{N} $ malá platí $$ \mathrm{H}(N,r,n) \dot = \mathrm{B}_i \left(n,\frac{r}{N}\right) $$ \end{theorem} \begin{definition}[Poissonovské rozdělení] Říkáme, že náhodná veličina $ X $ má poissonovské rozdělení s parametrem $ \lambda > 0$, pokud \begin{equation} \mathrm{P}(X = x) = \frac{{\lambda}^{x}}{x!}e^{-\lambda} \end{equation} \end{definition} \begin{theorem}[Poissonova] Uvažujme posloupnost náhodných veličin $ X_n $ s binomickým rozdělením, $ X_n \sim B_i(n,p_n) $, a nechť $ np_n \to \lambda $ (nebo $ np_n = \lambda $), $ \lambda > 0 $. Potom \begin{equation} \lim_{n \to \infty} \mathrm{P}_n (x) = \frac{{\lambda}^x}{x!}e^{-\lambda} \end{equation} \end{theorem} \begin{proof} \ $$ \lim_{n \to +\infty} \mathrm{P}_n(x) = \lim_{n \to +\infty} {n \choose x} p_n^x(1 - p_n)^{n-x} = \left\{ p_n = \frac{\lambda}{n} + o\left(\frac{1}{n}\right) \right\} = $$ $$ = \lim_{n \to +\infty} {n \choose x} \left( \frac{\lambda}{n} + o\left(\frac{1}{n}\right)\right)^x \left(1 - \frac{\lambda}{n} - o\left(\frac{1}{n}\right) \right)^{n-x} = $$ $$ = \lim_{n \to +\infty} \frac{\lambda^x}{x!} \underbrace{\frac{n(n-1)\cdots(n-x+1)}{n^x}}_{\to 1} \ \underbrace{\left( 1 + n o\left(\frac{1}{n} \right) \right)^x}_{\to 1} $$ $$ \underbrace{\left( 1 - \frac{\lambda}{n} - o\left( \frac{1}{n}\right) \right)^{n-x}}_{\to e^{-\lambda}} = e^{-\lambda} $$ \end{proof} \begin{theorem}[Zákon řídkých jevů] Uvažujme jev $ A $ v čase $ t $ (se začátkem v $ t_0 = 0$). Počet výskytu jevu do času $ t $ označme jako $ X_t $. Nechť dále platí: \begin{enumerate} \item { $ X_{t+h} - X_t $ nezávisí na $ t $ } \item { $ \mathrm{P}\left(\left( X_{t+h} - X_t\right)=1\right) = \lambda h + o(h) , \lambda > 0$, přičemž při $ h \to 0+ $ platí $$ \frac{o(h)}{h} \to 0 $$ } \item { $ \mathrm{P}\left( X_{t+h} - X_t > 1 \right) = o(h) $ při $ h \to 0+ $ } \item { Funkce $ p_k(t) = \mathrm{P}(X_t = k) $ je diferencovatelná v $ t $ pro všechna $ k \in \mathbb{N}_0 $. } \end{enumerate} Potom \begin{equation} \mathrm{P}\left(X_t = k\right) = \frac{\left(\lambda t\right)^k}{k!}e^{-\lambda t} \end{equation} ($ \lambda $ nazýváme intenzitou řídkého jevu). \end{theorem} \begin{proof} \ $$ p_o(t+h) = \mathrm{P}\left( X_t = 0 \right) \mathrm{P}\left(X_{t+h} - X_t = 0\right) = p_0(t)\left(1 - \lambda h + o(h)\right) $$ $$ \frac{\mathrm{d}p_0}{\mathrm{d}t}(t) = \lim_{h \to 0+} \frac{p_0(t+h) - p_0(t)}{h} = \lim_{h \to 0+} \left( - \lambda p_0(t) + p_0(t) \frac{o(h)}{h} \right) = -\lambda p_0(t) $$ $$ p_k(t+h) = \sum_{j=0}^{k} \mathrm{P}\left( X_t = j \right) \mathrm{P}\left( X_{t+h} -X_t = k - j \right) = $$ $$ = \sum_{j=0}^{k-2} \mathrm{P}\left( X_t = j \right) \underbrace{\mathrm{P}\left( X_{t+h} -X_t = k - j \right)}_{o(h)} + \underbrace{\mathrm{P}(X_{t+h} - X_t = 1)}_{\lambda h + o(h)} p_{k-1}(t) + $$ $$ + \underbrace{\mathrm{P}(X_{t+h} - X_t = 0)}_{1 - \lambda h + o(h)}p_k(t) = \sum_{j=0}^{k-2} \mathrm{P} \left( X_t = j \right) o(h) + $$ $$ + \mathrm{P}(X_t = k-1)(\lambda h + o(h)) + \mathrm{P}(X_t = k)(1 - \lambda h + o(h)) $$ $$ \frac{\mathrm{d}p_k}{\mathrm{d}t}(t) = \lim_{h \to 0+} \frac{p_k(t+h) - p_k(t)}{h} = \lambda p_{k-1}(t) - \lambda p_k(t) $$ Máme tedy soustavu lineárních diferenciálních rovnic $$ p_0'(t) = -\lambda p_0(t) $$ $$ p_k'(t) = \lambda(p_{k-1}(t) - p_k(t)) $$ která je za počátečních podmínek $$ p_0(0) = 1 $$ $$ p_k(0) = 0 $$ a po zavedení funkce $ q_k(t) = p_k(t) e^{\lambda t} $ řešitelná rekurentně. \end{proof} \begin{note} Důležitými předpoklady v zákonu řídkých jevů jsou \begin{enumerate} \item { Nezávislost na minulosti. } \item { Pravděpodobnost, že v $ X_{t+h} - X_t $ nastane právě jedna událost je zhruba lineární funkcí délky intervalu. } \end{enumerate} \end{note} \begin{example}[Příklad pro kuchaře] Na zadělání $ 1000 $ koláčů dáme $ 100000 $ rozinek. Najděte rozdělení počtu rozinek v náhodně vybraném koláči. \begin{enumerate} \item { Jaká je pravděpodobnost, že na koláči bude více než 5 rozinek? } \item { Jaká je pravděpodobnost, že na koláči nebude žádná rozinka? } \end{enumerate} \end{example} Vezměme libovolný koláč, ptejme se, zda je na něm $ n $-tá rozinka, a tento pokus opakujme $ 10000x $ (protože právě tolik je rozinek). Každá rozinka může být na jednom z tisíce koláčů, a to se stejnou pravděpodobností, proto $$ p_k = \frac{1}{1000} $$ Jako $ X $ označme počet rozinek na koláči, přičemž $ \lambda = n \cdot p_k = 10 $. Potom dle zákona velkých čísel platí $$ \mathrm{P}_n(k) = \frac{\lambda^k}{k!}e^{-\lambda} = \frac{10^k}{k!}e^{-10}\ \ \ \ \ \ \ \ \forall k \in \widehat{10000} $$ takže \begin{enumerate} \item { $$ \mathrm{P}(X > 5) = 1 - \mathrm{P}(X = 0) - \dots - \mathrm{P}(X = 5) \dot = 0,934 $$ } \item { $$ \mathrm{P}(X = 0) = \dots $$ } \end{enumerate} \begin{note} V předchozím případě jsme ale předpokládali, že se na libovolný koláč vejde libovolný počet rozinek. Jinak by totiž nebyl splněn předpoklad o nezávislosti na minulosti. \end{note} \begin{definition}[Vícerozměrná diskrétní hustota] Vícerozměrnou diskrétní hustotu definijeme jako \begin{equation} f_{\mathbb{X}} = \mathrm{P}\left( \cap_{j=1}^{n}\left\{ X_j = x_j \right\} \right) \end{equation} \end{definition} \begin{definition}[Multinomické rozdělení] Uvažujme měřitelný prostor $ \left( \Omega,\mathcal{A} \right) $, a nechť $ A_1,\dots,A_n \in \mathcal{A} $. Nechť dále platí \begin{enumerate} \item { $ A_i $ jsou disjunktní } \item { $ \sum_{i} A_i = \Omega $ } \item { $ \mathrm{P}(A_i) = p_i $ } \end{enumerate} Buď $ X_j $ počet opakování jevu jevu $ A_j $ v $ n $ pokusech. Přitom zřejmě platí $$ \sum_{j=1^{k}} \mathrm{P}(A_j) = n $$ Potom \begin{equation} f_{\mathbb{X}}(x) = \mathrm{P}\left(X_1 = x_1,\dots,X_k = x_k \right) = \frac{n!}{x_1! x_2! \cdots x_k!} p_1^{x_1}p_2^{x_2}\cdots p_k^{x_k} \end{equation} \end{definition} \begin{note} Značíme $$ \frac{n!}{x_1! x_2! \cdots x_k!} = { n \choose x_1! x_2! \cdots x_k! } $$ \end{note} Omezení tedy nutně je $$ 0 \leq x_1 \leq n $$ $$ 0 \leq x_2 \leq n - x_1 $$ $$ 0 \leq x_3 \leq n - x_1 - x_2 $$ $$ \vdots $$ $$ x_k = n - x_1 - x_2 - \cdots - x_{k-1} $$ Potom $$ \sum_{j=1}^{k} X_j = n $$