Součásti dokumentu 01PRA1
Zdrojový kód
%\wikiskriptum{01PRA1}
\section{Diskrétní náhodné veličiny}
\begin{definition}[Diskrétní náhodná veličina]
Náhodnou veličinu $ X $ nazýváme diskrétní, pokud obor hodnot $ \mathrm{R}_X $ je nejvýše spočetná množina,
tzn. pokud existuje taková posloupnost $ x_1,\dots,x_n,\dots $ že $ X^{-1}\{x_1,\dots,x_n,\dots\} = \Omega $.
Distribuční funkci diskrétní náhodné veličiny můžeme zapsat například jako
\begin{equation}
\mathrm{F}_X(x) = \mathrm{P}(X \leq x) = \sum_{m|x_m \leq x} \mathrm{P}(X = x_m) = \sum_{m=1}^{N,\infty}
\mathrm{P}(X = x_m) \mathbb{I}_{[x_m,+\infty]}(x)
\end{equation}
Diskrétní hustota pravděpodobnosti (frekvenční funkce) je funkce definována jako
\begin{equation}
f_X(x) = \left\{ \matrix{\mathrm{P}(X = x_k) &\ \ & X = x_k \cr 0 &\ \ & \textrm{ jinak }} \right.
\end{equation}
\end{definition}
\begin{note}
$ \mathrm{P}\left( X = x_k\right) $ můžeme označit jako $ p_k $. Přitom platí
$$ \sum_{k} p_k = 1 $$
\end{note}
\begin{definition}[Diracovo rozdělení]
Buď $ X $ náhodná veličina, a nechť existuje $ c \in \mathbb{R} $ takové, že
\begin{equation}
\matrix{\mathrm{P}\left( X = c \right) = 1 \cr
\mathrm{P}\left( X \neq c \right) = 0 }
\end{equation}
Značíme $X \sim \delta_c$.
\end{definition}
\begin{definition}[Alternativní/Bernoulliho rozdělení s parametrem p]
Nechť $p\in[0,1]$. Uvažujme náhodnou veličinu $ X $, která může nabývat pouze dvou hodnot, například $ 0,1 $, a dále nechť platí
\begin{equation}
\matrix{ \mathrm{P}(X = 1) = p \cr \mathrm{P}(X = 0) = 1 - p }
\end{equation}
Značíme $X \sim A(p)$.
\end{definition}
\begin{definition}[Binomické rozdělení]
Opakujme $ n $-krát experiment s náhodnou veličinou $ X $, která má alternativní rozdělení, přičemž uvažujeme
$ \mathrm{P}(A) = p $ (pravděpodobnost úspěchu) a tedy $ \mathrm{P}\left(A^{\mathbb{C}}\right) = 1 - p $
(pravděpodobnost neúspěchu). Počet příznivých jevů při $ n $ opakováních je potom \begin{equation} X =
\sum_{j=1}^{n} X_j \end{equation}
Značíme $X \sim Bi(n,p)$.
\end{definition}
Pro pravděpodobnost poté platí
$$ \mathrm{P}_n(X = k) = \mathrm{P}_n\left( \sum_{\pi(\hat{n})} \{X_{i_1} = 1, \dots, X_{i_k} =
1, X_{i_{k+1}} = 0, \dots, X_{i_{n}} = 0 \} \right) = $$
$$ = \sum_{\pi(\hat{n})} \mathrm{P}\left( X_{i_1} = 1,\dots,X_{i_k}=1,X_{i_{k+1}} = 0,\dots,X_{i_n} = 0
\right) = $$
$$ = {n \choose k} \prod_{i=1}^{k}\mathrm{P}(x_i = 1) \prod_{i=k+1}^{n} \mathrm{P}(x_i = 0) = {n \choose k}p^k
(1 - p)^{n-k} $$
Z binomické věty také vyplývá, že
$$ \sum_{k=0}^{n} {n \choose k} p^k (1-p)^{n-k} = (p + 1 - p)^n = 1 $$
\begin{example}
Uvažujme šachovou partii, ve které jsou dva stejně silní soupeři (pravděpodobnost výhry i prohry je $
\frac{1}{2} $). Rozhodněte, zda je pravděpodobnější
\begin{enumerate}
\item { vyhrát 3 partie ze 4, nebo 5 partií z 8. }
\item { vyhrát alespoň 3 partie ze 4, nebo alespoň 5 partií z 8. }
\end{enumerate}
\end{example}
\begin{enumerate}
\item {
$$ \mathrm{P}\left(X = 3 \right) = \mathrm{P}_4(3) = {4 \choose 3} \left(\frac{1}{2}\right)^{3} \left(
\frac{1}{2} \right) = \frac{1}{4} $$
$$ \mathrm{P}\left(X = 5 \right) = \mathrm{P}_8(5) = {8 \choose 5} \left( \frac{1}{2}\right)^{5}\left(
\frac{1}{2} \right) = \frac{7}{32} $$ }
\item {
$$ \mathrm{P}\left(X = 3 \vee X = 4 \right) = \mathrm{P}\left( X = 3 \right) + \mathrm{P}\left( X = 4
\right) \mathrm{P}_4(3) + \mathrm{P}_4(4) = $$
$$ \frac{1}{4} + {4 \choose 4} \left( \frac{1}{2} \right)^{4} = \frac{5}{16} $$
$$ \mathrm{P}\left( X = 5 \vee X = 7 \vee X = 8 \right) = \sum_{k=5}^{8} \mathrm{P}_8\left( k \right) = $$
$$ = \sum_{k=5}^{8} {8 \choose k} \left( \frac{1}{2} \right)^k \left( \frac{1}{2} \right)^{8-k} =
\frac{93}{256} $$ }
\end{enumerate}
\begin{definition}[Geometrické/Pascalovo rozdělení]
Uvažujme nekonečnou posloupnost pokusů s veličinou s alternativním rozdělením
$$ \mathrm{P}(A) = p $$
$$ \mathrm{P}\left(A^{\mathbb{C}}\right) = 1 - p $$
a buď $ X $ počet pokusů před prvním výskytem jevu $ A $. Platí, že
\begin{equation}
\mathrm{P}\left(X = k\right) = p (1-p)^k
\end{equation}
\end{definition}
Platí
$$ \sum_{k=0}^{\infty} p(1-p)^k = p \sum_{k=0}^{\infty} (1-p)^k = p \frac{1}{1 - (1 - p)} = 1 $$
\begin{definition}[Negativně binomické rozdělení]
Opakujme jev nekonečně krát, a nechť náhodná veličina $ Y $ značí počet neúspěchů před $ m $-tým úspěchem,
přičemž $ \mathrm{P}(A) = p $. Potom
$$ \mathrm{P}\left( Y = k \right) = {k + m - 1 \choose k } p^m (1 - p)^k $$
\end{definition}
\begin{definition}[Hypergeometrické rozdělení]
Uvažujme zásobníkový model, ve kterém je $ r $ červených a $ N - r $ bílých kuliček. Opakujme $ n $-krát tah
bez vracení, a jako náhodnou veličinu $ X $ uvažujme počet červených kuliček v $ n $-tici.
\begin{equation}
\mathrm{P}\left(X = x\right) = \frac{{r \choose x}{N - r \choose n - x}}{{N \choose n}}
\end{equation}
Značíme $X \sim Hyp(N,r,n)$.
\end{definition}
\begin{example}
Uvažujme rybník, ve kterém je $ N $ ryb, a nechť $ r $ z nich je označeno. Chytněme $ n $ ryb, a jako
náhodnou veličinu $ X $ uvažujme počet označených ryb mezi $ n $ chycenými. Jaká je statistika $ N $?
\end{example}
Chytíme $ n $ ryb, spočítáme označené a odhadneme $ N = \widehat{N} $, protože víme kolik je $ r $.
$$ \frac{r}{\widehat{N}} = \frac{x}{n} $$
$$ \widehat{N} = \frac{r}{x}n $$
\begin{theorem}
Pro $ N $ velká, $ \frac{n}{N} $ malá platí
$$ \mathrm{H}(N,r,n) \dot = \mathrm{B}_i \left(n,\frac{r}{N}\right) $$
\end{theorem}
\begin{definition}[Poissonovské rozdělení]
Říkáme, že náhodná veličina $ X: \Omega \rightarrow \mathbb{N}_0 $ má poissonovské rozdělení s parametrem $ \lambda > 0$, pokud
\begin{equation}
\mathrm{P}(X = x) = \frac{{\lambda}^{x}}{x!}e^{-\lambda} \quad x=0, 1, \dots
\end{equation}
Značíme $X \sim Po(\lambda)$
\end{definition}
\begin{theorem}[Poissonova]
Uvažujme posloupnost náhodných veličin $ X_n $ s binomickým rozdělením, $ X_n \sim B_i(n,p_n) $, a nechť $ np_n
\to \lambda $ (nebo $ np_n = \lambda $), $ \lambda > 0 $. Potom
\begin{equation}
\lim_{n \to \infty} \mathrm{P}_n (x) = \frac{{\lambda}^x}{x!}e^{-\lambda}
\end{equation}
\end{theorem}
\begin{proof}
\
$$ \lim_{n \to +\infty} \mathrm{P}_n(x) = \lim_{n \to +\infty} {n \choose x} p_n^x(1 - p_n)^{n-x} = \left\{
p_n = \frac{\lambda}{n} + o\left(\frac{1}{n}\right) \right\} = $$
$$ = \lim_{n \to +\infty} {n \choose x} \left( \frac{\lambda}{n} + o\left(\frac{1}{n}\right)\right)^x \left(1
- \frac{\lambda}{n} - o\left(\frac{1}{n}\right) \right)^{n-x} = $$
$$ = \lim_{n \to +\infty} \frac{\lambda^x}{x!} \underbrace{\frac{n(n-1)\cdots(n-x+1)}{n^x}}_{\to 1}
\ \underbrace{\left( 1 + n o\left(\frac{1}{n} \right) \right)^x}_{\to 1} $$
$$ \underbrace{\left( 1 - \frac{\lambda}{n} - o\left( \frac{1}{n}\right) \right)^{n-x}}_{\to e^{-\lambda}} =
\frac{\lambda^x}{x!} e^{-\lambda} $$
\end{proof}
\begin{note}
V předchozím důkazu se používají značky $o()$ a $O()$ definované:
\begin{description}
\item $$a_n = o(b_n) (n \rightarrow \infty) \iff \frac{a_n}{b_n} \rightarrow 0$$
\item $$a_n = O(b_n) \iff \exists k: \frac{a_n}{b_n} \leq k$$
\end{description}
\end{note}
\begin{theorem}[Zákon řídkých jevů]
Uvažujme jev $ A $ v čase $ t $ (se začátkem v $ t_0 = 0$). Počet výskytu jevu do času $ t $ označme jako $
X_t $. Nechť dále platí:
\begin{enumerate}
\item { $ X_{t+h} - X_t $ nezávisí na $ t $ }
\item { $ \mathrm{P}\left(\left( X_{t+h} - X_t\right)=1\right) = \lambda h + o(h) , \lambda > 0$, přičemž při
$ h \to 0+ $ platí
$$ \frac{o(h)}{h} \to 0 $$ }
\item { $ \mathrm{P}\left( X_{t+h} - X_t > 1 \right) = o(h) $ při $ h \to 0+ $ }
\item { Funkce $ p_k(t) = \mathrm{P}(X_t = k) $ je diferencovatelná v $ t $ pro všechna $ k \in
\mathbb{N}_0 $. }
\end{enumerate}
Potom
\begin{equation}
\mathrm{P}\left(X_t = k\right) = \frac{\left(\lambda t\right)^k}{k!}e^{-\lambda t}
\end{equation}
($ \lambda $ nazýváme intenzitou řídkého jevu).
\end{theorem}
\begin{proof}
\
$$ p_o(t+h) = \mathrm{P}\left( X_t = 0 \right) \mathrm{P}\left(X_{t+h} - X_t = 0\right) = p_0(t)\left(1 -
\lambda h + o(h)\right) $$
$$ \frac{\mathrm{d}p_0}{\mathrm{d}t}(t) = \lim_{h \to 0+} \frac{p_0(t+h) - p_0(t)}{h} = \lim_{h \to 0+}
\left( - \lambda p_0(t) + p_0(t) \frac{o(h)}{h} \right) = -\lambda p_0(t) $$
$$ p_k(t+h) = \sum_{j=0}^{k} \mathrm{P}\left( X_t = j \right) \mathrm{P}\left( X_{t+h} -X_t = k -
j \right) = $$
$$ = \sum_{j=0}^{k-2} \mathrm{P}\left( X_t = j \right) \underbrace{\mathrm{P}\left( X_{t+h} -X_t = k -
j \right)}_{o(h)} + \underbrace{\mathrm{P}(X_{t+h} - X_t = 1)}_{\lambda h + o(h)} p_{k-1}(t) + $$
$$ + \underbrace{\mathrm{P}(X_{t+h} - X_t = 0)}_{1 - \lambda h + o(h)}p_k(t) = \sum_{j=0}^{k-2} \mathrm{P}
\left( X_t = j \right) o(h) + $$ $$ + \mathrm{P}(X_t = k-1)(\lambda h + o(h)) + \mathrm{P}(X_t = k)(1 -
\lambda h + o(h)) $$ $$ \frac{\mathrm{d}p_k}{\mathrm{d}t}(t) = \lim_{h \to 0+} \frac{p_k(t+h) - p_k(t)}{h} =
\lambda p_{k-1}(t) - \lambda p_k(t) $$
Máme tedy soustavu lineárních diferenciálních rovnic
$$ p_0'(t) = -\lambda p_0(t) $$
$$ p_k'(t) = \lambda(p_{k-1}(t) - p_k(t)) $$
která je za počátečních podmínek
$$ p_0(0) = 1 $$
$$ p_k(0) = 0 $$
a po zavedení funkce $ q_k(t) = p_k(t) e^{\lambda t} $ řešitelná rekurentně.
\end{proof}
\begin{note}
Důležitými předpoklady v zákonu řídkých jevů jsou
\begin{enumerate}
\item { Nezávislost na minulosti. }
\item { Pravděpodobnost, že v $ X_{t+h} - X_t $ nastane právě jedna událost je zhruba lineární funkcí délky
intervalu. }
\end{enumerate}
\end{note}
\begin{example}[Příklad pro kuchaře]
Na zadělání $ 1000 $ koláčů dáme $ 10000 $ rozinek. Najděte rozdělení počtu rozinek v náhodně vybraném
koláči.
\begin{enumerate}
\item { Jaká je pravděpodobnost, že na koláči bude více než 5 rozinek? }
\item { Jaká je pravděpodobnost, že na koláči nebude žádná rozinka? }
\end{enumerate}
\end{example}
Vezměme libovolný koláč, ptejme se, zda je na něm $ n $-tá rozinka, a tento pokus opakujme $ 10000x $ (protože
právě tolik je rozinek). Každá rozinka může být na jednom z tisíce koláčů, a to se stejnou pravděpodobností,
proto
$$ p_k = \frac{1}{1000} $$
Jako $ X $ označme počet rozinek na koláči, přičemž $ \lambda = n \cdot p_k = 10 $. Potom dle zákona velkých
čísel platí
$$ \mathrm{P}_n(k) = \frac{\lambda^k}{k!}e^{-\lambda} = \frac{10^k}{k!}e^{-10}\ \ \ \ \ \ \ \ \forall k \in
\widehat{10000} $$
takže
\begin{enumerate}
\item { $$ \mathrm{P}(X > 5) = 1 - \mathrm{P}(X = 0) - \dots - \mathrm{P}(X = 5) \dot = 0,934 $$ }
\item { $$ \mathrm{P}(X = 0) = \dots $$ }
\end{enumerate}
\begin{note}
V předchozím případě jsme ale předpokládali, že se na libovolný koláč vejde libovolný počet rozinek. Jinak by
totiž nebyl splněn předpoklad o nezávislosti na minulosti.
\end{note}
\begin{definition}[Vícerozměrná diskrétní hustota]
Vícerozměrnou diskrétní hustotu definijeme jako
\begin{equation}
f_{\mathbb{X}} = \mathrm{P}\left( \cap_{j=1}^{n}\left\{ X_j = x_j \right\} \right)
\end{equation}
\end{definition}
\begin{definition}[Multinomické rozdělení]
Uvažujme měřitelný prostor $ \left( \Omega,\mathcal{A} \right) $, a nechť $ A_1,\dots,A_n \in \mathcal{A} $.
Nechť dále platí
\begin{enumerate}
\item { $ A_i $ jsou disjunktní }
\item { $ \sum_{i} A_i = \Omega $ }
\item { $ \mathrm{P}(A_i) = p_i $ }
\end{enumerate}
Buď $ X_j $ počet opakování jevu jevu $ A_j $ v $ n $ pokusech. Přitom zřejmě platí
$$ \sum_{j=1^{k}} \mathrm{P}(A_j) = n $$
Potom
\begin{equation}
f_{\mathbb{X}}(x) = \mathrm{P}\left(X_1 = x_1,\dots,X_k = x_k \right) = \frac{n!}{x_1! x_2! \cdots
x_k!} p_1^{x_1}p_2^{x_2}\cdots p_k^{x_k}
\end{equation}
\end{definition}
\begin{note}
Značíme
$$ \frac{n!}{x_1! x_2! \cdots x_k!} = { n \choose x_1! x_2! \cdots x_k! } $$
\end{note}
Omezení tedy nutně je
$$ 0 \leq x_1 \leq n $$
$$ 0 \leq x_2 \leq n - x_1 $$
$$ 0 \leq x_3 \leq n - x_1 - x_2 $$
$$ \vdots $$
$$ x_k = n - x_1 - x_2 - \cdots - x_{k-1} $$
Potom
$$ \sum_{j=1}^{k} X_j = n $$