01MIP:Kapitola4: Porovnání verzí
Z WikiSkripta FJFI ČVUT v Praze
(Založena prázdná stránka) |
|||
Řádka 1: | Řádka 1: | ||
+ | %\wikiskriptum{01MIP} | ||
+ | % | ||
+ | \chapter{Hustota pravděpodobnosti} | ||
+ | \section{Diskrétní náhodné veličiny} | ||
+ | \begin{defi} | ||
+ | Nechť $ \xx = (X_1, \ldots, X_n) $ je náhodná veličina s~rozdělením $ P^{\xx} $. Nazveme ji \textbf{diskrétní}, právě když $ \ran \xx = \lbrace \mx_j \rbrace_{j=1}^{m, +\infty}$, neboli když je její obor hodnot nejvýše spočetný. | ||
+ | |||
+ | Položme dále $ p_k := P(\xx = \mx_k) $. V~tom je ale ukryto $ n $ podmínek, neboť bychom správně měli psát $ P(\xx = \mx_k) = P(X_1 = x^1_k, \ldots, X_n = x^n_k) $, kde $ x^j_k $ je $ j $-tá složka vektoru $ \mx_k $. Definujme nyní \textbf{hustotu pravděpodobnosti} náhodné veličiny $ \xx $ vztahem | ||
+ | \begin{equation*} | ||
+ | f_{\xx}(\mx) = | ||
+ | \begin{cases} | ||
+ | p_k &\text{ pro } \mx = \mx_k,\\ | ||
+ | 0 &\text{ jinak.} | ||
+ | \end{cases} | ||
+ | \end{equation*} | ||
+ | Říká nám, "jak často nastává $ \mx_k $", proto se jí někdy říká \emph{frekvenční funkce}. | ||
+ | \end{defi} | ||
+ | \begin{pozn} | ||
+ | Pokud je $ \xx $ diskrétní, pak $ p_k = P(\xx = \mx_k) \stackrel{\ref{pozn-distrib-fce}}{=} F(\mx_k) - F_{\xx}(\mx_{k-}) \neq 0$. Kdyby tomu tak nebylo, pak by byla $ F_{\xx}$ spojitá v~bodě $ \mx_k $, což ale nemůže nastat, jelikož je $ \ran{\xx} $ nejvýše spočetný. | ||
+ | |||
+ | Protože může distribuční funkce nabývat pouze spočetně mnoha hodnot, můžeme učinit následující pozorování: | ||
+ | \begin{itemize} | ||
+ | \item V $ \mathbb{R} $: $ F_X(x) = P(X \leq x) = \sum_{x_k\leq x}P(X = x_k) = \sum_{k=1}^{n,+\infty} P(X = x_k)\chi_{[x_k, +\infty)}(x)$, kde $ \chi $ je charakteristická funkce. | ||
+ | \item $ (\forall\, k \in \mathbb{N})(p_k \in [0,1]) $. | ||
+ | \item $ \sum_{k=1}^{n,+\infty}p_k = P(\Omega) = 1 $. | ||
+ | \item $ (\forall \, k \in \mathbb{N})\bigl(f(x_k) \in [0,1] \wedge \sum_{k=1}^{n,+\infty}f_X(x_k) = 1 \bigr)$. Hustota pravděpodobnosti je znormována na jedničku. | ||
+ | \end{itemize} | ||
+ | \end{pozn} | ||
+ | |||
+ | \begin{priklad} | ||
+ | Ukažme si nyní několik konkrétních příkladů rozdělení diskrétních veličin. | ||
+ | |||
+ | \begin{enumerate} | ||
+ | \item \textbf{Diracovo} $ \delta $-rozdělení je nejjednodušším příkladem. Značíme ho $\delta_c $ a definujeme následovně: $ X \sim \delta_c \Leftrightarrow P(X = c) = 1 $. | ||
+ | \item \textbf{Rovnoměrné} rozdělení $ X $ na $ \{x_1, \ldots, x_m\} $ definujeme takto: | ||
+ | \begin{equation*} | ||
+ | \left( \forall k \in \hat{m}\right)\left(P(X = x_k) = \frac{1}{m}\right) | ||
+ | \end{equation*} | ||
+ | a píšeme $ X \sim \mathcal{U}_{\{x_1, \ldots, x_n\}} $, kde $ \mathcal{U} $ znamená uniformní (rovnoměrné). | ||
+ | \item \textbf{Poissonovo}\footnote{Siméon Denis Poisson (1781--1840), čti [poason].} rozdělení pro řídké jevy je posledním diskrétním rozdělením, které zde uvedeme. K~tomu, abychom ho mohli definovat, bude ovšem potřeba vyslovit a dokázat tzv.~\emph{zákon řídkých jevů}. | ||
+ | \end{enumerate} | ||
+ | \end{priklad} | ||
+ | |||
+ | \begin{veta}[Zákon řídkých jevů] | ||
+ | Buď $ t \geq 0$ čas, $ t_0 = 0 $, $ h >0 $. Nechť $ A $ je sledovaný jev a $ X_t $ je náhodná veličina vyjadřující počet událostí (příznivých jevů), kdy jev $ A $ nastal do času $ t $. | ||
+ | Nechť dále platí: | ||
+ | \begin{enumerate} | ||
+ | \item\label{zrj1} Hodnota $ X_{t+h} - X_t $ nezávisí na $ X_t $. Jinými slovy: počet jevů mezi časy $ t $ a $ t+h $ nezávisí na tom, co se událo v~minulosti. | ||
+ | \item\label{zrj2} $ P\left(X_{t+h} - X_t = 1\right) = \lambda \cdot h + o(h) $ při $ h \rightarrow 0_+ $, kde $ \lambda > 0 $ a $ o(h) $ je člen, který jde rychleji k~nule než $ h $, tj. $ \lim_{h \rightarrow 0_+} \frac{o(h)}{h} = 0 $. Tato podmínka vyjadřuje skutečnost, že pravděpodobnost, že jev $ A $ nastane právě jednou v~časovém intervalu o~délce $ h $, je až na zbytek $ o(h) $ přímo úměrná délce tohoto intervalu. | ||
+ | \item\label{zrj3} $ P\left(X_{t+h} - X_t \geq 2\right) = o(h) $, tj. jevy jsou \emph{řídké}. Pravděpodobnost, že v~intervalu délky~$ h $ nastanou alespoň dva jevy, je malá. | ||
+ | \item\label{zrj4} Funkce $ p_k(t) = P(X_t = k) $ je diferencovatelná vzhledem k $ t $ pro každé $ k \in \mathbb{N} $. Tento bod je důležitý spíše pro samotný důkaz věty. | ||
+ | \end{enumerate} | ||
+ | Pak platí: | ||
+ | \begin{equation} | ||
+ | \left(\forall\, t > 0\right)\left(\forall\, k \in \mathbb{N}\right)\Bigl(P(X_t = k) = \frac{\left( \lambda t\right)^k}{k!} \mathrm{e}^{-\lambda t}\Bigr). | ||
+ | \end{equation} | ||
+ | \end{veta} | ||
+ | \begin{proof} | ||
+ | $ $ | ||
+ | \begin{enumerate}[(I)] | ||
+ | \item Nejdříve upravme funkci $ p_k(t+h) $ pro $ k = 0 $. | ||
+ | \begin{align*} | ||
+ | p_0(t+h) = P(X_{t+h} = 0) &= P(X_t = 0) \cdot P\left(X_{t+h} - X_t = 0\right) \\ | ||
+ | & \stackrel{\ref{zrj2}}{=} p_0(t) \cdot \left(1-\lambda h - o(h) - o(h)\right) | ||
+ | \end{align*} | ||
+ | Pravděpodobnost $ P\left(X_{t+h} - X_t = 0\right)$ jsme vyjádřili pomocí pravděpodobnosti komplementárního jevu, tedy že nastane právě jeden jev či více jevů. Jednoduchou ekvivalentní úpravou (jelikož $ h \neq 0 $) dostaneme: | ||
+ | \begin{equation*} | ||
+ | \frac{p_0(t+h) - p_0(t)}{h} = -\lambda p_0(t) - \frac{o(h)}{h} | ||
+ | \end{equation*} | ||
+ | Rozdíl členů $ o(h) $ můžeme sloučit do jednoho, protože na jejich konvergenci k~nule rychleji než $ h $ to nic nemění. Nyní pouze provedeme limitní přechod pro $ h \rightarrow 0_+ $ a získáme lineární diferenciální rovnici 1. řádu: | ||
+ | \begin{equation} | ||
+ | p'_0(t) = - \lambda p_0(t). | ||
+ | \end{equation} | ||
+ | Derivace $ p'_0(t) $ jistě existuje a je konečná dle předpokladu \ref{zrj4}. | ||
+ | \item Nyní analogicky rozepišme funkce $ p_k(t+h) $ pro $ k \geq 1 $. | ||
+ | \begin{align*} | ||
+ | p_k(t+h) &= P(X_{t+h} = k) \\ | ||
+ | &= \sum_{j=0}^{k} P(X_t = j)P(X_{t+h} - X_t = k-j) \\ | ||
+ | &\!\!\!\stackrel{\ref{zrj2} \text{ a } \ref{zrj3}}{=} \sum_{j=0}^{k-2} p_j(t) o(h) | ||
+ | + p_{k-1}(t)\bigl(\underbrace{\lambda h + o(h)}_{\text{dle \ref{zrj2}}}\bigr) + p_k(t)\bigl(1 - \lambda h - o(h) - o(h)\bigr). | ||
+ | \end{align*} | ||
+ | Stejně jako v bodě (I) upravíme rovnici tak, abychom měli vlevo připravenou derivaci $ p_k(t) $: | ||
+ | \begin{equation*} | ||
+ | \frac{p_k(t+h) - p_k(t)}{h} = \sum_{j=0}^{k-2} p_j(t) \frac{o(h)}{h} + \lambda p_{k-1}(t) + p_{k-1}(t)\frac{o(h)}{h} - \lambda p_k(t) - p_k(t)\frac{o(h)}{h}. | ||
+ | \end{equation*} | ||
+ | Po limitním přechodu $ h \rightarrow 0_+ $ dostáváme diferenciální rovnice | ||
+ | \begin{equation} | ||
+ | \forall k \geq 1\colon \quad p'_k(t) = \lambda p_{k-1}(t) - \lambda p_k(t). | ||
+ | \end{equation} | ||
+ | Dohromady máme tedy soustavu spočetně mnoha diferenciálních rovnic. Její řešení je tvaru $ p_k(t) = P(X_t = k) = \frac{\left( \lambda t\right)^k}{k!} \mathrm{e}^{-\lambda t} $. Přesvědčíme se o~tom pouhým dosazením. | ||
+ | \end{enumerate} | ||
+ | Poissonovo rozdělení dobře popisuje počet událostí za \emph{jednotku} času, např. počet částic emitovaných radioaktivním izotopem za sekundu či počet hovorů na ústředně za hodinu.\qedhere | ||
+ | \end{proof} | ||
+ | |||
+ | \begin{defi}\label{def-podm-hustota-diskr} | ||
+ | Buď nyní $ \xx = (X,Y) $ náhodná veličina s diskrétním rozdělením. \textbf{Podmíněnou hustotu pravděpodobnosti} náhodné veličiny $ \xx $ za podmínky, že nastane jev $ Y = y $, definujeme $\forall x \in \ran X$ předpisem | ||
+ | \begin{equation}\label{eq-podm-hustota-pp} | ||
+ | f_{X\mid Y}(x \mid y) := \frac{f_{(X,Y)}(x,y)}{f_Y(y)}, | ||
+ | \end{equation} | ||
+ | je-li $ y \in \ran Y $ a $ f_Y(y) \neq 0 $. | ||
+ | \end{defi} | ||
+ | |||
+ | \begin{pozn} | ||
+ | $ $ | ||
+ | \begin{itemize} | ||
+ | \item Správně bychom měli podmíněnou hustotu značit $ f_{X\mid Y = y}(x) $, odkud je lépe vidět, že $ y $ je pevný parametr. Jak už to ale bývá, logičtější varianta se neuchytila. | ||
+ | \item Vztah \eqref{eq-podm-hustota-pp} by nám měl nápadně připomínat definici podmíněné pravděpodobnosti \eqref{podm-pp}. Skutečně: Budeme-li považovat rovnosti $ X = x $, resp. $ Y = y $ za jevy\footnote{Toto přiřazení je v~diskrétním modelu možné.} $ A $, resp. $ B $, obdržíme | ||
+ | \begin{equation*} | ||
+ | \frac{f_{(X,Y)}(x,y)}{f_Y(y)} = \frac{P(X = x, Y = y)}{P(Y=y)} = \frac{P(A \cap B)}{P(B)} = P(A \mid B) = P(X = x \mid Y= y). | ||
+ | \end{equation*} | ||
+ | \end{itemize} | ||
+ | \end{pozn} | ||
+ | |||
+ | \section{Spojité náhodné veličiny} | ||
+ | Odstavec o~spojitých náhodných veličinách začneme větou z~teorie míry, jejíž tvrzení je velice obecné, ale speciální volba nám umožní zavést zásadní pojem hustoty pravděpodobnosti spojité veličiny. Nejdříve však musíme definovat $ \sigma $-finitní míry a jejich absolutní spojitost. | ||
+ | |||
+ | \begin{defi}\label{def-sigma-finitnost} | ||
+ | Nechť $ \lambda $ je obecná míra na $ (\mathbb{R}^n, \bb_n) $. Nazveme ji $ \sigma $\textbf{-finitní} (též $ \sigma $-konečná) právě tehdy, když | ||
+ | \begin{equation*} | ||
+ | \Bigl(\exists\,(B_j)_{j=1}^{+\infty} \in \bb_n,\ \bigcup_{j=1}^{+\infty} B_j = \mathbb{R}^n \Bigr)(\forall\, j \in \mathbb{N})(\lambda(B_j) < +\infty). | ||
+ | \end{equation*} | ||
+ | Vezměme například míru Lebesgueovu $ \lambda_{\text{L}} $. Jak známo, není konečná ($ \lambda_{\text{L}}(\mathbb{R}) = +\infty $), ale je sigma-\-finitní, neboť dovedeme reálnou osu pokrýt spočetně mnoha částečnými intervaly, jejichž míra konečná je. Jako příklad poslouží pokrytí $ \mathbb{R} = \bigcup_{j=-\infty}^{+\infty} (j,~j+1]$, přičemž platí $ \lambda_{\text{L}}\bigl((j, j+1]\bigr) = 1 $. Analogicky je $ \lambda_{\text{L}} $ $ \sigma $-finitní na $ \mathbb{R}^n $. | ||
+ | \end{defi} | ||
+ | |||
+ | \begin{defi}\label{def-abs-spoj} | ||
+ | Míra $ \nu $ je \textbf{absolutně spojitá} vzhledem k~míře $ \lambda $ právě tehdy, když | ||
+ | \begin{equation}\label{eq-def-abs-spoj} | ||
+ | (\forall\, B \in \bb_n)(\lambda(B) = 0 \Rightarrow \nu(B) = 0), | ||
+ | \end{equation} | ||
+ | značeno $ \nu \ll \lambda $. Je-li navíc míra $ \nu $ \emph{konečná}, platí následující ekvivalence: | ||
+ | \begin{equation}\label{eq-def-abs-spoj-konecna} | ||
+ | \nu \ll \lambda \Longleftrightarrow (\forall\, \varepsilon > 0)(\exists\, \delta > 0)(\forall B \in \bb_n)(\lambda(B) < \delta \Rightarrow \nu(B) < \varepsilon). | ||
+ | \end{equation} | ||
+ | Též říkáme, že "$ \lambda $ dominuje míře $ \nu $". Pro neomezenou míru $ \nu $ nejsou tyto výroky ekvivalentní.\footnote{Na \url{https://math.stackexchange.com/questions/1691328/question-on-equivalent-ideas-of-absolute-continuity-of-measures?noredirect=1\&lq=1} či na \\ \url{https://math.stackexchange.com/questions/780824/equivalent-ideas-of-absolute-continuity-of-measures} najde čtenář protipříklad, kde pro neomezenou míru $ \nu $ neplatí implikace ve směru ($ \Rightarrow $).} | ||
+ | \end{defi} | ||
+ | |||
+ | \begin{pozn} | ||
+ | Dr.~Kůs na přednášce definoval absolutní spojitost vztahem \eqref{eq-def-abs-spoj-konecna}. Nám to však nedalo a~po porovnání s~literaturou jsme zjistili, že ostatní autoři\footnote{"Ostatními autory" rozumíme internet a jeho nesčetné množství zdrojů.} ji definují přísnější podmínkou~\eqref{eq-def-abs-spoj}. Budeme tedy světoví a~absolutní spojitostí budeme rozumět splnění podmínky \eqref{eq-def-abs-spoj}. | ||
+ | \end{pozn} | ||
+ | \begin{veta}[Radonova--Nikodymova\footnote{Johann Radon (1887--1956); Otto Nikodym (1887--1974).}]\label{v-radon-nikodym} | ||
+ | Buďte $ \lambda,\ \nu $ dvě $ \sigma $-finitní míry na prostoru $ (\mathbb{R}^n, \bb_n) $. Nechť $ \nu $ je absolutně spojitá vzhledem k~míře $ \lambda $. Potom platí: | ||
+ | \begin{equation} | ||
+ | \left(\exists^1\, f\colon \mathbb{R}^n \rightarrow \mathbb{R}_0^+, f \text{ borelovsky měř.}\right)(\forall\, B \in \bb_n)\left(\nu(B) = \int_{B} f \dd\lambda \right), | ||
+ | \end{equation} | ||
+ | kde $ f $ je jednoznačná vzhledem k~$ \lambda $ \emph{až na množinu míry nula}. Tuto funkci nazveme \textbf{derivací} míry~$ \nu $ vzhledem k~míře $ \lambda $ a píšeme $ f = \diff{\nu}{\lambda} $. | ||
+ | \end{veta} | ||
+ | \begin{proof} | ||
+ | $ $ | ||
+ | \begin{enumerate}[a)] | ||
+ | \item \textbf{Jednoznačnost.} Nechť existují dvě funkce splňující tvrzení věty, tj. $ \int_{B}f\dd\lambda = \nu(B) = \int_{B} g \dd\lambda $. Zvolme libovolně $ \varepsilon > 0 $, $ \tilde{\varepsilon} > 0 $ a sestrojme množiny | ||
+ | \begin{align*} | ||
+ | B_\varepsilon &:= \lbrace \mx \in \mathbb{R}^n \mid f(\mx) + \varepsilon \leq g(\mx) \rbrace, \\ | ||
+ | B_{\tilde{\varepsilon}} &:= \lbrace \mx \in \mathbb{R}^n \mid f(\mx) - \tilde{\varepsilon} \geq g(\mx) \rbrace. | ||
+ | \end{align*} | ||
+ | Jako obvykle bychom chtěli ukázat rovnost funkcí $ f $ a $ g $, a sice skoro všude (s.~v.). Naším cílem tedy je ověřit, že tyto množiny mají nulovou míru. Integrujme první nerovnost přes $ B_\varepsilon $ (zůstane zachována): | ||
+ | \begin{align*} | ||
+ | \int_{B_\varepsilon} f \dd\lambda + \varepsilon\int_{B_\varepsilon}\dd\lambda &\leq \int_{B_\varepsilon} g \dd\lambda\\ | ||
+ | \nu(B_\varepsilon) + \varepsilon\underbrace{\lambda(B_\varepsilon)}_{\geq 0} &\leq \nu(B_\varepsilon). | ||
+ | \end{align*} | ||
+ | Má-li nerovnost platit, kvůli kladnosti $ \varepsilon $ není jiná možnost, než aby $ \lambda(B_\varepsilon) = 0$. Integrací druhé nerovnosti dojdeme ke vztahu | ||
+ | \begin{equation*} | ||
+ | \nu(B_{\tilde{\varepsilon}}) - \tilde{\varepsilon}\underbrace{\lambda(B_{\tilde{\varepsilon}})}_{\geq 0} \geq \nu(B_{\tilde{\varepsilon}}), | ||
+ | \end{equation*} | ||
+ | z~něhož nutně vyplyne $ \lambda(B_{\tilde{\varepsilon}}) = 0 $, a to pro všechna $ \varepsilon, \tilde{\varepsilon} > 0 $. To ale znamená, že $f(\mx) = g(\mx) $ skoro všude. | ||
+ | \item \textbf{Existence.} Nebudeme dokazovat existenci funkce $ f $ v~celé délce. Čtenář nejspíš od dr.~Kůse dostal kopii důkazu Johna von~Neumanna, který se vydal funkcionálně-analytickou cestou. My zde naznačíme schéma jeho postupu. | ||
+ | |||
+ | Prvně je potřeba vyslovit následující lemma. | ||
+ | \begin{lemma}[Lebesgueova dekompozice konečné míry]\label{lemma-lebesgue} | ||
+ | Mějme dvě \emph{konečné} míry $ \nu $ a $ \lambda $, $ B \in \bb_n $. Potom platí: | ||
+ | \begin{equation*} | ||
+ | \left(\exists\, f\colon \mathbb{R}^n \rightarrow \mathbb{R}_0^+,\ f \text{ borelovsky měř.}\right)\left(\exists\, C \in \bb_n,\ \lambda(C) = 0\right)\Bigl(\nu(B) = \int_{B} f \dd\lambda + \nu(B \cap C) \Bigr). | ||
+ | \end{equation*} | ||
+ | \end{lemma} | ||
+ | V~důkazu lemmatu se využívá zásadního tvrzení, s~nímž jsme se setkali již v~LAL2, a sice Rieszovy\footnote{Frigyes Riesz (1880--1956), čti [friděš rís].} věty o reprezentaci: \emph{Nechť $ \mathcal{H} $ je Hilbertův prostor, $ \mathcal{H}^{*} $ prostor k~němu duální a $ f \in \mathcal{H}^{*}$ je omezený lineární funkcionál. Pak $ (\exists^1 y \in \mathcal{H})(\forall x \in \mathcal{H})(f(x) = \langle x \mid y \rangle ) $}. Ke konstrukci funkce~$ f $ z~tvrzení lemmatu se použije právě tohoto jedinečného $ y $ z~Rieszovy věty, ale dále v~jeho důkazu nebudeme pokračovat. | ||
+ | |||
+ | Nyní vezměme míry $ \nu$ a $ \lambda $ z~předpokladu věty. Zvolme $ \mathcal{H} = L^2(\mathbb{R}^n, \pi)$, kde $ L^2(\mathbb{R}^n, \pi) $ je prostor funkcí integrabilních s~kvadrátem vzhledem k~míře $ \pi$.\footnote{$ L^2 $ je jako jediný z~$ L^p $ prostorů Hilbertův.} Položme $ \pi = \lambda + \nu $. O~mírách $ \lambda,~\nu $ víme, že jsou $ \sigma $-finitní a že $ \nu \ll \lambda $. Máme tedy $ \sigma $-konečnou míru~$ \pi $, ale do lemmatu \ref{lemma-lebesgue} potřebujeme, aby byla \emph{konečná}. Sigma-finitnost $ \pi $ podle definice \ref{def-sigma-finitnost} zaručuje existenci pokrytí $ \bigcup_{1}^{+\infty}B_j = \mathbb{R}^n $ a navíc $ (\forall\, j \in \mathbb{N})(\pi(B_j) < +\infty) $, takže konečnost míry $ \pi $ dovedeme zařídit na každé pokrývací množině $ B_j \in \bb_n $. Na nich aplikujeme lemma \ref{lemma-lebesgue}, tedy | ||
+ | \begin{equation*} | ||
+ | (\forall\, j \in \mathbb{N})(\exists\, f_j \geq 0)(\exists\, C_j \in \bb_n,\ \lambda(C_j) = 0)\Bigl(\nu(B) = \int_B f_j \dd\lambda + \nu(B \cap C_j )\Bigr), | ||
+ | \end{equation*} | ||
+ | kde $ B \subset B_j \in \bb_n $. Každé $ f_j $ bylo zkonstruováno pomocí Rieszovy věty. Naším cílem je odstranit "zbytek" za integrálem ve vztahu výše. Zkusme, zda naším kandidátem na finální funkci~$ f $ není například | ||
+ | \begin{equation*} | ||
+ | f := \sum_{j=1}^{+\infty}\frac{1}{\lambda(B_j)}f_j\chi_{B_j}. | ||
+ | \end{equation*} | ||
+ | Pokrytí umíme volit disjunktní a složené z~množin kladné míry. Nechť je dále $ C = \bigcup_{1}^{+\infty}C_j $. Jelikož jde o~spočetné sjednocení množin míry nula, je i~$ \lambda(C) = 0$. | ||
+ | |||
+ | Víme, že $ \nu \ll \lambda $. To podle definice \eqref{eq-def-abs-spoj} znamená: $(\forall C \in \bb_n)(\lambda(C) = 0 \Rightarrow \nu(C) = 0 )$. Odhadněme $ 0 \leq \nu(B \cap C) \leq \nu(C) $, ale díky implikaci o řádek výše je $ \nu(C) = 0 $, a tedy $ \nu(B \cap C) = 0 $. Tímto jsme se zbavili zbytku v~dekompozičním lemmatu a obdrželi jsme tvrzení Radonovy--Nikodymovy věty.\qedhere | ||
+ | \end{enumerate} | ||
+ | \end{proof} | ||
+ | |||
+ | \begin{pozn} | ||
+ | Není pravdou, že absolutní spojitost míry $ \nu $ vzhledem k~$ \sigma $-finitní míře $ \lambda $ implikuje $ \sigma $-konečnost míry $ \nu $! Jednoduchý protipříklad je k~nalezení zde: \url{https://math.stackexchange.com/questions/1576894/sigma-finiteness-and-absolutely-continuous-measures?rq=1}. Proto nelze v~R--N větě předpokládat pouze $ \sigma $-konečnost míry $ \lambda $ a $ \nu \ll \lambda $. Dovolujeme si tedy dr.~Kůsovi oponovat a~předpokládáme $ \sigma $-finitnost jak u~míry $ \lambda $, tak u~míry~$ \nu $ (což je ve shodě s~ostatní literaturou). | ||
+ | \end{pozn} | ||
+ | |||
+ | Zaloví-li čtenář důkladně v~paměti, uvědomí si, že obrácená implikace v~R--N větě je takřka totožná s~větou o~absolutní spojitosti Lebesgueova integrálu z~MAA4.\footnote{Viz \emph{Turistický průvodce MAA4}, věta 29.8. Podrobněji pak ve skriptech \emph{Integrální počet} od L.~Vrány, věta 10.6.} | ||
+ | \begin{veta}[Absolutní spojitost integrálu] Buď $ f\colon \mathbb{R}^n \rightarrow \mathbb{R}$ nezáporná borelovsky měřitelná funkce, $ f \in L^1(\mathbb{R}^n, \bb_n, \lambda) $. Pro $ B \in \bb_n $ definujme funkci $ \nu(B) := \int_{B}f \dd\lambda$. Pak $ \nu \ll \lambda $, neboli | ||
+ | \begin{equation*} | ||
+ | (\forall\,\varepsilon > 0)(\exists\, \delta > 0)(\forall B \in \bb_n)\Bigl(\lambda(B) < \delta \Rightarrow \int_{B}f \dd\lambda < \varepsilon\Bigr). | ||
+ | \end{equation*} | ||
+ | \end{veta} | ||
+ | Takto definovaná míra $ \nu $ je díky integrabilitě $ f $ dokonce konečná, proto pro ni platí vztah $ \eqref{eq-def-abs-spoj-konecna} $ i~ve směru $ (\Rightarrow) $. | ||
+ | |||
+ | Spojením dvou předchozích tvrzení dostáváme ekvivalenci: | ||
+ | \begin{veta} | ||
+ | Nechť $ \lambda $ a $ \nu $ jsou $ \sigma $-finitní míry. Pak platí: | ||
+ | \begin{equation*} | ||
+ | \nu \ll \lambda \Longleftrightarrow \left(\exists^1\, f\colon \mathbb{R}^n \rightarrow \mathbb{R}_0^+, f \text{ borelovsky měř.}\right)(\forall\, B \in \bb_n)\Bigl(\nu(B) = \int_{B} f \dd\lambda \Bigr), | ||
+ | \end{equation*} | ||
+ | přičemž funkce $ f $ je dána jednoznačně až na množinu míry nula. | ||
+ | \end{veta} | ||
+ | |||
+ | Nyní se konečně dozvíme, co pro nás obecný výsledek Radonovy--Nikodymovy věty znamená v~teorii pravděpodobnosti. Za míru $ \nu $ totiž můžeme speciálně vzít rozdělení náhodné veličiny (které je jistě mírou, a dokonce konečnou). Výsledkem je následující tvrzení. | ||
+ | |||
+ | \begin{dusl}[Kritérium absolutní spojitosti rozdělení]\label{v-abs-spoj-rozdeleni} | ||
+ | Nechť $ \xx\colon (\Omega, \sa, P) \rightarrow (\mathbb{R}^n, \bb_n) $ je náhodná veličina s~rozdělením $ P^{\xx} $. Nechť $ \lambda $ je $ \sigma $-konečná míra a položme $ P^{\xx} := \nu $ z~R--N věty. Potom platí: | ||
+ | \begin{equation}\label{eq-abs-spoj-rozdeleni} | ||
+ | P^{\xx} \ll \lambda \Longleftrightarrow \left(\exists^1\, f_{\xx}\colon \mathbb{R}^n \rightarrow \mathbb{R}_0^+, f_{\xx} \text{ borelovsky měř.}\right)(\forall\, B \in \bb_n)\Bigl(P^{\xx}(B) = \int_{B} f_{\xx} \dd\lambda \Bigr), | ||
+ | \end{equation} | ||
+ | kde $ f_{\xx} $ je jednoznačná až na množinu nulové míry. | ||
+ | \end{dusl} | ||
+ | |||
+ | \begin{defi}[Spojité rozdělení] | ||
+ | Řekneme, že náhodná veličina $ \xx $ má \textbf{absolutně spojité rozdělení} vzhledem k~$ \sigma $-finitní míře~$ \lambda $, právě když $ P^{\xx} \ll \lambda $. Skoro všude jednoznačnou funkci~$ f_{\xx} $ z~věty \ref{v-abs-spoj-rozdeleni} nazveme \textbf{hustotou pravděpodobnosti} náhodné veličiny~$ \xx $, značíme $ f_{\xx} = \dd P^{\xx}/\dd \lambda $. | ||
+ | \end{defi} | ||
+ | |||
+ | \begin{pozn} | ||
+ | Umíme-li spočítat integrál v~\eqref{eq-abs-spoj-rozdeleni}, pak automaticky dovedeme určit pravděpodobnost na libovolném intervalu. Zvolme nyní $ \lambda $ Lebesgueovu. Pro $ \bm{b} \in \mathbb{R}^{n} $ můžeme při speciální volbě $ B = \bigtimes_{j=1}^n(-\infty, b_j]$ psát | ||
+ | \begin{equation*} | ||
+ | P(\xx \leq \bm{b}) = P^{\xx}\Bigl(\bigtimes_{j=1}^n(-\infty, b_j)\Bigr) \stackrel{\eqref{eq-abs-spoj-rozdeleni}}{=} \int_B f_{\xx}(\mx) \dd\mx \stackrel{\text{Fub}}{=} \int_{-\infty}^{b_1} \cdots \int_{-\infty}^{b_n} f_{\xx}(\mx) \dd x_1 \cdots \dd x_n = F_{\xx}(\bm{b}). | ||
+ | \end{equation*} | ||
+ | Podobně můžeme spočítat například | ||
+ | \begin{equation*} | ||
+ | P(\bm{a} < \xx \leq \bm{b}) = \int_{a_1}^{b_1} \cdots \int_{a_n}^{b_n} f_{\xx}(\mx) \dd x_1 \cdots \dd x_n. | ||
+ | \end{equation*} | ||
+ | \end{pozn} | ||
+ | |||
+ | Ověřovat podmínku $ \eqref{eq-abs-spoj-rozdeleni} $ pro všechny borelovské množiny by bylo příliš zdlouhavé a~nepraktické. Následující věta poskytuje ekvivalent k~tvrzení \ref{v-abs-spoj-rozdeleni}, ale pro mnohem užší skupinu množin, konkrétně pro množiny typu $ \bigtimes_{j=1}^n(-\infty, x_j] $, tj. ze systému $ \eqref{t1} $. | ||
+ | |||
+ | \begin{veta}[Ekvivalentní definice ASR]\label{v-ekviv-def-ASR} | ||
+ | Buď $ \xx $ náhodná veličina s~rozdělením $ P^{\xx} $ (dále už jen $ \xx \sim P^{\xx} $) a nechť $ \lambda $ je $ \sigma $-finitní míra. Potom platí následující nutná a postačující podmínka absolutní spojitosti rozdělení veličiny $ \xx $: | ||
+ | \begin{equation*} | ||
+ | P^{\xx} \ll \lambda \Longleftrightarrow \left(\exists^1\, f_{\xx}\colon \mathbb{R}^n \rightarrow \mathbb{R}_0^+, f_{\xx} \text{ borelovsky měř.}\right)(\forall\, \mx \in \mathbb{R}^n)\Bigl(F_{\xx}(\mx) = \int_{-\infty}^{x_1} \cdots \int_{-\infty}^{x_n} f_{\xx}(\bm{t}) \dd \bm{t} \Bigr). | ||
+ | \end{equation*} | ||
+ | Srovnej s~\eqref{eq-abs-spoj-rozdeleni}. | ||
+ | \end{veta} | ||
+ | \begin{proof} | ||
+ | Dokažme dvě implikace. | ||
+ | \begin{itemize} | ||
+ | \item[$(\Rightarrow)$] Tento směr platí dokonce obecně (jak tvrdí R--N věta \ref{v-radon-nikodym}), tím spíše pro tento speciální typ borelovských množin. | ||
+ | \item[$ (\Leftarrow) $] Mějme funkci $ f_{\xx} $ danou tvrzením věty. Jediné, co máme k~dispozici, je vztah $ \eqref{eq-abs-spoj-rozdeleni} $. Naším cílem bude pomocí funkce $ f_{\xx} $ sestrojit jistou míru $ P' $, o~níž potom dokážeme, že je rovna~$ P^{\xx} $. | ||
+ | |||
+ | Pro všechny $ B \in \bb_n $ definujme funkci $ P' $ vztahem $ P'(B) := \int_B f_{\xx}(\mx) \dd \mx $ (pro naše účely volíme Lebesgueovu míru). Ukažme, že $ P' $ je pravděpodobnostní mírou. | ||
+ | \begin{itemize} | ||
+ | \item[K\ref{k1}.] S~využitím předpokladu máme | ||
+ | \begin{equation*} | ||
+ | P'(\mathbb{R}^n) = \idotsint\limits_{\mathbb{R}^n} f_{\xx}(\bm{t}) \dd \bm{t} = | ||
+ | \lim_{\substack{ \forall i \in \hat{n}\\ x_i \rightarrow +\infty}} \int_{-\infty}^{x_1} \!\!\! \cdots \int_{-\infty}^{x_n} \mkern-8mu f_{\xx}(\bm{t}) \dd \bm{t} = | ||
+ | \lim_{\substack{ \forall i \in \hat{n}\\ x_i \rightarrow +\infty}}\mkern-10mu F_{\xx}(\mx) \stackrel{\text{D\ref{d3c}}}{=} 1. | ||
+ | \end{equation*} | ||
+ | \item[K\ref{k2}.] Jelikož je $ f_{\xx} \geq 0$, je jistě i~$ P' \geq 0 $. | ||
+ | \item[K\ref{k3}.] Zde využijeme $ \sigma $-aditivity Lebesgueova integrálu na disjunktním sjednocení; označme ho písmenem $ B $. | ||
+ | \begin{equation*} | ||
+ | P'\Bigl( \sum_{j=1}^{+\infty} B_j \Bigr) = | ||
+ | \int_{B}\!\! f_{\xx}(\mx) \dd\mx = | ||
+ | \sum_{j=1}^{+\infty} \int_{B_j}\mkern-10mu f_{\xx}(\mx) \dd\mx = \sum_{j=1}^{+\infty} P'(B_j). | ||
+ | \end{equation*} | ||
+ | \end{itemize} | ||
+ | Ukázali jsme, že $ P' $ je pravděpodobnostní míra na $ (\mathbb{R}^n, \bb_n) $. Nesmíme však zapomenout, že na tomtéž prostoru máme ještě $ P^{\xx} $. Z~věty o jednoznačnosti \ref{v-o-jednoznacnosti} ale víme, distribuční funkce $ F_{\xx} $ charakterizuje rozdělení $ P^{\xx} $ \emph{jednoznačně}. Tím pádem musí $ F_{\xx} = P^{\xx}\!\!\mid_{\tau_{1,n}} \stackrel{!}{=} P' $. Jestliže se ale dvě míry rovnají na $ \tau_{1, n} $, přičemž $ \sigma(\tau_{1, n}) = \bb_n $, potom už se nutně musejí rovnat na celé $ \sigma $-algebře $ \bb_n $ (podle věty \ref{v-o-rovnosti-PQ}). Tím je důkaz dokončen. | ||
+ | \end{itemize} | ||
+ | \end{proof} | ||
+ | |||
+ | \begin{pozn}\label{pozn-derivovani-F} | ||
+ | Je-li $ F_{\xx}(\mx) = \int\limits_{-\infty}^{x_1}\cdots \int\limits_{-\infty}^{x_n} f_{\xx}(\bm{t}) \dd\bm{t} $, lze odsud $ f_{\xx} $ získat derivováním integrálu jako funkce horní meze v~bodech spojitosti: | ||
+ | \begin{equation*} | ||
+ | f_{\xx}(\mx_0) = \frac{\partial^n}{\partial x_1 \cdots \partial x_n}F_{\xx}(\mx_0). | ||
+ | \end{equation*} | ||
+ | \end{pozn} | ||
+ | |||
+ | V~dalších větách uvažujme Lebesgueovu míru. | ||
+ | \begin{veta}[O marginální hustotě]\label{v-o-marg-hustote} | ||
+ | Nechť $ \xx \sim P^{\xx} $ a $ \xx $ má ASR vzhledem k~Lebesgueově míře~$\lambda $.\footnote{Díky~R--N větě lze psát též $ \xx \sim f_{\xx} $.} Označme $ \xx' := \xx \setminus X_j $. Pak má veličina $ \xx' $ ASR vzhledem k~$ (n-1) $-rozměrné Lebesgueově míře a pro její hustotu platí: | ||
+ | \begin{equation*} | ||
+ | \forall \mx' \in \mathbb{R}^{n-1}\colon \quad f_{\xx'}(\mx') = \int_{-\infty}^{+\infty} \mkern-18mu f_{\xx}(\mx) \dd x_j. | ||
+ | \end{equation*} | ||
+ | Fixujeme tedy $ n-1 $ proměnných a integrujeme přes $ x_j $. Funkci~$ f_{\xx'} $ nazýváme \textbf{marginální hustotou pravděpodobnosti}. | ||
+ | \end{veta} | ||
+ | \begin{proof} V~důkazu hned několikrát využijeme Fubiniho větu. Její použití bude legální, protože je~$ f_{\xx} $ na kartézském součinu integrabilní. Podle předchozí věty máme | ||
+ | \begin{align*} | ||
+ | F_{\xx'}(\mx') &\stackrel{\text{D\ref{d3a}}}{=} \lim_{x_j \rightarrow +\infty} F_{\xx}(\mx)\\ | ||
+ | &\!\stackrel{\text{R--N}}{=} \lim_{x_j \rightarrow +\infty} \int\limits_{-\infty}^{x_1} \cdots \int\limits_{-\infty}^{x_j} \cdots \int\limits_{-\infty}^{x_n} f_{\xx}(\mt) \dd\mt\\ | ||
+ | &\stackrel{\text{Fub}}{=} \lim_{x_j \rightarrow +\infty} \int\limits_{-\infty}^{x_j} \int\limits_{-\infty}^{x_1} \cdots \int\limits_{-\infty}^{x_n} f_{\xx}(\mt) \dd\mt \\ | ||
+ | &\, = \int\limits_{-\infty}^{+\infty} \int\limits_{-\infty}^{x_1} \cdots \int\limits_{-\infty}^{x_n} f_{\xx}(\mt) \dd\mt \\ | ||
+ | &\stackrel{\text{Fub}}{=} \int\limits_{-\infty}^{x_1} \cdots \int\limits_{-\infty}^{x_{j-1}} \int\limits_{-\infty}^{x_{j+1}} \cdots \int\limits_{-\infty}^{+\infty} f_{\xx}(\mt) \dd t_j \dd t_1 \ldots \dd t_n. | ||
+ | \end{align*} | ||
+ | Předvídavě označme $ \int_{-\infty}^{+\infty} f_{\xx}(\mt) \dd t_j := f_{\xx'}(\mx')$. Předchozí věta říká, že existuje jediná funkce, pomocí níž lze $ F_{\xx'} $ vyjádřit ve tvaru těchto integrálů. Proto musí být $ f_{\xx'} $ nutně hledanou hustotou a~je s.~v. jednoznačná. Tím jsme obdrželi to, co jsme chtěli ukázat.\qedhere | ||
+ | \end{proof} | ||
+ | |||
+ | Podobně jako ve větě $ \ref{v-o-nezavislosti-pro-F} $ lze pojem nezávislosti rozšířit i~na hustotu pravděpodobnosti. | ||
+ | \begin{veta}\label{v-o-nezav-pro-f} | ||
+ | Nechť $ \xx \sim P^{\xx} $ a má ASR. Náhodné věličiny $ X_1, \ldots, X_n $ jsou (stochasticky) nezávislé, právě když | ||
+ | \begin{equation*} | ||
+ | \forall \mx \in \mathbb{R}^n\colon \quad f_{\xx}(\mx) = \prod_{j=1}^n f_{X_j}(x_j). | ||
+ | \end{equation*} | ||
+ | \end{veta} | ||
+ | \begin{proof} | ||
+ | $ $ | ||
+ | \begin{itemize} | ||
+ | \item[$ (\Rightarrow) $] Buďte $ (X_j)_1^n $ nezávislé. Podle věty \ref{v-o-nezavislosti-pro-F} víme, že to nastává, právě když $ F_{\xx}(\mx) = \prod_{j=1}^n F_{X_j}(x_j)$. Má-li $ \xx $ ASR, pak ho musí mít i~všechny její složky se svými vlastními hustotami. Odtud | ||
+ | \begin{equation*} | ||
+ | \prod_{j=1}^n F_{X_j}(x_j) \stackrel{\ref{v-ekviv-def-ASR}}{=} \, \prod_{j=1}^n \int_{-\infty}^{x_j} f_{X_j}(t_j) \dd t_j \stackrel{\text{Fub}}{=} \int_{-\infty}^{x_1} \cdots \int_{-\infty}^{x_n} \prod_{j=1}^n f_{X_j}(t_j) \dd\mt. | ||
+ | \end{equation*} | ||
+ | Opět není jiná možnost, než aby poslední integrand byl hledanou hustotou při funkci~$ F_{\xx} $. Je tedy nutně $ f_{\xx}(\mx) = \prod_{j=1}^n f_{X_j}(x_j) $. | ||
+ | \item[$ (\Leftarrow) $] Nezávislost veličin $ (X_j)_1^n $ ukážeme z~definice \ref{nez-nv} v~řeči poznámky \ref{pozn-nez-nv}. Označme $ \bigtimes_{j=1}^n B_j :=~B $. Pak | ||
+ | \begin{align*} | ||
+ | P\Bigl(\xx \in \bigtimes_{j=1}^n B_j \Bigr) &= | ||
+ | P^{\xx}\Bigl(\bigtimes_{j=1}^n B_j \Bigr) \stackrel{\ref{v-abs-spoj-rozdeleni}}{=} | ||
+ | \int_B f_{\xx}(\mx) \dd\mx \stackrel{\text{předp.}}{=} | ||
+ | \int_{B} \prod_{j=1}^n f_{X_j}(x_j) \dd\mx =\\ | ||
+ | &\!\!\stackrel{\text{Fub}}{=} \prod_{j=1}^n \int_{B_j} f_{X_j}(x_j) \dd x_j \stackrel{\ref{v-abs-spoj-rozdeleni}}{=} | ||
+ | \prod_{j=1}^n P^{X_j}(B_j) = \prod_{j=1}^n P(X_j \in B_j), | ||
+ | \end{align*} | ||
+ | což jsme chtěli dokázat.\qedhere | ||
+ | \end{itemize} | ||
+ | \end{proof} | ||
+ | |||
+ | Vyslovme nyní definici podmíněné hustoty pravděpodobnosti pro absolutně spojité veličiny. Bude takřka totožná s~diskrétní verzí \ref{def-podm-hustota-diskr}. | ||
+ | \begin{defi}\label{def-podm-hustota-spoj} | ||
+ | Budiž $ \xx = (X,Y) $ náhodná veličina s~ASR a hustotou $ f_{(X,Y)} $. \textbf{Podmíněnou hustotu pravděpodobnosti} za předpokladu, že $ Y = y $, definujeme $\forall x \in \ran X$ vztahem | ||
+ | \begin{equation*} | ||
+ | f_{X\mid Y}(x \mid y) := \frac{f_{(X,Y)}(x,y)}{f_Y(y)} | ||
+ | \end{equation*} | ||
+ | za podmínky, že $ y \in \ran Y $ a $ f_Y(y) \neq 0 $. | ||
+ | \end{defi} | ||
+ | |||
+ | \begin{pozn} | ||
+ | $ $ | ||
+ | \begin{itemize} | ||
+ | \item Definice je korektní, protože $ f_{X \mid Y} $ je skutečně hustotou: je nezáporná a~snadno ověříme normovací podmínku $ \int_{\mathbb{R}}f_{X \mid Y}(x \mid y) \dd x = 1 $. To nám umožní přejít k~rozdělení podmíněné veličiny $ X \mid Y $ skrze vztah $ P^{X\mid Y}(B) = \int_{B} f_{X \mid Y}(x \mid y) \dd x$, kde $ B \in \bb_1 $. Pak už můžeme psát $ X \mid Y \sim P^{X\mid Y} $. | ||
+ | \item Kdybychom chtěli definovat podmíněnost spojitých náhodných veličin pomocí pravděpodobností, potřebovali bychom | ||
+ | \begin{equation*} | ||
+ | P(X \in B \mid Y = y) = \frac{P(X \in B, Y = y)}{P(Y=y)}. | ||
+ | \end{equation*} | ||
+ | Zde však narazíme, jakmile má veličina $ Y $ spojité rozdělení; v~tom okamžiku by byla \linebreak $ P(Y = y) = 0 $ (množina nulové míry) a zlomek výše by pozbyl smyslu. Takto tedy nelze $ X \mid Y $ přímo definovat, ale jak jsme viděli, lze tuto potíž obejít pomocí hustoty. | ||
+ | \end{itemize} | ||
+ | \end{pozn} | ||
+ | |||
+ | Zabývejme se nyní otázkou, co se s~hustotou pravděpodobnosti děje při obecné transformaci. | ||
+ | \begin{veta}[O obecné transformaci] | ||
+ | Nechť $ \xx \sim P^{\xx} $, kde toto rozdělení je absolutně spojité vzhledem k~míře~$ \lambda $ (např. Lebesgueově). Buď $ \mg\colon \mathbb{R}^n \rightarrow \mathbb{R}^m $ borelovská transformační funkce a~definujme novou náhodnou veličinu $ \yy = \mg\, \circ \xx \stackrel{\text{ozn.}}{=} \mg(\xx)$. Potom za předpokladu existence parciálních derivací skoro všude platí pro transformovanou hustotu pravděpodobnosti vztah | ||
+ | \begin{equation}\label{eq-obec-transfce} | ||
+ | f_{\yy}(\my) = \frac{\partial^m}{\partial y_1 \cdots \partial y_m}\int_{B_{\my}} \mkern-12mu f_{\xx}(\mx)\dd\mx, | ||
+ | \end{equation} | ||
+ | kde $ B_{\my} = \lbrace \mx \in \mathbb{R}^n \mid \mg(\mx) \leq \my \rbrace \in \bb_n$. | ||
+ | \end{veta} | ||
+ | \begin{proof} | ||
+ | Funkce $ f_{\xx} $ je nezáporná a měřitelná, množina $ B_{\my} $ je měřitelná, takže integrál existuje. Volba Lebesgueovy míry se odráží v~notaci $ \dd\mx $. Studujme distribuční funkci $ F_{\yy} $, od níž dokážeme snadno (a jednoznačně) pomocí R--N věty přejít k~hustotě. | ||
+ | |||
+ | Zorientujme se v~dimenzích problému. Podle definice rozdělení \ref{def-rozdeleni} a~poznámky pod ní platí, že $ P^{\xx} = P \circ \xx^{-1}\!\colon (\mathbb{R}^n, \bb_n) \rightarrow [0,1]. $ Z~definičního vztahu veličiny $ \yy $ plyne, že $ \yy\colon (\Omega, \sa, P) \rightarrow (\mathbb{R}^m, \bb_m), $ a tedy $ P^{\yy} = P \circ \yy^{-1} = P \circ \xx^{-1} \circ \mg^{-1} = P^{\xx} \circ \mg^{-1} $ a odsud $ F_{\yy} = P^{\yy}\!\!\mid_{\tau_{1,m}} $. | ||
+ | Nyní pišme: | ||
+ | \begin{align*} | ||
+ | F_{\yy}(\my) &= P(\yy \leq \my) = P(\mg \circ \xx \leq \my) = P\bigl(\left\lbrace \omega \mid (\mg \circ \xx)(\omega) \leq \my\right\rbrace\bigr) = P\Bigl[(\mg \circ \xx)^{-1}\bigl((-\bm{\infty}, \my]\bigl)\Bigr] =\\ | ||
+ | &= P\Bigl[\xx^{-1}\bigl(\mg^{-1}\bigl((-\bm{\infty}, \my]\bigr)\bigr)\Bigr] \stackrel{\ref{def-rozdeleni}}{=} P^{\xx}\left(\mg^{-1}\bigl((-\bm{\infty}, \my]\bigr)\right), | ||
+ | \end{align*} | ||
+ | kde pohodlnějším značením $ (-\bm{\infty}, \my] $ míníme $ m $ intervalů $ (\infty, y_i] $. Množina $\mg^{-1}\bigl((-\bm{\infty}, \my]\bigr) $ je borelovská a~jedná se přímo o~množinu $ B_{\my} $ ze znění věty. Rozdělení $ P^{\xx} $ je navíc absolutně spojité vzhledem k~Lebesgueově míře, takže podle důsledku R--N věty (viz \ref{v-abs-spoj-rozdeleni}) existuje s.~v. jednoznačná $ f_{\xx} $ taková, že | ||
+ | \begin{equation*} | ||
+ | F_{\yy}(\my) = P^{\xx}\left(\mg^{-1}\bigl((-\bm{\infty}, \my]\bigr)\right) = \int_{B_{\my}} \mkern-12mu f_{\xx}\dd\mx. | ||
+ | \end{equation*} | ||
+ | K~hustotě $ f_{\yy} $ se podle poznámky \ref{pozn-derivovani-F} dostaneme derivováním $ F_{\yy} $ v~bodech spojitosti: | ||
+ | \begin{equation*} | ||
+ | f_{\yy}(\my) = \frac{\partial^m}{\partial y_1 \cdots \partial y_m}F_{\yy}(\my) = \frac{\partial^m}{\partial y_1 \cdots \partial y_m} \int_{-\infty}^{y_1} \cdots \int_{-\infty}^{y_m} \mkern-12mu f_{\xx}(\mx)\dd \bm{x}. | ||
+ | \end{equation*} | ||
+ | \end{proof} | ||
+ | |||
+ | Předchozí věta nám poskytla vzorec pro transformovanou hustotu pravděpodobnosti. Pro běžné počítání je však příliš složitý, protože velice snadno nastane situace, kdy integrál nebudeme moci spočítat, a navíc bychom ho pak museli $ m $-krát derivovat. Proto bychom chtěli \eqref{eq-obec-transfce} zjednodušit. Budeme přitom uvažovat transformaci do prostoru \emph{stejné} dimenze. | ||
+ | |||
+ | \begin{veta}\label{v-o-tranfci-Rn-Rn} | ||
+ | Buďte $ k \in \mathbb{N},\ i \in \hat{k} $ a $ \xx \sim P^{\xx} $ s~ASR vzhledem k~Lebesgueově míře. Nechť $ \mg\colon \mathbb{R}^n \rightarrow \mathbb{R}^n $ je zobrazení \emph{po částech} regulární a prosté na množinách $ B_i $, kde pro všechna $ i \in \hat{k}$ platí: | ||
+ | $ B_i = B_i^\circ $, jsou vzájemně \emph{disjunktní} a množina $ G := \sum_{i=1}^k B_i $ je taková, že $ \int_{G}f_{\xx}\dd\mx = 1$. Pak je $ \yy := \mg(\xx) $ náhodná veličina s~ASR a příslušná hustota pravděpodobnosti je rovna | ||
+ | \begin{equation}\label{eq-transfce-hustoty} | ||
+ | \forall \my \in \mg(G)\colon \quad | ||
+ | f_{\yy}(\my) = \sum_{i=1}^{k}f_{\xx}\Bigl(\mg^{-1}\!\!\mid_{B_i}\!\!(\my)\Bigr)\left| \det \mathbb{J}_{\mg^{-1}}(\my)\right| | ||
+ | \end{equation} | ||
+ | a jinde je dodefinována nulou. | ||
+ | \end{veta} | ||
+ | \begin{pozn} | ||
+ | Zkusme se v~této džungli symbolů a pojmů nejdříve zorientovat. | ||
+ | \begin{itemize} | ||
+ | \item Zobrazení $ g $ nazveme regulárním, právě když $ g \in \mathcal{C}^1 $ a $ (\forall x \in \dom g)(\det \mathbb{J}_g(x) \neq 0) $. Symbolem $ \mathbb{J}_g $ značíme Jacobiho matici zobrazení $ g $ a~jejímu determinantu se říká \emph{jakobián}. To, že je $ g $ regulární, ještě neznamená, že je prosté, a proto musíme prostotu předpokládat zvlášť.\footnote{Regulární zobrazení je ale lokálně prosté, jak plyne z~věty o derivaci inverzního zobrazení (viz \emph{Turistický průvodce MAA4}, věta 14.1). Zobrazení, které je regulární a prosté, se též nazývá \emph{difeomorfismem}.} | ||
+ | \item Regularita a prostota $ \mg $ \emph{po částech} znamená, že jsme schopni nalézt konečně mnoho podmnožin definičního oboru, na nichž už je $ \mg $ regulární a prosté. | ||
+ | \item Množiny $ B_i $ jsou otevřené, a tedy borelovské; zrovna tak množina $ G $. Podmínka normovanosti $ \int_{G}f_{\xx}\dd\mx = 1 $ je totožná s~požadavkem $ P^{\xx}(G) = 1 $, tj. $ G $ je pokrytím v~pravděpodobnostním smyslu. Suma v~\eqref{eq-transfce-hustoty} symbolizuje opětovné "napojení" jednotlivých transformací do jedné funkce. | ||
+ | \item Symbolem $ \mg^{-1}\!\!\mid_{B_i} $ myslíme \emph{inverzní} zobrazení ke $ \mg $ zúžené na množinu $ B_i $. Budeme ho dále značit pouze $ \mg_i^{-1} $. | ||
+ | \end{itemize} | ||
+ | \end{pozn} | ||
+ | \begin{proof} | ||
+ | V~důkazu minulé věty jsme obdrželi rovnost $ F_{\yy}(\my) = \int_{B_{\my}} f_{\xx}\dd\mx $, odkud jsme se nemohli pohnout dál. Nyní jsme v~situaci, kdy $ m = n $, a proto můžeme na každé $ B_i $ provést substituci, neboť je na nich~$ \mg $ regulární a prosté. Proto nejdříve pronikneme $ B_{\my} \cap \sum_{i=1}^k B_i$ a díky normovací podmínce se hodnota integrálu nezmění. S~využitím distributivity průniku vůči sjednocení a~aditivity integrálu máme | ||
+ | \begin{equation*} | ||
+ | F_{\yy}(\my) = \int\limits_{B_{\my}} \!\!f_{\xx}(\mx)\dd\mx = \int\limits_{B_{\my}\cap G} \mkern-12mu f_{\xx}(\mx)\dd\mx = \sum_{i=1}^k \int\limits_{\,B_{\my}\cap B_i} \mkern-18mu f_{\xx}(\mx)\dd\mx | ||
+ | \end{equation*} | ||
+ | \begin{align*} | ||
+ | \mg(\mx) &= \bm{t} \\%&\forall i \in \hat{k} \,\\ | ||
+ | \mx &= \mg^{-1}_i(\bm{t}) \quad\text{ na } B_i\,\\ | ||
+ | \,\det\mathbb{J}_{\mg_i^{-1}}(t)&\neq 0 \qquad\quad\ \text{ na } B_i\, | ||
+ | \end{align*} | ||
+ | \begin{equation*} | ||
+ | \sum_{i=1}^k \int\limits_{\, T_{\my} \cap \mg(B_i)} \mkern-18mu f_{\xx}\left(\mg^{-1}_i(\bm{t})\right)\left| \det \mathbb{J}_{\mg_i^{-1}}(\bm{t})\right| \dd\bm{t} \stackrel{\text{Fub}}{=} | ||
+ | \int_{-\infty}^{y_1}\cdots\int_{-\infty}^{y_n} \sum_{i=1}^k f_{\xx}\left(\mg^{-1}_i(\bm{t})\right)\left| \det \mathbb{J}_{\mg_i^{-1}}(\bm{t})\right| \dd\bm{t} | ||
+ | \end{equation*} | ||
+ | kde $ T_{\my} = \lbrace \bm{t} \in \mathbb{R}^n \mid \bm{t} \leq \my \rbrace$. Poslední integrand označme sugestivně $ f_{\yy}(\bm{t}) $. Víme, že jakmile se podaří distribuční funkci $ F_{\yy}(\my) $ vyjádřit ve tvaru tohoto integrálu, je integrand nutně hustotou pravděpodobnosti veličiny $ \yy $. Tím je důkaz dokončen, protože jsme obdrželi rovnost \eqref{eq-transfce-hustoty}. | ||
+ | \end{proof} | ||
+ | |||
+ | Projděme si nyní různé speciální případy přechozí věty. | ||
+ | \begin{enumerate} | ||
+ | \item\textbf{Případ $ n = 1 $.} Nechť $ \xx \sim P_{\xx} $ s~ASR. Buď $ g\colon \mathbb{R} \rightarrow \mathbb{R} $ funkce po částech regulární (tj. na množinách $ B_i $ je $ g \in \mathcal{C}^1,\ g'(x) \neq 0$) a prostá. Pak má náhodná veličina $ Y := g(X) $ ASR a~hustotu pravděpodobnosti $\forall y \in g(G)$ rovnu | ||
+ | \begin{equation*} | ||
+ | f_Y(y) = \sum_{i=1}^k f_X\left(g_i^{-1}(y)\right)\frac{1}{\left| g_i'\left(g_i^{-1}(y)\right) \right| }. | ||
+ | \end{equation*} | ||
+ | \item \textbf{Případ $ k = 1 $.} Je jen jedna množina, kde $ \mg\colon \mathbb{R}^n \rightarrow \mathbb{R}^n $ je regulární a prostá, takže je suma tvořena jen jedním sčítancem. Pro všechna $ \my \in B_1 = G$ platí | ||
+ | \begin{equation*} | ||
+ | f_{\yy}(\my) = f_{\xx}\left(\mg^{-1}(\bm{\my})\right)\left| \det \mathbb{J}_{\mg^{-1}}(\bm{\my})\right|. | ||
+ | \end{equation*} | ||
+ | \item \textbf{Případ $ g\colon \mathbb{R}^n \rightarrow \mathbb{R}$} sice nespadá do předchozí věty, ale i~tak si dovedeme poradit. Položme $ Y := g(\xx) $. Z~této veličiny utvoříme vektor $ \yy = (Y, Y_2, \ldots, Y_n) $, přičemž pro $ 2 \leq j \leq n $ jsou $ Y_j = X_j $. Jedná se tedy o~latentní proměnné (transformujeme je identitou), přes které později zintegrujeme. Předpokládejme, že lze složku $ X_1 $ jednoznačně (algebraicky) vyjádřit pomocí $ Y := Y_1 $ a~ostatních složek $ (X_2, \ldots X_n) := \xx' = (Y_2,\ldots Y_n)$. Toto vyjádření nechť je tvaru | ||
+ | $ X_1 = h(Y_1, \xx') = h(y_1, \mx') = h(\my)$\footnote{Přechod k~malým proměnným lze chápat tak, že jsme transformaci náhodné veličiny přiřadili malé proměnné, které potom měníme tak, jak to známe z~analýzy. Tento postup je ale spíše fyzikální, protože proměnnými náhodné veličiny jsou $ \omega \in \Omega $!} a předpokládejme, že existuje spojitá a nenulová $ \partial h / \partial y_1 \stackrel{\text{ozn.}}{=} \partial_{y_1}h$ Teď už máme prostou transformaci $ \tilde{g}\colon \mathbb{R}^n \rightarrow \mathbb{R}^n $ s~nenulovým jakobiánem | ||
+ | \begin{equation*} | ||
+ | \begingroup | ||
+ | \setlength\arraycolsep{3pt} | ||
+ | \det\mathbb{J}_{\tilde{g}^{-1}}(\my) = \det | ||
+ | \begin{pmatrix} | ||
+ | \partial_{y_1}h(\my) & \partial_{y_2}h(\my) & \cdots & \partial_{y_n}h(\my)\\[3pt] | ||
+ | 0 & 1 & \cdots & 0\\[-4pt] | ||
+ | \vdots & \vdots & \ddots & \vdots\\ | ||
+ | 0 & 0 & \cdots & 1 | ||
+ | \end{pmatrix} | ||
+ | \endgroup | ||
+ | = \diffp{h(\my)}{{y_1}} \neq 0 | ||
+ | \end{equation*} | ||
+ | dle předpokladu. Splnili jsme tedy požadavky předchozí věty a můžeme psát (uvažujeme $ k = 1 $): | ||
+ | \begin{align*} | ||
+ | f_{\yy}(\my) &= f_{\xx}\left(\tilde{\mg}^{-1}(\bm{\my})\right)\left| \det \mathbb{J}_{\tilde{\mg}^{-1}}(\bm{\my})\right|\\ | ||
+ | &= f_{\xx}\bigl(h(\my), \mx'\bigr)\cdot \left| \partial_{y_1}h(\my)\right|\\ | ||
+ | &= f_{\xx}\bigl(h(\my), y_2,\ldots, y_n\bigr) \cdot \left| \partial_{y_1}h(\my)\right|. | ||
+ | \end{align*} | ||
+ | Od sdružené hustoty lze podle věty \ref{v-o-marg-hustote} přejít k~hustotě marginální integrováním přes zbylé proměnné: | ||
+ | \begin{equation*} | ||
+ | f_{\yy}(\my) \xrightarrow{\text{\ref{v-o-marg-hustote}}} f_{Y_1}(y_1) = \int_{-\infty}^{+\infty}\mkern-20mu \cdots \int_{-\infty}^{+\infty} \mkern-12mu f_{\yy}(\bm{t})\dd t_2 \cdots \dd t_n. | ||
+ | \end{equation*} | ||
+ | \end{enumerate} | ||
+ | |||
+ | \begin{priklad}\label{pr-transfce-X1+X2} | ||
+ | Ukažme si aplikaci třetího bodu na transformaci $ \mathbb{R}^2 \rightarrow \mathbb{R} $. Buď $ \xx = (X_1, X_2) $ náhodná veličina s~ASR a hustotou pravděpodobnosti $ f_{(X_1,X_2)} $. Řekněme, že chceme veličinu $ \xx $ transformovat do nové, jednorozměrné podoby tvaru $ Y = X_1 + X_2 \stackrel{\text{ozn.}}{=} Y_1$ (to je analog $ Y = g(\xx) $). Proto doplníme tuto transformaci do $ \mathbb{R}^2 $ identickým přechodem $ Y_2 = X_2 $. Formálně se jedná o~záměnu proměnných | ||
+ | \begin{align*} | ||
+ | y_1 &= x_1 + x_2\\ | ||
+ | y_2 &= x_2, | ||
+ | \end{align*} | ||
+ | přičmž nové proměnné stojí na levé straně. Nyní vyjádříme $ x_1 = y_1 - x_2 \stackrel{\text{ozn.}}{=} h(y_1, x_2) = h(y_1, y_2) $ (viz $ h(\my) $ výše). Je zřejmé, že $ \partial_{y_1} h = 1 \neq 0$, takže můžeme použít větu \ref{v-o-tranfci-Rn-Rn} a obdržíme | ||
+ | \begin{equation*} | ||
+ | f_{(Y_1, Y_2)}(y_1, y_2) = f_{(X_1, X_2)}(y_1-y_2, y_2)\cdot 1 \xrightarrow{\text{\ref{v-o-marg-hustote}}} f_{Y_1}(y_1) = f_{X_1+X_2}(y_1) = \int_{-\infty}^{+\infty} \mkern-18mu f_{(X_1, X_2)}(y_1-y_2, y_2) \dd y_2. | ||
+ | \end{equation*} | ||
+ | Víme-li navíc, že jsou veličiny $ X_1 $ a $ X_2 $ nezávislé, lze podle věty \ref{v-o-nezav-pro-f} psát $ f_{X_1+X_2}(y_1) = \linebreak = \int_{\mathbb{R}}f_{X_1}(y_1-y_2)\cdot f_{X_2}(y_2) \dd y_2 $, což není jiného než \emph{konvoluce} $ (f_X * f_Y)(y_1) $, jak ji známe z~RMF. | ||
+ | Čtenář snadno odvodí (zcela analogickým způsobem) transformace typu $ Y = X_1X_2 $ či $ Y=~X_1/X_2 $. | ||
+ | \end{priklad} | ||
+ | |||
+ | \subsection{Příklady spojitých rozdělení} | ||
+ | Uveďme nyní několik příkladů spojitých rozdělení a~příslušných hustot pravděpodobnosti. | ||
+ | \begin{enumerate} | ||
+ | \item \textbf{Uniformní rozdělení.} Řekneme, že náhodná veličina $ X $ má \textbf{uniformní (rovnoměrné) rozdělení} na konečném intervalu $ /a,b/ $, právě když je příslušná hustota pravděpodobnosti rovna | ||
+ | \begin{equation*} | ||
+ | f_{X}(x) = \frac{1}{b-a}\chi_{/a,b/}(x), | ||
+ | \end{equation*} | ||
+ | píšeme $ X \sim \mathcal{U}(a,b) $. Lomené závorky u~intervalu značí, že nezáleží na jeho typu. V~krajních bodech lze $ f_X $ dodefinovat buď nulou, nebo hodnotou $ 1/(b-a) $; integrál totiž na jeden bod (tj. množinu míry nula) nebere ohledy. Distribuční funkci získáme jako funkci horní meze: | ||
+ | \begin{equation*} | ||
+ | F_X(x) = \int_{-\infty}^x \mkern-12mu f_X(t) \dd t = | ||
+ | \begin{cases} | ||
+ | 0 & x < a\\ | ||
+ | \frac{x-a}{b-a} & x \in (a,b) \\ | ||
+ | 1 & x > b. | ||
+ | \end{cases} | ||
+ | \end{equation*} | ||
+ | Je snadné ověřit, že je splněna normovací podmínka $ \int_{\mathbb{R}} f_X(x) \dd x = 1.$ | ||
+ | \begin{figure}[h] | ||
+ | \centering | ||
+ | \includegraphics[width=0.7\textwidth]{Fig1-uniformni-rozdeleni.png} | ||
+ | \caption{Graf hustoty pravděpodobnosti $ f_X $, resp. distribuční funkce $ F_X $ pro $ X \sim \mathcal{U}(-2,2) $.} | ||
+ | \label{fig1-10} | ||
+ | \end{figure} | ||
+ | \item \textbf{Uniformní rozdělení na $ \mathbb{R}^n $.} Definici rovnoměrného rozdělení lze rozšířit i~na omezené množiny v~$ \mathbb{R}^n $. Budiž $ \lambda $ míra a množina~$ G \subset \mathbb{R}^n $ taková, že $ \lambda(G) < +\infty $. Pak říkáme, že náhodná veličina \textbf{má na~$ G $ uniformní rozdělení}, značeno $ \xx \sim \mathcal{U}(G) $, právě když | ||
+ | \begin{equation*} | ||
+ | f_{\xx}(\mx) = \frac{1}{\lambda(G)}\chi_G(\mx). | ||
+ | \end{equation*} | ||
+ | Opět platí, že $ \int_{\mathbb{R}^n} f_{\xx} \dd\lambda = 1 $. | ||
+ | \item \textbf{Normální rozdělení.} Náhodná veličina $ X $ má \textbf{normální (gaussovské) rozdělení} s~parametry $ \mu \in \mathbb{R} $ a $ \sigma > 0$, když $ \forall x \in \mathbb{R} $ platí | ||
+ | \begin{equation}\label{eq-norm-rozd-f} | ||
+ | f_X(x) = \frac{1}{\sqrt{2\pi\sigma^2}}\exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right), | ||
+ | \end{equation} | ||
+ | psáno $ X \sim \mathcal{N}(\mu, \sigma^2) $. Parametr $ \mu $ je střední hodnotou tohoto rozdělení, $ \sigma^2 $ jeho rozptyl (o~tom se více dozvíme později v~semestru). Význam tohoto rozdělení oceníme především v~odstavci o~tzv.~\emph{centrální limitní větě}. Má zcela zásadní postavení ve statistice, přírodních i~společenských vědách. | ||
+ | |||
+ | Normovací podmínku $ \int_{\mathbb{R}} f_X(x) \dd x = 1 $ lze substitucí $ t = (x-\mu)/(\sqrt{2}\sigma) $ převést na tzv. Gaussův integrál $ \int_{\mathbb{R}} \mathrm{e}^{-t^2}\dd t = \sqrt{\pi}$, který se počítá standardním trikem spočívajícím v~přechodu do polárních souřadnic (viz MA4 či TSFA). | ||
+ | |||
+ | Příslušná kumulativní distribuční funkce je tvaru | ||
+ | \begin{equation}\label{eq-norm-rozd-F} | ||
+ | F_X(x) = \frac{1}{\sqrt{2\pi\sigma^2}}\int_{-\infty}^x \!\!\!\exp\left(\frac{(t-\mu)^2}{2\sigma^2}\right)\dd t. | ||
+ | \end{equation} | ||
+ | Zde však narážíme na problém, že ji nelze vyjádřit v~elementárním tvaru (tj. jako konečnou kombinaci elementárních funkcí), a tak se její hodnoty stanovují numericky; je ale vidět, že $ F_X(+\infty) = 1 $. | ||
+ | |||
+ | Význačné hodnoty parametrů normálního rozdělení jsou $ \mu = 0 $ a $ \sigma^2 = 1 $; pak se mu říká \emph{standardizované}. Jedná se tedy o~případ $ X \sim \mathcal{N}(0,1)$. Hustota \eqref{eq-norm-rozd-f} pak nabývá tvaru | ||
+ | \begin{equation}\label{eq-norm-rozd-phi} | ||
+ | \varphi_X(x) = \frac{1}{\sqrt{2\pi}}\exp\left(-\frac{x^2}{2}\right) | ||
+ | \end{equation} | ||
+ | a distribuční funkce (opět neelementární) | ||
+ | \begin{equation}\label{eq-norm-rozd-Phi} | ||
+ | \Phi_X(x) = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{x} \exp\left(-\frac{t^2}{2}\right) \dd t. | ||
+ | \end{equation} | ||
+ | Na obrázcích \ref{fig-normalni-rozdeleni} jsou znázorněny průběhy funkcí $ f_X $, resp. $ F_X $ při normálním rozdělení (případ $ \mathcal{N}(0,1) $ modře). | ||
+ | \begin{figure}[t] | ||
+ | \centering | ||
+ | \begin{subfigure}[t]{0.62\textwidth} | ||
+ | \includegraphics[width=1\linewidth]{Fig2a-normalni-pdf.png} | ||
+ | \caption{\mbox{Graf hustoty pravděpodobnosti $ f_X $ pro různé hodnoty parametrů $ \mu $ a $ \sigma^2$.}} | ||
+ | \label{fig2a-norm-pdf} | ||
+ | \end{subfigure} | ||
+ | \begin{subfigure}[t]{0.62\textwidth} | ||
+ | \centering | ||
+ | \includegraphics[width=1\linewidth]{Fig2b-normalni-cdf.png} | ||
+ | \caption{\mbox{Graf distribuční funkce $ F_X $ pro různé hodnoty parametrů $ \mu $ a $ \sigma^2$.}} | ||
+ | \label{fig2b-norm-cdf} | ||
+ | \end{subfigure} | ||
+ | \caption{Grafy funkcí $ f_X $, resp. $ F_X $ pro různé hodnoty parametrů $ \mu $ a $ \sigma^2$ normálního rozdělení.} | ||
+ | \label{fig-normalni-rozdeleni} | ||
+ | \end{figure} | ||
+ | |||
+ | Shrňme si nyní základní vlastnosti Gaussova rozdělení do jedné~věty. | ||
+ | \begin{veta}[O vlastnostech $ \mathcal{N} $]\label{v-o-vlastn-norm-rozd} | ||
+ | Mějme $ X \sim \mathcal{N}(\mu, \sigma^2) $. Platí: | ||
+ | \begin{enumerate}[i.] | ||
+ | \item Normální rozdělení $ \mathcal{N}(\mu, \sigma^2) $ je symetrické kolem bodu $ x = \mu $. Inflexní body se nachází v~$ x = \mu \pm \sigma $. | ||
+ | \item $ (\forall x \in \mathbb{R})( \Phi_X(x) = 1-\Phi_X(-x) )$. | ||
+ | \item\label{v-o-vlastn-norm-rozd-bod3} Mezi distribuční funkcí obecného $ \mathcal{N}(\mu, \sigma^2) $ a standardního rozdělení $ \mathcal{N}(0,1) $ lze přecházet vztahem | ||
+ | \begin{equation*} | ||
+ | F_X(x) = \Phi_X\left(\frac{x-\mu}{\sigma}\right). | ||
+ | \end{equation*} | ||
+ | Proto stačí tabelovat pouze hodnoty $ \Phi_X $ a~díky bodu (ii) dokonce jen ty na kladné poloose. | ||
+ | \item $ P(a < X \leq b) = \frac{1}{\sqrt{2\pi}} \mkern-5mu \int\limits_{(a-\mu)/\sigma}^{(b-\mu)/\sigma} \mkern-10mu \exp(-x^2/2) \dd x$. | ||
+ | \item Je-li $ X \sim \mathcal{N}(\mu, \sigma^2) $, pak pro $ a \neq 0 $ má rozdělení transformované veličiny $ Y := aX + b $ následující podobu: $ Y \sim \mathcal{N}(a\mu + b;\, a^2\sigma^2)$. Speciálně: Jestliže $ X \sim \mathcal{N}(0,1) $, potom $ \sigma X + \mu \sim \mathcal{N}(\mu, \sigma^2) $. | ||
+ | \item Budiž $ k \in \mathbb{N} $. Pak | ||
+ | $ P\left( \mu - k\sigma \leq X \leq \mu + k\sigma \right) = 2\Phi_X(k) - 1$. | ||
+ | \end{enumerate} | ||
+ | \end{veta} | ||
+ | \begin{proof} | ||
+ | $ $ | ||
+ | \begin{enumerate}[i.] | ||
+ | \setcounter{enumii}{1} | ||
+ | \item Tvrzení druhého bodu snadno obdržíme přičtením a~odečtením integrálu $ 1/\sqrt{2\pi}\int_{x}^{+\infty} \exp(-t^2/2) \dd t $ a následnou substitucí $ r = -t $. | ||
+ | \item Substitucí $ (t-\mu)/\sigma = r $ v~předpisu \eqref{eq-norm-rozd-F} pro $ \Phi $ přímo dostaneme kýžený vztah: | ||
+ | \begin{equation*} | ||
+ | F_X(x) = \frac{1}{\sqrt{2\pi}} \mkern-12mu \int\limits_{-\infty}^{(x-\mu)/\sigma} \mkern-12mu \exp(-r^2/2) \dd r \stackrel{\text{\eqref{eq-norm-rozd-Phi}}}{=} \Phi_X\left(\frac{x-\mu}{\sigma}\right). | ||
+ | \end{equation*} | ||
+ | \item Počítejme například $ P(a < X \leq b) $. Podle poznámky \ref{pozn-distrib-fce}.\ref{pozn-distrib-fce-bod2} bychom si správně měli dávat pozor na druh nerovnosti. Jelikož se ale nyní bavíme o~(absolutně) spojitém rozdělení, je lhostejno, kterou nerovnost použijeme -- jednostranná limita funkce $ F $ bude přímo rovna funkční hodnotě v~daném bodě. Pišme tedy | ||
+ | \begin{align*} | ||
+ | P(a < X \leq b) &= F_X(b) - F_X(a) \stackrel{\text{iii.}}{=} | ||
+ | \Phi_X\left(\frac{b-\mu}{\sigma}\right) - \Phi_X\left(\frac{a-\mu}{\sigma}\right) \stackrel{\text{ozn.}}{=} \Phi_X(d) - \Phi_X(c) =\\ | ||
+ | &= \frac{1}{\sqrt{2\pi}} \int_c^d \exp(-x^2/2) \dd x. | ||
+ | \end{align*} | ||
+ | Tuto pravděpodobnost lze opět počítat pouze numericky. | ||
+ | \item Zde přijde na řadu věta o~transformaci \ref{v-o-tranfci-Rn-Rn} a~její speciální případ $ n = 1 $. Transformační funkce~$ g $ provádí přiřazení $g(x) = ax+b $, tím pádem její inverze $ g^{-1}(y) = \frac{y-b}{a} $. Jakobián zobrazení $ g^{-1} $ je jednoduše $ \left(g^{-1}\right)'(y) = \frac{1}{a} $, takže s~pomocí \eqref{eq-transfce-hustoty} máme | ||
+ | \begin{align*} | ||
+ | f_Y(y) &\stackrel{\eqref{eq-transfce-hustoty}}{=} f_X\left(g^{-1}(y)\right) \cdot \left| \left(g^{-1}\right)'(y) \right| \\ | ||
+ | &\stackrel{\eqref{eq-norm-rozd-f}}{=} \frac{1}{\sqrt{2\pi\sigma^2}}\exp\!\left[-\frac{\left(\frac{y-b}{a} - \mu\right)^2}{2\sigma^2}\right] \cdot \frac{1}{|a|}\\ | ||
+ | &\ \;= \frac{1}{\sqrt{2\pi (a\sigma)^2}} \exp\left[- \frac{\left(y - (a\mu+b)\right)^2}{2(a\sigma)^2}\right]. | ||
+ | \end{align*} | ||
+ | To je ale hustota normálního rozdělení s~parametry $ \mu' = a\mu + b $ a $ \sigma'^2 = a^2\sigma^2 $, což bylo dokázati. Je-li speciálně $ a = 1/\sigma,\ b = - \mu/\sigma $, pak $ (X-\mu)/\sigma^2 \sim \mathcal{N}(0,1) $. Obráceně: pro $ X \sim \mathcal{N}(0,1) $ je potom $ \sigma X + \mu \sim \mathcal{N}(\mu, \sigma^2) $. | ||
+ | \item Nedbaje na typ nerovností můžeme počítat například | ||
+ | \begin{equation*} | ||
+ | P(\mu - k\sigma \leq X \leq \mu + k\sigma) = | ||
+ | P\Bigl( k \leq \frac{X - \mu}{\sigma} \leq k\Bigr) \stackrel{\text{iii.}}{=} \Phi_X(k) - \Phi_X(-k) \stackrel{\text{ii.}}{=} 2\Phi_X(k) - 1. | ||
+ | \end{equation*} | ||
+ | Tento vztah se někdy nazývá \emph{pravidlem $ k $-sigma}. Vyjadřuje pravděpodobnost (spolehlivost), že se hodnota naměřené veličiny nachází v~intervalu $ [\mu - k\sigma, \mu + k\sigma] $. Řekneme-li, že jsme naměřili data "s~přesností jedna sigma", dosazením $ k = 1$ obdržíme spolehlivost $ 0,68268 $; pro $ k = 2 $ je to $ 0,9545 $; pro $ k = 3 $ dokonce $ 0,9973 $ -- máme 99,73procentní jistotu, že se naše data nacházejí v~úseku $ [\mu - 3\sigma, \mu + 3\sigma]$. \qedhere | ||
+ | \end{enumerate} | ||
+ | \end{proof} | ||
+ | Odstavec o~normálním rozdělení uzavřeme poslední vlastností, která si ale zaslouží být zvláštní větou. | ||
+ | \begin{veta}[Reprodukční vlastnost $ \mathcal{N} $]\label{v-reprod-vlastn-N-1} | ||
+ | Mějme konečně mnoho \emph{nezávislých} náhodných veličin takových, že $ (\forall j \in \hat{n})\left(X_j \sim \mathcal{N}(\mu_j, \sigma^2_j)\right) $. Nechť $ \bm{a} = (a_1, \ldots, a_n) \neq \bm{0} $ je $ n $-tice čísel. Potom i~lineární kombinace těchto veličin má normální rozdělení, a sice | ||
+ | \begin{equation*} | ||
+ | \sum_{j=1}^n a_j X_j \sim \mathcal{N}\Bigl(\sum_{j=1}^n a_j \mu_j;\ \sum_{j=1}^n a_j^2\sigma_j^2 \Bigr). | ||
+ | \end{equation*} | ||
+ | \end{veta} | ||
+ | \begin{proof} | ||
+ | Toto tvrzení mnohem jednodušeji dokážeme v~kapitole o~charakteristické funkci (viz~\ref{pr-reprod-vlastn-gauss}). Následující důkaz berme spíše jako ilustraci faktu, že život bez charakteristické funkce je těžký. | ||
+ | |||
+ | Z~bodu (v.) předchozí věty víme, že násobení skalárem nezmění gaussovskost rozdělení: je totiž $ a_jX_j \sim \mathcal{N}(a_j\mu_j;\ a_j^2\sigma_j^2) $. Proto BÚNO položme $ (\forall j \in \hat{n})(a_j := 1)$ a zkoumejme pouze součet náhodných veličin. | ||
+ | |||
+ | Postupujme matematickou indukcí. Nejdříve uvažme $ X_1 + X_2 $. Využijme nezávislosti a~rozdělení jednotlivých $ X_j $ a~pišme | ||
+ | \begin{align*} | ||
+ | X_1 + X_2 \sim f_{X_1+X_2}(u) &\stackrel{\text{\ref{pr-transfce-X1+X2}}}{=} | ||
+ | (f_{X_1}*f_{X_2})(u) = \int_{\mathbb{R}} f_{X_1}(u-v)f_{X_2}(v) \dd v =\\ | ||
+ | &\ = \frac{1}{2\pi\sigma_1\sigma_2} \int_{\mathbb{R}} \exp\underbrace{\Biggl[-\frac{((u-v)-\mu_1)^2}{2\sigma_1^2} - \frac{(v-\mu_2)^2}{2\sigma_2^2}\Biggr]}_{(\star)} \dd v \stackrel{\text{ozn.}}{=} I(u). | ||
+ | \end{align*} | ||
+ | Následuje zdlouhavý výpočet, který zde uvedeme pouze ve stručné podobě. Argument \linebreak exponenciály upravíme na společný jmenovatel | ||
+ | \begin{align*} | ||
+ | (\star) &= -\frac{1}{2\sigma_1^2\sigma_2^2}\Bigl[ v^2\left(\sigma_1^2+\sigma_2^2\right) + 2v\left(\sigma_2^2(\mu_1 - u) - \sigma_1^2\mu_2^2\right) + \sigma_2^2(u-\mu_1)^2 + \sigma_1^2\mu_2^2\Bigr] \\ | ||
+ | &\!\! \stackrel{\text{ozn.}}{=} -\frac{1}{2\sigma_1^2\sigma_2^2} \Bigl[v^2S + 2vB + C \Bigr] | ||
+ | \end{align*} | ||
+ | a převedeme na čtverec vzhledem k~proměnné $ v $: | ||
+ | \begin{align*} | ||
+ | (\star) &= -\frac{S}{2\sigma_1^2\sigma_2^2}\Biggl[\left(v+\frac{B}{S}\right)^2 + \frac{CS - B^2}{S^2} \Biggr]. | ||
+ | \end{align*} | ||
+ | Roznásobíme oba výrazy a jakožto argumenty exponenciály je integrujeme přes celou reálnou osu. Druhý sčítanec nezávisí na $ v $, tudíž jej lze vytknout před integrál (nezapomeňme na faktor, který už před integrálem byl). Substitucí redukujeme výpočet na integrál typu $ \int_{\mathbb{R}} \exp(-At^2) \dd t $, kde $ A = S/(2\sigma_1^2\sigma_2^2) $, jehož výsledkem\footnote{Čtenář--klasik nahlédne do knihy \emph{Matematické vzorce} od H.-J. Bartsche, s. 609, kde lze nalézt nesčetné množství tabelovaných integrálů všech druhů. Čtenář--pragmatik navštíví \url{https://en.wikipedia.org/wiki/List_of_integrals_of_exponential_functions}.} je $ \sqrt{\pi/A} $. Po vykrácení koeficientů máme | ||
+ | \begin{align*} | ||
+ | I(u) &= \frac{1}{\sqrt{2\pi(\sigma_1^2+\sigma_2^2)}}\exp\left[-\frac{1}{2\sigma_1^2\sigma_2^2}\frac{CS-B^2}{S}\right]\\ | ||
+ | &= \frac{1}{\sqrt{2\pi(\sigma_1^2+\sigma_2^2)}}\exp\left[-\frac{(u-(\mu_1+\mu_2))^2}{2(\sigma_1^2+\sigma_2^2)}\right], | ||
+ | \end{align*} | ||
+ | což ale neznamená nic jiného, než že $ X_1 + X_2 \sim \mathcal{N}(\mu_1+\mu_2; \sigma_1^2 + \sigma_2^2) $. | ||
+ | |||
+ | Nechť pro $ k = n $ tvrzení platí. Pak | ||
+ | \begin{equation*} | ||
+ | \sum_{j=1}^{n+1}X_j = \sum_{j=1}^{n} X_j + X_{j+1} \stackrel{\text{IP}}{=} \mathcal{N}\Bigl(\sum_{j=1}^n \mu_j + \mu_{n+1};\ \sum_{j=1}^n \sigma_j^2 + \sigma_{n+1}^2\Bigr) | ||
+ | \end{equation*} | ||
+ | a tím je důkaz dokončen. | ||
+ | \end{proof} | ||
+ | \begin{dusl} | ||
+ | Nechť $ \bm{a} = (1/n, \ldots, 1/n) $. Pak podle předchozí věty $ \frac{1}{n}\sum_{j=1}^n X_j \stackrel{\text{ozn.}}{=} \overline{X_n} \sim \linebreak \sim \mathcal{N}\left(\overline{\mu_n};\ \frac{1}{n} \overline{\sigma^2_n}\right)$, kde pruh značí aritmetický průměr. Jsou-li navíc všechny veličiny $ X_j $ takzvaně i.~i.~d., tj.~nezávislé a~se stejným rozdělením, pak $ \overline{X_n} \sim \mathcal{N}(\mu;\ \frac{1}{n}\sigma^2)$. V~praxi to znamená, že rozdělení $ n $-krát nezávisle opakovaného experimentu má $ n $-krát menší rozptyl -- data jsou koncentrována v~blízkosti střední hodnoty. | ||
+ | \end{dusl} | ||
+ | \end{enumerate} | ||
+ | |||
+ | \subsection{Rozdělení zkonstruovaná pomocí $ \mathcal{N} $} | ||
+ | Skrze různé transformace lze z~normálního rozdělení odvodit mnoho dalších. Uvedeme si nyní několik z~nich. | ||
+ | \begin{enumerate} | ||
+ | \item \textbf{Rozdělení chí kvadrát.} Je-li $ X \sim \mathcal{N}(0,1) $, transformací $ Y = X^2 $ (není prostá!) dostaneme rozdělení zvané \emph{chí kvadrát} s~jedním stupněm volnosti, psáno $ Y \sim \chi^2(1) $. Tuto úvahu lze zobecnit na součet druhých mocnin $ n $ náhodných veličin, jež jsou i.~i.~d. Pak dostáváme chí kvadrát s~$ n $ stupni volnosti: $ Y = \sum_{j=1}^n X_j^2 \sim \chi^2(n) $. Využívá se například při konstrukci intervalu spolehlivosti pro rozptyl náhodné veličiny. Graf hustoty viz na obrázku \ref{fig3a-chi-pdf}. | ||
+ | \item \textbf{Log-normální rozdělení.} Řekneme, že veličina~$ X$ má log-normální rozdělení, právě když $ \ln X $ má normální rozdělení. Jinými slovy: jestliže $ X \sim \mathcal{N}(\mu, \sigma^2) $, pak $ \mathrm{e}^X \sim \mathrm{LN}(\mu, \sigma^2) $. Z~obrázku \ref{fig3b-lognorm-cdf} je vidět, že "chvosty" tohoto rozdělení jsou oproti normálnímu vyšší, tedy pravděpodobnost, že při tomto rozdělení naměříme vysoké hodnoty, je také vyšší. | ||
+ | \begin{figure}[h] | ||
+ | \centering | ||
+ | \begin{subfigure}[h]{0.6\textwidth} | ||
+ | \includegraphics[width=1\textwidth]{Fig3a-chi-kvadrat-pdf.png} | ||
+ | \caption{\mbox{Graf $ f_X $ pro různé hodnoty $ n $ při $ X \sim \chi^2(n) $}.} | ||
+ | \label{fig3a-chi-pdf} | ||
+ | \end{subfigure} | ||
+ | \begin{subfigure}[h]{0.6\textwidth} | ||
+ | \centering | ||
+ | \includegraphics[width=1\textwidth]{Fig3b-log-normalni-pdf.png} | ||
+ | \caption{\mbox{Graf $f_X $ pro různé hodnoty parametrů $ \mu $ a $ \sigma^2$ při $ X \sim \mathrm{LN}(\mu, \sigma^2) $.}} | ||
+ | \label{fig3b-lognorm-cdf} | ||
+ | \end{subfigure} | ||
+ | \label{fig-chi-lognorm-rozdeleni} | ||
+ | \caption{Graf hustoty pravděpodobnosti při chí kvadrát, resp. log-normálním rozdělení.} | ||
+ | \end{figure} | ||
+ | \item \textbf{Cauchyho rozdělení.} Vzniká podílem i.~d. veličin $ X, Y \sim \mathcal{N}(0,1) $, píšeme $ \frac{X}{Y} \sim \mathrm{C}(0,1) $. Jeho střední hodnota ani rozptyl nejsou definovány. Nachází využití ve fyzice, kde je také známé jako Lorentzovo rozdělení. | ||
+ | \item \textbf{Studentovo\footnote{Pochází od W.~S.~Gosseta (1876--1937), který vystupoval pod pseudonymem \emph{Student}.} rozdělení.} Nechť $ X \sim \mathcal{N}(0,1) $ a $ Y \sim \chi^2(n) $ jsou nezávislé. Pak má veličina $ \frac{X}{\sqrt{Y/n}} $ studentovo rozdělení, symbolicky $ \frac{X}{\sqrt{Y/n}} \sim \mathrm{t}(n) $. Veličina $ Y $ je tedy znormována a~odmocněna. Viz obrázek \ref{fig4a-student-pdf}. | ||
+ | \item \textbf{Rozdělení $ \mathrm{F} $}, též zvané \textbf{Fisherovo--Snedecorovo}, vzniká jako podíl dvou nezávislých normovaných veličin $ X \sim \chi^2(n) $ a $ Y \sim \chi^2(m) $, píšeme $ \frac{X/n}{Y/m} \sim \mathrm{F}(n,m) $. Viz obrázek \ref{fig4b-F-pdf}. | ||
+ | \begin{figure}[h] | ||
+ | \centering | ||
+ | \begin{subfigure}[h]{0.60\textwidth} | ||
+ | \includegraphics[width=1\textwidth]{Fig4a-studentovo-pdf.png} | ||
+ | \caption{\mbox{Graf $ f_X $ pro různé hodnoty $ n $ při $ X \sim \mathrm{t}(n) $}.} | ||
+ | \label{fig4a-student-pdf} | ||
+ | \end{subfigure} | ||
+ | \begin{subfigure}[h]{0.60\textwidth} | ||
+ | \centering | ||
+ | \includegraphics[width=1\textwidth]{Fig4b-rozdeleniF-pdf.png} | ||
+ | \caption{\mbox{Graf $f_X $ pro různé hodnoty parametrů $ n $ a $ m $ při $ X \sim \mathrm{F}(n, m) $.}} | ||
+ | \label{fig4b-F-pdf} | ||
+ | \end{subfigure} | ||
+ | \label{fig-studentovo-F-rozd} | ||
+ | \caption{Graf hustoty pravděpodobnosti při studentově, resp. $ \mathrm{F} $-rozdělení.} | ||
+ | \end{figure} | ||
+ | \end{enumerate} | ||
+ | \newpage | ||
+ | \begin{defi} | ||
+ | Řekneme, že náhodná veličina $ \xx $ má rozdělení \textbf{exponenciální třídy}, právě když $(\forall\, \mx \in \mathbb{R}^n)(\forall\, \bm{\theta} \in \Theta \subset \mathbb{R}^k) $ platí | ||
+ | \begin{equation*} | ||
+ | \xx \sim f_{\xx}(\mx) = c(\bm{\theta}) h(\mx) \exp(\bm{Q}(\bm{\theta}) \cdot \bm{T}(\mx)), | ||
+ | \end{equation*} | ||
+ | přičemž | ||
+ | \begin{itemize} | ||
+ | \item $ k \leq n $, | ||
+ | \item $ c = c(\bm{\theta}) $ je taková normovací konstanta, že $ c(\bm{\theta}) = \int_{\mathbb{R}^n} h(\mx) \exp\bigl(\bm{Q}(\bm{\theta}) \cdot \bm{T}(\mx)\bigr) \dd\mx < +\infty$, | ||
+ | \item mezi $ \bm{Q} $ a $ \bm{T} $ je skalární součin. Jde o zobrazení $ \bm{Q}\colon \mathbb{R}^k \rightarrow \mathbb{R}^k$ a $ \bm{T}\colon \mathbb{R}^n \rightarrow \mathbb{R}^k $. Vektorová funkce $ \bm{T} $ transformuje $ n $-rozměrnou náhodnou veličinu do $ k $-dimenzionálního prostoru, aby mohl být proveden skalární součin s~obrazem~$ \bm{Q} $. | ||
+ | \end{itemize} | ||
+ | Mezi rozdělení exponenciální třídy patří např. normální, binomické a~Poissonovo. | ||
+ | \end{defi} |
Aktuální verze z 18. 9. 2020, 14:06
[ znovu generovat, | výstup z překladu ] | Kompletní WikiSkriptum včetně všech podkapitol. | |
PDF Této kapitoly | [ znovu generovat, | výstup z překladu ] | Přeložení pouze této kaptioly. |
ZIP | Kompletní zdrojový kód včetně obrázků. |
Součásti dokumentu 01MIP
součást | akce | popis | poslední editace | soubor | |||
---|---|---|---|---|---|---|---|
Hlavní dokument | editovat | Hlavní stránka dokumentu 01MIP | Vandenie | 18. 9. 2020 | 16:24 | ||
Řídící stránka | editovat | Definiční stránka dokumentu a vložených obrázků | Vandenie | 18. 9. 2020 | 13:56 | ||
Header | editovat | Hlavičkový soubor | Vandenie | 18. 9. 2020 | 14:28 | header.tex | |
Kapitola0 | editovat | Předmluva | Vandenie | 18. 9. 2020 | 13:19 | predmluva.tex | |
Kapitola1 | editovat | Náhodné jevy | Vandenie | 18. 9. 2020 | 13:23 | nahodne_jevy.tex | |
Kapitola2 | editovat | Náhodné veličiny | Vandenie | 18. 9. 2020 | 13:28 | nahodne_veliciny.tex | |
Kapitola3 | editovat | Rozdělení pravděpodobnosti, distribuční funkce | Vandenie | 18. 9. 2020 | 13:31 | rozdeleni.tex | |
Kapitola4 | editovat | Hustota pravděpodobnosti | Vandenie | 18. 9. 2020 | 14:06 | hustota.tex | |
Kapitola5 | editovat | Charakteristiky hustoty pravděpodobnosti | Vandenie | 4. 12. 2020 | 20:35 | charakteristiky.tex | |
Kapitola6 | editovat | Charakteristická funkce náhodné veličiny | Vandenie | 18. 9. 2020 | 14:12 | char_funkce.tex | |
Kapitola7 | editovat | Konvergence na prostoru náhodných veličin | Vandenie | 4. 12. 2020 | 20:36 | konvergence.tex |
Vložené soubory
soubor | název souboru pro LaTeX |
---|---|
Soubor:Fig1-uniformni-rozdeleni.png | Fig1-uniformni-rozdeleni.png |
Soubor:Fig2a-normalni-pdf.png | Fig2a-normalni-pdf.png |
Soubor:Fig2b-normalni-cdf.png | Fig2b-normalni-cdf.png |
Soubor:Fig3a-chi-kvadrat-pdf.png | Fig3a-chi-kvadrat-pdf.png |
Soubor:Fig3b-log-normalni-pdf.png | Fig3b-log-normalni-pdf.png |
Soubor:Fig4a-studentovo-pdf.png | Fig4a-studentovo-pdf.png |
Soubor:Fig4b-rozdeleniF-pdf.png | Fig4b-rozdeleniF-pdf.png |
Soubor:Fig5-kvantily.png | Fig5-kvantily.png |
Soubor:Fig6-grafy-skoro-jiste.png | Fig6-grafy-skoro-jiste.png |
Soubor:Fig7-graf-gn.png | Fig7-graf-gn.png |
Soubor:Fig8-volba-epsilon.png | Fig8-volba-epsilon.png |
Zdrojový kód
%\wikiskriptum{01MIP} % \chapter{Hustota pravděpodobnosti} \section{Diskrétní náhodné veličiny} \begin{defi} Nechť $ \xx = (X_1, \ldots, X_n) $ je náhodná veličina s~rozdělením $ P^{\xx} $. Nazveme ji \textbf{diskrétní}, právě když $ \ran \xx = \lbrace \mx_j \rbrace_{j=1}^{m, +\infty}$, neboli když je její obor hodnot nejvýše spočetný. Položme dále $ p_k := P(\xx = \mx_k) $. V~tom je ale ukryto $ n $ podmínek, neboť bychom správně měli psát $ P(\xx = \mx_k) = P(X_1 = x^1_k, \ldots, X_n = x^n_k) $, kde $ x^j_k $ je $ j $-tá složka vektoru $ \mx_k $. Definujme nyní \textbf{hustotu pravděpodobnosti} náhodné veličiny $ \xx $ vztahem \begin{equation*} f_{\xx}(\mx) = \begin{cases} p_k &\text{ pro } \mx = \mx_k,\\ 0 &\text{ jinak.} \end{cases} \end{equation*} Říká nám, "jak často nastává $ \mx_k $", proto se jí někdy říká \emph{frekvenční funkce}. \end{defi} \begin{pozn} Pokud je $ \xx $ diskrétní, pak $ p_k = P(\xx = \mx_k) \stackrel{\ref{pozn-distrib-fce}}{=} F(\mx_k) - F_{\xx}(\mx_{k-}) \neq 0$. Kdyby tomu tak nebylo, pak by byla $ F_{\xx}$ spojitá v~bodě $ \mx_k $, což ale nemůže nastat, jelikož je $ \ran{\xx} $ nejvýše spočetný. Protože může distribuční funkce nabývat pouze spočetně mnoha hodnot, můžeme učinit následující pozorování: \begin{itemize} \item V $ \mathbb{R} $: $ F_X(x) = P(X \leq x) = \sum_{x_k\leq x}P(X = x_k) = \sum_{k=1}^{n,+\infty} P(X = x_k)\chi_{[x_k, +\infty)}(x)$, kde $ \chi $ je charakteristická funkce. \item $ (\forall\, k \in \mathbb{N})(p_k \in [0,1]) $. \item $ \sum_{k=1}^{n,+\infty}p_k = P(\Omega) = 1 $. \item $ (\forall \, k \in \mathbb{N})\bigl(f(x_k) \in [0,1] \wedge \sum_{k=1}^{n,+\infty}f_X(x_k) = 1 \bigr)$. Hustota pravděpodobnosti je znormována na jedničku. \end{itemize} \end{pozn} \begin{priklad} Ukažme si nyní několik konkrétních příkladů rozdělení diskrétních veličin. \begin{enumerate} \item \textbf{Diracovo} $ \delta $-rozdělení je nejjednodušším příkladem. Značíme ho $\delta_c $ a definujeme následovně: $ X \sim \delta_c \Leftrightarrow P(X = c) = 1 $. \item \textbf{Rovnoměrné} rozdělení $ X $ na $ \{x_1, \ldots, x_m\} $ definujeme takto: \begin{equation*} \left( \forall k \in \hat{m}\right)\left(P(X = x_k) = \frac{1}{m}\right) \end{equation*} a píšeme $ X \sim \mathcal{U}_{\{x_1, \ldots, x_n\}} $, kde $ \mathcal{U} $ znamená uniformní (rovnoměrné). \item \textbf{Poissonovo}\footnote{Siméon Denis Poisson (1781--1840), čti [poason].} rozdělení pro řídké jevy je posledním diskrétním rozdělením, které zde uvedeme. K~tomu, abychom ho mohli definovat, bude ovšem potřeba vyslovit a dokázat tzv.~\emph{zákon řídkých jevů}. \end{enumerate} \end{priklad} \begin{veta}[Zákon řídkých jevů] Buď $ t \geq 0$ čas, $ t_0 = 0 $, $ h >0 $. Nechť $ A $ je sledovaný jev a $ X_t $ je náhodná veličina vyjadřující počet událostí (příznivých jevů), kdy jev $ A $ nastal do času $ t $. Nechť dále platí: \begin{enumerate} \item\label{zrj1} Hodnota $ X_{t+h} - X_t $ nezávisí na $ X_t $. Jinými slovy: počet jevů mezi časy $ t $ a $ t+h $ nezávisí na tom, co se událo v~minulosti. \item\label{zrj2} $ P\left(X_{t+h} - X_t = 1\right) = \lambda \cdot h + o(h) $ při $ h \rightarrow 0_+ $, kde $ \lambda > 0 $ a $ o(h) $ je člen, který jde rychleji k~nule než $ h $, tj. $ \lim_{h \rightarrow 0_+} \frac{o(h)}{h} = 0 $. Tato podmínka vyjadřuje skutečnost, že pravděpodobnost, že jev $ A $ nastane právě jednou v~časovém intervalu o~délce $ h $, je až na zbytek $ o(h) $ přímo úměrná délce tohoto intervalu. \item\label{zrj3} $ P\left(X_{t+h} - X_t \geq 2\right) = o(h) $, tj. jevy jsou \emph{řídké}. Pravděpodobnost, že v~intervalu délky~$ h $ nastanou alespoň dva jevy, je malá. \item\label{zrj4} Funkce $ p_k(t) = P(X_t = k) $ je diferencovatelná vzhledem k $ t $ pro každé $ k \in \mathbb{N} $. Tento bod je důležitý spíše pro samotný důkaz věty. \end{enumerate} Pak platí: \begin{equation} \left(\forall\, t > 0\right)\left(\forall\, k \in \mathbb{N}\right)\Bigl(P(X_t = k) = \frac{\left( \lambda t\right)^k}{k!} \mathrm{e}^{-\lambda t}\Bigr). \end{equation} \end{veta} \begin{proof} $ $ \begin{enumerate}[(I)] \item Nejdříve upravme funkci $ p_k(t+h) $ pro $ k = 0 $. \begin{align*} p_0(t+h) = P(X_{t+h} = 0) &= P(X_t = 0) \cdot P\left(X_{t+h} - X_t = 0\right) \\ & \stackrel{\ref{zrj2}}{=} p_0(t) \cdot \left(1-\lambda h - o(h) - o(h)\right) \end{align*} Pravděpodobnost $ P\left(X_{t+h} - X_t = 0\right)$ jsme vyjádřili pomocí pravděpodobnosti komplementárního jevu, tedy že nastane právě jeden jev či více jevů. Jednoduchou ekvivalentní úpravou (jelikož $ h \neq 0 $) dostaneme: \begin{equation*} \frac{p_0(t+h) - p_0(t)}{h} = -\lambda p_0(t) - \frac{o(h)}{h} \end{equation*} Rozdíl členů $ o(h) $ můžeme sloučit do jednoho, protože na jejich konvergenci k~nule rychleji než $ h $ to nic nemění. Nyní pouze provedeme limitní přechod pro $ h \rightarrow 0_+ $ a získáme lineární diferenciální rovnici 1. řádu: \begin{equation} p'_0(t) = - \lambda p_0(t). \end{equation} Derivace $ p'_0(t) $ jistě existuje a je konečná dle předpokladu \ref{zrj4}. \item Nyní analogicky rozepišme funkce $ p_k(t+h) $ pro $ k \geq 1 $. \begin{align*} p_k(t+h) &= P(X_{t+h} = k) \\ &= \sum_{j=0}^{k} P(X_t = j)P(X_{t+h} - X_t = k-j) \\ &\!\!\!\stackrel{\ref{zrj2} \text{ a } \ref{zrj3}}{=} \sum_{j=0}^{k-2} p_j(t) o(h) + p_{k-1}(t)\bigl(\underbrace{\lambda h + o(h)}_{\text{dle \ref{zrj2}}}\bigr) + p_k(t)\bigl(1 - \lambda h - o(h) - o(h)\bigr). \end{align*} Stejně jako v bodě (I) upravíme rovnici tak, abychom měli vlevo připravenou derivaci $ p_k(t) $: \begin{equation*} \frac{p_k(t+h) - p_k(t)}{h} = \sum_{j=0}^{k-2} p_j(t) \frac{o(h)}{h} + \lambda p_{k-1}(t) + p_{k-1}(t)\frac{o(h)}{h} - \lambda p_k(t) - p_k(t)\frac{o(h)}{h}. \end{equation*} Po limitním přechodu $ h \rightarrow 0_+ $ dostáváme diferenciální rovnice \begin{equation} \forall k \geq 1\colon \quad p'_k(t) = \lambda p_{k-1}(t) - \lambda p_k(t). \end{equation} Dohromady máme tedy soustavu spočetně mnoha diferenciálních rovnic. Její řešení je tvaru $ p_k(t) = P(X_t = k) = \frac{\left( \lambda t\right)^k}{k!} \mathrm{e}^{-\lambda t} $. Přesvědčíme se o~tom pouhým dosazením. \end{enumerate} Poissonovo rozdělení dobře popisuje počet událostí za \emph{jednotku} času, např. počet částic emitovaných radioaktivním izotopem za sekundu či počet hovorů na ústředně za hodinu.\qedhere \end{proof} \begin{defi}\label{def-podm-hustota-diskr} Buď nyní $ \xx = (X,Y) $ náhodná veličina s diskrétním rozdělením. \textbf{Podmíněnou hustotu pravděpodobnosti} náhodné veličiny $ \xx $ za podmínky, že nastane jev $ Y = y $, definujeme $\forall x \in \ran X$ předpisem \begin{equation}\label{eq-podm-hustota-pp} f_{X\mid Y}(x \mid y) := \frac{f_{(X,Y)}(x,y)}{f_Y(y)}, \end{equation} je-li $ y \in \ran Y $ a $ f_Y(y) \neq 0 $. \end{defi} \begin{pozn} $ $ \begin{itemize} \item Správně bychom měli podmíněnou hustotu značit $ f_{X\mid Y = y}(x) $, odkud je lépe vidět, že $ y $ je pevný parametr. Jak už to ale bývá, logičtější varianta se neuchytila. \item Vztah \eqref{eq-podm-hustota-pp} by nám měl nápadně připomínat definici podmíněné pravděpodobnosti \eqref{podm-pp}. Skutečně: Budeme-li považovat rovnosti $ X = x $, resp. $ Y = y $ za jevy\footnote{Toto přiřazení je v~diskrétním modelu možné.} $ A $, resp. $ B $, obdržíme \begin{equation*} \frac{f_{(X,Y)}(x,y)}{f_Y(y)} = \frac{P(X = x, Y = y)}{P(Y=y)} = \frac{P(A \cap B)}{P(B)} = P(A \mid B) = P(X = x \mid Y= y). \end{equation*} \end{itemize} \end{pozn} \section{Spojité náhodné veličiny} Odstavec o~spojitých náhodných veličinách začneme větou z~teorie míry, jejíž tvrzení je velice obecné, ale speciální volba nám umožní zavést zásadní pojem hustoty pravděpodobnosti spojité veličiny. Nejdříve však musíme definovat $ \sigma $-finitní míry a jejich absolutní spojitost. \begin{defi}\label{def-sigma-finitnost} Nechť $ \lambda $ je obecná míra na $ (\mathbb{R}^n, \bb_n) $. Nazveme ji $ \sigma $\textbf{-finitní} (též $ \sigma $-konečná) právě tehdy, když \begin{equation*} \Bigl(\exists\,(B_j)_{j=1}^{+\infty} \in \bb_n,\ \bigcup_{j=1}^{+\infty} B_j = \mathbb{R}^n \Bigr)(\forall\, j \in \mathbb{N})(\lambda(B_j) < +\infty). \end{equation*} Vezměme například míru Lebesgueovu $ \lambda_{\text{L}} $. Jak známo, není konečná ($ \lambda_{\text{L}}(\mathbb{R}) = +\infty $), ale je sigma-\-finitní, neboť dovedeme reálnou osu pokrýt spočetně mnoha částečnými intervaly, jejichž míra konečná je. Jako příklad poslouží pokrytí $ \mathbb{R} = \bigcup_{j=-\infty}^{+\infty} (j,~j+1]$, přičemž platí $ \lambda_{\text{L}}\bigl((j, j+1]\bigr) = 1 $. Analogicky je $ \lambda_{\text{L}} $ $ \sigma $-finitní na $ \mathbb{R}^n $. \end{defi} \begin{defi}\label{def-abs-spoj} Míra $ \nu $ je \textbf{absolutně spojitá} vzhledem k~míře $ \lambda $ právě tehdy, když \begin{equation}\label{eq-def-abs-spoj} (\forall\, B \in \bb_n)(\lambda(B) = 0 \Rightarrow \nu(B) = 0), \end{equation} značeno $ \nu \ll \lambda $. Je-li navíc míra $ \nu $ \emph{konečná}, platí následující ekvivalence: \begin{equation}\label{eq-def-abs-spoj-konecna} \nu \ll \lambda \Longleftrightarrow (\forall\, \varepsilon > 0)(\exists\, \delta > 0)(\forall B \in \bb_n)(\lambda(B) < \delta \Rightarrow \nu(B) < \varepsilon). \end{equation} Též říkáme, že "$ \lambda $ dominuje míře $ \nu $". Pro neomezenou míru $ \nu $ nejsou tyto výroky ekvivalentní.\footnote{Na \url{https://math.stackexchange.com/questions/1691328/question-on-equivalent-ideas-of-absolute-continuity-of-measures?noredirect=1\&lq=1} či na \\ \url{https://math.stackexchange.com/questions/780824/equivalent-ideas-of-absolute-continuity-of-measures} najde čtenář protipříklad, kde pro neomezenou míru $ \nu $ neplatí implikace ve směru ($ \Rightarrow $).} \end{defi} \begin{pozn} Dr.~Kůs na přednášce definoval absolutní spojitost vztahem \eqref{eq-def-abs-spoj-konecna}. Nám to však nedalo a~po porovnání s~literaturou jsme zjistili, že ostatní autoři\footnote{"Ostatními autory" rozumíme internet a jeho nesčetné množství zdrojů.} ji definují přísnější podmínkou~\eqref{eq-def-abs-spoj}. Budeme tedy světoví a~absolutní spojitostí budeme rozumět splnění podmínky \eqref{eq-def-abs-spoj}. \end{pozn} \begin{veta}[Radonova--Nikodymova\footnote{Johann Radon (1887--1956); Otto Nikodym (1887--1974).}]\label{v-radon-nikodym} Buďte $ \lambda,\ \nu $ dvě $ \sigma $-finitní míry na prostoru $ (\mathbb{R}^n, \bb_n) $. Nechť $ \nu $ je absolutně spojitá vzhledem k~míře $ \lambda $. Potom platí: \begin{equation} \left(\exists^1\, f\colon \mathbb{R}^n \rightarrow \mathbb{R}_0^+, f \text{ borelovsky měř.}\right)(\forall\, B \in \bb_n)\left(\nu(B) = \int_{B} f \dd\lambda \right), \end{equation} kde $ f $ je jednoznačná vzhledem k~$ \lambda $ \emph{až na množinu míry nula}. Tuto funkci nazveme \textbf{derivací} míry~$ \nu $ vzhledem k~míře $ \lambda $ a píšeme $ f = \diff{\nu}{\lambda} $. \end{veta} \begin{proof} $ $ \begin{enumerate}[a)] \item \textbf{Jednoznačnost.} Nechť existují dvě funkce splňující tvrzení věty, tj. $ \int_{B}f\dd\lambda = \nu(B) = \int_{B} g \dd\lambda $. Zvolme libovolně $ \varepsilon > 0 $, $ \tilde{\varepsilon} > 0 $ a sestrojme množiny \begin{align*} B_\varepsilon &:= \lbrace \mx \in \mathbb{R}^n \mid f(\mx) + \varepsilon \leq g(\mx) \rbrace, \\ B_{\tilde{\varepsilon}} &:= \lbrace \mx \in \mathbb{R}^n \mid f(\mx) - \tilde{\varepsilon} \geq g(\mx) \rbrace. \end{align*} Jako obvykle bychom chtěli ukázat rovnost funkcí $ f $ a $ g $, a sice skoro všude (s.~v.). Naším cílem tedy je ověřit, že tyto množiny mají nulovou míru. Integrujme první nerovnost přes $ B_\varepsilon $ (zůstane zachována): \begin{align*} \int_{B_\varepsilon} f \dd\lambda + \varepsilon\int_{B_\varepsilon}\dd\lambda &\leq \int_{B_\varepsilon} g \dd\lambda\\ \nu(B_\varepsilon) + \varepsilon\underbrace{\lambda(B_\varepsilon)}_{\geq 0} &\leq \nu(B_\varepsilon). \end{align*} Má-li nerovnost platit, kvůli kladnosti $ \varepsilon $ není jiná možnost, než aby $ \lambda(B_\varepsilon) = 0$. Integrací druhé nerovnosti dojdeme ke vztahu \begin{equation*} \nu(B_{\tilde{\varepsilon}}) - \tilde{\varepsilon}\underbrace{\lambda(B_{\tilde{\varepsilon}})}_{\geq 0} \geq \nu(B_{\tilde{\varepsilon}}), \end{equation*} z~něhož nutně vyplyne $ \lambda(B_{\tilde{\varepsilon}}) = 0 $, a to pro všechna $ \varepsilon, \tilde{\varepsilon} > 0 $. To ale znamená, že $f(\mx) = g(\mx) $ skoro všude. \item \textbf{Existence.} Nebudeme dokazovat existenci funkce $ f $ v~celé délce. Čtenář nejspíš od dr.~Kůse dostal kopii důkazu Johna von~Neumanna, který se vydal funkcionálně-analytickou cestou. My zde naznačíme schéma jeho postupu. Prvně je potřeba vyslovit následující lemma. \begin{lemma}[Lebesgueova dekompozice konečné míry]\label{lemma-lebesgue} Mějme dvě \emph{konečné} míry $ \nu $ a $ \lambda $, $ B \in \bb_n $. Potom platí: \begin{equation*} \left(\exists\, f\colon \mathbb{R}^n \rightarrow \mathbb{R}_0^+,\ f \text{ borelovsky měř.}\right)\left(\exists\, C \in \bb_n,\ \lambda(C) = 0\right)\Bigl(\nu(B) = \int_{B} f \dd\lambda + \nu(B \cap C) \Bigr). \end{equation*} \end{lemma} V~důkazu lemmatu se využívá zásadního tvrzení, s~nímž jsme se setkali již v~LAL2, a sice Rieszovy\footnote{Frigyes Riesz (1880--1956), čti [friděš rís].} věty o reprezentaci: \emph{Nechť $ \mathcal{H} $ je Hilbertův prostor, $ \mathcal{H}^{*} $ prostor k~němu duální a $ f \in \mathcal{H}^{*}$ je omezený lineární funkcionál. Pak $ (\exists^1 y \in \mathcal{H})(\forall x \in \mathcal{H})(f(x) = \langle x \mid y \rangle ) $}. Ke konstrukci funkce~$ f $ z~tvrzení lemmatu se použije právě tohoto jedinečného $ y $ z~Rieszovy věty, ale dále v~jeho důkazu nebudeme pokračovat. Nyní vezměme míry $ \nu$ a $ \lambda $ z~předpokladu věty. Zvolme $ \mathcal{H} = L^2(\mathbb{R}^n, \pi)$, kde $ L^2(\mathbb{R}^n, \pi) $ je prostor funkcí integrabilních s~kvadrátem vzhledem k~míře $ \pi$.\footnote{$ L^2 $ je jako jediný z~$ L^p $ prostorů Hilbertův.} Položme $ \pi = \lambda + \nu $. O~mírách $ \lambda,~\nu $ víme, že jsou $ \sigma $-finitní a že $ \nu \ll \lambda $. Máme tedy $ \sigma $-konečnou míru~$ \pi $, ale do lemmatu \ref{lemma-lebesgue} potřebujeme, aby byla \emph{konečná}. Sigma-finitnost $ \pi $ podle definice \ref{def-sigma-finitnost} zaručuje existenci pokrytí $ \bigcup_{1}^{+\infty}B_j = \mathbb{R}^n $ a navíc $ (\forall\, j \in \mathbb{N})(\pi(B_j) < +\infty) $, takže konečnost míry $ \pi $ dovedeme zařídit na každé pokrývací množině $ B_j \in \bb_n $. Na nich aplikujeme lemma \ref{lemma-lebesgue}, tedy \begin{equation*} (\forall\, j \in \mathbb{N})(\exists\, f_j \geq 0)(\exists\, C_j \in \bb_n,\ \lambda(C_j) = 0)\Bigl(\nu(B) = \int_B f_j \dd\lambda + \nu(B \cap C_j )\Bigr), \end{equation*} kde $ B \subset B_j \in \bb_n $. Každé $ f_j $ bylo zkonstruováno pomocí Rieszovy věty. Naším cílem je odstranit "zbytek" za integrálem ve vztahu výše. Zkusme, zda naším kandidátem na finální funkci~$ f $ není například \begin{equation*} f := \sum_{j=1}^{+\infty}\frac{1}{\lambda(B_j)}f_j\chi_{B_j}. \end{equation*} Pokrytí umíme volit disjunktní a složené z~množin kladné míry. Nechť je dále $ C = \bigcup_{1}^{+\infty}C_j $. Jelikož jde o~spočetné sjednocení množin míry nula, je i~$ \lambda(C) = 0$. Víme, že $ \nu \ll \lambda $. To podle definice \eqref{eq-def-abs-spoj} znamená: $(\forall C \in \bb_n)(\lambda(C) = 0 \Rightarrow \nu(C) = 0 )$. Odhadněme $ 0 \leq \nu(B \cap C) \leq \nu(C) $, ale díky implikaci o řádek výše je $ \nu(C) = 0 $, a tedy $ \nu(B \cap C) = 0 $. Tímto jsme se zbavili zbytku v~dekompozičním lemmatu a obdrželi jsme tvrzení Radonovy--Nikodymovy věty.\qedhere \end{enumerate} \end{proof} \begin{pozn} Není pravdou, že absolutní spojitost míry $ \nu $ vzhledem k~$ \sigma $-finitní míře $ \lambda $ implikuje $ \sigma $-konečnost míry $ \nu $! Jednoduchý protipříklad je k~nalezení zde: \url{https://math.stackexchange.com/questions/1576894/sigma-finiteness-and-absolutely-continuous-measures?rq=1}. Proto nelze v~R--N větě předpokládat pouze $ \sigma $-konečnost míry $ \lambda $ a $ \nu \ll \lambda $. Dovolujeme si tedy dr.~Kůsovi oponovat a~předpokládáme $ \sigma $-finitnost jak u~míry $ \lambda $, tak u~míry~$ \nu $ (což je ve shodě s~ostatní literaturou). \end{pozn} Zaloví-li čtenář důkladně v~paměti, uvědomí si, že obrácená implikace v~R--N větě je takřka totožná s~větou o~absolutní spojitosti Lebesgueova integrálu z~MAA4.\footnote{Viz \emph{Turistický průvodce MAA4}, věta 29.8. Podrobněji pak ve skriptech \emph{Integrální počet} od L.~Vrány, věta 10.6.} \begin{veta}[Absolutní spojitost integrálu] Buď $ f\colon \mathbb{R}^n \rightarrow \mathbb{R}$ nezáporná borelovsky měřitelná funkce, $ f \in L^1(\mathbb{R}^n, \bb_n, \lambda) $. Pro $ B \in \bb_n $ definujme funkci $ \nu(B) := \int_{B}f \dd\lambda$. Pak $ \nu \ll \lambda $, neboli \begin{equation*} (\forall\,\varepsilon > 0)(\exists\, \delta > 0)(\forall B \in \bb_n)\Bigl(\lambda(B) < \delta \Rightarrow \int_{B}f \dd\lambda < \varepsilon\Bigr). \end{equation*} \end{veta} Takto definovaná míra $ \nu $ je díky integrabilitě $ f $ dokonce konečná, proto pro ni platí vztah $ \eqref{eq-def-abs-spoj-konecna} $ i~ve směru $ (\Rightarrow) $. Spojením dvou předchozích tvrzení dostáváme ekvivalenci: \begin{veta} Nechť $ \lambda $ a $ \nu $ jsou $ \sigma $-finitní míry. Pak platí: \begin{equation*} \nu \ll \lambda \Longleftrightarrow \left(\exists^1\, f\colon \mathbb{R}^n \rightarrow \mathbb{R}_0^+, f \text{ borelovsky měř.}\right)(\forall\, B \in \bb_n)\Bigl(\nu(B) = \int_{B} f \dd\lambda \Bigr), \end{equation*} přičemž funkce $ f $ je dána jednoznačně až na množinu míry nula. \end{veta} Nyní se konečně dozvíme, co pro nás obecný výsledek Radonovy--Nikodymovy věty znamená v~teorii pravděpodobnosti. Za míru $ \nu $ totiž můžeme speciálně vzít rozdělení náhodné veličiny (které je jistě mírou, a dokonce konečnou). Výsledkem je následující tvrzení. \begin{dusl}[Kritérium absolutní spojitosti rozdělení]\label{v-abs-spoj-rozdeleni} Nechť $ \xx\colon (\Omega, \sa, P) \rightarrow (\mathbb{R}^n, \bb_n) $ je náhodná veličina s~rozdělením $ P^{\xx} $. Nechť $ \lambda $ je $ \sigma $-konečná míra a položme $ P^{\xx} := \nu $ z~R--N věty. Potom platí: \begin{equation}\label{eq-abs-spoj-rozdeleni} P^{\xx} \ll \lambda \Longleftrightarrow \left(\exists^1\, f_{\xx}\colon \mathbb{R}^n \rightarrow \mathbb{R}_0^+, f_{\xx} \text{ borelovsky měř.}\right)(\forall\, B \in \bb_n)\Bigl(P^{\xx}(B) = \int_{B} f_{\xx} \dd\lambda \Bigr), \end{equation} kde $ f_{\xx} $ je jednoznačná až na množinu nulové míry. \end{dusl} \begin{defi}[Spojité rozdělení] Řekneme, že náhodná veličina $ \xx $ má \textbf{absolutně spojité rozdělení} vzhledem k~$ \sigma $-finitní míře~$ \lambda $, právě když $ P^{\xx} \ll \lambda $. Skoro všude jednoznačnou funkci~$ f_{\xx} $ z~věty \ref{v-abs-spoj-rozdeleni} nazveme \textbf{hustotou pravděpodobnosti} náhodné veličiny~$ \xx $, značíme $ f_{\xx} = \dd P^{\xx}/\dd \lambda $. \end{defi} \begin{pozn} Umíme-li spočítat integrál v~\eqref{eq-abs-spoj-rozdeleni}, pak automaticky dovedeme určit pravděpodobnost na libovolném intervalu. Zvolme nyní $ \lambda $ Lebesgueovu. Pro $ \bm{b} \in \mathbb{R}^{n} $ můžeme při speciální volbě $ B = \bigtimes_{j=1}^n(-\infty, b_j]$ psát \begin{equation*} P(\xx \leq \bm{b}) = P^{\xx}\Bigl(\bigtimes_{j=1}^n(-\infty, b_j)\Bigr) \stackrel{\eqref{eq-abs-spoj-rozdeleni}}{=} \int_B f_{\xx}(\mx) \dd\mx \stackrel{\text{Fub}}{=} \int_{-\infty}^{b_1} \cdots \int_{-\infty}^{b_n} f_{\xx}(\mx) \dd x_1 \cdots \dd x_n = F_{\xx}(\bm{b}). \end{equation*} Podobně můžeme spočítat například \begin{equation*} P(\bm{a} < \xx \leq \bm{b}) = \int_{a_1}^{b_1} \cdots \int_{a_n}^{b_n} f_{\xx}(\mx) \dd x_1 \cdots \dd x_n. \end{equation*} \end{pozn} Ověřovat podmínku $ \eqref{eq-abs-spoj-rozdeleni} $ pro všechny borelovské množiny by bylo příliš zdlouhavé a~nepraktické. Následující věta poskytuje ekvivalent k~tvrzení \ref{v-abs-spoj-rozdeleni}, ale pro mnohem užší skupinu množin, konkrétně pro množiny typu $ \bigtimes_{j=1}^n(-\infty, x_j] $, tj. ze systému $ \eqref{t1} $. \begin{veta}[Ekvivalentní definice ASR]\label{v-ekviv-def-ASR} Buď $ \xx $ náhodná veličina s~rozdělením $ P^{\xx} $ (dále už jen $ \xx \sim P^{\xx} $) a nechť $ \lambda $ je $ \sigma $-finitní míra. Potom platí následující nutná a postačující podmínka absolutní spojitosti rozdělení veličiny $ \xx $: \begin{equation*} P^{\xx} \ll \lambda \Longleftrightarrow \left(\exists^1\, f_{\xx}\colon \mathbb{R}^n \rightarrow \mathbb{R}_0^+, f_{\xx} \text{ borelovsky měř.}\right)(\forall\, \mx \in \mathbb{R}^n)\Bigl(F_{\xx}(\mx) = \int_{-\infty}^{x_1} \cdots \int_{-\infty}^{x_n} f_{\xx}(\bm{t}) \dd \bm{t} \Bigr). \end{equation*} Srovnej s~\eqref{eq-abs-spoj-rozdeleni}. \end{veta} \begin{proof} Dokažme dvě implikace. \begin{itemize} \item[$(\Rightarrow)$] Tento směr platí dokonce obecně (jak tvrdí R--N věta \ref{v-radon-nikodym}), tím spíše pro tento speciální typ borelovských množin. \item[$ (\Leftarrow) $] Mějme funkci $ f_{\xx} $ danou tvrzením věty. Jediné, co máme k~dispozici, je vztah $ \eqref{eq-abs-spoj-rozdeleni} $. Naším cílem bude pomocí funkce $ f_{\xx} $ sestrojit jistou míru $ P' $, o~níž potom dokážeme, že je rovna~$ P^{\xx} $. Pro všechny $ B \in \bb_n $ definujme funkci $ P' $ vztahem $ P'(B) := \int_B f_{\xx}(\mx) \dd \mx $ (pro naše účely volíme Lebesgueovu míru). Ukažme, že $ P' $ je pravděpodobnostní mírou. \begin{itemize} \item[K\ref{k1}.] S~využitím předpokladu máme \begin{equation*} P'(\mathbb{R}^n) = \idotsint\limits_{\mathbb{R}^n} f_{\xx}(\bm{t}) \dd \bm{t} = \lim_{\substack{ \forall i \in \hat{n}\\ x_i \rightarrow +\infty}} \int_{-\infty}^{x_1} \!\!\! \cdots \int_{-\infty}^{x_n} \mkern-8mu f_{\xx}(\bm{t}) \dd \bm{t} = \lim_{\substack{ \forall i \in \hat{n}\\ x_i \rightarrow +\infty}}\mkern-10mu F_{\xx}(\mx) \stackrel{\text{D\ref{d3c}}}{=} 1. \end{equation*} \item[K\ref{k2}.] Jelikož je $ f_{\xx} \geq 0$, je jistě i~$ P' \geq 0 $. \item[K\ref{k3}.] Zde využijeme $ \sigma $-aditivity Lebesgueova integrálu na disjunktním sjednocení; označme ho písmenem $ B $. \begin{equation*} P'\Bigl( \sum_{j=1}^{+\infty} B_j \Bigr) = \int_{B}\!\! f_{\xx}(\mx) \dd\mx = \sum_{j=1}^{+\infty} \int_{B_j}\mkern-10mu f_{\xx}(\mx) \dd\mx = \sum_{j=1}^{+\infty} P'(B_j). \end{equation*} \end{itemize} Ukázali jsme, že $ P' $ je pravděpodobnostní míra na $ (\mathbb{R}^n, \bb_n) $. Nesmíme však zapomenout, že na tomtéž prostoru máme ještě $ P^{\xx} $. Z~věty o jednoznačnosti \ref{v-o-jednoznacnosti} ale víme, distribuční funkce $ F_{\xx} $ charakterizuje rozdělení $ P^{\xx} $ \emph{jednoznačně}. Tím pádem musí $ F_{\xx} = P^{\xx}\!\!\mid_{\tau_{1,n}} \stackrel{!}{=} P' $. Jestliže se ale dvě míry rovnají na $ \tau_{1, n} $, přičemž $ \sigma(\tau_{1, n}) = \bb_n $, potom už se nutně musejí rovnat na celé $ \sigma $-algebře $ \bb_n $ (podle věty \ref{v-o-rovnosti-PQ}). Tím je důkaz dokončen. \end{itemize} \end{proof} \begin{pozn}\label{pozn-derivovani-F} Je-li $ F_{\xx}(\mx) = \int\limits_{-\infty}^{x_1}\cdots \int\limits_{-\infty}^{x_n} f_{\xx}(\bm{t}) \dd\bm{t} $, lze odsud $ f_{\xx} $ získat derivováním integrálu jako funkce horní meze v~bodech spojitosti: \begin{equation*} f_{\xx}(\mx_0) = \frac{\partial^n}{\partial x_1 \cdots \partial x_n}F_{\xx}(\mx_0). \end{equation*} \end{pozn} V~dalších větách uvažujme Lebesgueovu míru. \begin{veta}[O marginální hustotě]\label{v-o-marg-hustote} Nechť $ \xx \sim P^{\xx} $ a $ \xx $ má ASR vzhledem k~Lebesgueově míře~$\lambda $.\footnote{Díky~R--N větě lze psát též $ \xx \sim f_{\xx} $.} Označme $ \xx' := \xx \setminus X_j $. Pak má veličina $ \xx' $ ASR vzhledem k~$ (n-1) $-rozměrné Lebesgueově míře a pro její hustotu platí: \begin{equation*} \forall \mx' \in \mathbb{R}^{n-1}\colon \quad f_{\xx'}(\mx') = \int_{-\infty}^{+\infty} \mkern-18mu f_{\xx}(\mx) \dd x_j. \end{equation*} Fixujeme tedy $ n-1 $ proměnných a integrujeme přes $ x_j $. Funkci~$ f_{\xx'} $ nazýváme \textbf{marginální hustotou pravděpodobnosti}. \end{veta} \begin{proof} V~důkazu hned několikrát využijeme Fubiniho větu. Její použití bude legální, protože je~$ f_{\xx} $ na kartézském součinu integrabilní. Podle předchozí věty máme \begin{align*} F_{\xx'}(\mx') &\stackrel{\text{D\ref{d3a}}}{=} \lim_{x_j \rightarrow +\infty} F_{\xx}(\mx)\\ &\!\stackrel{\text{R--N}}{=} \lim_{x_j \rightarrow +\infty} \int\limits_{-\infty}^{x_1} \cdots \int\limits_{-\infty}^{x_j} \cdots \int\limits_{-\infty}^{x_n} f_{\xx}(\mt) \dd\mt\\ &\stackrel{\text{Fub}}{=} \lim_{x_j \rightarrow +\infty} \int\limits_{-\infty}^{x_j} \int\limits_{-\infty}^{x_1} \cdots \int\limits_{-\infty}^{x_n} f_{\xx}(\mt) \dd\mt \\ &\, = \int\limits_{-\infty}^{+\infty} \int\limits_{-\infty}^{x_1} \cdots \int\limits_{-\infty}^{x_n} f_{\xx}(\mt) \dd\mt \\ &\stackrel{\text{Fub}}{=} \int\limits_{-\infty}^{x_1} \cdots \int\limits_{-\infty}^{x_{j-1}} \int\limits_{-\infty}^{x_{j+1}} \cdots \int\limits_{-\infty}^{+\infty} f_{\xx}(\mt) \dd t_j \dd t_1 \ldots \dd t_n. \end{align*} Předvídavě označme $ \int_{-\infty}^{+\infty} f_{\xx}(\mt) \dd t_j := f_{\xx'}(\mx')$. Předchozí věta říká, že existuje jediná funkce, pomocí níž lze $ F_{\xx'} $ vyjádřit ve tvaru těchto integrálů. Proto musí být $ f_{\xx'} $ nutně hledanou hustotou a~je s.~v. jednoznačná. Tím jsme obdrželi to, co jsme chtěli ukázat.\qedhere \end{proof} Podobně jako ve větě $ \ref{v-o-nezavislosti-pro-F} $ lze pojem nezávislosti rozšířit i~na hustotu pravděpodobnosti. \begin{veta}\label{v-o-nezav-pro-f} Nechť $ \xx \sim P^{\xx} $ a má ASR. Náhodné věličiny $ X_1, \ldots, X_n $ jsou (stochasticky) nezávislé, právě když \begin{equation*} \forall \mx \in \mathbb{R}^n\colon \quad f_{\xx}(\mx) = \prod_{j=1}^n f_{X_j}(x_j). \end{equation*} \end{veta} \begin{proof} $ $ \begin{itemize} \item[$ (\Rightarrow) $] Buďte $ (X_j)_1^n $ nezávislé. Podle věty \ref{v-o-nezavislosti-pro-F} víme, že to nastává, právě když $ F_{\xx}(\mx) = \prod_{j=1}^n F_{X_j}(x_j)$. Má-li $ \xx $ ASR, pak ho musí mít i~všechny její složky se svými vlastními hustotami. Odtud \begin{equation*} \prod_{j=1}^n F_{X_j}(x_j) \stackrel{\ref{v-ekviv-def-ASR}}{=} \, \prod_{j=1}^n \int_{-\infty}^{x_j} f_{X_j}(t_j) \dd t_j \stackrel{\text{Fub}}{=} \int_{-\infty}^{x_1} \cdots \int_{-\infty}^{x_n} \prod_{j=1}^n f_{X_j}(t_j) \dd\mt. \end{equation*} Opět není jiná možnost, než aby poslední integrand byl hledanou hustotou při funkci~$ F_{\xx} $. Je tedy nutně $ f_{\xx}(\mx) = \prod_{j=1}^n f_{X_j}(x_j) $. \item[$ (\Leftarrow) $] Nezávislost veličin $ (X_j)_1^n $ ukážeme z~definice \ref{nez-nv} v~řeči poznámky \ref{pozn-nez-nv}. Označme $ \bigtimes_{j=1}^n B_j :=~B $. Pak \begin{align*} P\Bigl(\xx \in \bigtimes_{j=1}^n B_j \Bigr) &= P^{\xx}\Bigl(\bigtimes_{j=1}^n B_j \Bigr) \stackrel{\ref{v-abs-spoj-rozdeleni}}{=} \int_B f_{\xx}(\mx) \dd\mx \stackrel{\text{předp.}}{=} \int_{B} \prod_{j=1}^n f_{X_j}(x_j) \dd\mx =\\ &\!\!\stackrel{\text{Fub}}{=} \prod_{j=1}^n \int_{B_j} f_{X_j}(x_j) \dd x_j \stackrel{\ref{v-abs-spoj-rozdeleni}}{=} \prod_{j=1}^n P^{X_j}(B_j) = \prod_{j=1}^n P(X_j \in B_j), \end{align*} což jsme chtěli dokázat.\qedhere \end{itemize} \end{proof} Vyslovme nyní definici podmíněné hustoty pravděpodobnosti pro absolutně spojité veličiny. Bude takřka totožná s~diskrétní verzí \ref{def-podm-hustota-diskr}. \begin{defi}\label{def-podm-hustota-spoj} Budiž $ \xx = (X,Y) $ náhodná veličina s~ASR a hustotou $ f_{(X,Y)} $. \textbf{Podmíněnou hustotu pravděpodobnosti} za předpokladu, že $ Y = y $, definujeme $\forall x \in \ran X$ vztahem \begin{equation*} f_{X\mid Y}(x \mid y) := \frac{f_{(X,Y)}(x,y)}{f_Y(y)} \end{equation*} za podmínky, že $ y \in \ran Y $ a $ f_Y(y) \neq 0 $. \end{defi} \begin{pozn} $ $ \begin{itemize} \item Definice je korektní, protože $ f_{X \mid Y} $ je skutečně hustotou: je nezáporná a~snadno ověříme normovací podmínku $ \int_{\mathbb{R}}f_{X \mid Y}(x \mid y) \dd x = 1 $. To nám umožní přejít k~rozdělení podmíněné veličiny $ X \mid Y $ skrze vztah $ P^{X\mid Y}(B) = \int_{B} f_{X \mid Y}(x \mid y) \dd x$, kde $ B \in \bb_1 $. Pak už můžeme psát $ X \mid Y \sim P^{X\mid Y} $. \item Kdybychom chtěli definovat podmíněnost spojitých náhodných veličin pomocí pravděpodobností, potřebovali bychom \begin{equation*} P(X \in B \mid Y = y) = \frac{P(X \in B, Y = y)}{P(Y=y)}. \end{equation*} Zde však narazíme, jakmile má veličina $ Y $ spojité rozdělení; v~tom okamžiku by byla \linebreak $ P(Y = y) = 0 $ (množina nulové míry) a zlomek výše by pozbyl smyslu. Takto tedy nelze $ X \mid Y $ přímo definovat, ale jak jsme viděli, lze tuto potíž obejít pomocí hustoty. \end{itemize} \end{pozn} Zabývejme se nyní otázkou, co se s~hustotou pravděpodobnosti děje při obecné transformaci. \begin{veta}[O obecné transformaci] Nechť $ \xx \sim P^{\xx} $, kde toto rozdělení je absolutně spojité vzhledem k~míře~$ \lambda $ (např. Lebesgueově). Buď $ \mg\colon \mathbb{R}^n \rightarrow \mathbb{R}^m $ borelovská transformační funkce a~definujme novou náhodnou veličinu $ \yy = \mg\, \circ \xx \stackrel{\text{ozn.}}{=} \mg(\xx)$. Potom za předpokladu existence parciálních derivací skoro všude platí pro transformovanou hustotu pravděpodobnosti vztah \begin{equation}\label{eq-obec-transfce} f_{\yy}(\my) = \frac{\partial^m}{\partial y_1 \cdots \partial y_m}\int_{B_{\my}} \mkern-12mu f_{\xx}(\mx)\dd\mx, \end{equation} kde $ B_{\my} = \lbrace \mx \in \mathbb{R}^n \mid \mg(\mx) \leq \my \rbrace \in \bb_n$. \end{veta} \begin{proof} Funkce $ f_{\xx} $ je nezáporná a měřitelná, množina $ B_{\my} $ je měřitelná, takže integrál existuje. Volba Lebesgueovy míry se odráží v~notaci $ \dd\mx $. Studujme distribuční funkci $ F_{\yy} $, od níž dokážeme snadno (a jednoznačně) pomocí R--N věty přejít k~hustotě. Zorientujme se v~dimenzích problému. Podle definice rozdělení \ref{def-rozdeleni} a~poznámky pod ní platí, že $ P^{\xx} = P \circ \xx^{-1}\!\colon (\mathbb{R}^n, \bb_n) \rightarrow [0,1]. $ Z~definičního vztahu veličiny $ \yy $ plyne, že $ \yy\colon (\Omega, \sa, P) \rightarrow (\mathbb{R}^m, \bb_m), $ a tedy $ P^{\yy} = P \circ \yy^{-1} = P \circ \xx^{-1} \circ \mg^{-1} = P^{\xx} \circ \mg^{-1} $ a odsud $ F_{\yy} = P^{\yy}\!\!\mid_{\tau_{1,m}} $. Nyní pišme: \begin{align*} F_{\yy}(\my) &= P(\yy \leq \my) = P(\mg \circ \xx \leq \my) = P\bigl(\left\lbrace \omega \mid (\mg \circ \xx)(\omega) \leq \my\right\rbrace\bigr) = P\Bigl[(\mg \circ \xx)^{-1}\bigl((-\bm{\infty}, \my]\bigl)\Bigr] =\\ &= P\Bigl[\xx^{-1}\bigl(\mg^{-1}\bigl((-\bm{\infty}, \my]\bigr)\bigr)\Bigr] \stackrel{\ref{def-rozdeleni}}{=} P^{\xx}\left(\mg^{-1}\bigl((-\bm{\infty}, \my]\bigr)\right), \end{align*} kde pohodlnějším značením $ (-\bm{\infty}, \my] $ míníme $ m $ intervalů $ (\infty, y_i] $. Množina $\mg^{-1}\bigl((-\bm{\infty}, \my]\bigr) $ je borelovská a~jedná se přímo o~množinu $ B_{\my} $ ze znění věty. Rozdělení $ P^{\xx} $ je navíc absolutně spojité vzhledem k~Lebesgueově míře, takže podle důsledku R--N věty (viz \ref{v-abs-spoj-rozdeleni}) existuje s.~v. jednoznačná $ f_{\xx} $ taková, že \begin{equation*} F_{\yy}(\my) = P^{\xx}\left(\mg^{-1}\bigl((-\bm{\infty}, \my]\bigr)\right) = \int_{B_{\my}} \mkern-12mu f_{\xx}\dd\mx. \end{equation*} K~hustotě $ f_{\yy} $ se podle poznámky \ref{pozn-derivovani-F} dostaneme derivováním $ F_{\yy} $ v~bodech spojitosti: \begin{equation*} f_{\yy}(\my) = \frac{\partial^m}{\partial y_1 \cdots \partial y_m}F_{\yy}(\my) = \frac{\partial^m}{\partial y_1 \cdots \partial y_m} \int_{-\infty}^{y_1} \cdots \int_{-\infty}^{y_m} \mkern-12mu f_{\xx}(\mx)\dd \bm{x}. \end{equation*} \end{proof} Předchozí věta nám poskytla vzorec pro transformovanou hustotu pravděpodobnosti. Pro běžné počítání je však příliš složitý, protože velice snadno nastane situace, kdy integrál nebudeme moci spočítat, a navíc bychom ho pak museli $ m $-krát derivovat. Proto bychom chtěli \eqref{eq-obec-transfce} zjednodušit. Budeme přitom uvažovat transformaci do prostoru \emph{stejné} dimenze. \begin{veta}\label{v-o-tranfci-Rn-Rn} Buďte $ k \in \mathbb{N},\ i \in \hat{k} $ a $ \xx \sim P^{\xx} $ s~ASR vzhledem k~Lebesgueově míře. Nechť $ \mg\colon \mathbb{R}^n \rightarrow \mathbb{R}^n $ je zobrazení \emph{po částech} regulární a prosté na množinách $ B_i $, kde pro všechna $ i \in \hat{k}$ platí: $ B_i = B_i^\circ $, jsou vzájemně \emph{disjunktní} a množina $ G := \sum_{i=1}^k B_i $ je taková, že $ \int_{G}f_{\xx}\dd\mx = 1$. Pak je $ \yy := \mg(\xx) $ náhodná veličina s~ASR a příslušná hustota pravděpodobnosti je rovna \begin{equation}\label{eq-transfce-hustoty} \forall \my \in \mg(G)\colon \quad f_{\yy}(\my) = \sum_{i=1}^{k}f_{\xx}\Bigl(\mg^{-1}\!\!\mid_{B_i}\!\!(\my)\Bigr)\left| \det \mathbb{J}_{\mg^{-1}}(\my)\right| \end{equation} a jinde je dodefinována nulou. \end{veta} \begin{pozn} Zkusme se v~této džungli symbolů a pojmů nejdříve zorientovat. \begin{itemize} \item Zobrazení $ g $ nazveme regulárním, právě když $ g \in \mathcal{C}^1 $ a $ (\forall x \in \dom g)(\det \mathbb{J}_g(x) \neq 0) $. Symbolem $ \mathbb{J}_g $ značíme Jacobiho matici zobrazení $ g $ a~jejímu determinantu se říká \emph{jakobián}. To, že je $ g $ regulární, ještě neznamená, že je prosté, a proto musíme prostotu předpokládat zvlášť.\footnote{Regulární zobrazení je ale lokálně prosté, jak plyne z~věty o derivaci inverzního zobrazení (viz \emph{Turistický průvodce MAA4}, věta 14.1). Zobrazení, které je regulární a prosté, se též nazývá \emph{difeomorfismem}.} \item Regularita a prostota $ \mg $ \emph{po částech} znamená, že jsme schopni nalézt konečně mnoho podmnožin definičního oboru, na nichž už je $ \mg $ regulární a prosté. \item Množiny $ B_i $ jsou otevřené, a tedy borelovské; zrovna tak množina $ G $. Podmínka normovanosti $ \int_{G}f_{\xx}\dd\mx = 1 $ je totožná s~požadavkem $ P^{\xx}(G) = 1 $, tj. $ G $ je pokrytím v~pravděpodobnostním smyslu. Suma v~\eqref{eq-transfce-hustoty} symbolizuje opětovné "napojení" jednotlivých transformací do jedné funkce. \item Symbolem $ \mg^{-1}\!\!\mid_{B_i} $ myslíme \emph{inverzní} zobrazení ke $ \mg $ zúžené na množinu $ B_i $. Budeme ho dále značit pouze $ \mg_i^{-1} $. \end{itemize} \end{pozn} \begin{proof} V~důkazu minulé věty jsme obdrželi rovnost $ F_{\yy}(\my) = \int_{B_{\my}} f_{\xx}\dd\mx $, odkud jsme se nemohli pohnout dál. Nyní jsme v~situaci, kdy $ m = n $, a proto můžeme na každé $ B_i $ provést substituci, neboť je na nich~$ \mg $ regulární a prosté. Proto nejdříve pronikneme $ B_{\my} \cap \sum_{i=1}^k B_i$ a díky normovací podmínce se hodnota integrálu nezmění. S~využitím distributivity průniku vůči sjednocení a~aditivity integrálu máme \begin{equation*} F_{\yy}(\my) = \int\limits_{B_{\my}} \!\!f_{\xx}(\mx)\dd\mx = \int\limits_{B_{\my}\cap G} \mkern-12mu f_{\xx}(\mx)\dd\mx = \sum_{i=1}^k \int\limits_{\,B_{\my}\cap B_i} \mkern-18mu f_{\xx}(\mx)\dd\mx \end{equation*} \begin{align*} \mg(\mx) &= \bm{t} \\%&\forall i \in \hat{k} \,\\ \mx &= \mg^{-1}_i(\bm{t}) \quad\text{ na } B_i\,\\ \,\det\mathbb{J}_{\mg_i^{-1}}(t)&\neq 0 \qquad\quad\ \text{ na } B_i\, \end{align*} \begin{equation*} \sum_{i=1}^k \int\limits_{\, T_{\my} \cap \mg(B_i)} \mkern-18mu f_{\xx}\left(\mg^{-1}_i(\bm{t})\right)\left| \det \mathbb{J}_{\mg_i^{-1}}(\bm{t})\right| \dd\bm{t} \stackrel{\text{Fub}}{=} \int_{-\infty}^{y_1}\cdots\int_{-\infty}^{y_n} \sum_{i=1}^k f_{\xx}\left(\mg^{-1}_i(\bm{t})\right)\left| \det \mathbb{J}_{\mg_i^{-1}}(\bm{t})\right| \dd\bm{t} \end{equation*} kde $ T_{\my} = \lbrace \bm{t} \in \mathbb{R}^n \mid \bm{t} \leq \my \rbrace$. Poslední integrand označme sugestivně $ f_{\yy}(\bm{t}) $. Víme, že jakmile se podaří distribuční funkci $ F_{\yy}(\my) $ vyjádřit ve tvaru tohoto integrálu, je integrand nutně hustotou pravděpodobnosti veličiny $ \yy $. Tím je důkaz dokončen, protože jsme obdrželi rovnost \eqref{eq-transfce-hustoty}. \end{proof} Projděme si nyní různé speciální případy přechozí věty. \begin{enumerate} \item\textbf{Případ $ n = 1 $.} Nechť $ \xx \sim P_{\xx} $ s~ASR. Buď $ g\colon \mathbb{R} \rightarrow \mathbb{R} $ funkce po částech regulární (tj. na množinách $ B_i $ je $ g \in \mathcal{C}^1,\ g'(x) \neq 0$) a prostá. Pak má náhodná veličina $ Y := g(X) $ ASR a~hustotu pravděpodobnosti $\forall y \in g(G)$ rovnu \begin{equation*} f_Y(y) = \sum_{i=1}^k f_X\left(g_i^{-1}(y)\right)\frac{1}{\left| g_i'\left(g_i^{-1}(y)\right) \right| }. \end{equation*} \item \textbf{Případ $ k = 1 $.} Je jen jedna množina, kde $ \mg\colon \mathbb{R}^n \rightarrow \mathbb{R}^n $ je regulární a prostá, takže je suma tvořena jen jedním sčítancem. Pro všechna $ \my \in B_1 = G$ platí \begin{equation*} f_{\yy}(\my) = f_{\xx}\left(\mg^{-1}(\bm{\my})\right)\left| \det \mathbb{J}_{\mg^{-1}}(\bm{\my})\right|. \end{equation*} \item \textbf{Případ $ g\colon \mathbb{R}^n \rightarrow \mathbb{R}$} sice nespadá do předchozí věty, ale i~tak si dovedeme poradit. Položme $ Y := g(\xx) $. Z~této veličiny utvoříme vektor $ \yy = (Y, Y_2, \ldots, Y_n) $, přičemž pro $ 2 \leq j \leq n $ jsou $ Y_j = X_j $. Jedná se tedy o~latentní proměnné (transformujeme je identitou), přes které později zintegrujeme. Předpokládejme, že lze složku $ X_1 $ jednoznačně (algebraicky) vyjádřit pomocí $ Y := Y_1 $ a~ostatních složek $ (X_2, \ldots X_n) := \xx' = (Y_2,\ldots Y_n)$. Toto vyjádření nechť je tvaru $ X_1 = h(Y_1, \xx') = h(y_1, \mx') = h(\my)$\footnote{Přechod k~malým proměnným lze chápat tak, že jsme transformaci náhodné veličiny přiřadili malé proměnné, které potom měníme tak, jak to známe z~analýzy. Tento postup je ale spíše fyzikální, protože proměnnými náhodné veličiny jsou $ \omega \in \Omega $!} a předpokládejme, že existuje spojitá a nenulová $ \partial h / \partial y_1 \stackrel{\text{ozn.}}{=} \partial_{y_1}h$ Teď už máme prostou transformaci $ \tilde{g}\colon \mathbb{R}^n \rightarrow \mathbb{R}^n $ s~nenulovým jakobiánem \begin{equation*} \begingroup \setlength\arraycolsep{3pt} \det\mathbb{J}_{\tilde{g}^{-1}}(\my) = \det \begin{pmatrix} \partial_{y_1}h(\my) & \partial_{y_2}h(\my) & \cdots & \partial_{y_n}h(\my)\\[3pt] 0 & 1 & \cdots & 0\\[-4pt] \vdots & \vdots & \ddots & \vdots\\ 0 & 0 & \cdots & 1 \end{pmatrix} \endgroup = \diffp{h(\my)}{{y_1}} \neq 0 \end{equation*} dle předpokladu. Splnili jsme tedy požadavky předchozí věty a můžeme psát (uvažujeme $ k = 1 $): \begin{align*} f_{\yy}(\my) &= f_{\xx}\left(\tilde{\mg}^{-1}(\bm{\my})\right)\left| \det \mathbb{J}_{\tilde{\mg}^{-1}}(\bm{\my})\right|\\ &= f_{\xx}\bigl(h(\my), \mx'\bigr)\cdot \left| \partial_{y_1}h(\my)\right|\\ &= f_{\xx}\bigl(h(\my), y_2,\ldots, y_n\bigr) \cdot \left| \partial_{y_1}h(\my)\right|. \end{align*} Od sdružené hustoty lze podle věty \ref{v-o-marg-hustote} přejít k~hustotě marginální integrováním přes zbylé proměnné: \begin{equation*} f_{\yy}(\my) \xrightarrow{\text{\ref{v-o-marg-hustote}}} f_{Y_1}(y_1) = \int_{-\infty}^{+\infty}\mkern-20mu \cdots \int_{-\infty}^{+\infty} \mkern-12mu f_{\yy}(\bm{t})\dd t_2 \cdots \dd t_n. \end{equation*} \end{enumerate} \begin{priklad}\label{pr-transfce-X1+X2} Ukažme si aplikaci třetího bodu na transformaci $ \mathbb{R}^2 \rightarrow \mathbb{R} $. Buď $ \xx = (X_1, X_2) $ náhodná veličina s~ASR a hustotou pravděpodobnosti $ f_{(X_1,X_2)} $. Řekněme, že chceme veličinu $ \xx $ transformovat do nové, jednorozměrné podoby tvaru $ Y = X_1 + X_2 \stackrel{\text{ozn.}}{=} Y_1$ (to je analog $ Y = g(\xx) $). Proto doplníme tuto transformaci do $ \mathbb{R}^2 $ identickým přechodem $ Y_2 = X_2 $. Formálně se jedná o~záměnu proměnných \begin{align*} y_1 &= x_1 + x_2\\ y_2 &= x_2, \end{align*} přičmž nové proměnné stojí na levé straně. Nyní vyjádříme $ x_1 = y_1 - x_2 \stackrel{\text{ozn.}}{=} h(y_1, x_2) = h(y_1, y_2) $ (viz $ h(\my) $ výše). Je zřejmé, že $ \partial_{y_1} h = 1 \neq 0$, takže můžeme použít větu \ref{v-o-tranfci-Rn-Rn} a obdržíme \begin{equation*} f_{(Y_1, Y_2)}(y_1, y_2) = f_{(X_1, X_2)}(y_1-y_2, y_2)\cdot 1 \xrightarrow{\text{\ref{v-o-marg-hustote}}} f_{Y_1}(y_1) = f_{X_1+X_2}(y_1) = \int_{-\infty}^{+\infty} \mkern-18mu f_{(X_1, X_2)}(y_1-y_2, y_2) \dd y_2. \end{equation*} Víme-li navíc, že jsou veličiny $ X_1 $ a $ X_2 $ nezávislé, lze podle věty \ref{v-o-nezav-pro-f} psát $ f_{X_1+X_2}(y_1) = \linebreak = \int_{\mathbb{R}}f_{X_1}(y_1-y_2)\cdot f_{X_2}(y_2) \dd y_2 $, což není jiného než \emph{konvoluce} $ (f_X * f_Y)(y_1) $, jak ji známe z~RMF. Čtenář snadno odvodí (zcela analogickým způsobem) transformace typu $ Y = X_1X_2 $ či $ Y=~X_1/X_2 $. \end{priklad} \subsection{Příklady spojitých rozdělení} Uveďme nyní několik příkladů spojitých rozdělení a~příslušných hustot pravděpodobnosti. \begin{enumerate} \item \textbf{Uniformní rozdělení.} Řekneme, že náhodná veličina $ X $ má \textbf{uniformní (rovnoměrné) rozdělení} na konečném intervalu $ /a,b/ $, právě když je příslušná hustota pravděpodobnosti rovna \begin{equation*} f_{X}(x) = \frac{1}{b-a}\chi_{/a,b/}(x), \end{equation*} píšeme $ X \sim \mathcal{U}(a,b) $. Lomené závorky u~intervalu značí, že nezáleží na jeho typu. V~krajních bodech lze $ f_X $ dodefinovat buď nulou, nebo hodnotou $ 1/(b-a) $; integrál totiž na jeden bod (tj. množinu míry nula) nebere ohledy. Distribuční funkci získáme jako funkci horní meze: \begin{equation*} F_X(x) = \int_{-\infty}^x \mkern-12mu f_X(t) \dd t = \begin{cases} 0 & x < a\\ \frac{x-a}{b-a} & x \in (a,b) \\ 1 & x > b. \end{cases} \end{equation*} Je snadné ověřit, že je splněna normovací podmínka $ \int_{\mathbb{R}} f_X(x) \dd x = 1.$ \begin{figure}[h] \centering \includegraphics[width=0.7\textwidth]{Fig1-uniformni-rozdeleni.png} \caption{Graf hustoty pravděpodobnosti $ f_X $, resp. distribuční funkce $ F_X $ pro $ X \sim \mathcal{U}(-2,2) $.} \label{fig1-10} \end{figure} \item \textbf{Uniformní rozdělení na $ \mathbb{R}^n $.} Definici rovnoměrného rozdělení lze rozšířit i~na omezené množiny v~$ \mathbb{R}^n $. Budiž $ \lambda $ míra a množina~$ G \subset \mathbb{R}^n $ taková, že $ \lambda(G) < +\infty $. Pak říkáme, že náhodná veličina \textbf{má na~$ G $ uniformní rozdělení}, značeno $ \xx \sim \mathcal{U}(G) $, právě když \begin{equation*} f_{\xx}(\mx) = \frac{1}{\lambda(G)}\chi_G(\mx). \end{equation*} Opět platí, že $ \int_{\mathbb{R}^n} f_{\xx} \dd\lambda = 1 $. \item \textbf{Normální rozdělení.} Náhodná veličina $ X $ má \textbf{normální (gaussovské) rozdělení} s~parametry $ \mu \in \mathbb{R} $ a $ \sigma > 0$, když $ \forall x \in \mathbb{R} $ platí \begin{equation}\label{eq-norm-rozd-f} f_X(x) = \frac{1}{\sqrt{2\pi\sigma^2}}\exp\left(-\frac{(x-\mu)^2}{2\sigma^2}\right), \end{equation} psáno $ X \sim \mathcal{N}(\mu, \sigma^2) $. Parametr $ \mu $ je střední hodnotou tohoto rozdělení, $ \sigma^2 $ jeho rozptyl (o~tom se více dozvíme později v~semestru). Význam tohoto rozdělení oceníme především v~odstavci o~tzv.~\emph{centrální limitní větě}. Má zcela zásadní postavení ve statistice, přírodních i~společenských vědách. Normovací podmínku $ \int_{\mathbb{R}} f_X(x) \dd x = 1 $ lze substitucí $ t = (x-\mu)/(\sqrt{2}\sigma) $ převést na tzv. Gaussův integrál $ \int_{\mathbb{R}} \mathrm{e}^{-t^2}\dd t = \sqrt{\pi}$, který se počítá standardním trikem spočívajícím v~přechodu do polárních souřadnic (viz MA4 či TSFA). Příslušná kumulativní distribuční funkce je tvaru \begin{equation}\label{eq-norm-rozd-F} F_X(x) = \frac{1}{\sqrt{2\pi\sigma^2}}\int_{-\infty}^x \!\!\!\exp\left(\frac{(t-\mu)^2}{2\sigma^2}\right)\dd t. \end{equation} Zde však narážíme na problém, že ji nelze vyjádřit v~elementárním tvaru (tj. jako konečnou kombinaci elementárních funkcí), a tak se její hodnoty stanovují numericky; je ale vidět, že $ F_X(+\infty) = 1 $. Význačné hodnoty parametrů normálního rozdělení jsou $ \mu = 0 $ a $ \sigma^2 = 1 $; pak se mu říká \emph{standardizované}. Jedná se tedy o~případ $ X \sim \mathcal{N}(0,1)$. Hustota \eqref{eq-norm-rozd-f} pak nabývá tvaru \begin{equation}\label{eq-norm-rozd-phi} \varphi_X(x) = \frac{1}{\sqrt{2\pi}}\exp\left(-\frac{x^2}{2}\right) \end{equation} a distribuční funkce (opět neelementární) \begin{equation}\label{eq-norm-rozd-Phi} \Phi_X(x) = \frac{1}{\sqrt{2\pi}} \int_{-\infty}^{x} \exp\left(-\frac{t^2}{2}\right) \dd t. \end{equation} Na obrázcích \ref{fig-normalni-rozdeleni} jsou znázorněny průběhy funkcí $ f_X $, resp. $ F_X $ při normálním rozdělení (případ $ \mathcal{N}(0,1) $ modře). \begin{figure}[t] \centering \begin{subfigure}[t]{0.62\textwidth} \includegraphics[width=1\linewidth]{Fig2a-normalni-pdf.png} \caption{\mbox{Graf hustoty pravděpodobnosti $ f_X $ pro různé hodnoty parametrů $ \mu $ a $ \sigma^2$.}} \label{fig2a-norm-pdf} \end{subfigure} \begin{subfigure}[t]{0.62\textwidth} \centering \includegraphics[width=1\linewidth]{Fig2b-normalni-cdf.png} \caption{\mbox{Graf distribuční funkce $ F_X $ pro různé hodnoty parametrů $ \mu $ a $ \sigma^2$.}} \label{fig2b-norm-cdf} \end{subfigure} \caption{Grafy funkcí $ f_X $, resp. $ F_X $ pro různé hodnoty parametrů $ \mu $ a $ \sigma^2$ normálního rozdělení.} \label{fig-normalni-rozdeleni} \end{figure} Shrňme si nyní základní vlastnosti Gaussova rozdělení do jedné~věty. \begin{veta}[O vlastnostech $ \mathcal{N} $]\label{v-o-vlastn-norm-rozd} Mějme $ X \sim \mathcal{N}(\mu, \sigma^2) $. Platí: \begin{enumerate}[i.] \item Normální rozdělení $ \mathcal{N}(\mu, \sigma^2) $ je symetrické kolem bodu $ x = \mu $. Inflexní body se nachází v~$ x = \mu \pm \sigma $. \item $ (\forall x \in \mathbb{R})( \Phi_X(x) = 1-\Phi_X(-x) )$. \item\label{v-o-vlastn-norm-rozd-bod3} Mezi distribuční funkcí obecného $ \mathcal{N}(\mu, \sigma^2) $ a standardního rozdělení $ \mathcal{N}(0,1) $ lze přecházet vztahem \begin{equation*} F_X(x) = \Phi_X\left(\frac{x-\mu}{\sigma}\right). \end{equation*} Proto stačí tabelovat pouze hodnoty $ \Phi_X $ a~díky bodu (ii) dokonce jen ty na kladné poloose. \item $ P(a < X \leq b) = \frac{1}{\sqrt{2\pi}} \mkern-5mu \int\limits_{(a-\mu)/\sigma}^{(b-\mu)/\sigma} \mkern-10mu \exp(-x^2/2) \dd x$. \item Je-li $ X \sim \mathcal{N}(\mu, \sigma^2) $, pak pro $ a \neq 0 $ má rozdělení transformované veličiny $ Y := aX + b $ následující podobu: $ Y \sim \mathcal{N}(a\mu + b;\, a^2\sigma^2)$. Speciálně: Jestliže $ X \sim \mathcal{N}(0,1) $, potom $ \sigma X + \mu \sim \mathcal{N}(\mu, \sigma^2) $. \item Budiž $ k \in \mathbb{N} $. Pak $ P\left( \mu - k\sigma \leq X \leq \mu + k\sigma \right) = 2\Phi_X(k) - 1$. \end{enumerate} \end{veta} \begin{proof} $ $ \begin{enumerate}[i.] \setcounter{enumii}{1} \item Tvrzení druhého bodu snadno obdržíme přičtením a~odečtením integrálu $ 1/\sqrt{2\pi}\int_{x}^{+\infty} \exp(-t^2/2) \dd t $ a následnou substitucí $ r = -t $. \item Substitucí $ (t-\mu)/\sigma = r $ v~předpisu \eqref{eq-norm-rozd-F} pro $ \Phi $ přímo dostaneme kýžený vztah: \begin{equation*} F_X(x) = \frac{1}{\sqrt{2\pi}} \mkern-12mu \int\limits_{-\infty}^{(x-\mu)/\sigma} \mkern-12mu \exp(-r^2/2) \dd r \stackrel{\text{\eqref{eq-norm-rozd-Phi}}}{=} \Phi_X\left(\frac{x-\mu}{\sigma}\right). \end{equation*} \item Počítejme například $ P(a < X \leq b) $. Podle poznámky \ref{pozn-distrib-fce}.\ref{pozn-distrib-fce-bod2} bychom si správně měli dávat pozor na druh nerovnosti. Jelikož se ale nyní bavíme o~(absolutně) spojitém rozdělení, je lhostejno, kterou nerovnost použijeme -- jednostranná limita funkce $ F $ bude přímo rovna funkční hodnotě v~daném bodě. Pišme tedy \begin{align*} P(a < X \leq b) &= F_X(b) - F_X(a) \stackrel{\text{iii.}}{=} \Phi_X\left(\frac{b-\mu}{\sigma}\right) - \Phi_X\left(\frac{a-\mu}{\sigma}\right) \stackrel{\text{ozn.}}{=} \Phi_X(d) - \Phi_X(c) =\\ &= \frac{1}{\sqrt{2\pi}} \int_c^d \exp(-x^2/2) \dd x. \end{align*} Tuto pravděpodobnost lze opět počítat pouze numericky. \item Zde přijde na řadu věta o~transformaci \ref{v-o-tranfci-Rn-Rn} a~její speciální případ $ n = 1 $. Transformační funkce~$ g $ provádí přiřazení $g(x) = ax+b $, tím pádem její inverze $ g^{-1}(y) = \frac{y-b}{a} $. Jakobián zobrazení $ g^{-1} $ je jednoduše $ \left(g^{-1}\right)'(y) = \frac{1}{a} $, takže s~pomocí \eqref{eq-transfce-hustoty} máme \begin{align*} f_Y(y) &\stackrel{\eqref{eq-transfce-hustoty}}{=} f_X\left(g^{-1}(y)\right) \cdot \left| \left(g^{-1}\right)'(y) \right| \\ &\stackrel{\eqref{eq-norm-rozd-f}}{=} \frac{1}{\sqrt{2\pi\sigma^2}}\exp\!\left[-\frac{\left(\frac{y-b}{a} - \mu\right)^2}{2\sigma^2}\right] \cdot \frac{1}{|a|}\\ &\ \;= \frac{1}{\sqrt{2\pi (a\sigma)^2}} \exp\left[- \frac{\left(y - (a\mu+b)\right)^2}{2(a\sigma)^2}\right]. \end{align*} To je ale hustota normálního rozdělení s~parametry $ \mu' = a\mu + b $ a $ \sigma'^2 = a^2\sigma^2 $, což bylo dokázati. Je-li speciálně $ a = 1/\sigma,\ b = - \mu/\sigma $, pak $ (X-\mu)/\sigma^2 \sim \mathcal{N}(0,1) $. Obráceně: pro $ X \sim \mathcal{N}(0,1) $ je potom $ \sigma X + \mu \sim \mathcal{N}(\mu, \sigma^2) $. \item Nedbaje na typ nerovností můžeme počítat například \begin{equation*} P(\mu - k\sigma \leq X \leq \mu + k\sigma) = P\Bigl( k \leq \frac{X - \mu}{\sigma} \leq k\Bigr) \stackrel{\text{iii.}}{=} \Phi_X(k) - \Phi_X(-k) \stackrel{\text{ii.}}{=} 2\Phi_X(k) - 1. \end{equation*} Tento vztah se někdy nazývá \emph{pravidlem $ k $-sigma}. Vyjadřuje pravděpodobnost (spolehlivost), že se hodnota naměřené veličiny nachází v~intervalu $ [\mu - k\sigma, \mu + k\sigma] $. Řekneme-li, že jsme naměřili data "s~přesností jedna sigma", dosazením $ k = 1$ obdržíme spolehlivost $ 0,68268 $; pro $ k = 2 $ je to $ 0,9545 $; pro $ k = 3 $ dokonce $ 0,9973 $ -- máme 99,73procentní jistotu, že se naše data nacházejí v~úseku $ [\mu - 3\sigma, \mu + 3\sigma]$. \qedhere \end{enumerate} \end{proof} Odstavec o~normálním rozdělení uzavřeme poslední vlastností, která si ale zaslouží být zvláštní větou. \begin{veta}[Reprodukční vlastnost $ \mathcal{N} $]\label{v-reprod-vlastn-N-1} Mějme konečně mnoho \emph{nezávislých} náhodných veličin takových, že $ (\forall j \in \hat{n})\left(X_j \sim \mathcal{N}(\mu_j, \sigma^2_j)\right) $. Nechť $ \bm{a} = (a_1, \ldots, a_n) \neq \bm{0} $ je $ n $-tice čísel. Potom i~lineární kombinace těchto veličin má normální rozdělení, a sice \begin{equation*} \sum_{j=1}^n a_j X_j \sim \mathcal{N}\Bigl(\sum_{j=1}^n a_j \mu_j;\ \sum_{j=1}^n a_j^2\sigma_j^2 \Bigr). \end{equation*} \end{veta} \begin{proof} Toto tvrzení mnohem jednodušeji dokážeme v~kapitole o~charakteristické funkci (viz~\ref{pr-reprod-vlastn-gauss}). Následující důkaz berme spíše jako ilustraci faktu, že život bez charakteristické funkce je těžký. Z~bodu (v.) předchozí věty víme, že násobení skalárem nezmění gaussovskost rozdělení: je totiž $ a_jX_j \sim \mathcal{N}(a_j\mu_j;\ a_j^2\sigma_j^2) $. Proto BÚNO položme $ (\forall j \in \hat{n})(a_j := 1)$ a zkoumejme pouze součet náhodných veličin. Postupujme matematickou indukcí. Nejdříve uvažme $ X_1 + X_2 $. Využijme nezávislosti a~rozdělení jednotlivých $ X_j $ a~pišme \begin{align*} X_1 + X_2 \sim f_{X_1+X_2}(u) &\stackrel{\text{\ref{pr-transfce-X1+X2}}}{=} (f_{X_1}*f_{X_2})(u) = \int_{\mathbb{R}} f_{X_1}(u-v)f_{X_2}(v) \dd v =\\ &\ = \frac{1}{2\pi\sigma_1\sigma_2} \int_{\mathbb{R}} \exp\underbrace{\Biggl[-\frac{((u-v)-\mu_1)^2}{2\sigma_1^2} - \frac{(v-\mu_2)^2}{2\sigma_2^2}\Biggr]}_{(\star)} \dd v \stackrel{\text{ozn.}}{=} I(u). \end{align*} Následuje zdlouhavý výpočet, který zde uvedeme pouze ve stručné podobě. Argument \linebreak exponenciály upravíme na společný jmenovatel \begin{align*} (\star) &= -\frac{1}{2\sigma_1^2\sigma_2^2}\Bigl[ v^2\left(\sigma_1^2+\sigma_2^2\right) + 2v\left(\sigma_2^2(\mu_1 - u) - \sigma_1^2\mu_2^2\right) + \sigma_2^2(u-\mu_1)^2 + \sigma_1^2\mu_2^2\Bigr] \\ &\!\! \stackrel{\text{ozn.}}{=} -\frac{1}{2\sigma_1^2\sigma_2^2} \Bigl[v^2S + 2vB + C \Bigr] \end{align*} a převedeme na čtverec vzhledem k~proměnné $ v $: \begin{align*} (\star) &= -\frac{S}{2\sigma_1^2\sigma_2^2}\Biggl[\left(v+\frac{B}{S}\right)^2 + \frac{CS - B^2}{S^2} \Biggr]. \end{align*} Roznásobíme oba výrazy a jakožto argumenty exponenciály je integrujeme přes celou reálnou osu. Druhý sčítanec nezávisí na $ v $, tudíž jej lze vytknout před integrál (nezapomeňme na faktor, který už před integrálem byl). Substitucí redukujeme výpočet na integrál typu $ \int_{\mathbb{R}} \exp(-At^2) \dd t $, kde $ A = S/(2\sigma_1^2\sigma_2^2) $, jehož výsledkem\footnote{Čtenář--klasik nahlédne do knihy \emph{Matematické vzorce} od H.-J. Bartsche, s. 609, kde lze nalézt nesčetné množství tabelovaných integrálů všech druhů. Čtenář--pragmatik navštíví \url{https://en.wikipedia.org/wiki/List_of_integrals_of_exponential_functions}.} je $ \sqrt{\pi/A} $. Po vykrácení koeficientů máme \begin{align*} I(u) &= \frac{1}{\sqrt{2\pi(\sigma_1^2+\sigma_2^2)}}\exp\left[-\frac{1}{2\sigma_1^2\sigma_2^2}\frac{CS-B^2}{S}\right]\\ &= \frac{1}{\sqrt{2\pi(\sigma_1^2+\sigma_2^2)}}\exp\left[-\frac{(u-(\mu_1+\mu_2))^2}{2(\sigma_1^2+\sigma_2^2)}\right], \end{align*} což ale neznamená nic jiného, než že $ X_1 + X_2 \sim \mathcal{N}(\mu_1+\mu_2; \sigma_1^2 + \sigma_2^2) $. Nechť pro $ k = n $ tvrzení platí. Pak \begin{equation*} \sum_{j=1}^{n+1}X_j = \sum_{j=1}^{n} X_j + X_{j+1} \stackrel{\text{IP}}{=} \mathcal{N}\Bigl(\sum_{j=1}^n \mu_j + \mu_{n+1};\ \sum_{j=1}^n \sigma_j^2 + \sigma_{n+1}^2\Bigr) \end{equation*} a tím je důkaz dokončen. \end{proof} \begin{dusl} Nechť $ \bm{a} = (1/n, \ldots, 1/n) $. Pak podle předchozí věty $ \frac{1}{n}\sum_{j=1}^n X_j \stackrel{\text{ozn.}}{=} \overline{X_n} \sim \linebreak \sim \mathcal{N}\left(\overline{\mu_n};\ \frac{1}{n} \overline{\sigma^2_n}\right)$, kde pruh značí aritmetický průměr. Jsou-li navíc všechny veličiny $ X_j $ takzvaně i.~i.~d., tj.~nezávislé a~se stejným rozdělením, pak $ \overline{X_n} \sim \mathcal{N}(\mu;\ \frac{1}{n}\sigma^2)$. V~praxi to znamená, že rozdělení $ n $-krát nezávisle opakovaného experimentu má $ n $-krát menší rozptyl -- data jsou koncentrována v~blízkosti střední hodnoty. \end{dusl} \end{enumerate} \subsection{Rozdělení zkonstruovaná pomocí $ \mathcal{N} $} Skrze různé transformace lze z~normálního rozdělení odvodit mnoho dalších. Uvedeme si nyní několik z~nich. \begin{enumerate} \item \textbf{Rozdělení chí kvadrát.} Je-li $ X \sim \mathcal{N}(0,1) $, transformací $ Y = X^2 $ (není prostá!) dostaneme rozdělení zvané \emph{chí kvadrát} s~jedním stupněm volnosti, psáno $ Y \sim \chi^2(1) $. Tuto úvahu lze zobecnit na součet druhých mocnin $ n $ náhodných veličin, jež jsou i.~i.~d. Pak dostáváme chí kvadrát s~$ n $ stupni volnosti: $ Y = \sum_{j=1}^n X_j^2 \sim \chi^2(n) $. Využívá se například při konstrukci intervalu spolehlivosti pro rozptyl náhodné veličiny. Graf hustoty viz na obrázku \ref{fig3a-chi-pdf}. \item \textbf{Log-normální rozdělení.} Řekneme, že veličina~$ X$ má log-normální rozdělení, právě když $ \ln X $ má normální rozdělení. Jinými slovy: jestliže $ X \sim \mathcal{N}(\mu, \sigma^2) $, pak $ \mathrm{e}^X \sim \mathrm{LN}(\mu, \sigma^2) $. Z~obrázku \ref{fig3b-lognorm-cdf} je vidět, že "chvosty" tohoto rozdělení jsou oproti normálnímu vyšší, tedy pravděpodobnost, že při tomto rozdělení naměříme vysoké hodnoty, je také vyšší. \begin{figure}[h] \centering \begin{subfigure}[h]{0.6\textwidth} \includegraphics[width=1\textwidth]{Fig3a-chi-kvadrat-pdf.png} \caption{\mbox{Graf $ f_X $ pro různé hodnoty $ n $ při $ X \sim \chi^2(n) $}.} \label{fig3a-chi-pdf} \end{subfigure} \begin{subfigure}[h]{0.6\textwidth} \centering \includegraphics[width=1\textwidth]{Fig3b-log-normalni-pdf.png} \caption{\mbox{Graf $f_X $ pro různé hodnoty parametrů $ \mu $ a $ \sigma^2$ při $ X \sim \mathrm{LN}(\mu, \sigma^2) $.}} \label{fig3b-lognorm-cdf} \end{subfigure} \label{fig-chi-lognorm-rozdeleni} \caption{Graf hustoty pravděpodobnosti při chí kvadrát, resp. log-normálním rozdělení.} \end{figure} \item \textbf{Cauchyho rozdělení.} Vzniká podílem i.~d. veličin $ X, Y \sim \mathcal{N}(0,1) $, píšeme $ \frac{X}{Y} \sim \mathrm{C}(0,1) $. Jeho střední hodnota ani rozptyl nejsou definovány. Nachází využití ve fyzice, kde je také známé jako Lorentzovo rozdělení. \item \textbf{Studentovo\footnote{Pochází od W.~S.~Gosseta (1876--1937), který vystupoval pod pseudonymem \emph{Student}.} rozdělení.} Nechť $ X \sim \mathcal{N}(0,1) $ a $ Y \sim \chi^2(n) $ jsou nezávislé. Pak má veličina $ \frac{X}{\sqrt{Y/n}} $ studentovo rozdělení, symbolicky $ \frac{X}{\sqrt{Y/n}} \sim \mathrm{t}(n) $. Veličina $ Y $ je tedy znormována a~odmocněna. Viz obrázek \ref{fig4a-student-pdf}. \item \textbf{Rozdělení $ \mathrm{F} $}, též zvané \textbf{Fisherovo--Snedecorovo}, vzniká jako podíl dvou nezávislých normovaných veličin $ X \sim \chi^2(n) $ a $ Y \sim \chi^2(m) $, píšeme $ \frac{X/n}{Y/m} \sim \mathrm{F}(n,m) $. Viz obrázek \ref{fig4b-F-pdf}. \begin{figure}[h] \centering \begin{subfigure}[h]{0.60\textwidth} \includegraphics[width=1\textwidth]{Fig4a-studentovo-pdf.png} \caption{\mbox{Graf $ f_X $ pro různé hodnoty $ n $ při $ X \sim \mathrm{t}(n) $}.} \label{fig4a-student-pdf} \end{subfigure} \begin{subfigure}[h]{0.60\textwidth} \centering \includegraphics[width=1\textwidth]{Fig4b-rozdeleniF-pdf.png} \caption{\mbox{Graf $f_X $ pro různé hodnoty parametrů $ n $ a $ m $ při $ X \sim \mathrm{F}(n, m) $.}} \label{fig4b-F-pdf} \end{subfigure} \label{fig-studentovo-F-rozd} \caption{Graf hustoty pravděpodobnosti při studentově, resp. $ \mathrm{F} $-rozdělení.} \end{figure} \end{enumerate} \newpage \begin{defi} Řekneme, že náhodná veličina $ \xx $ má rozdělení \textbf{exponenciální třídy}, právě když $(\forall\, \mx \in \mathbb{R}^n)(\forall\, \bm{\theta} \in \Theta \subset \mathbb{R}^k) $ platí \begin{equation*} \xx \sim f_{\xx}(\mx) = c(\bm{\theta}) h(\mx) \exp(\bm{Q}(\bm{\theta}) \cdot \bm{T}(\mx)), \end{equation*} přičemž \begin{itemize} \item $ k \leq n $, \item $ c = c(\bm{\theta}) $ je taková normovací konstanta, že $ c(\bm{\theta}) = \int_{\mathbb{R}^n} h(\mx) \exp\bigl(\bm{Q}(\bm{\theta}) \cdot \bm{T}(\mx)\bigr) \dd\mx < +\infty$, \item mezi $ \bm{Q} $ a $ \bm{T} $ je skalární součin. Jde o zobrazení $ \bm{Q}\colon \mathbb{R}^k \rightarrow \mathbb{R}^k$ a $ \bm{T}\colon \mathbb{R}^n \rightarrow \mathbb{R}^k $. Vektorová funkce $ \bm{T} $ transformuje $ n $-rozměrnou náhodnou veličinu do $ k $-dimenzionálního prostoru, aby mohl být proveden skalární součin s~obrazem~$ \bm{Q} $. \end{itemize} Mezi rozdělení exponenciální třídy patří např. normální, binomické a~Poissonovo. \end{defi}