02OKS:Kapitola6
Z WikiSkripta FJFI ČVUT v Praze
Verze z 5. 9. 2015, 12:08, kterou vytvořil Kyseljar (diskuse | příspěvky) (Založena nová stránka s textem „%\wikiskriptum{02OKS} \section{von Neumannova entropie} \label{sec:vonNeumannova_entropie} V informatice se zavádí veličina $H$ popisující, jak moc…“)
[ znovu generovat, | výstup z překladu ] | Kompletní WikiSkriptum včetně všech podkapitol. | |
PDF Této kapitoly | [ znovu generovat, | výstup z překladu ] | Přeložení pouze této kaptioly. |
ZIP | Kompletní zdrojový kód včetně obrázků. |
Součásti dokumentu 02OKS
součást | akce | popis | poslední editace | soubor | |||
---|---|---|---|---|---|---|---|
Hlavní dokument | editovat | Hlavní stránka dokumentu 02OKS | Kyseljar | 5. 9. 2015 | 12:16 | ||
Řídící stránka | editovat | Definiční stránka dokumentu a vložených obrázků | Admin | 7. 9. 2015 | 14:52 | ||
Header | editovat | Hlavičkový soubor | Kyseljar | 5. 9. 2015 | 12:04 | header.tex | |
Kapitola1 | editovat | Úvodní stránka | Kyseljar | 5. 9. 2015 | 12:06 | titlepage.tex | |
Kapitola2 | editovat | Přehled značení | Kyseljar | 5. 9. 2015 | 12:07 | Prehled_znaceni.tex | |
Kapitola3 | editovat | Úvod | Maresj23 | 12. 8. 2017 | 17:05 | Uvod.tex | |
Kapitola4 | editovat | Operátor hustoty | Gajaleks | 15. 2. 2023 | 12:13 | Operator_hustoty.tex | |
Kapitola5 | editovat | Matematický aparát | Maresj23 | 1. 10. 2017 | 08:30 | Matematicky_aparat.tex | |
Kapitola6 | editovat | vonNeumannova entropie | Kyseljar | 5. 9. 2015 | 12:08 | vonNeumannova_entropie.tex | |
Kapitola7 | editovat | Kvantové měření | Kyseljar | 5. 9. 2015 | 12:09 | Kvantove_mereni.tex | |
Kapitola8 | editovat | Kvantové operace | Kyseljar | 5. 9. 2015 | 12:09 | Kvantove_operace.tex | |
Kapitola9 | editovat | Změny kvantového systému | Kyseljar | 5. 9. 2015 | 12:09 | Zmeny_kvantoveho_systemu.tex | |
Kapitola10 | editovat | Dovětek | Kyseljar | 5. 9. 2015 | 12:09 | Dovetek.tex |
Zdrojový kód
%\wikiskriptum{02OKS} \section{von Neumannova entropie} \label{sec:vonNeumannova_entropie} V informatice se zavádí veličina $H$ popisující, jak moc je dané pravděpodobnostní rozdělení \uv{neočekávatelné}. Pokud jsou všechny hodnoty rozdělení $\{ p_i \}_i$ stejné, tak je tato veličina maximální. Nelze totiž preferovat jednu událost s pravděpodobností $p_1$ před druhou událostí s pravděpodobností $p_2$, neboť každá může nastat stejně často. Takovéto rozdělení bychom mohli označit za \uv{nejvíce neočekávatelné}. Naopak, pokud je rozdělení $\{ p_i \}_i$ tvořeno samými nulami vyjma jedné jedničky $p_{i_0} = 1$, je tato veličina nulová. V takovém případě totiž jev spjatý s pravděpodobností $p_{i_0}$ nastává vždy a žádný jiný jev nenastává. Toto rozdělení je tedy \uv{nejméně neočekávatelné}. Zmíněné veličině se říká \emph{Shannonova entropie} a její definiční předpis pro pravděpodobnostní rozdělení $\{ p_i \}_i$ zní $H(p_i) = -\sum_i p_i \ln p_i$. Jak jsme si uváděli v kapitolce o operátorech hustoty, operátor hustoty $\rho$ lze chápat jako vážený průměr čistých stavů, kde váhami je jisté pravděpodobnostní rozdělení tvořené vlastními hodnotami, $\rho = \sum_i \lambda_i \ketbraSame{i}$. Tento zápis pak zhruba řečeno vyjadřuje, že se daný systém nachází v čistém stavu $\ket{i}$ s pravděpodobností $\lambda_i$. Pokud jsou všechna vlastní čísla vyjma jednoho nulová, je $\rho$ samotné čistým stavem. Žádná neurčitost týkající se \uv{výběru} čistého stavu $\ket{i}$ z rozkladu výše tedy nevzniká. Naproti tomu, jsou-li všechna vlastní čísla stejná, může se stav daného systému nacházet v libovolném z čistých stavů $\ket{i}$ stejně pravděpodobně. Neurčitost \uv{výběru} čistého stavu je maximální. Právě naznačená analogie mezi pravděpodobnostními rozděleními a operátory hustoty nás vede na myšlenku definovat entropii i pro tyto operátory. Jak se lze snadno přesvědčit v diagonální bázi operátoru $\rho$, výraz $-\tr(\rho \ln \rho)$ je roven Shannonově entropii pro rozdělení $\{ \lambda_i \}_i$. Tato úvaha nás motivuje pro zavedení následujícího pojmu. \begin{definice} Nechť $\rho \in \states{\hilb}$ je nějaký operátor hustoty, pak \textbf{von Neumannova entropie} pro tento operátor je veličina definovaná vztahem \begin{equation} S(\rho) \coloneqq -\tr(\rho \ln \rho). \end{equation} \end{definice} Entropie kvantových stavů je důležitá veličina s mnoha zajímavými a intuitivními vlastnostmi. Některé z nich si právě uvedeme. \begin{itemize} \item Platí $S(\rho) \geq 0$, kde se rovnosti nabývá právě, když $\rho$ je čistý stav, tj. $\rho = \ketbrapsi$ pro nějaké $\ketpsi \in \hilb$. Tuto vlastnost lze intuitivně chápat podobně jako v případě Shannonovy entropie. Chápeme-li operátor hustoty jako vážený průměr čistých stavů, pak zřejmě nejméně neočekávatelný výsledek měření na takovémto stavu bude tehdy, když bude tento stav čistý a při vhodné volbě projekčních operátorů (viz později) budeme dostávat stále tentýž výsledek. \item Je-li systém $A + B$ v čistém stavu $\ketpsi \in \hilb_A \tens \hilb_B$, pak entropie stavů jeho podsystémů se rovnají, tj. $S(\rho_A) = S(\rho_B)$. Je-li navíc stav $\ketpsi$ maximálně provázaný, jsou tyto entropie rovny $S(\rho_A) = S(\rho_B) = \ln d > 0$, kde $d = \dim \hilb_A = \dim \hilb_B$. Z prvního bodu přitom $S(\ketbrapsi) = 0$. Vidíme tak, že ač je stav celého systému plně určen, oba jeho podsystémy vykazují neurčitost. \item $S(U \rho \adj{U}) = S(\rho)$ pro libovolný unitární operátor $U \in \bound{\hilb}$. Při uzavřeném vývoji se tedy entropie stavu systému zachovává. \end{itemize} Pár dalších vlastností si vyslovíme a dokážeme ve formě lemmat níže. \begin{lemma} \emph{Konkávnost.} Nechť $\rho, \sigma \in \states{\hilb}$ jsou dva stavy a $p \in [0,1]$. Pak platí \begin{equation} S(p \rho + (1-p) \sigma) \geq p S(\rho) + (1-p) S(\sigma), \end{equation} kde se rovnosti nabývá právě tehdy, když $\rho = \sigma$. \end{lemma} \begin{proof} Označme si $\omega = p \rho + (1-p) \sigma$. Pak z nerovnosti \eqref{eq:Klein_ner_lepsi} plyne $-\tr(\omega \ln \omega) = -p \tr (\rho \ln \omega) - (1-p) \tr (\sigma \ln \omega) \geq -p (\tr (\rho \ln \rho) + \tr(\omega - \rho)) - (1-p)(\tr (\sigma \ln \sigma) + \tr(\omega - \sigma))$. Tento výraz lze dále upravit na $p(-\tr(\rho \ln \rho)) + (1-p)(-\tr (\sigma \ln \sigma)) - \tr(p \omega - p \rho + (1-p) \omega - (1-p) \sigma) = p S(\rho) + (1-p) S(\sigma) - \tr(\omega - (p \rho + (1-p) \sigma)) = S(\rho) + (1-p) S(\sigma)$. Tvrzení lze dokázat i aplikací nerovnosti \eqref{eq:Peier_ner_lepsi}, kde položíme $f(A) \coloneqq A \ln A$. Výsledek dostáváme ihned. \end{proof} \begin{lemma} \emph{Subaditivita.} Nechť $\rho \in \states{\hilb_A \tens \hilb_B}$ je stav systému, $\rho_A = \trPar{B}\rho$ a $\rho_B = \trPar{A}\rho$ nechť jsou jemu odpovídající stavy podsystémů. Pak \begin{equation} S(\rho) \leq S(\rho_A) + S(\rho_B), \end{equation} přičemž rovnost nastává právě tehdy, když je $\rho$ faktorizovaného tvaru $\rho = \rho_A \tens \rho_B$. \end{lemma} \begin{proof} Označíme-li $A = \rho$ a $B = \rho_A \tens \rho_B$, plyne po dosazení do \eqref{eq:Klein_ner_lepsi} z Kleinovy nerovnosti $\tr(\rho \ln \rho) \geq \tr(\rho \ln (\rho_A \tens \rho_B)) + \tr(\rho - \rho_A \tens \rho_B) = \tr(\rho \ln (\rho_A \tens \ident)(\ident \tens \rho_B)) + \tr(\rho) - \tr(\rho_A \tens \rho_B)$. Neboť $\tr \rho = 1 = \tr(\rho_A \tens \rho_B)$, dostáváme $\tr(\rho \ln \rho) \geq \tr(\rho \ln (\rho_A \tens \ident)) + \tr(\rho \ln (\ident \tens \rho_B))$. Dále platí $\tr(\rho \ln (\rho_A \tens \ident)) = \tr(\rho ((\ln \rho_A) \tens \ident)) = \tr \rho_A \ln \rho_A$ a obdobně pro systém $B$. Celkem tedy $\tr(\rho \ln \rho) \geq \tr(\rho_A \ln \rho_A) + \tr(\rho_B \ln \rho_B)$, z čehož již plyne dokazované tvrzení. \end{proof} \begin{lemma} \emph{Arakiho-Liebova nerovnost.} Nechť $\rho \in \states{\hilb_A \tens \hilb_B}$ je operátor hustoty složeného systému, $\rho_A = \trPar{B}\rho$ a $\rho_B = \trPar{A}\rho$ nechť jsou jemu odpovídající stavy podsystémů. Pak \begin{equation} S(\rho) \geq |S(\rho_A) - S(\rho_B)|. \end{equation} \end{lemma} \begin{proof} Stav celého systému $\rho \in \states{\hilb_A \tens \hilb_B}$ lze purifikovat na čistý stav $\ketpsi \in \hilb_A \tens \hilb_B \tens \hilb_C$ splňující $\rho = \trPar{C}(\ketbrapsi)$. Označíme si $S_i = S(\rho_i)$. Neboť $\ketpsi$ je čistý, platí z vlastností entropie zmíněných výše, že $S_{AB} = S_{C}$, $S_{AC} =S_B$ a $S_{BC} = S_{A}$. Dále ze subaditivity plyne $S_A + S_C \geq S_{AC}$ atd. Přeuspořádáním získaných nerovností dospíváme ke vztahům $S_{AB} = S_{C} \geq S_B - S_A$ a $S_{AB} \geq S_A - S_B$, ze kterých plyne dokazované tvrzení. \end{proof} \begin{definice} Jako \textbf{index korelace} $I_C$ kvantových stavů dvou podsystémů $A$ a $B$ označíme veličinu $I_C = S_A + S_B - S_{AB}$, kde $S_i = S(\rho_i)$ jsou entropie stavů jednotlivých podsystémů a $S_{AB}$ je entropie stavu $\rho$ celého systému. \end{definice} Index korelace kvantifikuje míru klasických i kvantových korelací mezi dvěma systémy. Neboť mezi čistými stavy nevyvstávají žádné klasické korelace, můžeme říci, že pro čisté stavy veličina $I_C$ přímo kvantifikuje míru provázání. Index korelace nabývá maximální hodnoty právě tehdy, když je stav $\rho$ celého systému maximálně provázaný. Navíc platí zřejmé nerovnosti $0 \leq I_C \leq 2 \min \{S_A, S_B\}$. Pro entropii smíšeného stavu platí následující vztahy, které si vzápětí dokážeme. \begin{veta} Nechť $\{p_i\}_i$ je pravděpodobnostní rozdělení, $\{ \rho_i \}_i$ je sada operátorů hustoty z prostoru $\bound{\hilb}$ a $H(\{ p_i \}_i) = - \sum_i p_i \ln p_i$ je Shannonova entropie. Pak platí \begin{equation} \sum_i p_i S(\rho_i) \ \leq \ S \left( \sum_i p_i \rho_i \right) \ \leq \ \sum_i p_i S(\rho_i) + H(\{ p_i \}_i). \end{equation} \end{veta} \begin{proof} První nerovnost lze dokázat matematickou indukcí, kde tvrzení pro $i=2$ bylo dokázáno výše. Přikročme tedy k důkazu druhé nerovnosti. Tu nejprve dokážeme pro případ, kdy jsou $\rho_i \in \states{\hilb}$ čisté stavy, $\rho_i = \ketbraSame{\psi_i}$. Označme si $\hilb \equiv \hilb_A$ a připomeňme, že $\basisAlt{\psi_i}{i}{N}$ nejsou obecně ortonormální. Definujme si pomocné vektory $\ket{\psi^{AB}} = \sum_i \sqrt{p_i} \ket{\psi_i} \ket{i}$ ležící v prostoru $\hilb_A \tens \hilb_B$, kde $\{\ket{i}\}_i$ je ortonormální báze prostoru $\hilb_B$ dimenze $\dim \hilb_B = N$. Vidíme, že platí $\sum_i p_i \rho_i = \rho_A \equiv \trPar{B}(\ketbraSame{\psi^{AB}})$ a $\rho_B \equiv \trPar{A}(\ketbraSame{\psi^{AB}}) = \sum_{i j k} \sqrt{p_i p_j} \braket{e_k}{\psi_i} \braket{\psi_j}{e_k} \ketbra{i}{j}$, kde $\{ e_k \}_k$ je ortonormální báze prostoru $\hilb_A$. Pak $S(\sum_i p_i \rho_i) = S(\rho_A) = S(\rho_B)$, což plyne z obecných vlastností entropie. Z nerovnosti \eqref{eq:Klein_ner_lepsi} dále $-\tr(\rho \ln \rho) \leq -\tr(\rho \ln \rho')$ pro libovolné $\rho, \rho' \in \states{\hilb_B}$. Můžeme tedy vzít $\rho'_B = \sum_i p_i \ketbraSame{i}$ a aplikovat nerovnost, abychom obdrželi $S(\rho_B) = - \tr(\rho_B \ln \rho_B) \leq - \tr(\rho_B \ln \rho'_B)$. Nyní si uvědomíme, že stopa přes celý prostor je tvaru $\tr(\cdot) = \sum_{i k} \bra{e_k} \bra{i} (\cdot) \ket{e_k} \ket{i}$. Explicitním výpočtem lze snadno zjistit, že poslední výraz, ke kterému jsme zatím dospěli, je roven $- \sum_i \tr(\sum_k p_i |\braket{e_k}{\psi_i}|^2 \ketbraSame{i} \ln \rho'_B)$. S pomocí Parsevalovy rovnosti lze tento výraz upravit na tvar $-\sum_i \tr(p_i \ketbraSame{i} \ln \rho'_B) = -\tr(\rho'_B \ln \rho'_B) = -\sum_i p_i \ln p_i = H(\{ p_i \}_i)$. Pro čisté stavy $\rho_i$ jsme tedy dokázali nerovnost $S(\sum_i p_i \rho_i) \leq H(\{ p_i \}_i)$. Pro obecné stavy máme $\rho_i = \sum_j p_j^{(i)} \ketbraSame{e_j^{(i)}}$ a tedy $\rho = \sum_i p_i \rho_i = \sum_{i j} p_i p_j^{(i)} \ketbraSame{e_j^{(i)}}$. Tento operátor můžu chápat jako soubor čistých stavů $\{ \ket{e_j^{(i)}} \}_{i j}$ s pravděpodobnostním rozdělením $\{ p_i p_j^{(i)} \}_{i j}$, na které mohu aplikovat výsledek obdržený výše. Dostáváme tudíž zřejmé vztahy $S(\rho) \leq H(\{ p_i p_j^{(i)} \}_{i j}) = - \sum_{i j} p_i p_j^{(i)} \ln p_i p_j^{(i)} = - \sum_{i j} p_i p_j^{(i)} \ln p_i - \sum_{i j} p_i p_j^{(i)} \ln p_j^{(i)}$. Tento výraz lze zjevně upravit dále na $-\sum_i (\sum_j p_j^{(i)}) p_i \ln p_i + \sum_i p_i (-\sum_j p_j^{(i)} \ln p_j^{(i)}) = H(\{ p_i \}_i) + \sum_i p_i S(\rho_i)$, což bylo dokázati. \end{proof} \subsection{Relativní entropie} Kromě obyčejné entropie je vhodné si zavést další podobné pojmy, jakým je například relativní entropie. Než přikročíme k definici kvantové relativní entropie, je názorné si připomenout definici klasické relativní entropie. Ta je pro dvě pravděpodobnostní rozdělení $\vec{p} \equiv \{p_i\}_i$ a $\vec{q} \equiv \{q_i\}_i$ definována vztahem $S(\vec{q} \| \vec{p}) = \sum_i (q_i \ln q_i - q_i \ln p_i)$. \begin{priklad} \emph{Nesouměrná mince.} Házejme si mincí a zjišťujme, s jakou pravděpodobností nám padne panna či orel. Chceme přitom zjistit, jaké pravděpodobnostní rozdělení sledují výsledky hodů této mince. Nechť $\{p,1-p\}$ je pravděpodobnostní rozdělení, které mince skutečně sleduje a nechť $\{q,1-q\}$ je nějaké jiné rozdělení. Dále nechť $p$, resp. $q$, odpovídá situaci, kdy nám padne panna, a podobně nechť $1-p$, resp. $1-q$, odpovídá situaci, kdy nám padne orel. Zajímá nás tedy, jaká je pravděpodobnost, že zaměníme rozdělení $\vec{p}$ a $\vec{q}$. Při provedení $N$ nezávislých pokusů je pravděpodobnost, že právě $n$-krát padne panna, rovna $p(n,N) = \binom{N}{n} p^n (1-p)^{N-n}$. Využijeme-li Stirlingovy formule pro aproximaci faktoriálu, obdržíme \begin{eqnarray*} \ln p(n,N) & = & \ln \frac{N!}{n! (N-n)!} p^n (1-p)^{N-n} \ \sim \ \ln \frac{\left( \frac{N}{e} \right)^N}{\left( \frac{n}{e} \right)^n \left( \frac{N - n}{e} \right)^{N-n}} p^n (1-p)^{N-n} \\ & = & N \ln N - n \ln n - (N-n) \ln (N-n) + n \ln p + (N-n) \ln (1-p) \\ & = & -N \left( -\ln N + \frac{n}{N} \ln n + \left(1-\frac{n}{N}\right) \ln (N-n) - \frac{n}{N} \ln p - \left(1-\frac{n}{N}\right) \ln (1-p) \right) \\ & = & -N \left( \frac{n}{N} \ln \frac{n}{N} + \left(1-\frac{n}{N}\right) \ln \left(1-\frac{n}{N}\right) - \frac{n}{N} \ln p - \left(1-\frac{n}{N}\right) \ln (1-p) \right). \end{eqnarray*} Označme si nyní $q = n/N$, předchozí výraz se tak redukuje do tvaru, v němž rozpoznáváme relativní entropii $-N(q \ln q + (1-q) \ln (1-q) - q \ln p - (1-q) \ln (1-p)) = -N S(\vec{q} \| \vec{p})$. Obdrželi jsme tak vzorec, kterému se říká \emph{Sanovova věta} \begin{equation} p(\vec{q} \| \vec{p}) = e^{-N S( \vec{q} \| \vec{p})}, \end{equation} kde $p(\vec{q} \| \vec{p})$ označuje pravděpodobnost záměny rozdělení $\vec{p}$ a $\vec{q}$. Z tohoto vzorce je patrné, že pravděpodobnost záměny se zmenšuje se zvětšující se relativní entropií. Relativní entropii lze chápat jako míru rozlišitelnosti rozdělení $\vec{p}$ a $\vec{q}$. \end{priklad} Relativní entropie \emph{není} obecně symetrická, tj. obecně $S(\vec{p} \| \vec{q}) \neq S(\vec{q} \| \vec{p})$. Například pro rozdělení $\vec{p} = (1,0)$ a $\vec{q}=(1/2,1/2)$ dostáváme $S(\vec{p} \| \vec{q}) = 1 \ln 1 + 0 \ln 0 - 1 \ln 1/2 - 0 \ln 1/2 = \ln 2$, zatímco $S(\vec{q} \| \vec{p}) = 1/2 \ln 1/2 + 1/2 \ln 1/2 - 1/2 \ln 1 - 1/2 \ln 0 = + \infty$. Přejděme nyní k definici \emph{kvantové} relativní entropie. \begin{definice} Mějme dva operátory hustoty $\rho, \sigma \in \states{\hilb}$. Pak \textbf{kvantová relativní entropie} pro tyto dva stavy je definována vztahem \begin{equation} S(\rho\| \sigma) = \tr(\rho \ln \rho - \rho \ln \sigma). \end{equation} \end{definice} Kvantovou relativní entropii dvou stavů lze chápat jako míru rozlišitelnosti (či ne\-za\-mě\-ni\-tel\-nos\-ti) těchto dvou stavů. Uvažujme nyní stav $\rho$ systému složeného ze dvou podsystémů $A$ a $B$. Stavy jednotlivých podsystémů jsou zřejmě rovny $\rho_A = \trPar{B} \rho$ a $\rho_B = \trPar{A} \rho$. Jak už jsme si dříve řekli, stav podsystému $A$ společně se stavem podsystému $B$ \emph{nejsou} schopny reprodukovat všechny vlastnosti obsažené ve stavu $\rho$ složeného systému. Důvodem je to, že jednotlivé stavy podsystémů neobsahují informaci o jejich vzájemném provázání. Podívejme se, o kolik informace přijdeme, omezíme-li se pouze na stavy $\rho_A$ a $\rho_B$ namísto stavu $\rho$. Dostáváme $S(\rho \| \rho_A \tens \rho_B) = \tr(\rho \ln \rho) - \tr(\rho \ln (\rho_A \tens \rho_B)) = \tr(\rho \ln \rho) - \tr(\rho \ln (\ident \tens \rho_B)) - \tr(\rho \ln (\rho_A \tens \ident)) = -S + S_A + S_B = I_C$. Vidíme tedy, že míra rozlišitelnosti provázaného stavu $\rho$ od toho neprovázaného $\rho_A \tens \rho_B$ je rovna indexu korelace $I_C$ zavedenému výše. Kvantová relativní entropie má dále následující vlastnosti, kde $\rho, \sigma \in \states{\hilb}$ jsou libovolné operátory hustoty. \begin{itemize} \item $S(\rho \| \sigma) = +\infty$ právě tehdy, když $\supp \sigma \subset \supp \rho$, \item $S(\rho \| \sigma) \geq 0$, což plyne z Kleinovy nerovnosti; rovnost se přitom nabývá právě tehdy, když $\rho = \sigma$, \item $S(U \rho \adj{U} \| U \sigma \adj{U}) = S(\rho \| \sigma)$ pro všechny unitární operátory $U \in \bound{\hilb}$. \end{itemize}