02OKS:Kapitola6

Z WikiSkripta FJFI ČVUT v Praze
Přejít na: navigace, hledání
PDF [ znovu generovat, výstup z překladu ] Kompletní WikiSkriptum včetně všech podkapitol.
PDF Této kapitoly [ znovu generovat, výstup z překladu ] Přeložení pouze této kaptioly.
ZIPKompletní zdrojový kód včetně obrázků.

Součásti dokumentu 02OKS

součástakcepopisposlední editacesoubor
Hlavní dokument editovatHlavní stránka dokumentu 02OKSKyseljar 5. 9. 201511:16
Řídící stránka editovatDefiniční stránka dokumentu a vložených obrázkůAdmin 7. 9. 201513:52
Header editovatHlavičkový souborKyseljar 5. 9. 201511:04 header.tex
Kapitola1 editovatÚvodní stránkaKyseljar 5. 9. 201511:06 titlepage.tex
Kapitola2 editovatPřehled značeníKyseljar 5. 9. 201511:07 Prehled_znaceni.tex
Kapitola3 editovatÚvodMaresj23 12. 8. 201716:05 Uvod.tex
Kapitola4 editovatOperátor hustotyGajaleks 15. 2. 202311:13 Operator_hustoty.tex
Kapitola5 editovatMatematický aparátMaresj23 1. 10. 201707:30 Matematicky_aparat.tex
Kapitola6 editovatvonNeumannova entropieKyseljar 5. 9. 201511:08 vonNeumannova_entropie.tex
Kapitola7 editovatKvantové měřeníKyseljar 5. 9. 201511:09 Kvantove_mereni.tex
Kapitola8 editovatKvantové operaceKyseljar 5. 9. 201511:09 Kvantove_operace.tex
Kapitola9 editovatZměny kvantového systémuKyseljar 5. 9. 201511:09 Zmeny_kvantoveho_systemu.tex
Kapitola10 editovatDovětekKyseljar 5. 9. 201511:09 Dovetek.tex

Zdrojový kód

%\wikiskriptum{02OKS}
 
\section{von Neumannova entropie}
\label{sec:vonNeumannova_entropie}
 
V informatice se zavádí veličina $H$ popisující, jak moc je dané pravděpodobnostní rozdělení \uv{neočekávatelné}. Pokud jsou všechny hodnoty rozdělení $\{ p_i \}_i$ stejné, tak je tato veličina maximální. Nelze totiž preferovat jednu událost s pravděpodobností $p_1$ před druhou událostí s pravděpodobností $p_2$, neboť každá může nastat stejně často. Takovéto rozdělení bychom mohli označit za \uv{nejvíce neočekávatelné}. Naopak, pokud je rozdělení $\{ p_i \}_i$ tvořeno samými nulami vyjma jedné jedničky $p_{i_0} = 1$, je tato veličina nulová. V takovém případě totiž jev spjatý s pravděpodobností $p_{i_0}$ nastává vždy a žádný jiný jev nenastává. Toto rozdělení je tedy \uv{nejméně neočekávatelné}. Zmíněné veličině se říká \emph{Shannonova entropie} a její definiční předpis pro pravděpodobnostní rozdělení $\{ p_i \}_i$ zní $H(p_i) = -\sum_i p_i \ln p_i$.
 
Jak jsme si uváděli v kapitolce o operátorech hustoty, operátor hustoty $\rho$ lze chápat jako vážený průměr čistých stavů, kde váhami je jisté pravděpodobnostní rozdělení tvořené vlastními hodnotami, $\rho = \sum_i \lambda_i \ketbraSame{i}$. Tento zápis pak zhruba řečeno vyjadřuje, že se daný systém nachází v čistém stavu $\ket{i}$ s pravděpodobností $\lambda_i$. Pokud jsou všechna vlastní čísla vyjma jednoho nulová, je $\rho$ samotné čistým stavem. Žádná neurčitost týkající se \uv{výběru} čistého stavu $\ket{i}$ z rozkladu výše tedy nevzniká. Naproti tomu, jsou-li všechna vlastní čísla stejná, může se stav daného systému nacházet v libovolném z čistých stavů $\ket{i}$ stejně pravděpodobně. Neurčitost \uv{výběru} čistého stavu je maximální.
 
Právě naznačená analogie mezi pravděpodobnostními rozděleními a operátory hustoty nás vede na myšlenku definovat entropii i pro tyto operátory. Jak se lze snadno přesvědčit v diagonální bázi operátoru $\rho$, výraz $-\tr(\rho \ln \rho)$ je roven Shannonově entropii pro rozdělení $\{ \lambda_i \}_i$. Tato úvaha nás motivuje pro zavedení následujícího pojmu.
 
\begin{definice}
Nechť $\rho \in \states{\hilb}$ je nějaký operátor hustoty, pak \textbf{von Neumannova entropie} pro tento operátor je veličina definovaná vztahem
\begin{equation}
S(\rho) \coloneqq -\tr(\rho \ln \rho).
\end{equation}
\end{definice}
 
Entropie kvantových stavů je důležitá veličina s mnoha zajímavými a intuitivními vlastnostmi. Některé z nich si právě uvedeme.
\begin{itemize}
\item Platí $S(\rho) \geq 0$, kde se rovnosti nabývá právě, když $\rho$ je čistý stav, tj. $\rho = \ketbrapsi$ pro nějaké $\ketpsi \in \hilb$. Tuto vlastnost lze intuitivně chápat podobně jako v případě Shannonovy entropie. Chápeme-li operátor hustoty jako vážený průměr čistých stavů, pak zřejmě nejméně neočekávatelný výsledek měření na takovémto stavu bude tehdy, když bude tento stav čistý a při vhodné volbě projekčních operátorů (viz později) budeme dostávat stále tentýž výsledek.
\item Je-li systém $A + B$ v čistém stavu $\ketpsi \in \hilb_A \tens \hilb_B$, pak entropie stavů jeho podsystémů se rovnají, tj. $S(\rho_A) = S(\rho_B)$. Je-li navíc stav $\ketpsi$ maximálně provázaný, jsou tyto entropie rovny $S(\rho_A) = S(\rho_B) = \ln d > 0$, kde $d = \dim \hilb_A = \dim \hilb_B$. Z prvního bodu přitom $S(\ketbrapsi) = 0$. Vidíme tak, že ač je stav celého systému plně určen, oba jeho podsystémy vykazují neurčitost.
\item $S(U \rho \adj{U}) = S(\rho)$ pro libovolný unitární operátor $U \in \bound{\hilb}$. Při uzavřeném vývoji se tedy entropie stavu systému zachovává.
\end{itemize}
Pár dalších vlastností si vyslovíme a dokážeme ve formě lemmat níže.
 
\begin{lemma}
\emph{Konkávnost.} Nechť $\rho, \sigma \in \states{\hilb}$ jsou dva stavy a $p \in [0,1]$. Pak platí
\begin{equation}
S(p \rho + (1-p) \sigma) \geq p S(\rho) + (1-p) S(\sigma),
\end{equation}
kde se rovnosti nabývá právě tehdy, když $\rho = \sigma$.
\end{lemma}
 
\begin{proof}
Označme si $\omega = p \rho + (1-p) \sigma$. Pak z nerovnosti \eqref{eq:Klein_ner_lepsi} plyne $-\tr(\omega \ln \omega) = -p \tr (\rho \ln \omega) - (1-p) \tr (\sigma \ln \omega) \geq -p (\tr (\rho \ln \rho) + \tr(\omega - \rho)) - (1-p)(\tr (\sigma \ln \sigma) + \tr(\omega - \sigma))$. Tento výraz lze dále upravit na $p(-\tr(\rho \ln \rho)) + (1-p)(-\tr (\sigma \ln \sigma)) - \tr(p \omega - p \rho + (1-p) \omega - (1-p) \sigma) = p S(\rho) + (1-p) S(\sigma) - \tr(\omega - (p \rho + (1-p) \sigma)) = S(\rho) + (1-p) S(\sigma)$. Tvrzení lze dokázat i aplikací nerovnosti \eqref{eq:Peier_ner_lepsi}, kde položíme $f(A) \coloneqq A \ln A$. Výsledek dostáváme ihned.
\end{proof}
 
\begin{lemma}
\emph{Subaditivita.} Nechť $\rho \in \states{\hilb_A \tens \hilb_B}$ je stav systému, $\rho_A = \trPar{B}\rho$ a $\rho_B = \trPar{A}\rho$ nechť jsou jemu odpovídající stavy podsystémů. Pak
\begin{equation}
S(\rho) \leq S(\rho_A) + S(\rho_B),
\end{equation}
přičemž rovnost nastává právě tehdy, když je $\rho$ faktorizovaného tvaru $\rho = \rho_A \tens \rho_B$.
\end{lemma}
 
\begin{proof}
Označíme-li $A = \rho$ a $B = \rho_A \tens \rho_B$, plyne po dosazení do \eqref{eq:Klein_ner_lepsi} z Kleinovy nerovnosti $\tr(\rho \ln \rho) \geq \tr(\rho \ln (\rho_A \tens \rho_B)) + \tr(\rho - \rho_A \tens \rho_B) = \tr(\rho \ln (\rho_A \tens \ident)(\ident \tens \rho_B)) + \tr(\rho) - \tr(\rho_A \tens \rho_B)$. Neboť $\tr \rho = 1 = \tr(\rho_A \tens \rho_B)$, dostáváme $\tr(\rho \ln \rho) \geq \tr(\rho \ln (\rho_A \tens \ident)) + \tr(\rho \ln (\ident \tens \rho_B))$. Dále platí $\tr(\rho \ln (\rho_A \tens \ident)) = \tr(\rho ((\ln \rho_A) \tens \ident)) = \tr \rho_A \ln \rho_A$ a obdobně pro systém $B$. Celkem tedy $\tr(\rho \ln \rho) \geq \tr(\rho_A \ln \rho_A) + \tr(\rho_B \ln \rho_B)$, z čehož již plyne dokazované tvrzení.
\end{proof}
 
\begin{lemma}
\emph{Arakiho-Liebova nerovnost.} Nechť $\rho \in \states{\hilb_A \tens \hilb_B}$ je operátor hustoty složeného systému, $\rho_A = \trPar{B}\rho$ a $\rho_B = \trPar{A}\rho$ nechť jsou jemu odpovídající stavy podsystémů. Pak
\begin{equation}
S(\rho) \geq |S(\rho_A) - S(\rho_B)|.
\end{equation}
\end{lemma}
 
\begin{proof}
Stav celého systému $\rho \in \states{\hilb_A \tens \hilb_B}$ lze purifikovat na čistý stav $\ketpsi \in \hilb_A \tens \hilb_B \tens \hilb_C$ splňující $\rho = \trPar{C}(\ketbrapsi)$. Označíme si $S_i = S(\rho_i)$. Neboť $\ketpsi$ je čistý, platí z vlastností entropie zmíněných výše, že $S_{AB} = S_{C}$, $S_{AC} =S_B$ a $S_{BC} = S_{A}$. Dále ze subaditivity plyne $S_A + S_C \geq S_{AC}$ atd. Přeuspořádáním získaných nerovností dospíváme ke vztahům $S_{AB} = S_{C} \geq S_B - S_A$ a $S_{AB} \geq S_A - S_B$, ze kterých plyne dokazované tvrzení.
\end{proof}
 
\begin{definice}
Jako \textbf{index korelace} $I_C$ kvantových stavů dvou podsystémů $A$ a $B$ označíme veličinu $I_C = S_A + S_B - S_{AB}$, kde $S_i = S(\rho_i)$ jsou entropie stavů jednotlivých podsystémů a $S_{AB}$ je entropie stavu $\rho$ celého systému.
\end{definice}
Index korelace kvantifikuje míru klasických i kvantových korelací mezi dvěma systémy. Neboť mezi čistými stavy nevyvstávají žádné klasické korelace, můžeme říci, že pro čisté stavy veličina $I_C$ přímo kvantifikuje míru provázání. Index korelace nabývá maximální hodnoty právě tehdy, když je stav $\rho$ celého systému maximálně provázaný. Navíc platí zřejmé nerovnosti $0 \leq I_C \leq 2 \min \{S_A, S_B\}$.
 
Pro entropii smíšeného stavu platí následující vztahy, které si vzápětí dokážeme.
\begin{veta}
Nechť $\{p_i\}_i$ je pravděpodobnostní rozdělení, $\{ \rho_i \}_i$ je sada operátorů hustoty z prostoru $\bound{\hilb}$ a $H(\{ p_i \}_i) = - \sum_i p_i \ln p_i$ je Shannonova entropie. Pak platí
\begin{equation}
\sum_i p_i S(\rho_i) \ \leq \ S \left( \sum_i p_i \rho_i \right) \ \leq \ \sum_i p_i S(\rho_i) + H(\{ p_i \}_i).
\end{equation}
\end{veta}
 
\begin{proof}
První nerovnost lze dokázat matematickou indukcí, kde tvrzení pro $i=2$ bylo dokázáno výše. Přikročme tedy k důkazu druhé nerovnosti. Tu nejprve dokážeme pro případ, kdy jsou $\rho_i \in \states{\hilb}$ čisté stavy, $\rho_i = \ketbraSame{\psi_i}$. Označme si $\hilb \equiv \hilb_A$ a připomeňme, že $\basisAlt{\psi_i}{i}{N}$ nejsou obecně ortonormální. Definujme si pomocné vektory $\ket{\psi^{AB}} = \sum_i \sqrt{p_i} \ket{\psi_i} \ket{i}$ ležící v prostoru $\hilb_A \tens \hilb_B$, kde $\{\ket{i}\}_i$ je ortonormální báze prostoru $\hilb_B$ dimenze $\dim \hilb_B = N$. Vidíme, že platí $\sum_i p_i \rho_i = \rho_A \equiv \trPar{B}(\ketbraSame{\psi^{AB}})$ a $\rho_B \equiv \trPar{A}(\ketbraSame{\psi^{AB}}) = \sum_{i j k} \sqrt{p_i p_j} \braket{e_k}{\psi_i} \braket{\psi_j}{e_k} \ketbra{i}{j}$, kde $\{ e_k \}_k$ je ortonormální báze prostoru $\hilb_A$. Pak $S(\sum_i p_i \rho_i) = S(\rho_A) = S(\rho_B)$, což plyne z obecných vlastností entropie. Z nerovnosti \eqref{eq:Klein_ner_lepsi} dále $-\tr(\rho \ln \rho) \leq -\tr(\rho \ln \rho')$ pro libovolné $\rho, \rho' \in \states{\hilb_B}$. Můžeme tedy vzít $\rho'_B = \sum_i p_i \ketbraSame{i}$ a aplikovat nerovnost, abychom obdrželi $S(\rho_B) = - \tr(\rho_B \ln \rho_B) \leq - \tr(\rho_B \ln \rho'_B)$. Nyní si uvědomíme, že stopa přes celý prostor je tvaru $\tr(\cdot) = \sum_{i k} \bra{e_k} \bra{i} (\cdot) \ket{e_k} \ket{i}$. Explicitním výpočtem lze snadno zjistit, že poslední výraz, ke kterému jsme zatím dospěli, je roven $- \sum_i \tr(\sum_k p_i |\braket{e_k}{\psi_i}|^2 \ketbraSame{i} \ln \rho'_B)$. S pomocí Parsevalovy rovnosti lze tento výraz upravit na tvar $-\sum_i \tr(p_i \ketbraSame{i} \ln \rho'_B) = -\tr(\rho'_B \ln \rho'_B) = -\sum_i p_i \ln p_i = H(\{ p_i \}_i)$. Pro čisté stavy $\rho_i$ jsme tedy dokázali nerovnost $S(\sum_i p_i \rho_i) \leq H(\{ p_i \}_i)$.
 
Pro obecné stavy máme $\rho_i = \sum_j p_j^{(i)} \ketbraSame{e_j^{(i)}}$ a tedy $\rho = \sum_i p_i \rho_i = \sum_{i j} p_i p_j^{(i)} \ketbraSame{e_j^{(i)}}$. Tento operátor můžu chápat jako soubor čistých stavů $\{ \ket{e_j^{(i)}} \}_{i j}$ s pravděpodobnostním rozdělením $\{ p_i p_j^{(i)} \}_{i j}$, na které mohu aplikovat výsledek obdržený výše. Dostáváme tudíž zřejmé vztahy $S(\rho) \leq H(\{ p_i p_j^{(i)} \}_{i j}) = - \sum_{i j} p_i p_j^{(i)} \ln p_i p_j^{(i)} = - \sum_{i j} p_i p_j^{(i)} \ln p_i - \sum_{i j} p_i p_j^{(i)} \ln p_j^{(i)}$. Tento výraz lze zjevně upravit dále na $-\sum_i (\sum_j p_j^{(i)}) p_i \ln p_i + \sum_i p_i (-\sum_j p_j^{(i)} \ln p_j^{(i)}) = H(\{ p_i \}_i) + \sum_i p_i S(\rho_i)$, což bylo dokázati.
\end{proof}
 
\subsection{Relativní entropie}
 
Kromě obyčejné entropie je vhodné si zavést další podobné pojmy, jakým je například relativní entropie. Než přikročíme k definici kvantové relativní entropie, je názorné si připomenout definici klasické relativní entropie. Ta je pro dvě pravděpodobnostní rozdělení $\vec{p} \equiv \{p_i\}_i$ a $\vec{q} \equiv \{q_i\}_i$ definována vztahem $S(\vec{q} \| \vec{p}) = \sum_i (q_i \ln q_i - q_i \ln p_i)$.
 
\begin{priklad}
\emph{Nesouměrná mince.} Házejme si mincí a zjišťujme, s jakou pravděpodobností nám padne panna či orel. Chceme přitom zjistit, jaké pravděpodobnostní rozdělení sledují výsledky hodů této mince. Nechť $\{p,1-p\}$ je pravděpodobnostní rozdělení, které mince skutečně sleduje a nechť $\{q,1-q\}$ je nějaké jiné rozdělení. Dále nechť $p$, resp. $q$, odpovídá situaci, kdy nám padne panna, a podobně nechť $1-p$, resp. $1-q$, odpovídá situaci, kdy nám padne orel. Zajímá nás tedy, jaká je pravděpodobnost, že zaměníme rozdělení $\vec{p}$ a $\vec{q}$.
 
Při provedení $N$ nezávislých pokusů je pravděpodobnost, že právě $n$-krát padne panna, rovna $p(n,N) = \binom{N}{n} p^n (1-p)^{N-n}$. Využijeme-li Stirlingovy formule pro aproximaci faktoriálu, obdržíme
\begin{eqnarray*}
\ln p(n,N) & = & \ln \frac{N!}{n! (N-n)!} p^n (1-p)^{N-n} \ \sim \ \ln \frac{\left( \frac{N}{e} \right)^N}{\left( \frac{n}{e} \right)^n \left( \frac{N - n}{e} \right)^{N-n}}  p^n (1-p)^{N-n} \\
& = & N \ln N - n \ln n - (N-n) \ln (N-n) + n \ln p + (N-n) \ln (1-p) \\
& = & -N \left( -\ln N + \frac{n}{N} \ln n + \left(1-\frac{n}{N}\right) \ln (N-n) - \frac{n}{N} \ln p - \left(1-\frac{n}{N}\right) \ln (1-p) \right) \\
& = & -N \left( \frac{n}{N} \ln \frac{n}{N} + \left(1-\frac{n}{N}\right) \ln \left(1-\frac{n}{N}\right) - \frac{n}{N} \ln p - \left(1-\frac{n}{N}\right) \ln (1-p) \right).
\end{eqnarray*}
Označme si nyní $q = n/N$, předchozí výraz se tak redukuje do tvaru, v němž rozpoznáváme relativní entropii $-N(q \ln q + (1-q) \ln (1-q) - q \ln p - (1-q) \ln (1-p)) = -N S(\vec{q} \| \vec{p})$. Obdrželi jsme tak vzorec, kterému se říká \emph{Sanovova věta}
\begin{equation}
p(\vec{q} \| \vec{p}) = e^{-N S( \vec{q} \| \vec{p})},
\end{equation}
kde $p(\vec{q} \| \vec{p})$ označuje pravděpodobnost záměny rozdělení $\vec{p}$ a $\vec{q}$. Z tohoto vzorce je patrné, že pravděpodobnost záměny se zmenšuje se zvětšující se relativní entropií. Relativní entropii lze chápat jako míru rozlišitelnosti rozdělení $\vec{p}$ a $\vec{q}$.
\end{priklad}
 
Relativní entropie \emph{není} obecně symetrická, tj. obecně $S(\vec{p} \| \vec{q}) \neq S(\vec{q} \| \vec{p})$. Například pro rozdělení $\vec{p} = (1,0)$ a $\vec{q}=(1/2,1/2)$ dostáváme $S(\vec{p} \| \vec{q}) = 1 \ln 1 + 0 \ln 0 - 1 \ln 1/2 - 0 \ln 1/2 = \ln 2$, zatímco $S(\vec{q} \| \vec{p}) = 1/2 \ln 1/2 + 1/2 \ln 1/2 - 1/2 \ln 1 - 1/2 \ln 0 = + \infty$. Přejděme nyní k definici \emph{kvantové} relativní entropie.
 
\begin{definice}
Mějme dva operátory hustoty $\rho, \sigma \in \states{\hilb}$. Pak \textbf{kvantová relativní entropie} pro tyto dva stavy je definována vztahem
\begin{equation}
S(\rho\| \sigma) = \tr(\rho \ln \rho - \rho \ln \sigma).
\end{equation}
\end{definice}
 
Kvantovou relativní entropii dvou stavů lze chápat jako míru rozlišitelnosti (či ne\-za\-mě\-ni\-tel\-nos\-ti) těchto dvou stavů. Uvažujme nyní stav $\rho$ systému složeného ze dvou podsystémů $A$ a $B$. Stavy jednotlivých podsystémů jsou zřejmě rovny $\rho_A = \trPar{B} \rho$ a $\rho_B = \trPar{A} \rho$. Jak už jsme si dříve řekli, stav podsystému $A$ společně se stavem podsystému $B$ \emph{nejsou} schopny reprodukovat všechny vlastnosti obsažené ve stavu $\rho$ složeného systému. Důvodem je to, že jednotlivé stavy podsystémů neobsahují informaci o jejich vzájemném provázání. Podívejme se, o kolik informace přijdeme, omezíme-li se pouze na stavy $\rho_A$ a $\rho_B$ namísto stavu $\rho$. Dostáváme $S(\rho \| \rho_A \tens \rho_B) = \tr(\rho \ln \rho) - \tr(\rho \ln (\rho_A \tens \rho_B)) = \tr(\rho \ln \rho) - \tr(\rho \ln (\ident \tens \rho_B)) - \tr(\rho \ln (\rho_A \tens \ident)) = -S + S_A + S_B = I_C$. Vidíme tedy, že míra rozlišitelnosti provázaného stavu $\rho$ od toho neprovázaného $\rho_A \tens \rho_B$ je rovna indexu korelace $I_C$ zavedenému výše.
 
Kvantová relativní entropie má dále následující vlastnosti, kde $\rho, \sigma \in \states{\hilb}$ jsou libovolné operátory hustoty.
\begin{itemize}
\item $S(\rho \| \sigma) = +\infty$ právě tehdy, když $\supp \sigma \subset \supp \rho$,
\item $S(\rho \| \sigma) \geq 0$, což plyne z Kleinovy nerovnosti; rovnost se přitom nabývá právě tehdy, když $\rho = \sigma$,
\item $S(U \rho \adj{U} \| U \sigma \adj{U}) = S(\rho \| \sigma)$ pro všechny unitární operátory $U \in \bound{\hilb}$.
\end{itemize}