Перейти до основного вмісту

Опуклі комбінації матриць густини

Імовірнісний вибір матриць густини

Ключова властивість матриць густини полягає в тому, що імовірнісні вибори квантових станів представляються опуклими комбінаціями їхніх матриць густини.

Наприклад, якщо маємо дві матриці густини ρ\rho і σ\sigma, що представляють квантові стани системи X\mathsf{X}, і систему готують у стані ρ\rho з імовірністю pp, а у стані σ\sigma з імовірністю 1p1 - p, то отриманий квантовий стан представляється матрицею густини

pρ+(1p)σ.p \rho + (1 - p) \sigma.

Загальніше, якщо маємо mm квантових станів, представлених матрицями густини ρ0,,ρm1\rho_0,\ldots,\rho_{m-1}, і систему готують у стані ρk\rho_k з імовірністю pkp_k для деякого вектора ймовірностей (p0,,pm1)(p_0,\ldots,p_{m-1}), то отриманий стан представляється матрицею густини

k=0m1pkρk.\sum_{k = 0}^{m-1} p_k \rho_k.

Це є опуклою комбінацією матриць густини ρ0,,ρm1\rho_0,\ldots,\rho_{m-1}.

Звідси випливає, що якщо маємо mm векторів квантових станів ψ0,,ψm1\vert\psi_0\rangle,\ldots,\vert\psi_{m-1}\rangle і готуємо систему у стані ψk\vert\psi_k\rangle з імовірністю pkp_k для кожного k{0,,m1}k\in\{0,\ldots,m-1\}, то отриманий стан представляється матрицею густини

k=0m1pkψkψk.\sum_{k = 0}^{m-1} p_k \vert\psi_k\rangle\langle\psi_k\vert.

Наприклад, якщо кубіт готується у стані 0\vert 0\rangle з імовірністю 1/21/2 та у стані +\vert + \rangle з імовірністю 1/21/2, то матричне представлення густини отриманого стану має вигляд

1200+12++=12(1000)+12(12121212)=(34141414).\frac{1}{2} \vert 0\rangle\langle 0 \vert + \frac{1}{2} \vert +\rangle\langle + \vert = \frac{1}{2} \begin{pmatrix} 1 & 0\\[1mm] 0 & 0 \end{pmatrix} + \frac{1}{2} \begin{pmatrix} \frac{1}{2} & \frac{1}{2}\\[2mm] \frac{1}{2} & \frac{1}{2} \end{pmatrix} = \begin{pmatrix} \frac{3}{4} & \frac{1}{4}\\[2mm] \frac{1}{4} & \frac{1}{4} \end{pmatrix}.

У спрощеному формулюванні квантової інформації таке усереднення векторів квантових станів не працює. Наприклад, вектор

120+12+=12(10)+12(1212)=(2+2424)\frac{1}{2} \vert 0\rangle + \frac{1}{2} \vert + \rangle = \frac{1}{2} \begin{pmatrix}1\\[1mm] 0\end{pmatrix} + \frac{1}{2} \begin{pmatrix}\frac{1}{\sqrt{2}}\\[2mm]\frac{1}{\sqrt{2}}\end{pmatrix} = \begin{pmatrix}\frac{2 + \sqrt{2}}{4}\\[2mm]\frac{\sqrt{2}}{4}\end{pmatrix}

не є допустимим вектором квантового стану, оскільки його евклідова норма не дорівнює 11. Більш крайній приклад, що демонструє непридатність такого підходу, — візьмемо довільний вектор квантового стану ψ\vert\psi\rangle і стан, який є ψ\vert\psi\rangle з імовірністю 1/21/2 і ψ-\vert\psi\rangle з імовірністю 1/21/2. Ці стани відрізняються лише глобальною фазою, тобто вони фактично однакові — але усереднення дає нульовий вектор, який не є допустимим вектором квантового стану.

Повністю змішаний стан

Припустимо, що стан кубіта встановлюється випадково: 0\vert 0\rangle або 1\vert 1\rangle, кожен із імовірністю 1/21/2. Матриця густини, що представляє отриманий стан, має такий вигляд.

1200+1211=12(1000)+12(0001)=(120012)=12I\frac{1}{2} \vert 0\rangle\langle 0\vert + \frac{1}{2} \vert 1\rangle\langle 1\vert = \frac{1}{2} \begin{pmatrix} 1 & 0\\[1mm] 0 & 0 \end{pmatrix} + \frac{1}{2} \begin{pmatrix} 0 & 0\\[1mm] 0 & 1 \end{pmatrix} = \begin{pmatrix} \frac{1}{2} & 0\\[1mm] 0 & \frac{1}{2} \end{pmatrix} = \frac{1}{2} \mathbb{I}

(У цьому рівнянні символ I\mathbb{I} позначає одиничну матрицю розміру 2×22\times 2.) Це особливий стан, відомий як повністю змішаний стан. Він представляє повну невизначеність щодо стану кубіта, подібно до рівномірно випадкового біта в імовірнісному контексті.

Тепер змінімо процедуру: замість станів 0\vert 0\rangle і 1\vert 1\rangle використаємо стани +\vert + \rangle і \vert - \rangle. Матрицю густини, що описує отриманий стан, можна обчислити аналогічно.

12+++12=12(12121212)+12(12121212)=(120012)=12I\frac{1}{2} \vert +\rangle\langle +\vert + \frac{1}{2} \vert -\rangle\langle -\vert = \frac{1}{2} \begin{pmatrix} \frac{1}{2} & \frac{1}{2}\\[2mm] \frac{1}{2} & \frac{1}{2} \end{pmatrix} + \frac{1}{2} \begin{pmatrix} \frac{1}{2} & -\frac{1}{2}\\[2mm] -\frac{1}{2} & \frac{1}{2} \end{pmatrix} = \begin{pmatrix} \frac{1}{2} & 0\\[2mm] 0 & \frac{1}{2} \end{pmatrix} = \frac{1}{2} \mathbb{I}

Та сама матриця густини, що й раніше, — попри те, що ми змінили стани. Насправді ми знову отримаємо той самий результат — повністю змішаний стан — якщо підставимо будь-які два ортогональних вектори стану кубіта замість 0\vert 0\rangle і 1\vert 1\rangle.

Це особливість, а не баг! Обидві процедури справді дають той самий стан. Тобто неможливо відрізнити їх, вимірюючи вироблений ними кубіт, навіть у статистичному сенсі. Обидві процедури — просто різні способи приготування цього стану.

Переконатись у цьому можна, подумавши про те, що ми могли б дізнатися, маючи випадковий вибір стану з одного з двох можливих наборів {0,1}\{\vert 0\rangle,\vert 1\rangle\} та {+,}\{\vert +\rangle,\vert -\rangle\}. Для простоти припустимо, що ми виконуємо унітарну операцію UU на кубіті, а потім вимірюємо в стандартному базисі.

У першому сценарії стан кубіта рівномірно вибирається з множини {0,1}\{\vert 0\rangle,\vert 1\rangle\}. Якщо стан 0\vert 0\rangle, ми отримуємо результати 00 і 11 із імовірностями

0U02та1U02\vert \langle 0 \vert U \vert 0 \rangle \vert^2 \quad\text{та}\quad \vert \langle 1 \vert U \vert 0 \rangle \vert^2

відповідно. Якщо стан 1\vert 1\rangle, ми отримуємо результати 00 і 11 із імовірностями

0U12та1U12.\vert \langle 0 \vert U \vert 1 \rangle \vert^2 \quad\text{та}\quad \vert \langle 1 \vert U \vert 1 \rangle \vert^2.

Оскільки обидва варіанти трапляються з імовірністю 1/21/2, ми отримуємо результат 00 з імовірністю

120U02+120U12\frac{1}{2}\vert \langle 0 \vert U \vert 0 \rangle \vert^2 + \frac{1}{2}\vert \langle 0 \vert U \vert 1 \rangle \vert^2

і результат 11 з імовірністю

121U02+121U12.\frac{1}{2}\vert \langle 1 \vert U \vert 0 \rangle \vert^2 + \frac{1}{2}\vert \langle 1 \vert U \vert 1 \rangle \vert^2.

Обидва вирази дорівнюють 1/21/2. Один зі способів обґрунтувати це — скористатися фактом із лінійної алгебри, що можна розглядати як узагальнення теореми Піфагора.

Теорема

Нехай {ψ1,,ψn}\{\vert\psi_1\rangle,\ldots,\vert\psi_n\rangle\} — ортонормований базис (дійсного або комплексного) векторного простору V\mathcal{V}. Для кожного вектора ϕV\vert \phi\rangle \in \mathcal{V} виконується ψ1ϕ2++ψnϕ2=ϕ2.\vert \langle \psi_1\vert\phi\rangle\vert^2 + \cdots + \vert \langle \psi_n \vert \phi \rangle\vert^2 = \| \vert\phi\rangle \|^2.

Застосуємо цю теорему для визначення імовірностей. Імовірність отримати 00 дорівнює

120U02+120U12=12(0U02+0U12)=12(0U02+1U02)=12U02\begin{aligned} \frac{1}{2}\vert \langle 0 \vert U \vert 0 \rangle \vert^2 + \frac{1}{2}\vert \langle 0 \vert U \vert 1 \rangle \vert^2 & = \frac{1}{2} \Bigl( \vert \langle 0 \vert U \vert 0 \rangle \vert^2 + \vert \langle 0 \vert U \vert 1 \rangle \vert^2 \Bigr) \\[2mm] & = \frac{1}{2} \Bigl( \vert \langle 0 \vert U^{\dagger} \vert 0 \rangle \vert^2 + \vert \langle 1 \vert U^{\dagger} \vert 0 \rangle \vert^2 \Bigr)\\[2mm] & = \frac{1}{2} \bigl\| U^{\dagger} \vert 0 \rangle \bigr\|^2 \end{aligned}

і імовірність отримати 11 дорівнює

121U02+121U12=12(1U02+1U12)=12(0U12+1U12)=12U12.\begin{aligned} \frac{1}{2}\vert \langle 1 \vert U \vert 0 \rangle \vert^2 + \frac{1}{2}\vert \langle 1 \vert U \vert 1 \rangle \vert^2 & = \frac{1}{2} \Bigl( \vert \langle 1 \vert U \vert 0 \rangle \vert^2 + \vert \langle 1 \vert U \vert 1 \rangle \vert^2 \Bigr) \\[2mm] & = \frac{1}{2} \Bigl( \vert \langle 0 \vert U^{\dagger} \vert 1 \rangle \vert^2 + \vert \langle 1 \vert U^{\dagger} \vert 1 \rangle \vert^2 \Bigr)\\[2mm] & = \frac{1}{2} \bigl\| U^{\dagger} \vert 1 \rangle \bigr\|^2. \end{aligned}

Оскільки UU — унітарна матриця, ми знаємо, що UU^{\dagger} теж унітарна, а значить, U0U^{\dagger} \vert 0 \rangle і U1U^{\dagger} \vert 1 \rangle є одиничними векторами. Обидві імовірності тому дорівнюють 1/21/2. Це означає, що незалежно від вибору UU вимірювання дасть лише рівномірно випадковий біт.

Аналогічну перевірку можна провести для будь-якої іншої пари ортонормованих станів замість 0\vert 0\rangle і 1\vert 1\rangle. Наприклад, оскільки {+,}\{\vert + \rangle, \vert - \rangle\} є ортонормованим базисом, імовірність отримати результат вимірювання 00 у другій процедурі дорівнює

120U+2+120U2=12U02=12\frac{1}{2}\vert \langle 0 \vert U \vert + \rangle \vert^2 + \frac{1}{2}\vert \langle 0 \vert U \vert - \rangle \vert^2 = \frac{1}{2} \bigl\| U^{\dagger} \vert 0 \rangle \bigr\|^2 = \frac{1}{2}

і імовірність отримати 11 дорівнює

121U+2+121U2=12U12=12.\frac{1}{2}\vert \langle 1 \vert U \vert + \rangle \vert^2 + \frac{1}{2}\vert \langle 1 \vert U \vert - \rangle \vert^2 = \frac{1}{2} \bigl\| U^{\dagger} \vert 1 \rangle \bigr\|^2 = \frac{1}{2}.

Зокрема, ми отримуємо точно ту саму статистику виходів, що й для станів 0\vert 0\rangle і 1\vert 1\rangle.

Імовірнісні стани

Класичні стани можна представляти матрицями густини. Зокрема, для кожного класичного стану aa системи X\mathsf{X} матриця густини

ρ=aa\rho = \vert a\rangle \langle a \vert

представляє те, що X\mathsf{X} знаходиться саме в класичному стані aa. Для кубітів маємо

00=(1000)та11=(0001),\vert 0\rangle \langle 0 \vert = \begin{pmatrix}1 & 0 \\ 0 & 0\end{pmatrix} \quad\text{та}\quad \vert 1\rangle \langle 1 \vert = \begin{pmatrix}0 & 0 \\ 0 & 1\end{pmatrix},

і в загальному випадку на діагоналі стоїть одна 11 на позиції, що відповідає класичному стану, а всі інші елементи дорівнюють нулю.

Потім можна брати опуклі комбінації цих матриць густини для представлення імовірнісних станів. Для простоти припустимо, що наш класичний набір станів — {0,,n1}\{0,\ldots,n-1\}; якщо X\mathsf{X} знаходиться в стані aa з імовірністю pap_a для кожного a{0,,n1}a\in\{0,\ldots,n-1\}, то матриця густини, яку ми отримуємо:

ρ=a=0n1paaa=(p0000p1000pn1).\rho = \sum_{a = 0}^{n-1} p_a \vert a\rangle \langle a \vert = \begin{pmatrix} p_0 & 0 & \cdots & 0\\ 0 & p_1 & \ddots & \vdots\\ \vdots & \ddots & \ddots & 0\\ 0 & \cdots & 0 & p_{n-1} \end{pmatrix}.

У зворотному напрямку: будь-яка діагональна матриця густини природно ідентифікується з імовірнісним станом, вектор ймовірностей якого просто зчитується з діагоналі.

Зауважимо: якщо матриця густини є діагональною, це не обов'язково означає, що ми говоримо про класичну систему або що система була приготована шляхом випадкового вибору класичного стану — радше це означає, що стан міг бути отриманий саме так.

Той факт, що імовірнісні стани представляються діагональними матрицями густини, узгоджується з інтуїцією, висловленою на початку уроку: позадіагональні елементи описують ступінь, до якого два класичні стани, що відповідають рядку та стовпцю цього елемента, знаходяться в квантовій суперпозиції. Тут усі позадіагональні елементи дорівнюють нулю, тому маємо лише класичну випадковість, без квантової суперпозиції.

Матриці густини і спектральна теорема

Ми бачили, що опукла комбінація чистих станів

ρ=k=0m1pkψkψk,\rho = \sum_{k = 0}^{m-1} p_k \vert \psi_k\rangle \langle \psi_k \vert,

дає матрицю густини. Насправді кожну матрицю густини ρ\rho можна виразити як опуклу комбінацію чистих станів такого вигляду. Тобто завжди знайдеться набір одиничних векторів {ψ0,,ψm1}\{\vert\psi_0\rangle,\ldots,\vert\psi_{m-1}\rangle\} і вектор ймовірностей (p0,,pm1)(p_0,\ldots,p_{m-1}), для яких наведене рівняння виконується.

Більш того, число mm завжди можна вибрати рівним кількості класичних станів розглядуваної системи, а вектори квантових станів — ортогональними. Це дозволяє зробити спектральна теорема, з якою ми познайомились у курсі «Основи квантових алгоритмів». Ось її переформулювання для зручності.

Теорема

Спектральна теорема: Нехай MMнормальна комплексна матриця n×nn\times n. Існує ортонормований базис nn-вимірних комплексних векторів {ψ0,,ψn1}\{\vert\psi_0\rangle,\ldots,\vert\psi_{n-1}\rangle \} і комплексні числа λ0,,λn1\lambda_0,\ldots,\lambda_{n-1} такі, що

M=λ0ψ0ψ0++λn1ψn1ψn1.M = \lambda_0 \vert \psi_0\rangle\langle \psi_0\vert + \cdots + \lambda_{n-1} \vert \psi_{n-1}\rangle\langle \psi_{n-1}\vert.

(Нагадаємо, що матриця MM є нормальною, якщо виконується MM=MMM^{\dagger} M = M M^{\dagger}. Іншими словами, нормальні матриці — це матриці, що комутують із власним спряженим транспонуванням.)

Спектральну теорему можна застосувати до будь-якої матриці густини ρ\rho, оскільки матриці густини завжди ермітові, а отже, нормальні. Це дозволяє записати

ρ=λ0ψ0ψ0++λn1ψn1ψn1\rho = \lambda_0 \vert \psi_0\rangle\langle \psi_0\vert + \cdots + \lambda_{n-1} \vert \psi_{n-1}\rangle\langle \psi_{n-1}\vert

для деякого ортонормованого базису {ψ0,,ψn1}\{\vert\psi_0\rangle,\ldots,\vert\psi_{n-1}\rangle\}. Залишається перевірити, що (λ0,,λn1)(\lambda_0,\ldots,\lambda_{n-1}) — вектор ймовірностей (тоді його можна перейменувати на (p0,,pn1)(p_0,\ldots,p_{n-1}), якщо бажаємо).

Числа λ0,,λn1\lambda_0,\ldots,\lambda_{n-1} — це власні значення ρ\rho; оскільки ρ\rho є позитивно напівдовизначеною, вони є невід'ємними дійсними числами. Те, що λ0++λn1=1\lambda_0 + \cdots + \lambda_{n-1} = 1, випливає з того, що слід ρ\rho дорівнює 11. Розгляд деталей дасть нам можливість відзначити таку важливу і корисну властивість сліду.

Теорема

Циклічна властивість сліду: для будь-яких двох матриць AA і BB, добуток яких ABAB є квадратною матрицею, виконується рівність Tr(AB)=Tr(BA)\operatorname{Tr}(AB) = \operatorname{Tr}(BA).

Зауважимо, що ця теорема справджується навіть якщо AA і BB самі по собі не є квадратними. Тобто AA може бути матрицею n×mn\times m, а BB — матрицею m×nm\times n для деяких натуральних nn і mm, так що ABAB — квадратна матриця n×nn\times n, а BABA — квадратна матриця m×mm\times m.

Зокрема, якщо покласти AA рівним вектор-стовпцю ϕ\vert\phi\rangle, а BB — вектор-рядку ϕ\langle \phi\vert, то

Tr(ϕϕ)=Tr(ϕϕ)=ϕϕ.\operatorname{Tr}\bigl(\vert\phi\rangle\langle\phi\vert\bigr) = \operatorname{Tr}\bigl(\langle\phi\vert\phi\rangle\bigr) = \langle\phi\vert\phi\rangle.

Друга рівність випливає з того, що ϕϕ\langle\phi\vert\phi\rangle — скаляр, який можна розглядати як матрицю 1×11\times 1, слід якої дорівнює її єдиному елементу. Використовуючи цей факт і лінійність функції сліду, можна показати, що λ0++λn1=1\lambda_0 + \cdots + \lambda_{n-1} = 1.

1=Tr(ρ)=Tr(λ0ψ0ψ0++λn1ψn1ψn1)=λ0Tr(ψ0ψ0)++λn1Tr(ψn1ψn1)=λ0++λn1\begin{gathered} 1 = \operatorname{Tr}(\rho) = \operatorname{Tr}\bigl(\lambda_0 \vert \psi_0\rangle\langle \psi_0\vert + \cdots + \lambda_{n-1} \vert \psi_{n-1}\rangle\langle \psi_{n-1}\vert\bigr)\\[2mm] = \lambda_0 \operatorname{Tr}\bigl(\vert \psi_0\rangle\langle \psi_0\vert\bigr) + \cdots + \lambda_{n-1} \operatorname{Tr}\bigl(\vert \psi_{n-1}\rangle\langle \psi_{n-1}\vert\bigr) = \lambda_0 + \cdots + \lambda_{n-1} \end{gathered}

Альтернативно, той самий висновок можна зробити, скориставшись тим, що слід квадратної матриці (навіть ненормальної) дорівнює сумі її власних значень.

Таким чином, ми довели, що будь-яку матрицю густини ρ\rho можна виразити як опуклу комбінацію чистих станів. Також ми бачимо, що при цьому чисті стани можна вибирати ортогональними. Це означає, зокрема, що число nn ніколи не потрібно брати більшим за розмір класичного набору станів X\mathsf{X}.

Загалом слід розуміти, що існують різні способи записати матрицю густини як опуклу комбінацію чистих станів, — не лише ті, що дає спектральна теорема. Попередній приклад ілюструє це.

1200+12++=(34141414)\frac{1}{2} \vert 0\rangle\langle 0 \vert + \frac{1}{2} \vert +\rangle\langle + \vert = \begin{pmatrix} \frac{3}{4} & \frac{1}{4}\\[2mm] \frac{1}{4} & \frac{1}{4} \end{pmatrix}

Це не є спектральним розкладом цієї матриці, оскільки 0\vert 0\rangle і +\vert + \rangle не є ортогональними. Ось спектральний розклад:

(34141414)=cos2(π/8)ψπ/8ψπ/8+sin2(π/8)ψ5π/8ψ5π/8,\begin{pmatrix} \frac{3}{4} & \frac{1}{4}\\[2mm] \frac{1}{4} & \frac{1}{4} \end{pmatrix} = \cos^2(\pi/8) \vert \psi_{\pi/8} \rangle \langle \psi_{\pi/8}\vert + \sin^2(\pi/8) \vert \psi_{5\pi/8} \rangle \langle \psi_{5\pi/8}\vert,

де ψθ=cos(θ)0+sin(θ)1\vert \psi_{\theta} \rangle = \cos(\theta)\vert 0\rangle + \sin(\theta)\vert 1\rangle. Власні значення є числами, що, можливо, виглядають знайомо:

cos2(π/8)=2+240.85таsin2(π/8)=2240.15.\cos^2(\pi/8) = \frac{2+\sqrt{2}}{4} \approx 0.85 \quad\text{та}\quad \sin^2(\pi/8) = \frac{2-\sqrt{2}}{4} \approx 0.15.

Власні вектори можна записати явно:

ψπ/8=2+220+2221ψ5π/8=2220+2+221\begin{aligned} \vert\psi_{\pi/8}\rangle & = \frac{\sqrt{2 + \sqrt{2}}}{2}\vert 0\rangle + \frac{\sqrt{2 - \sqrt{2}}}{2}\vert 1\rangle \\[3mm] \vert\psi_{5\pi/8}\rangle & = -\frac{\sqrt{2 - \sqrt{2}}}{2}\vert 0\rangle + \frac{\sqrt{2 + \sqrt{2}}}{2}\vert 1\rangle \end{aligned}

Як ще один, більш загальний приклад: нехай ϕ0,,ϕ99\vert \phi_0\rangle,\ldots,\vert \phi_{99} \rangle — вектори квантових станів одного кубіта, вибрані довільно (без жодних припущень про зв'язки між ними). Розглянемо стан, отриманий рівномірним випадковим вибором одного з цих 100100 станів:

ρ=1100k=099ϕkϕk.\rho = \frac{1}{100} \sum_{k = 0}^{99} \vert \phi_k\rangle\langle \phi_k \vert.

Оскільки йдеться про кубіт, матриця густини ρ\rho має розмір 2×22\times 2, тому за спектральною теоремою її також можна записати у вигляді

ρ=pψ0ψ0+(1p)ψ1ψ1\rho = p \vert\psi_0\rangle\langle\psi_0\vert + (1 - p) \vert\psi_1\rangle\langle\psi_1\vert

для деякого дійсного p[0,1]p\in[0,1] та ортонормованого базису {ψ0,ψ1}\{\vert\psi_0\rangle,\vert\psi_1\rangle\} — але існування такого запису, звісно, не заважає нам при бажанні записати ρ\rho як середнє 100100 чистих станів.