Опуклі комбінації матриць густини

Імовірнісний вибір матриць густини

Ключова властивість матриць густини полягає в тому, що імовірнісні вибори квантових станів представляються опуклими комбінаціями їхніх матриць густини.

Наприклад, якщо маємо дві матриці густини $\rho$ і $\sigma$ , що представляють квантові стани системи $\mathsf{X}$ , і систему готують у стані $\rho$ з імовірністю $p$ , а у стані $\sigma$ з імовірністю $1 - p$ , то отриманий квантовий стан представляється матрицею густини

p \rho + (1 - p) \sigma.

Загальніше, якщо маємо $m$ квантових станів, представлених матрицями густини $\rho_0,\ldots,\rho_{m-1}$ , і систему готують у стані $\rho_k$ з імовірністю $p_k$ для деякого вектора ймовірностей $(p_0,\ldots,p_{m-1})$ , то отриманий стан представляється матрицею густини

\sum_{k = 0}^{m-1} p_k \rho_k.

Це є опуклою комбінацією матриць густини $\rho_0,\ldots,\rho_{m-1}$ .

Звідси випливає, що якщо маємо $m$ векторів квантових станів $\vert\psi_0\rangle,\ldots,\vert\psi_{m-1}\rangle$ і готуємо систему у стані $\vert\psi_k\rangle$ з імовірністю $p_k$ для кожного $k\in\{0,\ldots,m-1\}$ , то отриманий стан представляється матрицею густини

\sum_{k = 0}^{m-1} p_k \vert\psi_k\rangle\langle\psi_k\vert.

Наприклад, якщо кубіт готується у стані $\vert 0\rangle$ з імовірністю $1/2$ та у стані $\vert + \rangle$ з імовірністю $1/2$ , то матричне представлення густини отриманого стану має вигляд

\frac{1}{2} \vert 0\rangle\langle 0 \vert + \frac{1}{2} \vert +\rangle\langle + \vert = \frac{1}{2} \begin{pmatrix} 1 & 0\\[1mm] 0 & 0 \end{pmatrix} + \frac{1}{2} \begin{pmatrix} \frac{1}{2} & \frac{1}{2}\\[2mm] \frac{1}{2} & \frac{1}{2} \end{pmatrix} = \begin{pmatrix} \frac{3}{4} & \frac{1}{4}\\[2mm] \frac{1}{4} & \frac{1}{4} \end{pmatrix}.

У спрощеному формулюванні квантової інформації таке усереднення векторів квантових станів не працює. Наприклад, вектор

\frac{1}{2} \vert 0\rangle + \frac{1}{2} \vert + \rangle = \frac{1}{2} \begin{pmatrix}1\\[1mm] 0\end{pmatrix} + \frac{1}{2} \begin{pmatrix}\frac{1}{\sqrt{2}}\\[2mm]\frac{1}{\sqrt{2}}\end{pmatrix} = \begin{pmatrix}\frac{2 + \sqrt{2}}{4}\\[2mm]\frac{\sqrt{2}}{4}\end{pmatrix}

не є допустимим вектором квантового стану, оскільки його евклідова норма не дорівнює $1$ . Більш крайній приклад, що демонструє непридатність такого підходу, — візьмемо довільний вектор квантового стану $\vert\psi\rangle$ і стан, який є $\vert\psi\rangle$ з імовірністю $1/2$ і $-\vert\psi\rangle$ з імовірністю $1/2$ . Ці стани відрізняються лише глобальною фазою, тобто вони фактично однакові — але усереднення дає нульовий вектор, який не є допустимим вектором квантового стану.

Повністю змішаний стан

Припустимо, що стан кубіта встановлюється випадково: $\vert 0\rangle$ або $\vert 1\rangle$ , кожен із імовірністю $1/2$ . Матриця густини, що представляє отриманий стан, має такий вигляд.

\frac{1}{2} \vert 0\rangle\langle 0\vert + \frac{1}{2} \vert 1\rangle\langle 1\vert = \frac{1}{2} \begin{pmatrix} 1 & 0\\[1mm] 0 & 0 \end{pmatrix} + \frac{1}{2} \begin{pmatrix} 0 & 0\\[1mm] 0 & 1 \end{pmatrix} = \begin{pmatrix} \frac{1}{2} & 0\\[1mm] 0 & \frac{1}{2} \end{pmatrix} = \frac{1}{2} \mathbb{I}

(У цьому рівнянні символ $\mathbb{I}$ позначає одиничну матрицю розміру $2\times 2$ .) Це особливий стан, відомий як повністю змішаний стан. Він представляє повну невизначеність щодо стану кубіта, подібно до рівномірно випадкового біта в імовірнісному контексті.

Тепер змінімо процедуру: замість станів $\vert 0\rangle$ і $\vert 1\rangle$ використаємо стани $\vert + \rangle$ і $\vert - \rangle$ . Матрицю густини, що описує отриманий стан, можна обчислити аналогічно.

\frac{1}{2} \vert +\rangle\langle +\vert + \frac{1}{2} \vert -\rangle\langle -\vert = \frac{1}{2} \begin{pmatrix} \frac{1}{2} & \frac{1}{2}\\[2mm] \frac{1}{2} & \frac{1}{2} \end{pmatrix} + \frac{1}{2} \begin{pmatrix} \frac{1}{2} & -\frac{1}{2}\\[2mm] -\frac{1}{2} & \frac{1}{2} \end{pmatrix} = \begin{pmatrix} \frac{1}{2} & 0\\[2mm] 0 & \frac{1}{2} \end{pmatrix} = \frac{1}{2} \mathbb{I}

Та сама матриця густини, що й раніше, — попри те, що ми змінили стани. Насправді ми знову отримаємо той самий результат — повністю змішаний стан — якщо підставимо будь-які два ортогональних вектори стану кубіта замість $\vert 0\rangle$ і $\vert 1\rangle$ .

Це особливість, а не баг! Обидві процедури справді дають той самий стан. Тобто неможливо відрізнити їх, вимірюючи вироблений ними кубіт, навіть у статистичному сенсі. Обидві процедури — просто різні способи приготування цього стану.

Переконатись у цьому можна, подумавши про те, що ми могли б дізнатися, маючи випадковий вибір стану з одного з двох можливих наборів $\{\vert 0\rangle,\vert 1\rangle\}$ та $\{\vert +\rangle,\vert -\rangle\}$ . Для простоти припустимо, що ми виконуємо унітарну операцію $U$ на кубіті, а потім вимірюємо в стандартному базисі.

У першому сценарії стан кубіта рівномірно вибирається з множини $\{\vert 0\rangle,\vert 1\rangle\}$ . Якщо стан $\vert 0\rangle$ , ми отримуємо результати $0$ і $1$ із імовірностями

\vert \langle 0 \vert U \vert 0 \rangle \vert^2 \quad\text{та}\quad \vert \langle 1 \vert U \vert 0 \rangle \vert^2

відповідно. Якщо стан $\vert 1\rangle$ , ми отримуємо результати $0$ і $1$ із імовірностями

\vert \langle 0 \vert U \vert 1 \rangle \vert^2 \quad\text{та}\quad \vert \langle 1 \vert U \vert 1 \rangle \vert^2.

Оскільки обидва варіанти трапляються з імовірністю $1/2$ , ми отримуємо результат $0$ з імовірністю

\frac{1}{2}\vert \langle 0 \vert U \vert 0 \rangle \vert^2 + \frac{1}{2}\vert \langle 0 \vert U \vert 1 \rangle \vert^2

і результат $1$ з імовірністю

\frac{1}{2}\vert \langle 1 \vert U \vert 0 \rangle \vert^2 + \frac{1}{2}\vert \langle 1 \vert U \vert 1 \rangle \vert^2.

Обидва вирази дорівнюють $1/2$ . Один зі способів обґрунтувати це — скористатися фактом із лінійної алгебри, що можна розглядати як узагальнення теореми Піфагора.

Теорема

Нехай $\{\vert\psi_1\rangle,\ldots,\vert\psi_n\rangle\}$ — ортонормований базис (дійсного або комплексного) векторного простору $\mathcal{V}$ . Для кожного вектора $\vert \phi\rangle \in \mathcal{V}$ виконується $\vert \langle \psi_1\vert\phi\rangle\vert^2 + \cdots + \vert \langle \psi_n \vert \phi \rangle\vert^2 = \| \vert\phi\rangle \|^2.$

Застосуємо цю теорему для визначення імовірностей. Імовірність отримати $0$ дорівнює

\begin{aligned} \frac{1}{2}\vert \langle 0 \vert U \vert 0 \rangle \vert^2 + \frac{1}{2}\vert \langle 0 \vert U \vert 1 \rangle \vert^2 & = \frac{1}{2} \Bigl( \vert \langle 0 \vert U \vert 0 \rangle \vert^2 + \vert \langle 0 \vert U \vert 1 \rangle \vert^2 \Bigr) \\[2mm] & = \frac{1}{2} \Bigl( \vert \langle 0 \vert U^{\dagger} \vert 0 \rangle \vert^2 + \vert \langle 1 \vert U^{\dagger} \vert 0 \rangle \vert^2 \Bigr)\\[2mm] & = \frac{1}{2} \bigl\| U^{\dagger} \vert 0 \rangle \bigr\|^2 \end{aligned}

і імовірність отримати $1$ дорівнює

\begin{aligned} \frac{1}{2}\vert \langle 1 \vert U \vert 0 \rangle \vert^2 + \frac{1}{2}\vert \langle 1 \vert U \vert 1 \rangle \vert^2 & = \frac{1}{2} \Bigl( \vert \langle 1 \vert U \vert 0 \rangle \vert^2 + \vert \langle 1 \vert U \vert 1 \rangle \vert^2 \Bigr) \\[2mm] & = \frac{1}{2} \Bigl( \vert \langle 0 \vert U^{\dagger} \vert 1 \rangle \vert^2 + \vert \langle 1 \vert U^{\dagger} \vert 1 \rangle \vert^2 \Bigr)\\[2mm] & = \frac{1}{2} \bigl\| U^{\dagger} \vert 1 \rangle \bigr\|^2. \end{aligned}

Оскільки $U$ — унітарна матриця, ми знаємо, що $U^{\dagger}$ теж унітарна, а значить, $U^{\dagger} \vert 0 \rangle$ і $U^{\dagger} \vert 1 \rangle$ є одиничними векторами. Обидві імовірності тому дорівнюють $1/2$ . Це означає, що незалежно від вибору $U$ вимірювання дасть лише рівномірно випадковий біт.

Аналогічну перевірку можна провести для будь-якої іншої пари ортонормованих станів замість $\vert 0\rangle$ і $\vert 1\rangle$ . Наприклад, оскільки $\{\vert + \rangle, \vert - \rangle\}$ є ортонормованим базисом, імовірність отримати результат вимірювання $0$ у другій процедурі дорівнює

\frac{1}{2}\vert \langle 0 \vert U \vert + \rangle \vert^2 + \frac{1}{2}\vert \langle 0 \vert U \vert - \rangle \vert^2 = \frac{1}{2} \bigl\| U^{\dagger} \vert 0 \rangle \bigr\|^2 = \frac{1}{2}

і імовірність отримати $1$ дорівнює

\frac{1}{2}\vert \langle 1 \vert U \vert + \rangle \vert^2 + \frac{1}{2}\vert \langle 1 \vert U \vert - \rangle \vert^2 = \frac{1}{2} \bigl\| U^{\dagger} \vert 1 \rangle \bigr\|^2 = \frac{1}{2}.

Зокрема, ми отримуємо точно ту саму статистику виходів, що й для станів $\vert 0\rangle$ і $\vert 1\rangle$ .

Імовірнісні стани

Класичні стани можна представляти матрицями густини. Зокрема, для кожного класичного стану $a$ системи $\mathsf{X}$ матриця густини

\rho = \vert a\rangle \langle a \vert

представляє те, що $\mathsf{X}$ знаходиться саме в класичному стані $a$ . Для кубітів маємо

\vert 0\rangle \langle 0 \vert = \begin{pmatrix}1 & 0 \\ 0 & 0\end{pmatrix} \quad\text{та}\quad \vert 1\rangle \langle 1 \vert = \begin{pmatrix}0 & 0 \\ 0 & 1\end{pmatrix},

і в загальному випадку на діагоналі стоїть одна $1$ на позиції, що відповідає класичному стану, а всі інші елементи дорівнюють нулю.

Потім можна брати опуклі комбінації цих матриць густини для представлення імовірнісних станів. Для простоти припустимо, що наш класичний набір станів — $\{0,\ldots,n-1\}$ ; якщо $\mathsf{X}$ знаходиться в стані $a$ з імовірністю $p_a$ для кожного $a\in\{0,\ldots,n-1\}$ , то матриця густини, яку ми отримуємо:

\rho = \sum_{a = 0}^{n-1} p_a \vert a\rangle \langle a \vert = \begin{pmatrix} p_0 & 0 & \cdots & 0\\ 0 & p_1 & \ddots & \vdots\\ \vdots & \ddots & \ddots & 0\\ 0 & \cdots & 0 & p_{n-1} \end{pmatrix}.

У зворотному напрямку: будь-яка діагональна матриця густини природно ідентифікується з імовірнісним станом, вектор ймовірностей якого просто зчитується з діагоналі.

Зауважимо: якщо матриця густини є діагональною, це не обов'язково означає, що ми говоримо про класичну систему або що система була приготована шляхом випадкового вибору класичного стану — радше це означає, що стан міг бути отриманий саме так.

Той факт, що імовірнісні стани представляються діагональними матрицями густини, узгоджується з інтуїцією, висловленою на початку уроку: позадіагональні елементи описують ступінь, до якого два класичні стани, що відповідають рядку та стовпцю цього елемента, знаходяться в квантовій суперпозиції. Тут усі позадіагональні елементи дорівнюють нулю, тому маємо лише класичну випадковість, без квантової суперпозиції.

Матриці густини і спектральна теорема

Ми бачили, що опукла комбінація чистих станів

\rho = \sum_{k = 0}^{m-1} p_k \vert \psi_k\rangle \langle \psi_k \vert,

дає матрицю густини. Насправді кожну матрицю густини $\rho$ можна виразити як опуклу комбінацію чистих станів такого вигляду. Тобто завжди знайдеться набір одиничних векторів $\{\vert\psi_0\rangle,\ldots,\vert\psi_{m-1}\rangle\}$ і вектор ймовірностей $(p_0,\ldots,p_{m-1})$ , для яких наведене рівняння виконується.

Більш того, число $m$ завжди можна вибрати рівним кількості класичних станів розглядуваної системи, а вектори квантових станів — ортогональними. Це дозволяє зробити спектральна теорема, з якою ми познайомились у курсі «Основи квантових алгоритмів». Ось її переформулювання для зручності.

Теорема

Спектральна теорема: Нехай $M$ — нормальна комплексна матриця $n\times n$ . Існує ортонормований базис $n$ -вимірних комплексних векторів $\{\vert\psi_0\rangle,\ldots,\vert\psi_{n-1}\rangle \}$ і комплексні числа $\lambda_0,\ldots,\lambda_{n-1}$ такі, що

M = \lambda_0 \vert \psi_0\rangle\langle \psi_0\vert + \cdots + \lambda_{n-1} \vert \psi_{n-1}\rangle\langle \psi_{n-1}\vert.

(Нагадаємо, що матриця $M$ є нормальною, якщо виконується $M^{\dagger} M = M M^{\dagger}$ . Іншими словами, нормальні матриці — це матриці, що комутують із власним спряженим транспонуванням.)

Спектральну теорему можна застосувати до будь-якої матриці густини $\rho$ , оскільки матриці густини завжди ермітові, а отже, нормальні. Це дозволяє записати

\rho = \lambda_0 \vert \psi_0\rangle\langle \psi_0\vert + \cdots + \lambda_{n-1} \vert \psi_{n-1}\rangle\langle \psi_{n-1}\vert

для деякого ортонормованого базису $\{\vert\psi_0\rangle,\ldots,\vert\psi_{n-1}\rangle\}$ . Залишається перевірити, що $(\lambda_0,\ldots,\lambda_{n-1})$ — вектор ймовірностей (тоді його можна перейменувати на $(p_0,\ldots,p_{n-1})$ , якщо бажаємо).

Числа $\lambda_0,\ldots,\lambda_{n-1}$ — це власні значення $\rho$ ; оскільки $\rho$ є позитивно напівдовизначеною, вони є невід'ємними дійсними числами. Те, що $\lambda_0 + \cdots + \lambda_{n-1} = 1$ , випливає з того, що слід $\rho$ дорівнює $1$ . Розгляд деталей дасть нам можливість відзначити таку важливу і корисну властивість сліду.

Теорема

Циклічна властивість сліду: для будь-яких двох матриць $A$ і $B$ , добуток яких $AB$ є квадратною матрицею, виконується рівність $\operatorname{Tr}(AB) = \operatorname{Tr}(BA)$ .

Зауважимо, що ця теорема справджується навіть якщо $A$ і $B$ самі по собі не є квадратними. Тобто $A$ може бути матрицею $n\times m$ , а $B$ — матрицею $m\times n$ для деяких натуральних $n$ і $m$ , так що $AB$ — квадратна матриця $n\times n$ , а $BA$ — квадратна матриця $m\times m$ .

Зокрема, якщо покласти $A$ рівним вектор-стовпцю $\vert\phi\rangle$ , а $B$ — вектор-рядку $\langle \phi\vert$ , то

\operatorname{Tr}\bigl(\vert\phi\rangle\langle\phi\vert\bigr) = \operatorname{Tr}\bigl(\langle\phi\vert\phi\rangle\bigr) = \langle\phi\vert\phi\rangle.

Друга рівність випливає з того, що $\langle\phi\vert\phi\rangle$ — скаляр, який можна розглядати як матрицю $1\times 1$ , слід якої дорівнює її єдиному елементу. Використовуючи цей факт і лінійність функції сліду, можна показати, що $\lambda_0 + \cdots + \lambda_{n-1} = 1$ .

\begin{gathered} 1 = \operatorname{Tr}(\rho) = \operatorname{Tr}\bigl(\lambda_0 \vert \psi_0\rangle\langle \psi_0\vert + \cdots + \lambda_{n-1} \vert \psi_{n-1}\rangle\langle \psi_{n-1}\vert\bigr)\\[2mm] = \lambda_0 \operatorname{Tr}\bigl(\vert \psi_0\rangle\langle \psi_0\vert\bigr) + \cdots + \lambda_{n-1} \operatorname{Tr}\bigl(\vert \psi_{n-1}\rangle\langle \psi_{n-1}\vert\bigr) = \lambda_0 + \cdots + \lambda_{n-1} \end{gathered}

Альтернативно, той самий висновок можна зробити, скориставшись тим, що слід квадратної матриці (навіть ненормальної) дорівнює сумі її власних значень.

Таким чином, ми довели, що будь-яку матрицю густини $\rho$ можна виразити як опуклу комбінацію чистих станів. Також ми бачимо, що при цьому чисті стани можна вибирати ортогональними. Це означає, зокрема, що число $n$ ніколи не потрібно брати більшим за розмір класичного набору станів $\mathsf{X}$ .

Загалом слід розуміти, що існують різні способи записати матрицю густини як опуклу комбінацію чистих станів, — не лише ті, що дає спектральна теорема. Попередній приклад ілюструє це.

\frac{1}{2} \vert 0\rangle\langle 0 \vert + \frac{1}{2} \vert +\rangle\langle + \vert = \begin{pmatrix} \frac{3}{4} & \frac{1}{4}\\[2mm] \frac{1}{4} & \frac{1}{4} \end{pmatrix}

Це не є спектральним розкладом цієї матриці, оскільки $\vert 0\rangle$ і $\vert + \rangle$ не є ортогональними. Ось спектральний розклад:

\begin{pmatrix} \frac{3}{4} & \frac{1}{4}\\[2mm] \frac{1}{4} & \frac{1}{4} \end{pmatrix} = \cos^2(\pi/8) \vert \psi_{\pi/8} \rangle \langle \psi_{\pi/8}\vert + \sin^2(\pi/8) \vert \psi_{5\pi/8} \rangle \langle \psi_{5\pi/8}\vert,

де $\vert \psi_{\theta} \rangle = \cos(\theta)\vert 0\rangle + \sin(\theta)\vert 1\rangle$ . Власні значення є числами, що, можливо, виглядають знайомо:

\cos^2(\pi/8) = \frac{2+\sqrt{2}}{4} \approx 0.85 \quad\text{та}\quad \sin^2(\pi/8) = \frac{2-\sqrt{2}}{4} \approx 0.15.

Власні вектори можна записати явно:

\begin{aligned} \vert\psi_{\pi/8}\rangle & = \frac{\sqrt{2 + \sqrt{2}}}{2}\vert 0\rangle + \frac{\sqrt{2 - \sqrt{2}}}{2}\vert 1\rangle \\[3mm] \vert\psi_{5\pi/8}\rangle & = -\frac{\sqrt{2 - \sqrt{2}}}{2}\vert 0\rangle + \frac{\sqrt{2 + \sqrt{2}}}{2}\vert 1\rangle \end{aligned}

Як ще один, більш загальний приклад: нехай $\vert \phi_0\rangle,\ldots,\vert \phi_{99} \rangle$ — вектори квантових станів одного кубіта, вибрані довільно (без жодних припущень про зв'язки між ними). Розглянемо стан, отриманий рівномірним випадковим вибором одного з цих $100$ станів:

\rho = \frac{1}{100} \sum_{k = 0}^{99} \vert \phi_k\rangle\langle \phi_k \vert.

Оскільки йдеться про кубіт, матриця густини $\rho$ має розмір $2\times 2$ , тому за спектральною теоремою її також можна записати у вигляді

\rho = p \vert\psi_0\rangle\langle\psi_0\vert + (1 - p) \vert\psi_1\rangle\langle\psi_1\vert

для деякого дійсного $p\in[0,1]$ та ортонормованого базису $\{\vert\psi_0\rangle,\vert\psi_1\rangle\}$ — але існування такого запису, звісно, не заважає нам при бажанні записати $\rho$ як середнє $100$ чистих станів.

Імовірнісний вибір матриць густини​

Повністю змішаний стан​

Імовірнісні стани​

Матриці густини і спектральна теорема​

Імовірнісний вибір матриць густини

Повністю змішаний стан

Імовірнісні стани

Матриці густини і спектральна теорема