Перейти до основного вмісту

Математичні формулювання вимірювань

Урок починається з двох еквівалентних математичних описів вимірювань:

  1. Загальні вимірювання можна описати наборами матриць — по одній на кожен результат вимірювання — у спосіб, що узагальнює опис проєктивних вимірювань.
  2. Загальні вимірювання можна описати як канали, виходи яких завжди є класичними станами (представленими діагональними матрицями густини).

Ми обмежимося вимірюваннями з кінцевою кількістю можливих результатів. Хоча вимірювання з нескінченно багатьма можливими результатами і можна визначити, вони значно рідше зустрічаються в контексті обчислень та обробки інформації, а для їх строгої формалізації потрібна додаткова математика (а саме теорія міри).

Спочатку ми зосередимось на так званих деструктивних вимірюваннях, де вихід вимірювання — це лише класичний результат вимірювання без будь-якої специфікації пост-вимірювального квантового стану виміряної системи. Інтуїтивно можна уявити, що таке вимірювання знищує квантову систему або що систему відразу відкидають після вимірювання. Далі в уроці ми розширимо погляд і розглянемо недеструктивні вимірювання, де є і класичний результат вимірювання, і пост-вимірювальний квантовий стан виміряної системи.

Вимірювання як набори матриць

Припустимо, що X\mathsf{X} — система, яку потрібно виміряти, і для простоти вважаємо, що множина класичних станів X\mathsf{X} — це {0,,n1}\{0,\ldots, n-1\} для деякого натурального числа n,n, тому матриці густини, що представляють квантові стани X,\mathsf{X}, є матрицями розміру n×nn\times n. Нам насправді майже не доведеться посилатися на класичні стани X,\mathsf{X}, але зручно буде посилатися на nn — кількість класичних станів X.\mathsf{X}. Також припустимо, що можливі результати вимірювання — цілі числа 0,,m10,\ldots,m-1 для деякого натурального числа m.m.

Зауважимо, що ці імена обрано лише для простоти; усе наступне без труднощів узагальнюється на довільні скінченні множини класичних станів і результатів вимірювання з іншими назвами.

Проєктивні вимірювання

Нагадаємо, що проєктивне вимірювання описується набором проєкційних матриць, сума яких дорівнює одиничній матриці. Символічно,

{Π0,,Πm1}\{\Pi_0,\ldots,\Pi_{m-1}\}

описує проєктивне вимірювання X,\mathsf{X}, якщо кожна Πa\Pi_a є проєкційною матрицею розміру n×nn\times n і виконується така умова:

Π0++Πm1=IX\Pi_0 + \cdots + \Pi_{m-1} = \mathbb{I}_{\mathsf{X}}

Коли таке вимірювання виконується над системою X\mathsf{X} у стані, описаному квантовим вектором стану ψ,\vert\psi\rangle, кожен результат aa отримується з імовірністю Πaψ2.\|\Pi_a\vert\psi\rangle\|^2. Також пост-вимірювальний стан X\mathsf{X} отримується нормалізацією вектора Πaψ,\Pi_a\vert\psi\rangle, але пост-вимірювальний стан ми поки що ігноруємо.

Якщо стан X\mathsf{X} описано матрицею густини ρ,\rho, а не квантовим вектором стану ψ,\vert\psi\rangle, то імовірність отримати результат aa можна виразити альтернативно як Tr(Πaρ).\operatorname{Tr}(\Pi_a \rho).

Якщо ρ=ψψ\rho = \vert \psi\rangle\langle\psi\vert — чистий стан, то обидва вирази рівні:

Tr(Πaρ)=Tr(Πaψψ)=ψΠaψ=ψΠaΠaψ=Πaψ2.\operatorname{Tr}(\Pi_a \rho) = \operatorname{Tr}(\Pi_a \vert \psi\rangle\langle\psi \vert) = \langle \psi \vert \Pi_a \vert \psi \rangle = \langle \psi \vert \Pi_a \Pi_a \vert \psi \rangle = \|\Pi_a\vert\psi\rangle\|^2.

Тут для другої рівності ми використовуємо циклічну властивість сліду, а для третьої — той факт, що кожна Πa\Pi_a є проєкційною матрицею і тому задовольняє Πa2=Πa.\Pi_a^2 = \Pi_a.

Загалом, якщо ρ\rho є опуклою комбінацією

ρ=k=0N1pkψkψk\rho = \sum_{k = 0}^{N-1} p_k \vert \psi_k\rangle\langle \psi_k \vert

чистих станів, то вираз Tr(Πaρ)\operatorname{Tr}(\Pi_a \rho) збігається із середньою імовірністю результату a,a, оскільки цей вираз є лінійним відносно ρ.\rho.

Tr(Πaρ)=k=0N1pkTr(Πaψkψk)=k=0N1pkΠaψk2\operatorname{Tr}(\Pi_a \rho) = \sum_{k = 0}^{N-1} p_k \operatorname{Tr}(\Pi_a \vert \psi_k\rangle\langle\psi_k\vert) = \sum_{k = 0}^{N-1} p_k \|\Pi_a\vert\psi_k\rangle\|^2

Загальні вимірювання

Математичний опис загальних вимірювань отримується послабленням визначення проєктивних вимірювань. Конкретно, ми дозволяємо матрицям у наборі, що описує вимірювання, бути довільними позитивно напіввизначеними матрицями, а не лише проєкціями. (Проєкції завжди є позитивно напіввизначеними; їх також можна визначити як позитивно напіввизначені матриці, усі власні значення яких дорівнюють 0 або 1.)

Зокрема, загальне вимірювання системи X\mathsf{X} з результатами 0,,m10,\ldots,m-1 задається набором позитивно напіввизначених матриць {P0,,Pm1},\{P_0,\ldots,P_{m-1}\}, рядки та стовпці яких відповідають класичним станам X\mathsf{X} і які задовольняють умову

P0++Pm1=IX.P_0 + \cdots + P_{m-1} = \mathbb{I}_{\mathsf{X}}.

Якщо система X\mathsf{X} вимірюється у стані, описаному матрицею густини ρ,\rho, то кожен результат a{0,,m1}a\in\{0,\ldots,m-1\} з'являється з імовірністю Tr(Paρ).\operatorname{Tr}(P_a \rho).

Як ми природно й вимагаємо, вектор імовірностей результатів

(Tr(P0ρ),,Tr(Pm1ρ))\bigl(\operatorname{Tr}(P_0 \rho),\ldots,\operatorname{Tr}(P_{m-1} \rho)\bigr)

загального вимірювання завжди утворює вектор імовірностей для будь-якої матриці густини ρ.\rho. Це підтверджують два таких спостереження.

  1. Кожне значення Tr(Paρ)\operatorname{Tr}(P_a \rho) є невід'ємним, оскільки слід добутку будь-яких двох позитивно напіввизначених матриць завжди невід'ємний:

    Q,R0  Tr(QR)0.Q, R \geq 0 \; \Rightarrow \: \operatorname{Tr}(QR) \geq 0.

    Один зі способів довести цей факт — скористатися спектральними розкладами QQ і RR разом із циклічною властивістю сліду, щоб виразити слід добутку QRQR як суму невід'ємних дійсних чисел, яка тому й є невід'ємною.

  2. Умова P0++Pm1=IXP_0 + \cdots + P_{m-1} = \mathbb{I}_{\mathsf{X}} разом із лінійністю сліду гарантує, що суму імовірностей дорівнює 1.1.

    a=0m1Tr(Paρ)=Tr(a=0m1Paρ)=Tr(Iρ)=Tr(ρ)=1\sum_{a = 0}^{m-1} \operatorname{Tr}(P_a \rho) = \operatorname{Tr}\Biggl(\sum_{a = 0}^{m-1} P_a \rho\Biggr) = \operatorname{Tr}(\mathbb{I}\rho) = \operatorname{Tr}(\rho) = 1

Приклад 1: будь-яке проєктивне вимірювання

Проєкції завжди є позитивно напіввизначеними, тому кожне проєктивне вимірювання є прикладом загального вимірювання.

Наприклад, вимірювання кубіта в стандартному базисі можна представити через {P0,P1},\{P_0,P_1\}, де

P0=00=(1000)andP1=11=(0001).P_0 = \vert 0\rangle\langle 0\vert = \begin{pmatrix} 1 & 0 \\ 0 & 0 \end{pmatrix} \quad\text{and}\quad P_1 = \vert 1\rangle\langle 1\vert = \begin{pmatrix} 0 & 0 \\ 0 & 1 \end{pmatrix}.

Вимірювання кубіта в стані ρ\rho дає імовірності результатів такі:

Prob(outcome=0)=Tr(P0ρ)=Tr(00ρ)=0ρ0Prob(outcome=1)=Tr(P1ρ)=Tr(11ρ)=1ρ1\begin{aligned} \operatorname{Prob}(\text{outcome} = 0) & = \operatorname{Tr}(P_0 \rho) = \operatorname{Tr}\bigl(\vert 0\rangle\langle 0\vert \rho\bigr) = \langle 0\vert \rho \vert 0 \rangle \\[1mm] \operatorname{Prob}(\text{outcome} = 1) & = \operatorname{Tr}(P_1 \rho) = \operatorname{Tr}\bigl(\vert 1\rangle\langle 1\vert\rho\bigr) = \langle 1 \vert \rho \vert 1 \rangle \end{aligned}

Приклад 2: непроєктивне вимірювання кубіта

Припустимо, що X\mathsf{X} — кубіт, і визначимо дві матриці таким чином.

P0=(23131313)P1=(13131323)P_0 = \begin{pmatrix} \frac{2}{3} & \frac{1}{3}\\[2mm] \frac{1}{3} & \frac{1}{3} \end{pmatrix} \qquad P_1 = \begin{pmatrix} \frac{1}{3} & -\frac{1}{3}\\[2mm] -\frac{1}{3} & \frac{2}{3} \end{pmatrix}

Обидві матриці є позитивно напіввизначеними: вони ермітові, і в обох випадках власні значення рівні 1/2±5/6,1/2 \pm \sqrt{5}/6, які обидва додатні. Також виконується P0+P1=I,P_0 + P_1 = \mathbb{I}, тому {P0,P1}\{P_0,P_1\} описує вимірювання.

Якщо стан X\mathsf{X} описаний матрицею густини ρ\rho і ми виконуємо це вимірювання, то імовірність отримати результат 00 дорівнює Tr(P0ρ),\operatorname{Tr}(P_0 \rho), а результат 11Tr(P1ρ).\operatorname{Tr}(P_1 \rho). Наприклад, якщо ρ=++,\rho = \vert + \rangle \langle + \vert, то імовірності двох результатів 00 і 11 такі:

Tr(P0ρ)=Tr((23131313)(12121212))=(2312+1312)+(1312+1312)=12+13=56Tr(P1ρ)=Tr((13131323)(12121212))=(13121312)+(1312+2312)=0+16=16\begin{aligned} \operatorname{Tr}(P_0 \rho) & = \operatorname{Tr}\left( \begin{pmatrix} \frac{2}{3} & \frac{1}{3}\\[2mm] \frac{1}{3} & \frac{1}{3} \end{pmatrix} \begin{pmatrix} \frac{1}{2} & \frac{1}{2}\\[2mm] \frac{1}{2} & \frac{1}{2} \end{pmatrix} \right)\\[4mm] & = \biggl(\frac{2}{3} \cdot \frac{1}{2} + \frac{1}{3} \cdot \frac{1}{2}\biggr) + \biggl(\frac{1}{3}\cdot\frac{1}{2} + \frac{1}{3}\cdot\frac{1}{2}\biggr)\\ & = \frac{1}{2} + \frac{1}{3} = \frac{5}{6}\\[4mm] \operatorname{Tr}(P_1 \rho) & = \operatorname{Tr}\left( \begin{pmatrix} \frac{1}{3} & -\frac{1}{3}\\[2mm] -\frac{1}{3} & \frac{2}{3} \end{pmatrix} \begin{pmatrix} \frac{1}{2} & \frac{1}{2}\\[2mm] \frac{1}{2} & \frac{1}{2} \end{pmatrix} \right)\\[4mm] & = \biggl(\frac{1}{3} \cdot \frac{1}{2} - \frac{1}{3} \cdot \frac{1}{2}\biggr) + \biggl(-\frac{1}{3}\cdot\frac{1}{2} + \frac{2}{3}\cdot\frac{1}{2}\biggr)\\ & = 0 + \frac{1}{6} = \frac{1}{6} \end{aligned}

Приклад 3: тетраедральне вимірювання

Визначимо чотири одно-кубітних вектори квантового стану таким чином.

ϕ0=0ϕ1=130+231ϕ2=130+23e2πi/31ϕ3=130+23e2πi/31\begin{aligned} \vert\phi_0\rangle & = \vert 0 \rangle\\ \vert\phi_1\rangle & = \frac{1}{\sqrt{3}}\vert 0 \rangle + \sqrt{\frac{2}{3}} \vert 1\rangle \\ \vert\phi_2\rangle & = \frac{1}{\sqrt{3}}\vert 0 \rangle + \sqrt{\frac{2}{3}} e^{2\pi i/3} \vert 1\rangle \\ \vert\phi_3\rangle & = \frac{1}{\sqrt{3}}\vert 0 \rangle + \sqrt{\frac{2}{3}} e^{-2\pi i/3} \vert 1\rangle \end{aligned}

Ці чотири стани іноді називають тетраедральними, оскільки вони є вершинами правильного тетраедра, вписаного у сферу Блоха.

Ілюстрація тетраедра, вписаного у сферу Блоха

Декартові координати цих чотирьох станів на сфері Блоха:

(0,0,1),(223,0,13),(23,23,13),(23,23,13),(0,0,1),\\[2mm] \left( \frac{2\sqrt{2}}{3} , 0 , -\frac{1}{3} \right),\\[1mm] \left( -\frac{\sqrt{2}}{3} , \sqrt{\frac{2}{3}} , -\frac{1}{3} \right),\\[1mm] \left( -\frac{\sqrt{2}}{3} , -\sqrt{\frac{2}{3}} , -\frac{1}{3} \right),

що можна перевірити, виразивши матриці густини цих станів як лінійні комбінації матриць Паулі.

ϕ0ϕ0=(1000)=I+σz2\vert \phi_0 \rangle\langle \phi_0 \vert = \begin{pmatrix} 1 & 0\\[1mm] 0 & 0 \end{pmatrix} = \frac{\mathbb{I} + \sigma_z}{2} ϕ1ϕ1=(13232323)=I+223σx13σz2\vert \phi_1 \rangle\langle \phi_1 \vert = \begin{pmatrix} \frac{1}{3} & \frac{\sqrt{2}}{3} \\[2mm] \frac{\sqrt{2}}{3} & \frac{2}{3} \end{pmatrix} = \frac{\mathbb{I} + \frac{2\sqrt{2}}{3} \sigma_x - \frac{1}{3}\sigma_z}{2} ϕ2ϕ2=(13132i6132+i623)=I23σx+23σy13σz2\vert \phi_2 \rangle\langle \phi_2 \vert = \begin{pmatrix} \frac{1}{3} & -\frac{1}{3\sqrt{2}} - \frac{i}{\sqrt{6}} \\[2mm] -\frac{1}{3\sqrt{2}} + \frac{i}{\sqrt{6}} & \frac{2}{3} \end{pmatrix} = \frac{\mathbb{I} - \frac{\sqrt{2}}{3} \sigma_x + \sqrt{\frac{2}{3}} \sigma_y - \frac{1}{3}\sigma_z}{2} ϕ3ϕ3=(13132+i6132i623)=I23σx23σy13σz2\vert \phi_3 \rangle\langle \phi_3 \vert = \begin{pmatrix} \frac{1}{3} & -\frac{1}{3\sqrt{2}} + \frac{i}{\sqrt{6}} \\[2mm] -\frac{1}{3\sqrt{2}} - \frac{i}{\sqrt{6}} & \frac{2}{3} \end{pmatrix} = \frac{\mathbb{I} - \frac{\sqrt{2}}{3} \sigma_x - \sqrt{\frac{2}{3}} \sigma_y - \frac{1}{3}\sigma_z}{2}

Ці чотири стани рівномірно розподілені по сфері Блоха: кожен знаходиться на однаковій відстані від трьох інших, а кути між будь-якою парою завжди однакові.

Тепер визначимо вимірювання {P0,P1,P2,P3}\{P_0,P_1,P_2,P_3\} кубіта, поклавши PaP_a для кожного a=0,,3a=0,\ldots,3 таким чином:

Pa=ϕaϕa2P_a = \frac{\vert\phi_a\rangle\langle\phi_a\vert}{2}

Переконаємось, що це дійсне вимірювання:

  1. Кожна PaP_a очевидно позитивно напіввизначена — це чистий стан, поділений на одну другу. Тобто кожна з них є ермітовою матрицею з одним власним значенням 1/21/2 і нулями у решті власних значень.
  2. Сума цих матриць є одиничною матрицею: P0+P1+P2+P3=I.P_0 + P_1 + P_2 + P_3 = \mathbb{I}. Вирази цих матриць через лінійні комбінації матриць Паулі роблять перевірку цього простою.

Вимірювання як канали

Другий спосіб описати вимірювання в математичних термінах — це канали.

Класичну інформацію можна розглядати як окремий випадок квантової інформації, оскільки ймовірнісні стани можна ототожнити з діагональними матрицями густини. Тому в операційному сенсі вимірювання можна розглядати як канали, входи яких — матриці, що описують стани вимірюваної системи, а виходи — діагональні матриці густини, що описують розподіл результатів вимірювання.

Незабаром ми побачимо, що будь-який канал із такою властивістю завжди можна записати в простій канонічній формі, яка безпосередньо пов'язана з описом вимірювань через набори позитивно напіввизначених матриць. І навпаки, для будь-якого довільного вимірювання, заданого набором матриць, завжди існує коректний канал із діагональним виходом, який описує це вимірювання, як запропоновано в попередньому абзаці. Зіставивши ці спостереження, ми доходимо висновку, що два описи загальних вимірювань є еквівалентними.

Перш ніж іти далі, уточнимо, що являє собою вимірювання, як ми розглядаємо його як канал і які припущення ми робимо.

Як і раніше, припустимо, що X\mathsf{X} — система, яку вимірюємо, а можливі результати вимірювання — цілі числа 0,,m10,\ldots,m-1 для деякого натурального числа m.m. Нехай Y\mathsf{Y} — система, що зберігає результати вимірювання, тобто її множина класичних станів — {0,,m1},\{0,\ldots,m-1\}, і ми представляємо вимірювання як канал Φ\Phi з X\mathsf{X} у Y.\mathsf{Y}. Наше припущення полягає в тому, що Y\mathsf{Y} є класичною — тобто незалежно від початкового стану X\mathsf{X} отриманий стан Y\mathsf{Y} представлений діагональною матрицею густини.

Математично умову, що вихід Φ\Phi завжди діагональний, можна виразити так. Спочатку визначимо повністю дефазуючий канал Δm\Delta_m на Y.\mathsf{Y}.

Δm(σ)=a=0m1aσaaa\Delta_m(\sigma) = \sum_{a = 0}^{m-1} \langle a \vert \sigma \vert a\rangle \,\vert a\rangle\langle a\vert

Цей канал аналогічний повністю дефазуючому кубітному каналу Δ\Delta з попереднього уроку. Як лінійне відображення, він обнуляє всі позадіагональні елементи вхідної матриці, залишаючи діагональ незмінною.

Простий спосіб виразити, що дана матриця густини σ\sigma є діагональною, — це рівняння σ=Δm(σ).\sigma = \Delta_m(\sigma). Іншими словами, обнулення всіх позадіагональних елементів матриці густини не має ефекту тоді і тільки тоді, коли позадіагональні елементи від початку дорівнювали нулю. Канал Φ\Phi задовольняє наше припущення — що Y\mathsf{Y} є класичною — тоді і тільки тоді, коли

Φ(ρ)=Δm(Φ(ρ))\Phi(\rho) = \Delta_m(\Phi(\rho))

для кожної матриці густини ρ,\rho, що представляє стан X.\mathsf{X}.

Еквівалентність формулювань

Від каналів до матриць

Припустимо, що маємо канал з X\mathsf{X} у Y\mathsf{Y} із властивістю

Φ(ρ)=Δm(Φ(ρ))\Phi(\rho) = \Delta_m(\Phi(\rho))

для кожної матриці густини ρ.\rho. Це можна записати інакше:

Φ(ρ)=a=0m1aΦ(ρ)aaa(1)\Phi(\rho) = \sum_{a = 0}^{m-1} \langle a \vert \Phi(\rho) \vert a\rangle\, \vert a\rangle\langle a \vert \tag{1}

Як і будь-який канал, Φ\Phi можна виразити у формі Крауса для якогось вибору матриць Крауса A0,,AN1.A_0,\ldots,A_{N-1}.

Φ(ρ)=k=0N1AkρAk\Phi(\rho) = \sum_{k = 0}^{N-1} A_k \rho A_k^{\dagger}

Це дає нам альтернативний вираз для діагональних елементів Φ(ρ) ⁣:\Phi(\rho)\!:

aΦ(ρ)a=k=0N1aAkρAka=k=0N1Tr(AkaaAkρ)=Tr(Paρ)\begin{aligned} \langle a \vert \Phi(\rho) \vert a\rangle & = \sum_{k = 0}^{N-1} \langle a \vert A_k \rho A_k^{\dagger} \vert a\rangle \\ & = \sum_{k = 0}^{N-1} \operatorname{Tr}\bigl( A_k^{\dagger} \vert a\rangle\langle a \vert A_k \rho\bigr)\\ & = \operatorname{Tr}\bigl(P_a\rho\bigr) \end{aligned}

де

Pa=k=0N1AkaaAk.P_a = \sum_{k = 0}^{N-1} A_k^{\dagger} \vert a\rangle\langle a \vert A_k.

Отже, для тих самих матриць P0,,Pm1P_0,\ldots,P_{m-1} канал Φ\Phi можна виразити так:

Φ(ρ)=a=0m1Tr(Paρ)aa\Phi(\rho) = \sum_{a = 0}^{m-1} \operatorname{Tr}(P_a \rho) \vert a\rangle\langle a\vert

Цей вираз узгоджується з нашим описом загальних вимірювань через матриці: кожен результат вимірювання з'являється з імовірністю Tr(Paρ).\operatorname{Tr}(P_a \rho).

Тепер переконаємось, що обидві властивості, які потрібні від набору матриць {P0,,Pm1}\{P_0,\ldots,P_{m-1}\} для опису загального вимірювання, дійсно виконуються. Перша властивість — усі вони є позитивно напіввизначеними матрицями. Один зі способів побачити це — зауважити, що для кожного вектора ψ,\vert \psi\rangle, компоненти якого відповідають класичним станам X,\mathsf{X}, маємо

ψPaψ=k=0N1ψAkaaAkψ=k=0N1aAkψ20.\langle \psi \vert P_a \vert \psi\rangle = \sum_{k = 0}^{N-1} \langle \psi \vert A_k^{\dagger} \vert a\rangle\langle a \vert A_k\vert \psi\rangle = \sum_{k = 0}^{N-1} \bigl\vert\langle a \vert A_k\vert \psi\rangle\bigr\vert^2 \geq 0.

Друга властивість — сума цих матриць дає одиничну матрицю.

a=0m1Pa=a=0m1k=0N1AkaaAk=k=0N1Ak(a=0m1aa)Ak=k=0N1AkAk=IX\begin{aligned} \sum_{a = 0}^{m-1} P_a & = \sum_{a = 0}^{m-1} \sum_{k = 0}^{N-1} A_k^{\dagger} \vert a\rangle\langle a \vert A_k \\ & = \sum_{k = 0}^{N-1} A_k^{\dagger} \Biggl(\sum_{a = 0}^{m-1} \vert a\rangle\langle a \vert\Biggr) A_k \\ & = \sum_{k = 0}^{N-1} A_k^{\dagger} A_k \\ & = \mathbb{I}_{\mathsf{X}} \end{aligned}

Остання рівність випливає з того, що Φ\Phi є каналом, а отже, його матриці Крауса повинні задовольняти цю умову.

Матриці в канали

Тепер перевіримо, що для будь-якої сукупності {P0,,Pm1}\{P_0,\ldots,P_{m-1}\} додатно напіввизначених матриць, що задовольняють умову P0++Pm1=IX,P_0 + \cdots + P_{m-1} = \mathbb{I}_{\mathsf{X}}, відображення, визначене як

Φ(ρ)=a=0m1Tr(Paρ)aa\Phi(\rho) = \sum_{a = 0}^{m-1} \operatorname{Tr}(P_a \rho) \vert a \rangle\langle a\vert

є коректним каналом з X\mathsf{X} у Y.\mathsf{Y}.

Один зі способів це зробити — обчислити представлення Чоя цього відображення.

J(Φ)=b,c=0n1bcΦ(bc)=b,c=0n1a=0m1bcTr(Pabc)aa=b,c=0n1a=0m1bbPaTccaa=a=0m1PaTaa\begin{aligned} J(\Phi) & = \sum_{b,c = 0}^{n-1} \vert b \rangle \langle c \vert \otimes \Phi(\vert b \rangle \langle c \vert)\\[1mm] & = \sum_{b,c = 0}^{n-1} \sum_{a = 0}^{m-1} \vert b \rangle \langle c \vert \otimes \operatorname{Tr}(P_a \vert b \rangle \langle c \vert) \vert a \rangle\langle a\vert\\[1mm] & = \sum_{b,c = 0}^{n-1} \sum_{a = 0}^{m-1} \vert b \rangle \langle b \vert P_a^T \vert c \rangle \langle c \vert \otimes \vert a \rangle\langle a\vert\\[1mm] & = \sum_{a = 0}^{m-1} P_a^T \otimes \vert a \rangle\langle a\vert \end{aligned}

Транспонування кожної PaP_a з'являється у третій рівності, оскільки

cPab=bPaTc.\langle c \vert P_a \vert b\rangle = \langle b \vert P_a^T \vert c\rangle.

Це дозволяє отримати вирази bb\vert b \rangle \langle b \vert та cc\vert c \rangle \langle c \vert, які після підсумовування по bb та cc відповідно спрощуються до одиничної матриці.

З припущення, що P0,,Pm1P_0,\ldots,P_{m-1} є додатно напіввизначеними, такими само є і P0T,,Pm1T.P_0^{T},\ldots,P_{m-1}^{T}. Зокрема, транспонування ермітової матриці дає іншу ермітову матрицю, а власні значення довільної квадратної матриці та її транспонованої завжди збігаються. З цього випливає, що J(Φ)J(\Phi) є додатно напіввизначеною. Виконуючи трасування по вихідній системі Y\mathsf{Y} (тобто по правій системі), отримуємо

TrY(J(Φ))=a=0m1PaT=IXT=IX,\operatorname{Tr}_{\mathsf{Y}} (J(\Phi)) = \sum_{a = 0}^{m-1} P_a^T = \mathbb{I}_{\mathsf{X}}^T = \mathbb{I}_{\mathsf{X}},

і тому робимо висновок, що Φ\Phi є каналом.

Часткові вимірювання

Припустимо, що маємо декілька систем, які разом перебувають у квантовому стані, і над однією з них виконується загальне вимірювання. Це призводить до одного з результатів вимірювання, вибраного випадковим чином відповідно до ймовірностей, що визначаються вимірюванням та станом системи до нього. Результуючий стан решти систем загалом залежатиме від того, який результат вимірювання було отримано.

Розглянемо, як це працює для пари систем (X,Z)(\mathsf{X},\mathsf{Z}), коли вимірюється система X.\mathsf{X}. (Систему справа ми називаємо Z\mathsf{Z}, бо Y\mathsf{Y} залишимо для системи, що представлятиме класичний вихід вимірювання при його розгляді як каналу.) Узагальнення на випадок, коли системи міняються місцями, а також на три чи більше систем не складає труднощів.

Припустимо, що стан (X,Z)(\mathsf{X},\mathsf{Z}) до вимірювання описується матрицею густини ρ,\rho, яку можна записати так.

ρ=b,c=0n1bcρb,c\rho = \sum_{b,c = 0}^{n-1} \vert b\rangle\langle c\vert \otimes \rho_{b,c}

У цьому виразі передбачається, що класичні стани X\mathsf{X} — це 0,,n1.0,\ldots,n-1.

Вважатимемо, що вимірювання описується сукупністю матриць {P0,,Pm1}.\{P_0,\ldots,P_{m-1}\}. Це вимірювання також можна описати як канал Φ\Phi з X\mathsf{X} у Y,\mathsf{Y}, де Y\mathsf{Y} — нова система з множиною класичних станів {0,,m1}.\{0,\ldots,m-1\}. Зокрема, дія цього каналу виражається так.

Φ(ξ)=a=0m1Tr(Paξ)aa\Phi(\xi) = \sum_{a = 0}^{m-1} \operatorname{Tr}(P_a \xi)\, \vert a \rangle \langle a \vert

Ймовірності результатів

Ми розглядаємо вимірювання системи X,\mathsf{X}, тому ймовірності різних результатів вимірювання можуть залежати лише від ρX\rho_{\mathsf{X}} — редукованого стану X.\mathsf{X}. Зокрема, ймовірність кожного результату a{0,,m1}a\in\{0,\ldots,m-1\} можна виразити трьома еквівалентними способами.

Tr(PaρX)=Tr(PaTrZ(ρ))=Tr((PaIZ)ρ)\operatorname{Tr}\bigl( P_a \rho_{\mathsf{X}}\bigr) = \operatorname{Tr}\bigl( P_a \operatorname{Tr}_{\mathsf{Z}}(\rho)\bigr) = \operatorname{Tr}\bigl( (P_a \otimes \mathbb{I}_{\mathsf{Z}}) \rho \bigr)

Перший вираз природньо представляє ймовірність отримати результат aa на основі вже відомого нам про вимірювання одиночної системи. Другий вираз отримується просто за визначенням ρX=TrZ(ρ).\rho_{\mathsf{X}} = \operatorname{Tr}_{\mathsf{Z}}(\rho).

Для отримання третього виразу потрібно більше роздумів — читачам пропонується самостійно переконатися в його справедливості. Підказка: еквівалентність між другим і третім виразами не залежить від того, чи є ρ\rho матрицею густини і чи є кожна PaP_a додатно напіввизначеною. Спробуй спочатку довести це для тензорних добутків вигляду ρ=MN\rho = M\otimes N, а потім скористатися лінійністю для загального випадку.

Хоча еквівалентність першого та третього виразів у попередньому рівнянні може бути не очевидною, вона має сенс. Починаючи з вимірювання на X,\mathsf{X}, ми фактично визначаємо вимірювання (X,Z)(\mathsf{X},\mathsf{Z}), де ми просто відкидаємо Z\mathsf{Z} і вимірюємо X.\mathsf{X}. Як і будь-яке вимірювання, це нове вимірювання можна описати сукупністю матриць, і не дивно, що воно описується сукупністю

{P0IZ,,Pm1IZ}.\{P_0\otimes\mathbb{I}_{\mathsf{Z}}, \ldots, P_{m-1}\otimes\mathbb{I}_{\mathsf{Z}}\}.

Стани, зумовлені результатами вимірювання

Якщо ми хочемо визначити не лише ймовірності різних результатів, а й результуючий стан Z\mathsf{Z}, зумовлений кожним результатом вимірювання, звернемося до каналового опису вимірювання. Зокрема, розглянемо стан, який виникає, коли ми застосовуємо Φ\Phi до X\mathsf{X} і нічого не робимо з Z.\mathsf{Z}.

(ΦIdZ)(ρ)=b,c=0n1Φ(bc)ρb,c=a=0m1b,c=0n1Tr(Pabc)aaρb,c=a=0m1aab,c=0n1Tr(Pabc)ρb,c=a=0m1aab,c=0n1TrX((PaIZ)(bcρb,c))=a=0m1aaTrX((PaIZ)ρ)\begin{aligned} (\Phi\otimes\operatorname{Id}_{\mathsf{Z}})(\rho) & = \sum_{b,c = 0}^{n-1} \Phi(\vert b\rangle\langle c\vert) \otimes \rho_{b,c}\\ & = \sum_{a = 0}^{m-1} \sum_{b,c = 0}^{n-1} \operatorname{Tr}(P_a \vert b\rangle\langle c\vert) \,\vert a\rangle \langle a \vert \otimes \rho_{b,c}\\ & = \sum_{a = 0}^{m-1} \vert a\rangle \langle a \vert \otimes \sum_{b,c = 0}^{n-1} \operatorname{Tr}(P_a \vert b\rangle\langle c\vert) \rho_{b,c}\\ & = \sum_{a = 0}^{m-1} \vert a\rangle \langle a \vert \otimes \sum_{b,c = 0}^{n-1} \operatorname{Tr}_{\mathsf{X}}\bigl((P_a\otimes\mathbb{I}_{\mathsf{Z}}) (\vert b\rangle\langle c\vert\otimes\rho_{b,c})\bigr)\\ & = \sum_{a = 0}^{m-1} \vert a\rangle \langle a \vert \otimes \operatorname{Tr}_{\mathsf{X}}\bigl((P_a \otimes \mathbb{I}_{\mathsf{Z}}) \rho\bigr) \end{aligned}

Зазначимо, що це є матрицею густини завдяки тому, що Φ\Phi є каналом, а отже кожна матриця TrX((PaIZ)ρ)\operatorname{Tr}_{\mathsf{X}}\bigl((P_a \otimes \mathbb{I}_{\mathsf{Z}}) \rho) є додатно напіввизначеною.

Останній крок перетворює цей вираз на форму, що розкриває те, що нас цікавить.

a=0m1Tr((PaIZ)ρ)aaTrX((PaIZ)ρ)Tr((PaIZ)ρ)\sum_{a = 0}^{m-1} \operatorname{Tr}\bigl((P_a \otimes \mathbb{I}_{\mathsf{Z}}) \rho)\, \vert a\rangle \langle a \vert \otimes \frac{\operatorname{Tr}_{\mathsf{X}}\bigl((P_a \otimes \mathbb{I}_{\mathsf{Z}}) \rho)}{\operatorname{Tr}\bigl((P_a \otimes \mathbb{I}_{\mathsf{Z}}) \rho)}

Це приклад класично-квантового стану,

a=0m1p(a)aaσa,\sum_{a = 0}^{m-1} p(a)\, \vert a\rangle\langle a\vert \otimes \sigma_a,

як ми бачили в уроці Матриці густини. Для кожного результату вимірювання a{0,,m1}a\in\{0,\ldots,m-1\} з ймовірністю

p(a)=Tr((PaIZ)ρ)p(a) = \operatorname{Tr}\bigl((P_a \otimes \mathbb{I}_{\mathsf{Z}}) \rho)

система Y\mathsf{Y} перебуває у класичному стані aa\vert a \rangle \langle a \vert, а система Z\mathsf{Z} — у стані

σa=TrX((PaIZ)ρ)Tr((PaIZ)ρ).(2)\sigma_a = \frac{\operatorname{Tr}_{\mathsf{X}}\bigl((P_a \otimes \mathbb{I}_{\mathsf{Z}}) \rho)}{\operatorname{Tr}\bigl((P_a \otimes \mathbb{I}_{\mathsf{Z}}) \rho)}. \tag{2}

Тобто, це матриця густини, яку ми отримуємо, нормуючи

TrX((PaIZ)ρ)\operatorname{Tr}_{\mathsf{X}}\bigl((P_a \otimes \mathbb{I}_{\mathsf{Z}}) \rho)

шляхом ділення на її слід. (Строго кажучи, стан σa\sigma_a визначений лише тоді, коли ймовірність p(a)p(a) є ненульовою; коли p(a)=0p(a) = 0, цей стан не має значення, оскільки відповідна дискретна подія відбувається з нульовою ймовірністю.)

Звісно, ймовірності результатів узгоджуються з нашими попередніми спостереженнями.

Підсумуємо: ось що відбувається, коли над X\mathsf{X} виконується вимірювання {P0,,Pm1}\{P_0,\ldots,P_{m-1}\}, а (X,Z)(\mathsf{X},\mathsf{Z}) перебуває у стані ρ.\rho.

  1. Кожен результат aa з'являється з ймовірністю p(a)=Tr((PaIZ)ρ).p(a) = \operatorname{Tr}\bigl((P_a \otimes \mathbb{I}_{\mathsf{Z}}) \rho).
  2. За умови отримання результату aa стан системи Z\mathsf{Z} описується матрицею густини σa\sigma_a з рівняння (2),(2), яку отримують нормуванням TrX((PaIZ)ρ).\operatorname{Tr}_{\mathsf{X}}\bigl((P_a \otimes \mathbb{I}_{\mathsf{Z}}) \rho).

Узагальнення

Цей опис можна адаптувати до інших ситуацій — наприклад, коли порядок систем змінено на протилежний або коли систем три чи більше. Концептуально це не складно, хоча запис формул може бути громіздким.

Загалом, якщо маємо rr систем X1,,Xr,\mathsf{X}_1,\ldots,\mathsf{X}_r, стан складеної системи (X1,,Xr)(\mathsf{X}_1,\ldots,\mathsf{X}_r) дорівнює ρ,\rho, і вимірювання {P0,,Pm1}\{P_0,\ldots,P_{m-1}\} виконується над Xk\mathsf{X}_k, відбувається наступне.

  1. Кожен результат aa з'являється з ймовірністю

    p(a)=Tr((IX1IXk1PaIXk+1IXr)ρ).p(a) = \operatorname{Tr}\bigl((\mathbb{I}_{\mathsf{X}_1}\otimes \cdots \otimes\mathbb{I}_{\mathsf{X}_{k-1}} \otimes P_a \otimes \mathbb{I}_{\mathsf{X}_{k+1}} \otimes \cdots \otimes\mathbb{I}_{\mathsf{X}_r}) \rho\bigr).
  2. За умови отримання результату aa стан (X1,,Xk1,Xk+1,,Xr)(\mathsf{X}_1,\ldots,\mathsf{X}_{k-1},\mathsf{X}_{k+1},\ldots,\mathsf{X}_r) описується такою матрицею густини.

    TrXk((IX1IXk1PaIXk+1IXr)ρ)Tr((IX1IXk1PaIXk+1IXr)ρ)\frac{\operatorname{Tr}_{\mathsf{X}_k}\bigl((\mathbb{I}_{\mathsf{X}_1}\otimes \cdots \otimes\mathbb{I}_{\mathsf{X}_{k-1}} \otimes P_a \otimes \mathbb{I}_{\mathsf{X}_{k+1}} \otimes \cdots \otimes\mathbb{I}_{\mathsf{X}_r}) \rho\bigr)}{\operatorname{Tr}\bigl((\mathbb{I}_{\mathsf{X}_1}\otimes \cdots \otimes\mathbb{I}_{\mathsf{X}_{k-1}} \otimes P_a \otimes \mathbb{I}_{\mathsf{X}_{k+1}} \otimes \cdots \otimes\mathbb{I}_{\mathsf{X}_r}) \rho\bigr)}