Перейти до основного вмісту

Внутрішні добутки та проєкції

Щоб краще підготуватися до вивчення можливостей і обмежень квантових схем, ми розглянемо кілька додаткових математичних понять — а саме внутрішній добуток між векторами (і його зв'язок із Евклідовою нормою), поняття ортогональності та ортонормальності для наборів векторів, а також матриці проєкцій, що дадуть нам змогу ввести зручне узагальнення стандартних базисних вимірювань.

Внутрішні добутки

Пригадаємо, що коли ми використовуємо нотацію Дірака для позначення довільного стовпцевого вектора як кет, наприклад

ψ=(α1α2αn),\vert \psi \rangle = \begin{pmatrix} \alpha_1\\ \alpha_2\\ \vdots\\ \alpha_n \end{pmatrix},

то відповідний бра-вектор є спряженою транспонованою цього вектора:

ψ=(ψ)=(α1α2αn).(1)\langle \psi \vert = \bigl(\vert \psi \rangle \bigr)^{\dagger} = \begin{pmatrix} \overline{\alpha_1} & \overline{\alpha_2} & \cdots & \overline{\alpha_n} \end{pmatrix}. \tag{1}

Або ж, якщо ми маємо на увазі деяку множину класичних станів Σ\Sigma і записуємо стовпцевий вектор у вигляді кет,

ψ=aΣαaa,\vert \psi \rangle = \sum_{a\in\Sigma} \alpha_a \vert a \rangle,

то відповідний рядковий (або бра-) вектор є спряженою транспонованою

ψ=aΣαaa.(2)\langle \psi \vert = \sum_{a\in\Sigma} \overline{\alpha_a} \langle a \vert. \tag{2}

Добуток бра-вектора і кет-вектора, розглянутих як матриці, що мають відповідно один рядок або один стовпець, дає скаляр. Зокрема, якщо є два стовпцевих вектори

ψ=(α1α2αn)таϕ=(β1β2βn),\vert \psi \rangle = \begin{pmatrix} \alpha_1\\ \alpha_2\\ \vdots\\ \alpha_n \end{pmatrix} \quad\text{та}\quad \vert \phi \rangle = \begin{pmatrix} \beta_1\\ \beta_2\\ \vdots\\ \beta_n \end{pmatrix},

так що рядковий вектор ψ\langle \psi \vert має вигляд, як у рівнянні (1),(1), то

ψϕ=ψϕ=(α1α2αn)(β1β2βn)=α1β1++αnβn.\langle \psi \vert \phi \rangle = \langle \psi \vert \vert \phi \rangle = \begin{pmatrix} \overline{\alpha_1} & \overline{\alpha_2} & \cdots & \overline{\alpha_n} \end{pmatrix} \begin{pmatrix} \beta_1\\ \beta_2\\ \vdots\\ \beta_n \end{pmatrix} = \overline{\alpha_1} \beta_1 + \cdots + \overline{\alpha_n}\beta_n.

Або ж, якщо два стовпцевих вектори записані у вигляді

ψ=aΣαaaтаϕ=bΣβbb,\vert \psi \rangle = \sum_{a\in\Sigma} \alpha_a \vert a \rangle \quad\text{та}\quad \vert \phi \rangle = \sum_{b\in\Sigma} \beta_b \vert b \rangle,

так що ψ\langle \psi \vert є рядковим вектором (2),(2), то

ψϕ=ψϕ=(aΣαaa)(bΣβbb)=aΣbΣαaβbab=aΣαaβa,\begin{aligned} \langle \psi \vert \phi \rangle & = \langle \psi \vert \vert \phi \rangle\\ & = \Biggl(\sum_{a\in\Sigma} \overline{\alpha_a} \langle a \vert\Biggr) \Biggl(\sum_{b\in\Sigma} \beta_b \vert b\rangle\Biggr)\\ & = \sum_{a\in\Sigma}\sum_{b\in\Sigma} \overline{\alpha_a} \beta_b \langle a \vert b \rangle\\ & = \sum_{a\in\Sigma} \overline{\alpha_a} \beta_a, \end{aligned}

де остання рівність випливає зі спостереження, що aa=1\langle a \vert a \rangle = 1 і ab=0\langle a \vert b \rangle = 0 для класичних станів aa і bb, що задовольняють ab.a\neq b.

Значення ψϕ\langle \psi \vert \phi \rangle називається внутрішнім добутком між векторами ψ\vert \psi\rangle та ϕ.\vert \phi \rangle. Внутрішні добутки відіграють критично важливу роль у квантовій інформації та обчисленнях; без них неможливо глибоко зрозуміти квантову інформацію на математичному рівні.

Зберемо тепер деякі базові факти про внутрішні добутки векторів.

  1. Зв'язок із Евклідовою нормою. Внутрішній добуток будь-якого вектора

    ψ=aΣαaa\vert \psi \rangle = \sum_{a\in\Sigma} \alpha_a \vert a \rangle

    із самим собою дорівнює

    ψψ=aΣαaαa=aΣαa2=ψ2.\langle \psi \vert \psi \rangle = \sum_{a\in\Sigma} \overline{\alpha_a} \alpha_a = \sum_{a\in\Sigma} \vert\alpha_a\vert^2 = \bigl\| \vert \psi \rangle \bigr\|^2.

    Отже, Евклідову норму вектора можна альтернативно виразити як

    ψ=ψψ.\bigl\| \vert \psi \rangle \bigr\| = \sqrt{ \langle \psi \vert \psi \rangle }.

    Зауваж, що Евклідова норма вектора завжди є невід'ємним дійсним числом. Крім того, Евклідова норма вектора може дорівнювати нулю лише тоді, коли кожен із його елементів дорівнює нулю, тобто вектор є нульовим вектором.

    Ці спостереження можна підсумувати так: для кожного вектора ψ\vert \psi \rangle виконується

    ψψ0,\langle \psi \vert \psi \rangle \geq 0,

    причому ψψ=0\langle \psi \vert \psi \rangle = 0 тоді і тільки тоді, коли ψ=0.\vert \psi \rangle = 0. Цю властивість внутрішнього добутку іноді називають позитивною визначеністю.

  2. Кон'югатна симетрія. Для будь-яких двох векторів

    ψ=aΣαaaтаϕ=bΣβbb,\vert \psi \rangle = \sum_{a\in\Sigma} \alpha_a \vert a \rangle \quad\text{та}\quad \vert \phi \rangle = \sum_{b\in\Sigma} \beta_b \vert b \rangle,

    маємо

    ψϕ=aΣαaβaтаϕψ=aΣβaαa,\langle \psi \vert \phi \rangle = \sum_{a\in\Sigma} \overline{\alpha_a} \beta_a \quad\text{та}\quad \langle \phi \vert \psi \rangle = \sum_{a\in\Sigma} \overline{\beta_a} \alpha_a,

    а отже

    ψϕ=ϕψ.\overline{\langle \psi \vert \phi \rangle} = \langle \phi \vert \psi \rangle.
  3. Лінійність у другому аргументі (і кон'югатна лінійність у першому). Припустімо, що ψ,\vert \psi \rangle, ϕ1\vert \phi_1 \rangle та ϕ2\vert \phi_2 \rangle — вектори, а α1\alpha_1 і α2\alpha_2 — комплексні числа. Якщо визначити новий вектор

    ϕ=α1ϕ1+α2ϕ2,\vert \phi\rangle = \alpha_1 \vert \phi_1\rangle + \alpha_2 \vert \phi_2\rangle,

    то

    ψϕ=ψ(α1ϕ1+α2ϕ2)=α1ψϕ1+α2ψϕ2.\langle \psi \vert \phi \rangle = \langle \psi \vert \bigl( \alpha_1\vert \phi_1 \rangle + \alpha_2\vert \phi_2 \rangle\bigr) = \alpha_1 \langle \psi \vert \phi_1 \rangle + \alpha_2 \langle \psi \vert \phi_2 \rangle.

    Тобто внутрішній добуток є лінійним у другому аргументі. Це можна перевірити або безпосередньо за наведеними формулами, або просто зауваживши, що множення матриць є лінійним за кожним аргументом (і зокрема за другим).

    Поєднання цього факту з кон'югатною симетрією показує, що внутрішній добуток є кон'югатно лінійним у першому аргументі. Тобто якщо ψ1,\vert \psi_1 \rangle, ψ2\vert \psi_2 \rangle та ϕ\vert \phi \rangle — вектори, α1\alpha_1 і α2\alpha_2 — комплексні числа, і визначено

    ψ=α1ψ1+α2ψ2,\vert \psi \rangle = \alpha_1 \vert \psi_1\rangle + \alpha_2 \vert \psi_2 \rangle,

    то

    ψϕ=(α1ψ1+α2ψ2)ϕ=α1ψ1ϕ+α2ψ2ϕ.\langle \psi \vert \phi \rangle = \bigl( \overline{\alpha_1} \langle \psi_1 \vert + \overline{\alpha_2} \langle \psi_2 \vert \bigr) \vert\phi\rangle = \overline{\alpha_1} \langle \psi_1 \vert \phi \rangle + \overline{\alpha_2} \langle \psi_2 \vert \phi \rangle.
  4. Нерівність Коші–Шварца. Для кожного вибору векторів ϕ\vert \phi \rangle та ψ\vert \psi \rangle з однаковою кількістю елементів виконується

    ψϕψϕ.\bigl\vert \langle \psi \vert \phi \rangle\bigr| \leq \bigl\| \vert\psi \rangle \bigr\| \bigl\| \vert \phi \rangle \bigr\|.

    Це надзвичайно корисна нерівність, яка широко використовується у квантовій інформації (і в багатьох інших розділах математики та фізики).

Ортогональні та ортонормальні набори

Два вектори ϕ\vert \phi \rangle та ψ\vert \psi \rangle називаються ортогональними, якщо їхній внутрішній добуток дорівнює нулю:

ψϕ=0.\langle \psi \vert \phi \rangle = 0.

Геометрично ортогональні вектори можна уявити як вектори, що утворюють прямий кут між собою.

Набір векторів {ψ1,,ψm}\{ \vert \psi_1\rangle,\ldots,\vert\psi_m\rangle\} називається ортогональним набором, якщо кожен вектор у ньому є ортогональним до будь-якого іншого вектора цього набору. Тобто набір є ортогональним, якщо

ψjψk=0\langle \psi_j \vert \psi_k\rangle = 0

для всіх j,k{1,,m}j,k\in\{1,\ldots,m\} таких, що jk.j\neq k.

Набір векторів {ψ1,,ψm}\{ \vert \psi_1\rangle,\ldots,\vert\psi_m\rangle\} називається ортонормальним, якщо він є ортогональним набором і, крім того, кожен вектор у ньому є одиничним вектором. Еквівалентно, цей набір є ортонормальним, якщо виконується

ψjψk={1j=k0jk(3)\langle \psi_j \vert \psi_k\rangle = \begin{cases} 1 & j = k\\[1mm] 0 & j\neq k \end{cases} \tag{3}

для всіх j,k{1,,m}.j,k\in\{1,\ldots,m\}.

Нарешті, набір {ψ1,,ψm}\{ \vert \psi_1\rangle,\ldots,\vert\psi_m\rangle\} є ортонормальним базисом, якщо він є ортонормальним набором і до того ж утворює базис. Це рівносильно тому, що {ψ1,,ψm}\{ \vert \psi_1\rangle,\ldots,\vert\psi_m\rangle\} є ортонормальним набором, а mm дорівнює розмірності простору, з якого беруться ψ1,,ψm.\vert \psi_1\rangle,\ldots,\vert\psi_m\rangle.

Наприклад, для будь-якої множини класичних станів Σ\Sigma набір усіх стандартних базисних векторів

{a:aΣ}\big\{ \vert a \rangle \,:\, a\in\Sigma\bigr\}

є ортонормальним базисом. Набір {+,}\{\vert+\rangle,\vert-\rangle\} є ортонормальним базисом для 22-вимірного простору, що відповідає одному кубіту, а базис Белла {ϕ+,ϕ,ψ+,ψ}\{\vert\phi^+\rangle, \vert\phi^-\rangle, \vert\psi^+\rangle, \vert\psi^-\rangle\} є ортонормальним базисом для 44-вимірного простору двох кубітів.

Розширення ортонормальних наборів до ортонормальних базисів

Припустімо, що ψ1,,ψm\vert\psi_1\rangle,\ldots,\vert\psi_m\rangle — вектори з nn-вимірного простору, і при цьому {ψ1,,ψm}\{\vert\psi_1\rangle,\ldots,\vert\psi_m\rangle\} є ортонормальним набором. Ортонормальні набори завжди є лінійно незалежними, тому ці вектори обов'язково розкладають підпростір розмірності m.m. Звідси випливає, що mnm\leq n, оскільки розмірність підпростору, що породжується цими векторами, не може перевищувати розмірність усього простору, з якого вони беруться.

Якщо m<n,m<n, то завжди можна вибрати додаткові nmn-m векторів ψm+1,,ψn\vert \psi_{m+1}\rangle,\ldots,\vert\psi_n\rangle так, щоб {ψ1,,ψn}\{\vert\psi_1\rangle,\ldots,\vert\psi_n\rangle\} утворювало ортонормальний базис. Для побудови таких векторів використовується процедура, відома як процес ортогоналізації Грама–Шмідта.

Ортонормальні набори та унітарні матриці

Ортонормальні набори векторів тісно пов'язані з унітарними матрицями. Один зі способів виразити цей зв'язок — сказати, що такі три твердження є логічно еквівалентними (тобто або всі вони істинні, або всі хибні) для будь-якої квадратної матриці UU:

  1. Матриця UU є унітарною (тобто UU=I=UUU^{\dagger} U = \mathbb{I} = U U^{\dagger}).
  2. Рядки матриці UU утворюють ортонормальний набір.
  3. Стовпці матриці UU утворюють ортонормальний набір.

Ця еквівалентність стає цілком очевидною, якщо поміркувати над тим, як працює множення матриць і спряжена транспонована. Припустімо, наприклад, що маємо матрицю 3×33\times 3:

U=(α1,1α1,2α1,3α2,1α2,2α2,3α3,1α3,2α3,3)U = \begin{pmatrix} \alpha_{1,1} & \alpha_{1,2} & \alpha_{1,3} \\[1mm] \alpha_{2,1} & \alpha_{2,2} & \alpha_{2,3} \\[1mm] \alpha_{3,1} & \alpha_{3,2} & \alpha_{3,3} \end{pmatrix}

Спряжена транспонована матриці UU має вигляд:

U=(α1,1α2,1α3,1α1,2α2,2α3,2α1,3α2,3α3,3)U^{\dagger} = \begin{pmatrix} \overline{\alpha_{1,1}} & \overline{\alpha_{2,1}} & \overline{\alpha_{3,1}} \\[1mm] \overline{\alpha_{1,2}} & \overline{\alpha_{2,2}} & \overline{\alpha_{3,2}} \\[1mm] \overline{\alpha_{1,3}} & \overline{\alpha_{2,3}} & \overline{\alpha_{3,3}} \end{pmatrix}

Перемноживши ці дві матриці, поставивши спряжену транспоновану ліворуч, отримаємо:

(α1,1α2,1α3,1α1,2α2,2α3,2α1,3α2,3α3,3)(α1,1α1,2α1,3α2,1α2,2α2,3α3,1α3,2α3,3)=(α1,1α1,1+α2,1α2,1+α3,1α3,1α1,1α1,2+α2,1α2,2+α3,1α3,2α1,1α1,3+α2,1α2,3+α3,1α3,3α1,2α1,1+α2,2α2,1+α3,2α3,1α1,2α1,2+α2,2α2,2+α3,2α3,2α1,2α1,3+α2,2α2,3+α3,2α3,3α1,3α1,1+α2,3α2,1+α3,3α3,1α1,3α1,2+α2,3α2,2+α3,3α3,2α1,3α1,3+α2,3α2,3+α3,3α3,3)\begin{aligned} &\begin{pmatrix} \overline{\alpha_{1,1}} & \overline{\alpha_{2,1}} & \overline{\alpha_{3,1}} \\[1mm] \overline{\alpha_{1,2}} & \overline{\alpha_{2,2}} & \overline{\alpha_{3,2}} \\[1mm] \overline{\alpha_{1,3}} & \overline{\alpha_{2,3}} & \overline{\alpha_{3,3}} \end{pmatrix} \begin{pmatrix} \alpha_{1,1} & \alpha_{1,2} & \alpha_{1,3} \\[1mm] \alpha_{2,1} & \alpha_{2,2} & \alpha_{2,3} \\[1mm] \alpha_{3,1} & \alpha_{3,2} & \alpha_{3,3} \end{pmatrix}\\[4mm] \quad &= \begin{pmatrix} \overline{\alpha_{1,1}}\alpha_{1,1} + \overline{\alpha_{2,1}}\alpha_{2,1} + \overline{\alpha_{3,1}}\alpha_{3,1} & \overline{\alpha_{1,1}}\alpha_{1,2} + \overline{\alpha_{2,1}}\alpha_{2,2} + \overline{\alpha_{3,1}}\alpha_{3,2} & \overline{\alpha_{1,1}}\alpha_{1,3} + \overline{\alpha_{2,1}}\alpha_{2,3} + \overline{\alpha_{3,1}}\alpha_{3,3} \\[2mm] \overline{\alpha_{1,2}}\alpha_{1,1} + \overline{\alpha_{2,2}}\alpha_{2,1} + \overline{\alpha_{3,2}}\alpha_{3,1} & \overline{\alpha_{1,2}}\alpha_{1,2} + \overline{\alpha_{2,2}}\alpha_{2,2} + \overline{\alpha_{3,2}}\alpha_{3,2} & \overline{\alpha_{1,2}}\alpha_{1,3} + \overline{\alpha_{2,2}}\alpha_{2,3} + \overline{\alpha_{3,2}}\alpha_{3,3} \\[2mm] \overline{\alpha_{1,3}}\alpha_{1,1} + \overline{\alpha_{2,3}}\alpha_{2,1} + \overline{\alpha_{3,3}}\alpha_{3,1} & \overline{\alpha_{1,3}}\alpha_{1,2} + \overline{\alpha_{2,3}}\alpha_{2,2} + \overline{\alpha_{3,3}}\alpha_{3,2} & \overline{\alpha_{1,3}}\alpha_{1,3} + \overline{\alpha_{2,3}}\alpha_{2,3} + \overline{\alpha_{3,3}}\alpha_{3,3} \end{pmatrix} \end{aligned}

Якщо скласти три вектори зі стовпців матриці U,U,

ψ1=(α1,1α2,1α3,1),ψ2=(α1,2α2,2α3,2),ψ3=(α1,3α2,3α3,3),\vert \psi_1\rangle = \begin{pmatrix} \alpha_{1,1}\\ \alpha_{2,1}\\ \alpha_{3,1} \end{pmatrix}, \quad \vert \psi_2\rangle = \begin{pmatrix} \alpha_{1,2}\\ \alpha_{2,2}\\ \alpha_{3,2} \end{pmatrix}, \quad \vert \psi_3\rangle = \begin{pmatrix} \alpha_{1,3}\\ \alpha_{2,3}\\ \alpha_{3,3} \end{pmatrix},

то добуток вище можна записати інакше:

UU=(ψ1ψ1ψ1ψ2ψ1ψ3ψ2ψ1ψ2ψ2ψ2ψ3ψ3ψ1ψ3ψ2ψ3ψ3)U^{\dagger} U = \begin{pmatrix} \langle \psi_1\vert \psi_1 \rangle & \langle \psi_1\vert \psi_2 \rangle & \langle \psi_1\vert \psi_3 \rangle \\ \langle \psi_2\vert \psi_1 \rangle & \langle \psi_2\vert \psi_2 \rangle & \langle \psi_2\vert \psi_3 \rangle \\ \langle \psi_3\vert \psi_1 \rangle & \langle \psi_3\vert \psi_2 \rangle & \langle \psi_3\vert \psi_3 \rangle \end{pmatrix}

Посилаючись на рівняння (3),(3), бачимо тепер, що умова рівності цієї матриці одиничній еквівалентна ортонормальності набору {ψ1,ψ2,ψ3}.\{\vert\psi_1\rangle,\vert\psi_2\rangle,\vert\psi_3\rangle\}.

Цей аргумент узагальнюється на унітарні матриці будь-якого розміру. Той факт, що рядки матриці утворюють ортонормальний базис тоді і тільки тоді, коли матриця є унітарною, випливає з того, що матриця є унітарною тоді і тільки тоді, коли її транспонована теж є унітарною.

З огляду на описану еквівалентність і той факт, що будь-який ортонормальний набір можна розширити до ортонормального базису, можна зробити такий корисний висновок: для будь-якого ортонормального набору векторів {ψ1,,ψm}\{\vert\psi_1\rangle,\ldots,\vert\psi_m\rangle\} з nn-вимірного простору існує унітарна матриця UU, перші mm стовпців якої є векторами ψ1,,ψm.\vert\psi_1\rangle,\ldots,\vert\psi_m\rangle. Схематично ми завжди можемо знайти унітарну матрицю такого вигляду:

U=(ψ1ψ2ψmψm+1ψn).U = \left( \begin{array}{ccccccc} \rule{0.4pt}{10pt} & \rule{0.4pt}{10pt} & & \rule{0.4pt}{10pt} & \rule{0.4pt}{10pt} & & \rule{0.4pt}{10pt}\\ \vert\psi_1\rangle & \vert\psi_2\rangle & \cdots & \vert\psi_m\rangle & \vert\psi_{m+1}\rangle & \cdots & \vert\psi_n\rangle\\[2mm] \rule{0.4pt}{10pt} & \rule{0.4pt}{10pt} & & \rule{0.4pt}{10pt} & \rule{0.4pt}{10pt} & & \rule{0.4pt}{10pt} \end{array} \right).

Тут останні nmn-m стовпців заповнюються будь-яким вибором векторів ψm+1,,ψn\vert\psi_{m+1}\rangle,\ldots,\vert\psi_n\rangle, що роблять {ψ1,,ψn}\{\vert\psi_1\rangle,\ldots,\vert\psi_n\rangle\} ортонормальним базисом.

Проєкції та проєктивні вимірювання

Матриці проєкцій

Квадратна матриця Π\Pi називається проєкцією, якщо вона задовольняє дві умови:

  1. Π=Π.\Pi = \Pi^{\dagger}.
  2. Π2=Π.\Pi^2 = \Pi.

Матриці, що задовольняють першу умову — тобто рівні своїй спряженій транспонованій — називаються ермітовими матрицями, а матриці, що задовольняють другу умову — тобто залишаються незмінними при піднесенні до квадрата — називаються ідемпотентними матрицями.

Варто зауважити, що слово проєкція іноді вживається для позначення будь-якої матриці, що задовольняє лише другу умову, але не обов'язково першу; в такому разі для матриць, що задовольняють обидві умови, зазвичай використовують термін ортогональна проєкція. У контексті квантової інформації та обчислень, проте, терміни проєкція та матриця проєкції частіше стосуються матриць, що задовольняють обидві умови.

Прикладом проєкції є матриця

Π=ψψ(4)\Pi = \vert \psi \rangle \langle \psi \vert \tag{4}

для довільного одиничного вектора ψ.\vert \psi\rangle. Переконаємося, що ця матриця є ермітовою:

Π=(ψψ)=(ψ)(ψ)=ψψ=Π.\Pi^{\dagger} = \bigl( \vert \psi \rangle \langle \psi \vert \bigr)^{\dagger} = \bigl( \langle \psi \vert \bigr)^{\dagger}\bigl( \vert \psi \rangle \bigr)^{\dagger} = \vert \psi \rangle \langle \psi \vert = \Pi.

Тут для отримання другої рівності ми скористалися формулою

(AB)=BA,(A B)^{\dagger} = B^{\dagger} A^{\dagger},

яка є справедливою для будь-яких двох матриць AA і BB, для яких добуток ABAB має сенс.

Щоб переконатися, що матриця Π\Pi з (4)(4) є ідемпотентною, скористаємося тим, що ψ\vert\psi\rangle є одиничним вектором, тобто ψψ=1.\langle \psi \vert \psi\rangle = 1. Тоді маємо

Π2=(ψψ)2=ψψψψ=ψψ=Π.\Pi^2 = \bigl( \vert\psi\rangle\langle \psi\vert \bigr)^2 = \vert\psi\rangle\langle \psi\vert\psi\rangle\langle\psi\vert = \vert\psi\rangle\langle\psi\vert = \Pi.

Більш загально, якщо {ψ1,,ψm}\{\vert \psi_1\rangle,\ldots,\vert \psi_m\rangle\} — довільна ортонормована множина векторів, то матриця

Π=k=1mψkψk(5)\Pi = \sum_{k = 1}^m \vert \psi_k\rangle \langle \psi_k \vert \tag{5}

є проєкцією. Зокрема, маємо

Π=(k=1mψkψk)=k=1m(ψkψk)=k=1mψkψk=Π,\begin{aligned} \Pi^{\dagger} &= \biggl(\sum_{k = 1}^m \vert \psi_k\rangle \langle \psi_k \vert\biggr)^{\dagger} \\ &= \sum_{k = 1}^m \bigl(\vert\psi_k\rangle\langle\psi_k\vert\bigr)^{\dagger} \\ &= \sum_{k = 1}^m \vert \psi_k\rangle \langle \psi_k \vert\\ &= \Pi, \end{aligned}

і

Π2=(j=1mψjψj)(k=1mψkψk)=j=1mk=1mψjψjψkψk=k=1mψkψk=Π,\begin{aligned} \Pi^2 & = \biggl( \sum_{j = 1}^m \vert \psi_j\rangle \langle \psi_j \vert\Bigr)\Bigl(\sum_{k = 1}^m \vert \psi_k\rangle \langle \psi_k \vert\biggr) \\ & = \sum_{j = 1}^m\sum_{k = 1}^m \vert \psi_j\rangle \langle \psi_j \vert \psi_k\rangle \langle \psi_k \vert \\ & = \sum_{k = 1}^m \vert \psi_k\rangle \langle \psi_k \vert\\ & = \Pi, \end{aligned}

де ортонормованість {ψ1,,ψm}\{\vert \psi_1\rangle,\ldots,\vert \psi_m\rangle\} забезпечує передостанню рівність.

Насправді цим вичерпуються всі можливості: будь-яку проєкцію Π\Pi можна записати у вигляді (5)(5) для деякого вибору ортонормованої множини {ψ1,,ψm}.\{\vert \psi_1\rangle,\ldots,\vert \psi_m\rangle\}. (Строго кажучи, нульова матриця Π=0,\Pi=0, яка теж є проєкцією, є окремим випадком. Щоб вписати її у загальну форму (5)(5), треба допустити можливість порожньої суми, що дає нульову матрицю.)

Проєктивні вимірювання

Поняття вимірювання квантової системи є загальнішим, ніж просто вимірювання у стандартному базисі. Проєктивні вимірювання — це вимірювання, що описуються набором проєкцій, сума яких дорівнює одиничній матриці. У символах, набір {Π0,,Πm1}\{\Pi_0,\ldots,\Pi_{m-1}\} матриць проєкцій описує проєктивне вимірювання, якщо

Π0++Πm1=I.\Pi_0 + \cdots + \Pi_{m-1} = \mathbb{I}.

Коли таке вимірювання виконується над системою X\mathsf{X}, що перебуває в стані ψ,\vert\psi\rangle, відбуваються дві речі:

  1. Для кожного k{0,,m1},k\in\{0,\ldots,m-1\}, результат вимірювання дорівнює kk з імовірністю

    Pr(outcome is k)=Πkψ2.\operatorname{Pr}\bigl(\text{outcome is $k$}\bigr) = \bigl\| \Pi_k \vert \psi \rangle \bigr\|^2.
  2. Для того результату kk, який отримало вимірювання, стан X\mathsf{X} стає

    ΠkψΠkψ.\frac{\Pi_k \vert\psi\rangle}{\bigl\|\Pi_k \vert\psi\rangle\bigr\|}.

За бажанням для проєктивних вимірювань можна також обирати результати, відмінні від {0,,m1}.\{0,\ldots,m-1\}. Більш загально, для будь-якої скінченної та непорожньої множини Σ,\Sigma, якщо маємо набір матриць проєкцій

{Πa:aΣ}\{\Pi_a:a\in\Sigma\}

що задовольняє умову

aΣΠa=I,\sum_{a\in\Sigma} \Pi_a = \mathbb{I},

то цей набір описує проєктивне вимірювання, можливі результати якого збігаються з множиною Σ,\Sigma, де правила ті самі, що й раніше:

  1. Для кожного aΣ,a\in\Sigma, результат вимірювання дорівнює aa з імовірністю

    Pr(outcome is a)=Πaψ2.\operatorname{Pr}\bigl(\text{outcome is $a$}\bigr) = \bigl\| \Pi_a \vert \psi \rangle \bigr\|^2.
  2. Для того результату aa, який отримало вимірювання, стан X\mathsf{X} стає

    ΠaψΠaψ.\frac{\Pi_a \vert\psi\rangle}{\bigl\|\Pi_a \vert\psi\rangle\bigr\|}.

Наприклад, вимірювання у стандартному базисі є окремим випадком проєктивних вимірювань, де Σ\Sigma — множина класичних станів системи X\mathsf{X}, а набір матриць проєкцій — це {aa:aΣ}.\{\vert a\rangle\langle a\vert:a\in\Sigma\}.

Ще один приклад проєктивного вимірювання, цього разу над двома кубітами (X,Y),(\mathsf{X},\mathsf{Y}), задається набором {Π0,Π1},\{\Pi_0,\Pi_1\}, де

Π0=ϕ+ϕ++ϕϕ+ψ+ψ+andΠ1=ψψ.\Pi_0 = \vert \phi^+\rangle\langle \phi^+ \vert + \vert \phi^-\rangle\langle \phi^- \vert + \vert \psi^+\rangle\langle \psi^+ \vert \quad\text{and}\quad \Pi_1 = \vert\psi^-\rangle\langle\psi^-\vert.

Якщо маємо кілька систем, що разом перебувають у деякому квантовому стані, і проєктивне вимірювання виконується лише над однією з них, то дія аналогічна тому, що ми мали для вимірювань у стандартному базисі — і фактично тепер ми можемо описати цю дію значно простіше, ніж раніше.

Точніше, припустімо, що маємо дві системи (X,Y)(\mathsf{X},\mathsf{Y}) у квантовому стані ψ,\vert\psi\rangle, і над системою X\mathsf{X} виконується проєктивне вимірювання, описане набором {Πa:aΣ},\{\Pi_a : a\in\Sigma\}, тоді як над Y\mathsf{Y} нічого не робиться. Це еквівалентно виконанню проєктивного вимірювання, описаного набором

{ΠaI:aΣ}\bigl\{ \Pi_a \otimes \mathbb{I} \,:\, a\in\Sigma\bigr\}

над спільною системою (X,Y).(\mathsf{X},\mathsf{Y}). Кожен результат вимірювання aa отримується з імовірністю

(ΠaI)ψ2,\bigl\| (\Pi_a \otimes \mathbb{I})\vert \psi\rangle \bigr\|^2,

і за умови появи результату aa стан спільної системи (X,Y)(\mathsf{X},\mathsf{Y}) стає

(ΠaI)ψ(ΠaI)ψ.\frac{(\Pi_a \otimes \mathbb{I})\vert \psi\rangle}{\bigl\| (\Pi_a \otimes \mathbb{I})\vert \psi\rangle \bigr\|}.

Реалізація проєктивних вимірювань

Довільні проєктивні вимірювання можна реалізувати за допомогою унітарних операцій, вимірювань у стандартному базисі та додаткової робочої системи — це буде пояснено нижче.

Припустімо, що X\mathsf{X} — деяка система, а {Π0,,Πm1}\{\Pi_0,\ldots,\Pi_{m-1}\} — проєктивне вимірювання над X.\mathsf{X}. Цей розгляд легко узагальнити на проєктивні вимірювання з різними множинами результатів, але для зручності та простоти вважатимемо, що множина можливих результатів нашого вимірювання — це {0,,m1}.\{0,\ldots,m-1\}.

Зауважимо явно, що mm не обов'язково дорівнює кількості класичних станів X\mathsf{X} — позначимо кількість класичних станів X\mathsf{X} через nn, тобто кожна матриця Πk\Pi_k є матрицею проєкції розміру n×nn\times n.

Оскільки ми припускаємо, що {Π0,Πm1}\{\Pi_0\ldots,\Pi_{m-1}\} представляє проєктивне вимірювання, обов'язково виконується

k=0m1Πk=In.\sum_{k = 0}^{m-1} \Pi_k = \mathbb{I}_n.

Наша мета — виконати процес, що має той самий ефект, що й це проєктивне вимірювання над X,\mathsf{X}, але використовуючи лише унітарні операції та вимірювання у стандартному базисі.

Для цього скористаємося додатковою робочою системою Y\mathsf{Y}, і зокрема візьмемо множину класичних станів Y\mathsf{Y} рівною {0,,m1}\{0,\ldots,m-1\} — такою ж, як і множина результатів проєктивного вимірювання. Ідея полягає в тому, що ми виконаємо вимірювання у стандартному базисі над Y\mathsf{Y} і інтерпретуємо результат цього вимірювання як результат проєктивного вимірювання над X.\mathsf{X}. Треба припустити, що Y\mathsf{Y} ініціалізована у деякому фіксованому стані; виберемо 0.\vert 0\rangle. (Будь-який інший фіксований вектор квантового стану теж підійде, але вибір 0\vert 0\rangle значно спрощує подальші пояснення.)

Зрозуміло, що щоб вимірювання Y\mathsf{Y} у стандартному базисі давало нам інформацію про X,\mathsf{X}, потрібно, щоб X\mathsf{X} і Y\mathsf{Y} якимось чином взаємодіяли перед вимірюванням Y\mathsf{Y} — шляхом виконання унітарної операції над системою (Y,X).(\mathsf{Y},\mathsf{X}). Розглянемо спочатку ось цю матрицю:

M=k=0m1k0Πk.M = \sum_{k = 0}^{m-1} \vert k \rangle \langle 0 \vert \otimes \Pi_k.

У явному вигляді, як так звана блокова матриця — тобто матриця матриць, яку ми інтерпретуємо як одну більшу матрицю — MM виглядає так:

M=(Π000Π100Πm100).M = \begin{pmatrix} \Pi_0 & 0 & \cdots & 0\\[1mm] \Pi_1 & 0 & \cdots & 0\\[1mm] \vdots & \vdots & \ddots & \vdots\\[1mm] \Pi_{m-1} & 0 & \cdots & 0 \end{pmatrix}.

Тут кожен 00 позначає матрицю n×nn\times n, заповнену нулями, тому вся матриця MM є матрицею розміру nm×nmnm\times nm.

Сама по собі MM не є унітарною матрицею (за винятком тривіального випадку m=1m=1, де Π0=I\Pi_0 = \mathbb{I} і M=IM = \mathbb{I}), оскільки унітарні матриці не можуть мати стовпців (або рядків), що повністю складаються з нулів: стовпці унітарних матриць утворюють ортонормовані базиси, а нульовий вектор не є одиничним.

Проте перші nn стовпців матриці MM є ортонормованими — це випливає з того, що {Π0,,Πm1}\{\Pi_0,\ldots,\Pi_{m-1}\} є вимірюванням. Щоб підтвердити це, зауважимо, що для кожного j{0,,n1}j\in\{0,\ldots,n-1\} вектор, що утворює jj-й стовпець MM, має вигляд:

ψj=M0,j=k=0m1kΠkj.\vert \psi_j\rangle = M \vert 0, j\rangle = \sum_{k = 0}^{m-1} \vert k \rangle \otimes \Pi_k \vert j\rangle.

Зауважимо, що стовпці нумеруються починаючи з 0.0. Скалярний добуток ii-го стовпця та jj-го стовпця при i,j{0,,n1}i,j\in\{0,\ldots,n-1\} дорівнює

ψiψj=(k=0m1kΠki)(l=0m1lΠlj)=k=0m1l=0m1kliΠkΠlj=k=0m1iΠkΠkj=k=0m1iΠkj=iIj={1i=j0ij,\begin{aligned} \langle \psi_i \vert \psi_j \rangle & = \biggl(\sum_{k = 0}^{m-1} \vert k \rangle \otimes \Pi_k \vert i\rangle\biggr)^{\dagger} \biggl(\sum_{l = 0}^{m-1} \vert l \rangle \otimes \Pi_l \vert j\rangle\biggr) \\ & = \sum_{k = 0}^{m-1} \sum_{l = 0}^{m-1} \langle k \vert l \rangle \langle i \vert \Pi_k \Pi_l \vert j\rangle\\ & = \sum_{k = 0}^{m-1} \langle i \vert \Pi_k \Pi_k \vert j\rangle\\ & = \sum_{k = 0}^{m-1} \langle i \vert \Pi_k \vert j\rangle\\ & = \langle i \vert \mathbb{I} \vert j \rangle\\ & = \begin{cases} 1 & i = j\\ 0 & i\neq j, \end{cases} \end{aligned}

що і потрібно було показати.

Отже, оскільки перші nn стовпців матриці MM є ортонормованими, можна замінити всі решта нульових елементів на деякий вибір комплексних чисел так, щоб уся матриця стала унітарною.

U=(Π0??Π1??Πm1??)U = \begin{pmatrix} \Pi_0 & \fbox{?} & \cdots & \fbox{?}\\[1mm] \Pi_1 & \fbox{?} & \cdots & \fbox{?}\\[1mm] \vdots & \vdots & \ddots & \vdots\\[1mm] \Pi_{m-1} & \fbox{?} & \cdots & \fbox{?} \end{pmatrix}

Маючи матриці Π0,,Πm1,\Pi_0,\ldots,\Pi_{m-1}, можна обчислити відповідні матриці для заповнення блоків, позначених ?\fbox{?}, — за допомогою процесу Ґрама–Шмідта — але для цього обговорення не важливо, якими саме будуть ці матриці.

Тепер можна описати процес вимірювання: спочатку виконуємо UU над спільною системою (Y,X),(\mathsf{Y},\mathsf{X}), а потім вимірюємо Y\mathsf{Y} у стандартному базисі. Для довільного стану ϕ\vert \phi \rangle системи X\mathsf{X} отримуємо стан

U(0ϕ)=M(0ϕ)=k=0m1kΠkϕ,U \bigl( \vert 0\rangle \vert \phi\rangle\bigr) = M \bigl( \vert 0\rangle \vert \phi\rangle\bigr) = \sum_{k = 0}^{m-1} \vert k\rangle \otimes \Pi_k \vert\phi\rangle,

де перша рівність випливає з того, що UU і MM збігаються на перших nn стовпцях. Коли ми виконуємо вимірювання над Y\mathsf{Y} у стандартному базисі, кожен результат kk отримується з імовірністю

Πkϕ2,\bigl\| \Pi_k \vert \phi\rangle \bigr\|^2,

і в цьому разі стан (Y,X)(\mathsf{Y},\mathsf{X}) стає

kΠkϕΠkϕ.\vert k\rangle \otimes \frac{\Pi_k \vert \phi\rangle}{\bigl\| \Pi_k \vert \phi\rangle \bigr\|}.