Внутрішні добутки та проєкції

Щоб краще підготуватися до вивчення можливостей і обмежень квантових схем, ми розглянемо кілька додаткових математичних понять — а саме внутрішній добуток між векторами (і його зв'язок із Евклідовою нормою), поняття ортогональності та ортонормальності для наборів векторів, а також матриці проєкцій, що дадуть нам змогу ввести зручне узагальнення стандартних базисних вимірювань.

Внутрішні добутки

Пригадаємо, що коли ми використовуємо нотацію Дірака для позначення довільного стовпцевого вектора як кет, наприклад

\vert \psi \rangle = \begin{pmatrix} \alpha_1\\ \alpha_2\\ \vdots\\ \alpha_n \end{pmatrix},

то відповідний бра-вектор є спряженою транспонованою цього вектора:

\langle \psi \vert = \bigl(\vert \psi \rangle \bigr)^{\dagger} = \begin{pmatrix} \overline{\alpha_1} & \overline{\alpha_2} & \cdots & \overline{\alpha_n} \end{pmatrix}. \tag{1}

Або ж, якщо ми маємо на увазі деяку множину класичних станів $\Sigma$ і записуємо стовпцевий вектор у вигляді кет,

\vert \psi \rangle = \sum_{a\in\Sigma} \alpha_a \vert a \rangle,

то відповідний рядковий (або бра-) вектор є спряженою транспонованою

\langle \psi \vert = \sum_{a\in\Sigma} \overline{\alpha_a} \langle a \vert. \tag{2}

Добуток бра-вектора і кет-вектора, розглянутих як матриці, що мають відповідно один рядок або один стовпець, дає скаляр. Зокрема, якщо є два стовпцевих вектори

\vert \psi \rangle = \begin{pmatrix} \alpha_1\\ \alpha_2\\ \vdots\\ \alpha_n \end{pmatrix} \quad\text{та}\quad \vert \phi \rangle = \begin{pmatrix} \beta_1\\ \beta_2\\ \vdots\\ \beta_n \end{pmatrix},

так що рядковий вектор $\langle \psi \vert$ має вигляд, як у рівнянні $(1),$ то

\langle \psi \vert \phi \rangle = \langle \psi \vert \vert \phi \rangle = \begin{pmatrix} \overline{\alpha_1} & \overline{\alpha_2} & \cdots & \overline{\alpha_n} \end{pmatrix} \begin{pmatrix} \beta_1\\ \beta_2\\ \vdots\\ \beta_n \end{pmatrix} = \overline{\alpha_1} \beta_1 + \cdots + \overline{\alpha_n}\beta_n.

Або ж, якщо два стовпцевих вектори записані у вигляді

\vert \psi \rangle = \sum_{a\in\Sigma} \alpha_a \vert a \rangle \quad\text{та}\quad \vert \phi \rangle = \sum_{b\in\Sigma} \beta_b \vert b \rangle,

так що $\langle \psi \vert$ є рядковим вектором $(2),$ то

\begin{aligned} \langle \psi \vert \phi \rangle & = \langle \psi \vert \vert \phi \rangle\\ & = \Biggl(\sum_{a\in\Sigma} \overline{\alpha_a} \langle a \vert\Biggr) \Biggl(\sum_{b\in\Sigma} \beta_b \vert b\rangle\Biggr)\\ & = \sum_{a\in\Sigma}\sum_{b\in\Sigma} \overline{\alpha_a} \beta_b \langle a \vert b \rangle\\ & = \sum_{a\in\Sigma} \overline{\alpha_a} \beta_a, \end{aligned}

де остання рівність випливає зі спостереження, що $\langle a \vert a \rangle = 1$ і $\langle a \vert b \rangle = 0$ для класичних станів $a$ і $b$ , що задовольняють $a\neq b.$

Значення $\langle \psi \vert \phi \rangle$ називається внутрішнім добутком між векторами $\vert \psi\rangle$ та $\vert \phi \rangle.$ Внутрішні добутки відіграють критично важливу роль у квантовій інформації та обчисленнях; без них неможливо глибоко зрозуміти квантову інформацію на математичному рівні.

Зберемо тепер деякі базові факти про внутрішні добутки векторів.

Зв'язок із Евклідовою нормою. Внутрішній добуток будь-якого вектора
$\vert \psi \rangle = \sum_{a\in\Sigma} \alpha_a \vert a \rangle$
із самим собою дорівнює
$\langle \psi \vert \psi \rangle = \sum_{a\in\Sigma} \overline{\alpha_a} \alpha_a = \sum_{a\in\Sigma} \vert\alpha_a\vert^2 = \bigl\| \vert \psi \rangle \bigr\|^2.$
Отже, Евклідову норму вектора можна альтернативно виразити як
$\bigl\| \vert \psi \rangle \bigr\| = \sqrt{ \langle \psi \vert \psi \rangle }.$
Зауваж, що Евклідова норма вектора завжди є невід'ємним дійсним числом. Крім того, Евклідова норма вектора може дорівнювати нулю лише тоді, коли кожен із його елементів дорівнює нулю, тобто вектор є нульовим вектором.

Ці спостереження можна підсумувати так: для кожного вектора $\vert \psi \rangle$ виконується
$\langle \psi \vert \psi \rangle \geq 0,$
причому $\langle \psi \vert \psi \rangle = 0$ тоді і тільки тоді, коли $\vert \psi \rangle = 0.$ Цю властивість внутрішнього добутку іноді називають позитивною визначеністю.
Кон'югатна симетрія. Для будь-яких двох векторів
$\vert \psi \rangle = \sum_{a\in\Sigma} \alpha_a \vert a \rangle \quad\text{та}\quad \vert \phi \rangle = \sum_{b\in\Sigma} \beta_b \vert b \rangle,$
маємо
$\langle \psi \vert \phi \rangle = \sum_{a\in\Sigma} \overline{\alpha_a} \beta_a \quad\text{та}\quad \langle \phi \vert \psi \rangle = \sum_{a\in\Sigma} \overline{\beta_a} \alpha_a,$
а отже
$\overline{\langle \psi \vert \phi \rangle} = \langle \phi \vert \psi \rangle.$
Лінійність у другому аргументі (і кон'югатна лінійність у першому). Припустімо, що $\vert \psi \rangle,$ $\vert \phi_1 \rangle$ та $\vert \phi_2 \rangle$ — вектори, а $\alpha_1$ і $\alpha_2$ — комплексні числа. Якщо визначити новий вектор
$\vert \phi\rangle = \alpha_1 \vert \phi_1\rangle + \alpha_2 \vert \phi_2\rangle,$
то
$\langle \psi \vert \phi \rangle = \langle \psi \vert \bigl( \alpha_1\vert \phi_1 \rangle + \alpha_2\vert \phi_2 \rangle\bigr) = \alpha_1 \langle \psi \vert \phi_1 \rangle + \alpha_2 \langle \psi \vert \phi_2 \rangle.$
Тобто внутрішній добуток є лінійним у другому аргументі. Це можна перевірити або безпосередньо за наведеними формулами, або просто зауваживши, що множення матриць є лінійним за кожним аргументом (і зокрема за другим).

Поєднання цього факту з кон'югатною симетрією показує, що внутрішній добуток є кон'югатно лінійним у першому аргументі. Тобто якщо $\vert \psi_1 \rangle,$ $\vert \psi_2 \rangle$ та $\vert \phi \rangle$ — вектори, $\alpha_1$ і $\alpha_2$ — комплексні числа, і визначено
$\vert \psi \rangle = \alpha_1 \vert \psi_1\rangle + \alpha_2 \vert \psi_2 \rangle,$
то
$\langle \psi \vert \phi \rangle = \bigl( \overline{\alpha_1} \langle \psi_1 \vert + \overline{\alpha_2} \langle \psi_2 \vert \bigr) \vert\phi\rangle = \overline{\alpha_1} \langle \psi_1 \vert \phi \rangle + \overline{\alpha_2} \langle \psi_2 \vert \phi \rangle.$
Нерівність Коші–Шварца. Для кожного вибору векторів $\vert \phi \rangle$ та $\vert \psi \rangle$ з однаковою кількістю елементів виконується
$\bigl\vert \langle \psi \vert \phi \rangle\bigr| \leq \bigl\| \vert\psi \rangle \bigr\| \bigl\| \vert \phi \rangle \bigr\|.$
Це надзвичайно корисна нерівність, яка широко використовується у квантовій інформації (і в багатьох інших розділах математики та фізики).

Ортогональні та ортонормальні набори

Два вектори $\vert \phi \rangle$ та $\vert \psi \rangle$ називаються ортогональними, якщо їхній внутрішній добуток дорівнює нулю:

\langle \psi \vert \phi \rangle = 0.

Геометрично ортогональні вектори можна уявити як вектори, що утворюють прямий кут між собою.

Набір векторів $\{ \vert \psi_1\rangle,\ldots,\vert\psi_m\rangle\}$ називається ортогональним набором, якщо кожен вектор у ньому є ортогональним до будь-якого іншого вектора цього набору. Тобто набір є ортогональним, якщо

\langle \psi_j \vert \psi_k\rangle = 0

для всіх $j,k\in\{1,\ldots,m\}$ таких, що $j\neq k.$

Набір векторів $\{ \vert \psi_1\rangle,\ldots,\vert\psi_m\rangle\}$ називається ортонормальним, якщо він є ортогональним набором і, крім того, кожен вектор у ньому є одиничним вектором. Еквівалентно, цей набір є ортонормальним, якщо виконується

\langle \psi_j \vert \psi_k\rangle = \begin{cases} 1 & j = k\\[1mm] 0 & j\neq k \end{cases} \tag{3}

для всіх $j,k\in\{1,\ldots,m\}.$

Нарешті, набір $\{ \vert \psi_1\rangle,\ldots,\vert\psi_m\rangle\}$ є ортонормальним базисом, якщо він є ортонормальним набором і до того ж утворює базис. Це рівносильно тому, що $\{ \vert \psi_1\rangle,\ldots,\vert\psi_m\rangle\}$ є ортонормальним набором, а $m$ дорівнює розмірності простору, з якого беруться $\vert \psi_1\rangle,\ldots,\vert\psi_m\rangle.$

Наприклад, для будь-якої множини класичних станів $\Sigma$ набір усіх стандартних базисних векторів

\big\{ \vert a \rangle \,:\, a\in\Sigma\bigr\}

є ортонормальним базисом. Набір $\{\vert+\rangle,\vert-\rangle\}$ є ортонормальним базисом для $2$ -вимірного простору, що відповідає одному кубіту, а базис Белла $\{\vert\phi^+\rangle, \vert\phi^-\rangle, \vert\psi^+\rangle, \vert\psi^-\rangle\}$ є ортонормальним базисом для $4$ -вимірного простору двох кубітів.

Розширення ортонормальних наборів до ортонормальних базисів

Припустімо, що $\vert\psi_1\rangle,\ldots,\vert\psi_m\rangle$ — вектори з $n$ -вимірного простору, і при цьому $\{\vert\psi_1\rangle,\ldots,\vert\psi_m\rangle\}$ є ортонормальним набором. Ортонормальні набори завжди є лінійно незалежними, тому ці вектори обов'язково розкладають підпростір розмірності $m.$ Звідси випливає, що $m\leq n$ , оскільки розмірність підпростору, що породжується цими векторами, не може перевищувати розмірність усього простору, з якого вони беруться.

Якщо $m<n,$ то завжди можна вибрати додаткові $n-m$ векторів $\vert \psi_{m+1}\rangle,\ldots,\vert\psi_n\rangle$ так, щоб $\{\vert\psi_1\rangle,\ldots,\vert\psi_n\rangle\}$ утворювало ортонормальний базис. Для побудови таких векторів використовується процедура, відома як процес ортогоналізації Грама–Шмідта.

Ортонормальні набори та унітарні матриці

Ортонормальні набори векторів тісно пов'язані з унітарними матрицями. Один зі способів виразити цей зв'язок — сказати, що такі три твердження є логічно еквівалентними (тобто або всі вони істинні, або всі хибні) для будь-якої квадратної матриці $U$ :

Матриця $U$ є унітарною (тобто $U^{\dagger} U = \mathbb{I} = U U^{\dagger}$ ).
Рядки матриці $U$ утворюють ортонормальний набір.
Стовпці матриці $U$ утворюють ортонормальний набір.

Ця еквівалентність стає цілком очевидною, якщо поміркувати над тим, як працює множення матриць і спряжена транспонована. Припустімо, наприклад, що маємо матрицю $3\times 3$ :

U = \begin{pmatrix} \alpha_{1,1} & \alpha_{1,2} & \alpha_{1,3} \\[1mm] \alpha_{2,1} & \alpha_{2,2} & \alpha_{2,3} \\[1mm] \alpha_{3,1} & \alpha_{3,2} & \alpha_{3,3} \end{pmatrix}

Спряжена транспонована матриці $U$ має вигляд:

U^{\dagger} = \begin{pmatrix} \overline{\alpha_{1,1}} & \overline{\alpha_{2,1}} & \overline{\alpha_{3,1}} \\[1mm] \overline{\alpha_{1,2}} & \overline{\alpha_{2,2}} & \overline{\alpha_{3,2}} \\[1mm] \overline{\alpha_{1,3}} & \overline{\alpha_{2,3}} & \overline{\alpha_{3,3}} \end{pmatrix}

Перемноживши ці дві матриці, поставивши спряжену транспоновану ліворуч, отримаємо:

\begin{aligned} &\begin{pmatrix} \overline{\alpha_{1,1}} & \overline{\alpha_{2,1}} & \overline{\alpha_{3,1}} \\[1mm] \overline{\alpha_{1,2}} & \overline{\alpha_{2,2}} & \overline{\alpha_{3,2}} \\[1mm] \overline{\alpha_{1,3}} & \overline{\alpha_{2,3}} & \overline{\alpha_{3,3}} \end{pmatrix} \begin{pmatrix} \alpha_{1,1} & \alpha_{1,2} & \alpha_{1,3} \\[1mm] \alpha_{2,1} & \alpha_{2,2} & \alpha_{2,3} \\[1mm] \alpha_{3,1} & \alpha_{3,2} & \alpha_{3,3} \end{pmatrix}\\[4mm] \quad &= \begin{pmatrix} \overline{\alpha_{1,1}}\alpha_{1,1} + \overline{\alpha_{2,1}}\alpha_{2,1} + \overline{\alpha_{3,1}}\alpha_{3,1} & \overline{\alpha_{1,1}}\alpha_{1,2} + \overline{\alpha_{2,1}}\alpha_{2,2} + \overline{\alpha_{3,1}}\alpha_{3,2} & \overline{\alpha_{1,1}}\alpha_{1,3} + \overline{\alpha_{2,1}}\alpha_{2,3} + \overline{\alpha_{3,1}}\alpha_{3,3} \\[2mm] \overline{\alpha_{1,2}}\alpha_{1,1} + \overline{\alpha_{2,2}}\alpha_{2,1} + \overline{\alpha_{3,2}}\alpha_{3,1} & \overline{\alpha_{1,2}}\alpha_{1,2} + \overline{\alpha_{2,2}}\alpha_{2,2} + \overline{\alpha_{3,2}}\alpha_{3,2} & \overline{\alpha_{1,2}}\alpha_{1,3} + \overline{\alpha_{2,2}}\alpha_{2,3} + \overline{\alpha_{3,2}}\alpha_{3,3} \\[2mm] \overline{\alpha_{1,3}}\alpha_{1,1} + \overline{\alpha_{2,3}}\alpha_{2,1} + \overline{\alpha_{3,3}}\alpha_{3,1} & \overline{\alpha_{1,3}}\alpha_{1,2} + \overline{\alpha_{2,3}}\alpha_{2,2} + \overline{\alpha_{3,3}}\alpha_{3,2} & \overline{\alpha_{1,3}}\alpha_{1,3} + \overline{\alpha_{2,3}}\alpha_{2,3} + \overline{\alpha_{3,3}}\alpha_{3,3} \end{pmatrix} \end{aligned}

Якщо скласти три вектори зі стовпців матриці $U,$

\vert \psi_1\rangle = \begin{pmatrix} \alpha_{1,1}\\ \alpha_{2,1}\\ \alpha_{3,1} \end{pmatrix}, \quad \vert \psi_2\rangle = \begin{pmatrix} \alpha_{1,2}\\ \alpha_{2,2}\\ \alpha_{3,2} \end{pmatrix}, \quad \vert \psi_3\rangle = \begin{pmatrix} \alpha_{1,3}\\ \alpha_{2,3}\\ \alpha_{3,3} \end{pmatrix},

то добуток вище можна записати інакше:

U^{\dagger} U = \begin{pmatrix} \langle \psi_1\vert \psi_1 \rangle & \langle \psi_1\vert \psi_2 \rangle & \langle \psi_1\vert \psi_3 \rangle \\ \langle \psi_2\vert \psi_1 \rangle & \langle \psi_2\vert \psi_2 \rangle & \langle \psi_2\vert \psi_3 \rangle \\ \langle \psi_3\vert \psi_1 \rangle & \langle \psi_3\vert \psi_2 \rangle & \langle \psi_3\vert \psi_3 \rangle \end{pmatrix}

Посилаючись на рівняння $(3),$ бачимо тепер, що умова рівності цієї матриці одиничній еквівалентна ортонормальності набору $\{\vert\psi_1\rangle,\vert\psi_2\rangle,\vert\psi_3\rangle\}.$

Цей аргумент узагальнюється на унітарні матриці будь-якого розміру. Той факт, що рядки матриці утворюють ортонормальний базис тоді і тільки тоді, коли матриця є унітарною, випливає з того, що матриця є унітарною тоді і тільки тоді, коли її транспонована теж є унітарною.

З огляду на описану еквівалентність і той факт, що будь-який ортонормальний набір можна розширити до ортонормального базису, можна зробити такий корисний висновок: для будь-якого ортонормального набору векторів $\{\vert\psi_1\rangle,\ldots,\vert\psi_m\rangle\}$ з $n$ -вимірного простору існує унітарна матриця $U$ , перші $m$ стовпців якої є векторами $\vert\psi_1\rangle,\ldots,\vert\psi_m\rangle.$ Схематично ми завжди можемо знайти унітарну матрицю такого вигляду:

U = \left( \begin{array}{ccccccc} \rule{0.4pt}{10pt} & \rule{0.4pt}{10pt} & & \rule{0.4pt}{10pt} & \rule{0.4pt}{10pt} & & \rule{0.4pt}{10pt}\\ \vert\psi_1\rangle & \vert\psi_2\rangle & \cdots & \vert\psi_m\rangle & \vert\psi_{m+1}\rangle & \cdots & \vert\psi_n\rangle\\[2mm] \rule{0.4pt}{10pt} & \rule{0.4pt}{10pt} & & \rule{0.4pt}{10pt} & \rule{0.4pt}{10pt} & & \rule{0.4pt}{10pt} \end{array} \right).

Тут останні $n-m$ стовпців заповнюються будь-яким вибором векторів $\vert\psi_{m+1}\rangle,\ldots,\vert\psi_n\rangle$ , що роблять $\{\vert\psi_1\rangle,\ldots,\vert\psi_n\rangle\}$ ортонормальним базисом.

Проєкції та проєктивні вимірювання

Матриці проєкцій

Квадратна матриця $\Pi$ називається проєкцією, якщо вона задовольняє дві умови:

$\Pi = \Pi^{\dagger}.$
$\Pi^2 = \Pi.$

Матриці, що задовольняють першу умову — тобто рівні своїй спряженій транспонованій — називаються ермітовими матрицями, а матриці, що задовольняють другу умову — тобто залишаються незмінними при піднесенні до квадрата — називаються ідемпотентними матрицями.

Варто зауважити, що слово проєкція іноді вживається для позначення будь-якої матриці, що задовольняє лише другу умову, але не обов'язково першу; в такому разі для матриць, що задовольняють обидві умови, зазвичай використовують термін ортогональна проєкція. У контексті квантової інформації та обчислень, проте, терміни проєкція та матриця проєкції частіше стосуються матриць, що задовольняють обидві умови.

Прикладом проєкції є матриця

\Pi = \vert \psi \rangle \langle \psi \vert \tag{4}

для довільного одиничного вектора $\vert \psi\rangle.$ Переконаємося, що ця матриця є ермітовою:

\Pi^{\dagger} = \bigl( \vert \psi \rangle \langle \psi \vert \bigr)^{\dagger} = \bigl( \langle \psi \vert \bigr)^{\dagger}\bigl( \vert \psi \rangle \bigr)^{\dagger} = \vert \psi \rangle \langle \psi \vert = \Pi.

Тут для отримання другої рівності ми скористалися формулою

(A B)^{\dagger} = B^{\dagger} A^{\dagger},

яка є справедливою для будь-яких двох матриць $A$ і $B$ , для яких добуток $AB$ має сенс.

Щоб переконатися, що матриця $\Pi$ з $(4)$ є ідемпотентною, скористаємося тим, що $\vert\psi\rangle$ є одиничним вектором, тобто $\langle \psi \vert \psi\rangle = 1.$ Тоді маємо

\Pi^2 = \bigl( \vert\psi\rangle\langle \psi\vert \bigr)^2 = \vert\psi\rangle\langle \psi\vert\psi\rangle\langle\psi\vert = \vert\psi\rangle\langle\psi\vert = \Pi.

Більш загально, якщо $\{\vert \psi_1\rangle,\ldots,\vert \psi_m\rangle\}$ — довільна ортонормована множина векторів, то матриця

\Pi = \sum_{k = 1}^m \vert \psi_k\rangle \langle \psi_k \vert \tag{5}

є проєкцією. Зокрема, маємо

\begin{aligned} \Pi^{\dagger} &= \biggl(\sum_{k = 1}^m \vert \psi_k\rangle \langle \psi_k \vert\biggr)^{\dagger} \\ &= \sum_{k = 1}^m \bigl(\vert\psi_k\rangle\langle\psi_k\vert\bigr)^{\dagger} \\ &= \sum_{k = 1}^m \vert \psi_k\rangle \langle \psi_k \vert\\ &= \Pi, \end{aligned}

\begin{aligned} \Pi^2 & = \biggl( \sum_{j = 1}^m \vert \psi_j\rangle \langle \psi_j \vert\Bigr)\Bigl(\sum_{k = 1}^m \vert \psi_k\rangle \langle \psi_k \vert\biggr) \\ & = \sum_{j = 1}^m\sum_{k = 1}^m \vert \psi_j\rangle \langle \psi_j \vert \psi_k\rangle \langle \psi_k \vert \\ & = \sum_{k = 1}^m \vert \psi_k\rangle \langle \psi_k \vert\\ & = \Pi, \end{aligned}

де ортонормованість $\{\vert \psi_1\rangle,\ldots,\vert \psi_m\rangle\}$ забезпечує передостанню рівність.

Насправді цим вичерпуються всі можливості: будь-яку проєкцію $\Pi$ можна записати у вигляді $(5)$ для деякого вибору ортонормованої множини $\{\vert \psi_1\rangle,\ldots,\vert \psi_m\rangle\}.$ (Строго кажучи, нульова матриця $\Pi=0,$ яка теж є проєкцією, є окремим випадком. Щоб вписати її у загальну форму $(5)$ , треба допустити можливість порожньої суми, що дає нульову матрицю.)

Проєктивні вимірювання

Поняття вимірювання квантової системи є загальнішим, ніж просто вимірювання у стандартному базисі. Проєктивні вимірювання — це вимірювання, що описуються набором проєкцій, сума яких дорівнює одиничній матриці. У символах, набір $\{\Pi_0,\ldots,\Pi_{m-1}\}$ матриць проєкцій описує проєктивне вимірювання, якщо

\Pi_0 + \cdots + \Pi_{m-1} = \mathbb{I}.

Коли таке вимірювання виконується над системою $\mathsf{X}$ , що перебуває в стані $\vert\psi\rangle,$ відбуваються дві речі:

Для кожного $k\in\{0,\ldots,m-1\},$ результат вимірювання дорівнює $k$ з імовірністю
$\operatorname{Pr}\bigl(\text{outcome is $k$}\bigr) = \bigl\| \Pi_k \vert \psi \rangle \bigr\|^2.$
Для того результату $k$ , який отримало вимірювання, стан $\mathsf{X}$ стає
$\frac{\Pi_k \vert\psi\rangle}{\bigl\|\Pi_k \vert\psi\rangle\bigr\|}.$

За бажанням для проєктивних вимірювань можна також обирати результати, відмінні від $\{0,\ldots,m-1\}.$ Більш загально, для будь-якої скінченної та непорожньої множини $\Sigma,$ якщо маємо набір матриць проєкцій

\{\Pi_a:a\in\Sigma\}

що задовольняє умову

\sum_{a\in\Sigma} \Pi_a = \mathbb{I},

то цей набір описує проєктивне вимірювання, можливі результати якого збігаються з множиною $\Sigma,$ де правила ті самі, що й раніше:

Для кожного $a\in\Sigma,$ результат вимірювання дорівнює $a$ з імовірністю
$\operatorname{Pr}\bigl(\text{outcome is $a$}\bigr) = \bigl\| \Pi_a \vert \psi \rangle \bigr\|^2.$
Для того результату $a$ , який отримало вимірювання, стан $\mathsf{X}$ стає
$\frac{\Pi_a \vert\psi\rangle}{\bigl\|\Pi_a \vert\psi\rangle\bigr\|}.$

Наприклад, вимірювання у стандартному базисі є окремим випадком проєктивних вимірювань, де $\Sigma$ — множина класичних станів системи $\mathsf{X}$ , а набір матриць проєкцій — це $\{\vert a\rangle\langle a\vert:a\in\Sigma\}.$

Ще один приклад проєктивного вимірювання, цього разу над двома кубітами $(\mathsf{X},\mathsf{Y}),$ задається набором $\{\Pi_0,\Pi_1\},$ де

\Pi_0 = \vert \phi^+\rangle\langle \phi^+ \vert + \vert \phi^-\rangle\langle \phi^- \vert + \vert \psi^+\rangle\langle \psi^+ \vert \quad\text{and}\quad \Pi_1 = \vert\psi^-\rangle\langle\psi^-\vert.

Якщо маємо кілька систем, що разом перебувають у деякому квантовому стані, і проєктивне вимірювання виконується лише над однією з них, то дія аналогічна тому, що ми мали для вимірювань у стандартному базисі — і фактично тепер ми можемо описати цю дію значно простіше, ніж раніше.

Точніше, припустімо, що маємо дві системи $(\mathsf{X},\mathsf{Y})$ у квантовому стані $\vert\psi\rangle,$ і над системою $\mathsf{X}$ виконується проєктивне вимірювання, описане набором $\{\Pi_a : a\in\Sigma\},$ тоді як над $\mathsf{Y}$ нічого не робиться. Це еквівалентно виконанню проєктивного вимірювання, описаного набором

\bigl\{ \Pi_a \otimes \mathbb{I} \,:\, a\in\Sigma\bigr\}

над спільною системою $(\mathsf{X},\mathsf{Y}).$ Кожен результат вимірювання $a$ отримується з імовірністю

\bigl\| (\Pi_a \otimes \mathbb{I})\vert \psi\rangle \bigr\|^2,

і за умови появи результату $a$ стан спільної системи $(\mathsf{X},\mathsf{Y})$ стає

\frac{(\Pi_a \otimes \mathbb{I})\vert \psi\rangle}{\bigl\| (\Pi_a \otimes \mathbb{I})\vert \psi\rangle \bigr\|}.

Реалізація проєктивних вимірювань

Довільні проєктивні вимірювання можна реалізувати за допомогою унітарних операцій, вимірювань у стандартному базисі та додаткової робочої системи — це буде пояснено нижче.

Припустімо, що $\mathsf{X}$ — деяка система, а $\{\Pi_0,\ldots,\Pi_{m-1}\}$ — проєктивне вимірювання над $\mathsf{X}.$ Цей розгляд легко узагальнити на проєктивні вимірювання з різними множинами результатів, але для зручності та простоти вважатимемо, що множина можливих результатів нашого вимірювання — це $\{0,\ldots,m-1\}.$

Зауважимо явно, що $m$ не обов'язково дорівнює кількості класичних станів $\mathsf{X}$ — позначимо кількість класичних станів $\mathsf{X}$ через $n$ , тобто кожна матриця $\Pi_k$ є матрицею проєкції розміру $n\times n$ .

Оскільки ми припускаємо, що $\{\Pi_0\ldots,\Pi_{m-1}\}$ представляє проєктивне вимірювання, обов'язково виконується

\sum_{k = 0}^{m-1} \Pi_k = \mathbb{I}_n.

Наша мета — виконати процес, що має той самий ефект, що й це проєктивне вимірювання над $\mathsf{X},$ але використовуючи лише унітарні операції та вимірювання у стандартному базисі.

Для цього скористаємося додатковою робочою системою $\mathsf{Y}$ , і зокрема візьмемо множину класичних станів $\mathsf{Y}$ рівною $\{0,\ldots,m-1\}$ — такою ж, як і множина результатів проєктивного вимірювання. Ідея полягає в тому, що ми виконаємо вимірювання у стандартному базисі над $\mathsf{Y}$ і інтерпретуємо результат цього вимірювання як результат проєктивного вимірювання над $\mathsf{X}.$ Треба припустити, що $\mathsf{Y}$ ініціалізована у деякому фіксованому стані; виберемо $\vert 0\rangle.$ (Будь-який інший фіксований вектор квантового стану теж підійде, але вибір $\vert 0\rangle$ значно спрощує подальші пояснення.)

Зрозуміло, що щоб вимірювання $\mathsf{Y}$ у стандартному базисі давало нам інформацію про $\mathsf{X},$ потрібно, щоб $\mathsf{X}$ і $\mathsf{Y}$ якимось чином взаємодіяли перед вимірюванням $\mathsf{Y}$ — шляхом виконання унітарної операції над системою $(\mathsf{Y},\mathsf{X}).$ Розглянемо спочатку ось цю матрицю:

M = \sum_{k = 0}^{m-1} \vert k \rangle \langle 0 \vert \otimes \Pi_k.

У явному вигляді, як так звана блокова матриця — тобто матриця матриць, яку ми інтерпретуємо як одну більшу матрицю — $M$ виглядає так:

M = \begin{pmatrix} \Pi_0 & 0 & \cdots & 0\\[1mm] \Pi_1 & 0 & \cdots & 0\\[1mm] \vdots & \vdots & \ddots & \vdots\\[1mm] \Pi_{m-1} & 0 & \cdots & 0 \end{pmatrix}.

Тут кожен $0$ позначає матрицю $n\times n$ , заповнену нулями, тому вся матриця $M$ є матрицею розміру $nm\times nm$ .

Сама по собі $M$ не є унітарною матрицею (за винятком тривіального випадку $m=1$ , де $\Pi_0 = \mathbb{I}$ і $M = \mathbb{I}$ ), оскільки унітарні матриці не можуть мати стовпців (або рядків), що повністю складаються з нулів: стовпці унітарних матриць утворюють ортонормовані базиси, а нульовий вектор не є одиничним.

Проте перші $n$ стовпців матриці $M$ є ортонормованими — це випливає з того, що $\{\Pi_0,\ldots,\Pi_{m-1}\}$ є вимірюванням. Щоб підтвердити це, зауважимо, що для кожного $j\in\{0,\ldots,n-1\}$ вектор, що утворює $j$ -й стовпець $M$ , має вигляд:

\vert \psi_j\rangle = M \vert 0, j\rangle = \sum_{k = 0}^{m-1} \vert k \rangle \otimes \Pi_k \vert j\rangle.

Зауважимо, що стовпці нумеруються починаючи з $0.$ Скалярний добуток $i$ -го стовпця та $j$ -го стовпця при $i,j\in\{0,\ldots,n-1\}$ дорівнює

\begin{aligned} \langle \psi_i \vert \psi_j \rangle & = \biggl(\sum_{k = 0}^{m-1} \vert k \rangle \otimes \Pi_k \vert i\rangle\biggr)^{\dagger} \biggl(\sum_{l = 0}^{m-1} \vert l \rangle \otimes \Pi_l \vert j\rangle\biggr) \\ & = \sum_{k = 0}^{m-1} \sum_{l = 0}^{m-1} \langle k \vert l \rangle \langle i \vert \Pi_k \Pi_l \vert j\rangle\\ & = \sum_{k = 0}^{m-1} \langle i \vert \Pi_k \Pi_k \vert j\rangle\\ & = \sum_{k = 0}^{m-1} \langle i \vert \Pi_k \vert j\rangle\\ & = \langle i \vert \mathbb{I} \vert j \rangle\\ & = \begin{cases} 1 & i = j\\ 0 & i\neq j, \end{cases} \end{aligned}

що і потрібно було показати.

Отже, оскільки перші $n$ стовпців матриці $M$ є ортонормованими, можна замінити всі решта нульових елементів на деякий вибір комплексних чисел так, щоб уся матриця стала унітарною.

U = \begin{pmatrix} \Pi_0 & \fbox{?} & \cdots & \fbox{?}\\[1mm] \Pi_1 & \fbox{?} & \cdots & \fbox{?}\\[1mm] \vdots & \vdots & \ddots & \vdots\\[1mm] \Pi_{m-1} & \fbox{?} & \cdots & \fbox{?} \end{pmatrix}

Маючи матриці $\Pi_0,\ldots,\Pi_{m-1},$ можна обчислити відповідні матриці для заповнення блоків, позначених $\fbox{?}$ , — за допомогою процесу Ґрама–Шмідта — але для цього обговорення не важливо, якими саме будуть ці матриці.

Тепер можна описати процес вимірювання: спочатку виконуємо $U$ над спільною системою $(\mathsf{Y},\mathsf{X}),$ а потім вимірюємо $\mathsf{Y}$ у стандартному базисі. Для довільного стану $\vert \phi \rangle$ системи $\mathsf{X}$ отримуємо стан

U \bigl( \vert 0\rangle \vert \phi\rangle\bigr) = M \bigl( \vert 0\rangle \vert \phi\rangle\bigr) = \sum_{k = 0}^{m-1} \vert k\rangle \otimes \Pi_k \vert\phi\rangle,

де перша рівність випливає з того, що $U$ і $M$ збігаються на перших $n$ стовпцях. Коли ми виконуємо вимірювання над $\mathsf{Y}$ у стандартному базисі, кожен результат $k$ отримується з імовірністю

\bigl\| \Pi_k \vert \phi\rangle \bigr\|^2,

і в цьому разі стан $(\mathsf{Y},\mathsf{X})$ стає

\vert k\rangle \otimes \frac{\Pi_k \vert \phi\rangle}{\bigl\| \Pi_k \vert \phi\rangle \bigr\|}.