Класична інформація

Як і в попередньому уроці, ми розпочнемо цей урок з обговорення класичної інформації. Знову ж таки, імовірнісний і квантовий описи математично схожі, і розуміння того, як математика працює у звичному контексті класичної інформації, допомагає зрозуміти, чому квантова інформація описується саме так.

Класичні стани через декартовий добуток

Почнемо з найбільш базового рівня — класичних станів кількох систем. Для простоти спочатку розглянемо лише дві системи, а потім узагальнимо на більшу кількість.

Точніше кажучи, нехай $\mathsf{X}$ — система, множина класичних станів якої є $\Sigma,$ а $\mathsf{Y}$ — друга система, множина класичних станів якої є $\Gamma.$ Зауважимо, що, оскільки ми назвали ці множини множинами класичних станів, наше припущення полягає в тому, що $\Sigma$ і $\Gamma$ є скінченними та непорожніми. Може бути, що $\Sigma = \Gamma,$ але це не обов'язково — і незалежно від цього, для зручності корисно використовувати різні назви для цих множин.

Тепер уяви, що дві системи, $\mathsf{X}$ і $\mathsf{Y},$ розташовані поруч, причому $\mathsf{X}$ — ліворуч, а $\mathsf{Y}$ — праворуч. За бажанням можна розглядати ці дві системи як одну систему, яку позначимо $(\mathsf{X},\mathsf{Y})$ або $\mathsf{XY}$ залежно від уподобань. Природне питання щодо цієї складеної системи $(\mathsf{X},\mathsf{Y})$ : «Які її класичні стани?»

Відповідь така: множина класичних станів $(\mathsf{X},\mathsf{Y})$ — це декартовий добуток $\Sigma$ і $\Gamma,$ який визначається як

\Sigma\times\Gamma = \bigl\{(a,b)\,:\,a\in\Sigma\;\text{і}\;b\in\Gamma\bigr\}.

Простими словами, декартовий добуток — це саме та математична конструкція, яка відображає ідею розгляду елемента однієї множини та елемента іншої множини разом, ніби вони утворюють один елемент однієї множини. У нашому випадку сказати, що $(\mathsf{X},\mathsf{Y})$ перебуває у класичному стані $(a,b)\in\Sigma\times\Gamma,$ означає, що $\mathsf{X}$ перебуває у класичному стані $a\in\Sigma,$ а $\mathsf{Y}$ — у класичному стані $b\in\Gamma;$ і якщо класичний стан $\mathsf{X}$ дорівнює $a\in\Sigma,$ а класичний стан $\mathsf{Y}$ дорівнює $b\in\Gamma,$ то класичний стан спільної системи $(\mathsf{X},\mathsf{Y})$ дорівнює $(a,b).$

Для більш ніж двох систем ситуація узагальнюється природним чином. Якщо $\mathsf{X}_1,\ldots,\mathsf{X}_n$ — системи з множинами класичних станів $\Sigma_1,\ldots,\Sigma_n$ відповідно, для будь-якого натурального числа $n,$ множина класичних станів $n$ -кортежу $(\mathsf{X}_1,\ldots,\mathsf{X}_n),$ розглянутого як єдина спільна система, — це декартовий добуток

\Sigma_1\times\cdots\times\Sigma_n = \bigl\{(a_1,\ldots,a_n)\,:\, a_1\in\Sigma_1,\:\ldots,\:a_n\in\Sigma_n\bigr\}.

Звичайно, ми вільні називати системи як завгодно і розташовувати їх у будь-якому порядку. Зокрема, маючи $n$ систем, як вище, ми можемо назвати їх $\mathsf{X}_{0},\ldots,\mathsf{X}_{n-1}$ і розташувати справа наліво, так що спільна система матиме вигляд $(\mathsf{X}_{n-1},\ldots,\mathsf{X}_0).$ Дотримуючись того самого шаблону іменування для відповідних класичних станів і їхніх множин, ми тоді можемо посилатися на класичний стан

(a_{n-1},\ldots,a_0) \in \Sigma_{n-1}\times \cdots \times \Sigma_0

цієї складеної системи. Саме таку угоду про порядок використовує Qiskit при іменуванні кількох кубітів. Ми повернемося до цієї угоди та її зв'язку з квантовими схемами в наступному уроці, але почнемо використовувати її вже зараз, щоб звикнути до неї.

Зручно записувати класичний стан вигляду $(a_{n-1},\ldots,a_0)$ як рядок $a_{n-1}\cdots a_0$ для стислості, особливо в типовій ситуації, коли множини класичних станів $\Sigma_0,\ldots,\Sigma_{n-1}$ пов'язані з наборами символів або знаків. У цьому контексті термін алфавіт зазвичай застосовується до наборів символів, що утворюють рядки, але математичне визначення алфавіту збігається з визначенням множини класичних станів: це скінченна та непорожня множина.

Наприклад, припустимо, що $\mathsf{X}_0,\ldots,\mathsf{X}_9$ — біти, тоді множини класичних станів цих систем однакові.

\Sigma_0 = \Sigma_1 = \cdots = \Sigma_9 = \{0,1\}

Тоді спільна система $(\mathsf{X}_9,\ldots,\mathsf{X}_0)$ має $2^{10} = 1024$ класичних стани, що є елементами множини

\Sigma_9\times\Sigma_8\times\cdots\times\Sigma_0 = \{0,1\}^{10}.

У вигляді рядків ці класичні стани виглядають так:

\begin{array}{c} 0000000000\\ 0000000001\\ 0000000010\\ 0000000011\\ 0000000100\\ \vdots\\[1mm] 1111111111 \end{array}

Для класичного стану $0000000110,$ наприклад, бачимо, що $\mathsf{X}_1$ і $\mathsf{X}_2$ перебувають у стані $1,$ тоді як усі інші системи — у стані $0.$

Імовірнісні стани

Пригадай з попереднього уроку, що імовірнісний стан пов'язує ймовірність із кожним класичним станом системи. Таким чином, імовірнісний стан кількох систем — розглянутих разом як одна система — пов'язує ймовірність із кожним елементом декартового добутку множин класичних станів окремих систем.

Наприклад, нехай $\mathsf{X}$ і $\mathsf{Y}$ — обидва біти, тобто їхні множини класичних станів: $\Sigma = \{0,1\}$ і $\Gamma = \{0,1\}$ відповідно. Ось імовірнісний стан пари $(\mathsf{X},\mathsf{Y}):$

\begin{aligned} \operatorname{Pr}\bigl( (\mathsf{X},\mathsf{Y}) = (0,0)\bigr) & = 1/2 \\[2mm] \operatorname{Pr}\bigl( (\mathsf{X},\mathsf{Y}) = (0,1)\bigr) & = 0\\[2mm] \operatorname{Pr}\bigl( (\mathsf{X},\mathsf{Y}) = (1,0)\bigr) & = 0\\[2mm] \operatorname{Pr}\bigl( (\mathsf{X},\mathsf{Y}) = (1,1)\bigr) & = 1/2 \end{aligned}

Цей імовірнісний стан такий, що обидва $\mathsf{X}$ і $\mathsf{Y}$ є випадковими бітами — кожен дорівнює $0$ з імовірністю $1/2$ та $1$ з імовірністю $1/2$ — але класичні стани двох бітів завжди збігаються. Це приклад кореляції між цими системами.

Упорядкування множин станів декартового добутку

Імовірнісні стани систем можна представляти векторами ймовірностей, як обговорювалося в попередньому уроці. Зокрема, елементи вектора представляють ймовірності того, що система перебуває у відповідних класичних станах, і передбачається, що вибрано відповідність між елементами та множиною класичних станів.

Вибір такої відповідності фактично означає вибір порядку класичних станів, який часто є природним або визначається стандартною угодою. Наприклад, двійковий алфавіт $\{0,1\}$ природно впорядкований: спочатку $0,$ потім $1,$ тому перший елемент вектора ймовірностей, що описує імовірнісний стан біта, — це ймовірність перебування у стані $0,$ а другий — у стані $1.$

У контексті кількох систем нічого не змінюється, але є одне рішення, яке треба прийняти. Множина класичних станів кількох систем разом, розглянутих як одна система, — це декартовий добуток множин класичних станів окремих систем, тому треба вирішити, як упорядковувати елементи декартових добутків.

Існує проста угода, якої ми дотримуємося: беремо вже наявні порядки для окремих множин класичних станів і впорядковуємо елементи декартового добутку за алфавітом. Інакше кажучи, елементи кожного $n$ -кортежу (або, еквівалентно, символи кожного рядка) розглядаються так, ніби їхня значущість зменшується зліва направо. Наприклад, згідно з цією угодою, декартовий добуток $\{1,2,3\}\times\{0,1\}$ упорядковано так:

(1,0),\; (1,1),\; (2,0),\; (2,1),\; (3,0),\; (3,1).

Коли $n$ -кортежі записуються у вигляді рядків і впорядковуються таким чином, ми спостерігаємо знайомі шаблони: наприклад, $\{0,1\}\times\{0,1\}$ упорядковано як $00, 01, 10, 11,$ а множина $\{0,1\}^{10}$ упорядкована так, як було написано раніше в уроці. Як іще один приклад, розглядаючи множину $\{0, 1, \dots, 9\} \times \{0, 1, \dots, 9\}$ як множину рядків, отримуємо двозначні числа від $00$ до $99,$ упорядковані чисельно. Це, очевидно, не випадковість; наша десяткова система числення використовує саме такий алфавітний порядок, де слово алфавітний слід розуміти широко: воно включає цифри разом із літерами.

Повертаючись до прикладу двох бітів, наведений вище імовірнісний стан представляється таким вектором ймовірностей, де елементи позначено для ясності.

\begin{pmatrix} \frac{1}{2}\\[1mm] 0\\[1mm] 0\\[1mm] \frac{1}{2} \end{pmatrix} \begin{array}{l} \leftarrow \text{ймовірність перебування у стані 00}\\[1mm] \leftarrow \text{ймовірність перебування у стані 01}\\[1mm] \leftarrow \text{ймовірність перебування у стані 10}\\[1mm] \leftarrow \text{ймовірність перебування у стані 11} \end{array} \tag{1}

Незалежність двох систем

Особливий тип імовірнісного стану двох систем — це стан, у якому системи є незалежними. Інтуїтивно кажучи, дві системи є незалежними, якщо знання класичного стану будь-якої з систем жодним чином не впливає на ймовірності, пов'язані з іншою. Тобто знання класичного стану однієї системи не дає жодної інформації про класичний стан іншої.

Щоб визначити це поняття точно, припустимо знову, що $\mathsf{X}$ і $\mathsf{Y}$ — системи з множинами класичних станів $\Sigma$ і $\Gamma$ відповідно. Щодо певного імовірнісного стану цих систем, вони називаються незалежними, якщо виконується умова

\operatorname{Pr}((\mathsf{X},\mathsf{Y}) = (a,b)) = \operatorname{Pr}(\mathsf{X} = a) \operatorname{Pr}(\mathsf{Y} = b) \tag{2}

для будь-якого вибору $a\in\Sigma$ і $b\in\Gamma.$

Щоб виразити цю умову через вектори ймовірностей, припустимо, що заданий імовірнісний стан $(\mathsf{X},\mathsf{Y})$ описується вектором ймовірностей, записаним у нотації Дірака як

\sum_{(a,b) \in \Sigma\times\Gamma} p_{ab} \vert a b\rangle.

Умова $(2)$ для незалежності еквівалентна існуванню двох векторів ймовірностей

\vert \phi \rangle = \sum_{a\in\Sigma} q_a \vert a \rangle \quad\text{і}\quad \vert \psi \rangle = \sum_{b\in\Gamma} r_b \vert b \rangle, \tag{3}

що описують ймовірності, пов'язані з класичними станами $\mathsf{X}$ і $\mathsf{Y}$ відповідно, такі що

p_{ab} = q_a r_b \tag{4}

для всіх $a\in\Sigma$ і $b\in\Gamma.$

Наприклад, імовірнісний стан пари бітів $(\mathsf{X},\mathsf{Y}),$ представлений вектором

\frac{1}{6} \vert 00 \rangle + \frac{1}{12} \vert 01 \rangle + \frac{1}{2} \vert 10 \rangle + \frac{1}{4} \vert 11 \rangle

є таким, у якому $\mathsf{X}$ і $\mathsf{Y}$ є незалежними. Зокрема, умова незалежності виконується для векторів ймовірностей

\vert \phi \rangle = \frac{1}{4} \vert 0 \rangle + \frac{3}{4} \vert 1 \rangle \quad\text{і}\quad \vert \psi \rangle = \frac{2}{3} \vert 0 \rangle + \frac{1}{3} \vert 1 \rangle.

Наприклад, щоб ймовірності стану $00$ збіглися, потрібно $\frac{1}{6} = \frac{1}{4} \times \frac{2}{3},$ що і є справедливим. Інші елементи можна перевірити аналогічно.

З іншого боку, імовірнісний стан $(1),$ який можна записати як

\frac{1}{2} \vert 00 \rangle + \frac{1}{2} \vert 11 \rangle, \tag{5}

не представляє незалежності між системами $\mathsf{X}$ і $\mathsf{Y}.$ Є простий спосіб довести це.

Припустимо, що існують вектори ймовірностей $\vert \phi\rangle$ і $\vert \psi \rangle,$ як у рівнянні $(3)$ вище, для яких умова $(4)$ виконується для будь-якого вибору $a$ і $b.$ Тоді обов'язково

q_0 r_1 = \operatorname{Pr}\bigl((\mathsf{X},\mathsf{Y}) = (0,1)\bigr) = 0.

Це означає, що або $q_0 = 0,$ або $r_1 = 0,$ бо якби обидва були ненульовими, добуток $q_0 r_1$ також був би ненульовим. Звідси випливає, що або $q_0 r_0 = 0$ (якщо $q_0 = 0$ ), або $q_1 r_1 = 0$ (якщо $r_1 = 0$ ). Однак жодна з цих рівностей не може бути справедливою, оскільки маємо $q_0 r_0 = 1/2$ і $q_1 r_1 = 1/2.$ Отже, не існує векторів $\vert\phi\rangle$ і $\vert\psi\rangle,$ що задовольняють властивість, необхідну для незалежності.

Визначивши незалежність двох систем, можемо тепер визначити, що означає кореляція: це відсутність незалежності. Наприклад, оскільки два біти в імовірнісному стані, представленому вектором $(5),$ не є незалежними, вони, за визначенням, скорельовані.

Тензорні добутки векторів

Умову незалежності, описану вище, можна стисло виразити через поняття тензорного добутку. Хоча тензорні добутки — дуже загальне поняття, яке можна визначити досить абстрактно і застосовувати до різних математичних структур, у нашому випадку можна дати просте та конкретне визначення.

Для двох векторів

\vert \phi \rangle = \sum_{a\in\Sigma} \alpha_a \vert a \rangle \quad\text{і}\quad \vert \psi \rangle = \sum_{b\in\Gamma} \beta_b \vert b \rangle

тензорний добуток $\vert \phi \rangle \otimes \vert \psi \rangle$ — це вектор, визначений як

\vert \phi \rangle \otimes \vert \psi \rangle = \sum_{(a,b)\in\Sigma\times\Gamma} \alpha_a \beta_b \vert ab\rangle.

Елементи цього нового вектора відповідають елементам декартового добутку $\Sigma\times\Gamma,$ записаним як рядки у попередньому рівнянні. Еквівалентно, вектор $\vert \pi \rangle = \vert \phi \rangle \otimes \vert \psi \rangle$ визначається умовою

\langle ab \vert \pi \rangle = \langle a \vert \phi \rangle \langle b \vert \psi \rangle

яка справедлива для кожного $a\in\Sigma$ і $b\in\Gamma.$

Тепер можна переформулювати умову незалежності: для спільної системи $(\mathsf{X}, \mathsf{Y})$ в імовірнісному стані, представленому вектором ймовірностей $\vert \pi \rangle,$ системи $\mathsf{X}$ і $\mathsf{Y}$ є незалежними, якщо $\vert\pi\rangle$ отримується як тензорний добуток

\vert \pi \rangle = \vert \phi \rangle \otimes \vert \psi \rangle

векторів ймовірностей $\vert \phi \rangle$ і $\vert \psi \rangle$ на кожній із підсистем $\mathsf{X}$ і $\mathsf{Y}.$ У цьому випадку $\vert \pi \rangle$ називається добутковим станом або добутковим вектором.

Символ $\otimes$ при тензорному добутку кетів часто опускається — пишуть $\vert \phi \rangle \vert \psi \rangle$ замість $\vert \phi \rangle \otimes \vert \psi \rangle.$ Ця угода відображає ідею, що тензорний добуток у даному контексті є найбільш природним або стандартним способом множення двох векторів. Рідше використовується запис $\vert \phi\otimes\psi\rangle.$

Використовуючи алфавітну угоду для впорядкування елементів декартових добутків, отримуємо таке явне зображення тензорного добутку двох стовпчикових векторів:

\begin{pmatrix} \alpha_1\\ \vdots\\ \alpha_m \end{pmatrix} \otimes \begin{pmatrix} \beta_1\\ \vdots\\ \beta_k \end{pmatrix} = \begin{pmatrix} \alpha_1 \beta_1\\ \vdots\\ \alpha_1 \beta_k\\ \alpha_2 \beta_1\\ \vdots\\ \alpha_2 \beta_k\\ \vdots\\ \alpha_m \beta_1\\ \vdots\\ \alpha_m \beta_k \end{pmatrix}

Важливе зауваження: зверни увагу на таке вираження для тензорних добутків стандартних базисних векторів:

\vert a \rangle \otimes \vert b \rangle = \vert ab \rangle.

Можна також записати $(a,b)$ як впорядковану пару, а не рядок, тоді отримаємо $\vert a \rangle \otimes \vert b \rangle = \vert (a,b) \rangle.$ Однак частіше дужки опускають, записуючи $\vert a \rangle \otimes \vert b \rangle = \vert a,b \rangle.$ Це типово для математики в цілому: дужки, які не додають ясності й не усувають неоднозначності, зазвичай просто опускають.

Тензорний добуток двох векторів має важливу властивість білінійності, тобто він лінійний по кожному з двох аргументів окремо, якщо інший аргумент фіксований. Ця властивість виражається такими рівняннями:

1. Лінійність по першому аргументу:

\begin{aligned} \bigl(\vert\phi_1\rangle + \vert\phi_2\rangle\bigr)\otimes \vert\psi\rangle & = \vert\phi_1\rangle \otimes \vert\psi\rangle + \vert\phi_2\rangle \otimes \vert\psi\rangle \\[1mm] \bigl(\alpha \vert \phi \rangle\bigr) \otimes \vert \psi \rangle & = \alpha \bigl(\vert \phi \rangle \otimes \vert \psi \rangle \bigr) \end{aligned}

2. Лінійність по другому аргументу:

\begin{aligned} \vert \phi \rangle \otimes \bigl(\vert \psi_1 \rangle + \vert \psi_2 \rangle \bigr) & = \vert \phi \rangle \otimes \vert \psi_1 \rangle + \vert \phi \rangle \otimes \vert \psi_2 \rangle\\[1mm] \vert \phi \rangle \otimes \bigl(\alpha \vert \psi \rangle \bigr) & = \alpha \bigl(\vert\phi\rangle\otimes\vert\psi\rangle\bigr) \end{aligned}

Розглядаючи другі рівняння в кожній парі, бачимо, що скаляри «вільно переміщуються» всередині тензорних добутків:

\bigl(\alpha \vert \phi \rangle\bigr) \otimes \vert \psi \rangle = \vert \phi \rangle \otimes \bigl(\alpha \vert \psi \rangle \bigr) = \alpha \bigl(\vert \phi \rangle \otimes \vert \psi \rangle \bigr).

Тому немає жодної неоднозначності у записі $\alpha\vert\phi\rangle\otimes\vert\psi\rangle,$ або альтернативно $\alpha\vert\phi\rangle\vert\psi \rangle$ чи $\alpha\vert\phi\otimes\psi\rangle,$ для позначення цього вектора.

Незалежність і тензорні добутки для трьох і більше систем

Поняття незалежності та тензорних добутків природно узагальнюються на три і більше систем. Якщо $\mathsf{X}_0,\ldots,\mathsf{X}_{n-1}$ — системи з множинами класичних станів $\Sigma_0,\ldots,\Sigma_{n-1}$ відповідно, то імовірнісний стан комбінованої системи $(\mathsf{X}_{n-1},\ldots,\mathsf{X}_0)$ є добутковим станом, якщо відповідний вектор ймовірностей має вигляд

\vert \psi \rangle = \vert \phi_{n-1} \rangle \otimes \cdots \otimes \vert \phi_0 \rangle

для векторів ймовірностей $\vert \phi_0 \rangle,\ldots,\vert \phi_{n-1}\rangle,$ що описують імовірнісні стани $\mathsf{X}_0,\ldots,\mathsf{X}_{n-1}.$ Тут визначення тензорного добутку узагальнюється природним чином: вектор

\vert \psi \rangle = \vert \phi_{n-1} \rangle \otimes \cdots \otimes \vert \phi_0 \rangle

визначається умовою

\langle a_{n-1} \cdots a_0 \vert \psi \rangle = \langle a_{n-1} \vert \phi_{n-1} \rangle \cdots \langle a_0 \vert \phi_0 \rangle

яка справедлива для кожного $a_0\in\Sigma_0, \ldots a_{n-1}\in\Sigma_{n-1}.$

Інший, але еквівалентний спосіб визначити тензорний добуток трьох і більше векторів — рекурсивно через тензорні добутки двох векторів:

\vert \phi_{n-1} \rangle \otimes \cdots \otimes \vert \phi_0 \rangle = \vert \phi_{n-1} \rangle \otimes \bigl( \vert \phi_{n-2} \rangle \otimes \cdots \otimes \vert \phi_0 \rangle \bigr).

Аналогічно до тензорного добутку лише двох векторів, тензорний добуток трьох і більше векторів є лінійним по кожному аргументу окремо, якщо всі інші аргументи фіксовані. У цьому випадку кажуть, що тензорний добуток трьох і більше векторів є мультилінійним.

Як і у випадку двох систем, ми могли б сказати, що системи $\mathsf{X}_0,\ldots,\mathsf{X}_{n-1}$ є незалежними, коли вони перебувають у добутковому стані, але термін взаємно незалежні є точнішим. Існують й інші поняття незалежності для трьох і більше систем, наприклад попарна незалежність, які є цікавими та важливими — але не в контексті цього курсу.

Узагальнюючи попереднє спостереження щодо тензорних добутків стандартних базисних векторів, для будь-якого натурального числа $n$ і будь-яких класичних станів $a_0,\ldots,a_{n-1}$ маємо

\vert a_{n-1} \rangle \otimes \cdots \otimes \vert a_0 \rangle = \vert a_{n-1} \cdots a_0 \rangle.

Вимірювання імовірнісних станів

Тепер перейдемо до вимірювань імовірнісних станів кількох систем. Якщо розглядати кілька систем разом як одну систему, ми одразу отримуємо специфікацію того, як мають працювати вимірювання для кількох систем — за умови, що вимірюються усі системи.

Наприклад, якщо імовірнісний стан двох бітів $(\mathsf{X},\mathsf{Y})$ описується вектором імовірності

\frac{1}{2} \vert 00 \rangle + \frac{1}{2} \vert 11 \rangle,

то результат $00$ — тобто $0$ при вимірюванні $\mathsf{X}$ і $0$ при вимірюванні $\mathsf{Y}$ — отримується з імовірністю $1/2$ , і результат $11$ також отримується з імовірністю $1/2.$ У кожному випадку ми оновлюємо опис нашого знання у вигляді вектора імовірності відповідним чином, так що імовірнісний стан стає $|00\rangle$ або $|11\rangle$ відповідно.

Однак ми могли б обрати вимірювання не кожної системи, а лише деяких із них. Це призведе до отримання результату вимірювання для кожної виміряної системи, а також (загалом) вплине на наші знання про решту систем, які ми не вимірювали.

Щоб пояснити, як це працює, зосередимося на випадку двох систем, одна з яких вимірюється. Більш загальна ситуація — коли вимірюється певна власна підмножина з трьох і більше систем — фактично зводиться до випадку двох систем, якщо розглядати виміряні системи спільно як одну систему, а невиміряні — як другу систему.

Точніше, припустимо, що $\mathsf{X}$ і $\mathsf{Y}$ — це системи, класичні множини станів яких — $\Sigma$ і $\Gamma$ відповідно, і що обидві системи разом перебувають у деякому імовірнісному стані. Розглянемо, що відбувається, коли ми вимірюємо лише $\mathsf{X}$ і нічого не робимо з $\mathsf{Y}.$ Ситуація, коли вимірюється лише $\mathsf{Y}$ і нічого не відбувається з $\mathsf{X},$ розглядається симетрично.

По-перше, ми знаємо, що імовірність спостерігати конкретний класичний стан $a\in\Sigma$ при вимірюванні лише $\mathsf{X}$ має бути узгодженою з імовірностями, які ми отримали б, якби $\mathsf{Y}$ також вимірювалась. Тобто маємо виконуватися

\operatorname{Pr}(\mathsf{X} = a) = \sum_{b\in\Gamma} \operatorname{Pr}\bigl( (\mathsf{X},\mathsf{Y}) = (a,b) \bigr).

Це формула так званого зведеного (або маргінального) імовірнісного стану $\mathsf{X}$ окремо.

Ця формула цілком зрозуміла на інтуїтивному рівні: щось дуже дивне мало б статися, щоб вона виявилася хибною. Якби вона була хибною, це означало б, що вимірювання $\mathsf{Y}$ якимось чином може впливати на імовірності різних результатів вимірювання $\mathsf{X},$ незалежно від фактичного результату вимірювання $\mathsf{Y}.$ Якби $\mathsf{Y}$ перебувала у далекому місці — наприклад, десь в іншій галактиці — це дозволяло б передавати сигнали швидше за світло, що ми відкидаємо на підставі нашого розуміння фізики. Інший спосіб зрозуміти це випливає з інтерпретації імовірності як міри переконаності. Сам лише факт того, що хтось інший може вирішити подивитися на $\mathsf{Y},$ не може змінити класичний стан $\mathsf{X},$ тому без жодної інформації про те, що вони зробили чи не зробили або побачили, наші переконання щодо стану $\mathsf{X}$ не повинні змінюватись у результаті.

Тепер, враховуючи, що вимірюється лише $\mathsf{X}$ , а $\mathsf{Y}$ — ні, може все одно існувати невизначеність щодо класичного стану $\mathsf{Y}.$ З цієї причини, замість оновлення нашого опису імовірнісного стану $(\mathsf{X},\mathsf{Y})$ до $\vert ab\rangle$ для деякого вибору $a\in\Sigma$ і $b\in\Gamma,$ ми маємо оновити наш опис так, щоб ця невизначеність щодо $\mathsf{Y}$ була належним чином відображена.

Наступна формула умовної імовірності відображає цю невизначеність.

\operatorname{Pr}(\mathsf{Y} = b \,\vert\, \mathsf{X} = a) = \frac{ \operatorname{Pr}\bigl((\mathsf{X},\mathsf{Y}) = (a,b)\bigr) }{ \operatorname{Pr}(\mathsf{X} = a) }

Тут вираз $\operatorname{Pr}(\mathsf{Y} = b \,\vert\, \mathsf{X} = a)$ позначає імовірність того, що $\mathsf{Y} = b$ за умови (або якщо відомо, що) $\mathsf{X} = a.$ Технічно, цей вираз має сенс лише якщо $\operatorname{Pr}(\mathsf{X}=a)$ відмінне від нуля, адже якщо $\operatorname{Pr}(\mathsf{X}=a) = 0,$ ми ділимо на нуль і отримуємо невизначену форму $\frac{0}{0}.$ Проте це не є проблемою, оскільки якщо імовірність, пов'язана з $a$ , дорівнює нулю, то ми ніколи не отримаємо $a$ як результат вимірювання $\mathsf{X},$ тож нам не потрібно перейматися цією можливістю.

Щоб виразити ці формули через вектори імовірності, розглянемо вектор імовірності $\vert \pi \rangle$ , що описує спільний імовірнісний стан $(\mathsf{X},\mathsf{Y}).$

\vert\pi\rangle = \sum_{(a,b)\in\Sigma\times\Gamma} p_{ab} \vert ab\rangle

Вимірювання лише $\mathsf{X}$ дає кожен можливий результат $a\in\Sigma$ з імовірністю

\operatorname{Pr}(\mathsf{X} = a) = \sum_{c\in\Gamma} p_{ac}.

Вектор, що представляє імовірнісний стан лише $\mathsf{X},$ тому задається як

\sum_{a\in\Sigma} \biggl(\sum_{c\in\Gamma} p_{ac}\biggr) \vert a\rangle.

Після отримання конкретного результату $a\in\Sigma$ вимірювання $\mathsf{X},$ імовірнісний стан $\mathsf{Y}$ оновлюється згідно з формулою умовних імовірностей, так що він представляється таким вектором імовірності:

\vert \psi_a \rangle = \frac{\sum_{b\in\Gamma}p_{ab}\vert b\rangle}{\sum_{c\in\Gamma} p_{ac}}.

У разі, якщо вимірювання $\mathsf{X}$ дало класичний стан $a$ , ми оновлюємо наш опис імовірнісного стану спільної системи $(\mathsf{X},\mathsf{Y})$ до $\vert a\rangle \otimes \vert\psi_a\rangle.$

Один зі способів осмислити це визначення $\vert\psi_a\rangle$ — розглядати його як нормування вектора $\sum_{b\in\Gamma} p_{ab} \vert b\rangle$ , де ми ділимо на суму елементів цього вектора, щоб отримати вектор імовірності. Це нормування фактично враховує обумовленість подією, що вимірювання $\mathsf{X}$ дало результат $a.$

Для конкретного прикладу припустимо, що класична множина станів $\mathsf{X}$ — це $\Sigma = \{0,1\},$ класична множина станів $\mathsf{Y}$ — це $\Gamma = \{1,2,3\},$ і імовірнісний стан $(\mathsf{X},\mathsf{Y})$ задається як

\vert \pi \rangle = \frac{1}{2} \vert 0,1 \rangle + \frac{1}{12} \vert 0,3 \rangle + \frac{1}{12} \vert 1,1 \rangle + \frac{1}{6} \vert 1,2 \rangle + \frac{1}{6} \vert 1,3 \rangle.

Наша мета — визначити імовірності двох можливих результатів ( $0$ і $1$ ) та обчислити, яким стане результуючий імовірнісний стан $\mathsf{Y}$ для обох результатів, якщо система $\mathsf{X}$ вимірюється.

Використовуючи білінійність тензорного добутку, і зокрема той факт, що він є лінійним за другим аргументом, ми можемо переписати вектор $\vert \pi \rangle$ наступним чином:

\vert \pi \rangle = \vert 0\rangle \otimes \biggl( \frac{1}{2} \vert 1 \rangle + \frac{1}{12} \vert 3 \rangle\biggr) + \vert 1\rangle \otimes \biggl( \frac{1}{12} \vert 1 \rangle + \frac{1}{6} \vert 2\rangle + \frac{1}{6} \vert 3 \rangle\biggr).

Словами, ми виокремили різні стандартні базисні вектори першої системи (тобто тієї, що вимірюється), тензорно помноживши кожен із них на лінійну комбінацію стандартних базисних векторів другої системи, яку отримуємо, добираючи елементи початкового вектора, що відповідають відповідному класичному стану першої системи. Трохи поміркувавши, можна переконатися, що це завжди можливо, незалежно від того, з якого вектора ми починаємо.

Виразивши наш вектор імовірності таким чином, ефекти вимірювання першої системи стає легко аналізувати. Імовірності двох результатів можна отримати, сумуючи імовірності в дужках.

\begin{aligned} \operatorname{Pr}(\mathsf{X} = 0) & = \frac{1}{2} + \frac{1}{12} = \frac{7}{12}\\[3mm] \operatorname{Pr}(\mathsf{X} = 1) & = \frac{1}{12} + \frac{1}{6} + \frac{1}{6} = \frac{5}{12} \end{aligned}

Ці імовірності у сумі дають одиницю, як і очікується — але це корисна перевірка наших обчислень.

А тепер імовірнісний стан $\mathsf{Y}$ , обумовлений кожним можливим результатом, можна вивести, нормуючи вектори в дужках. Тобто ми ділимо ці вектори на відповідні щойно обчислені імовірності, щоб вони стали векторами імовірності.

Отже, за умови $\mathsf{X} = 0,$ імовірнісний стан $\mathsf{Y}$ набуває вигляду

\frac{\frac{1}{2} \vert 1 \rangle + \frac{1}{12} \vert 3 \rangle}{\frac{7}{12}} = \frac{6}{7} \vert 1 \rangle + \frac{1}{7} \vert 3 \rangle,

а за умови $\mathsf{X} = 1$ імовірнісний стан $\mathsf{Y}$ набуває вигляду

\frac{\frac{1}{12} \vert 1 \rangle + \frac{1}{6} \vert 2\rangle + \frac{1}{6} \vert 3 \rangle}{\frac{5}{12}} = \frac{1}{5} \vert 1 \rangle + \frac{2}{5} \vert 2 \rangle + \frac{2}{5} \vert 3 \rangle.

Операції над імовірнісними станами

На завершення цього обговорення класичної інформації для кількох систем розглянемо операції над кількома системами в імовірнісних станах. Дотримуючись тієї ж ідеї, що й раніше, ми можемо розглядати кілька систем спільно як одну складену систему, а потім звернутися до попереднього уроку, щоб побачити, як це працює.

Повернувшись до типового налаштування з двома системами $\mathsf{X}$ і $\mathsf{Y},$ розглянемо класичні операції над складеною системою $(\mathsf{X},\mathsf{Y}).$ На основі попереднього уроку та наведеного вище обговорення ми робимо висновок, що будь-яка така операція представляється стохастичною матрицею, рядки і стовпці якої індексуються декартовим добутком $\Sigma\times\Gamma.$

Наприклад, припустимо, що $\mathsf{X}$ і $\mathsf{Y}$ — це біти, і розглянемо операцію з таким описом.

Операція

Якщо $\mathsf{X} = 1,$ виконати операцію NOT над $\mathsf{Y}.$
Інакше нічого не робити.

Це детерміністична операція, відома як controlled-NOT (контрольоване НЕ), де $\mathsf{X}$ — це керуючий біт, який визначає, чи слід застосовувати операцію NOT до цільового біта $\mathsf{Y}.$ Ось матричне представлення цієї операції:

\begin{pmatrix} 1 & 0 & 0 & 0\\[2mm] 0 & 1 & 0 & 0\\[2mm] 0 & 0 & 0 & 1\\[2mm] 0 & 0 & 1 & 0 \end{pmatrix}.

Її дія на стандартні базисні стани виглядає так.

\begin{aligned} \vert 00 \rangle & \mapsto \vert 00 \rangle\\ \vert 01 \rangle & \mapsto \vert 01 \rangle\\ \vert 10 \rangle & \mapsto \vert 11 \rangle\\ \vert 11 \rangle & \mapsto \vert 10 \rangle \end{aligned}

Якби ми поміняли ролі $\mathsf{X}$ і $\mathsf{Y}$ місцями, зробивши $\mathsf{Y}$ керуючим бітом, а $\mathsf{X}$ — цільовим, то матричне представлення операції набрало б вигляду

\begin{pmatrix} 1 & 0 & 0 & 0\\[2mm] 0 & 0 & 0 & 1\\[2mm] 0 & 0 & 1 & 0\\[2mm] 0 & 1 & 0 & 0 \end{pmatrix}

і її дія на стандартні базисні стани виглядала б так:

\begin{aligned} \vert 00 \rangle & \mapsto \vert 00 \rangle\\ \vert 01 \rangle & \mapsto \vert 11 \rangle\\ \vert 10 \rangle & \mapsto \vert 10 \rangle\\ \vert 11 \rangle & \mapsto \vert 01 \rangle \end{aligned}

Ще один приклад — операція з таким описом:

Операція

Виконай одну з двох наступних операцій, кожну з імовірністю $1/2:$

Встановити $\mathsf{Y}$ рівним $\mathsf{X}.$
Встановити $\mathsf{X}$ рівним $\mathsf{Y}.$

Матричне представлення цієї операції виглядає так:

\begin{pmatrix} 1 & \frac{1}{2} & \frac{1}{2} & 0\\[2mm] 0 & 0 & 0 & 0\\[2mm] 0 & 0 & 0 & 0\\[2mm] 0 & \frac{1}{2} & \frac{1}{2} & 1 \end{pmatrix} = \frac{1}{2} \begin{pmatrix} 1 & 1 & 0 & 0\\[2mm] 0 & 0 & 0 & 0\\[2mm] 0 & 0 & 0 & 0\\[2mm] 0 & 0 & 1 & 1 \end{pmatrix} + \frac{1}{2} \begin{pmatrix} 1 & 0 & 1 & 0\\[2mm] 0 & 0 & 0 & 0\\[2mm] 0 & 0 & 0 & 0\\[2mm] 0 & 1 & 0 & 1 \end{pmatrix}.

Дія цієї операції на стандартні базисні вектори виглядає так:

\begin{aligned} \vert 00 \rangle & \mapsto \vert 00 \rangle\\[1mm] \vert 01 \rangle & \mapsto \frac{1}{2} \vert 00 \rangle + \frac{1}{2}\vert 11\rangle\\[3mm] \vert 10 \rangle & \mapsto \frac{1}{2} \vert 00 \rangle + \frac{1}{2}\vert 11\rangle\\[2mm] \vert 11 \rangle & \mapsto \vert 11 \rangle \end{aligned}

У цих прикладах ми просто розглядаємо дві системи разом як одну і діємо, як на попередньому уроці.

Те саме можна зробити для будь-якої кількості систем. Наприклад, уяви, що маємо три біти, і ми збільшуємо три біти за модулем $8$ — тобто розглядаємо три біти як кодування числа від $0$ до $7$ у двійковому записі, додаємо $1$ , а потім беремо залишок від ділення на $8.$ Один зі способів виразити цю операцію такий:

\begin{aligned} & \vert 001 \rangle \langle 000 \vert + \vert 010 \rangle \langle 001 \vert + \vert 011 \rangle \langle 010 \vert + \vert 100 \rangle \langle 011 \vert\\[1mm] & \quad + \vert 101 \rangle \langle 100 \vert + \vert 110 \rangle \langle 101 \vert + \vert 111 \rangle \langle 110 \vert + \vert 000 \rangle \langle 111 \vert. \end{aligned}

Інший спосіб виразити це — як

\sum_{k = 0}^{7} \vert (k+1) \bmod 8 \rangle \langle k \vert,

за умови, що ми домовилися: числа від $0$ до $7$ у кетах позначають їхні трибітові двійкові кодування. Третій варіант — виразити цю операцію у вигляді матриці.

\begin{pmatrix} 0 & 0 & 0 & 0 & 0 & 0 & 0 & 1\\ 1 & 0 & 0 & 0 & 0 & 0 & 0 & 0\\ 0 & 1 & 0 & 0 & 0 & 0 & 0 & 0\\ 0 & 0 & 1 & 0 & 0 & 0 & 0 & 0\\ 0 & 0 & 0 & 1 & 0 & 0 & 0 & 0\\ 0 & 0 & 0 & 0 & 1 & 0 & 0 & 0\\ 0 & 0 & 0 & 0 & 0 & 1 & 0 & 0\\ 0 & 0 & 0 & 0 & 0 & 0 & 1 & 0 \end{pmatrix}

Незалежні операції

Тепер припустимо, що маємо кілька систем і ми незалежно виконуємо різні операції над кожною системою окремо.

Наприклад, повертаючись до нашого звичного налаштування з двома системами $\mathsf{X}$ і $\mathsf{Y}$ з класичними множинами станів $\Sigma$ і $\Gamma$ відповідно, припустимо, що ми виконуємо одну операцію над $\mathsf{X}$ і, цілком незалежно, іншу операцію над $\mathsf{Y}.$ Як ми знаємо з попереднього уроку, ці операції представляються стохастичними матрицями — і, конкретніше, скажемо, що операція над $\mathsf{X}$ представляється матрицею $M$ , а операція над $\mathsf{Y}$ — матрицею $N.$ Таким чином, рядки і стовпці $M$ мають індекси, що відповідають елементам $\Sigma$ , і аналогічно рядки і стовпці $N$ відповідають елементам $\Gamma.$

Природне питання: якщо розглядати $\mathsf{X}$ і $\mathsf{Y}$ разом як одну складену систему $(\mathsf{X},\mathsf{Y}),$ яка матриця представляє сукупну дію двох операцій на цю складену систему? Щоб відповісти на це питання, нам спочатку потрібно ввести тензорні добутки матриць, які подібні до тензорних добутків векторів і визначаються аналогічно.

Тензорні добутки матриць

Тензорний добуток $M\otimes N$ матриць

M = \sum_{a,b\in\Sigma} \alpha_{ab} \vert a\rangle \langle b\vert

та

N = \sum_{c,d\in\Gamma} \beta_{cd} \vert c\rangle \langle d\vert

— це матриця

M \otimes N = \sum_{a,b\in\Sigma} \sum_{c,d\in\Gamma} \alpha_{ab} \beta_{cd} \vert ac \rangle \langle bd \vert

Еквівалентно, тензорний добуток $M$ і $N$ визначається рівнянням

\langle ac \vert M \otimes N \vert bd\rangle = \langle a \vert M \vert b\rangle \langle c \vert N \vert d\rangle

яке має виконуватися для будь-якого вибору $a,b\in\Sigma$ і $c,d\in\Gamma.$

Альтернативний, але еквівалентний, спосіб описати $M\otimes N$ полягає в тому, що це єдина матриця, що задовольняє рівнянню

(M \otimes N) \bigl( \vert \phi \rangle \otimes \vert \psi \rangle \bigr) = \bigl(M \vert\phi\rangle\bigr) \otimes \bigl(N \vert\psi\rangle\bigr)

для будь-якого можливого вибору векторів $\vert\phi\rangle$ і $\vert\psi\rangle,$ за умови, що індекси $\vert\phi\rangle$ відповідають елементам $\Sigma$ , а індекси $\vert\psi\rangle$ — елементам $\Gamma.$

Дотримуючись описаної раніше угоди щодо впорядкування елементів декартових добутків, ми можемо також записати тензорний добуток двох матриць явно:

\begin{gathered} \begin{pmatrix} \alpha_{11} & \cdots & \alpha_{1m} \\ \vdots & \ddots & \vdots \\ \alpha_{m1} & \cdots & \alpha_{mm} \end{pmatrix} \otimes \begin{pmatrix} \beta_{11} & \cdots & \beta_{1k} \\ \vdots & \ddots & \vdots\\ \beta_{k1} & \cdots & \beta_{kk} \end{pmatrix} \hspace{6cm}\\[8mm] \hspace{1cm} = \begin{pmatrix} \alpha_{11}\beta_{11} & \cdots & \alpha_{11}\beta_{1k} & & \alpha_{1m}\beta_{11} & \cdots & \alpha_{1m}\beta_{1k} \\ \vdots & \ddots & \vdots & \hspace{2mm}\cdots\hspace{2mm} & \vdots & \ddots & \vdots \\ \alpha_{11}\beta_{k1} & \cdots & \alpha_{11}\beta_{kk} & & \alpha_{1m}\beta_{k1} & \cdots & \alpha_{1m}\beta_{kk} \\[2mm] & \vdots & & \ddots & & \vdots & \\[2mm] \alpha_{m1}\beta_{11} & \cdots & \alpha_{m1}\beta_{1k} & & \alpha_{mm}\beta_{11} & \cdots & \alpha_{mm}\beta_{1k} \\ \vdots & \ddots & \vdots & \hspace{2mm}\cdots\hspace{2mm} & \vdots & \ddots & \vdots \\ \alpha_{m1}\beta_{k1} & \cdots & \alpha_{m1}\beta_{kk} & & \alpha_{mm}\beta_{k1} & \cdots & \alpha_{mm}\beta_{kk} \end{pmatrix} \end{gathered}

Тензорні добутки трьох і більше матриць визначаються аналогічним чином. Якщо $M_0, \ldots, M_{n-1}$ — матриці, індекси яких відповідають класичним множинам станів $\Sigma_0,\ldots,\Sigma_{n-1},$ то тензорний добуток $M_{n-1}\otimes\cdots\otimes M_0$ визначається умовою

\langle a_{n-1}\cdots a_0 \vert M_{n-1}\otimes\cdots\otimes M_0 \vert b_{n-1}\cdots b_0\rangle = \langle a_{n-1} \vert M_{n-1} \vert b_{n-1} \rangle \cdots\langle a_0 \vert M_0 \vert b_0 \rangle

для будь-якого вибору класичних станів $a_0,b_0\in\Sigma_0,\ldots,a_{n-1},b_{n-1}\in\Sigma_{n-1}.$ Крім того, тензорні добутки трьох і більше матриць можна визначити рекурсивно, через тензорні добутки двох матриць, аналогічно до того, що ми спостерігали для векторів.

Тензорний добуток матриць іноді називають мультиплікативним, оскільки рівняння

(M_{n-1}\otimes\cdots\otimes M_0)(N_{n-1}\otimes\cdots\otimes N_0) = (M_{n-1} N_{n-1})\otimes\cdots\otimes (M_0 N_0)

завжди виконується для будь-якого вибору матриць $M_0,\ldots,M_{n-1}$ і $N_0\ldots,N_{n-1},$ за умови, що добутки $M_0 N_0, \ldots, M_{n-1} N_{n-1}$ мають сенс.

Незалежні операції (продовження)

Тепер ми можемо відповісти на питання, поставлене раніше: якщо $M$ — це імовірнісна операція над $\mathsf{X},$ $N$ — імовірнісна операція над $\mathsf{Y},$ і ці дві операції виконуються незалежно, то результуюча операція над складеною системою $(\mathsf{X},\mathsf{Y})$ є тензорним добутком $M\otimes N.$

Отже, як для імовірнісних станів, так і для імовірнісних операцій, тензорні добутки представляють незалежність. Якщо маємо дві системи $\mathsf{X}$ та $\mathsf{Y},$ які незалежно перебувають в імовірнісних станах $\vert\phi\rangle$ та $\vert\psi\rangle,$ то складена система $(\mathsf{X},\mathsf{Y})$ знаходиться в імовірнісному стані $\vert\phi\rangle\otimes\vert\psi\rangle;$ а якщо застосовуємо імовірнісні операції $M$ та $N$ до двох систем незалежно, то дія на складену систему $(\mathsf{X},\mathsf{Y})$ описується операцією $M\otimes N.$

Розгляньмо приклад, що нагадує імовірнісну операцію над одним бітом із попереднього уроку: якщо класичний стан біта дорівнює $0,$ його залишають без змін; а якщо класичний стан біта дорівнює $1,$ його перевертають у 0 з імовірністю $1/2.$ Ми встановили, що ця операція представляється матрицею

\begin{pmatrix} 1 & \frac{1}{2}\\[1mm] 0 & \frac{1}{2} \end{pmatrix}.

Якщо цю операцію виконати над бітом $\mathsf{X},$ а операцію NOT — (незалежно) над другим бітом $\mathsf{Y},$ то спільна операція над складеною системою $(\mathsf{X},\mathsf{Y})$ має матричне представлення

\begin{pmatrix} 1 & \frac{1}{2}\\[1mm] 0 & \frac{1}{2} \end{pmatrix} \otimes \begin{pmatrix} 0 & 1\\[1mm] 1 & 0 \end{pmatrix} = \begin{pmatrix} 0 & 1 & 0 & \frac{1}{2} \\[1mm] 1 & 0 & \frac{1}{2} & 0 \\[1mm] 0 & 0 & 0 & \frac{1}{2} \\[1mm] 0 & 0 & \frac{1}{2} & 0 \end{pmatrix}.

З огляду можна переконатись, що це стохастична матриця. Так буде завжди: тензорний добуток двох або більше стохастичних матриць завжди є стохастичним.

Поширена ситуація — коли одну операцію виконують над однією системою, а з іншою не роблять нічого. У такому випадку дотримуються тих самих правил, пам'ятаючи, що нічого не робити представляється одиничною матрицею. Наприклад, скидання біта $\mathsf{X}$ у стан $0$ та бездіяльність щодо $\mathsf{Y}$ дають імовірнісну (а фактично детерміновану) операцію над $(\mathsf{X},\mathsf{Y})$ , що представляється матрицею

\begin{pmatrix} 1 & 1\\[1mm] 0 & 0 \end{pmatrix} \otimes \begin{pmatrix} 1 & 0\\[1mm] 0 & 1 \end{pmatrix} = \begin{pmatrix} 1 & 0 & 1 & 0 \\[1mm] 0 & 1 & 0 & 1 \\[1mm] 0 & 0 & 0 & 0 \\[1mm] 0 & 0 & 0 & 0 \end{pmatrix}.

Класичні стани через декартовий добуток​

Імовірнісні стани​

Упорядкування множин станів декартового добутку​

Незалежність двох систем​

Тензорні добутки векторів​

Незалежність і тензорні добутки для трьох і більше систем​

Вимірювання імовірнісних станів​

Операції над імовірнісними станами​

Незалежні операції​

Тензорні добутки матриць​

Незалежні операції (продовження)​