Гилберт Стренг: «Магия линейной алгебры в четырех подпространствах»

Линейная алгебра является фундаментом современной науки о данных и инженерного дела, а понимание матриц невозможно без их глубокого структурного анализа. В лекции от MIT OpenCourseWare подробно разбираются четыре фундаментальных подпространства матрицы, которые формируют «большую картину» всей дисциплины. Спикер объясняет, как эти пространства взаимосвязаны и почему их изучение критически важно для решения задач регрессии и метода наименьших квадратов.

📐 Четыре подпространства: от физики до Data Science 0:11

Работа с матрицами начинается с определения четырех фундаментальных подпространств, связанных с каждой конкретной матрицей $A$ . К ним относятся:

Столбцовое пространство (Column space);
Строчечное пространство (Row space);
Нуль-пространство (Null space);
Нуль-пространство транспонированной матрицы (Null space of $A^T$).

По словам лектора, эти концепции находят разное применение в зависимости от формы матрицы . В классической физике и инженерии чаще встречаются квадратные матрицы (например, 12 уравнений с 12 неизвестными), которые обычно обратимы . В таких случаях два из четырех подпространств (нуль-пространства) фактически пусты и содержат только нулевой вектор .

Однако в статистике, анализе данных и задачах машинного обучения специалисты чаще имеют дело с прямоугольными матрицами . Для таких матриц невозможно найти обычную обратную матрицу, так как размерности строк и столбцов не совпадают, что делает изучение всех четырех подпространств и концепции псевдообратной матрицы (pseudo inverse) критически важным .

🖼️ Визуализация «Большой картины» линейной алгебры 3:05

Лектор представляет графическую схему, которую он называет «большой картиной линейной алгебры» . На этой схеме:

Верхняя правая часть: столбцовое пространство;
Верхняя левая часть: строчечное пространство;
Нижние части: соответствующие нуль-пространства, которые дополняют структуру .

Для наглядности автор разбирает пример матрицы размерностью 2 на 3 (2 строки, 3 столбца) .

Столбцовое пространство

Столбцовое пространство — это совокупность всех линейных комбинаций столбцов матрицы . Если мы возьмем столбцы как векторы (например, 1-4, 2-5, 3-6) и будем умножать их на любые числа $V1, V2, V3$, мы получим набор точек в пространстве . В данном примере столбцы 1-4 и 2-5 направлены в разные стороны, поэтому их комбинации полностью заполняют двумерную плоскость XY . Третий столбец здесь оказывается «лишним», так как первые два уже покрыли всё возможное пространство .

Строчечное пространство

Чтобы работать со строчечным пространством, лектор предлагает использовать операцию транспонирования ($A^T$) — это позволяет сохранить единообразие терминологии и не вводить новые буквы . В этом случае строки становятся столбцами. В примере с векторами в трехмерном пространстве комбинация двух независимых векторов-строк образует двумерную плоскость, «живущую» внутри 3D-пространства . Лектор подчеркивает, что комбинации могут включать любые числа: десятичные дроби или отрицательные значения, что позволяет векторам указывать в противоположных направлениях .

🕳️ Нуль-пространства: где векторы «умирают» 10:37

Нуль-пространство матрицы — это набор всех векторов $x$, которые при умножении на матрицу $A$ дают нулевой результат ($Ax = 0$) .

Пример решения: В системе из двух уравнений с тремя неизвестными всегда есть определенная свобода выбора . Для рассматриваемой матрицы решением является вектор (1, -2, 1). Автор поясняет: если сложить первый и третий столбцы (1-4 и 3-6), получится 4-10, что в точности равно удвоенному второму столбцу (2-5) .
Левое нуль-пространство: Это нуль-пространство транспонированной матрицы $A^T$ . В примере с тремя уравнениями и двумя неизвестными единственным решением часто оказывается только нулевой вектор . Это означает, что единственный способ получить ноль из комбинации данных векторов — это умножить каждый из них на ноль .

✨ Магия ранга и факторизация 14:01

Одной из самых красивых теорем линейной алгебры лектор считает равенство строчечного и столбцового рангов . Матрица имеет только один ранг ($R$), который определяет количество линейно независимых строк или столбцов . Даже если у вас огромная матрица 50 на 70, количество независимых столбцов всегда будет равно количеству независимых строк — по мнению автора, это настоящая «магия линейной алгебры» .

Для доказательства этого факта лектор использует факторизацию $A = CR$ :

Матрица $C$ содержит независимые столбцы;
Матрица $R$ содержит независимые строки.

Эта модель наглядно показывает, что размерность строчечного пространства всегда совпадает с размерностью столбцового пространства .

🔄 Псевдообратная матрица и идеальное соответствие 18:14

Между строчечным и столбцовым пространствами (оба имеют размерность $R$) матрица ведет себя как обратимая . Любой вектор из строчечного пространства при умножении на $A$ переходит в уникальный вектор столбцового пространства . Это позволяет ввести понятие псевдообратной матрицы ($A^+$ или $A$ с «кинжалом»), которая возвращает вектор из столбцового пространства обратно в строчечное .

Псевдообратная матрица игнорирует нуль-пространства . Она работает как идеальное зеркало для «сердца» матрицы, но отправляет в ноль всё то, что не может быть корректно возвращено . Как утверждает лектор, это полезная, хотя и не самая базовая концепция, которая становится предельно ясной именно при взгляде на схему четырех подпространств .

📉 Метод наименьших квадратов и регрессия 20:39

Главным практическим применением этой теории является метод наименьших квадратов (Least Squares), который в статистике называют регрессией . Задача состоит в том, чтобы найти вектор $x$, который делает выражение $Ax - b$ максимально коротким (минимизирует длину ошибки) .

Основные тезисы лектора по этой теме:

Если точного решения $Ax = b$ не существует, мы ищем «лучшее из возможных» .
Используя исчисление (взятие производной и приравнивание к нулю), мы приходим к фундаментальному уравнению: $A^T A \hat{x} = A^T b$ .
Решение этого уравнения, обозначаемое как $\hat{x}$ («x с крышкой»), дает точку, в которой ошибка минимальна .

В завершение лектор подчеркивает, что даже если матрица не является квадратной или обратимой, эти четыре подпространства существуют всегда, определяя внутреннюю логику и возможности любой математической системы .