Что называется матрицей вектором
От действий над матрицами к пониманию их сути…
Очень уважаю людей, которые имеют смелость заявить, что они что-то не понимают. Сам такой. То, что не понимаю, — обязательно должен изучить, осмыслить, понять. Статья «Математика на пальцах», и особенно матричная запись формул, заставили меня поделиться своим небольшим, но, кажется, немаловажным опытом работы с матрицами.
Лет эдак 20 назад довелось мне изучать высшую математику в вузе, и начинали мы с матриц (пожалуй, как и все студенты того времени). Почему-то считается, что матрицы — самая лёгкая тема в курсе высшей математики. Возможно — потому, что все действия с матрицами сводятся к знанию способов расчёта определителя и нескольких формул, построенных — опять же, на определителе. Казалось бы, всё просто. Но… Попробуйте ответить на элементарный вопрос — что такое определитель, что означает число, которое вы получаете при его расчёте? (подсказка: вариант типа «определитель — это число, которое находится по определённым правилам» не является правильным ответом, поскольку говорит о методе получения, а не о самой сути определителя). Сдаётесь? — тогда читаем дальше.
Сразу хочу сказать, что я не математик ни по образованию, ни по должности. Разве что мне интересна суть вещей, и я порой пытаюсь до них «докопаться». Так же было и с определителем: нужно было разобраться со множественной регрессией, а в этом разделе эконометрики практически всё делается через… матрицы, будь они неладны. Вот и пришлось мне самому провести небольшое исследование, поскольку ни один из знакомых математиков не дал внятного ответа на поставленный вопрос, изначально звучавший как «что такое определитель». Все утверждали, что определитель — это такое число, которое особым образом посчитано, и если оно равно нулю, то… В общем, как в любом учебнике по линейной алгебре. Спасибо, проходили.
Если какую-то идею придумал один человек, то другой человек должен быть в состоянии её понять (правда, для этого порой приходится вооружаться дополнительными знаниями). Обращение к «великому и могучему» поисковику показало, что «площадь параллелограмма равна модулю определителя матрицы, образованной векторами — сторонами параллелограмма». Говоря простым языком, если матрица — это способ записи системы уравнений, то каждое уравнение в отдельности описывает вектор. Построив из точки начала координат векторы, заданные в матрице, мы таким образом зададим в пространстве некоторую фигуру. Если наше пространство одномерное, то фигура — это отрезок; если двумерное — то фигура — параллелограмм, и так далее.
Получается, что для одномерного пространства определитель — это длина отрезка, для плоскости — площадь фигуры, для трёхмерной фигуры — её объём… дальше идут n-мерные пространства, вообразить которые нам не дано. Если объём фигуры (то есть определитель для матрицы 3*3) равен нулю, то это означает, что сама фигура не является трёхмерной (она может быть при этом двухмерной, одномерной или вообще представлять собой точку). Ранг матрицы — это истинная (максимальная) размерность пространства, для которого определитель не равен нулю.
Так, с определителем почти всё понятно: он определяет «объёмность» фигуры, образованной описанными системой уравнений векторами (хотя непонятно, почему его значение не зависит от того, имеем мы дело с исходной матрицей, или с транспонированной — возможно, транспонирование — это вид аффинного преобразования?). Теперь нужно разобраться с действиями над матрицами…
Если матрица — это система уравнений (а иначе зачем нам таблица каких-то цифр, не имеющих к реальности никакого отношения?), то мы можем с ней делать разные вещи. Например, можем сложить две строки одной и той же матрицы, или умножить строку на число (то есть каждый коэффициент строки умножаем на одно и то же число). Если у нас есть две матрицы с одинаковыми размерностями, то мы их можем сложить (главное, чтобы при этом мы не сложили бульдога с носорогом — но разве математики, разрабатывая теорию матриц, думали о таком варианте развития событий?). Интуитивно понятно, тем более что в линейной алгебре иллюстрациями подобных операций являются системы уравнений.
Однако в чём смысл умножения матриц? Как я могу умножить одну систему уравнений на другую? Какой смысл будет иметь то, что я получу в этом случае? Почему для умножения матриц неприменимо переместительное правило (то есть произведение матриц В*А не то что не равно произведению А*В, но и не всегда осуществимо)? Почему, если мы перемножим матрицу на вектор-столбец, то получим вектор-столбец, а если перемножим вектор-строку на матрицу, то получим вектор-строку?
Ну, тут уж не то что Википедия, — тут даже современные учебники по линейной алгебре бессильны дать какое-либо внятное объяснение. Поскольку изучение чего-либо по принципу «вы сначала поверьте — а поймёте потом» — не для меня, копаю в глубь веков (точнее — читаю учебники первой половины XX века) и нахожу интересную фразу…
Если совокупность обычных векторов, т.е. направленных геометрических отрезков, является трёхмерным пространством, то часть этого пространства, состоящая из векторов, параллельных некоторой плоскости, является двумерным пространством, а все векторы, параллельные некоторой прямой, образуют одномерное векторное пространство.
В книгах об этом напрямую не говорится, но получается, что векторам, параллельным некоторой плоскости, необязательно лежать на этой плоскости. То есть они могут находиться в трёхмерном пространстве где угодно, но если они параллельны именно этой плоскости, то они образуют двумерное пространство… Из приходящих мне на ум аналогий — фотография: трёхмерный мир представлен на плоскости, при этом вектору, параллельному матрице (или плёнке) фотоаппарата, будет соответствовать такой же вектор на картинке (при условии соблюдении масштаба 1:1). Отображение трёхмерного мира на плоскости «убирает» одно измерение («глубину» картинки). Если я правильно понял сложные математические концепции, перемножение двух матриц как раз и представляет собой подобное отражение одного пространства в другом. Поэтому, если отражение пространства А в пространстве В возможно, то допустимость отражения пространства В в пространстве А — не гарантируется.
Любая статья заканчивается в тот момент, когда автору надоедает её писать. Поскольку я не ставил перед собой цели объять необъятное, а исключительно хотел понять суть описанных операций над матрицами и то, как именно матрицы связаны с решаемыми мной системами уравнений, я не полез в дальнейшие дебри линейной алгебры, а вернулся к эконометрике и множественной регрессии, но сделал это уже более осознанно. Понимая, что и зачем я делаю и почему только так, а не иначе. То, что у меня получилось в этом материале, можно озаглавить как «глава о сути основных операций линейной алгебры, которую почему-то забыли напечатать в учебниках». Но ведь мы же не читаем учебников, правда? Если честно, когда я учился в университете, мне очень не хватало именно понимания затронутых здесь вопросов, поэтому я надеюсь, что, изложив этот непростой материал по возможности простыми словами, я делаю доброе дело и помогаю кому-то вникнуть в саму суть матричной алгебры, переведя операции над матрицами из раздела «камлание с бубном» в раздел «практические инструменты, применяемые осознанно».
Векторы с координатами можно объединять в матрицы и производить с ними загадочные действия, в результате которых почему-то получаются правильные ответы. Загадочные эти действия потому, что смысл их не улавливается. Приходится довольно долго возиться, чтобы понять, откуда что берется.
Например, детерминант (определитель) матрицы.
Матрица второго порядка (двумерная): векторы на координатной плоскости, обозначаются двумя цифрами, и эти цифры обозначают длину проекций на оси Х и Y (первый рисунок поста).
А взялась эта площадь из геометрических соображений. Пусть у нас два вектора ОА (3,4) и ОС (2,1) и матрица, составленная из координат этих векторов
Из чертежа видно,
что, если из площади квадрата OHBD вычесть площади треугольников OCF, ABG, OAK, CEB и вычесть площадь прямоугольников FCED и KHGA, то как раз останется площадь параллелограмма ОАВС, образованного векторами ОА и ОС.
Площадь параллелограмма равна определителю матрицы.
А когда определитель матрицы равен нулю, векторы сливаются, площади нет, матрица вырождена.
Матрица (математика)
Матрицы широко применяются в математике для компактной записи систем линейных алгебраических или дифференциальных уравнений. В этом случае, количество строк матрицы соответствует числу уравнений, а количество столбцов — количеству неизвестных. В результате решение систем линейных уравнений сводится к операциям над матрицами.
Для матрицы определены следующие алгебраические операции:
Относительно сложения матрицы образуют абелеву группу; если же рассматривать ещё и умножение на скаляр, то матрицы образуют модуль над соответствующим кольцом (векторное пространство над полем). Множество квадратных матриц замкнуто относительно матричного умножения, поэтому квадратные матрицы одного размера образуют ассоциативное кольцо с единицей относительно матричного сложения и матричного умножения.
Доказано, что каждому линейному оператору, действующему в n-мерном линейном пространстве, можно сопоставить единственную квадратную матрицу порядка n; и обратно — каждой квадратной матрице порядка n может быть сопоставлен единственный линейный оператор, действующий в этом пространстве. [2] Свойства матрицы соответствуют свойствам линейного оператора. В частности, собственные числа матрицы — это собственные числа оператора, отвечающие соответствующим собственным векторам.
То же можно сказать о представлении матрицами билинейный (квадратичных) форм.
В математике рассматривается множество различных типов и видов матриц. Таковы, например, единичная, симметричная, кососимметричная, верхнетреугольная (нижнетреугольная) и т. п. матрицы.
Особое значение в теории матриц занимают всевозможные нормальные формы, то есть канонический вид, к которому можно привести матрицу заменой координат. Наиболее важной (в теоретическом значении) и проработанной является теория жордановых нормальных форм. На практике, однако, используются такие нормальные формы, которые обладают дополнительными свойствами, например, устойчивостью.
Содержание
История
Впервые матрицы упоминались ещё в древнем Китае, называясь тогда «волшебным квадратом». Основным применением матриц было решение линейных уравнений. Также волшебные квадраты были известны чуть позднее у арабских математиков, примерно тогда появился принцип сложения матриц. После развития теории определителей в конце 17-го века, Габриэль Крамер начал разрабатывать свою теорию в 18-ом столетии и опубликовал «правило Крамера» в 1751 году. Примерно в этом же промежутке времени появился «метод Гаусса». Теория матриц начала своё существование в середине XIX века в работах Уильяма Гамильтона и Артура Кэли. Фундаментальные результаты в теории матриц принадлежат Вейерштрассу, Жордану, Фробениусу. Термин «матрица» ввел Джеймс Сильвестр в 1850 г. [3]
Определение
Пусть есть два конечных множества и , где и — натуральные числа.
Назовём матрицей размера (читается на ) с элементами из некоторого кольца или поля отображение вида
.
называется элементом матрицы, находящимся на пересечении -той строки и -ого столбца;
Если индекс пробегает множество , а пробегает множество , то совокупность элементов полностью определяет матрицу.
Таким образом, матрица размера состоит в точности из
В соответствии с этим
Сама матрица естественным образом интерпретируется как вектор в пространстве , имеющем размерность . Это позволяет ввести покомпонентное сложение матриц и умножение матрицы на число (см. ниже); что касается матричного умножения, то оно существенным образом опирается на прямоугольную структуру матрицы.
Если у матрицы количество строк совпадает с количеством столбцов , то такая матрица называется квадратной, а число называется размером квадратной матрицы или её порядком.
Обозначения
Обычно матрицу обозначают заглавной буквой латинского алфавита: пусть
,
тогда — матрица, которая интерпретируется как прямоугольный массив элементов поля вида , где
таким образом, — элемент матрицы , находящийся на пересечении -той строки и -того столбца. В соответствии с этим принято следующее компактное обозначение для матрицы размера :
если нужно просто указать обозначение для элементов матрицы.
Иногда, вместо , пишут , чтобы отделить индексы друг от друга и избежать смешения с произведением двух чисел.
Если необходимо дать развёрнутое представление матрицы в виде таблицы, то используют запись вида
Можно встретить как обозначения с круглыми скобками «(…)», так и обозначения с квадратными скобками «[…]». Реже можно встретить обозначения с двойными прямыми линиями «||…||»).
Поскольку матрица состоит из строк и столбцов, для них используются следующие обозначения:
— это -тая строка матрицы ,
— это -тый столбец матрицы .
Таким образом, матрица обладает двойственным представлением — по строкам:
.
Такое представление позволяет формулировать свойства матриц в терминах строк или в терминах столбцов.
Транспонированная матрица
С каждой матрицей размера связана матрица размера вида
Такая матрица называется транспонированной матрицей для и обозначается так .
Транспонированную матрицу можно получить, поменяв строки и столбцы матрицы местами. Матрица размера при этом преобразовании станет матрицей размерностью .
Диагональная матрица
Диагональная матрица — квадратная матрица, все элементы которой кроме диагональных — нулевые , иногда записывается как:
Единичная матрица
Единичная матрица — матрица, при умножении на которую любая матрица (или вектор) остается неизменной, является диагональной матрицей с единичными (всеми) диагональными элементами:
Для ее обозначения чаще всего используется обозначение I или E, а также просто 1 (или 1 специальным шрифтом).
Для обозначения ее элементов также используется символ Кронекера , определяемый как:
при
Нулевая матрица
Для обозначения нулевой матрицы — матрицы, все элементы которой нули (при сложении ее с любой матрицей та остается неизменной, а при умножении на любую получается нулевая матрица) — используется обычно просто 0 или 0 специальным шрифтом, или буква, начертанием похожая на ноль, например .
Вектор-строка и вектор-столбец
Матрицы размера и являются элементами пространств и соответственно:
Операции над матрицами
Умножение матрицы на число
Умножение матрицы на число (обозначение: ) заключается в построении матрицы , элементы которой получены путём умножения каждого элемента матрицы на это число, то есть каждый элемент матрицы равен
Свойства умножения матриц на число:
Сложение матриц
Сложение матриц есть операция нахождения матрицы , все элементы которой равны попарной сумме всех соответствующих элементов матриц и , то есть каждый элемент матрицы равен
Свойства сложения матриц:
Все свойства линейных операций повторяют аксиомы линейного пространства и поэтому справедлива теорема:
Множество всех матриц одинаковых размеров mxn с элементами из поля P (поля всех действительных или комплексных чисел) образуют линейное пространство над полем P (каждая такая матрица является вектором этого пространства). Впрочем, прежде всего во избежание терминологической путаницы, матрицы в обычных контекстах избегают без необходимости (которой нет в наиболее обычных стандартных применениях) и четкого уточнения употребления термина называть векторами.
Умножение матриц
Умножение матриц (обозначение: , реже со знаком умножения ) — есть операция вычисления матрицы , каждый элемент которой равен сумме произведений элементов в соответствующей строке первого множителя и столбце второго.
Количество столбцов в матрице должно совпадать с количеством строк в матрице , иными словами, матрица обязана быть согласованной с матрицей . Если матрица имеет размерность , — , то размерность их произведения есть .
Свойства умножения матриц:
Умножение вектора на матрицу
По обычным правилам матричного умножения осуществляется умножение на матрицу слева вектора-столбца, а также умножение вектора-строки на матрицу справа. Поскольку элементы вектора-столбца или вектора-строки можно записать (что обычно и делается), используя один, а не два индекса, это умножение можно записать так:
для вектора-столбца v (получая новый вектор-столбец Av):
для вектора-строки s (получая новый вектор-строку sA):
Вектор-строка, матрица и вектор столбец могут быть умножены друг на друга, давая число (скаляр):
(Порядок важен: вектор-строка слева, вектор-столбец справа от матрицы).
Эти операции являются основой матричного представления линейных операторов и линейных преобразований координат (смены базисов), таких, как повороты, масштабирования, зеркальные отражения, а также (последнее) матричного представления билинейных (квадратичных форм.
Заметим, что обычной мотивировкой введения матриц и определения операции матричного умножения (см.тж.в статье об умножении матриц) является именно введение их, начиная с умножения вектора на матрицу (которое вводится исходя из преобразований базиса или вообще линейных операций над векторами), а уже затем композиции преобразований сопоставляется произведение матриц. Действительно, если новый вектор Av, полученный из исходного вектора v преобразованием, представимым умножением на матрицу A, преобразовать теперь еще раз, преобразованием, представимым умножением на матрицу B, получив B(Av), то, исходя из правила умножения вектора на матрицу, приведенного в начале этого параграфа (используя ассоциативность умножения чисел и меняя порядок суммирования), нетрудно увидеть в результате формулу, дающую элементы матрицы (BA), представляющую композицию первого и второго преобразований, и совпадающую с обычным определением матричного умножения.
Комплексное сопряжение
Если элементами матрицы являются комплексные числа, то комплексно сопряжённая (не путать с эрмитово сопряжённой! см. далее) матрица равна . Здесь — число, комплексно сопряжённое к .
Транспонирование и эрмитово сопряжение
Транспонирование уже обсуждалось выше: если , то . Для комплексных матриц более употребительно эрмитово сопряжение: . С точки зрения операторного взгляда на матрицы, транспонированная и эрмитово сопряжённая матрица — это матрицы оператора, сопряжённого относительно скалярного или эрмитова произведения, соответственно.
Для квадратной матрицы определен след:
(иногда также обозначается как Sp или Spur).
Является инвариантом ортогональных (унитарных) преобразований матрицы, соответствующих преобразованию матричного представления линейного оператора или билинейной (квадратичной) формы при соотвестствующем преобразовании векторного пространства (например, вращении).