Что такое ядро матрицы
Перейти к содержимому

Что такое ядро матрицы

Ядро и образ линейного отображения

2. Рассмотрим отображение , которое ставит в соответствие каждому вектору относительно заданного базиса . Ядром этого отображения является нулевой вектор пространства . Образ преобразования , так как это преобразование сюръективно (любой столбец из является координатным столбцом некоторого вектора пространства , которое каждому вектору его проекции на направление, задаваемое единичным вектором — множество векторов, ортогональных , которое каждому многочлену степени не выше ставит в соответствие его производную. Ядром этого отображения является множество многочленов нулевой степени, а образом — все пространство .

Свойства ядра и образа линейного отображения

1. Ядро любого линейного отображения .

В соответствии с определением требуется доказать, что множество

т.е. нулевой вектор отображается в нулевой вектор . Следовательно, ядро любого линейного отображения не является пустым и содержит, по крайней мере, нулевой элемент: . Покажем, что множество

Следовательно, множество 2. Образ любого линейного отображения . Тогда , то есть Дефектом линейного отображения называется размерность его ядра: рангом линейного отображения — размерность его образа: .

3. Ранг линейного отображения равен рангу его матрицы (определенной относительно любых базисов).

В самом деле, если любой базис пространства . Поэтому максимальное число линейно независимых векторов системы (ранг системы векторов) равно максимальному числу линейно независимых столбцов матрицы .

4. Линейное отображение , другими словами, когда дефект отображения равен нулю: служит нулевой вектор . Поэтому, если отображение инъективно, то ядро содержит только нулевой вектор , иначе два разных вектора имели бы один и тот же образ . Обратно, при условии разные векторы не могут иметь одинаковые образы , так как в этом случае из равенств , следует, что ненулевой вектор (приходим к противоречию).

5. Линейное отображение , другими словами, когда ранг отображения равен размерности пространства образов: .

6. Линейное отображение и одновременно.

Теорема (9.1) о размерностях ядра и образа. Сумма размерностей ядра и образа любого линейного отображения

Действительно, пусть . Выберем в подпространстве и дополним его векторами до базиса всего пространства образуют базис подпространства , так как образ любого вектора линейно выражается через векторы

Во-вторых, образующие линейно независимы. Если их линейная комбинация равна нулевому вектору:

то вектор принадлежит ядру (его образ — нулевой вектор). Однако, по построению этот вектор принадлежит алгебраическому дополнению . Учитывая, что , заключаем: . Получили разложение нулевого вектора по линейно независимой системе векторов, значит, все коэффициенты . Поэтому равенство справедливо только для тривиальной линейной комбинации, т.е. система векторов линейно независимая.

Таким образом, векторы образуют базис подпространства , а его размерность определяется количеством базисных векторов, т.е. Следствие. Линейное отображение

Тогда по теореме 9.1 заключаем, что , что и требовалось доказать.

Обратимые линейные отображения называются также невырожденными (имея в виду невырожденность их матрицы).

Линейное отображение

Линейным отображением линейного векторного пространства $ \mathbb V_<> $ с операцией сложения векторов, обозначаемой $ +_<> $, в линейное векторное пространство $ \mathbb W_<> $ с операцией сложения векторов, обозначаемой $ \boxplus_<> $, называется функция (соответствие) $$ \mathcal A:\ \mathbb V \longmapsto \mathbb W $$ (т.е. определенная на $ \mathbb V_<> $, имеющая значения в $ \mathbb W_<> $), обладающая свойством линейности, которое описывается одним из двух эквивалентных представлений: $$ \mathcal A (X_1 +X_2)= \mathcal A(X_1) \boxplus \mathcal A(X_2),\quad \mathcal A (\alpha_1 X_1)= \alpha_1 \mathcal A (X_1), $$ или $$ \mathcal A(\alpha_1 X_1 + \alpha_2 X_2)= \alpha_1 \mathcal A(X_1) \boxplus \alpha_2 \mathcal A(X_2) $$ указанные свойства должны быть выполнены для любых векторов $ X_1,X_2 $ пространства $ \mathbb V_<> $ и любых скаляров $ \alpha_1,\alpha_ 2 $ (вещественных если оба пространства вещественны, и комплексных если хотя бы одно из пространств комплексное). Если $ Y=\mathcal A(X) $, то говорят, что $ Y_<> $ — образ вектора $ X_<> $, а $ X_<> $ — прообраз вектора $ Y_<> $ при отображении $ \mathcal A_<> $. Пространство $ \mathbb V_<> $ называется областью определения отображения $ \mathcal A_<> $.

Примеры линейных отображений

Пример 1. Рассмотрим линейное пространство полиномов степени не выше $ n_<> $:

$$ \mathbb P_n=\ \, ; $$ в это же множество включаем и тождественно нулевой полином (для которого степень не определяется). Операция нахождения частного и операция нахождения остатка от деления полинома $ p(x)_<> $ на заданный фиксированный полином $ g(x) \in \mathbb R[x], g(x) \not\equiv 0 $ являются линейными отображениями пространства $ \mathbb P_ $: если

$$ p_1(x)\equiv q_1(x)g(x)+r_1(x),\ p_2(x)\equiv q_2(x)g(x)+r_2(x) $$ при $ \deg r_j(x)<\deg g(x) $ то $$ (\alpha_1p_1(x)+\alpha_2p_2(x)) \equiv $$ $$ \equiv (\alpha_1q_1(x)+\alpha_2q_2(x)) g(x) + (\alpha_1r_1(x)+\alpha_2r_2(x)) \ . $$ Фактически, операция деления на $ g_<>(x) $ (с остатком) порождает два разных линейных отображения. Если $ \deg g(x) = m $ при $ 0<m\le n $, то операция нахождения остатка — это отображение $ \mathbb P_ \mapsto \mathbb P_ $, а операция нахождения частного — это отображение $ \mathbb P_ \mapsto \mathbb P_ $.

Пример 2. В том же линейном пространстве $ \mathbb P_^<> $ операция дифференцирования

$$ \frac:\ p(x) <\color < \longmapsto>> p'(x) $$ является отображением $ \mathbb P_^<> $ в $ \mathbb P_^<> $ линейным поскольку $$\frac (\alpha_1 p_1(x) + \alpha_2 p_2(x))= \alpha_1 \frac p_1(x) + \alpha_2 \frac p_2(x) \ . $$ Прообраз любого элемента $ \mathbb P_^<> $ неединствен: $ \frac(\frac<1> <2>x^2 + \ const)=x $.

Пример 3. Операцию нахождения первообразной:

$$ \int_<0>^:\ \begin p(x) & <\color < \longmapsto>> & \int_<0>^ p(t) d\, t \\ a_0x^n+a_1x^+\cdots+a_n & <\color < \longmapsto>> & \displaystyle \fracx^+\fracx^+\cdots+a_nx \end $$ тоже можно рассматривать как линейное отображение $ \mathbb P_n <\color < \longmapsto>> \mathbb P_ $. При этом прообраз каждого полинома из $ \mathbb P_ $ (если существует) будет единствен.

Пример 4. Линейная форма от переменных $ x_<1>,\dots,x_n $:

$$\mathcal A(x_1,\dots,x_n)=a_1x_1+\dots+a_nx_n,\quad \_^ \subset \mathbb R $$ является примером линейного отображения $ \mathbb R^_<> $ в $ \mathbb R_<> $. Здесь тоже прообразов у одного и того же элемента из $ \mathbb W_<> $ может быть несколько: $$\mathcal A(x_1,x_2)=2x_1-x_2 \ \mbox < отображает вектора >\ X_1=[0,0] \ \mbox < и >\ X_2=[1,2] \ \mbox < в >\ 0 \ .$$

Пример 5. Обобщением предыдущего примера является отображение $ \mathcal A: \mathbb R^n \longmapsto \mathbb R^m $, задаваемое

$$ \mathcal A \left(\begin x_1 \\ x_2 \\ \vdots \\ x_n \end \right) = \left(\begin a_<11>x_1+a_<12>x_2 + \cdots + a_<1n>x_n \\ \dots \\ a_x_1+a_x_2 + \cdots + a_x_n \end \right)= $$ $$ = \left(\begin a_ <11>& a_<12>& \dots & a_ <1n>\\ \dots & & & \dots \\ a_ & a_& \dots & a_ \end \right) \cdot \left(\begin x_1 \\ x_2 \\ \vdots \\ x_n \end \right) $$ при произвольной вещественной матрице. Оно является линейным — в отличие от похожего на него отображения $$ \begin \tilde <\mathcal A>\left(\begin x_1 \\ x_2 \\ \vdots \\ x_n \end \right) &= \left(\begin a_<11>x_1+a_<12>x_2 + \cdots + a_<1n>x_n +b_1 \\ \dots \\ a_x_1+a_x_2 + \cdots + a_x_n + b_m \end \right)= \\ &=\left(\begin a_ <11>& a_<12>& \dots & a_ <1n>\\ \dots & & & \dots \\ a_ & a_& \dots & a_ \end \right) \cdot \left(\begin x_1 \\ x_2 \\ \vdots \\ x_n \end \right)+ \left(\begin b_1 \\ \vdots \\ b_m \end \right) \end $$ при хотя бы одном из чисел $ b_1,\dots,b_ $ отличном от нуля. В самом деле, если записать последнее в матричном виде: $$ \tilde<\mathcal A>(X)=A\cdot X+ \mathcal B, $$ то $$ \tilde<\mathcal A>(\alpha X)=A\cdot (\alpha X)+ \mathcal B \ne \alpha \tilde<\mathcal A>(X)= \alpha \left(A\cdot X+ \mathcal B \right). $$ Для этого отображения свойство линейности не выполняется. Для отображений такого типа приходится расширять множество линейных отображений: см. ☟ AФФИННОЕ ОТОБРАЖЕНИЕ.

Пример 6. Предыдущим примерам можно дать и геометрическую интерпретацию. Так, линейное отображение $ \mathbb R^3 \longmapsto \mathbb R^3 $:

$$\left(\begin x \\ y \\ z \end \right) \longmapsto \left(\begin x \\ y \\ 0 \end \right) $$ задает ортогональную проекцию вектора $ X=(x,y,z) $ на плоcкость $ z=0 $. Можно рассматривать его и как отображение $ \mathbb R^ <3>\longmapsto \mathbb R^2 $. Проецирование же на произвольное подпространство может быть задано с помощью матрицы. Так, например, отображение $$\left(\begin x \\ y \\ z \end \right) \longmapsto \frac<1> <3>\left(\begin 2 & -1 & -1 \\ -1& 2 & -1 \\ -1 & -1 & 2 \end \right) \left(\begin x \\ y \\ z \end \right) $$ задает ортогональную проекцию вектора $ X_<> $ на многообразие $ x+y+z=0 $.

Пример 7. В линейном пространстве $ \mathbb R^ $ матриц порядка $ m\times n_<> $ с вещественными элементами определим два отображения:

$$ X \mapsto A\cdot X \quad u \quad X \mapsto X \cdot B $$ умножения слева на фиксированную матрицу $ A_ <\ell\times m>$ и умножения справа на также фиксированную матрицу $ B_ $. Оба отображения являются линейными. Линейным также будет и отображение $$ X \mapsto A\cdot X \cdot B \ . $$ При дополнительных условиях $ m=n,\ell=k $ линейным будет и отображение $$ X \mapsto A\cdot X + X \cdot B \ . $$ Оно отображает множество квадратных матриц порядка $ n_<> $ во множество квадратных матриц порядка $ k_<> $.

Пример 8. В пространстве полиномов с вещественными коэффициентами от $ m_<> $ переменных $ x_1,x_2,\dots,x_ $ степени не выше $ n_<> $ рассмотрим отображение

$$ f(x_1,x_2,\dots,x_m) \mapsto \operatorname (f)= \left(\frac<\partial f><\partial x_1>, \frac<\partial f><\partial x_2>, \dots, \frac<\partial f> <\partial x_m>\right) \ . $$ Здесь вектор $ \operatorname (f) $ называется градиентом функции $ f_<> $. Это отображение будет линейным. Для его записи используют следующий формализм. Вводят в рассмотрение специальный вектор, называемый набла 2) $$ \nabla = \left(\frac<\partial ><\partial x_1>, \frac<\partial ><\partial x_2>, \dots, \frac<\partial > <\partial x_m>\right) \ . $$ Умножение этого вектора на функцию $ f_<> $ имеет результатом именно градиент: $$ \nabla \cdot f = \operatorname (f) \ . $$ Умножение же этого вектора по правилу скалярного произведения на вектор $ F= (f_1,f_2,\dots,f_m) $, состоящий из $ m_<> $ полиномов, порождает отображение этого вектора в полином: $$ \operatorname

(F) = \langle \nabla, F \rangle =\frac<\partial f_1 ><\partial x_1>+ \frac<\partial f_2 ><\partial x_2>+ \dots+ \frac<\partial f_m > <\partial x_m>\ ; $$ он называется дивергенцией вектора $ F_<> $. Это отображение $$ F \mapsto \operatorname

(F) $$ также будет линейным.

$$ f_j=a_x_1+\dots+a_x_m \quad npu \quad j\in\ <1,\dots,m\>$$ получим связь $ \operatorname

(F) $ с одним объектом матричного анализа. Каким именно?

Является ли линейным отображение

$$ X \longmapsto \operatorname (X) \ , $$ определенное в пространстве квадратных матриц порядка $ n_<> $? Здесь $ \operatorname (X) $ — след матрицы $ X_<> $.

Про линейное отображение $ \mathcal A $ пространства $ \mathbb R^<3>_<> $ в пространство $ \mathbb P_3^<> $ известно, что

$$ \mathcal A(1,0,1)=1+3\,x+x^3,\ \mathcal A(1,-1,0)=-1+x-x^2 \ . $$ Найти $ \mathcal A(-1,2,1) $.

Свойства линейных отображений

В настоящем пункте $ \mathbb O_<> $ означает нулевой вектор пространства $ \mathbb V_<> $, а $ \mathbb O' $ — нулевой вектор пространства $ \mathbb W_<> $.

Два линейных отображения $ \mathcal A $ и $ \mathcal B $ из $ \mathbb V_<> $ в $ \mathbb W_<> $ называются равными если $ \mathcal A(X)=\mathcal B(X) $ для любого $ X\in \mathbb V $. Нулевое отображение определяется условием $$<\mathcal O>(X)=\mathbb O' \quad npu \quad \forall \ X\in \mathbb V \ .$$

Теорема 1. Для любого линейного отображения $ \mathcal A(X) $:

а) $ \mathcal A(\mathbb O)=\mathbb O' $;

в) если система $ \ < \mathcal A(X_1),\dots,\mathcal A(X_k) \>$ линейно независима, то и система $ \ $ линейно независима.

Теорема 2. Линейное отображение отображает произвольное линейное многообразие пространства $ \mathbb V_<> $ в линейное же многообразие пространства $ \mathbb W_<> $.

Доказательство. Если $$ \mathbb M = X_0+\mathcal L(X_1,\dots,X_k) $$ $$ =\ , $$ то свойство линейности отображения $ \mathcal A_<> $ дает: $$ \mathcal A( \mathbb M) =\ <\mathcal A(X_0)\boxplus \alpha_1\mathcal A(X_1) \boxplus \dots \boxplus \alpha_k\mathcal A(X_k) \mid (\alpha_1,\dots,\alpha_k)\in \mathbb R^k \>= $$ $$ =\mathcal A(X_0) \boxplus \mathcal L(\mathcal A(X_1),\dots,\mathcal A(X_k)) \ . $$ Заметим, что в соответствии с теоремой 1, можно утверждать, что линейное отображение не увеличивает размерности отображаемого многообразия: $ \dim \mathcal A( \mathbb M) \le \dim \mathbb M $. ♦

Линейное отображение отображает произвольную прямую пространства $ \mathbb V_<> $ в прямую или точку пространства $ \mathbb W $.

Доказать, что линейное отображение отображает параллельные многообразия пространства $ \mathbb V_<> $ в параллельные же многообразия пространства $ \mathbb W_<> $.

Теорема 3. Пусть $ \ $ — произвольный базис $ \mathbb V_<> $, а $ Y_1,\dots,Y_n $ — произвольные векторы из $ \mathbb W_<> $. Существует единственное линейное отображение $ \mathcal A: \mathbb V \longmapsto \mathbb W $ такое, что$$ \mathcal A(X_1)=Y_1,\dots,\mathcal A(X_n)=Y_n \ .$$

Доказательство. Поскольку векторы $ X_1,\dots,X_ $ — базисные, то существует и единственно разложение любого $ X\in \mathbb V_<> $: $ X=x_1X_1+\cdots+x_nX_n $. Зададим отображение $ \mathcal A: \mathbb V \longmapsto \mathbb W $ формулой $$\mathcal A(X) = x_1Y_1\boxplus \dots \boxplus x_nY_n \ . $$ Легко проверить свойство его линейности. Кроме того: $$\mathcal A(X_j)=\mathcal A(0\cdot X_1+\dots+1\cdot X_j+\dots+0\cdot X_n)= $$ $$ =0\cdot Y_1 \boxplus \dots \boxplus 1\cdot Y_j \boxplus \dots \boxplus 0\cdot Y_n=Y_j,$$ т.е. оно удовлетворяет условиям теоремы.

Предположим теперь, что существует еще одно отображение $ \mathcal B(X) $, удовлетворяющее этим условиям: $ \mathcal B(X_j)=Y_j $. Тогда $$\mathcal A(X)=x_1Y_1 \boxplus \cdots \boxplus x_nY_n= $$ $$ =x_1\mathcal B(X_1) \boxplus \cdots \boxplus x_n\mathcal B(X_n)=\mathcal B(X),$$ и, на основании определения, $ \mathcal A(X)=\mathcal B(X) $. ♦

Отображение $ <\mathcal S>: \mathbb V \longmapsto \mathbb W $ называется суммой линейных отображений $ \mathcal A $ и $ \mathcal B $ если $ \mathcal S(X)=\mathcal A(X) \boxplus \mathcal B(X) $ для $ \forall X\in \mathbb V_<> $. Отображение $ \mathcal F:\mathbb V \longmapsto \mathbb W $ называется произведением линейного отображения $ \mathcal A_<> $ на число (скаляр) $ \lambda_<> \in \mathbb R $ если $ <\mathcal F>(X)=\lambda \cdot \mathcal A(X) $ для $ \forall X\in \mathbb V_<> $.

Пример. В пространстве полиномов $ \mathbb P_n $ операцию нахождения второй производной

$$ \frac:p(x) \longmapsto p''(x)$$ тоже можно рассматривать как линейное отображение $ \mathbb P_n \longmapsto \mathbb P_ $. Линейным также будет и отображение $$ \frac\times \Box + 2 \frac\times \Box: \ p(x) \ \longmapsto \ p''(x)+2 p'(x) \ .$$

Теорема 5. Множество $ <\mathcal H>om(\mathbb V,\mathbb W) $ всех линейных отображений из $ \mathbb V_<> $ в $ \mathbb W_<> $ образует линейное пространство и$$\dim <\mathcal H>om(\mathbb V,\mathbb W) = \dim \mathbb V \cdot \dim \mathbb W \ .$$

Ядро и образ линейного отображения

Для линейного отображения $ \mathcal A $ его ядром 3) называется множество векторов из $ \mathbb V_<> $, отображающихся в $ \mathbb O' \in \mathbb W $: $$\mathcaler (\mathcal A)= \left\ \ ; $$ а его образом называется множество всех векторов из $ \mathbb W_<> $, для каждого из которых существует прообраз из $ \mathbb V_<> $: $$\mathcalm (\mathcal A)= \left\ \ .$$

Теорема 1. $ \mathcaler (\mathcal A) $ и $ \mathcalm(\mathcal A) $ являются линейными подпространствами соответствующих пространств.

Для линейного отображения $ \mathcal A_<> $ его дефектом называется размерность ядра, а его рангом — размерность образа: $$ \operatorname(\mathcal A )=\dim (\mathcaler (\mathcal A )) , \ \operatorname(\mathcal A )= \dim (\mathcalm (\mathcal A )) \ . $$ Отображение называется невырожденным если $ \operatorname(\mathcal A )=0 $.

Теорема 2. Линейное отображение $ \mathcal A $ невырождено тогда и только тогда, когда у каждого образа существует единственный прообраз.

Доказательство. Необходимость. Если $ \mathcal A $ невырождено, то $ \mathcaler (\mathcal A )=\ <\mathbb O\>$, т.е. единственным вектором из $ \mathbb V_<> $, отображающимся в $ \mathbb O' \in \mathbb W $ должен быть $ \mathbb O_<> $. Если предположить неединственность прообраза для какого-то $ Y\in \mathbb W $: $ Y=\mathcal A (X_1)=\mathcal A (X_2) $ при $ X_1\ne X_2 $, то $$\mathbb O'=\mathcal A (X_1)-\mathcal A (X_2)=\mathcal A (X_1-X_2)$$ и получаем противоречие с единственностью прообраза у $ \mathbb O' $.

Достаточность. Пусть $ \mathcal A (X_1)\ne \mathcal A (X_2) $ для любых $ X_1\ne X_2 $. Если бы $ \mathcaler (\mathcal A ) $ имело ненулевую размерность, то существовал бы $ X\ne \mathbb O $ такой, что $ \mathcal A (X)=\mathbb O' $, что противоречило бы предыдущей фразе: $ \mathcal A (X)= \mathcal A (\mathbb O) $. ♦

Теорема 3. Если $ \\> $ — произвольный базис $ \mathbb V_<> $, то $ \mathcalm (\mathcal A) $ совпадает с линейной оболочкой образов этих векторов$$ \mathcalm (\mathcal A) =<\mathcal L>\left(\mathcal A (X_1),\dots, \mathcal A (X_n) \right) \ .$$

Доказательство. Действительно, любой вектор $ Y \in \mathcalm (\mathcal A) $ является образом какого-то вектора $ X=x_1X_1+\cdots+x_nX_n $, тогда на основании линейности отображения: $$ Y=\mathcal A (X)=x_1\mathcal A (X_1) \boxplus \cdots \boxplus x_n \mathcal A (X_n) \in <\mathcal L>\left(\mathcal A (X_1),\dots, \mathcal A(X_n) \right) \ .$$ Таким образом $$\mathcalm (\mathcal A) \subset <\mathcal L>\left(\mathcal A (X_1),\dots, \mathcal A (X_n) \right) \ .$$ Обратно, поскольку векторы $ \mathcal A (X_1),\dots, \mathcal A (X_n) $ принадлежат $ \mathcalm (\mathcal A) $, то по теореме 1 и любая линейная комбинация этих векторов должна принадлежать $ \mathcalm (\mathcal A) $: $$<\mathcal L>\left(\mathcal A (X_1),\dots, \mathcal A (X_n) \right) \subset \mathcalm (\mathcal A) \ .$$ Из двух взаимных включений множеств следует их равенство. ♦

Пример. Найти ядро и образ отображения $ \mathbb R^3 \longmapsto \mathbb R^4 $

$$ \mathcal A \left(\begin x_1 \\ x_2 \\ x_3 \end \right)= \left(\begin x_3 \\ 0 \\x_1+x_2+x_3 \\ x_1+x_2-x_3 \end \right) \ . $$

Решение. Для определения $ \mathcaler (\mathcal A) $ найдем фундаментальную систему решений системы уравнений $$\left\< \begin x_3 &=&0 \\ 0 &=&0 \\ x_1+x_2+x_3 &=&0 \\ x_1+x_2-x_3 &=&0 \end \right. \quad \Longrightarrow X_1= \left(\begin -1 \\ 1 \\0 \end \right) $$ Имеем $ \operatorname(\mathcal A )=1 $ и $ \mathcaler (\mathcal A)= \mathcal L (X_1) $.

Теперь для нахождения $ \mathcalm (\mathcal A) $ воспользуемся теоремой 3: базис следует искать среди векторов $$Y_1=\mathcal A \left(\begin 1 \\ 0 \\0 \end \right)= \left(\begin 0 \\ 0 \\ 1 \\ 1 \end \right), \ Y_2=\mathcal A \left(\begin 0 \\ 1 \\0 \end \right)= \left(\begin 0 \\ 0 \\ 1 \\ 1 \end \right), $$ $$ Y_3=\mathcal A \left(\begin 0 \\ 0 \\1 \end \right)= \left(\begin 1 \\ 0 \\ 1 \\ -1 \end \right) \ . $$ Имеем: $ \operatorname(\mathcal A )=2 $ и $ \mathcalm (\mathcal A) = \mathcal L (Y_1,Y_3) $. ♦

Пример. Найти ядро и образ отображения пространства полиномов $ \mathbb P_3 $ в $ \mathbb P_2 $, задаваемого формулой:

Решение. Для начала проверим, что это отображение именно $ \mathbb P_3 \mapsto \mathbb P_2 $, т.е. при таком отображении происходит понижение степени полинома, по крайней мере на $ 1_<> $. И действительно, если $ p(x)=a_0x^3+a_1x^2+a_2x+a_3 $, то $$ x^2 p^ <\prime \prime>(x) + p^ <\prime>(x) — 6 p(x) \equiv $$ $$ \equiv (-4\,a_1+3\,a_0)x^2+(2\,a_1-6\,a_2)x+(a_2-6\,a_3) \ . $$ Теперь понятно, что $ \mathcalm (\mathcal A) \subset \mathbb P_2 $, а, на самом деле, это включение может быть заменено на равенство. Действительно, в соответствии с теоремой 2, имеем: $$ \mathcalm (\mathcal A)= <\mathcal L>\left(\mathcal A (1),\mathcal A (x),\mathcal A (x^2),\mathcal A (x^3) \right)= $$ $$ = <\mathcal L>\left(-6,\,-6\,x+1 ,\, -4\,x^2+2\,x ,\, 3\,x^2 \right) = \mathbb P_2 $$ поскольку три из четырех получившихся полиномов линейно независимы.

Теперь найдем $ \mathcaler (\mathcal A) $, или, в альтернативной формулировке, подмножество решений дифференциального уравнения $$ x^2 p^ <\prime \prime>(x) + p^ <\prime>(x) — 6 p(x)=0 $$ во множестве $ \mathbb P_3 $ (полиномов степени не выше третьей). Воспользуемся уже выведенной выше формулой для образа произвольного полинома $ p(x) \in \mathbb P_3 $. Этот образ будет тождественно равным нулю полиномом при выполнении условий $$ -4\,a_1+3\,a_0=0,\ 2\,a_1-6\,a_2=0,\ a_2-6\,a_3=0 \ . $$ Решаем эту систему: $$ a_0=\frac<4> <3>a_1,\ a_2=\frac<1> <3>a_1,\ a_3=\frac<1> <18>a_1 \ . $$ Таким образом, $$ \mathcaler (\mathcal A) = \left\ < \lambda (24\,x^3+18\,x^2+6\,x+1) \mid \lambda \in \mathbb R \right\>\ . $$ ♦

Теорема 5. Имеет место равенство:

$$ \dim \mathbb V=\dim \left( \mathcaler (\mathcal A) \right) + \dim \left( \mathcalm (\mathcal A) \right) = \operatorname(\mathcal A )+ \operatorname(\mathcal A ) \ .$$

Доказательство ☞ ЗДЕСЬ.

Теорема 6. Пусть $ \mathbb V_1 $ — линейное подпространство $ \mathbb V_<> $, а $ \mathbb W_1 $ — линейное подпространство $ \mathbb W $, причем

$$ \dim \mathbb V_1 + \dim \mathbb W_1 =\dim \mathbb V \ . $$ Тогда существует линейное отображение $ \mathcal A : \mathbb V \longmapsto \mathbb W $ такое, что $$ \mathcaler (\mathcal A ) =\mathbb V_1 , \quad \mathcalm (\mathcal A )=\mathbb W_1 \ . $$

Определенные в настоящем пункте множества $ \mathcaler (\mathcal A) $ и $ \mathcalm(\mathcal A) $ позволяют полностью решить и следующую задачу:

Задача. Установить множество всех прообразов вектора $ Y \ne \mathbb O^ <\prime>$ при линейном отображении $ \mathcal A_<> $ .

Теорема 7. Если $ Y \not\in \mathcalm(\mathcal A) $, то у вектора $ Y \in \mathbb W $ не существует прообраза в $ \mathbb V_<> $. Если $ X_ <0>\in \mathbb V $ — какой-то из прообразов вектора $ Y_<> $, то все множество прообразов этого вектора является линейным многообразием в $ \mathbb V_<> $, а именно: $$ X_0 + \mathcaler (\mathcal A) \ . $$

Матрица линейного отображения

Рассмотрим линейное отображение $ \mathcal A: \mathbb V \longmapsto \mathbb W $, и пусть $ \ $ — базис $ \mathbb V_<> $, а $ \ $ — базис $ \mathbb W_<> $. Найдем координаты векторов $ \mathcal A(X_1),\dots,\mathcal A(X_n) $ в базисе $ \ $: $$ \left\< \begin \mathcal A(X_1)&=& <\color\alpha >_<11>Y_1 \boxplus <\color\alpha >_<21>Y_2 \boxplus \dots \boxplus <\color\alpha >_Y_m, \\ \mathcal A(X_2)&=& <\color\alpha >_<12>Y_1 \boxplus <\color\alpha >_<22>Y_2 \boxplus \dots \boxplus <\color\alpha >_Y_m, \\ \dots & & \dots, \\ \mathcal A(X_n)&=&\alpha_<1n>Y_1 \boxplus \alpha_<2n>Y_2 \boxplus \dots \boxplus \alpha_Y_m. \end \right. $$ Матрица $$ <\mathbf A>= \left(\begin <\color\alpha > _ <11>& <\color\alpha >_<12>& \dots & \alpha_ <1n>\\ <\color\alpha > _ <21>& <\color\alpha >_<22>& \dots & \alpha_ <2n>\\ \vdots & & & \vdots \\ <\color\alpha > _ & <\color\alpha >_& \dots & \alpha_ \end \right)_, $$ по столбцам которой стоят координаты образов базисных векторов, называется матрицей линейного отображения $ \mathcal A_<> $ в выбранных базисах.

Теорема 1. Координаты произвольного вектора

$ X=x_1X_1+\dots+x_nX_n $ и его образа $ \mathcal A (X)=y_1Y_1 \boxplus \dots \boxplus y_mY_m $ связаны формулой: $$ \left(\begin y_1 \\ \vdots \\ y_m \end \right) = <\mathbf A>\left(\begin x_1 \\ x_2 \\ \vdots \\ x_n \end \right) \ . $$

Доказательство. С помощью приведенных выше формул для $ \mathcal A (X_1), \dots, \mathcal A (X_n) $ получаем: $$ \begin \mathcal A (X)&=&\mathcal A (x_1X_1+\dots+x_nX_n)=x_1\mathcal A (X_1) \boxplus \dots \boxplus x_n\mathcal A (X_n)= \\ &=&x_1 (\alpha_<11>Y_1 \boxplus \dots \boxplus \alpha_Y_m) \boxplus \dots \boxplus x_n(\alpha_<1n>Y_1 \boxplus \dots \boxplus \alpha_Y_m)= \\ &=&\underbrace <(x_1\alpha_<11>+\dots+x_n\alpha_<1n>)>_Y_1 \boxplus \dots \boxplus \underbrace<(x_1\alpha_+\dots+x_n\alpha_)>_Y_m, \end $$ откуда и следует утверждение теоремы. ♦

Пример. Найти матрицу линейного отображения

Решение. $$ \mathcal A(\mathfrak e_1)= \left[ \begin 0 \\ 0 \\ 1 \\ 1 \end \right]=0\cdot \mathfrak E_<_1>+0\cdot \mathfrak E_<_2>+1\cdot \mathfrak E_<_3>+1\cdot \mathfrak E_ <_4>;\quad \mathcal A(\mathfrak e_2)= \left[ \begin 0 \\ 0 \\ 1 \\ 1 \end \right]=0\cdot \mathfrak E_<_1>+0\cdot \mathfrak E_<_2>+1\cdot \mathfrak E_<_3>+1\cdot \mathfrak E_ <_4>; $$ $$ \mathcal A(\mathfrak e_3)= \left[ \begin 1 \\ 0 \\ 1 \\ -1 \end \right]=1\cdot \mathfrak E_<_1>+0\cdot \mathfrak E_<_2>+1\cdot \mathfrak E_<_3>-1\cdot \mathfrak E_ <_4>. $$ Матрица отображения $ \mathcal A_<> $ в выбранных базисах: $$ \mathbf A= \left(\begin 0 & 0 & 1 \\ 0 & 0 & 0 \\ 1& 1 & 1 \\ 1 & 1 & -1 \end \right) $$ совпадает с матрицей коэффициентов при переменных $ x_1,x_2,x_3 $ в выражениях координат вектора $ \mathcal A(X) $. ♦

Пример. Найти матрицу линейного отображения пространства полиномов $ \mathbb P_3 $ в $ \mathbb P_2 $, задаваемого формулой:

$$ \mathcal A \left(p(x)\right) = x^2 p^ <\prime \prime>(x) + p^ <\prime>(x) — 6 p(x) \ . $$ Базисом пространства $ \mathbb P_3 $ выбран $ \ <1,x,x^2,x^3\>$, а базис пространства $ \mathbb P_2 $ состоит из полиномов Лежандра $$ \<2>(3\,x^2-1) \> \ .$$

Решение. В предыдущем ПУНКТЕ уже были получены выражения: $$ \mathcal A(1)=-6,\ \mathcal A(x)=-6\,x+1,\ \mathcal A(x^2)=-4\,x^2+2\,x ,\ \mathcal A(x^3)=3\,x^2 \ .$$ Если бы базис пространства $ \mathbb P_2 $ составляли полиномы, входящие в базис исходного пространства, т.е. $ \ <1,x,x^2\>$, то матрица линейного отображения построилась бы достаточно просто: $$ \mathbf B= \left( \begin -6 & 1 & 0 & 0 \\ 0 &-6 & 2 & 0 \\ 0 & 0 & -4 & 3 \\ \end \right) \ . $$ Однако базис пространства $ \mathbb P_2 $ отличается от $ \ <1,x,x^2\>$ в последнем полиноме: $ P_2(x) \not\equiv x^2 $. Координаты $ \mathcal A(1) $ и $ \mathcal A(x) $ остаются прежними, а вот $ \mathcal A(x^2) $ и $ \mathcal A(x^3) $ приходится переписывать под базис из полиномов Лежандра: $$ -4\,x^2+2\,x \equiv a_<13>\cdot 1 + a_<23>\cdot x + a_ <33>\cdot \left( \frac<1><2>(3\,x^2-1) \right) \ . $$ Откуда получаем: $ a_<13>=-4/3,\ a_<23>=2,\ a_<33>=-8/3 $. Аналогично $$ 3\,x^2\equiv P_0(x)+2\,P_2(x) $$ и, следовательно, матрица линейного отображения: $$ \mathbf A= \left( \begin -6 & 1 & -4/3 & 1 \\ 0 &-6 & 2 & 0 \\ 0 & 0 & -8/3 & 2 \\ \end \right) \ . $$ ♦

Теорема 2. Существует изоморфизм между линейным пространством $ <\mathcal H>om(\mathbb V,\mathbb W) $ (линейных отображений из $ \mathbb V_<> $ в $ \mathbb W_<> $) и линейным пространством матриц $ \mathbb R^ $.

Теорема 3. Если $ A_<> $ — матрица линейного отображения $ \mathcal A_<> $ в каких-то выбранных базисах пространств $ \mathbb V_<> $ и $ \mathbb W_<> $, то

$$\operatorname (\mathcal A)=\operatorname( A ),\ \operatorname (\mathcal A)=n-\operatorname( A ) \ .$$

Ядро линейного отображения $$ Y=AX \quad \mbox < при >\quad X\in \mathbb R^n, Y\in \mathbb R^m, \quad A \in \mathbb R^ $$ часто называется ядром матрицы $ A_<> $ или нуль-пространством матрицы $ A_<> $ и также обозначается $ <\mathcal K>er (A) $. Наряду с определением ядра матрицы через свойства отображения $ AX $, можно дать ему и другую интерпретацию:

Теорема 4. Если в пространстве $ \mathbb R_<>^ $, рассматриваемом как пространство $ n_<> $-строк, ввести скалярное произведение формулой

$$ \langle X,Y \rangle=x_1y_1+x_2y_2+\dots+x_ny_n \quad npu \quad X=[x_1,x_2,\dots,x_n],\ Y=[y_1,y_2,\dots,y_n] , $$ то $ <\mathcal K>er (A) $ образует ортогональное дополнение линейной оболочки строк этой матрицы в пространстве $ \mathbb R_<>^ $: $$ <\mathcal K>er (A) \bot \mathcal L ( A^<[1]>, A^<[2]>,\dots, A^ <[m]>),\ <\mathcal K>er (A) \oplus \mathcal L ( A^<[1]>, A^<[2]>,\dots, A^ <[m]>) = \mathbb R_<>^ \ . $$

Дефектом матрицы 4) $ A_<> $ будем называть размерность ядра этой матрицы, или, что то же, число элементов фундаментальной системы решений системы линейных однородных уравнений $ AX=\mathbb O $. В соответствии с результатами, приведенными ☞ ЗДЕСЬ: $$ \operatorname(A) = n — \mathfrak r \ npu \ \mathfrak r = \operatorname(A) . $$

Вернемся теперь к общему случаю линейного пространства.

Задача. Как изменяется матрица линейного отображения $ \mathcal A_<> $ при изменении базисов?

Теорема 5. Пусть $ \<<\mathfrak X>_1,\dots,<\mathfrak X>_n \> $ — новый базис пространства $ \mathbb V_<> $, $ \< <\mathfrak Y>_1,\dots,<\mathfrak Y>_m \> $— новый базис $ \mathbb W_<> $, и в этих базисах линейное отображение $ \mathcal A $ имеет матрицу $ <\mathbf B>$. Если $ C_<> $ — матрица перехода от старого базиса к новому в пространстве $ \mathbb V_<> $, а $ D_<> $ — матрица перехода от старого базиса к новому в пространстве $ \mathbb W_<> $, то

Доказательство. Действительно, координаты произвольного вектора $$ X=x_1X_1+\dots+x_nX_n = <\mathfrak x>_1 <\mathfrak X>_1+\dots+ <\mathfrak x>_n <\mathfrak X>_n \ ,$$ и его образа $$ Y =\mathcal A(X)=y_1Y_1 \boxplus \dots \boxplus y_mY_m= <\mathfrak y>_1<\mathfrak Y>_1 \boxplus \dots \boxplus <\mathfrak y>_m<\mathfrak Y>_m $$ связаны следующими соотношениями: с одной стороны, на основании теоремы 1, $$ \left(\begin y_1 \\ \vdots \\ y_m \end \right) = <\mathbf A>\left(\begin x_1 \\ x_2 \\ \vdots \\ x_n \end \right), \qquad \left(\begin <\mathfrak y>_1 \\ \vdots \\ <\mathfrak y>_m \end \right) = <\mathbf B>\left(\begin <\mathfrak x>_1 \\ <\mathfrak x>_2 \\ \vdots \\ <\mathfrak x>_n \end \right) \ . $$ с другой стороны, на основании результатов пункта ☞ ПРЕОБРАЗОВАНИЕ КООРДИНАТ ПРИ ЗАМЕНЕ БАЗИСА, $$ \left(\begin x_1 \\ x_2 \\ \vdots \\ x_n \end \right)=C \left(\begin <\mathfrak x>_1 \\ <\mathfrak x>_2 \\ \vdots \\ <\mathfrak x>_n \end \right), \qquad \left(\begin y_1 \\ \vdots \\ y_m \end \right)=D \left(\begin <\mathfrak y>_1 \\ \vdots \\ <\mathfrak y>_m \end \right). $$ Получаем цепочку равенств: $$ <\mathbf B>\left(\begin <\mathfrak x>_1 \\ <\mathfrak x>_2 \\ \vdots \\ <\mathfrak x>_n \end \right)= \left(\begin <\mathfrak y>_1 \\ \vdots \\ <\mathfrak y>_m \end \right) =D^<-1>\left(\begin y_1 \\ \vdots \\ y_m \end \right)=D^ <-1><\mathbf A>\left(\begin x_1 \\ x_2 \\ \vdots \\ x_n \end \right)=D^ <-1> <\mathbf A>C \left(\begin <\mathfrak x>_1 \\ <\mathfrak x>_2 \\ \vdots \\ <\mathfrak x>_n \end \right). $$ Поскольку равенство справедливо для любого столбца координат, то оно справедливо и для столбцов $$ \left(\begin 1 \\ 0 \\ \vdots \\ 0 \end \right) \ , \ \left(\begin 0 \\ 1 \\ \vdots \\ 0 \end \right) \ ,\dots, \ \left(\begin 0 \\ 0 \\ \vdots \\ 1 \end \right) \ . $$ Объединяя полученные $ n_<> $ равенств в одно матричное, получаем $ <\mathbf B>E = D^ <-1> <\mathbf A>C E $, где $ E_<> $ — единичная матрица порядка $ n_<> $. Отсюда и следует утверждение теоремы. ♦

Канонический вид матрицы линейного отображения

Задача. Подобрать базисы пространств $ \mathbb V_<> $ и $ \mathbb W_<> $ так, чтобы матрица заданного линейного отображения $ \mathcal A $ имела наиболее простой вид.

Найдем относительный базис $ \mathbb V_<> $ над $ \mathcaler (\mathcal A) $, т.е. базис $ \mathcaler (\mathcal A) $ дополним до базиса $ \mathbb V_<> $: $$ \>\> \gets \ \mbox < относительный базис >\ \mathbb V \ \mbox < над >\ \mathcaler (\mathcal A) $$ $$ \+1>,\dots,X_ \> \gets \ \mbox < базис >\ \mathcaler (\mathcal A) $$ Было доказано (см. ☞ теорему 4 ), что $ \<\mathcal A(X_1),\dots,\mathcal A(X_<<\mathfrak r>>) \> \subset \mathbb W $ является базисом $ \mathcalm (\mathcal A) $. Составим базис $ \mathbb W_<> $ ее дополнением: $$ \<\mathcal A(X_1),\dots,\mathcal A(X_<<\mathfrak r>>)\> \gets \ \mbox < базис >\ \mathcalm (\mathcal A) $$ $$ \< Y_<<\mathfrak r>+1>,\dots,Y_\> \gets \ \mbox < относительный базис >\ \mathbb W \ \mbox < над >\ \mathcalm (\mathcal A) $$

Теорема. В выбранных базисах матрица линейного отображения $ \mathcal A $ имеет следующий канонический вид:

Доказательство. Разложим образы базисных векторов $ \ $ по базису пространства $ \mathbb W $: $$ \begin \mathcal A(X_1) & = 1\cdot \mathcal A(X_1) & \boxplus 0 \cdot \mathcal A(X_2) & \boxplus \dots & \boxplus 0\cdot \mathcal A(X_<\mathfrak r>)& \boxplus 0\cdot Y_<<\mathfrak r>+1>&\boxplus\dots &\boxplus 0\cdot Y_m, \\ \mathcal A(X_2) & = 0\cdot \mathcal A(X_1) & \boxplus 1 \cdot \mathcal A(X_2) & \boxplus \dots & \boxplus 0\cdot \mathcal A(X_<\mathfrak r>)& \boxplus 0\cdot Y_<<\mathfrak r>+1>&\boxplus \dots & \boxplus 0\cdot Y_m, \\ \dots & & & \dots \\ \mathcal A(X_<\mathfrak r>) & = 0\cdot \mathcal A(X_1) & \boxplus 0 \cdot \mathcal A(X_2) & \boxplus \dots & \boxplus 1\cdot \mathcal A(X_<\mathfrak r>)& \boxplus 0\cdot Y_<<\mathfrak r>+1>&\boxplus \dots & \boxplus 0\cdot Y_m, \end $$ а $ \mathcal A(X_<<\mathfrak r>+1>)=\mathbb O^<\prime>,\dots, \mathcal A(X_)=\mathbb O^ <\prime>$ по определению $ \mathcaler (\mathcal A) $. ♦

Матричный формализм

Настоящий пункт может быть пропущен при первоначальном чтении.

В частном случае отображения $ \mathbb R^ $ в $ \mathbb R^ $, задаваемого матрицей в стандартных базисах пространств, результат последнего пункта можно переформулировать в следующем виде.

Теорема. Любую матрицу $ A_ $ ранга $ \mathfrak r > 0 $ можно представить в виде произведения

Здесь матрица $ \tilde C $ соответствует матрице $ C^ <-1>$ из теоремы предыдущего пункта.

Пример. Представить матрицу

$$ A = \left( \begin 2 & — 1 & 0 \\ -2/3 & 5/3 & 4/3 \\ 2 & — 1 & 0 \\ -2/3 & 5/3 & 4/3 \end \right) $$ в виде произведения из теоремы.

Решение. Здесь $ \operatorname (A) =2 $, так что $$ A_d= \left(\begin 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 0 \\ 0 & 0 & 0 \end \right) \, . $$ Для нахождения матрицы $ C $ из теоремы предыдущего пункта ищем базис ядра отображения $ AX $, т.е. попросту говоря, фундаментальную систему решений системы уравнений $ AX=\mathbb O $. Можно взять $ X=[1,2,-2]^ <\top>$. Этот столбец будет третьим столбцом матрицы $ C $. Первые два — любые линейно независимые с этим столбцом. Например $$ C= \left(\begin 1 & 0 & 1 \\ 0 & 1 & 2 \\ 0 & 0 & -2 \end \right) \, . $$ Теперь умножаем столбцы $ C_ <[1]>$ и $ C_ <[2]>$ на матрицу $ A $ (слева). Полученные столбцы $$ D_<[1]>=\left[2,-2/3,2,-2/3\right]^<\top>, \ D_<[2]>=\left[-1,5/3,-1,5/3\right]^ <\top>$$ будут первыми столбцами искомой матрицы $ D $. Оставшиеся два выбираем произвольными линейно независимыми с уже найденными. $$ D= \left( \begin 2 & — 1 & 1 & 0 \\ -2/3 & 5/3 & 0 & 1 \\ 2 & -1 & 0 & 0 \\ -2/3 & 5/3 & 0 & 0 \end \right), \quad \tilde C= C^ <-1>= \left( \begin — 1 & 0 & 1/2 \\ 0 & 1 & 1 \\ 0 & 0 & -1/2 \end \right) \, . $$ ♦

Линейный оператор

Линейное отображение векторного пространства $ \mathbb V_<> $ в себя $$ \mathcal A : \mathbb V \longmapsto \mathbb V $$ называется линейным преобразованием $ \mathbb V_<> $ или линейным оператором на $ \mathbb V_<> $. Подробнее ☞ ЗДЕСЬ.

Аффинное отображение

Линейные отображения пространства $ \mathbb V_<> $ в пространство $ \mathbb W_<> $ составляют подмножество более широкого класса отображений.

Рассмотрим пример $ 5_<> $ ☞ ЗДЕСЬ. Отображение пространства $ \mathbb R^_<> $ в пространство $ \mathbb R^ $, задаваемое соотношением $$ \begin \tilde <\mathcal A>\left(\begin x_1 \\ x_2 \\ \vdots \\ x_n \end \right) &= \left(\begin a_<11>x_1+a_<12>x_2 + \cdots + a_<1n>x_n +b_1 \\ \dots \\ a_x_1+a_x_2 + \cdots + a_x_n + b_m \end \right)= \\ &=\left(\begin a_ <11>& a_<12>& \dots & a_ <1n>\\ \dots & & & \dots \\ a_ & a_& \dots & a_ \end \right) \cdot \left(\begin x_1 \\ x_2 \\ \vdots \\ x_n \end \right)+ \left(\begin b_1 \\ \vdots \\ b_m \end \right) \end $$ будет линейным отображением при условии, что $ b_1=0,\dots, b_m=0 $ и не будет линейным отображением при хотя бы одном из чисел $ b_1,\dots,b_ $ отличном от нуля. Тем не менее, по своему внешнему виду отображение из $ \mathbb R^_<> $ в $ \mathbb R^ $, задаваемое в матричном виде как $ A\, X + \mathcal B $ напоминает линейную функцию $ a\, x+b $, действующую в $ \mathbb R $. Кажется очень несправедливым лишать подобные отображения эпитета линейный, однако же именно это и произошло в линейной алгебре и геометрии.

Аффинным 5) отображением линейного векторного пространства $ \mathbb V_<> $ с операцией сложения векторов, обозначаемой $ +_<> $, в линейное векторное пространство $ \mathbb W_<> $ с операцией сложения векторов, обозначаемой $ \boxplus_<> $, называется функция вида $$ \mathcal A(X) \boxplus_<> \mathcal B \ npu \ X \in \mathbb V \ . $$ Здесь $ \mathcal A $ — линейное отображение $ \mathbb V_<> $ в $ \mathbb W_<> $, а $ \mathcal B $ — некоторый вектор пространства $ \mathbb W_<> $.

Основное геометрическое свойство аффинного отображения проявилось в ☞ ПУНКТЕ для отображения линейного.

Теорема. Аффинное отображение отображает произвольное линейное многообразие пространства $ \mathbb V_<> $ в линейное же многообразие пространства $ \mathbb W_<> $. Аффинное отображение отображает параллельные многообразия пространства $ \mathbb V_<> $ в параллельные же многообразия пространства $ \mathbb W_<> $.

Аффинное отображение отображает произвольную прямую пространства $ \mathbb V_<> $ в прямую или точку пространства $ \mathbb W $.

Почему рассматриваются только линейные отображения?

Почему во всех вузовских курсах алгебры не рассматриваются более сложные отображения, задаваемые, например, нелинейными полиномами: $$ \left( \begin x_1 \\ x_2 \\ x_3 \end \right) \mapsto \left( \begin x_1^4-\sqrt <2>x_1^2x_3 + 17\, x_2^5+2\, x_1 — 3\,x_3-14 \\ x_2^<18>— x_2^7+x_1x_2^4x_3^6-x_1-5\,x_2+2 \\ x_2x_3^3+x_3-6 \\ x_1-2\,x_2+6\,x_3-33 \end \right) \ ? $$ — Да потому что про них мало что понятно. Попытки обобщения на нелинейный случай практически любого понятия, введенного для линейного отображения, приводят к нерешенной задаче. Так, для обобщения понятия ядра придется решить не решенную на настоящий момент 16-ю проблему Гильберта; еще одна нерешенная проблема — проблема якобиана — связана с существованием обратного к полиномиальному отображению.

В одном частном случае нелинейные отображения сравнительно хорошо изучены — это отображения $ \mathbb R^2 \mapsto \mathbb R^2 $, заданные условиями: $$ \left( \begin x \\ y \end \right) \mapsto \left( \begin u(x,y) \\ v(x,y) \end \right) \quad npu \quad \frac<\partial u><\partial x>=\frac<\partial v><\partial y>, \ \frac<\partial u><\partial y>=-\frac<\partial v> <\partial x>\ ; $$ (функции $ u_<> $ и $ v_<> $ — не обязательно полиномы). Последние два условия называются условиями Коши-Римана (Даламбера-Эйлера); из них следует, что каждая из функций $ u_<> $ и $ v_<> $ является гармонической функцией, т.е. удовлетворяет тождествам: $$ \frac<\partial^2 u><\partial x^2>+\frac<\partial^2 u><\partial y^2>\equiv 0,\quad \frac<\partial^2 v><\partial x^2>+\frac<\partial^2 v> <\partial y^2>\equiv 0 \ . $$ Подобные отображения рассматриваются в разделе математики, известном как КОМПЛЕКСНЫЙ АНАЛИЗ или теория функций комплексной переменной (ТФКП).

Как же исследовать нелинейные отображения в общем случае? — Ну, по крайней мере, можно попытаться свести их исследование к линейному случаю. Рассмотрим пример отображения из начала пункта $$ \left( \begin x_1 \\ x_2 \\ x_3 \end \right) \mapsto \left( \begin x_1^4-\sqrt <2>x_1^2x_3 + 17\, x_2^5+2\, x_1 — 3\,x_3-14 \\ x_2^<18>— x_2^7+x_1x_2^4x_3^6-x_1-5\,x_2+2 \\ x_2x_3^3+x_3-6 \\ x_1-2\,x_2+6\,x_3-33 \end \right) = $$ $$ =\left( \begin -14 \\ 2 \\ -6 \\ -33 \end \right) + \left( \begin 2\, x_1 — 3\,x_3 \\ -x_1-5\,x_2 \\ x_3 \\ x_1-2\,x_2+6\,x_3 \end \right) + \dots $$ В разложении каждого элемента вектора отбросим все члены степени выше первой. В результате мы получили отображение, которое можно представить в матричном виде $$ \left( \begin x_1 \\ x_2 \\ x_3 \end \right) \mapsto \underbrace<\left( \begin -14 \\ 2 \\ -6 \\ -33 \end \right)>_<=\mathcal B>+ \underbrace<\left( \begin 2 & 0 & — 3 \\ -1 & -5 & 0 \\ 0 & 0 & 1 \\ 1 & -2 & 6 \end \right)>_ <=A>\left( \begin x_1 \\ x_2 \\ x_3 \end \right) \ . $$ Это новое отображение является аффинным отображением пространства $ \mathbb R^ <3>$ в пространство $ \mathbb R^ <4>$. Таким образом, исходное, существенно нелинейное, отображение $ \mathcal F(X) $ фактически заменили аффинным $ \tilde<\mathcal A>(X)=AX+\mathcal B $. Насколько такая замена оправдана? — Ну, по крайней мере, в одной точке эти отображения совпадают: $ \mathcal F(\mathbb O) = \tilde <\mathcal A>(\mathbb O) $. Трудно ожидать, что они будут совпадать еще где-нибудь. Однако же, в малой окрестности точки $ \mathbb O $ значения этих двух функций оказываются близкими! $$ \begin \mathcal F \left( \begin 0.01 \\ -0.02\\ 0.07 \end \right)= \left( \begin -14.19000994 \\ 2.090000000 \\ -5.930006860 \\ -32.53000000 \end \right); & \mathcal F \left( \begin 0.05 \\ 0.12\\ -0.14 \end \right)= \left( \begin -13.47907577 \\ 1.349999642 \\ -6.140329280 \\ -34.03000000 \end \right); & \mathcal F \left( \begin -0.30 \\ 0.25\\ -0.24 \end \right)= \left( \begin -13.82475143 \\ 1.049938741 \\ -6.243456000 \\ -35.24000000 \end \right) ; \dots \\ \tilde <\mathcal A>\left( \begin 0.01 \\ -0.02\\ 0.07 \end \right)= \left( \begin -14.19000000 \\ 2.090000000 \\ -5.930000000 \\ -32.53000000 \end \right) ; & \tilde <\mathcal A>\left( \begin 0.05 \\ 0.12\\ -0.14 \end \right)= \left( \begin -13.48000000 \\ 1.350000000\\ -6.140000000 \\ -34.03000000 \end \right) & \tilde <\mathcal A>\left( \begin -0.30 \\ 0.25\\ -0.24 \end \right)= \left( \begin -13.88000000 \\ 1.050000000 \\ -6.240000000 \\ -35.24000000 \end \right); \dots \end $$ Иными словами, в некоторой достаточно малой окрестности 6) точки $ X_0=\mathbb O_<> $ нелинейное отображение аппроксимируется аффинным. А чем аппроксимировать за пределами этой окрестности, скажем, в окрестности вектора $ X_0=[1,-1,1]^\top $? — Для этого придется привлекать аппарат разложения нелинейных функций нескольких переменных в ряды Тейлора. К счастью, функции нашего примера являются полиномиальными, поэтому этот ряд не будет содержать бесконечного числа членов. Воспользовавшись материалом пункта ☞ ФОРМУЛА ТЕЙЛОРА, получим: $$ \mathcal F \left( \begin x_1 \\ x_2\\ x_3 \end \right) = \left( \begin -31-\sqrt <2>\\ 9 \\ -6 \\ -24 \end \right)+ \left( \begin (6-2\,\sqrt<2>)(x_1-1) &+ 85\, (x_2+1) & +(-\sqrt<2>-3)(x_3-1)\\ &-34\,(x_2+1) & +6\,(x_3-1) \\ &(x_2+1) & -2\,(x_3-1)\\ (x_1-1) &- 2\,(x_2+1) & +6\,(x_3-1) \end \right)+ \dots $$ Перепишем второе слагаемое в матричном виде: $$ = \left( \begin -31-\sqrt <2>\\ 9 \\ -6 \\ -24 \end \right)+ \left( \begin 6-2\,\sqrt <2>&85& -\sqrt<2>-3\\ 0 &-34 & 6 \\ 0&1& -2\\ 1 &- 2 & 6 \end \right)\left( \begin x_1-1 \\ x_2+1 \\ x_3-1 \end \right) + \dots $$ В общем же случае, если $$ \mathcal \left( \begin x_1 \\ x_2\\ \vdots \\ x_n \end \right)= \left( \begin f_1(x_1,\dots,x_n) \\ \vdots \\ f_m(x_1,\dots,x_n) \end \right), $$ то, в окрестности вектора $ X_0= (x_<01>,x_<02>,\dots,x_<0n>)^ <\top>$ его можно аппроксимировать аффинным отображением $$ \tilde <\mathcal A>\left( \begin y_1 \\ y_2\\ \vdots \\ y_n \end \right)= \underbrace<\left( \begin f_1(x_<01>,\dots,x_<0n>) \\ \vdots \\ f_m(x_<01>,\dots,x_<0n>) \end \right)>_<=\mathcal F(X_0)>+ \underbrace<\left( \begin <\partial f_1>/ <\partial x_1>& <\partial f_1>/ <\partial x_2>& \dots & <\partial f_1>/ <\partial x_n>\\ <\partial f_2>/ <\partial x_1>& <\partial f_2>/ <\partial x_2>& \dots & <\partial f_2>/ <\partial x_n>\\ \dots & && \dots \\ <\partial f_m>/ <\partial x_1>& <\partial f_m>/ <\partial x_2>& \dots & <\partial f_m>/ <\partial x_n>\end \right)>_<\mathbf J>\left( \begin y_1 \\ y_2\\ \vdots \\ y_n \end \right) \ , $$ которое рассматривается в окрестности $ Y_0=\mathbb O_<> $. Здесь все частные производные в матрице $ \mathbf J $ вычисляются в точке $ X_ <0>$. Матрица $$ \mathbf J = \left[ \frac<\partial f_j> <\partial x_k>\right]_ $$ называется матрицей Якоби системы из $ m_<> $ функций $ \,\dots,x_n)\> $ по переменным $ x_1,\dots,x_ $. Линейное отображение $$ \mathbf J \left( \begin y_1 \\ y_2\\ \vdots \\ y_n \end \right) $$ известно как дифференциал (первого порядка) функции $ \mathcal F(X) $ в точке $ X_0 $.

Подводя итог, можно сказать, что линейные (аффинные) отображения служат основой анализа отображений нелинейных — но этот анализ носит локальный характер: линеаризация адекватно приближает исходное нелинейное отображение лишь в малых областях значений аргументов.

Ядро (линейная алгебра)

В математике , то ядро из линейной карты , также известное как нуль — пространство или нуль — пространство , является линейным подпространством в области карты , которая отображается на нулевой вектор. [1] [2] То есть, учитывая линейное отображение L : VW между двумя векторными пространствами V и W , ядро L является векторным пространством всех элементов v из V таких, что L ( v ) = 0 , где 0 обозначает нулевой вектор в W , [3] или более символически:

Характеристики

Ядро L представляет собой линейное подпространство в области V . [4] [3] В линейном отображении L : VW два элемента V имеют один и тот же образ в W тогда и только тогда, когда их различие лежит в ядре L :

Из этого следует , что образ L является изоморфно к фактору из V по ядру:

В случае , когда V является конечномерным , то отсюда следует теорема ранга дефектности :

где, рангом мы понимаем размерность образа L , и ничтожности , что из ядра L . [5]

Когда V является пространством внутреннего произведения , фактор V / ker ( L ) можно отождествить с ортогональным дополнением в V к ker ( L ) . Это обобщение линейных операторов пространства строк или кообраза матрицы.

Приложение к модулям

Понятие ядра также имеет смысл для гомоморфизмов из модулей , которые являются обобщением векторных пространств , где скаляры являются элементами кольца , а не в поле . Область отображения — это модуль, а ядро ​​составляет подмодуль . Здесь понятия ранга и недействительности не обязательно применимы.

В функциональном анализе

Если V и W являются топологические векторные пространства таким образом, что W конечномерно, то линейный оператор L : VW является непрерывной тогда и только тогда , когда ядро L является замкнутым подпространством V .

Представление как матричное умножение

Матричное уравнение эквивалентно однородной системе линейных уравнений :

Таким образом, ядро ​​матрицы A совпадает с решением вышеуказанных однородных уравнений.

Свойства подпространства

Ядро матрицы A размера m × n над полем K является линейным подпространством в K n . То есть ядро A , множество Null ( A ), имеет следующие три свойства:

  1. Null ( A ) всегда содержит нулевой вектор , поскольку A0 = 0 .
  2. Если x ∈ Null ( A ) и y ∈ Null ( A ) , то x + y ∈ Null ( A ) . Это следует из дистрибутивности умножения матриц над сложением.
  3. Если x ∈ Null ( A ) и c — скалярcK , то cx ∈ Null ( A ) , поскольку A ( cx ) = c ( Ax ) = c0 = 0 .

Строковое пространство матрицы

Произведение A x может быть записано в терминах скалярного произведения векторов следующим образом:

Здесь 1 , . м обозначают строки матрицы A . Отсюда следует , что х находится в ядре А , тогда и только тогда , когда х является ортогональным (или перпендикулярно) к каждому из векторов — строк A (поскольку ортогональности определен как имеющий скалярное произведение 0).

Пространство строк или кообраз, из матрицы А является оболочкой из векторов — строк A . По приведенным выше рассуждениям ядро A является ортогональным дополнением к пространству строк. То есть, вектор х лежит в ядре А , тогда и только тогда , когда она перпендикулярна каждый вектор в пространстве строки A .

Размер строки пространства А называется ранг из А , а размерность ядра А называется недействительность из A . Эти величины связаны теоремой ранга – недействительности [5]

Оставшееся пустое пространство

Левое пространство нуль или Коядро , из матрицы A состоит из всех векторов — столбцов х , такие , что х T A = 0 Т , где Т означает транспонирование матрицы. Левый нуль — пространство А такое же , как ядро A T . Левое пустое пространство для A является ортогональным дополнением к колонку пространству от А , и двойственно коядру ассоциированного линейного преобразования. Ядро, строка пространства, столбец пространство, а левое пустое пространство для A является четыре основных подпространством , связанным с матрицей А .

Неоднородные системы линейных уравнений.

Ядро также играет роль в решении неоднородной системы линейных уравнений:

Если u и v — два возможных решения вышеуказанного уравнения, то

Таким образом, разность любых двух решений уравнения А х = Ь лежит в ядре A .

Отсюда следует, что любое решение уравнения A x = b может быть выражено как сумма фиксированного решения v и произвольного элемента ядра. То есть набор решений уравнения A x = b равен

С геометрической точки зрения это означает, что решение, заданное для A x = b, является переносом ядра A на вектор v . См. Также альтернативу Фредгольма и плоскость (геометрия) .

Иллюстрация

Ниже приводится простая иллюстрация вычисления ядра матрицы (см. § Вычисление методом исключения Гаусса ниже, где описаны методы, лучше подходящие для более сложных вычислений). Иллюстрация также затрагивает пространство строк и его связь с ядром.

Ядро этой матрицы состоит из всех векторов ( x , y , z ) ∈ R 3, для которых

которая может быть выражена как однородная система линейных уравнений, включающая x , y и z :

Те же линейные уравнения могут быть записаны в матричной форме как:

С помощью исключения Гаусса – Жордана матрица может быть уменьшена до:

Переписывая матрицу в виде уравнения, получаем:

Элементы ядра могут быть дополнительно выражены в параметрической форме следующим образом:

Поскольку c — свободная переменная, охватывающая все действительные числа, это может быть выражено одинаково хорошо как:

Ядро A является в точности набором решений этих уравнений (в данном случае линия, проходящая через начало координат в R 3 ). Здесь, так как вектор (-1, -26,16) Т представляет собой основу из ядра A . Недействительность A равна 1.

Следующие скалярные произведения равны нулю:

которая иллюстрирует , что векторы в ядре A ортогональны к каждому из векторов — строк A .

Эти два (линейно независимых векторов — строк) охватывают пространство строк -a плоскости , ортогональной к вектору (-1, -26,16) T .

С рангом 2 для A , нулевым значением 1 для A и размерностью 3 для A у нас есть иллюстрация теоремы о ранге-нуле.

Примеры

  • Если L : RmRn , то ядро L является множеством решений однородной системы линейных уравнений . Как на иллюстрации выше, если L — оператор: L ( Икс 1 , Икс 2 , Икс 3 ) знак равно ( 2 Икс 1 + 3 Икс 2 + 5 Икс 3 , — 4 Икс 1 + 2 Икс 2 + 3 Икс 3 ) <\ displaystyle L (x_ <1>, x_ <2>, x_ <3>) = (2x_ <1>+ 3x_ <2>+ 5x_ <3>, \; — 4x_ <1>+ 2x_ <2>+ 3x_ <3>)> то ядро L — это множество решений уравнений 2 Икс 1 + 3 Икс 2 + 5 Икс 3 знак равно 0 — 4 Икс 1 + 2 Икс 2 + 3 Икс 3 знак равно 0 <\ displaystyle <\ begin <7>2x_ <1>& \; + \; & 3x_ <2>& \; + \; & 5x_ <3>& \; = \; & 0 \\ — 4x_ <1>& \; + \; & 2x_ <2>& \; + \; & 3x_ <3>& \; = \; & 0 \ end >>
  • Обозначим через C [0,1] векторное пространство всех непрерывных вещественнозначных функций на интервале [0,1] и определим L : C [0,1] → R по правилу L ( ж ) знак равно ж ( 0,3 ) . <\ Displaystyle L (е) = е (0,3) <\ текст <.>>> Тогда ядро L состоит из всех функций fC [0,1], для которых f (0.3) = 0.
  • Пусть C ∞ ( R ) — векторное пространство всех бесконечно дифференцируемых функций RR , и пусть D : C ∞ ( R ) → C ∞ ( R ) — оператор дифференцирования : D ( ж ) знак равно d ж d Икс . <\ displaystyle D (f) = <\ frac ><\ text <.>>> Тогда ядро D состоит из всех функций из C ∞ ( R ), производные которых равны нулю, т.е. множества всех постоянных функций .
  • Пусть R ∞ — прямое произведение бесконечного числа копий R , и пусть s : R ∞ → R ∞ — оператор сдвига s ( Икс 1 , Икс 2 , Икс 3 , Икс 4 , … ) знак равно ( Икс 2 , Икс 3 , Икс 4 , … ) . <\ Displaystyle s (x_ <1>, x_ <2>, x_ <3>, x_ <4>, \ ldots) = (x_ <2>, x_ <3>, x_ <4>, \ ldots) <\ текст<.>>> Тогда ядро s — это одномерное подпространство, состоящее из всех векторов ( x1 , 0, 0,…).
  • Если V представляет собой внутреннее пространство продукта и W есть подпространство, ядро ортогональной проекцииVW является ортогональным дополнением к W в V .

Вычисление методом исключения Гаусса

Базис ядра матрицы может быть вычислена путем исключения Гаусса .

Для этого по матрице A размера m × n мы сначала строим матрицу с дополнениями по строкам [ А я ] , <\ displaystyle <\ begin A \\\ hline I \ end >,> где I — единичная матрица размера n × n .

Фактически, вычисление может быть остановлено, как только верхняя матрица находится в форме эшелона столбцов: оставшаяся часть вычислений состоит в изменении базиса векторного пространства, генерируемого столбцами, верхняя часть которых равна нулю.

Например, предположим, что

Помещение верхней части в эшелонированную форму столбцов с помощью операций с столбцами для всей матрицы дает

Последние три столбца B — нулевые столбцы. Следовательно, три последних вектора C ,

является основой ядра A .

Численный расчет

Проблема вычисления ядра на компьютере зависит от характера коэффициентов.

Точные коэффициенты

Если коэффициенты матрицы являются точно заданными числами, форма столбцов матрицы может быть вычислена с помощью алгоритма Барейсса более эффективно, чем с помощью исключения Гаусса. Еще более эффективно использовать модульную арифметику и китайскую теорему об остатках , которая сводит проблему к нескольким аналогичным задачам над конечными полями (это позволяет избежать накладных расходов, вызванных нелинейностью вычислительной сложности целочисленного умножения). [ необходима цитата ]

Для коэффициентов в конечном поле метод исключения Гаусса работает хорошо, но для больших матриц, которые встречаются в криптографии и вычислении базиса Гребнера , известны лучшие алгоритмы, которые имеют примерно такую ​​же вычислительную сложность , но быстрее и лучше работают с современным компьютерным оборудованием . [ необходима цитата ]

Вычисление с плавающей запятой

Для матриц, элементы которых являются числами с плавающей запятой , проблема вычисления ядра имеет смысл только для таких матриц, в которых количество строк равно их рангу: из-за ошибок округления матрица с плавающей запятой почти всегда имеет полный ранг. , даже если это аппроксимация матрицы гораздо меньшего ранга. Даже для полноранговой матрицы возможно вычислить ее ядро, только если она хорошо обусловлена , т. Е. Имеет низкое число обусловленности . [6] [ необходима ссылка ]

Даже для хорошо обусловленной матрицы полного ранга метод исключения Гаусса не работает правильно: он приводит к ошибкам округления, которые слишком велики для получения значимого результата. Поскольку вычисление ядра матрицы является частным случаем решения однородной системы линейных уравнений, ядро ​​может быть вычислено с помощью любого из различных алгоритмов, предназначенных для решения однородных систем. Современное программное обеспечение для этой цели — библиотека Lapack . [ необходима цитата ]

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *