Как найти след матрицы
Теорема. След матрицы равен сумме всех ее собственных значений и инвариантен относительно любого ортонормированного преобразования, е.
Доказательство. Для прямоугольных матриц имеем
где — компоненты матриц Используя равенство (2.151), получим
Как было доказано выше, собственные значения инвариантны относительно любого ортонормированного преобразования.
Поэтому любая функция от собственных значений также будет инвариантной.
Пример 2.16. Если — ковариационная или автокорреляционная матрица, то из вышеприведенной теоремы следует, что сумма дисперсий или вторых моментов отдельных переменных будет инвариантна относительно любого ортонормированного преобразования.
Теорема. След матрицы равен сумме всех ее собственных значений и инвариантен относительно любого ортонормированного преобразования, т. е.
Доказательство. Используя равенство получим
Пример 2.17. Пусть собственных значений являются выборкой, извлеченной из генеральной совокупности случайной величины к. Тогда можно вычислить все моменты распределения случайной величины X с помощью выражения
В частности, имеют место следующие соотношения;
Пример 2.18. Уравнение (2.154) можно применить для нахождения наибольшего собственного значения матрицы, поскольку
где — наибольшее собственное значение. Например, если выбрать то нужно четыре раза перемножить матрицы, т. е. , и для нахождения наибольшего собственного значения определить след матрицы
След (алгебра)
В линейной алгебре , то след квадратной матрицы А определяются как сумма ее диагональных коэффициентов и часто отметить , Тр ( ). След можно рассматривать как линейную форму в векторном пространстве матриц. Он проверяет тождество: Tr ( AB ) = Tr ( BA ) и, следовательно, инвариантен по подобию .
Аналогичным образом , если у является эндоморфизм из конечного мерного векторного пространства на коммутативным поле К , мы можем определить след оператора ¯u , например , как след его матрицы в любой основе .
В более общем плане , на алгебре А , след является линейной формой λ таким образом, что Х ( AB ) = λ ( ба ) . Это определение находится, в частности, при изучении алгебр фон Неймана, которые являются алгебрами операторов в гильбертовых пространствах .
Резюме
Примеры приложений
- В линейной алгебре след оператора u — это сумма его собственных значений, считая с кратностью. Например, след вращения равен 1 + 2 cos ( θ ) и, следовательно, обеспечивает угол поворота θ . р 3 <\ Displaystyle \ mathbb
^ <3>> - В теории Галуа след лежит в основе определения формы следа . Эта форма также используется в теории алгебраических чисел , например , для определения дискриминантого кольца из алгебраических чисел .
- В теории групповых представлений , след представления является его характер. Например, для представления конечной группы ее характер позволяет понять ее разложение в прямую сумму неприводимых представлений. Эта теория позволяет нам лучше понять структуру группы . Следовательно, мы находим использование этого инструмента при доказательстве теорем по этому вопросу, например , доказательств Бернсайда о разрешимых группах или о подгруппах в GL ( n ,) в рамках проблемы Бернсайда .
- При изучении групп Ли и всегда в связи с теорией представлений след позволяет нам определить форму Киллинга , которая является квадратичной формой на соответствующей алгебре Ли. Критерий Картана(еп) показывает важность. Например, форма Киллинга определяется как отрицательная тогда и только тогда, когда нейтральный компонент компактен ( теорема Майерса ).
- В дифференциальном исчислении на пространстве матриц след появляется как дифференциал определителя в единичной матрице.
- След также участвует в определении расходимости векторного поля, которое измеряет неспособность его потока сохранить объем.
Определения
След квадратной матрицы
с коэффициентами в коммутативном поле K (или только в коммутативном кольце ) его след, обозначенный Tr ( A ) , является скалярной суммой коэффициентов его главной диагонали :
Т р ( В ) знак равно ∑ я знак равно 1 нет в я я <\ displaystyle \ mathrm
Для всех квадратных матриц A и B (одного порядка) и для любого скаляра α∊ K проверяются следующие свойства:
Т р ( В + B ) знак равно Т р ( В ) + Т р ( B ) Т р ( α В ) знак равно α Т р ( В ) Т р ( В Т ) знак равно Т р ( В ) , <\ displaystyle <\ begin где Т обозначает транспонирование из A . Другими словами, след — это линейная форма на векторном пространстве ℳ n ( K ) квадратных матриц порядка n , инвариантная при транспонировании . Отображение Tr является линейной формой, его ядро является гиперплоскостью of n ( K ). Если теперь A и B являются матрицами ( n , m ) и ( m , n ) (не обязательно квадратными, но обеспечивающими квадратные матрицы путем умножения), мы имеем тождество: Т р ( В B ) знак равно Т р ( B В ) . <\ displaystyle <\ begin Предыдущее равенство приводит к следующему тождеству, действительному для любой квадратной матрицы A и для любой обратимой матрицы P того же порядка: Т р ( п — 1 В п ) знак равно Т р ( В ) . <\ displaystyle <\ begin Другими словами, след является « инвариантом подобия» для квадратных матриц заданного порядка, то есть две одинаковые матрицы имеют один и тот же след, что неудивительно, если нам известна связь между следом и характеристическим многочленом ( см. ниже ) и инвариантность подобия последнего . Мы можем показать с помощью довольно короткого доказательства, включающего матричные единицы (en) ( т.е. матрицы канонического базиса ℳ n ( K ), которые являются матрицами, у которых один коэффициент равен 1, а все остальные 0) что линейная форма на пространстве ℳ n ( K ), инвариантная по подобию, обязательно пропорциональна следу. Если след квадратной матрицы может быть определен без особых технических подробностей на любом коммутативном кольце, это не то же самое для следа эндоморфизма . Используя матричное представление , это недорого осуществимо для эндоморфизма векторного пространства ; более абстрактная конструкция, использующая тензорную алгебру , позволяет распространить концепцию на некоторые модульные эндоморфизмы — но не на все. Если Е является векторным пространством конечной размерности п , след эндоморфизма , обозначается , определяются как след матрицы ¯u в основании фиксированного заранее , чтобы Е . Это определение не зависит от произвольного выбора, потому что if является другой базой, « формула замены базы » показывает, что матрицы u соответственно в и подобны, поэтому (см. Выше ) имеют одинаковый след. ты ∈ L ( E ) <\ Displaystyle и \ в <\ mathcal Имеют место следующие свойства для всех эндоморфизмов , любое скалярное и любого ш ∈ GL ( Е ) (т.е. вес является автоморфизм Е ) ты , v ∈ L ( E ) <\ Displaystyle и, v \ in <\ mathcal Т р ( ты + v ) знак равно Т р ( ты ) + Т р ( v ) Т р ( α ты ) знак равно α Т р ( ты ) Т р ( ты ∘ v ) знак равно Т р ( v ∘ ты ) Т р ( ш — 1 ∘ ты ∘ ш ) знак равно Т р ( ты ) . <\ displaystyle <\ begin Другими словами: след — это линейная форма в векторном пространстве , инвариантная по сопряжению . L ( E ) <\ Displaystyle <\ mathcal Кроме того ,, где обозначает транспонированная карта из ц . Т р ( ты Т ) знак равно Т р ( ты ) <\ Displaystyle \ mathrm Используя тензорное сжатие , можно распространить понятие следа на эндоморфизмы проективных модулей конечного типа . Пусть ( E , g ) — евклидово пространство . Мы определяем биекцию (подробно описанную в соответствующем разделе Симметричная билинейная форма (соответственно эрмитова форма) статьи Самодобавляемый оператор ) между квадратичными формами q на E и симметричными операторами A на ( E , g ) следующим образом: q ( v ) знак равно грамм ( v , В v ) <\ Displaystyle д (v) = г (v, Av)>. След формы A называется следом квадратичной формы q относительно g . В евклидовых пространствах: Пусть A — квадратная матрица порядка n с коэффициентами в коммутативном кольце. Обозначим через p A ( X ) его характеристический многочлен, а c i — коэффициент при X i в p A ( X ) . Другими словами мы ставим п В ( Икс ) знак равно Det ( Икс я нет — В ) знак равно Икс нет + против нет — 1 Икс нет — 1 + ⋯ + против 1 Икс + против 0 <\ displaystyle p_ (X): = \ det (XI_ где I n обозначает единичную матрицу порядка n . Так, Тр ( В ) знак равно — против нет — 1 <\ displaystyle <\ textrm Докажем указанное равенство и, если (где λ i принадлежат коммутативному кольцу, содержащему коэффициенты A ), выполняется следующее равенство: Тр ( В ) знак равно ∑ я знак равно 1 нет λ я <\ displaystyle <\ textrm Частный случай коэффициентов в целочисленном кольце Предположим сначала, что кольцо коэффициентов целое . Тогда мы можем рассматривать A как матрицу с коэффициентами в коммутативном поле K , а именно как поле частных этого кольца. Затем мы ставим себя в поле L , содержащем К и где р является разделение , (например , его алгебраическое замыкание или поле разложения из р А ) и отметят: Λ я являются собственные из A , с учетом кратности. По теории тригонализации мы знаем, как найти треугольную квадратную матрицу T с коэффициентами в L и аналогичную матрице A , главная диагональ которой образована λ i . Используя инвариантность следа по подобию, заключаем: Тр ( В ) знак равно ∑ я знак равно 1 нет λ я <\ displaystyle <\ textrm Более того, если мы разработаем запись p A в множителях первой степени, сумма λ i появится как противоположность коэффициента при X n — 1 в этом полиноме. Таким образом, мы заключаем, что, если мы обозначим через c n — 1 этот коэффициент: Тр ( В ) знак равно — против нет — 1 <\ displaystyle <\ textrm Общий случай Мы больше не предполагаем, что A имеет коэффициенты в целочисленном кольце; тем не менее можно получить аналогичные результаты другим путем. При разработке определителя, который определяет характеристический многочлен по формуле с использованием перестановок , мы видим, что одночлен от X n — 1 появляется только в одном из n ! члены суммы, которая является произведением диагональных членов XI n — A , то есть: Затем след от A появляется как коэффициент при X n — 1 . Мы доказали формулу иначе: Тр ( В ) знак равно — против нет — 1 <\ displaystyle <\ textrm Теперь предположим, что характеристический многочлен A расщепляется, и отметим: разложение этого многочлена на множители первой степени. Разрабатывая этот продукт, мы получаем новое выражение c n — 1 ; объединив это с предыдущей формулой, мы получим: Тр ( В ) знак равно ∑ я знак равно 1 нет λ я <\ displaystyle <\ textrm Пусть q — многочлен (с коэффициентами в коммутативном кольце, содержащем указанное выше λ i и коэффициенты A ). Так : Тр [ q ( В ) ] знак равно ∑ я знак равно 1 нет q ( λ я ) <\ Displaystyle <\ textrm Если кольцо не повреждено, можно использовать использованные выше методы и обозначения. Матрица q ( A ) аналогична q ( T ) , а главная диагональ матрицы T образована q ( λ i ) . Выводим формулу. Эта формула остается в силе без предположения о целостности, доказательства [Какого?], Опирающегося на [Сомнительную информацию] предварительного рассмотрения случая неповрежденных колец [недостаточный источник] . Специализируя предыдущую формулу на одночлен q = X k , получаем: Тр ( В k ) знак равно ∑ я знак равно 1 нет λ я k <\ displaystyle <\ textrm В нулевой характеристике элементарные симметричные многочлены могут быть восстановлены полиномиально, начиная с сумм Ньютона, через тождества Ньютона . Следовательно, существуют универсальные полиномиальные формулы, позволяющие выразить коэффициенты характеристического полинома матрицы ( n , n ) как функцию следов ее степеней (и даже степеней с показателем, меньшим или равным n ). Приведу пример: против нет — 2 знак равно Тр ( В ) 2 — Тр ( В 2 ) 2 . <\ displaystyle c_ Вот это приложение: если является матрицей ( п , п ) с коэффициентами в поле нулевой характеристики и удовлетворяет :, то является нильпотентным . Т р ( В ) знак равно Т р ( В 2 ) знак равно ⋯ знак равно Т р ( В нет ) знак равно 0 <\ Displaystyle \ mathrm Для вещественного векторного пространства E конечной размерности определитель определяет отображение det из пространства операторов на E в R , которое является однородным степени n . Det числа ( у ) выражаются в виде полиномиальной функции в коэффициентах матрицы , представляющей U в основе любого Е . Функция Det поэтому дифференцируема . Его отличительная черта — это след . Другими словами, для любого оператора ц на Е , Det ( я + ты ) знак равно 1 + Тр ( ты ) + о ( ты ) <\ displaystyle <\ textrm где o ( u ) означает, что остаток незначителен по сравнению с u, когда u приближается к нулю. Как следствие, для любого оператора ц на Е , Det ( exp ( ты ) ) знак равно exp ( Тр ( ты ) ) <\ Displaystyle \ Det (\ ехр (и)) = \ ехр (<\ textrm В частности, экспонента от u является определителем 1 тогда и только тогда, когда u — оператор нулевого следа. Этот результат можно интерпретировать в теории групп Ли следующим образом. Приложение Det представляет собой непрерывный морфизм групп, из линейной группы GL ( S ) к R . Его ядро, набор операторов с определителем 1, поэтому является подгруппой GL ( E ), обозначаемой SL ( E ). Это классическая группа Ли , т.е. замкнутая подгруппа в GL ( E ). Геометрически, оператор принадлежит SL ( Е ) тогда и только тогда , когда он сохраняет объем лебегову E . Его алгебра Ли — это в точности множество операторов u с нулевым следом, обозначенным . s л ( E ) <\ Displaystyle <\ mathfrak На открытом U из Е , А векторное поле Х представляет собой приложение . Если это отображение липшицево, теорема Коши-Липшица подтверждает существование максимальных решений обыкновенного дифференциального уравнения Икс : U → р нет <\ displaystyle X: U \ rightarrow \ mathbb против ′ ( т ) знак равно Икс ( против ( т ) ) <\ Displaystyle с '(т) = Х (с (т))>(1). Поток X — это семейство диффеоморфизмов f t, которые отправляют x на c (t), где c — решение (1) с начальным условием c (0) = x . Поток определяется локально. Введем расхождение в X d я v ( Икс ) ( Икс ) знак равно Т р ( d Икс ( Икс ) ) <\ displaystyle <\ rm < где дЙ (х) дифференциал X в х , который является оператором на Е . Поток f t сохраняет объем Лебега тогда и только тогда, когда дивергенция равна нулю. Точнее, для любого вскрытия , адгезия которого входит в U , Ω (Это равенство позволяет расширить определение дивергенции, например, на ориентированные многообразия при наличии формы объема.) Форма Killing на это симметричная билинейная форма грамм <\ displaystyle <\ mathfrak B ( Икс , Y ) знак равно Тр ( объявление ( Икс ) ∘ объявление ( Y ) ) <\ Displaystyle B (X, Y) = <\ textrm Автоморфизмы алгебры Ли сохраняют форму Киллинга. В частности, ее присоединенное представление сохраняет B . Форма Киллинга была введена Эли Картаном для характеристики полупростоты алгебр Ли . Когда K = R , он также предоставляет информацию о связанной группе Ли. См . Критерий Картана (en) . грамм <\ displaystyle <\ mathfrak Пусть G будет группа Ли (например, замкнутая подгруппа GL ( E )). По определению его алгебра Ли — это пространство левоинвариантных векторных полей на G , снабженное скобкой Ли [,] (коммутатор векторного поля). Форма Киллинга ассоциируется Б определяет метрику псевдориманово биинвариантную на G . Если форма Киллинга B положительно определена, то ассоциированная метрика является римановой метрикой положительной кривизны. Из теоремы Мейерса следует, что G компактна. Есть другие ссылки. ( В ∣ B ) знак равно ∑ 1 ≤ я ≤ нет , 1 ≤ j ≤ п в я , j б я , j знак равно Т р ( т В B ) знак равно Т р ( т B В ) <\ displaystyle (A \ mid B) = \ sum _ <1 \ leq i n, 1 j p>a_ b_ = \ mathrm Таким образом, мы получили приятное описание канонического скалярного произведения на пространстве . р нет п <\ Displaystyle \ mathbb Если Н является евклидова или эрмитова , то сопряженный оператор оператора U на Н является оператором на H . Затем мы определяем следующее скалярное произведение на операторном пространстве на H : L ( ЧАС ) <\ Displaystyle <\ mathcal ( ты ∣ v ) знак равно Тр ( ты * v ) <\ Displaystyle (и \ середина v) = <\ textrm С этим определением очевидно, что самоассоциированные операторы и антисамоассоциированные операторы образуют два ортогональных подпространства в . Сложение — это ортогональная симметрия относительно пространства самосопряженных операторов. L ( ЧАС ) <\ Displaystyle <\ mathcal Пусть U — открытое множество вещественного векторного пространства, содержащее 0, и имеет класс C 2 . Гессиан Н из F в точке 0 является симметричной билинейной формой на Е , удовлетворяющая р нет <\ Displaystyle \ mathbb ж ( Икс ) — ж ( 0 ) знак равно d ж ( 0 ) ( Икс ) + ЧАС ( ж ) ( Икс , Икс ) + о ( ‖ Икс ‖ 2 ) <\ Displaystyle f (x) -f (0) = \ mathrm По определению лапласиан f в точке 0 является следом гессиана: Δ ж ( 0 ) знак равно Т р [ ЧАС ( ж ) ( 0 ) ] знак равно ∑ я знак равно 1 нет ∂ 2 ж ∂ Икс я 2 ( 0 ) . <\ displaystyle \ Delta f (0) = \ mathrm Функции класса C 2 нулевого лапласиана называются гармониками . Обязательно аналитические , эти функции используются, в частности, в комплексном и функциональном анализе . В частности, функции нулевого лапласиана являются решениями задачи Дирихле, которая представляет собой поиск экстремалей энергии Дирихле. Более того, определение лапласиана обобщается в дифференциальной геометрии для функций на римановых многообразиях ( оператор Лапласа-Бельтрами ), а также для более общих объектов, таких как дифференциальные формы . Включая эту более общую структуру , определение может быть дано следами билинейных форм. Нулевые лапласовские формы называются гармониками, и теория Ходжа показывает их важность. Для гладкой ориентированной поверхности S евклидова пространства средняя кривизна S по x является средним значением двух главных кривизны S по x . Формально эти кривизны являются собственными значениями квадратичной формы на касательной плоскости T x S , называемой второй фундаментальной формой S в точке x , отмеченной II x . Средняя кривизна S по x равна р 3 <\ Displaystyle \ mathbb м ( Икс ) знак равно Т р ( я я Икс ) 2 <\ Displaystyle м (х) = <\ гидроразрыва <\ mathrm Определение средней кривизны распространяется на гладкие подмногообразия N римановых многообразий. Его значение в x больше не является скаляром, а вектором, ортогональным T x N , который все еще определяется с помощью трасс. Подмногообразия нулевой средней кривизны называются минимальными и являются экстремалями риманова объема. Пусть H — гильбертово пространство с гильбертовым базисом ( e i ) i ∈ I (не обязательно счетным ). Ограниченный оператор ∈ ℒ ( Н ) , как говорят , чтобы иметь след , если (Эта сумма не зависит от выбора базиса Гильберта.) В этом случае положим Тр ( В ) знак равно ∑ я ∈ я ⟨ В е я | е я ⟩ . <\ displaystyle <\ textrm Операторы трассировки компактны . Они образуют идеал ( H ), отмеченный ℒ 1 ( H ), который является полным для нормы ‖ ‖ 1, определенной ниже. След Tr — это непрерывная линейная форма, положительно определенная на ℒ 1 ( H ). | Тр ( В ) | ≤ ‖ В ‖ 1 знак равно Тр ( В * В ) . <\ displaystyle | <\ textrm В конечномерном случае след оператора — это сумма диагональных коэффициентов матричного представления. Следующий пример является обобщением. Пусть μ есть мера Бореля на компакте K . Пусть f : K 2 → ℝ — непрерывное отображение. На пространстве Гильберта L 2 ( K , ℝ) функций из K в ℝ с суммируемых с квадратом , тем оператора ядра Определителем (или детерм и на том) квадратной матрицы я-го порядка (или определителем п-го порядка) А„хп=Ап= (ау) называется число, обозначаемое А„ (или А„ det/1) и определяемое по следующим правилам: при п = 1 Если Атх„ = (а,;), то А’„хт = (а,,). Например, если Свойства операции транспонирования: Решение: а) По формуле (13.9) б) По формуле (13.10) (При вычислении определителя 3-го порядка Аз использовали правило треугольников, согласно которому соответствующие произведения трех элементов матрицы берутся со знаками «+» и «—»: Определитель квадратной матрицы п-го порядка (или определитель п-го порядка) при любом п определяется более сложно. Он может быть вычислен с помощью разложения по элементам строки или столбца (теоремы Лапласа): где ay — элементы любой строки (столбца), Лц — алгебраическое дополнение элемента a-f Му — минор элемента а^ — определитель матрицы (п— 1)-го порядка, полученной из матрицы А вычеркиванием /-й строки и j- го столбца. ? Пример 13.3. Вычислить определитель Д3 матрицы из примера 13.2, разложив его по элементам строки (столбца). Решение. Раскладывая по элементам, например, 1-ой строки, получим по формуле (13.11) с учетом (13.12): Следом квадратной матрицы А п-то порядка (обозначается tr(А) (от английского слова «trace»)) называется сумма ее диагональных элементов: Свойства следа матриц: В частности, если А — (я xl) вектор-столбец, В =А, то где, напомним, АА и А А — соответственно квадратные матрицы я-го и 1-го порядков.
(A + B) & = & \ mathrm (A) + \ mathrm (B) \\\ mathrm (\ alpha A ) & = & \ alpha \ mathrm (A) \\\ mathrm (A ^ (A), \\\ end (AB) & = & \ mathrm (BA). \\\ end (P ^ <- 1>AP) & = & \ mathrm (A). \\\ end
След эндоморфизма
В векторном пространстве
(и)> B <\ displaystyle <\ mathcal >> B <\ displaystyle <\ mathcal >> B ′ <\ displaystyle <\ mathcal > ‘> B <\ displaystyle <\ mathcal >> B ′ <\ displaystyle <\ mathcal > ‘> (u + v) & = & \ mathrm (u) + \ mathrm (v) \\\ mathrm (\ alpha u ) & = & \ alpha \ mathrm (u) \\\ mathrm (u \ circ v) & = & \ mathrm (v \ circ u) \\\ mathrm (w ^ <- 1>\ circ u \ circ w) & = & \ mathrm (u). \ End (u ^ (u)> ты Т ∈ L ( E * ) <\ displaystyle u ^ В модуле
След квадратичной формы
Примеры
(\ mathrm
> _ > _ <п>\, \!> M σ знак равно ( м я j ) 1 ≤ я , j ≤ нет <\ displaystyle M _ <\ sigma>= (m_ ) _ <1 \ leq i, j n>\, \!>< м я j знак равно 1 s я σ ( я ) знак равно j м я j знак равно 0 s я нет о нет <\ displaystyle \ left \ <<\ begin (M _ <\ sigma>) = \ mathrm След, характеристический многочлен и собственные значения
> (A) = — c_ Характеристический след и полином
> (A) = \ sum _ ^ > (A) = \ sum _ ^ > (A) = — c_ > (A) = — c_ > (A) = \ sum _ ^ След матричного полинома
> [д (А)] = \ сумма _ <я = 1>^ <п>д (\ лямбда _ <я>)> . > (A ^ > (A) ^ <2>— <\ textrm > (A ^ <2>)> <2>>.> (A) = \ mathrm (A ^ <2>) = \ dots = \ mathrm (A ^ Приложения
Расхождение
> (u) + o (u)> > (и))> . (dX (x))>>>>> Форма убийства
> \ left (<\ textrm Канонический точечный продукт
( ^ (^ > (и ^ <*>v)> . Лапласиан
[H (f) (0)] = \ sum _ ^ Условия кривизны
(\ mathrm Операторы трассировки
> (A) = \ sum _ \ langle Ae_ | e_ \ rangle.> > (A) | \ leq \ | A \ | _ <1>= <\ textrm > ( <\ sqrt A>>).> Определитель и след квадратной матрицы