Teorema da Triangularização de Schur e Diagonalização de Matrizes Normais

Teorema da Triangularização de Schur e Diagonalização de Matrizes Normais Reginaldo J Santos Departamento de Matemática-ICEx Universidade Federal de Minas Gerais http://wwwmatufmgbr/~regi 16 de novembro de 211

2 1 Resultados Preliminares Vamos chamar o conjunto das matrizes m n cujas entradas são números complexos de M mn (C) Para uma matriz A = (a ij ) M mn (C), definimos o conjugado da matriz A, denotado por A como sendo a matriz B = (b ij ) M mn (C) dada por b ij = a ij, em que, se a ij = α ij + iβ ij, então a ij = α ij iβ ij Para as matrizes de M mn (C) além das propriedades que são válidas para matrizes com entradas que são números reais, são válidas as seguintes propriedades, cuja demonstração deixamos a cargo do leitor: (p) Se A M mp (C) e B M pn (C), então (q) Se A M mn (C) e α C, então AB = A B αa = αb Definição 1 Para cada inteiro positivo n, o espaço (vetorial) C n é definido pelo conjunto de todas as n-uplas ordenadas X = (x 1,, x n ) de números reais Definição 2 (a) Definimos o produto escalar ou interno de dois vetores X = (x 1,, x n ) C n e Y = (y 1,, y n ) C n por X Y = x 1 y 1 + x 2 y 2 + + x n y n = n x i y i i=1 (b) Definimos a norma de um vetor X = (x 1,, x n ) C n por X = X X = x 1 2 + + x n 2 = n i=1 x i 2

3 Escrevendo os vetores como matrizes colunas, o produto interno de dois vetores X = x 1 x n e Y = pertencentes a C n pode ser escrito em termos do produto de matrizes como X Y = X t Y y 1 y n São válidas as seguintes propriedades para o produto escalar e a norma de vetores de C n que são análogas àquelas que são válidas para vetores de R n Proposição 1 Se X, Y e Z são vetores de C n e α C, então (a) X Y = Y X; (b) (X + Y) Z = X Z + Y Z e X (Y + Z) = X Y + X Z (distributividade em relação à soma); (c) (αx) Y = α(x Y) e X (αy) = α(x Y); (d) X X = X 2 e X = se, e somente se, X = ; (e) αx = α X ; (f) X Y X Y (desigualdade de Cauchy-Schwarz); (g) X + Y X + Y (desigualdade triangular) Demonstração Sejam X, Y, Z C n e α C Usando o fato de que se os vetores são escritos como matrizes colunas, então o produto escalar pode ser escrito como o produto de matrizes, X Y = X t Y, e as propriedades da álgebra matricial, temos que (a) X Y = x 1 y 1 + x 2 y 2 + + x n y n = y 1 x 1 + + y n x n = Y X (b) (X + Y) Z = (X + Y) t Z = X t Z + Y t Z = X Z + Y Z e X (Y + Z) = X t (Y + Z) = X t Y + X t Z = X Y + X Z

4 (c) α(x Y) = α(x t Y) = (αx t )Y = (αx) t Y = (αx) Y e α(x Y) = α(x t Y) = X t (αy) = X t (αy) = X (αy) (d) X X é uma soma de quadrados, por isso é sempre maior ou igual a zero e é zero se, e somente se, todas as parcelas são iguais a zero (e) αx 2 = αx 1 2 + + αx n 2 = α 2 ( x 1 2 + + x n 2 ) = α 2 X 2 Tomando a raiz quadrada, segue-se o resultado (f) A norma de X λy é maior ou igual a zero, para qualquer λ complexo Assim, X λy 2 = (X λy) (X λy) = X 2 λy X λx Y + λ 2 Y 2, para qualquer λ complexo Tomando λ = X Y Y 2 obtemos X 2 X Y Y 2 Y X Y X X Y 2 X Y + Y 2 Y 4 Y 2 = X 2 X Y 2 Y 2 Logo, X Y X Y (g) Pelo item anterior temos que X + Y 2 = (X + Y) (X + Y) = X 2 + X Y + Y X + Y 2 X 2 + 2R(X Y) + Y 2 X 2 + 2 X Y + Y 2 X 2 + 2 X Y + Y 2 = ( X + Y ) 2 Tomando a raiz quadrada, segue-se o resultado Com o resultado anterior, podemos estender a definição de bases ortogonais e ortonormais para o espaço C n e provar, exatamente da mesma forma que é provado o resultado análogo para o R n (ver por exemplo [2]), o Teorema que garante que todo subespaço C n tem uma base ortonormal Teorema 2 (Gram-Schmidt) Seja {V 1,, V k } uma base de um subespaço W de C n Então, existe uma base {U 1,, U k } de W que é ortonormal e tal que o subespaço gerado por U 1,, U j é igual ao subespaço gerado por V 1,, V j para j = 1,, k

5 2 Resultados Principais Teorema 3 (Schur) Se A é uma matriz n n com entradas que são números complexos, então existe uma matriz unitária P (isto é, P t = P 1 ) e uma matriz triangular superior T tal que A = PTP t Demonstração O resultado é obvio se n = 1 Vamos supor que o resultado seja verdadeiro para matrizes (n 1) (n 1) e vamos provar que ele é verdadeiro para matrizes n n Como todo polinômio com coeficientes complexos tem uma raiz, a matriz A tem um autovalor λ 1 C Isto significa que existem autovetores associados a λ 1 Seja V 1 um autovetor de norma igual a 1 associado a λ 1 Sejam V 2,, V n vetores tais que {V 1,, V n } é uma base ortonormal de C n (isto pode ser conseguido aplicando-se o processo de ortogonalização de Gram-Schmidt a uma base de C n que contenha V 1 ) Seja P 1 = [ V 1 V n ] Como AV 1 = λ 1 V 1 e AV 2,, AV n são combinações lineares de V 1,, V n, temos que em que M = AP 1 = [ AV 1 AV n ] = [ V 1 V n ]M = P 1 M, (1) λ 1 M2 B Como estamos supondo o resultado verdadeiro para matrizes (n 1) (n 1), então existe uma matriz unitária P 2 e uma matriz triangular superior T 2, ambas (n 1) (n 1), tais que B = P 2 T 2 P 2 t Seja 1 P 2 = P 2 Seja P = P 1P 2 P é unitária (verifique!) e pela equação (1) λ 1 M2 P 2 AP = (AP 1 )P 2 = P 1 MP 2 = P 1 B P 2

6 Mas, B P 2 = P 2 T 2 e assim, AP = P 1 1 P 2 λ 1 M2 P 2 T 2 = P 1P 2 λ 1 M2 P 2 T 2 = PT, em que T = Multiplicando-se à direita por Pt obtemos o resultado λ 1 M2 P 2 T 2 Teorema 4 Se A é uma matriz normal (isto é, AA t = A t A) n n com entradas que são números complexos, então existe uma matriz unitária P (isto é, P t = P 1 ) e uma matriz diagonal D tal que A = PDP t Demonstração O resultado é obvio se n = 1 Vamos supor que o resultado seja verdadeiro para matrizes (n 1) (n 1) e vamos provar que ele é verdadeiro para matrizes n n Como todo polinômio com coeficientes complexos tem uma raiz, então A matriz A tem um autovalor λ 1 C Isto significa que existem autovetores associados a λ 1 Seja V 1 um autovetor de norma igual a 1 associado a λ 1 Sejam V 2,, V n vetores tais que {V 1,, V n } é uma base ortonormal de C n (isto pode ser conseguido aplicando-se o processo de ortogonalização de Gram-Schmidt a uma base de C n que contenha V 1 ) Seja P 1 = [ V 1 V n ] Como AV 1 = λ 1 V 1 e AV 2,, AV n são combinações lineares de V 1,, V n, temos que AP 1 = [ AV 1 AV n ] = [ V 1 V n ]M = P 1 M, (2)

7 Multiplicando-se à esquerda (2) por Pt 1 obte- λ 1 m12 m 1n em que M = B mos M = P1AP t 1 Mas, M t M = (P t 1 AP 1) t (P t 1AP 1 ) = P t 1A t A t P 1 = P t 1A t A t P 1 = (P t 1AP 1 )(P t 1AP 1 ) = MM t, ou seja, a matriz M é normal enquanto (MM t ) 11 = λ 1 2 + m 12 2 + + m 1n 2, (M t M) 11 = λ 1 2 Portanto, M = λ 1 B com B uma matriz normal (n 1) (n 1) Como estamos supondo o resultado verdadeiro para matrizes (n 1) (n 1), então existe uma matriz unitária P 2, 1 (n 1) (n 1), tal que D 2 = P 2B t P 2 é diagonal Seja P 2 = P 2 Seja P = P 1 P 2 P é unitária (verifique!) e pela equação (2) AP = (AP 1 )P 2 = P 1 MP 2 = P 1 λ 1 B P 2

8 Mas, B P 2 = P 2 D 2 e assim, λ 1 AP = P 1 P 2 = D 2 PD, λ 1 em que D = D 2 Multiplicando-se à direita por Pt obtemos o resultado Referências [1] Michael Artin Algebra Prentice Hall, New Jersey, 1991 [2] Reginaldo J Santos Um Curso de Geometria Analítica e Álgebra Linear Imprensa Universitária da UFMG, Belo Horizonte, 21