Diagonalização Matrizes Semelhantes e Matrizes Diagonalizáveis Nosso objetivo neste capítulo é estudar aquelas transformações lineares de R n para as quais existe pelo menos uma base em que elas são representadas por uma matriz diagonal Uma matriz diagonal é a matriz mais simples possível Note, no entanto, que não é possível encontrar para toda transformação linear uma base em que a transformação é representada por uma matriz diagonal: rotações, por exemplo, não podem ser representadas em geral por matrizes diagonais, pois uma rotação transforma um vetor em outro vetor com uma direção completamente diferente É possível provar que duas matrizes A e B representam a mesma transformação linear, com respeito a bases diferentes, se e somente se elas estão relacionadas através da seguinte equação B = P AP, para alguma matriz invertível P ; a matriz P é precisamente a matriz de mudança de coordenadas, quando passamos de uma base para a outra Assim, dada uma transformação linear, representada em uma certa base por uma matriz A, a questão de determinar se existe uma base na qual a tranformação linear é representada por uma matriz diagonal D se reduz a encontrar uma matriz invertível P tal que Isso motiva as seguintes definições D = P AP Definição Sejam A, B matrizes n n Dizemos que B é semelhante a A, se existe uma matriz invertível P tal que B = P AP Definição Dizemos que uma matriz A é diagonalizável, se ela é semelhante a uma matriz diagonal Autovalores e Autovetores Dada uma transformação linear T, suponha que exista alguma base em que T é representada por uma matriz diagonal, digamos por λ λ B = λ n Para os vetores desta base e =, e =,, e n =,
temos Be = λ e, Be = λ e,, Be n = λ n e n Isso mostra que, dada uma transformação linear T, seremos capazes de diagonalizar T (em outras palavras, encontrar uma base em que ela é representada por uma matriz diagonal) se e somente se formos capazes de encontrar n vetores linearmente independentes v, v,, v n tais que Tudo isso motiva as seguintes definições T v = λ v, T v = λ v,, T v n = λ n v n Definição Seja A uma matriz n n Dizemos que um número real λ é um autovalor de A se existir um vetor não nulo v de R n tal que Av = λv O vetor v é chamado um autovetor de A, correspondente ao autovalor λ Teorema Uma matriz A n n é diagonalizável se e somente se ela possui n autovetores linearmente independentes Prova: Suponha que A é diagonalizável, isto é, que exista uma matriz invertível P tal que D = P AP Em particular, segue que AP = DP Escreva P segundo suas colunas: Então e Comparando, concluímos que P = [V V V n ] AP = [AV AV AV n ] DP = [λ V λ V λ n V n ] AV = λ V, AV = λ V, AV n = λ n V n, isto é, as colunas de P são autovetores de A Como P é invertível, suas colunas são LI, logo encontramos n autovetores LI para A Reciprocamente, suponha agora que existam n vetores LI V, V,, V n tais que AV = λ V, AV = λ V,, AV n = λ n V n Defina uma matriz n n P por P = [V V V n ] Como as colunas de P são LI, segue que P é invertível Temos AP = A[V V V n ] = [AV AV AV n ] = [λ V λ V λ n V n ] = [V V V n ] λ λ λ n = P D
onde denotamos λ λ D = λ n Multiplicando ambos os lados da equação por P, obtemos P AP = D Corolário Se D = P AP, então as colunas da matriz P são n autovetores linearmente independentes de A Portanto, a matriz P pode ser obtida encontrando-se n autovetores LI de A O que não é surpreendente: a matriz P é exatamente a matriz da mudança de coordenadas de uma base B formada por autovetores da matriz A para a base canônica, onde se supõe que a matriz A está escrita; para obter D é necessário voltar para a base B através da mudança de coordenadas inversa P Exemplo Considere a transformação linear T : R R definida por ( T ((x, y, z)) = x 4 y + 7 z, x + y + z, x + 4 y ) z Esta transformação linear é representada na base {i, j, k} pela matriz A = 7 4 4 Mas, se tomarmos os vetores V = (,, ), V = (,, ) e V = (,, ), notamos o seguinte: T V = A = 4 = 4 = 4V, T V = A = = V, T V = A = 4 = = V Note que os vetores V, V, V são L I, logo eles também formam uma base para R Portanto, com relação à base {V, V, V }, a transformação linear T é representada pela matriz B = 4 Observe que a matriz A tem autovalores 4, e Autovetores correspondentes a estes autovalores são V = (,, ), V = (,, ) e V = (,, ) Segue que P =
Como concluímos que 4 P = = 4 4 4 5 4 = 4 7 4 4 4 4 5 4, Portanto, para determinar se uma matriz é diagonalizável, precisamos determinar antes de mais nada seus autovalores Isso pode ser feito da maneira a seguir Denotando por I a matriz identidade, então a equação Av = λv é equivalente a Av = λiv, ou (A λi)v = Portanto, λ será um autovalor de A se e somente se o sistema homogêneo (A λi)x = possuir soluções não-triviais Mas isso acontecerá se e somente se det(a λi) = A expressão det(a λi) é um polinômio de grau n em λ, logo concluímos que os autovalores de A são exatamente as raízes deste polinômio Este polinômio é chamado o polinômio característico de A Proposição Seja A uma matriz n n Os autovalores de A são as raízes do polinômio característico de A p(λ) = det(a λi) Em particular, uma matriz n n possui no máximo n autovalores distintos Exemplo Determine os autovalores da matriz a) A = ( ) b) ( cos θ sin θ B = sin θ cos θ ) Solução: Temos ( λ det(a λi) = det λ = λ 4λ + ) = ( λ) + 4 Este polinômio não tem raízes reais, pois = b 4ac = 6 = 6, logo a matriz A não tem autovalores Observe que ) A = ( isto é, A representa uma rotação de R por um ângulo de 45, seguida de uma dilatação por um fator de, portanto este resultado está de acordo com o que seria esperado Similarmente, a matriz em, 4
(b) representa uma rotação de R por um ângulo θ e nós temos ( ) cos θ λ sin θ det(b λi) = det = (cos θ λ) + sin θ sin θ cos θ λ = cos θ λ cos θ + λ + sin θ = λ λ cos θ + Como o discriminante deste polinômio é = b 4ac = 4 cos θ 4 = 4(cos θ ), ele só possui raízes reais se cos θ = ±, ou seja, para θ = ou θ = O primeiro corresponde à matriz identidade ( ) B =, cujos autovalores são as raízes de λ λ +, ou seja, todos iguais a, enquanto que o segundo corresponde à matriz ( ) B =, cujos autovalores são as raízes de λ + λ +, ou seja, todos iguais a São os únicos exemplos de rotações em R que podem ser representadas por matrizes diagonais Exemplo Determine os autovalores da matriz A = Solução: Temos det(a λi) = det = ( + λ) λ λ λ λ λ = ( + λ)[λ λ + ] λ + + 4 + λ = ( + λ)[λ λ + ] λ + ( ) λ As raízes de ( + λ)[λ λ + ] = são λ = e λ =, logo estes são os autovalores de A Uma vez encontrados os autovalores da matriz, para encontrar os autovetores basta resolver o sistema linear homogêneo (A λi)x = Como eles são as soluções de um sistema linear homogêneo, segue que os autovetores associados a um determinado autovalor λ formam um subespaço vetorial, que nós chamamos o autoespaço associado ao autovalor λ Proposição Seja A uma matriz n n Se λ é um autovalor de A, então os autovetores de A associados a λ são as soluções do sistema homogêneo (A λi)x = Vamos resumir tudo o que foi explicado acima no seguinte teorema 5
Teorema Seja A uma matriz n n A é diagonalizável se e somente se existe uma base para R n formada por autovetores de A Neste caso, ela é semelhante a uma matriz diagonal D cuja diagonal principal é formada pelos autovalores de A, cada um aparecendo tantas vezes quanto for a dimensão do autoespaço associado a ele Exemplo 4 Determine se a matriz do Exemplo é diagonalizável Se for, determine uma matriz diagonal semelhante a ela Solução: Já determinamos que A possui e como autovalores A será diagonalizável se e somente se pudermos formar uma base para R entre os autovetores associados a estes autovalores Os autovetores associados ao autovalor são as soluções do sistema homogêneo (A I)X =, ou seja, X = Resolvemos este sistema É fácil ver que sua matriz aumentada tem forma escalonada reduzida Obtemos então que o autoespaço associado a é α β α R : α, β R β Como ( α β, α, β) = α(,, ) + β(,, ), segue que uma base para este autoespaço é formada pelos vetores (,, ) e (,, ) Os autovetores associados ao autovalor são as soluções do sistema homogêneo (A + I)X =, ou seja, X = Resolvemos este sistema É fácil ver que sua matriz aumentada tem forma escalonada reduzida Obtemos então que o autoespaço associado a é γ γ R : γ R γ Como (γ, γ, γ) = γ(,, ), segue que uma base para este autoespaço é formada pelo vetor (,, ) 6
Os vetores (,, ), (,, ) e (,, ) são L I, como pode ser facilmente verificado, portanto concluímos que a matriz A é diagonalizável Ela é semelhante à matriz O seguinte resultado facilitará o trabalho de determinar a independência linear de autovetores Proposição Seja A uma matriz n n Sejam λ, λ autovalores distintos de A Suponha que {v,, v k } são autovetores L I associados a λ e {w,, w l } são autovetores L I associados a λ Então o conjunto {v,, v k, w,, w l } é L I O mesmo resultado vale para qualquer número de autovalores distintos de A Prova: Suponha que existem escalares x,, x k, y,, y l tais que x v + + x k v k + y w + + y l w l = () Multiplicando ambos os lados por A e usando o fato de que Av j = λ v j, Aw j = λ w j segue que x λ v + + x k λ v k + y λ w + + y l λ w l = () Por outro lado, multiplicando a equação () por λ obtemos Agora, equação () menos equação () produz x λ v + + x k λ v k + y λ w + + y l λ w l = () x (λ λ )v + + x k (λ λ )v k = Como os vetores v,, v k são L I e λ λ, concluímos que x = = x k = Analogamente, multiplicando a equação () por λ e subtraindo da equação () obtemos y = = y l = Corolário Se uma matriz n n possui n autovalores distintos, então ela é diagonalizável Exemplo 5 Determine se a matriz a seguir é diagonalizável ou não A = π 7 7 e π 6 π Solução: Temos det(a λi) = det λ λ π 7 λ 7 e π 6 π λ = ( λ)( λ)( λ)( π λ), (lembre-se que o determinante de uma matriz triangular é o produto dos elementos na diagonal principal), logo os autovalores de A são,, e π Como A é uma matriz 4 4 com 4 autovalores distintos, segue que A é diagonalizável A é semelhante à matriz D = π 7
Exemplo 6 Determine se a matriz a seguir é diagonalizável ou não Se for, determine uma matriz diagonal semelhante a ela B = Solução: Temos det(b λi) = det = det λ λ λ λ ( ) λ det λ = [( λ) 9], ( λ λ logo det(b λi) = quando ( λ) 9 =, ou seja, quando λ = ±, donde concluímos que os autovalores de B são λ = e λ = 6 O autoespaço associado ao autovalor é o conjunto-solução do sistema homogêneo BX =, cuja matriz aumentada é que é equivalente por linhas a, ) que representa o sistema { x + x = x + x 4 = Portanto, o autoespaço associado a é o conjunto de vetores da forma ( α, α, β, β) = α(,,, )+ β(,,, ), logo uma base para este autoespaço é dada por e portanto ele tem dimensão B = {(,,, ), (,,, )} O autoespaço associado ao autovalor 6 é o conjunto-solução do sistema homogêneo (B 6I)X =, cuja matriz aumentada é que é equivalente por linhas a, que representa o sistema { x x = x x 4 = Portanto, o autoespaço associado a é o conjunto de vetores da forma (γ, γ, δ, δ) = γ(,,, ) + δ(,,, ), logo uma base para este autoespaço é dada por B 6 = {(,,, ), (,,, )}
e portanto ele também tem dimensão Como R 4 tem dimensão 4, segue da Proposição (ou pode ser verificado diretamente) que B = B B 6 = {(,,, ), (,,, ), (,,, ), (,,, )} é uma base de autovetores de B para R 4, logo B é diagonalizável e é semelhante à matriz diagonal D = 6 6 Exemplo 7 Determine se a matriz a seguir é diagonalizável ou não Se for, determine uma matriz diagonal semelhante a ela C = 4 Solução: Temos det(c λi) = det 4 λ λ λ = λ + 5λ 7λ + Substituindo λ =, verificamos que este valor é uma raiz para esta equação do terceiro grau; como λ 5λ + 7λ = λ 4λ +, cujas raízes são λ = e λ =, concluímos que os autovalores de C λ são λ = e λ = O autoespaço associado ao autovalor é o conjunto-solução do sistema homogêneo (C I)X =, cuja matriz aumentada é que é equivalente por linhas a, que representa o sistema { x + x = x = Portanto, o autoespaço associado a é o conjunto de vetores da forma ( α,, α) = α(,, ), logo uma base para este autoespaço é dada por e ele tem dimensão B = {(,, )} O autoespaço associado ao autovalor é o conjunto-solução do sistema homogêneo (C I)X =, cuja matriz aumentada é que é equivalente por linhas a 5, 9
que representa o sistema { x + 5 x = x + x = Portanto, o autoespaço associado a é o conjunto de vetores da forma ( 5 β, β, β) = β( 5,, ), logo uma base para este autoespaço é dada por B = {( 5 },, ) e ele também tem dimensão Como R tem dimensão e só existem no máximo autovetores linearmente independentes para C, segue não existe uma base para R formada por autovetores de C, logo C não é diagonalizável Diagonalização de Matrizes Simétricas Exemplo Considere o problema de identificar a curva no plano representada pela equação do segundo grau x + xy + y = 4 Esta equação do segundo grau também pode ser escrita como uma equação matricial: [ ] [ ] [ ] x x y = 4, y ou, se denotarmos por [ ] x X = e A = y X t AX = 4 [ ], Como veremos adiante, é possível escrever a matriz simétrica A na forma em que D = [ 4 A = P DP t ] e P = [ [Note que P é a matriz de rotação por um ângulo de 45 ] Assim, a equação matricial acima se torna X t AX = X t (P DP t )X = (P t X) t D(P t X) = 4 Fazendo a mudança de coordenadas X = P t X, no novo sistema de coordenadas [ ] X x = y, ] a equação matricial é ou X t DX = 4, [ x y ] [ 4 ] [ x y ] = 4,
que pode ser reescrita como a equação de segundo grau Dividindo por 4, obtemos x + 4y = 4 x + y =, que reconhecemos ser uma elipse com eixo maior de comprimento e eixo menor de comprimento Como a matriz de mudança de coordenadas é uma rotação, que não introduz nenhuma distorção de comprimento (não transforma círculos em elipses, por exemplo), concluímos que a equação original também representava uma elipse com as mesmas dimensões Uma cônica é uma curva no plano descrita por uma equação do segundo grau (o nome se deve ao fato de que tais curvas sempre podem ser obtidas seccionando-se um cone por um plano)o problema de identificar tais cônicas se reduz a encontrar um sistema de coordenadas mais apropriado, em que a equação do segundo grau tem a forma mais simples possível e permite a identificação imediata da curva através da comparação com equações modelos Neste tipo de problema, quando se muda de um sistema de coordenadas para outro é importante assegurar que esta mudança de coordenadas não introduz nenhuma distorção nos comprimentos Uma matriz de mudança de coordenadas com esta propriedade é chamada uma matriz ortogonal (um nome mais correto seria matriz ortonormal, que implica preservação também de comprimentos, enquanto que o nome matriz ortogonal sugere apenas a preservação de ângulos, mas a tradição se estabeleceu e o nome matriz ortonormal não foi definido e não tem qualquer significado) Assim, se P é ortogonal, então P v = v para todo v Operacionalmente, existem várias definições equivalentes para que uma matriz seja ortogonal Teorema As seguintes definições são equivalentes para que uma matriz P seja ortogonal (i) P t = P (ii) As colunas de P formam uma base ortonormal de vetores Corolário Se P é ortogonal, então det P = ± Prova: Como P é ortogonal, a inversa de P é a sua transposta, logo (lembrando que o determinante da transposta de uma matriz é igual ao determinante da matriz) P P t = I det(p P t ) = det I det P det P t = (det P ) = e daí det P = ± Se uma matriz A é diagonalizável através de uma matriz ortogonal P, então ao invés de escrevermos A = P DP, podemos escrever simplesmente A = P DP t Foi isso que vimos no exemplo acima Isso ocorre para qualquer matriz simétrica Teorema Uma matriz simétrica é sempre diagonalizável Além disso, ela sempre pode ser diagonalizada através de uma matriz ortogonal
Para que a matriz P seja ortogonal, é necessário, como vimos acima, que suas colunas sejam vetores ortonormais Portanto, para que a matriz A seja diagonalizável por uma matriz ortogonal P, é suficiente que seja possível encontrar uma base de autovetores ortonormais de A Quando isso for possível, podemos usar o processo de Gram-Schmidt para encontrar uma tal base ortonormal Como o último teorema afirma, isso é sempre possível para uma matriz simétrica (em particular, os autovetores correspondente a autovalores distintos de uma matriz simétrica são sempre ortogonais) Será que é possível encontrar uma matriz diagonalizadora P ortogonal para uma matriz não-simétrica? Exemplo 9 A matriz do Exemplo A = não pode ser diagonalizada através de uma matriz ortogonal De fato, como vimos no Exemplo 5, o autoespaço associado ao autovalor tem base B = {(,, ), (,, )}, enquanto que uma base para o autoespaço associado ao autovalor é B = {(,, )} Evidentemente, aplicando o processo de Gram-Schmidt a B, podemos encontrar uma base ortonormal para o autoespaço associado a Mas, como os autoespaços associados a e não são ortogonais (pois (,, ) (,, ) = (,, ) e (,, ) (,, ) = ), não é possível encontrar uma base ortonormal de autovetores de A para todo o espaço R Exemplo Diagonalize a matriz simétrica através de uma matriz ortogonal B = 4 4 4 Solução: Temos que o polinômio característico de B é dado por det(b λi) = λ +λ 6λ+ = (λ ) ( λ), logo os autovalores de B são λ = e λ = O autoespaço associado ao autovalor é o conjunto-solução do sistema homogêneo (B I)X =, cuja matriz aumentada é que é equivalente por linhas a,, que representa o sistema { x + x + x =, logo o autoespaço associado a é o conjunto de vetores da forma ( α β, α, β) = α(,, ) + β(,, ), e portanto uma base para este autoespaço é formada pelos autovetores V = (,, ), V = (,, ) Esta base não é ortonormal (nem mesmo ortogonal) Aplicando Gram-Schmidt, chamamos W = V = (,, ) e W = V proj W V = (,, ) = (,, ), (,, ) (,, ) (,, ) (,, )
donde U = W W = U = W W = ( ),,, ( ) 6 6 6 6, 6, formam uma base ortonormal para o autoespaço associado a O autoespaço associado ao autovalor é o conjunto-solução do sistema homogêneo (B I)X =, cuja matriz aumentada é 4 4 que é equivalente por linhas a, 4 que representa o sistema { x x = x x =, logo o autoespaço associado a é o conjunto de vetores da forma (γ, γ, γ) = γ(,, ), e portanto uma base ortonormal para este autoespaço é formada pelo autovetor ( ) U =,, Segue que para e P = D = 6 6 6 6 6 temos A = P DP t : 6 6 6 6 6 6 6 6 6 6 = 4 4 4 Note que para a matriz de mudança de coordenadas não ortogonal cujas colunas são formadas pela base de autovetores não ortonormais V, V e V Q =, nós temos também evidentemente que = 4 4 4