Cálculo Diferencial e Integral 2 Formas Quadráticas

Instituto Superior Técnico Departamento de Matemática Secção de Álgebra e Análise Cálculo Diferencial e Integral 2 Formas Quadráticas 1 Formas quadráticas Uma forma quadrática em R n é um polinómio do segundo grau homogéneo. Por exemplo, q(x, y) = x 2 3xy 2y 2 (1) é uma forma quadrática em R 2 e q(x, y, z) = x 2 3xy + y 2 4xz z 2 (2) é uma forma quadrática em R 3. De certa forma, estas funções são as mais simples a seguir às funções lineares. Em Cálculo, elas aparecem como primeira aproximação 1 a uma função de várias variáveis junto a um ponto em que a derivada se anula 2. A expressão geral de uma forma quadrática em R n é q(x 1, x 2,..., x n ) = a 11 x 2 1 +a 12 x 1 x 2 +... +a 1n x 1 x n + +a 22 x 2 2 +... +a 2n x 2 x n +.... + a nn x 2 n onde a ij são números reais quaisquer. A expressão anterior pode escrever-se matricialmente (identificando como é habitual matrizes 1 1 com escalares) na forma q(x) = x T Ax onde x T - a matriz transposta da matriz coluna x - é a matriz linha correspondente ao vector x = (x 1,..., x n ), e A é a matriz quadrada n n a 11 a 12... a 1n 0 a 22 a 2n A =. 0 0... 0 0 a nn 1 A seguir à aproximação de ordem zero que é a constante dada pelo valor da função no ponto. 2 Quando a derivada não se anula, a primeira aproximação é a aplicação linear determinada pela derivada. 1

Por exemplo, no caso de (1) temos q(x, y) = [ x y ] [ ] [ ] 1 3 x 0 2 y e no caso de (2) temos q(x, y, z) = [ x y z ] 1 3 4 x 0 1 0 y 0 0 1 z Mais geralmente, se A é uma matriz n n qualquer (não necessariamente triangular superior), a expressão q(x) = x T Ax (3) define uma forma quadrática. Por exemplo, [ ] [ ] [ ] 2 3 x x y = 2x 2 + 3xy yx 2y 2 = 2x 2 + 2xy 2y 2. 1 2 y Como se vê no exemplo anterior, entradas da matriz que sejam simétricas em relação à diagonal principal contribuem com termos semelhantes. Em geral, se A tem entradas (a ij ) com 1 i, j n, o coeficiente de x i x j na expansão de x T Ax será (a ij + a ji ) e portanto se A e B são matrizes tais que a ij + a ji = b ij + b ji temos x T Bx = x T Ax para todo o x. Uma maneira de descrever esta situação é dizer que a forma quadrática determinada por A depende apenas da parte simétrica 3 da matriz A, que é dada por 1 2 (A + AT ) e portanto tem entrada ij igual a a ij+a ji. 2 Assim, considerando apenas matrizes simétricas na expressão (3), temos uma correspondência biunívoca entre matrizes n n simétricas e formas quadráticas em R n dada por A simétrica q(x) = x T Ax. 3 Recorde que qualquer matriz A se pode escrever de forma única como uma soma A = S + T com S simétrica (isto significa que s ij = s ji ) e T anti-simétrica (isto significa que t ij = t ji ). S diz-se a parte simétrica de A e T diz-se a parte anti-simétrica de A. Além disso, é fácil ver que S = 1 2 (A + AT ) e T = 1 2 (A AT ). 2

2 Classificação de formas quadráticas No estudo de extremos de funções de várias variáveis é necessário entender se o sinal de uma forma quadrática q(x) = x T Ax é ou não constante para x 0. Como q(0) = 0, estudar o sinal de q corresponde a determinar se 0 é ou não um ponto de extremo de q. Por exemplo, se q(x) 0 para todo o x, a função q tem um máximo (absoluto) em x = 0. Se f : R n R é de classe C 2 e f(a) = 0 então, junto a x = a temos (pela fórmula de Taylor) f(a + h) f(a) + h T Hf(a)h onde Hf(a) é a matriz Hessiana de f em a (cuja entrada ij é 2 f x i x j (a)). É de esperar que o problema de decidir se f tem um máximo 4 (por exemplo) em a esteja relacionado com a existência de um máximo para a sua aproximação h h T Hf(a)h em h = 0, e de facto assim é como vimos na aula. Concentremo-nos agora então na questão se q(x) = x T Ax tem ou não um extremo em x = 0. Precisamos de alguma terminologia. Definição: Uma forma quadrática q(x) diz-se 1. definida positiva se q(x) > 0 para todo o x 0, 2. definida negativa se q(x) < 0 para todo o x 0, 3. semidefinida positiva se q(x) 0 para todo o x, 4. semidefinida negativa se q(x) 0 para todo o x, 5. indefinida caso contrário, isto é se existem x, y R n com q(x) > 0 e q(y) < 0. Note-se que se q(x) é definida positiva então também é semi-definida positiva (como q(0) = 0 é claro que q(x) 0 para todo o x quando q é definida positiva). A interpretação das condições acima em termos de extremos é muito simples: Dizer que q é definida positiva é equivalente a dizer que 0 é um ponto de mínimo absoluto estrito para q, dizer que é semi-definida positiva é equivalente a dizer que 0 é um ponto de mínimo absoluto não estrito 5 para q e dizer que q é indefinida é dizer que 0 não é ponto nem de máximo nem de mínimo para q. 4 Por máximo entendemos máximo local. a diz-se um ponto de máximo local de f se existe um aberto U contendo a tal que x U f(x) f(a). A aproximação dada pela fórmula de Taylor só é boa perto do ponto onde estamos a desenvolver e não nos diz nada sobre o valor de f longe de a. 5 Isto significa que possivelmente há pontos diferentes de 0 onde o valor mínimo q(0) = 0 é atingido. 3

Vejamos agora como usar Álgebra Linear para classificar uma forma quadrática dada. Recorde que uma matriz quadrada X se diz ortogonal se as suas colunas formam uma base ortonormal de R n, ou equivalentemente, se X T X = I onde I designa a matriz identidade (note que a entrada ij do produto X T X é o produto interno das colunas i e j da matriz X). É um resultado de Álgebra Linear que as matrizes simétricas são diagonalizáveis por matrizes ortogonais. Isto é, se A é simétrica, existe uma matriz X ortogonal tal que X 1 AX = X T AX = Λ com Λ = diag(λ 1,..., λ n ). Esboço de demonstração: É fácil ver que uma matriz simétrica tem valores próprios reais: Escrevendo, para o produto interno em C n temos, para qualquer matriz n n complexa A, x, Ay = A x, y onde A é a transposta da matriz conjugada de A (isto é, a matriz cuja entrada ij é a ji ). Se A é uma matriz real simétrica, temos A = A. Tomando na fórmula acima y = x e x um vector próprio associado ao valor próprio λ, obtemos x, λx = λx, x λ x 2 = λ x 2 e portanto λ = λ. As colunas da matriz ortogonal X que diagonaliza A constroem-se indutivamente. Para primeira coluna toma-se um vector próprio qualquer x 1 de A, de comprimento 1. Denotando por λ 1 o valor próprio de x 1 e por U o complemento ortogonal da linha gerada por x 1 em R n, temos, para y U, x 1, Ay = A x 1, y = Ax 1, y = λ 1 x 1, y = λ 1 x 1, y = 0 Isto diz-nos que a transformação linear T (x) = Ax leva U em U e portanto, numa base para R n formada por x 1 e uma base {v 2,..., v n } de U, T é representada por uma matriz diagonal por blocos [ ] λ1 0 0 B onde B é uma matrix (n 1) (n 1) que representa a restrição de T a U na base {v 2,..., v n }. É fácil verificar que, desde que {v 2,..., v n } seja ortonormal, B é uma matriz simétrica e portanto, por hipótese de indução pode ser diagonalizada através de uma matriz (n 1) (n 1) ortogonal. 4

Note que as entradas ao longo da diagonal da matriz Λ são os valores próprios da matriz A. O resultado anterior tem a seguinte consequência para uma forma quadrática q(x) = x T Ax com A simétrica: Fazendo a mudança de variável x = Xy (onde X é uma matriz ortogonal com X T AX = Λ diagonal) temos x T Ax = (Xy) T A(Xy) = y T X T AXy = y T Λy = λ 1 y 2 1 +... + λ n y 2 n. Imagine-se que queremos ver se q(x) é definida positiva. Ora q(x) > 0 para todo o x 0 é equivalente a dizer que λ 1 y 2 1 +... + λ n y 2 n > 0 para todo o y 0 (como X é invertível, x 0 Xy 0 y 0), e é claro que isto é equivalente a λ i > 0 para i = 1,... n. Os casos restantes são inteiramente análogos e portanto podemos concluir o seguinte. Proposição: Seja q(x) = x T Ax a forma quadrática correspondente à matriz simétrica A. (i) q é definida positiva sse todos os valores próprios de A são > 0. (ii) q é definida negativa sse todos os valores próprios de A são < 0. (iii) q é semidefinida positiva sse todos os valores próprios de A são 0. (iv) q é semidefinida positiva sse todos os valores próprios de A são 0. (v) q é indefinida sse A tem pelo menos um valor próprio positivo e outro negativo. 5