Física Matemática II: Notas de aula Rafael Sussumu Y. Miada Nessas notas, faremos uma introdução à teoria dos espaços métricos e normados, e aos operadores lineares em espaços normados. Os resultados obtidos serão utilizados para duas aplicações principais nessas notas: a análise da existência e unicidade de soluções de problemas de valor inicial relacionados a equações diferenciais ordinárias, e o problema de Sturm-Liouville. Ao longo dessas notas, nos limitaremos a trabalhar com corpos de escalares K = R ou C. 1 Métricas Definição 1.1 (Métrica). Seja X um conjunto não vazio. Uma função d : X X R é dita uma métrica (ou, uma distância) em X se satisfaz as seguintes propriedades: (a) Positividade: para todos x, y X, d(x, y) 0; (b) Identidade dos indiscerníveis: dados x, y X, d(x, y) = 0 x = y; (c) Simetria: para todos x, y X, d(x, y) = d(y, x); (d) Subaditividade: para todos x, y, z X, d(x, z) d(x, y) + d(y, z). (1) Nesse caso, o par (X, d) é dito um espaço métrico. Tendo como inspiração o caso geométrico, a desigualdade em (d) é também chamada de desigualdade triangular. Exemplo 1.2 (Métrica Euclidiana). Considere X = R n como o conjunto das n-tuplas ordenadas de números reais. Defina d : R n R n R segundo (x, y) R n R n d(x, y) =. x 1 y 1 2 +... + x n y n, onde x = (x 1,..., x n ) e y = (y 1,..., y n ). É simples verificar que d satisfaz as propriedades (a)-(c) da definição 1.1 de métrica. Por outro lado, o leitor não deve ter dificuldades em mostrar a chamada identidade de Lagrange: para todos (a 1,..., a n ), (b 1,..., b n ) R n, ( n ) 2 ( a i b i + 1 n n n (a i b j a j b i ) 2 = 2 j=1 a i 2 ) ( n b i 2 ). (2) 1
Dessa identidade, segue imediatamente a desigualdade de Cauchy: ( n n ) 1/2 ( n 1/2 2 a i b i a i b 2) i. (3) Dados x, y, z X, escolha a i = x i y i e b i = y i z i para cada i = 1,..., n. Nesse caso, ( ) 2 n n n n n d(x, z) = (x i z i ) 2 = (a i b i ) 2 = a i 2 2 a i b i + b i 2 2 ( n ) 1/2 ( n ) 1/2 a i 2 + b i 2, onde a última desigualdade é válida pela desigualdade de Cauchy (3). Concluímos que vale a desigualdade triangular: ( n ) 1/2 ( n ) 1/2 d(x, z) x i y i 2 + y i z i 2 = d(x, y) + d(y, z), portanto d é uma métrica em R n, a conhecida métrica Euclidiana (também chamada de distância Euclidiana). Exemplo 1.3 (Métrica do táxi). Seja X = R n. Defina d 1 : R n R n R segundo (x, y) R n R n d 1 (x, y) =. x 1 y 1 +... + x n y n. É simples verificar que d 1 satisfaz as propriedades (a)-(c) da definição de métrica. Além disso, d 1 (x, z) = = n n ( x i z i xi y i + y i z i ) n x i y i + n y i z i = d 1 (x, y) + d 1 (y, z), portanto concluímos que d 1 é uma métrica em R n, a chamada métrica do táxi ou métrica de Manhattan ou ainda métrica L 1 em R n. Exemplo 1.4 (Métrica discreta). Seja X um conjunto não vazio. Defina d : X X R segundo 1, se x y; (x, y) X X d(x, y) = 0, se x = y. É imediato verificar que d define uma métrica em X, a chamada métrica discreta. Note que esse exemplo garante que todo conjunto não vazio admite pelo menos uma métrica. 2
Restrições de métricas Definição 1.5 (Restrições de métricas). Sejam (X, d) um espaço métrico e S X não vazio. Defina d S : S S R como a restrição da métrica d ao conjunto S S, ou seja, (x, y) S S d S (x, y) =. d(x, y). É imediato que d S é uma métrica em S, chamada de restrição da métrica d a S. Exemplo 1.6 (Espaços de Hamming). Considere X = R n e a métrica L 1, d 1 : R n R n R, d 1 (x, y) =. x 1 y 1 +... + x n y n. Considere o subconjunto S = {0, 1} n das n-tuplas ordenadas cujos termos são todos 0 ou 1, e a métrica d d 1 S que é a restrição de d 1 ao conjunto S S. Nesse caso, o espaço métrico (S, d) é dito um espaço de Hamming, e a métrica d uma distância de Hamming. Completeza Definição 1.7 (Sequências convergentes). Seja (X, d) um espaço métrico. Uma sequência (x n ) n N em X é dita (d-)convergente se existe x X tal que, para todo ɛ > 0, existe N N satisfazendo n > N d(x, x n ) < ɛ. Nesse caso, x é dito um (d-)limite para a sequência (x n ) n N, e dizemos também que (x n ) n N (d-)converge para x. É simples mostrar que uma sequência converge para no máximo um ponto, e são usadas as notações n x = d-lim (x n ) n N d-lim n x n ou x n x. d Usualmente, quando não há risco de confusão quanto à métrica, os índices d são omitidos. Note que, se a sequência (x n ) n N é convergente para ambos x e y em X, então x = y, ou seja, uma sequência converge para, no máximo, um ponto em X. De fato, para todo ɛ > 0, existe n tal que d(x, x n ) < ɛ e d(y, x n ) < ɛ, de onde, pela desigualdade triangular junto à simetria de d, d(x, y) d(x, x n ) + d(x n, y) < 2ɛ. Como a estimativa anterior vale para todo ɛ > 0, segue que d(x, y) = 0, donde x = y. 3
Definição 1.8 (Sequências de Cauchy). Seja (X, d) um espaço métrico. Uma sequência (x n ) n N em X é dita uma sequência de Cauchy (com relação a d) se, para todo ɛ > 0, existe N N satisfazendo n, m > N d(x n, x m ) < ɛ. Lema 1.9. Sejam (X, d) um espaço métrico e (x n ) n N uma sequência em X. Se (x n ) n N é convergente, então (x n ) n N é uma sequência de Cauchy. Demonstração. Denote x = lim n x n X. Por hipótese, para todo ɛ > 0, existe N N tal que n > N d(x, x n ) < ɛ/2. Nesse caso, pela desigualdade triangular junto à simetria da métrica, n, m > N d(x n, x m ) d(x n, x) + d(x, x m ) < ɛ. No entanto, não é verdade que, num espaço métrico arbitrário, toda sequência de Cauchy é convergente. Um exemplo simples é o conjunto Q dos números racionais com a distância usual: d(x, y) = x y. Sabemos que não existe x Q tal que x 2 = 2. No entanto, podemos considerar a sequência (x n ) n N, onde x n = p n /10 n, p n o maior inteiro tal que x n 2 2 (por exemplo, x 0 = 1, x 1 = 1,4 e x 2 = 1,41). É simples verificar que tal sequência é de Cauchy, mas que, para todo ɛ > 0, existe N N tal que n > N implica x n 2 < ɛ. O exemplo seguinte consiste em um exemplo de espaço métrico de funções no qual existem sequências de Cauchy que não são convergentes. Exemplo 1.10. Seja X o conjunto das funções contínuas [ 1, 1] R, e defina d 1 : X X R, (f, g) d 1 (f, g). = 1 Não é difícil mostrar que d 1 é uma métrica em X. 1 f(x) g(x) dx. (4) Seja (f n ) n N uma sequência de funções em X, e suponha que (f n ) n N seja convergente para f X. Em particular, isso implica que, para todo x [ 1, 1], existe lim f n(x) = f(x), n ou seja, a sequência de funções (f n ) n N converge pontualmente. 4
Considere, agora, as funções 0, se 1 x 0; f n (x) =. nx, se 0 x 1/n; 1, se 1/n x 1. É claro que as funções f n são contínuas, e que, para todo x [ 1, 1], lim f n(x) = f (x) =. 0, 1 x 0; n 1, 0 < x 1. Dessa forma, como a função f não é contínua, a observação anterior implica que (f n ) n N assim definida não é uma sequência convergente em (X, d 1 ). Por outro lado, note que, dados números naturais n > m, para todo x [ 1, 1], Nesse caso, segue a estimativa 1 1 f n (x) f m (x) dx = f n (x) f m (x) 1. 1/m 0 f n (x) f m (x) dx 1/m 0 1 dx = 1 m, de onde concluímos que (f n ) n N é uma sequência de Cauchy (com relação a d 1 ). Definição 1.11 (Espaços métricos completos). Dizemos que um espaço métrico (X, d) é completo (ou que X é completo com relação a d) se toda sequência de Cauchy nesse espaço é também uma sequência convergente. Mais ainda, dizemos que um conjunto A X é completo se toda sequência de Cauchy em A é convergente para um elemento de A, ou seja, que o espaço métrico (A, d A ) é completo (d A a restrição da métrica d a A). Pontos de fronteira Definição 1.12 (Bolas abertas e fechadas). Seja (X, d) um espaço métrico. Chamamos de bola aberta de centro x X e raio r > 0 ao conjunto B(x, r) B (d) (x, r) =. {y X : d(x, y) < r} (5) dos pontos que estão a uma distância (estritamente) menor que r do centro x. Por outro lado, chamamos de bola fechada de centro x e raio r ao conjunto B[x, r] B (d) [x, r] =. {y X : d(x, y) r} (6) Outra notação comum para as bolas abertas é B r (x) B(x, r) e, de forma análoga, para bolas fechadas, B r [x] B[x, r]. 5
dos pontos que estão a uma distância menor ou igual a r do centro x. Definição 1.13 (Pontos de fronteira). Sejam (X, d) um espaço métrico e A X. Dizemos que x X é um ponto de fronteira de A (com relação a d) se, toda bola de centro x contém pelo menos um ponto em A e um não pertencente a A, ou seja, se, para todo ɛ > 0, A B(x, ɛ) ø e (X \ A) B(x, ɛ) ø. O conjunto dos pontos de fronteira de A será denotado por A d A. Pela definição de ponto de fronteira, é imediato que x é ponto de fronteira de A se, e somente se, x é ponto de fronteira de seu complementar X \ A; ou seja, vale a identidade A = (X \ A). (7) Exemplo 1.14 (Fronteiras de bolas abertas). Sejam (X, d) um espaço métrico e B(x, r) a bola aberta de centro x X e raio r > 0. Note que vale a inclusão B(x, r) {y X : d(x, y) = r}. (8) De fato, fixe y X tal que d(x, y) r. Nesse caso, existe ɛ > 0 tal que d(x, y) r > ɛ. Considere, então, a bola B(y, ɛ). Note que: (1) se d(x, y) < r, então d(x, y) + ɛ < r. Dessa forma, para todo z B(y, ɛ), d(x, z) d(x, y) + d(y, z) < d(x, y) + ɛ < r, de onde B(y, ɛ) B(x, r); (2) se d(x, y) > r, então d(x, y) ɛ > r. Daí, para todo z B(y, ɛ), d(x, z) d(x, y) d(y, z) > d(x, y) ɛ > r, de onde B(y, ɛ) X \ B(x, r). Em qualquer caso, concluímos que y não é ponto de fronteira de B(x, r). No entanto, em geral, não é válido que todo ponto com distância r em relação a x pertence à fronteira de B(x, r). De fato, considere, por exemplo, que d seja a métrica discreta em X, ou seja, 1, se x y; d(x, y) 0, se x = y. Note que, para todo y X e todo 0 < ɛ < 1, B(y, ɛ) = {y}, de onde segue que y não é ponto de fronteira de nenhum subconjunto de X, ou seja, que, com a métrica discreta, todo subconjunto de X possui fronteira vazia. No entanto, fixado x X, a bola B(x, r) 6
com r = 1 é tal que {y X : d(x, y) = 1} = X \ {x}. Dessa forma, sempre que X não é um conjunto unitário (ou seja, X {x}), temos que B(x, 1) = ø X \ {x} = {y X : d(x, y) = 1}. Exemplo 1.15 (Fronteiras de bolas fechadas). Sejam (X, d) um espaço métrico e B[x, r] a bola fechada de centro x X e raio r > 0. Por argumento análogo ao do exemplo anterior, vale a inclusão B[x, r] {y X : d(x, y) = r}. (9) Além disso, também vale que todo ponto de fronteira da bola fechada é também ponto de fronteira da respectiva bola aberta, ou seja, B[x, r] B(x, r). (10) De fato, seja y B[x, r]. Como d(x, y) = r, então y / B(x, r). Nesse caso, para todo ɛ > 0, y B(x, r) B(y, ɛ) e existe z B(y, ɛ) tal que z X \ B[x, r] X \ B(x, r), de onde segue que também y B(x, r). No entanto, em geral, (10) não vale como uma igualdade. Por exemplo, considere X = R e defina x y, se x y 1; d(x, y) = max{ x y, 1} = 1, se x y 1. É simples verificar que d é uma métrica em R. Fixado x R, considere as bolas aberta B(x, 1) e fechada B[x, 1] com relação a essa métrica. Note que B[x, 1] = R, de onde B[x, 1] = ø. Por outro lado, não é difícil mostrar que B(x, 1) = {y R : x y = 1} ø. Conjuntos abertos e fechados Definição 1.16 (Conjuntos abertos e fechados). Seja (X, d) um espaço métrico. Um conjunto A X é dito um: (a) conjunto aberto (com relação a d) se não contém nenhum de seus pontos de fronteira, ou seja, se A A = ø; Note que, com d assim definido, B(x, 1) {y R : d(x, y) = 1}. 7
(b) conjunto fechado (com relação a d) se contém todos os seus pontos de fronteira, ou seja, se A A (ou, equivalentemente, se A A = A). Por exemplo, note que, pelas equações (8) e (9), toda bola aberta é um conjunto aberto, e toda bola fechada é um conjunto fechado. Lema 1.17. Sejam (X, d) um espaço métrico e A X. São equivalentes: (a) A é aberto; (b) para todo a A, existe ɛ > 0 tal que B(a, ɛ) A; (c) A é união (arbitrária) de bolas abertas em X. Demonstração. ((a) (b)) Se A é aberto, então todo a A não é ponto de fronteira de A, de modo que existe ɛ > 0 tal que B(a, ɛ) não contém nenhum ponto em X \ A, ou seja, B(a, ɛ) A. ((b) (c)) é trivial. ((c) (a)) Se A é união (aberta) de bolas abertas em X, então, para todo a A, existe uma bola aberta B(x, r) (x X e r > 0) tal que a B(x, r) A. Como B(x, r) é um conjunto aberto, então a não é ponto de fronteira de B(x, r), de onde existe ɛ > 0 tal que B(a, ɛ) B(x, r) A, portanto a também não é ponto de fronteira de A. Proposição 1.18. Sejam (X, d) um espaço métrico e F X. São equivalentes: (a) F é fechado, ou seja, contém todos os seus pontos de fronteira; (b) toda sequência convergente (x n ) n N de pontos em F converge para um elemento de F. (c) X \ F é aberto; Observação. Conjuntos que satisfazem a propriedade (b) são usualmente ditos sequencialmente fechados. Demonstração. A equivalência entre (a) e (c) segue do fato que os pontos de fronteira de F são iguais aos pontos de fronteira de X \ F (equação (7)). ((c) (b)) Seja (x n ) n N uma sequência em F que é convergente para x X, e suponha, por absurdo, que x / F. Nesse caso, como X \ F é aberto, existe ɛ > 0 tal que B(x, ɛ) X \ F, em contradição com a hipótese de que (x n ) n N converge para x. ((b) (a)) Seja ponto x F ; em particular, para todo ɛ > 0 existe x F tal que d(x, x ) < ɛ. Nesse caso, para cada n N, o conjunto B(x, 1/n) F é não vazio. Construa, então, uma sequência (x n ) n N em F com x n B(x, 1/n) para cada n N. Claramente, (x n ) n N converge para x, e (b) implica que x F. 8
Teorema 1.19. Seja (X, d) um espaço métrico. As seguintes propriedades são satisfeitas pelos conjuntos abertos: (a) ø e X são conjuntos abertos; (b) a união (finita ou não, contável ou não) de conjuntos abertos é um conjunto aberto; (c) a intersecção de dois conjuntos abertos é um conjunto aberto. Além disso, as seguintes propriedades são satisfeitas pelos conjuntos fechados: (d) ø e X são conjuntos fechados; (e) a intersecção (finita ou não, contável ou não) de conjuntos fechados é um conjunto fechado; (f) a união de dois conjuntos fechados é um conjunto fechado. Por fim, vale a seguinte caracterização para os pontos de fronteira: (g) seja A X. Um ponto x X é ponto de fronteira de A se, e somente se, para todo conjunto aberto O X tal que x O, existe (pelo menos) um ponto de O em A, e um em X \ A. Demonstração. (a) é trivial. (b) e (c) seguem imediatamente do lema 1.17. (d) segue da proposição 1.18. (e) e (f) são as versões duais de (b) e (c) (g) Suponha que x é ponto de fronteira de A e que O X é um aberto tal que x O. Pelo lema 1.17, existe ɛ > 0 tal que B(x, ɛ) O. Pela definição de ponto de fronteira, O A B(x, ɛ) A ø e O (X \ A) B(x, ɛ) (X \ A) ø, o que conclui a prova da implicação. A recíproca, por outro lado, é trivial. Definição 1.20 (Topologia da métrica). Seja (X, d) um espaço métrico. Chamamos de topologia da métrica d ao conjunto T 2 X dos subconjuntos abertos de X (com relação a d). Note que, pelo teorema 1.19, estão satisfeitas as seguintes propriedades: (a) ø, X T ; (b) se O T, então O T ; (c) se O 1, O 2 T, então O 1 O 2 T. Interior e fecho de um conjunto Definição 1.21 (Interior e fecho). Sejam (X, d) um espaço métrico e A X. 9
(a) O interior de A (com relação a d) é o conjunto dos elementos de A que não estão na sua fronteira: int A int d A =. A \ A. (11) Os elementos de int A são chamados de pontos interiores de A. (b) O fecho de A (com relação a d) é o conjunto dos elementos que estão em A ou em sua fronteira: A A (d) =. A A. (12) Os elementos de A são chamados de pontos de aderência de A. Claramente, temos que A é aberto se, e somente se, A = int A; e que A é fechado se, e somente se, A = A. Lema 1.22. Sejam (X, d) um espaço métrico e A X. (a) O interior de A é o maior (no sentido da inclusão de conjuntos) conjunto aberto que está contido A (em outras palavras, int A é a união dos conjuntos abertos que estão contidos em A). (b) A = X \ int(x \ A). (c) O fecho de A é o menor (no sentido da inclusão) conjunto fechado que contém em A (ou seja, A é a intersecção dos conjuntos fechados que contém A). Demonstração. (a) Como, para cada x int A, x não é ponto de fronteira de A, então, pelo teorema 1.19 (g), existe um aberto O x X tal que x O x A. Nesse caso, temos, mais ainda, que O x int A (caso contrário, existiria ponto de fronteira y de A tal que y O x A, mas O x (X \ A) = ø). Dessa forma, x é também ponto interior de int A, de onde segue que int A é um conjunto aberto. Por outro lado, se O A é um conjunto aberto, então, para todo x O, a igualdade O (X \ A) = ø implica que x não é ponto de fronteira de A, ou seja, x int A, portanto O int A. (b) X \ A = X \ (A A) = (X \ A) \ A = (X \ A) \ X \ A = int(x \ A). (c) é a versão dual de (a). De fato, (b) implica que A é fechado. Além disso, se F X é um fechado tal que A F, então O = X \ F é um aberto tal que O X \ A, daí todo x O não é ponto de fronteira de A, de onde segue que A = A A F. 10
Vizinhanças de um ponto Definição 1.23 (Vizinhanças). Sejam (X, d) um espaço métrico e x X. Por uma vizinhança de x entendemos qualquer conjunto V X tal que existe um conjunto aberto O V com x O. Pelo lema 1.17, isso é equivalente a pedir que existe exista uma bola aberta de centro x contida em V. Note que as vizinhanças abertas de x (ou seja, as vizinhanças de x que são também conjuntos abertos) são exatamente os conjuntos abertos que contém o ponto x. Em particular, toda bola (de raio r > 0) centrada no ponto x é uma vizinhança de x. Funções contínuas Definição 1.24 (Funções contínuas). Sejam (X, d X ) e (Y, d Y ) espaços métricos. Uma função f : X Y é dita contínua no ponto x 0 X (com relação às métricas d X e d Y ) se, para todo ɛ > 0, existe δ > 0 tal que ( d X (x, x 0 ) < δ d Y f(x), f(x0 ) ) < ɛ, ou, equivalentemente, em termos de bolas abertas, f ( B X (x 0, δ) ) ( B Y f(x0 ), ɛ ), ou, ainda, ( B X (x 0, δ) f (B 1 Y f(x0 ), ɛ )). Dizemos que a função f é contínua num conjunto A X, se f é contínua em cada ponto x A. Por fim, dizemos simplesmente que a função f é contínua se f em X. Lema 1.25. Sejam (X, d X ) e (Y, d Y ) espaços métricos, f : X Y uma função e x X. São equivalentes: (a) f é contínua no ponto x; (b) para toda sequência (x n ) n N em X convergente para x (com relação à métrica d X ), a sequência ( f(x n ) ) n N em Y é convergente para f(x) (com relação a d Y ); Seja f : X Y uma função. Dado A X, f(a) =. {f(x) : x A} Y é a imagem de A por f. Além disso, dado B Y, f 1 (B) =. {x X : f(x) B} X é a pré-imagem de B por f. 11
(c) para toda vizinhança V de f(x) (com relação a d Y ), f 1 (V ) é uma vizinhança de x (com relação a d X ). Observação. Uma função f que satisfaz a propriedade (b) é dita sequencialmente contínua no ponto x. Além disso, a propriedade (c) corresponde à definição usual de continuidade no ponto para espaços topológicos arbitrários. Demonstração. ((a) (b)) Seja (x n ) n N uma sequência em X convergente para x. Fixe ɛ > 0. Por hipótese, f é contínua em x, daí existe δ > 0 tal que d X (x, x) < δ d Y ( f(x ), f(x) ) < ɛ. Agora, (x n ) n N converge para x, existe N N tal que, Dessa forma, concluímos que n > N d X (x n, x) < δ. d Y ( f(xn ), f(x) ) < ɛ. Segue que a sequência ( f(x n ) ) n N em Y converge para f(x). ((b) (c)) Seja V uma vizinhança de f(x). Suponha, por absurdo, que f 1 (V ) não é vizinhança de x. Nesse caso, para todo ɛ > 0, B X (x, ɛ) não está contida em f 1 (V ). Dessa forma, existe uma sequência (x n ) n N tal que, para todo n, x n B X (x, 1/n), mas x n f 1 (V ). Claramente, a sequência (x n ) n N converge para x. Dessa forma, por (b), ( f(xn ) ) n N converge para f(x). Em particular, para todo ɛ > 0, existe n N tal que ( d Y f(xn ), f(x) ) < ɛ. Mas, por construção, f(x n ) V para todo n N, em contradição com a hipótese de que V é vizinhança de f(x). ((c) (a)) Seja ɛ > 0, então B Y ( f(x), ɛ ) é uma vizinhança de f(x). Dessa forma, por hipótese, f 1 (B Y ( f(x), ɛ ) ) é vizinhança de x, portanto existe δ > 0 tal que B X (x, δ) f 1 (B Y ( f(x), ɛ ) ). Teorema 1.26. Sejam (X, d X ) e (Y, d Y ) espaços métricos e f : X Y uma função. São equivalentes: (a) f é contínua; (b) para toda sequência (x n ) n N em X convergente (com relação a d X ), também a sequência ( f(x n ) ) n N em Y é convergente (com relação a d Y ), e ( ) lim f(x n) = f lim x n ; n n (c) para todo U Y aberto (com relação a d Y ), f 1 (U) é aberto (com relação a d X ); 12
(d) para todo F Y fechado (com relação a d Y ), f 1 (F ) é fechado (com relação a d X ). Demonstração. A equivalência (a) (b) segue do lema 1.25. ((a) (c)) Seja U Y aberto. Para cada x f 1 (U), como f(x) U, U é vizinhança de f(x) e, como f é contínua, o lema 1.25 implica que f 1 (U) é vizinhança de x, ou seja, existe um aberto O x f 1 (U) tal que x O x. Segue que f 1 (U) é aberto. ((c) (a)) Fixe x X e seja V Y uma vizinhança de f(x); existe O V aberto tal que f(x) O. Pela hipótese (c), f 1 (O) é aberto, e é claro que x f 1 (O) f 1 (V ), daí f 1 (V ) é vizinhança de x. Por fim, a equivalência (c) (d) segue do teorema 1.19 (lembrando que, para todo A Y, f 1 (Y \ A) = X \ f 1 (A)). Conjuntos compactos Definição 1.27 (Compacidade (por bolas)). Seja (X, d) um espaço métrico. Um conjunto K X é dito (d-)compacto (por bolas ) se K é completo e, para todo ɛ > 0 existem n N e x 1,..., x n X tais que n K B(x i, ɛ) = B(x 1, ɛ)... B(x n, ɛ). Definição 1.28 (Recobrimentos e sub-recobrimentos abertos). Sejam (X, d) um espaço métrico e A X. Por um recobrimento de A, entendemos um conjunto M de subconjuntos de X tal que A M. Seja M um tal recobrimento de A: (a) dizemos que um recobrimento M de A é aberto (com relação a d) se todo elemento de M é aberto; (b) dizemos que um subconjunto N de M é um sub-recobrimento de A (com relação a M) se também A N ; além disso, o sub-recobrimento N é dito finito se o conjunto N é finito. Teorema 1.29. Sejam (X, d) um espaço métrico e K X. São equivalentes: (a) K é compacto (por bolas); (b) para toda sequência (x n ) n N de elementos em K, existe uma sub-sequência (x nk ) k N que é convergente para um elemento de K. (c) para todo recobrimento aberto M de K, existe um sub-recobrimento finito N de K. Em geral, um conjunto K com as propriedades aqui enunciadas é dito fechado e totalmente limitado. Para a definição mais usual de compacidade, vide o teorema 1.29. 13
Observação. Um conjunto K que satisfaz (b) é dito sequencialmente compacto. Além disso, a propriedade (c) corresponde à definição usual de compacidade para espaços topológicos arbitrários. Demonstração. ((c) (a)) Note que a única parte não trivial é mostrar que K é completo caso valha. Seja, então, (y n ) n N uma sequência em K que é de Cauchy. Suponha, por absurdo, que (y n ) n N não é convergente. Nesse caso, para cada x K, existe ɛ(x) > 0 tal que B ( x, ɛ(x) ) contém apenas um número finito de elementos da sequência (y n ) n N (caso contrário, teríamos que, para todo ɛ > 0, existe N tal que y N B(x, ɛ/2) e, para todo m > N, d(y N, y m ) < ɛ/2, de onde, para todo m > N, d(y m, x) < ɛ; dessa forma, concluiríamos que x = lim n y n ). Claramente, o conjunto das bolas B ( x, ɛ(x) ), x K, é um recobrimento aberto de K, e (c) implica que existe um número finito de pontos x 1,..., x n K tal que K B ( x 1, ɛ(x 1 ) )... B ( x n, ɛ(x n ) ). Mas, por construção, cada bola B ( x 1, ɛ(x 1 ) ) contém apenas um número finito de elementos da sequência (y n ) n N, cujos (infinitos) elementos estão em K; contradição! Dessa forma, (y n ) n N é convergente. Suponha, por absurdo, que o limite dessa sequência seja y / K. Considere, para cada x K, a bola B(x) B ( x, d(x, y)/2 ). Claramente, y / B(x) e K x K B(x). Dessa forma, por hipótese, existe uma quantidade finita de pontos x 1,..., x n K tais que n K B(x i ) = B(x 1 )... B(x n ). Defina r. = 1 2 min{d(x i, y) : i = 1,..., n}, e considere a bola B(y, r). Note que, pela desigualdade triangular, para cada i = 1,..., n, x B(y, r) d(x, x i ) d(y, x i ) d(y, x) > 1 2 d(y, x i) x / B(x i ). Dessa forma, para todo x B(y, r), temos que x / K, em contradição com a hipótese de que (y n ) n N é uma sequência em K que converge para y. Segue que K é (sequencialmente) fechado (pela proposição 1.18). ((a) (b)) Seja (x n ) n N uma sequência em K. Construa, indutivamente, a subsequência (x nk ) k N pelo processo seguinte: (1) para k = 1, existe um número finito de pontos y 1,..., y n K tais que K B(y 1, 1)... B(y n, 1). Nesse caso, tome y (1) {y 1,..., y n } tal que B(y (1), 1) contém infinitos elementos da 14
sequência (x n ) n N, escolha n 1 qualquer com x n1 B(y (1), 1); (2) para k = 2, existe um número finito de pontos y 1,..., y n K tais que K B(y 1, 1/2)... B(y n, 1/2). Note que o conjunto B(y (1), 1) K possui infinitos elementos da sequência (x n ) n N e está contido em B(y 1, 1/2)... B(y n, 1/2). Dessa forma, podemos escolher y (2) {y 1,..., y n } tal que B(y (1), 1) B(y (2), 1/2) contém infinitos elementos da sequência (x n ) n N; escolha, então, n 2 > n 1 e tal que x n2 B(y (1), 1) B(y (2), 1/2); (3) para k > 2 arbitrário, existe um número finito de pontos y 1,..., y n K tais que K B(y 1, 1/k)... B(y n, 1/k). Note que, em particular, existe y (k) {y 1,..., y n } tal que B(y (1), 1) B(y (2), 1/2)... B(y (k),1/k ) contém infinitos elementos da sequência (x n ) n N. Escolha, então, n k > n k 1 tal que x nk B(y (1), 1) B(y (2), 1/2)... B(y (k),1/k ). Com isso, temos definida uma sub-sequência (x nk ) k N tal que k > k d ( x nk, x nk ) < 2/k. Em particular, (x nk ) k N é de Cauchy e, como K é completo por hipótese, converge para um elemento de K. ((b) (c)) Suponha, por absurdo, que existe um recobrimento aberto M de K o qual não possui sub-recobrimento finito. Construa, indutivamente, a sequência (x n ) n N da forma seguinte: (1) defina K 1 = K e escolha x 1 K 1 ;. (2) tome M 1 M com x 1 M 1 e defina K 2 = K \ M1 ; como M não possui subrecobrimento finito, K 2 ø; escolha, então x 2 K 2 ;. (3) para n > 1, tome M n M com x n M n e defina K n+1 = K \ n k=1 M n; como M não possui sub-recobrimento finito, K n+1 ø; escolha, então x n+1 K n+1. Nesse caso, temos definida uma sequência (x n ) n N tal que, fixado N N, m > N x m / M N e x N M N. Como os conjuntos M n são abertos, isso implica que toda sub-sequência de (x n ) n N não é de Cauchy e, portanto, não é convergente, em contradição com (b). 15
2 Lemas de contração Teorema 2.1 (Teorema do ponto fixo de Banach). Sejam (X, d) um espaço métrico completo e T : X X. Suponha que exista 0 K < 1 tal que, para todos x, y X, d ( T (x), T (y) ) K d(x, y). Então existe um único ponto z X que é fixo com relação a T (ou seja, T (z) = z). Além disso, para todo x X, lim T n (x) = z. n Demonstração. O fato é trivial para K = 0, e podemos assumir que 0 < K < 1. Sejam n m inteiros positivos com n = m + r. Note que, para todo x X, d ( T n (x), T m (x) ) K d ( T n 1 (x), T m 1 (x) )... K m d ( x, T r (x) ). Além disso, pela desigualdade triangular, d ( x, T r (x) ) d ( x, T (x) ) + d ( T (x), T 2 (x) ) +... + d ( T r 1 (x), T r (x) ) ( 1 + K +... + K r 1) d ( x, T (x) ). Dessa forma, como 0 < K < 1, temos que d ( T n (x), T m (x) ) K m ( 1 + K +... + K r 1) d ( x, T (x) ) Km 1 K d( x, T (x) ). Segue que ( T n (x) ) n N é uma sequência de Cauchy e, como X é completo, converge para um único ponto z X. Agora, note que portanto T (z) = lim n T n (x) = z. d ( T (z), T n+1 (x) ) K d ( z, T n (x) ), Por fim, suponha que z 1 M seja outro ponto tal que T (z 1 ) = z 1. Nesse caso, e, como K 0, concluímos que z = z 1. d(z, z 1 ) = d ( T (z), T (z 1 ) ) Kd(z, z 1 ), Usaremos, ainda, o seguinte lema de contração. Lema 2.2 (Lema de contração). Sejam (X, d) um espaço métrico completo e T : X X uma aplicação para a qual existe N N tal que d ( T N (x), T N (y) ) Kd(x, y), x, y X, para alguma constante 0 K < 1. Então existe um único ponto z X tal que T (z) = z. Mais ainda, lim n T n (x) = z para todo x X. 16
Demonstração. O teorema do ponto fixo de Banach 2.1 garante a existência de um único z X tal que T N (z) = z e, para todo x X, lim k T kn (x) = z. Note que, como z é ponto fixo de T N, T N( T (z) ) = T ( T N (z) ) = T (z), daí também T (z) é ponto fixo de T N e, pela unicidade de tal ponto fixo, T (z) = z. Além disso, se z 1 X é outro ponto fixo de T, então, temos que z 1 = T (z 1 ) = T 2 (z 1 ) =... + T N (z 1 ), ou seja, z 1 é também ponto fixo de T N, de onde z 1 = z. Mais ainda, como lim k T kn (x) = z para todo x X, dado ɛ > 0, existem k 0,..., k N 1 tais que k > k j d ( T k N+j (x), z ) < ɛ, j = 0,..., N 1. Dessa forma, tomando k = min{k 0,..., k N 1 }, temos que k > k d ( T k N+j (x), z ) < ɛ, j = 0,..., N 1, de onde também vale que n > (k + 1) N d ( T n, z ) < ɛ, de onde concluímos que lim n T n (x) = z para todo x X. 3 Espaços de Banach Definição 3.1 (Normas). Seja X um espaço vetorial sobre K (= R ou C). Uma função : X R, x x, é dita uma norma em X se satisfaz as seguintes propriedades: (a) x 0 para todo x X; (b) x = 0 se, e somente se, x = 0; (c) λx = λ x para todos λ K, x X; (d) x + y x + y para todos x, y X. Nesse caso, dizemos também que o par (X, ) é um espaço normado (em K); caso não haja risco de confusão com relação à norma, é comum dizermos simplesmente que X é um espaço normado. Além disso, nesse caso, a distância entre dois vetores x, y X é definida como a norma do vetor diferença: d(x, y) d (x, y) = x y 17
(a notação d(x, y) será usada sempre que não houver risco de confusão com relação à norma em questão). É simples verificar que d é uma métrica em X, dessa forma, a todo espaço normado (X, ) está associado um espaço métrico (X, d ), e todas as definições topológicas das seções anteriores são naturalmente estendidas aos espaços normados. Definição 3.2 (Espaços de Banach). Um espaço normado (X, ) é dito um espaço de Banach se o respectivo espaço métrico (X, d ) é completo. Norma do supremo para funções contínuas num compacto Seja K um intervalo fechado e limitado de R. Denotemos por C(K) C(K, R) o espaço vetorial (real) das funções contínuas de K em R (com as operações usuais sobre funções). Para cada f C(K, R), defina f f sup f C(K). = sup f(x). x K Note que, pelo teorema de Weierstrass, f é bem definida, e o supremo anterior é realizado, ou seja, f. = sup x K f(x) = max f(x) <. x K Além disso, é simples mostrar que isso define uma norma em C(K), chamada de norma do supremo ou de norma uniforme. Espaços l p Considere o espaço vetorial real das sequências (infinitas) de números reais com as operações usuais de adição e multiplicação por escalar. Defina, para cada p 1, o conjunto l p l p (R) cujos elementos são as sequências reais x = (x n ) n N tais que x p ( ) 1/p. = x n p <. n N Note que, para p = 2, temos um análogo à norma Euclidiana para o espaço das sequências (infinitas) reais. Claramente, x l p e λ R implicam que também λx l p. Além disso, como, para todos a, b R, a + b p 2 p max{ a, b } 2 p a + b, Basta usar a convexidade da função t t p. 18
então, se x = (x n ), y = (y n ) l p, também x + y = (x n + y n ) l p. Segue que l p é um espaço vetorial sobre R (com as operações usuais de adição e multiplicação por escalar de sequências). Para p =, definimos l l (R) como o conjunto das sequências reais x = (x n ) n N que são limitadas, ou seja, tais que x. = sup n N { x n } <. É simples notar que l (com as operações usuais de sequências reais) é um espaço vetorial real. Para p = 1 e p =, não é difícil mostrar que p é uma norma em l p. Mostraremos, agora, que, para 1 < p <, também p é uma norma em l p (normas essas que são muitas vezes chamadas também de normas l p ). Primeiramente, note que as propriedades (a), (b) e (c) na definição de norma 3.1 são facilmente verificadas, de modo que basta mostrarmos a desigualdade triangular (d). Comecemos relembrando a desigualdade das médias com pesos: para todos a 1,..., a n não negativos e todos p 1,..., p n não negativos com p 1 +... + p n = 1, vale que a 1 p 1... a n p n p 1 a 1 +... + p n a n, onde a igualdade ocorre se, e somente se, a 1 =... = a n. Em particular, note que, se p > 1 e q > 1 são tais que 1 p + 1 q = 1 (nesse caso, dizemos que p e q são índices conjugados), então, para todos r, s 0, rs rp p + sq q, (13) valendo a igualdade se, e somente se, r = s. Podemos, agora, mostrar a chamada desigualdade de Hölder nos espaços l p. Lema 3.3 (Desigualdade de Hölder). Sejam p, q R >1 índices conjugados, ou seja, tais que 1 p + 1 q = 1, e sejam x = (x n ) n N l p e y = (y n ) n N l q. Vale a desigualdade de Hölder: x n y n x p y q. n N Demonstração. Se x p = 0 ou y q = 0, o fato vale trivialmente, de modo que podemos 19
supor que ambas as sequências x e y são não nulas. que Primeiramente, suponha que x p = 1 = y q. Nesse caso, pela equação (13), temos x n y n x n p + y n q = 1 n N n N p n N q p + 1 q = 1 = x p y q, portanto a desigualdade enunciada é válida. Por fim, para x e y sequências não nulas arbitrárias, note que, pelo caso anterior, x n y n x n y n = x p y q x x p y p y q. q n N n N Usando a desigualdade de Hölder, podemos finalmente mostrar que p é uma norma em l p. Proposição 3.4. Seja 1 < p <. Então p é uma norma em l p. Demonstração. Resta apenas verificarmos a validade da desigualdade triangular. Sejam x, y l p. Primeiramente, note que, para cada n N x n + y n p x n x n + y n p 1 + y n x n + y n p 1, Seja q > 1 o índice conjugado a p, ou seja, tal que 1 + 1 = 1. Note que p = q (p 1). p q Nesse caso, pela desigualdade de Hölder, ) 1/q ( ) 1/q ( (xn + y n ) p 1) q ( + y p (xn + y n ) p 1) q x + y p p x p ( n N = x + y p p/q ( x p + y p ), n N de onde segue a desigualdade triangular. Finalizamos (por enquanto) nossa discussão sobre os espaços l p analisando as inclusões entre esses espaços. Lema 3.5. Sejam 1 p < q e seja x l p. Então x q x p ; em particular, também x l q. Demonstração. Para q = o fato é trivial, daí podemos supor que ambos p < q são finitos. O fato é também trivial para a sequência nula. 20
Dada uma sequência x l p não nula, defina ( ) X = x x n = x p x p. n N Nesse caso, note que X p = 1, daí, para todo n N, X n 1, de onde X n q X n p, e também X q 1 ou, equivalentemente, x q x p. 4 Teorema de Picard-Lindelöf O teorema de Picard-Lindelöf trata da existência e unicidade de soluções locais para problemas de valor inicial. Nossa demonstração é baseada em [1]. Considere um problema de valor inicial { DX(t) = f ( t, X(t) ), X(t 0 ) = x 0, onde X : R n R n, t 0 R, x 0 R n, e f é uma função contínua. Considere um intervalo I R tal que t 0 I. Para t I, considere a função F (X)(t). = x 0 + t t 0 f ( s, X(s) ) ds. Note que X é solução do problema de valor inicial proposto se, e somente se, F (X) = X, ou seja, se, somente se, X é ponto fixo de F. Isso nos permite reduzir o problema da existência e unicidade de soluções do problema de valor inicial à existência e unicidade de pontos fixos da função F. Teorema 4.1 (Teorema de Picard-Lindelöf). Sejam t 0 R, x 0 R n e a, b R 0. Defina Ω. = I a B b, onde I a = [t 0 a, t 0 + a] e B b = {x R n : x x 0 b} e considere uma função contínua f : Ω R n para a qual existe K 0 tal que f(t, x) f(t, y) K x y, (t, x), (t, y) Ω. Seja, ainda, M > 0 tal que f(t, x) M para todos (t, x) Ω. Então existe uma única função X : I ε R n que satisfaz o problema de valor inicial { DX(t) = f ( t, X(t) ), X(t 0 ) = x 0, onde I ε = [t 0 ε, t 0 + ε] com ε = min{a, b/m}. 21
Demonstração. Seja ( C(I ε, B b ), ) o espaço de Banach das funções contínuas ϕ : I ε B b com a norma do supremo ϕ. = sup t I ε ϕ(t). Fixado ϕ C(I ε, B b ), defina F (ϕ) : I ε R n, F (ϕ)(t). = x 0 + Como ε a, F (ϕ) é bem definida e contínua. Note que, para todo t I ε, F (ϕ)(t) x 0 = t t t 0 f ( s, ϕ(s) ) ds. f ( s, ϕ(s) ) ds Mε b, t 0 pois ε b/m. Ou seja, F (ϕ)(t) B b e, como F (ϕ) é contínua, segue que F (ϕ) C(I ε, B b ). Além disso, note que, para todos ϕ 1, ϕ 2 C(I ε, B b ) e todo n N, F n (ϕ 1 )(t) F n (ϕ 2 )(t) Kn t t 0 n ϕ 1 ϕ 2 n!, t I ε. De fato, basta uma indução em n: a desigualdade é clara para n = 0 e, supondo que seja válida para n = k, temos que F k+1 (ϕ 1 )(t) F k+1 (ϕ 2 )(t) t ( f s, F k (ϕ 1 )(s) ) f ( s, F k (ϕ 2 )(s) ) ds t 0 t K F k (ϕ 1 )(s) F k (ϕ 2 )(s) ds t 0 t K K k s t 0 k ds k! ϕ 1 ϕ 2 Dessa forma, t 0 Kk+1 t t 0 k+1 ϕ 1 ϕ 2 (k + 1)!. F n (ϕ 1 ) F n (ϕ 2 ) Kn ε n ϕ 1 ϕ 2 n!, ϕ 1, ϕ 2 C(I ε, B b ). Para N suficientemente grande, KN ε N N! < 1, e, do lema de contração 2.2, existe uma única função ϕ C(I ε, B b ) tal que F (ϕ) = ϕ. Observação 4.2 (Lipschitz continuidade e o teorema de Cauchy-Peano). No teorema de Picard-Lindelöf anterior, supomos que a função f : Ω R n satisfaz a condição seguinte: 22
existe K 0 tal que f(t, x) f(t, y) K x y para todos (t, x), (t, y) Ω. Essa condição é chamada de Lipschitz continuidade (na segunda variável). Note que essa condição já garante que a função f é contínua no segundo argumento, ou seja, a continuidade de Lipschitz é mais forte que a continuidade pontual usual. Essa condição é essencial para garantir a unicidade da solução. De fato, suponha que a função f seja apenas contínua (e não Lipschitz contínua). Nesse caso, uma solução local para o problema do valor inicial enunciado no teorema anterior sempre existe, mas existem funções f para as quais a solução não é única. Esse fato é conhecido como teorema de Cauchy-Peano. Considere, por exemplo, a função f(t, x) = x 1/2 com t [0, 1] e x R. Tal função f é contínua, mas não Lipschitz contínua, portanto o teorema de Picard-Lindelöf não se aplica. Mais ainda, note que t 2 /4, t 0, x 1 (t) = 0 e x 2 (t) = 0, t < 0, são ambas soluções do problema de valor inicial no teorema de Picard-Lindelöf com condição de fronteira x(0) = 0. Dessa forma, nesse caso, uma solução local existe, mas não é única. Para mais detalhes, vide, por exemplo, [2]. Soluções globais Nesse parágrafo, faremos uma pequena discussão sobre a existência de soluções globais. Note que, o teorema de Picard-Lindelöf garante a existência e unicidade de soluções locais. Com a mesma notação desse teorema, note que dizemos que a solução é local pois ela é definida apenas no conjunto I ε = [t 0 ε, t 0 + ε], onde ε = min{a, b/m}. Agora, caso f seja globalmente contínua e f(t, x) cresça suficientemente lentamente, podemos aplicar o teorema de Picard-Lindelöf para a = a n e b = b n onde (a n ) e (b n ) são sequências crescentes divergentes (para + ). Nesse caso, obtemos (ε n ) também crescente e divergente, de modo que as soluções locais podem ser sucessivamente estendidas a uma solução global para o problema de valor inicial dado. Uma discussão mais detalhada, e com condições menos restritivas para a existência e unicidade de soluções globais pode ser encontrada, por exemplo, em [3]. 23
5 Soluções de equações diferenciais de 2 a ordem Considere, agora, o problema de valor inicial D 2 y(t) + P (t) Dy(t) + Q(t) y(t) = R(t), y(t 0 ) = y 0, Dy(t 0 ) = y 1 Defina y 1 (t). = Dy(t). Nesse caso, o problema de valor inicial anterior é equivalente ao sistema { Dy(t) = y 1 (t), y(t 0 ) = y 0 ; Dy 1 (t) = R(t) P (t) y 1 (t) Q(t) y(t), y 1 (t 0 ) = y 1. Defina, agora, X(t) e f ( t, X(t) ) segundo ( ) X(t) =. y(t) e f ( t, X(t) ) ( ). y 1 (t) =. y 1 (t) R(t) P (t) y 1 (t) Q(t) y(t) Nesse caso, o problema de valor inicial anterior é também equivalente ao seguinte: ( ) DX(t) = f ( t, X(t) ), X(t 0 ) = Caso P, Q e R sejam contínuas, o teorema de Picard-Lindelöf é aplicável, e concluímos o seguinte. Proposição 5.1. Sejam P, Q e R funções contínuas e sejam t 0, y 0, y 1 R. Então o problema de valor inicial { possui uma única solução local y. D 2 y(t) + P (t) Dy(t) + Q(t) y(t) = R(t), y(t 0 ) = y 0 e Dy(t 0 ) = y 1, y 0 y 1. O espaço das soluções Investiguemos, agora, as soluções da equação homogênea D 2 y(x) + P (x) Dy(x) + Q(x) = 0, (EDOH) onde, conforme a proposição anterior, supomos que P e Q são contínuas num intervalo [a, b]. Suponha que S seja o conjunto das soluções de (EDOH), ou seja, uma função y definida em [a, b] é elemento de S se, e somente se, satisfaz (EDOH). Primeiramente, note que S é um espaço vetorial com relação às operações usuais, ou seja, se y 1 e y 2 são soluções de (EDOH), então também qualquer combinação linear a y 1 (x) + b y 2 (x), a, b R, 24
é solução de (EDOH). Mostraremos, agora, que o espaço S tem dimensão 2. Note que a proposição anterior garante que existe uma única solução y 1 para o problema de valor inicial D 2 y(x) + P (x) Dy(x) + Q(x) = 0; y(x 0 ) = 1, Dy(x 0 ) = 0. Além disso, também existe uma única solução y 2 para o problema de valor inicial D 2 y(x) + P (x) Dy(x) + Q(x) = 0; y(x 0 ) = 0, Dy(x 0 ) = 1. Claramente, y 1 e y 2 são duas soluções linearmente independentes de (EDOH). Suponha, agora, que a função Y seja uma solução de (EDOH). Nesse caso, a proposição anterior garante novamente que o problema de valor inicial D 2 y(x) + P (x) Dy(x) + Q(x) = 0, y(x 0 ) = Y (x 0 ), Dy(x 0 ) = DY (x 0 ), possui uma única solução. Agora, note que a função y(x) = Y (x 0 ) y 1 (x) + DY (x 0 ) y 2 (x) é solução desse último problema. Concluímos, então, que Y (x) = Y (x 0 ) y 1 (x) + DY (x 0 ) y 2 (x), ou seja, qualquer elemento de S pode ser escrito como combinação linear das funções independentes y 1 e y 2. Dessa forma, (y 1, y 2 ) é uma base para o espaço de soluções S da equação homogênea, e, portanto, tal espaço tem dimensão 2. Conclusão. Quaisquer duas soluções linearmente independentes y 1 e y 2 da equação homogênea (EDOH) formam uma base para o espaço das soluções S, ou seja, a solução geral de (EDOH) tem a forma y = c 1 y 1 + c 2 y 2, com c 1 e c 2 constantes. 6 Produtos internos Até aqui, generalizamos o conceito de tamanho de vetor, mas ainda, não temos nada que generalize o produto escalar de vetores geométricos. Nessa seção, introduziremos 25
exatamente tal generalização. Definição 6.1 (Produto interno). Seja X um espaço vetorial sobre K. Dizemos que uma aplicação, : X X K é um produto interno em X se satisfaz as seguintes propriedades: (a) x, x 0 para todo x X; (b) x, x = 0 se, e somente se, x = 0; (c) x, y = y, x para todos x, y X; (d) x, αy + z = α x, y + x, z para todos x, y, z X e todo α K. Nesse caso, dizemos que ( X,, ) é um espaço munido de produto interno. No que segue, focaremo-nos nos espaços complexos (mas a teoria para espaços reais é análoga). Uma importante desigualdade nessa teoria é a de Cauchy-Bunyakovsky-Schwarz, também conhecida simplesmente como desigualdade de Cauchy-Schwarz. Teorema 6.2 (Desigualdade de Cauchy-Bunyakovsky-Schwarz). Seja ( X,, ) um espaço complexo munido de produto interno. Então, para todos x, y X, x, y 2 x, x y, y. Demonstração. Sejam x, y X não nulos (o fato é trivial caso x = 0 ou y = 0), e seja θ tal que x, y = e iθ x, y. Note que, para todo λ R, Dessa forma, 0 e iθ x + λy, e iθ x + λy = x, x + λ ( 2 x, y ) + λ 2 y, y. 4 x, y 4 x, x y, y 0, que é a desigualdade de Cauchy-Bunyakovsky-Schwarz. Com a desigualdade de Cauchy-Schwarz em mãos, não é difícil mostrar o seguinte. Proposição 6.3. Seja (X,, ) um espaço munido de produto interno. Então a aplicação x x. = x, x 1/2 é uma norma em X, chamada de norma associada ao produto interno,. Aqui, z representa o complexo conjugado de z. Note que, caso K = R, os complexos conjugados podem ser todos omitidos, já que os números em questão são sempre reais. Essa propriedade é nada mais que dizer que o produto interno é linear na segunda variável. Essa convenção é bastante usada em física, mas não é universal. Muitas referências em matemática costumam definir produtos internos como lineares na primeira variável, em oposição ao que fazemos aqui. 26
A proposição anterior nos diz que os produtos internos definem uma classe especial de espaços normados. De fato, pode-se mostrar que o produto interno e a norma relacionamse segundo a chamada identidade de polarização: x, y = 1 x + y 4( 2 x y 2 + ı x + ıy 2 ı x ıy 2). A condição que distingue normas que provêm ou não de produtos internos é dada no teorema seguinte. Teorema 6.4 (Jordan, von Neumann). Seja (X, ) um espaço normado. A norma provém de um produto interno se, e somente se, satisfaz a identidade do paralelogramo: x + y 2 + x y 2 = 2 ( x 2 + y 2). Ortogonalidade Definição 6.5 (Ortogonalidade). Seja X um espaço munido de produto interno e sejam x, y X e A X. Dizemos que x e y são ortogonais (notação: x y) se x, y = 0. Dizemos que x é ortogonal ao conjunto A se x é ortogonal a todo vetor de A. Note que, se x e y são ortogonais, vale o teorema de Pitágoras: x + y 2 = x 2 + y 2. Se o espaço X é real, então a recíproca é também verdadeira, ou seja, se vale a identidade anterior, então x e y são ortogonais. No entanto, se o espaço X é complexo, tal recíproca não é verdadeira: existem vetores x e y que satisfazem a identidade anterior, mas que não são ortogonais. Definição 6.6 (Conjuntos ortogonais). Sejam X um espaço munido de produto interno e S X. Dizemos que S é um conjunto ortogonal se para todos x y em S, x y. Dizemos, ainda, que S é um conjunto ortonormal se é ortogonal e todos os seus vetores são unitários (ou seja, têm norma 1). Teorema 6.7 (Desigualdade de Bessel). Sejam X um espaço munido de produto interno e S X um conjunto ortonormal. Sejam, ainda, u 1,..., u n S distintos dois a dois. Então, para todo x X, n u i, x 2 x 2. 27
Demonstração. Considere n n 0 x u i, x u i, x u i, x u i n = x, x u i, x u i, x x, n + u i, x u i, n u i, x u i. n u i, x u i Nas condições do enunciado, n n n n u i, x u i, u i, x u i = u i, x u i, x u i, u j = j=1 n u i, x u i, x = n u i, x 2. Além disso, n n n u i, x u i, x = x, u i, x u i = u i, x 2. Dessa forma, segue que 0 x 2 que é a desigualdade de Bessel. n u i, x 2, Dizemos que um conjunto A é no máximo contável se existe uma função f : A N que é injetiva. Note que, se f é sobrejetiva, então f é uma bijeção entre A e N, ou seja, todo natural é também associado a um único elemento de A; com isso, podemos denotar os elementos de A na forma a n, onde a n A é o elemento associado a n N; esse procedimento é dito uma enumeração de A. Corolário 6.8. Sejam X um espaço munido de produto interno e S X um conjunto ortonormal. Sejam, ainda, x X e A(x) = {u S : u, x = 0}. Então A(x) é no máximo contável. Demonstração. Como comentário inicial, A(x) S, portanto, se S é no máximo contável, então não há nada a provar. Para qualquer k Z >0, pela desigualdade de Bessel, 28
vale que k u i, x 2 x 2, u i,..., u k S. Defina, para cada n Z >0, A n (x) = Fixado n, se u 1,..., u k A n (x), então x 2 donde segue que A n (x) é finito. Claramente, temos que A(x) = { s A(x) : u, x 1 }. n n=1 k u i, x 2 k n, 2 A n (x). Agora, sabemos que uma união contável de conjuntos finitos é no máximo contável. Segue que A(x) é no máximo contável. Com esse corolário em mãos, é possível dar sentido a somas simbólicas dos tipos u, x u e u, x 2. u S onde S é um conjunto ortonormal. De fato, o corolário anterior afirma que apenas um número no máximo contável de termos dessa soma simbólica são não nulos. Mais ainda, pode-se mostrar que o resultado dessas séries é independentemente do ordenamento dos termos não nulos da soma simbólica. Com esses comentários, podemos enunciar a seguinte versão generalizada da desigualdade de Bessel. Teorema 6.9 (Desigualdade de Bessel). Sejam X um espaço munido de produto interno e S X um subconjunto ortonormal. Então, para todo x X, u, x 2 x 2. u S Conjuntos ortonormais completos. Bases de Hilbert Definição 6.10 (Base de Hilbert). Seja X um espaço vetorial munido de produto interno. Um conjunto ortonormal S X é dito completo se para todo T X ortonormal tal que S T, tem-se S = T. Nesse caso, também é comum dizermos que S é uma base de Hilbert de X. u S 29
Apontamos que, como consequência do lema de Zorn (que é uma das versões do axioma da escolha na teoria de conjuntos), é possível mostrar que todo espaço munido de produto interno possui uma base de Hilbert. Uma motivação para a nomenclatura base deve-se ao fato seguinte. Proposição 6.11. Sejam X um espaço vetorial munido de produto interno e S X um conjunto ortonormal. Se L(S) = X, então S é completo. Aqui, L(S) denota a varredura linear de S, ou seja, o conjunto dos vetores de X que são combinações lineares (finitas) de elementos de S. Demonstração. Suponha, por absurdo, que S não é completo. Então existe y X \ S com y = 1 e y S. Nesse caso, também y L(S) = X, em contradição com o fato que y 2 = y, y = 1. A recíproca desse fato depende da completeza do espaço X, o que motiva a definição seguinte. Definição 6.12 (Espaços de Hilbert). Seja H um espaço munido de produto interno. Dizemos que H é um espaço de Hilbert se H é um espaço de Banach com relação à norma =., 1/2. A fim de analisar mais detalhadamente as propriedades das bases de Hilbert, começamos com um importante teorema sobre a convergência de séries nesses espaços. Teorema 6.13 (Teorema de Riesz-Fischer). Seja H um espaço de Hilbert e seja {u n } n N um conjunto ortonormal em H. Então a n u n converge se, e somente se, n=1 a n 2 <. n=1 Nesse caso, se x = a n u n, então a n = u n, x. n=1 Demonstração. Seja S n = n a i u i. Então, para n > m, S n S m 2 = n 2 n a i u i = a i 2, i=m+1 i=m+1 30
a última igualdade devido( ao teorema de Pitágoras. Dessa forma, (S n ) é uma sequência de n ) Cauchy se, e somente se, a i 2 é uma sequência de Cauchy em l 2. Como ambos H e ( n ) l 2 são completos, segue que (S n ) é convergente se, e somente se, a i 2 é convergente. Além disso, pela continuidade do produto interno, a j = u j, a i u i = u j, a i u i = u j, x. Lema 6.14. Seja H um espaço de Hilbert e S um conjunto ortonormal em H. Para cada x H, denote por x(s) à soma simbólica u, x u. Seja x H: u S (a) x(s) L(S) e ( x x(s) ) L(S); (b) x L(S) se, e somente se, x = x(s). Então x(s) L(S) e ( x x(s) ) L(S). x = x(s). Além disso, x L(S) se, e somente se, Demonstração. Primeiramente, pelo corolário 6.8, podemos encontrar uma sequência (u i ) i N em S tal que x(s) = i N u i, x u i. Pelo teorema de Riesz-Fischer 6.13, essa série converge se, e somente se, i N u i, x 2 <. Mas, pela desigualdade de Bessel, i N u i, x 2 x, portanto x(s) é bem definido para todo x. (a) Claramente, x(s) L(S). Seja s S, então s, x x(s) = s, x s, x(s) = s, x u S Dessa forma, x x(s) S, de onde também x x(s) L(S). (b) Que x = x(s) implica x L(S) segue do item (a). u, x s, u }{{} = 0. =0, se u s Reciprocamente, suponha que x L(S). Nesse caso, também x x(s) L(S), e, como x x(s) L(S), concluímos que x x(s), x x(s) = 0, ou seja, x x(s) = 0. Usando o lema anterior, chegamos, então, a seguinte caracterização das bases de Hilbert. Teorema 6.15. Seja H um espaço de Hilbert e S um conjunto ortonormal em H. São equivalentes: (a) S é completo; (b) L(S) = H; 31
(c) para todo x H, x = u, x u; u S (d) para todos x, y H, x, y = x, u u, y ; u S (e) para todo x H, vale a identidade de Parseval: x 2 = u S u, x 2. Demonstração. ((a) (b)) Suponha que S é completo, mas, por absurdo, que existe x H \ L(S). Seja x(s) conforme o lema 6.14, então x(s) L(S) e x \ x(s) L(S); x x(s) x x(s) em particular, x x(s) 0. Nesse caso, é um vetor unitário e ortogonal a todo } elemento de S, daí S seria um conjunto ortogonal, em contradição com a { x x(s) x x(s) completeza de S. Segue que H = L(S); ((b) (c)) segue imediatamente do lema 6.14. ((c) (d)) Da continuidade do produto interno junto ao teorema de Riesz-Fischer, x, y = u, x u, y = x, u u, y, u S u S a primeira igualdade válida por (c). ((d) (e)) é trivial. ((e) (a)) Suponha, por absurdo, que S não é completo. Então existe x H tal que x = 1 e x S. Mas a identidade de Parseval implica que x 2 = u, x 2 = 0, que u S é absurdo. Segue que S é completo. 7 Aplicações lineares Definição 7.1 (Aplicações limitadas). Sejam X e Y espaços normados sobre o mesmo corpo K. Uma aplicação linear T : X Y é dita limitada se T ( B (0, 1) ) é limitado, ou seja, se existe C > 0 tal que, para todo x X com x 1, T (x) C x. Nesse caso, note que, da linearidade de T, temos que T (x) C x, x X. Pela desigualdade triangular da norma em Y, é simples mostrar que, se T, S : X Y são ambas aplicações lineares limitadas e λ K, então também λt + S é limitada. Aqui, foi escolhido, por simplicidade de notação, utilizar o mesmo símbolo para ambas as normas em X e em Y ; essa escolha não significa que as normas são iguais! 32
Denote, então, por B(X, Y ) o conjunto das aplicações lineares limitadas de X em Y. Pelo comentário anterior, B(X, Y ) é um espaço vetorial sobre K. Em particular, quando X = Y, denotamos B(X) B(X, Y ). Além disso, quando Y = K, denotamos X. = B(X, K), o chamada espaço dual de X. Lema 7.2. Sejam X e Y espaços normados sobre K e seja T : X Y uma aplicação linear. São equivalentes: (i) T é contínuo em 0 X (o vetor nulo em X); (ii) T é contínuo; (iii) T é limitado. Demonstração. ((ii) (i)) é trivial. ((iii) (i)) Suponha que existe C > 0 tal que T (x) C x para todo x X. Fixe ɛ > 0, então, definindo δ. = ɛ/c, temos que x < δ T (x) C x < Cδ = ɛ. ((i) (ii)) Note que, para todo x X e r > 0, B(x, r) = x + B(0, r). = {x + x : x B(0, r)}. Supondo T é contínua em 0, e fixando ɛ > 0, existe δ > 0 tal que Como T é linear, para todo x X, T ( B(0, δ) ) B ( 0, ɛ ). T ( B(x, δ) ) = T ( x + B(0, δ) ) = T (x) + T ( B(0, δ) ) T (x) + B ( 0, ɛ ) = B ( T (x), ɛ ), portanto T é contínua em qualquer x X. ((i) (iii)) Fixe ɛ > 0. Existe δ > 0 tal que x < 2δ T (x) < ɛ. Como T é linear, segue que, para todo x X, ( ) T (x) = x T δx = x ( ) δx δ x δ T ɛ x δ x, portanto T é limitada. Definição 7.3 (Norma de operador). Sejam X, Y espaços normados. Defina, para cada T B(X, Y ),. T T op = sup T (x). x X, x 1 É simples verificar que isso define uma norma, a chamada norma de operador em B(X, Y ). 33
Note que T. = sup T (x) = x X, x 1 sup T (x) = x X, x =1 T (x) sup x X,x 0 x. Pode-se mostrar que, se Y é um espaço de Banach, então também B(X, Y ) é um espaço de Banach. Em particular, note que, o espaço dual X munido da norma de operador é sempre um espaço de Banach (mesmo quando X não é completo). Por fim, note que, quando X = Y, a norma de operador é submultiplicativa: T S T S, T, S B(X). Decomposição ortogonal Sejam H um espaço de Hilbert e A H não vazio. Definimos o complemento ortogonal de A como o conjunto A. = {v H : v A} = {v H : ( v H) v v}. Lema 7.4. Sejam H um espaço de Hilbert e A H não vazio. (a) A é um subespaço fechado de H; (b) A (A ) ; (c) se A é um subespaço de H, então A A = {0} e A = (A ). Dados subespaços V 1 e V 2 de H, dizemos que H é soma direta de V 1 e V 2 (notação: H = V 1 V 2 ) se: (a) V 1 V 2 ; (b) para todo v H, existem v 1 V 1 e v 2 V 2 únicos tais que v = v 1 + v 2. Teorema 7.5 (Teorema da decomposição ortogonal). Seja H um espaço de Hilbert e seja V um subespaço fechado de H. Então H = V V. Dizemos que um operador P B(H) é um projetor se P 2 = P. Uma consequência essencial do teorema da decomposição ortogonal é a existência de projetores ortogonais. Corolário 7.6. Seja H um espaço de Hilbert e V um subespaço fechado de H. Considere, para cada v H, a decomposição ortogonal v = v + v, onde v V e v V. Defina Valem as propriedades seguintes. P V : H H, v P V (v) = v. A soma direta algébrica é definida pedindo apenas a propriedade (b). A definição aqui apresentada, apenas para espaços de Hilbert, é claramente mais restritiva. Aqui, P 2 = P P = P P é a composição de P com ele mesmo. 34
(a) P V é um projetor; (b) P V B(H) com P V 1; (c) P V = 0 se, e somente se, V = {0}. Caso contrário, P V = 1. Demonstração. O item (a) é imediato da unicidade da decomposição ortogonal. Por outro lado, pelo teorema de Pitágoras, dado v H, se v = P (v) + v, v V é a sua decomposição ortogonal, então v 2 = P (v) 2 + v 2, de onde segue (b). Claramente, se V = {0}, P V é o operador nulo. Por outro lado, se V {0}, escolhido v V, temos que P (v) = v, e o item (b) implica que P = 1. Espaço dual Para cada v H, defina a função ϕ v : H K, v H ϕ v (v ). = v, v. É imediato que ϕ v é linear. Mais ainda, pela desigualdade de Cauchy-Schwarz, ϕv (v ) = v, v v v, daí ϕ v é limitado (e, portanto, contínuo), ou seja, ϕ v H. O teorema seguinte é a recíproca desse fato. Teorema 7.7 (Teorema de representação de Riesz-Fréchet). Seja H um espaço de Hilbert sobre K. Para todo φ H. = B(H, K), existe um único vφ H tal que φ = ϕ vφ. Além disso, para todos φ, φ H e todo α K, (a) φ = v φ ; (b) v φ+φ = v φ + v φ ; (c) v αφ = α v φ. Demonstração. Nessas notas, não vamos mostrar a existência do vetor v φ, mas apenas as outras afirmações do teorema. Para tal demonstração, o leitor pode consultar, por exemplo, [4]. Seja φ H, suponha que v φ, v φ H sejam tais que v φ, v = v φ, v = φ(v), v H. 35
Em particular, quando v = v φ v φ, temos que v φ v φ, v φ v φ = v φ, v φ v φ v φ, v φ v φ = 0, portanto v φ = v φ, o que mostra a unicidade do vetor v φ. (a) Seja φ H. Note que, pela desigualdade de Cauchy-Schwarz, v φ, v φ = sup v H v = v φ, v φ v φ (b) Sejam φ, φ H, então, para todo v H, = v φ. v φ+φ, v = (φ + φ )(v) = v φ + v φ, v, e a unicidade do representante implica que v φ+φ = v φ + v φ. (c) é mostrado de forma análoga. Escrevamos o que foi visto nesse parágrafo com uma notação mais sugestiva: denote vetores em H na forma v v. Defina, ainda, v. = ϕ v e v v. = ϕ v (v ) = v, v. Nesse caso, o teorema de representação de Riesz-Fréchet garante que existe uma bijeção entre H e o seu dual H, bijeção essa que associa kets v a bras v. Além disso, no espaço dos bras (o espaço dual), temos que v + αv = ϕ v+αv = ϕ v + αϕ v = v + α v. Operador adjunto Definição 7.8 (Operador adjunto). Sejam H um espaço de Hilbert e T um operador em B(H) (ou seja, uma aplicação linear limitada de H em H). Dizemos que T possui adjunto se existe um operador T B(H) tal que, para todos x, y H, x, T (y) = T (x), y. Teorema 7.9. Sejam H um espaço de Hilbert e A B(H) um operador limitado. Então existe um único operador A tal que, para todos x, y H, x, A(y) = A (x), y. O operador A é chamado de operador adjunto a A. Demonstração. Primeiramente, note que, como consequência da desigualdade de Cauchy- 36
Schwarz, fixado x H, a função y H x, A(y) K é um funcional linear contínuo, e o teorema de representação de Riesz-Fréchet implica que existe um único vetor v x H tal que x, A(y) = v x, y, x, y H e, além disso, que v αx+y = α v x +v y para todos x, y H. Basta definir, então, A : H H, x v x. Teorema 7.10. Seja H um espaço de Hilbert em K e sejam A, B B(H). (a) A B(H); além disso, A = A e A A = A 2 ; (b) (AB) = B A ; (c) (αa + B) = αa + B para todo α K. (d) (A ) = A. Demonstração. Os itens (b), (c) e (d) são triviais da definição de adjunto junto ao teorema de Riesz-Fréchet, e basta mostrar o item (a). Suponha, então, que A 0 (o caso A = 0 é trivial). Pela desigualdade de Cauchy-Schwarz, A = sup A (x) = x H, x =1 = sup sup x H, x =1 y H, y =1 sup sup x H, x =1 y H, y =1 A(y), x A. y, A (x) Em particular, trocando A por A na estimativa anterior, A = A. Além disso, A = sup A(x) = sup A(x), A(x) x H, x =1 x H, x =1 = sup x, A A(x) A A, x H, x =1 sendo a última desigualdade válida pela desigualdade de Cauchy-Schwarz e pois x x é uma função monótona crescente. Dessa forma, pela submultiplicatividade da norma de operador, de onde vemos que A A = A 2. A 2 A A A A, 37
Operadores autoadjuntos Definição 7.11 (Operadores autoadjuntos). Sejam H um espaço de Hilbert e A B(H). Dizemos que A é normal se AA = A A. Dizemos que A é um autoadjunto se A = A. Teorema 7.12. Sejam H um espaço de Hilbert e A B(H) um operador autoadjunto. Então A = sup v, A(v). v H, v =1 Demonstração. Seja A B(H) autoadjunto. Primeiramente, temos A = sup sup x H, x =1 y H, y =1 Por outro lado, note que, como A = A, y, A(x) M =. sup x, A(x). x H A(x + y), x + y A(x y), x y = 2 A(x), y + 2 A(y), x = 4R A(y), x. Nesse caso, a identidade do paralelogramo implica que Segue que 4R A(y), x M ( x + y 2 + x y 2) = 2M ( x 2 + y 2). A = sup sup x H, x =1 y H, y =1 = sup sup x H, x =1 y H, y =1 y, A(x) R y, A(x) M. O teorema seguinte estabelece uma bijeção entre a coleção dos subespaços fechados de H e o conjunto dos projetores autoadjuntos em B(H). Teorema 7.13. Seja H um espaço de Hilbert. Para todo subespaço fechado V de H, seu projetor ortogonal P V é autoadjunto. Reciprocamente, se P B(H) é um projetor autoadjunto, então sua imagem P (H) é um subespaço fechado de H e P é o projetor ortogonal associado a esse subespaço. Operadores compactos Definição 7.14 (Aplicações compactas). Sejam X e Y espaços de Banach sobre o mesmo corpo K. Uma aplicação linear T : X Y é dita compacta se T ( B X(0, 1) ) é compacto, ou seja, se o fecho da imagem da bola unitária em X pela aplicação T é um conjunto compacto (em Y ). Equivalentemente, a aplicação linear T é compacta se, e somente se, 38
toda sequência limitada (x n ) em X contém uma subsequência (x nk ) tal que ( T ( )) x nk é convergente em Y. Teorema 7.15. Sejam X e Y espaços de Banach sobre o mesmo corpo K. (a) O conjunto dos operadores compactos de X em Y formam um subespaço vetorial de B(X, Y ), o qual é fechado com relação à norma de operador nesse espaço. (b) Quando X = Y, se T, S B(X) e T é compacto, então também ST e T S são compactos. (c) Quando X = Y tem dimensão infinita, se T B(X) é compacto, então T não é inversível, ou seja, não existe S B(X) tal que ST = T S = 1, onde 1 B(X) é a identidade (x x). Não entraremos em mais detalhes sobre os operadores compactos. O leitor pode consultar, por exemplo, o clássico Rudin [5] 8 Espectro de operadores compactos autoadjuntos Sejam H um espaço de Hilbert e T B(H). Dizemos que λ K é um autovalor de T se existe x H não nulo tal que T (x) = λx. Nesse caso, o vetor x é dito um autovetor de T (com relação ao autovalor λ). O conjunto dos autovalores de T é chamado de espectro de T. Teorema 8.1. Sejam H um espaço de Hilbert complexo e A B(H). Então A é autoadjunto se, e somente se, x, A(x) R para todo x H. Corolário 8.2. Sejam H um espaço de Hilbert complexo e A B(H) um operador autoadjunto. (a) Todo autovalor de A é real; (b) Se x, y H são autovetores de A relativos a autovalores distintos, então x y. Teorema 8.3. Sejam H um espaço de Hilbert complexo e A B(H) um operador compacto e autoadjunto. Então A ou A é autovalor de A. Demonstração. O fato é trivial quando A = 0, daí podemos supor que A 0. Como A = sup x H, x =1 x, A(x), existe (e n ) H, e n = 1, tal que lim e n, A(e n ) = A. n 39
Como e n, A(e n ) R, existe uma subsequência (e nk ) tal que lim k e nk, A(e nk ) = λ, para pelo menos um entre λ = A ou λ = A. Agora, note que, como λ 2 = A 2, 0 A(e nk ) λe nk 2 = A(e nk ) 2 A(e nk ), λe nk λe nk, A(e nk ) + λe nk 2 A 2 2λ e nk, A(e nk ) + λ 2 = 2 ( A 2 λ e nk, A(e nk ) ). Como λ = lim k e nk, A(e nk ), segue que lim A(e n k ) = λe nk. k Como A é compacto, existe uma subsequência ( u j = e nkj )j N que é convergente. Denote λy = lim j A(u j ). Escrevendo λu j = A(u j ) ( ) A(u j ) λu j, segue que lim n λu j = λy, portanto A(y) = λy. Teorema 8.4 (Teorema espectral para operadores compactos autoadjuntos). Sejam H um espaço de Hilbert e A B(H) um operador compacto autoadjunto. Então existe uma sequência (finita ou não: N N) ( (λ n, e n ) R H ) n N seguintes: que satisfaz as propriedades (a) λ n R é autovalor de A, λ n λ n+1 e (λ n ) n N contém todos os autovalores não nulos de A; em particular, se N é infinito, então lim n λ n = 0; (b) dado λ R 0, a dimensão de ker(λ1 A) é finita, e é igual ao número de vezes que λ aparece na sequência (λ n ) n N ; (c) (e n ) n N é uma família ortonormal tal que A(e n ) = λe n e, para todo x H, A(x) = n N λ n e n, x e n. Demonstração. Denote H 1 = H e A 1 = A. Pelo teorema anterior, existe λ 1 R autovalor de A com λ 1 = A, e podemos escolher um autovetor normalizado e 1. Defina, então, H 2 = {e 1 } e A 2 = A 1 H2 como a restrição de A 1 ao espaço H 2. Nesse caso, é claro que também A 2 é compacto e autoadjunto, e o teorema anterior garante que existe λ 2 R autovalor de A 2 (e portanto de A) com λ 2 = A 2 A 1 = λ 1, e um autovetor normalizado e 2 H 2. Note que por construção, e 2 {e 1 }. Repetindo o processo indutivamente, obtemos uma sequência (λ n ) de autovalores de A com λ k1 λ k e respectivos autovetores (e n ) ortonormais, além dos espaços H n+1 = Dado um operador B em H, definimos o seu núcleo como o conjunto ker(b) =. {x H : B(x) = 0}. É simples verificar que ker(b) é subespaço de H. 40
{e 1,..., e n } e operadores compactos autoadjuntos A n = A n 1 Hn. Suponha que A N+1 = 0 para algum N N. Se x L(e 1,..., e N ), então x = N e i, x e i, donde A(x) = N λ i e i, x e i. Por outro lado, se x {e 1,..., e N }, então, por construção A(x) = 0. Suponha, agora, que A N 0 para todo N e, por absurdo, que lim( n ) λ n 0. Nesse caso, existe ɛ > 0 tal que λ n ɛ para todo n, de onde en λ n 1 e A e n ɛ λ n = e n. Como A ( e é compacto e a sequência n λ n )n N é limitada, existe uma subsequência (e n k ) convergente; mas, pelo teorema de Pitágoras, e n e k = 2 quando n k, o que é absurdo, e segue que lim λ n = 0. n Fixado n N, note que x n e i, x e i H n+1. Como A n+1 = λ n+1, então ( n n ) A(x) λ i e i, x e i = A(x) A e i, x e i λ n+1 x, portanto A(x) = n N λ n e n, x e n. Suponha que λ R seja tal que A(e) = λe para algum e 0 mas que λ não esteja na sequência (λ n ). Nesse caso, e, e n = 0 para todo n, e o resultado anterior implica que A(e) = 0 e, logo, λ = 0. Dessa forma, a sequência (λ n ) contém todo autovalor não nulo de A. Por fim, se λ 0 aparece p vezes na sequência (λ n ), existem, por construção, pelo menos p autovetores {e n1,..., e np } ortonormais de λ, o que implica que dim ( ker(λ1 A) ) p. Suponha, por absurdo, que tal dimensão seja estritamente maior que p. Nesse caso, existe e {e n1,..., e np } não nulo tal que A(e) = λe. Como autovetores associados a autovalores distintos de A são ortogonais, isso implica que e e n para todo n, donde A(e) = 0, em contradição com a hipótese de que λ 0. Segue que dim ( ker(λ1 A) ) = p. 41
9 O problema de Sturm-Liouville Nessa seção, aplicaremos os resultados anteriores sobre espectro de um operador compacto autoadjunto no estudo dos autovalores e autovetores do problema de Sturm- Liouville, ou seja, no estudo de problemas da forma { L(y) = f, α 1 y(a) + β 1 Dy(a) = 0 e α 2 y(b) + β 2 Dy(b) = 0. Aqui, (α 1, β 1 ), (α 2, β 2 ) R 2 são não nulos, a < b, e L é o operador L(y) = D ( p Dy ) + qy, (SL) onde p é continuamente diferenciável em [a, b], p(t) > 0 para todo t [a, b], e q é contínua em [a, b]. Note que o operador L é definido apenas para funções y em [a, b] a valores complexos em duas vezes diferenciáveis em e que satisfazem as condições de fronteira do problema anterior. Fixe uma função peso ρ é uma função contínua em [a, b] com ρ(t) > 0 para t [a, b]. Defina, para λ C, L λ (y). = L(y) λρy. Dizemos que λ é autovalor do problema de Sturm-Liouville anterior se existe y não trivial tal que L λ (y) = 0; nesse caso, tal função y é dita uma autofunção relativa ao autovalor λ (note que essas definições dependem da função peso ρ). Lema 9.1. Todo autovalor do problema de Sturm-Liouville (SL) tem multiplicidade 1, ou seja, se y 1 e y 2 são autofunções relativas ao mesmo autovalor, então {y 1, y 2 } é linearmente dependente. Dada uma função contínua x quadrado integrável em [a, b], definimos sua norma L 2 (em [a.b]) segundo x 2 b. = x(t) 2 dt <. a Nesse caso, com o auxílio da desigualdade de Cauchy-Schwarz, pode-se mostrar a seguinte estimativa: x(t) 2 1 b a x 2 2 + 2 x 2 Dx 2, t [a, b]. Em particular, quando x 2 = 1, temos que x(t) 2 1 b a + 2 Dx 2. Usando essa estimativa, é possível mostrar o seguinte fato. 42
Teorema 9.2. Existe c 0 R tal que, para todo λ R autovalor do problema de Sturm- Liouville (SL), vale que λ > c 0. Note que, nesse caso, trocando q por q +c 0, podemos garantir que todos os autovalores do problema de Sturm-Liouville são positivos. Em particular, podemos supor, sem perda de generalidade, que λ = 0 não é autovalor do problema de Sturm-Liouville. Note que, se λ = 0 não é autovalor do problema de Sturm-Liouville, então o operador L é injetivo. Em particular, isso garante uma certa inversibilidade desse operador. Teorema 9.3. Suponha que λ = 0 não seja autovalor do problema de Sturm-Liouville (SL). Então existe uma função contínua G : [a, b] [a, b] R tal que, para todo f contínuo em [a, b], L(y) = f se, e somente se, y(t) = b a G(t, s) f(s) ds. Defina G no espaço C([a, b]) das funções contínuas em [a, b] segundo G(f) = b a G(t, s) ρ(s) f(s) ds. É simples mostrar que λ > 0 é autovalor do operador de Sturm-Liouville com autofunção y se, e somente se, G(y) = 1 λ y, ou seja, se, e somente se, 1 é autovalor de G com autofunção y. λ Note que G é compacto com relação à norma L 2 em [a, b] com peso ρ: b f 2,ρ = a ρ(t) f(t) 2 dt. Além disso, como G é simétrica, ou seja, G(t, s) = G(s, t), então G é autoadjunto. Nesse caso, podemos aplicar o teorema espectral 8.4, e chegamos nos fatos seguintes sobre o problema de Sturm-Liouville. Teorema 9.4. Considere o problema de Sturm-Liouville (SL) e suponha que λ = 0 não é autovalor desse problema. Então valem as afirmações seguintes: (a) os autovalores de (SL) são reais, infinito contáveis, e podem ser organizados numa sequência (λ n ) n N R tal que (1/λ n ) n N é a sequência dos autovalores do operador G. Em particular, lim λ n = ; n 43
(b) existe uma sequência (φ n ) n N de funções reais em [a, b] tais que φ n é autofunção relativa ao autovalor λ n com b a φ n (t) 2 ρ(t) dt = 1. Nesse caso, toda autofunção de λ n é múltipla de φ n ; (c) A sequência (φ n ) é uma família ortonormal completa no espaço (C([a, b])) das funções contínuas em [a, b] munido da norma L 2 com peso ρ: y y 2,ρ b. = y(t) 2 ρ(t) dt; (d) Para toda função y com segunda derivada contínua em [a, b] e que satisfaz as condições de fronteira do problema de Sturm-Liouville, tem-se que y(t) = y n φ n (t), n N onde Para mais detalhes, vide, por exemplo, [6]. y n a b. = y(t) φ n (t) ρ(t) dt. a Referências [1] J. Sotomayor, Lições de equações diferenciais ordinárias. Projeto Euclides, IMPA, 1979. [2] E. A. Coddington e N. Levinson, Theory of ordinary differential equations. McGraw- Hill, 1987. [3] G. Teschl, Ordinary differential equations and dynamical systems. Gradute Studies in Mathematics, AMS, 2012. [4] M. Reed e B. Simon, Methods of modern mathematical physics, vol. 1 - funcional analysis, 3 a ed. Academic Press, 1980, isbn: 0-12-585050-6. [5] W. Rudin, Functional analysis. McGraw-Hill, 1991. [6] C. S. Hönig, Análise funcional e o problema de sturm-liouville. 1971. 44