Teoria da Probabilidade (curso de doutorado)
|
|
|
- Agustina Almada Angelim
- 9 Há anos
- Visualizações:
Transcrição
1 Teoria da Probabilidade (curso de doutorado) Glauco Valle Contents 1 Introdução 2 2 Teoria da Medida Teoria dos conjuntos e medidas Funções mensuráveis Integração Medidas e integração em espaços produto O Teorema de Radon-Nikodym e aplicações Distribuições Absolutamente contínuas em R d Aplicação: Esperança Condicional Tipos de Convergência 20 5 Convergência Fraca de Medidas Convergência em distribuição O Teorema de Prohorov Convergência fraca em C[0,1] Funções mensuráveis A medida de Wiener e o Movimento Browniano Teorema Central do Limite - Caso geral 34 1
2 Curso de Probabilidade Avançada - Prof. Glauco Valle 2 1 Introdução É remarcável que uma ciência que começou com considerações sobre jogos de azar deva ter se tornado o mais importante objeto do conhecimento humano. Laplace, Pierre Simon: Théorie Analytique des probabilités Teoria da Medida 2.1 Teoria dos conjuntos e medidas Ω conjunto arbitrário (espaço amostral) P(Ω) := {A subconjunto de Ω} conjunto das partes de Ω (classe de eventos) Definição: A P(Ω) não vazio é uma algebra de subconjuntos de Ω se A,B A A c, A B A. M P(Ω) não vazio é uma classe monótona de subconjuntos de Ω se E i E i+1, J i J i+1 + i=1 E i, + i=1 J i M O P(Ω) não vazio é uma σ-algebra de subconjuntos de Ω se A O, A i O, i N A c, + i=1 A i O. Dizemos que (Ω, O) é um espaço mensurável e que os elementos de O são os conjuntos (ou eventos) mensuráveis. Obs: A,B A A B, A B A. Toda σ-algebra é uma classe monótona. Uma algebra é uma σ-algebra se e somente se for uma classe monótona. P(Ω) é sempre uma σ-algebra. Para um conjunto arbitrário de indices I e (O i ) i I σ-algebras (classes monótonas) temos que i I O i é também uma σ-algebra (classe monótona). Dessa forma, para uma classe de conjuntos arbitrários C P(Ω) denotamos por σ(c) a menor σ-algebra contendo C definida como a interseção entre todas as σ-algebras contendo C, também chamada de σ-algebra gerada por C. No caso de um espaço topológico M a σ-algebra gerada pelos abertos é chamada de σ-algebra dos borelianos e é denotada B(M). Proposição Seja A uma algebra. Então a σ-algebra gerada por A, σ(a), coincide com a menor classe monótona contendo A. Exemplos 2.1 : Exemplos de algebras: (i) Ω = R, A = { k i=1 (a i,b i ] : k N, a i < b i + }. (ii) Ω = R d, A = { d i=1 R i : R i = (a i,1,b i,1 ]... (a i,d,b i,d ], a i,j < b i,j + }. (iii) Ω N, C uma algebra de subconjuntos de Ω, A = { k i=1 R i : R i = i=1 C i,l, C i,l C e C i,l = Ω exceto para um número finito de l s}. 1 Teorema em [3]
3 Curso de Probabilidade Avançada - Prof. Glauco Valle 3 (iv) Sejam (Ω, O), (Λ, G) espaços mensuráveis. A classe de conjuntos formada por uniões finitas do produto cartesiano de conjuntos mensuráveis, isto é, A = { d i=1 R i : R i = A i B i, A i O, B i G}, é uma algebra em Ω Λ. A σ-algebra gerada por A é chamada de σ-algebra produto e será denotada por O G. Exercício 2.1 Seja A a algebra definida no exemplo 2.1-(ii). Mostre que B(R d ) = σ(a). Exercício 2.2 Seja A a algebra definida no exemplo 2.1-(iv). Para todo E O G, ω Ω e λ Λ definimos a ω-seção e a λ-seção de E respectivamente por E ω = {z : (ω,z) E} e E λ = {z : (z,λ) E}. Mostre que E ω G e E λ O. Apesar da ausência de eventos, Algebras são mais naturais na definição de medidas e importantes por resultados de aproximação. Exercício 2.3 Fazer os exercícios 8 e 9 da seção 2.1 em [3]. Definição 2.2 Seja O P(Ω) uma σ-algebra (algebra). µ : O [0,+ ] é uma medida sobre O se (i) µ(a) µ( ) = 0, A O. (ii) A i O, i N, tal que A i A j =, i,j (e + i=1 A i O, se O for uma algebra) então µ ( + i=1 A ) + i = µ(a i ). Dizemos que (Ω, O,µ) é um espaço de medida, se µ(ω) < dizemos que (Ω, O,µ) é um espaço de medida finito e se µ(ω) = 1 dizemos que µ é uma probabilidade sobre Ω e que (Ω, O,µ) é um espaço de probabilidade. Propriedades de medidas: Seja (Ω, O,µ) um espaço de medida (i) A B µ(a) µ(b), para todos A,B O. (ii) Para todo A O tal que µ(a) < temos µ(a B) = µ(a) µ(a B) para todo B O. Em particular, se (Ω, O,µ) for finito então µ(a c ) = µ(ω) µ(a) para todo A O. (iii) Para toda sequência crescente (A n ) n 1 em O temos que i=1 lim µ(a n) = µ(a), onde A = + n i=n A n. (iv) Para toda sequência decrescente (A n ) n 1 em O com µ(a 1 ) < + temos que lim µ(a n) = µ(a), onde A = + n n=1 A n. Exemplos 2.2 : (i) Seja Ω um conjunto arbitrário. Denotamos por #A o número de elementos de A Ω, então # é uma medida sobre (Ω, P(Ω)) que chamamos de medida de contagem. (ii) Seja (Ω, O) um espaço mensurável. Para x Ω definimos δ x como δ x = { 1, x A 0,c.c., para todo A O. Dizemos que δ x é a medida de Dirac concentrada em x.
4 Curso de Probabilidade Avançada - Prof. Glauco Valle 4 Obs: A medida de contagem fornece um exemplo de que a condição µ(a 1 ) < + em (iv) acima não pode ser dispensada. Proposição 2.3 (Lema de Borel-Cantelli) Seja (E k ) k 1 uma sequência de conjuntos mensuráveis em um espaço de probabilidade (Ω, O,P), tais que Então µ(e k ) <, k=1 P(E n i.v.) = P( n 1 m n E m ) = 0, onde i.v. le-se infinitas vezes (do inglês i.o. que abrevia infinitely often ) e o resultado significa que quase todo ω Ω pertence a no máximo um número finito dos E k s. Definição Dizemos que uma medida µ sobre uma algebra A e σ-finita se existem (A n ) n 1 em A tal que Ω = n 1 A n e µ(a n ) < para todo n 1. Exemplo: A medida de contagem em um espaço não-enumerável não é σ-finita. Definição Dizemos que x é um átomo de um espaço de medida (Ω, O,µ), se {x} O e µ({x}) > 0. Se existe E O tal que µ(a) = µ(a E) para todo A O dizemos que µ é concentrada em E. Dizemos que uma medida µ é discreta se existe uma coleção de átomos (x i ) i I tal que µ é concentrada em (x i ) i I. Dizemos que uma medida é contínua se não possui átomos. Exercício 2.4 Mostre que o número de átomos de um espaço de medida σ-finito é enumerável. Exercício 2.5 Mostre que a soma de duas medidas é uma medida e que a multiplicação de uma medida por um escalar positivo também é uma medida. Mostre que toda medida pode ser escrita como a soma de uma medida discreta e de uma contínua. Exercício 2.6 Fazer os exercícios 1 e 4 da seção 2.2. em [3]. Teorema 2.4 (Teorema de extensão de Carathéodory) 2 Seja µ uma medida σ-finita sobre uma algebra A então existe uma única extensão de µ a σ(a). Exercício 2.7 Mostre que o Teorema de extensão de Carathéodory não se aplica mesmo se as medidas µ e ν forem σ-finitas sobre σ(a). Dica: Seja Ω = N { } e A a algebra de subconjuntos finitos de Ω não contendo e seus complementares, então defina µ(e) = ν(e) = #E se E { } e µ( ) ν( ). Exemplo 2.3 (Medida de Lebesgue) Definimos inicialmente uma função de conjuntos µ sobre os retângulos de R d por 2 Demonstração no apêndice A.2 em [4] µ(r) = Π d i=1(b i a i ), para todo R = d i=1(a i,b i ].
5 Curso de Probabilidade Avançada - Prof. Glauco Valle 5 Consideremos a algebra A do exemplo 2.1-(ii). Observe que todo conjunto em A pode ser escrito como a união disjunta de retângulos em R d. Assim, escrevendo A A como A = k j=1 R j com R i R j =, para todo i,j, extendemos µ a A por µ(a) = k µ(r j ). j=1 Pode-se mostrar que µ é uma medida σ-aditiva em A, logo pelo Teorema de Carathéodory existe uma única extensão a (R d, B(R d )). Essa medida chamamos medida de Lebesgue e denotamos por m d, ou simplesmente m no caso d = 1. Propriedades da medida de Lebesgue: (i) Se E B(R d ) for enumerável então m d (E) = 0. (ii) m d é invariante por transformações rígidas. (iii) Se E B(R d ) então m d (ρe) = ρ d m d (E) para todo ρ > 0. Exercício 2.8 O Conjunto de Cantor é definido indutivamente começando pela remoção do intervalo (1/3, 2/3) de [0, 1] e continuando por remover os intervalos intermediários de cada intervalo restante. Mostre que o conjunto de Cantor é o conjunto de pontos x [0,1] para o quais a sua expansão na base 3 contém apenas os dígitos 0 e 2, ou seja, existe uma sequência (a j ) + j=1 em {0,2} tal que x = j=1 a j3 j. Mostre que o conjunto de Cantor é um exemplo de conjunto de medida de Lebesgue nula que não é enumerável. Exercício 2.9 Mostre que é possível construir um conjunto de medida finita qualquer que contenha todos os racionais da reta. Exemplo 2.4 (Medida de Lebesgue-Stieltjes em R) Seja F : R R uma função não decrescente e contínua à direita. Definimos uma função de conjuntos µ sobre a algebra de intervalos semi-abertos de R definida em (2.1) por µ ( k i=1 (a i,b i ] ) := k (F(b i ) F(a i )) se os intervalos (a i,b i ] são dois a dois disjuntos. Essa medida é σ-aditiva sobre esta algebra, logo pelo Teorema de Carathéodory existe uma única extensão a (R, B(R)). Essa medida é chamada medida de Lebesgue-Stieltjes e denotamos por df. Note que df é σ-finita, além disso df é finita se e somente se F( ) = lim x F(x) > e F(+ ) = lim x + F(x) <. Neste caso, µ(r) = F(+ ) F( ), em particular a medida de Lebesgue-Stieltjes é uma probabilidade se e somente se F(+ ) F( ) = 1. Note que, a soma de uma constante a F não altera a medida resultante, para que a identificação entre funções e medidas seja biunívuca no caso de medidas finitas nos impomos a condição de que F( ) = 0. Se além de F( ) = 0 temos F(+ ) = 1, dizemos que F é uma função de distribuição em R. Exercício 2.10 Prove os seguintes fatos: (i) Prove a identificação entre medidas finitas e funções crescente se anulando em mencionada em (2.5). (ii) Mostre que a R é um átomo de uma medida de Lebesgue-Stieltjes se e somente se a função crescente associada é discontínua em a. (iii) Mostre que toda função de distribuição pode ser decomposta na soma de uma função de distribuição discreta (puro salto) e uma função de distribuição contínua. Isto equivale a decomposição para medidas. i=1
6 Curso de Probabilidade Avançada - Prof. Glauco Valle 6 Exercício 2.11 (Suporte de uma função de distribuição e de uma medida de Lebesgue-Stieltjes) Fazer exercícios 6 e 7 da seção 1.2 e o exercício 24 da seção 2.2 em [3]. O que representa o suporte de uma função de distribuição em termos da medida associada? Exemplo 2.5 (Medida de Lebesgue-Stieltjes em R d ) Seja µ uma medida finita em (R d, B(R d )) e defina a função real F(x) = µ( d i=1(,x i ]), x R d. A função F acima definida satisfaz as seguintes propriedades (i) é crescente em todas as coordenadas; (ii) é contínua a direita; (iii) lim x F(x) = µ(r d ) < e lim xi F(x) = 0 para todo 1 i d; (iv) Para toda coleção de intervalos I 1 = (a 1,b 1 ],..., I d = (a d,b d ], R F = 1,I1... d,id F 0, onde R = Π d i=1 (a i,b i ] e para um intervalo I = (a,b] temos que k,i F(x 1,...,x d ) = F(x 1,...,x k 1,b,x k+1,...,x d ) F(x 1,...,x k 1,a,x k+1,...,x d ). Por outro lado, se F for uma função que satisfaça (i)-(iv) podemos definir µ(r) = R F para todo retângulo R em R d. Extendemos µ por aditividade a uma medida sobre a algebra gerada pelos retângulos. Nesta algebra a medida é σ-aditiva e pelo Teorema de Carathéodory existe uma única extensão a (R d, B(R d )). Essa medida é chamada medida de Lebesgue-Stieltjes e denotada por df. Se em particular consideramos lim n F(x) = 1 em (iii) dizemos que a função F : R d R que satisfaça as propriedades (i)-(iv) acima é chamada de função de distribuição multidimensional. Observe que a condição (iv) na definição de função de distribuição multidimensional é necessária. Como exemplo consideremos a função F(x 1,x 2 ) = 1 E (x 1,x 2 ), onde E = {(x 1,x 2 ) : x 1 + x 2 1}, então F satisfaz (i)-(iii) porém (0,1] 2F = F(1,1) F(1,0) F(0,1) + F(0,0) = 1. Definição: Seja (Ω, O,µ) um espaço de medida. A classe de conjuntos de medida µ zero é N = {A P(Ω) : A B O, µ(b) = 0}. Dizemos que (Ω, O,µ) é completo se N O. Definimos o completamento de (Ω, O,µ) como o espaço de medida (Ω, Õ, µ) (ver exercicio abaixo) onde Õ = {A B : A O, B N } e µ é a extensão natural de µ a Õ, isto é, para todo C Õ temos µ(c) = µ(a) para uma escolha de A O tal que C = A B para algum B N. Exercício 2.12 Mostre que (Ω, Õ, µ) está bem definido como espaço de medida. Faça o exercício 20 da seção 2.2 em [3]. Obs: Existem conjuntos não mensuráveis em R d, ou seja, conjuntos que não pertencem a B(R d ).
7 Curso de Probabilidade Avançada - Prof. Glauco Valle Funções mensuráveis Definição: Seja (Ω, O) um espaço mensurável e M um espaço topológico. Uma função X : Ω M é dita uma função mensurável (f.m.) se X 1 (A) O para todo aberto A de M. Se M = [,+ ] então X é chamada de função mensurável real estendida (f.m.r.e) ou simplesmente f.m.r. se X não toma valores ±. No caso de estarmos considerando um espaço de probabilidade (Ω, O,P) é convencionalmente usado o termo elemento aleatório de M no lugar de f.m., variável aleatória extendida (v.a.e.) no lugar de f.m.r.e., variável aleatória no lugar de f.m.r. e se M = R d, d > 1, de chamarmos o elemento aleatório de vetor aleatório. Se f : (R d, B(R d )) (R, B(R)) for uma f.m. dizemos que f é uma função boreliana de d variáveis ou simplesmente uma função boreliana se d = 1. Exercício 2.13 Mostre que se X for mensurável então {X 1 (A) : A B(M)} é uma sub σ- algebra de O, esta σ-algebra será denotada por σ(x). Em particular X é mensurável se e somente se X 1 (A) O para todo A B(M). Mostre ainda que se X é uma f.m.r. se e somente se X 1 ([a,b)) O, para todo a, b R, e que toda função contínua f : R d R é boreliana. Proposição 2.5 Sejam M, M espaços topológicos e (Ω, O) um espaço mensurável. (i) Seja g : M M contínua e X : Ω M mensurável, então g X : Ω M é mensurável. (ii) Se X e Y são f.m.r. e Φ : R 2 M for contínua então Φ(X,Y ) é mensurável. Proposição 2.6 Sejam X e Y f.m.r.e. então X + Y, X 2, XY, 1/X, max(x,y ), min(x,y ), X +, X, X são f.m.r.e. s. Além disso, para uma sequência de f.m.r.e. (X n ) temos que supx n, n inf n X n, limsup X n, n liminf n X n são também f.m.r.e. s e em particular se (X n ) converge então lim n X n é f.m.r.e. Obs: Por convenção a vale para a (0, ] e vale 0 se a = 0. Seja (Ω, O) um espaço mensurável. Uma f.m.r. S sobre Ω é chamada uma f.m.r. simples se for da forma n S = c i 1 Ei i=1 para c 1,...,c n R distintos e E 1,...,E n O disjuntos. Proposição 2.7 Seja X uma f.m.r.e. positiva então existem f.m.r. s simples 0 S 1 S 2... X tal que S n (ω) X(ω) para todo ω Ω. Exercício 2.14 Seja X uma função O G-mensurável em Ω Λ. Para cada ω Ω definimos as projeções X ω = X(ω,λ) em Λ e X λ = X(ω,λ) em Ω. Mostre que para cada ω Ω a projeção X ω é G-mensurável e para cada λ Λ a projeção X λ é O-mensurável. Definição: Seja X uma v.a. sobre um espaço de probabilidade (Ω, O,P). A função de distribuição de X é a função F X (x) = P(X x) e a distribuição de X é a medida de probabilidade df X em (R, B(R)).
8 Curso de Probabilidade Avançada - Prof. Glauco Valle 8 Exercício 2.15 Fazer os exercícios 3, 4, 5, 7 e 10 da seção 3.1 em [3]. Definição: Seja (Ω, O,P) um espaço de probabilidade. Dois eventos A e B são independentes se P(A B) = P(A)P(B). As v.a. s X 1,...,X n são independentes se P(X 1 A 1,...,X n A n ) = Π n i=1 P(X i A i ) para todo A 1,...,A n B(R). Duas σ-algebras O e G são independentes se todo par de conjuntos A O e B G são independentes. É simples verificar que duas v.a s X e Y são independentes então σ(x) e σ(y ) são independentes. Reciprocamente se O e G são independentes e X é O-mensurável e Y é G-mensurável, então X e Y são independentes. É importante notar que se X, Y e Z são v.a. s tais que os pares (X,Y ), (X,Z) e (Y,Z) são independentes não implica que X, Y e Z são independentes. Dizemos que uma coleção de v.a. s (X i ) i I é dois a dois independente se todo par (X i,x j ) for independente e em geral que (X i ) i I é n a n independente se toda n-upla (X i1,...,x in ) for independente. Exercício 2.16 Faça os exercícios 1, 2, 3 e 8 da seção 3.3 de [3] Proposição 2.8 Sejam X j vetores aleatórios em n j variáveis para 1 j k que são independentes. Se f j são funções borelianas em n j variáveis para 1 j n, então f 1 (X 1 ),...,f k (X k ) também são independentes. Proposição 2.9 (Segundo lema de Borel-Cantelli) Seja (E k ) k 1 uma sequência de conjuntos independentes em um espaço de probabilidade (Ω, O,P), tais que P(E k ) =, k=1 Então P(E n i.v.) = 1. Seja (X n ) n=1 uma sequência de v.a. s independentes. Os Lemmas de Borel-Cantelli servem para especificar a probabilidade de eventos do tipo {X n A n i.v.}, esses eventos são subconjuntos na σ-algebra da cauda da sequência X n que é a σ-algebra k σ(x k,x k+1,...). Para os eventos nessa σ-algebra nos temos um resultado geral: Teorema 2.10 (Lei 0-1 de Kolmogorov) Seja (X n ) n=1 uma sequência de v.a. s independentes em um espaço de probabilidade (Ω, O,P). Se E k σ(x k,x k+1,...) então P(E) {0,1}. 2.3 Integração Durante esta seção trabalharemos em um espaço de medida (Ω, O,µ) fixado. Definição: Definimos a integral de Lebesgue de uma f.m.r. simples S = n i=1 c i1 Ei com respeito a µ sobre A O por n Sdµ := c i µ(e i A). A i=1 Se X for uma f.m.r.e. positiva (com valores em [0, ]) definimos a integral de Lebesgue de X com respeito a µ sobre A O por Xdµ := sup Sdµ [0, ] S A A
9 Curso de Probabilidade Avançada - Prof. Glauco Valle 9 onde o supremum é tomado sobre todas as f.m.r. simples tais que 0 S X. Se A = Ω omitiremos a indicação do conjunto na integral, a menos que não esteja claro qual é o espaço amostral. Dizemos que uma f.m.r. X é µ-integrável se X dµ <. neste caso X + dµ e X dµ são finitas e definimos a integral de Lebesgue de X com respeito a µ como Xdµ := X + dµ X dµ. Obs: Se (Ω, O,µ) for um espaço de probabilidade costumamos usar a notação E µ [X] no lugar de Xdµ e chamar essa integral de esperança de X com respeito a µ, quando estiver claro em que espaço de probabilidade estamos trabalhando usamos simplesmente E[X]. Propriedades da integral: (i) X Y µ-integráveis ou positivas E Xdµ E Y dµ. (ii) A B, X positiva A Xdµ B Xdµ. (iii) Sejam X, Y µ-integráveis e c R uma constante, então (cx + Y )dµ = c Xdµ + Y dµ. (iv) X 0 Xdµ = 0 (mesmo se µ(e) = ). E (v) µ(e) = 0, X µ-integrável Xdµ = 0. Em particular, se X e Y são µ-integráveis e E µ(x Y ) = 0 então Xdµ = Y dµ. (vi) X for µ-integrável ou positiva e E O E Xdµ = X1 E dµ. (vii) X µ-integrável Xdµ X dµ. Definimos uma relação de equivalência no espaço de f.m.r. s: X é equivalente a Y se e somente se µ(x Y ) = 0, neste caso dizemos que X e Y coincidem µ quase certamente ou abreviadamente µ-q.c.. Por (v) temos que a o valor das integrais sobre conjuntos mensuráveis de v.a s dentro de uma mesma classe de equivalência é constante, logo do ponto de vista de integração duas f.m.r. s µ- integráveis que são identicas µ-q.c. podem ser consideradas iguais se desprezamos seus valores nesse conjunto de medida nula onde elas se diferem. Entretanto, no que diz respeito a mensurabilidade, observe que se modificarmos os valores de uma f.m.r. em um conjunto de medida nula não podemos garantir mensurabilidade da função obtida a menos que o espaço de medida seja completo. Assim, como ao descartar uma coleção enumerável de conjuntos de medida nula estamos ainda descartando um conjunto de medida nula, também podemos estender todos os resultados dessa seção que envolvem um processo limite de funções mensuráveis a occorrência quase certa do mesmo processo limite, isto é, ocorrendo a menos de um conjunto de medida nula (ver a seção 4). Teorema 2.11 (Teorema de convergência monótona de Lebesgue) Seja (X n ) n 1 uma sequência de f.m.r.e. positivas que seja monótona crescente e seja X o seu limite, então X é também uma f.m.r.e. e Xdµ = lim X n dµ. n
10 Curso de Probabilidade Avançada - Prof. Glauco Valle 10 Teorema 2.12 Seja (X n ) n 1 uma sequência de f.m.r.e positivas e X = i=1 X n, então Xdµ = X n dµ. n=1 Teorema 2.13 (Lema de Fatou) Seja (X n ) n 1 uma sequência de f.m.r.e positivas, então lim inf X ndµ liminf X n dµ. n n Proposição 2.14 Seja X uma f.m.r. µ-integrável e ν(e) = Xdµ, E O. Então ν é uma medida com sinal sobre (Ω, O). E Obs: Costumamos usar a seguinte notação dν = Xdµ para indicar que a medida ν é da forma que aparece na proposição acima. A recíproca dessa proposição é o Teorema de Radon-Nikodym que será visto na Seção 3. Proposição 2.15 Seja X uma f.m.r. µ-integrável então para todo ǫ > 0 existe δ > 0 tal que X dµ < ǫ para todo E O satisfazendo µ(e) < δ. E Em particular, se lim n µ(e n ) = 0 então lim n E n Xdµ = 0. Exercício 2.17 Mostre que (i) Se X for uma f.m.r. positiva e Xdµ = 0 então X = 0 µ-q.c. em Ω. (ii) Se X for uma f.m.r. e Xdµ = 0 para todo E O então X = 0 µ-q.c. em Ω. E Definição: Para 1 < p < + e X uma f.m.r. Dizemos que X tem momento de ordem p finito se X p dµ <. Denotamos o espaço de f.m.r. s com momentos de ordem p finitos por L p (µ). Proposição 2.16 (Desigualdade de Hölder e Minkowski) Sejam p 1, q 1 inteiros tais que p 1 + q 1 = 1. Se X, X L p (µ) e Y L q (µ) então ( XY dµ ) 1 ( ) 1 X p p dµ Y q q dµ e ( ) 1 ( X + X p p dµ ) 1 ( X p p dµ + ) 1 X p p dµ.
11 Curso de Probabilidade Avançada - Prof. Glauco Valle 11 Obs: L p (µ) é um espaço vetorial. Se para X L p (µ) denotamos ( ) 1 X p = X p p dµ então p é uma norma completa sobre L p (µ). Obs: Como consequência da desigualdade de Hölder, se (Ω, O,µ) for um espaço de medida finito, então os espaços L p (µ) são decrescentes, isto é, L p (µ) L q (µ) com 1 p q <. Proposição 2.17 (Desigualdade de Jensen) Se µ for uma probabilidade, então para toda v.a. X L 1 (µ) tal que a < X < b + e ϕ : (a,b) R convexa ( ) ϕ Xdµ ϕ(x)dµ. Proposição 2.18 (Desigualdade de Chebyshev) Suponha que µ seja uma probabilidade. Seja X L 1 (µ) e ϕ : R R uma função positiva e crescente em (0, ) tal que ϕ(u) = ϕ( u), então para todo u > 0, µ( X u) 1 ϕ(x)dµ. ϕ(u) Teorema 2.19 (Teorema de Convergência Dominada) Seja (X n ) uma sequência de f.m.r s que converge µ-q.c. Se existe Y L 1 (µ) positiva tal que X n Y para todo n então lim X ndµ = lim X n dµ. n n Exemplo 2.6 Observe que a condição de dominação é de fato necessária para garantir o intercâmbio entre o limite e a integral como no TCD. Um contra-exemplo usual é o seguinte: Considere o espaço de probabilidade ([0,1], B([0,1]),m) e as v.a s X n = 2 n 1 [0,2 n ], então lim n X n = 0 q.c, mas para todo n temos E[X n ] = 1 logo lim n E[X n ] = 1 0 = E[lim n X n ]. Proposição 2.20 Seja X uma f.m.r. sobre um espaço de medida finito (Ω, O,µ) que induz o espaço de medida finito (R, B(R),dF X ) e seja ϕ uma função boreliana. Então vale a igualdade ϕ(x(ω))µ(dω) = ϕ(x)df X (x) Ω R Teorema 2.21 (Teorema de mudança de variáveis) Suponha que (i) E A R d onde V é aberto e T : V R d é contínuo; (ii) E é Lebesgue mensurável, T é 1:1 em E e T e diferenciável em cada ponto de E. (iii) m d (T(V E)) = 0 Então, colocando F = T(E), f dm d = F E (f T) J T dm d para toda função boreliana f : R d [0, ], onde J T = J T (x) é a matriz jacobiana no ponto x. Exercício 2.18 Fazer os exercicios 4, 5, 6, 14, 16, 17, 18 e 19 da seção 3.2 em [3].
12 Curso de Probabilidade Avançada - Prof. Glauco Valle Medidas e integração em espaços produto Começamos por um resultado necessário na definição de medida produto. Teorema 2.22 Sejam (Ω, O,µ), (Λ, G,ν) dois espaços de medida σ-finitos. Suponha Q O G, então a função ν(q ω ) é O-mensurável, µ(q λ ) é G-mensurável e ν(q ω )dµ = µ(q λ )dν. Ω Definição: (Medida produto) Sejam (Ω, O,µ), (Λ, G,ν) dois espaços de medida σ-finitos. Para Q O G definimos (µ ν)(q) = ν(q ω )dµ = µ(q λ )dν. Ω Pelo Teorema 2.12, temos que µ ν é uma medida em (Ω Λ, O G) que chamamos de medida produto de µ e ν. Note que a medida produto de um retângulo A B, A O e B G, é dada por (µ ν)(a B) = µ(a) ν(b). Assim pelo Teorema de Carathéodory a medida produto é caracterizada como a única medida cujo valor nos retângulos é o produto das medidas das projeções. Λ Λ Teorema 2.23 (Teorema de Fubini) Sejam (Ω, O, µ), (Λ, G, ν) dois espaços de medida σ-finitos. Seja X uma f.m.r. em (Ω Λ, O G) (i) Se X for positiva então Ω X λ dµ, and Λ X ω dν são respectivamente G-mensurável e O-mensurável e { } X λ dµ dν = Xd(µ ν) = (ii) Se então X L 1 (µ ν). Λ Ω Ω { Ω Λ Λ } X ω dν dµ < (iii) Se X L 1 (µ ν), então X ω L 1 (ν) µ-q.c., X λ L 1 (µ) ν-q.c., além disso X λ dµ, and X ω dν estão respectivamente em L 1 (ν) e L 1 (µ) e (2.1) vale. Ω Λ Ω { Λ } X ω dν dλ (2.1) Exercício 2.19 Generalize a definição de medida produto e o Teorema de Fubini para o produto de n espaços mensuráveis. Sejam (Ω i, O i,µ i ), 1 i n, espaços produtos, definimos indutivamente com base na definição acima a medida produto n i=1 µ i sobre n i=1 O i, que pelo Teorema de carathéodory é a única medida sobre a σ-algebra produto cuja medida dos retângulos A 1... A n fatora-se como o produto µ 1 (A 1 )...µ n (A n ). Em particular, m d = d i=1 m. Obs: Se (Ω, O,µ), (Λ, G,ν) são dois espaços de medida completos, o espaço (Ω Λ, O G,µ ν) não é necessariamente completo.
13 Curso de Probabilidade Avançada - Prof. Glauco Valle 13 Exercício 2.20 Contra-exemplos para o Teorema de Fubini: (i)construa um exemplo de uma função boreliana f em [0,1] [0,1] que satisfaça: 1 1 f(x,y)dydx = 1 0 = f(x,y)dxdy, entretanto f(x,y) dydx = +. (ii) Considere os espaços de medida ([0,1], B([0,1]),m) e ([0,1], P([0,1]),#), encontre um exemplo de uma f : [0,1] [0,1] R + limitada que seja B([0,1]) P([0,1]) mesurável tal que f(x,y)d#(y)dm(x) = 1 0 = f(x,y)dm(x)d#(y). Exercício 2.21 Fazer o exercício 20 da seção 3.3 em [3]. O próximo resultado generaliza a proposição 2.20 para distribuições multidimensionais. Proposição 2.24 Seja (X 1,...,X n ) funções mensuráveis sobre um espaço de medida finito (Ω, O,µ) que induz o espaço de medida finito (R n, B(R n ),df X1,...,X n ) e seja ϕ uma função boreliana n- dimensional. Então vale a igualdade ϕ(x 1 (ω),...,x n (ω))µ(dω) = ϕ(x)df X1,...,X n (x) Ω R n Uma forma de caracterizar independência de v.a. s é através de sua distribuição conjunta. Se X 1,...,X n são v.a. s independentes, então a distribuição conjunta de (X 1,...,X n ) fatora-se como o produto das distribuições de X 1,...,X n, isto é, df X1,...,X n = df X1... df Xn, em particular a função de distribuição conjunta fatora no produto das funções de distribuição marginais. De forma mais geral, sejam X 1,...,X n elementos aleatórios independentes sobre um espaço M separável e µ j suas distribuições, isto é, µ i (A) = P(X i A) para todo A B(M), então a distribuição µ do vetor (X 1,...,X n ) fatora-se como µ = n i=1 µ i. Proposição 2.25 Sejam X e Y v.a. s independentes, então E[XY ] = E[X]E[Y ]. Exercício 2.22 Mostre que existem v.a. s X e Y em um espaço de probabilidade (Ω, O,P) tais que X Bin(n,p), Y Bin(n,q), com p < q, e P(X Y ) = 1. Faça o mesmo para X Poisson(λ 1 ), Y Poisson(λ 2 ), com λ 1 < λ 2 (A distribuição conjunta é chamada de medida de acoplamento nestes casos em que uma relação específica de dependência é caracterizada). O próximo resultado diz respeito a existência de medidas em espaços de produto infinito. O resultado apresentado aqui é para o espaço de sequências reais, mas pode ser generalizado para espaços de trajetórias reais que sejam indexadas por conjuntos não enumeráveis (Isto será visto posteriormente como pré-requisito no estudo de processos estocásticos a tempo contínuo). Para o espaço de sequências utilizamos a seguinte notação R N = {(x i ) i=1 : x i R}, e por B N a σ-algebra produto de R N definida em (iii) do exemplo (2.1). Denotamos por π k,k+1 : R k+1 R k e π k : R N R k as projeções canônicas nas k primeiras variáveis.
14 Curso de Probabilidade Avançada - Prof. Glauco Valle 14 Teorema 2.26 (Teorema de extensão de Kolmogorov) Seja (µ k ) k 1 uma família de medidas de probabilidade respectivamente sobre (R k, B(R k )), satisfazendo µ k = µ k+1 π 1 k,k+1, k 1, então existe uma única medida de probabilidade µ sobre (R N, B N ) tal que µ k = µπ 1 k. Pelo Teorema de Kolmogorov podemos falar na distribuição de uma sequência de v.a s (X i ) i=1 sobre (R N, B N ) que é i=1 ν i, onde ν i é a distribuição de X i. Verifica-se isto fazendo µ k = k i=1 ν i no Teorema 2.26 e definindo i=1 ν i := µ com µ como no enunciado. Exercício 2.23 Discuta com exemplos a relação entre medidas produto e independência. 3 O Teorema de Radon-Nikodym e aplicações Nesta seção nós começamos por generalizar o nosso conceito de medida. Uma medida com sinal é toda função de conjuntos de uma σ-algebra em R que é σ-aditiva e se anula em. As medidas como as definidas na Definição 2.2 serão chamadas de medidas positivas. Com o termo medida será usado em ambos os casos. Definição: Seja (Ω, O) um espaço mensurável. Se µ for uma medida positiva e ν uma medida com sinal sobre (Ω, O) dizemos que ν é absolutamente contínua com respeito a µ (notação: ν << µ) se ν(a) = 0 para todo A O tal que µ(a) = 0. Se ν 1 e ν 2 são medidas sobre (Ω, O) e existir um conjunto E O tal que ν 1 é concentrada em E e ν 2 em E c, dizemos que ν 1 e ν 2 são mutuamente singulares (notação: ν 1 ν 2 ). Proposição 3.1 Sejam µ, ν, ν 1 e ν 2 medidas sobre um espaço mensurável (Ω, O) tal que µ é uma medida positiva. (i) ν 1 µ e ν 2 µ ν 1 + ν 2 µ, (ii) ν 1 << µ e ν 2 << µ ν 1 + ν 2 << µ, (iii) ν 1 << µ e ν 2 µ ν 1 ν 2, (iv) ν << µ e ν µ ν = 0. Teorema 3.2 (Teorema de Radon-Nikodym) Seja µ uma medida positiva σ-finita sobre um espaço mensurável (Ω, O) e ν uma medida com sinal sobre o mesmo espaço. Temos que (i) Existe um único par de medidas ν a e ν s tais que ν = ν a + ν s, com ν a << µ e ν s µ. Se ν for positiva e finita, então também o são ν a e ν b. (ii) Existe uma única H L 1 (µ) tal que ν a (E) = além disso H é positiva se ν for positiva. E Hdµ, E O,
15 Curso de Probabilidade Avançada - Prof. Glauco Valle 15 Em particular, se ν << µ temos que ν = ν a, neste caso a função H em (ii) no Teorema de Radon- Nikodym é denominada de derivada de Radon-Nikodym ou densidade de ν com respeito a µ e será denotada por dν dµ. Pela proposição 2.15 temos que ν << µ se e somente se para todo ǫ > 0 existe δ > 0 tal que µ(e) < δ implica ν(e) < ǫ. Proposição 3.3 Sejam µ e ν duas medidas positivas tal que ν << µ, então se X L 1 (ν) temos que X dν dµ L1 (µ) e X dν = X dν dµ dµ. Exercício 3.1 Sejam ν e µ duas medidas positivas tais que ν << µ. Se dν dµ > 0 q.c. então µ << ν ( 1, e dµ dν = dν dµ) neste caso dizemos que ν e µ são equivalentes. 3.1 Distribuições Absolutamente contínuas em R d Vamos considerar agora uma aplicação, mas antes consideremos o seguinte resultado: Proposição 3.4 Toda função real monótona é q.c. diferenciável com respeito a medida de Lebesgue. Consideremos uma medida finita ν em (R d, B(R d )). Pelo Teorema de Radon-Nikodym existem medidas ν a e ν s em (R d, B(R d )) tais que ν a << m d e ν s m d. Sejam F, F a e F s respectivamente as funções de distribuição de ν, ν a, ν s. Note que F(x) = ν( d i=1(,x i ]) = ν a ( d i=1(,x i ]) + ν s ( d i=1(,x i ]) = F a (x) + F s (x), x R d, ou seja F = F a + F s. Temos que F a é chamada de a parte absolutamente contínua de F e F s de a parte singular de F. Como uma medida discreta não pode ser absolutamente contínua com respeito a Lebesgue, temos que F a é contínua. Por outro lado, F s pode ser decomposta em sua parte contínua, que denotamos F sc, e sua parte discreta F d, isto é, F s = F sc + F d. Suponhamos d = 1, ora ambas F a e F sc são contínuas e estamos interessados na propriedade que difere uma da outra. Pelo item (ii) no Teorema de Radon-Nikodym existe h L 1 (m) tal que F a (x ) F a (x) = ν((x,x ]) = x x h(y)dy, x,x [,+ ] : x < x, Pela proposição 3.4 F a é difereniável q.c. e F a = h q.c.. Uma função que satisfaça x G(x ) G(x) = ν((x,x ]) = g(y)dy, x x,x [,+ ] : x < x, para algum g L 1 (m) é dita absolutamente contínua. Note que x F(x ) F(x) h(x)dx = F a (x ) F a (x) = (F(x ) F(x)) (F s (x ) F s (x)), x por outro lado se existir g L 1 (m) positiva tal que x F s (x ) F s (x) g(x)dx, x x,x [,+ ] : x < x,
16 Curso de Probabilidade Avançada - Prof. Glauco Valle 16 teríamos também que ν s (E) E g(x)dx, E B(R), o que seria uma contradição ao fato de ν s m a menos que g = 0 m-q.c.. Definição: Dizemos que uma função de distribuição é absolutamente contínua se F = F a e que ela é singular se F = F s. Em particular toda função de distribuição é a combinação convexa de uma função de distribuição absolutamente contínua e uma singular. Obs: Pela Proposição 3.4, no caso de uma função de distribuição F teremos F = F a q.c. e F s = 0 q.c. (Tente mostrar isto usando o Lema de Fatou). No caso de F sc foge a intuição o fato de termos funções contínuas que são diferenciáveis q.c. com derivada nula, mas que não são constantes. Um exemplo de função de distribuição contínua singular é a função de Cantor definida por 1, se x 1, k F(x) = 2, se x J n n,k, 0, se x 0, lim y K, y x F(y), x K, onde K denota o conjunto de Cantor e J n,k denota o k-ésimo intervalo removido de [0,1] na n-ésima etapa do processo que define o conjunto de Cantor. Note ainda que como consequência do Teorema 3.3, temos que para uma função de distribuição absolutamente contínua F, se X L 1 (df) então XF L 1 (m) e XdF = XF dm R R São exemplos conhecidos dos cursos de probabilidade básica as famílias de distribuições absolutamente contínuas: normal, exponencial, t-student, gamma, beta. E as famílias de distribuições discretas: binomial, geométrica, Poisson. Embora as distribuições contínuas singulares não apareçam diretamente em cursos preliminares de probabilidade e estatística, elas não são apenas importantes do ponto de vista teórico, podemos citar exemplos de aplicações como ao cálculo estocástico cujas ramificações servem a estabelecer modelos probabilísticos relevantes em física e finanças. Exercício 3.2 (Generalização do Teorema Fundamental do Cálculo) Mostre que se g for uma função continuamente diferenciável com suporte compacto então + g(x)df(x) = + g (x)f(x)dx. Obs: Esse resultado permite pensar em df como a derivada de F e é em certos contextos chamada de derivada distribucional de F. Exercício 3.3 Mostre que a função de Cantor é uma função de distribuição contínua singular, cujo suporte é o conjunto de Cantor. Exercício 3.4 Fazer exercícios 3 e 4 da seção 1.3 em [3].
17 Curso de Probabilidade Avançada - Prof. Glauco Valle Aplicação: Esperança Condicional Uma das primeiras aplicações do Teorema de Radon-Nikodym na Teoria das probabilidades é a existência de probabilidades e esperanças condicionais. Consideremos um espaço de probabilidade (Ω, O,P). Seja A O e Y uma v.a., definimos µ A (C) := P(A {Y C}) P(Y C) =: df Y (C), C B(R). Temos que µ A e df Y são medidas positivas, além disso a inequação acima implica que µ A << df Y. Pelo Teorema de Radon-Nikodym existe φ : R R boreliana e integrável com respeito a df Y tal que P(A {Y C}) = φ(y)df Y (y). (3.1) Definimos P(A Y = y) := φ(y), q.c. com respeito a m, e dizemos que P(A Y = ) é uma versão da probabilidade condicional de A dado Y. Definimos a v.a P(A Y ) por P(A Y )(ω) := P(A Y (ω)) = φ(y (ω)). Então por (3.1) P(A {Y C}) = {Y C} C P(A Y )P(dy) = E [ P(A Y )1 {Y C} ], C B(R). (3.2) A vantagem do uso da derivada de Radon-Nikodym é que ela permite uma definição coerente da probabilidade condicional que se aplica mesmo quando P(Y = y) = 0. Definição: Chamamos de probabilidade condicional de A dado Y a única v.a. 3, denotada P(A Y ), que é σ(y )-mensurável satisfazendo (3.2). Lema 3.5 Existe uma versão regular da probabilidade condicional, isto é, temos P(A Y )(ω) como uma função de (A,ω) O Ω tal que (i) Para todo A O, P(A Y )(ω) é O-mensurável na variável ω, (ii) Para todo ω Ω, P( Y )(ω) é uma probabilidade. Analogamente obtemos um resultado de existência da esperança condicional. Seja X tal que X L 1. Definimos µ X (C) := XdP E[ X ], C B(R). {Y C} Temos que µ X é uma medida finita sobre B(R), além disso por propriedade da integral temos que µ X << df Y. Pelo Teorema de Radon-Nikodym existe φ : R R boreliana e integrável com respeito a df Y tal que XdP = φ(y)df Y (y). (3.3) {Y C} Como antes, definimos E(X Y = y) := φ(y), q.c. com respeito a m, e dizemos que E(X Y = ) é uma versão da esperança condicional de X dado Y. Definimos a v.a E(X Y ) por E(X Y )(ω) := E(X Y (ω)) = φ(y (ω)). 3única a menos de uma versão diferindo em um conjunto de probabilidade 0 C
18 Curso de Probabilidade Avançada - Prof. Glauco Valle 18 Então por (3.3) {Y C} XdP = o que é também equivalente a XdP = A {Y C} A E(X Y )P(dy) = E [ E(X Y )1 {Y C} ], C B(R). (3.4) E(X Y )P(dy) = E [ E(X Y )1 A ], A σ(y ). (3.5) Definição: Chamamos de esperança condicional de X dado Y a única v.a. 4, denotada por E[X Y ], que é σ(y )-mensurável satisfazendo (3.4) ou (3.5). Observe que a definição de probabilidade condicional dado uma v.a. é uma caso particular da esperança conditional. Outra observação importante é a de que a esperança condicional E[X Y ] só depende da varíavel aleatória Y através da σ-algebra σ(y ), funcionando como um filtro que reinterpreta a v.a. X em termos da informação proveniente de σ(y ). Baseado nisto, seria útil poder fazer o mesmo para toda σ-algebra G O. Isto se daria por outra aplicação análoga do Teorema de Radon-Nikodym generalizando as anteriores. De fato, se X L 1 temos que a medida Q X (A) := XdP E[ X ], A G A é absolutamente contínua com respeito a P e a derivada de Radon-Nikodym correspondente, denotada por E[X G], é a única função em L 1 que satisfaz XdP = E[X G]P(dy) = E [ ] E[X G]1 A, A G. (3.6) A A Definição: Chamamos a v.a. E[X G] da esperança condicional de X dado G. A esperança condicional é importante ferramenta em Teoria da Probabilidade. Formalizando a noção de condicionamento, ela serve de base na definição de certos processos estocásticos que motivaram o desenvolvimento da Probabilidade moderna e aparecem em inumeras aplicações. Como mencionado antes devemos sempre guardar a idéia de que a esperança condicional de X dado G funciona como um filtro que reinterpreta a v.a X em termos da informação proveniente do conhecimento de G. Lema 3.6 Existe uma versão regular da probabilidade condicional, isto é, temos P(A G) como uma função de (A,ω) O Ω tal que (i) Para todo A O, P(A G)(ω) é G-mensurável na variável ω, (ii) Para todo ω Ω, P( G)(ω) é uma probabilidade. Pelo Lema acima podemos pensar na probabilidade condicional como uma medida de probabilidade aleatória e na esperança condicional como a esperança com respeito a essa medida de probabilidade aleatória. Propriedades da esperança condicional: Seja X, Y e (X n ) n 1 v.a. s sobre um espaço de probabilidade (Ω, O, P) e G O uma σ-algebra: (i) E[E[X G]] = E[X] ; (ii) X c E[X G] = c q.c.; 4única a menos de uma versão diferindo em um conjunto de probabilidade 0
19 Curso de Probabilidade Avançada - Prof. Glauco Valle 19 (iii) (monotonicidade) X Y E[X G] E[Y G] q.c.; (iv) (linearidade) Para todo a, b R temos que E[aX + by G] = ae[x G] + be[y G] ; (v) (Desigualdade de Jensen) Seja φ : R R convexa, então φ(e[x G]) E[φ(X) G]; (vi) (Convergência monótona) Se X n 0 e X n X, então E[X n G] E[X G] ; (vii) (Convergência dominada) Se X n X, E[ Y ] < e X n Y para todo n, então E[X n G] E[X G]; (viii) Se X for G-mensurável então E[XY G] = XE[Y G] q.c., em particular X = E[X G] q.c.; (ix) Se X e G são independentes então E[X G] = E[X] q.c. Proposição 3.7 Seja X uma v.a. e G uma σ-algebra, então E[X G] é entre as v.a. s G-mensuráveis aquela que minimiza o erro quadrático médio, isto é, E[(X E[X G]) 2 ] E[(X Y ) 2 ] para toda v.a. Y G-mensurável. Exercício 3.5 Prove a Proposição 3.7. Seja X uma v.a. e G uma σ-algebra, mostre que O que concluimos se E[X 2 ] = E[E[X G] 2 ]. E[(X E[X G]) 2 ] = E[X 2 ] E[E[X G] 2 ]. Definição: função de distribuição condicional de X dado Y Sejam X e Y v.a. s, e seja G : R Ω R uma funão B(R) O-mensurável tal que (i) G(x,ω) = P(X x Y = ω) (a menos de um conjunto de probabilidade nula). (ii) Para todo ω, G(,ω) é uma função de distribuição. Denotamos tal função por F X (x,y ) que será chamada de função de distribuição condicional de X dado Y. Assim, por (3.1) com C = R e com C = (,y) temos que F X (x) = + F X,Y (x,y) = P(X x,y y) = F X (x Y = y)df Y (y). y F X (x Y = v)df Y (v). Proposição 3.8 (Princípio da substituição) Sejam X e Y v.a. s e ϕ : R 2 R uma função boreliana, então se ϕ(x,y ) for integrável temos que E[ϕ(X,Y ) Y = y] = E[ϕ(X,y) Y = y] = ϕ(x,y)df X (x Y = y). Suponha que X, Y possuam densidade conjunta f(x,y), então y F X (x Y = v)f Y (dv) = F X,Y (x,y) = = = y y y x { x { x f(u,v)dudv f(u,v) f Y (v) du } f Y (v)dv f(u,v) f Y (v) du } df Y (v),
20 Curso de Probabilidade Avançada - Prof. Glauco Valle 20 de onde obtemos que F X (x Y = y) = x f(u,y) f Y (y) du de forma que o integrando f(x,y)/f Y (y) é uma densidade para a função de distribuição F X ( Y = y) e coerentemente o denotamos por f(x y) que será chamada de densidade condicional de X dado Y. Exercício 3.6 Seja µ 1 e µ 2 duas medidas de probabilidade em (R, B(R)) e sejam F 1 e F 2 suas respectivas funções de distribuição, e se estas medidas são absolutamente contínuas sejam p 1 e p 2 suas densidades. Defina a convolução das medidas µ 1 e µ 2 por (µ 1 µ 2 )(B) = µ 1 (B y)µ 2 (dy), B B(R) R onde B y = {x y : x B}, a convolução das funções de distribuição F 1 e F 2 por (F 1 F 2 )(x) = F 1 (x y)df 2 (y) e a convolução das densidades p 1 e p 2 por (p 1 p 2 )(x) = R R p 1 (x y)p 2 (y)dy. Mostre que µ 1 µ 2 é uma medida em (R, B(R)) cuja função de distribuição é F 1 F 2 e que se ambas µ 1 e µ 2 são absolutamente contínuas então µ 1 µ 2 é absolutamente contínua com densidade p 1 p 2. Mostre ainda que se X e Y são v.a. s independentes com distribuição µ 1 e µ 2 então µ 1 µ 2 é a distribuição de X + Y. Se as v.a. s X e Y não são necessáriamente independentes qual é a função de distribuição de X + Y. 4 Tipos de Convergência Nesta seção estaremos trabalhando em um espaço de probabilidade (Ω, O,P) fixo. Definição: Sejam X e (X n ) n 1 v.a. s. (i) Dizemos que X n converge a X em probabilidade (notação: X n P X) se para todo ǫ > 0 P( X n X > ǫ) 0, quando n +. (ii) Dizemos qu X n converge a X quase-certamente (q.c.) se ( ) P ω : lim X n(ω) = X(ω) = 1. n (iii) Suponha que X e (X n ) n 1 estão em L p. Dizemos que X n converge a X em L p se ( ) 1 X n X = X n X p p dp 0, quando n. Exercício 4.1 Mostre que nos três casos acima, a menos de um conjunto de medida nula, o limite é unicamente determinado.
21 Curso de Probabilidade Avançada - Prof. Glauco Valle 21 Proposição 4.1 Uma sequência de v.a. s (X n ) converge a X q.c. se e somente se P( X n X > ǫ i.v.) = 0, para todo ǫ > 0. Proposição 4.2 Toda sequência de v.a. s que converge q.c. também converge em probabilidade ao mesmo limite. Exemplo 4.1 Considere o espaço de probabilidade ([0, 1], B([0, 1]), m) e a seguinte sequência de v.a. s aleatórias X n = 1 [(k 1)2 l,k2 l ), se n = 2 l + k, l 0 e k = 1,...,2 l. Então X n P 0 já que para todo ǫ > 0 temos P( X n > ǫ) < 2 l se n > 2 l. Entretanto X n não converge quase-certamente já que com probabilidade 1 a sequência X n alterna entre os valores 0 e 1 uma infinidade de vezes. Proposição 4.3 Se uma sequência (X n ) converge a X em probabilidade então existe uma subsequência (X nk ) que converge q.c. a X. Proposição 4.4 Toda sequência de v.a. s que é L p convergente também converge em probabilidade. Por outro lado, uma sequência de v.a. s (X n ) que converge em probabilidade também converge em L p se X n é dominada por alguma v.a. Y L p. O exemplo (2.6) também serve como exemplo de uma sequência de v.a s que converge quasecertamente mais não converge em L 1. Definição: Uma família de v.a s (X t ) t I, onde I é um conjunto de índices arbitrário, é uniformemente integrável se lim sup X t dp = 0. A t I { X t >A} Exercício 4.2 Mostre que uma família de v.a s (X t ) t I é uniformemente integrável se e somente se lim sup X t dp = 0. P(E) 0 t I E Proposição 4.5 Seja p [1, ), X n L p tal que X n P X. Então as seguintes três afirmativas são equivalentes: (i) ( X n p ) é uniformemente integrável; (ii) X n X em L p ; (iii) E[ X n p ] E[ X p ] <. Exercício 4.3 Fazer os exercícios 1, 3, 4, 5, 8, 10, 13, 18, 20 da seção 4.1 em [3].
22 Curso de Probabilidade Avançada - Prof. Glauco Valle 22 5 Convergência Fraca de Medidas Nesta seção estaremos interessados em espaços mensuráveis de um tipo particular. Estes espaços serão dotados de uma função particular no produto cartesiano do espaço por ele mesmo que nos permite medir o quanto afastado se encontra um ponto do outro, ou seja, a distância entre dois pontos. Essa função é chamada uma métrica e o espaço de um espaço métrico. Assim as noções de métrica e medida de probabilidade se combinam permitindo estudar a probabilidade de uma ocorrência aleatória de pontos pertencendo a uma vizinhança de outro ponto ou conjunto. Fica claro no sentido da métrica que as relações de convergência no espaço métrico se transferem para o espaço de probabilidades sobre ele através de uma definição coerente de convergência de medidas de probabilidade, que chamaremos de convergência fraca. Apesar da generalização abstrata no começo desta seção é inegável a importância desta teoria na probabilidade e estatística modernas. Resultados de convergência fraca cujos limites são distribuições significativas são conhecidos na literatura como Teorema Central do Limite (TCL). Como aplicação nós estudaremos convergência fraca de probabilidades sobre o espaço de funções reais contínuas em [0, 1] e obteremos um TCL funcional caracterizando convergência de uma classe de funções aleatórias para a medida de Wiener, cujas trajetórias são realizações do Movimento Browniano, que é o processo estocástico servindo de base do cálculo estocástico, que serve de relevante ferramenta de modelagem probabilística em ciências como Física e Biologia e é a base da teoria moderna de finanças. Definição: Seja M um espaço arbitrário e d : M M R + uma função tal que (i) d(x,y) = 0 x = y; (ii) d(x,y) > 0 x,y M; (iii) d(x,y) = d(y,x) x,y M; (iv) d(x,y) d(x,z) + d(z,y) x,y,z M. Dizemos que d é uma métrica sobre M e que (M,d) é um espaço métrico. Definição Seja (M,d) um espaço métrico. A bola aberta de raio r > 0 centrada em x M é o conjunto B M (r,x) = {y M : d(x,y) < r} Um conjunto A M é dito um aberto de M se para todo ponto de x A existe r > 0 tal que B M (r,x) A. Um conjunto F M é dito um fechado de fechado de M se o seu complementar for um conjunto aberto. A fronteira de um conjunto A M, denotada por A, é o conjunto dos pontos x A tais que para todo r > 0 temos B M (r,x) A e B M (r,x) A c. O espaço métrico M é dito separável se existe um conjunto enumerável E M que é denso em M, isto é, tal que todo aberto de M contém pelo menos um ponto de E. Dizemos que uma sequência (x n ) + n=1 de pontos do espaço métrico (M,d) converge a x M se d(x,x n ) 0 quando n +. Exemplos 5.1 Exemplos de espaços métricos: (i) O R d dotado da distância euclidiana x y = d (x y) 2. é um espaço métrico separável. Uma escolha para um conjunto denso enumerável é o conjunto dos racionais. (ii) Um norma sobre um espaço vetorial real V é uma função : V R + tal que (i) x 0, x V (iii) cx = c x, c R e x V (ii) x = 0 x = 0 (iv) x 1 + x 2 x 1 + x 2, x 1, x 2 V. i=1
23 Curso de Probabilidade Avançada - Prof. Glauco Valle 23 O espaço (V, ) é chamado um espaço vetorial normado. Se definirmos d(x,y) = x y, para todo par x, y V então d é uma métrica. Assim todo espaço vetorial normado é um espaço métrico com a métrica induzida pela norma. (iii) O R N dotado da métrica d(x,y) = i=1 ( ) 1 xn y n 2 n, x = (x i ) 1 + x n y n i=1, y = (y i ) i=1, é um espaço métrico separável. Uma escolha para o conjunto denso enumerável é o conjunto {x R N : N tal que x i Q i = 1,...,N e x i = 0 i N}. (iv) Denotamos por C([0, 1]) o espaço das funções contínuas reais com domínio [0, 1]. O espaço C([0,1]) é um espaço vetorial real. Para cada função x x(t) C[0,1] definimos x = sup x(s). s [0,1] Verificamos facilmente que é uma norma sobre C[0,1], chamada de norma do supremo. Portanto x y, x, y C[0,1], é uma métrica. Com esta métrica temos que C[0,1] é um espaço métrico separável. Duas escolhas importantes para o conjunto enumerável denso são: 1. O espaço dos polinômios com coeficientes racionais, isto é para algum n N e a 0, a 1,..., a n Q. x(t) = a 0 + a 1 t + a 2 t a n t n, t [0,1], 2. O espaço das funções lineares por parte do tipo x : [0,1] R com ( ) (i) x j n Q, j = 1,..., n, ( ) (ii) x linear em j 1 n, j n, j = 1,..., n. para algum n N. Exercício 5.1 Represente graficamente as bolas abertas de C[0,1]. Neste texto estaremos sempre considerando um espaço métrico M como um espaço mensurável dotado da σ-algebra dos Borelianos B(M). Assim quando dito medida ou probabilidade sobre M a σ-algebra é sempre B(M) exceto seja mencionada outra σ-algebra. Definição: Sejam P, P n, n 1, probabilidades sobre um espaço métrico M. Dizemos que P n convege fracamente para P, e denotamos P n P, se para toda função contínua f : M R limitada temos que fdp = lim fdp n n Teorema 5.1 (Teorema de Portmanteau): Sejam P n e P probabilidades sobre M. Então são equivalentes (i) P n P; (ii) limsup n P n (F) P(F) para todo fechado F M; (iii) P(A) liminf n P n (A) para todo aberto A M; (iv) P(E) = lim n P n (E) para todo E M tal que P( E) = 0.
24 Curso de Probabilidade Avançada - Prof. Glauco Valle 24 Proposição 5.2 Suponha que T é uma classe de subconjuntos de B(M) tal que (i) T é fechado pela formação de interseções finitas e (ii) cada aberto de M é a união finita ou enumerável de subconjuntos de T. Se P n (E) P(E) para todo E em T então P n P. Definição: Uma classe de subconjuntos A B(M) é dita uma classe que determina probabilidade se o fato de duas medidas P e Q coincidirem em A implica que P = Q. Uma classe de subconjuntos A B(M) é dita uma classe que determina convergência se o fato de P n (E) P(E) para todo E A tal que P( E) = 0 implica que P n P. É imediato que toda classe que determina convergência é uma classe que determina medida. Seguem abaixo alguns exemplos: Exercício 5.2 Mostre que a classe dos retângulos fechados a direita e abertos a esquerda em R d é uma classe de conjuntos que determina convergência. Exemplo 5.2 Exemplos de classes que determinam medida e convergência: (i) Para todos 0 i 1 <... < i k 1 em N definimos a projeção canônica π i1,...,i k : R N R k que para cada sequência x R N associa o vetor (x i1,...,x ik ). A classe dos conjuntos finito-dimensionais é a classe de conjuntos do tipo π 1 i 1,...,i k (E) para algum E B(R k ). Os conjuntos finito-dimensionais formam uma classe que determina convergência em R N. (ii) Para todos 0 t 1 <... < t k 1 em [0,1] definimos a projeção canônica π t1,...,t k : C[0,1] R k que para cada função x C([0,1]) associa o vetor (x t1,...,x tk ). A classe dos conjuntos finitodimensionais é a classe de conjuntos do tipo πt 1 1,...,t k (E) para algum E B(R k ). Os conjuntos finito-dimensionais formam uma classe que determina probabilidade em C[0, 1], entretanto não determina convergência. De fato, toda bola fechada em C([0,1]) é a interseção em n N de conjuntos finito dimensionais do tipo {x C[0,1] : max i=0,...,n x(i/n) yi n ǫ} para yn R n, e como C([0,1]) é separável e nós temos que todo aberto é a união enumerável de bolas fechadas, obtemos que A é uma classe que determina medida, pois os abertos claramente também determinam medida. Entretanto, se consideramos a sequência de probabilidades pontuais (medidas de Dirac) P n sobre C([0,1]) concentradas em funções (x n ) n=1 em C([0,1]) definidas conforme a figura abaixo 1 0 1/n x n obtemos uma sequência de probabilidades para a qual as probabilidades de todo conjunto finito dimensional converge para sua probabilidade com respeito a medida de Dirac P concentrada na função identicamente nula, mas P n não converge em distribuição a P, já que o máximo de uma função em C([0,1]) é uma função contínua com respeito a norma do supremo cujas esperanças com respeito a P n não convergem a esperança com respeito a P. 1
25 Curso de Probabilidade Avançada - Prof. Glauco Valle 25 Exemplo 5.3 (Convergência fraca em termo de funções de distribuição) Consideremos uma sequência de distribuições (df n ) n 1 em (R d, B(R d )). Se F n (x) F(x) em todo ponto x de continuidade da F, então df n (A) df(a) para todo retângulo A que seja fechado a direita e aberto a esquerda em R d e tal que a medida df dos hiperplanos que definem A seja nula. Essa classe de retângulos satisfaz as condições da Proposição 5.2, logo df n df. Reciprocamente se df n df então pelo item (iv) do Teorema 5.1 temos que F n (x) F(x) para todo ponto x de continuidade da F (mostre isso!). Dessa forma temos que df n df se e somente se F n (x) F(x) para todo ponto x de continuidade da F. Exercício 5.3 Mostre que uma sequência de probablidades pontuais sobre um espaço métrico (M, d) convergem fracamente se e somente se a sequência de pontos que definem essas probabilidades convergem com respeito a métrica do espaço M e que neste caso o limite é a massa pontual no limite desses pontos. Baseados na definição de classe de conjuntos que determinam convergência, podemos falar também em classes de funções que determinam convergência, isto é, um subconjunto V das funções reais contínuas sobre o espaço métrico tal que se fdp n fdp para toda f V então P n P. Um exemplo em R d é dado pelo seguinte resultado: Lema 5.3 A classe de funções reais com domínio em R d que são infinitamente diferenciáveis com derivadas de toda ordem limitadas é uma classe de funções que determina convergência. O próximo resultado é importante caracterização de convergência fraca de medidas produto. Teorema 5.4 Se M for um espaço métrico separável, então P n P n P P se e somente se P n P e P n P. Outra questão de interesse é quando a convergência fraca é preservada por transformações Borel mensuráveis entre espaços de medida. Sejam (M,d) e (M,d ) dois espaços métricos e h : M M uma função Borel mensurável então para uma probabilidade P sobre (M, B(M)) definimos Ph 1 por (Ph 1 )(A) = P(h 1 (A)), para todo A B(M ). Temos que Ph 1 é um probabilidade sobre (M, B(M )) (Verifique!). A nossa questão tem a seguinte interpretação: que condições deve satisfazer a função h para que a convergência P n P implique que P n h 1 Ph 1. Claramente isto vale se h for contínua, já que se f : M R for contínua então f h : M R também é contínua e f(y)dp n h 1 (y) = (f h)(y)dp n (y) (f h)(y)dp(y) = f(y)dph 1 (y), logo P n h 1 Ph 1 por definição de convergência fraca. Como resultado mais geral nós temos: Proposição 5.5 Se P n P e P(D h ) = 0, onde D h é o conjunto dos pontos de discontinuidade da função h, então P n h 1 Ph Convergência em distribuição Seja X um elemento aleatório de um espaço de probabilidade (Ω, O,P) sobre um espaço métrico M. Em analogia a definição de distribuição de uma variável aleatória podemos definir a distribuição do elemento aleatório X que é a medida de probabilidade µ X sobre (M, B(M)) definida por µ X (A) = P(X 1 (A)) = P(ω : X(ω) A) = P(X A), A B(M).
26 Curso de Probabilidade Avançada - Prof. Glauco Valle 26 É simples verificar que para toda função h : M R borel mensurável E[h(X)] = h(y)dµ X (y). M Definição: Dizemos que uma sequência de elementos aleatórios (X n ) n=1 em um espaço métrico M converge em distribuição ao elemento aleatório X se µ Xn µ X, neste caso denotamos X n D X. Podemos reescrever o Teorema de Portmanteau em termos de convergência em distribuição da seguinte forma: Sejam X n e X elementos aleatórios sobre M, então são equivalentes as seguintes afirmações: (i) X n D X; (ii) limsup n P(X n F) P(X F) para todo fechado F M; (iii) P(X A) liminf n P(X n A) para todo aberto A M; (iv) P(X E) = lim n P(X n E) para todo E M tal que P(X E) = 0. Dessa forma, se X n D X, apesar da nomeclatura, não são os elementos aleatórios (ou v.a s se M = R) que convergem, mas suas distribuições em (M, B(M)). Assim, mesmo que os X n s estejam definidos em eapaços de probabilidade diferentes faz sentido falar em convergência em distribuição. Além disso, se µ for uma probabilidade em (M, B(M)), também denotamos X n D µ se µxn µ. Analogamente a definição de convergência em probabilidade de v.a s podemos definir convergência em probabilidade de elementos aleatórios de um espaço de probablidade (Ω, O,P) em um espaço métrico. Uma sequência de elementos aleatórios X n sobre o espaço métrico (M,d) convergem em probabilidade a outro elemento aleatório X se lim P(d(X n,x) > ǫ) = 0, para todo ǫ > 0. n Aqui estamos interessados na relação entre convergência fraca e convergência em probabilidade. O primeiro resultado neste sentido é o seguinte Lema: Lema 5.6 Seja (X n ) n 1 uma sequência de elementos aleatórios de uma espaço métrico M e a M um elemento deste espaço, então X n D a se e somente se Xn P a. Um segundo resultado útil é: Proposição 5.7 Sejam (X n ) n 1 e (Y n ) n 1 duas sequências de elementos aleatórios de um espaço métrico (M,d) definidas sobre um mesmo espaço de probabilidade. Se X n D X e d(xn,y n ) P 0 então Y n D X. Mencionamos ainda outros dois resultados que são corolários da Proposição 5.5. Sejam (M, d) e (M,d ) dois espaços métricos e h : M M uma função Borel mensurável: Corolário 5.8 Se X n D X e P(X Dh ) = 0, então h(x n ) D h(x). Corolário 5.9 Se h for contínua em a e X n P a então h(xn ) P h(a). A primeira aplicação da teoria de convergência fraca é a obtenção do importante TCL fornecendo condições para convergência fraca (em distribuição) de arrays de v.a s independentes para uma normal padrão, conhecido com Teorema de Lindenberg. Estaremos denotando a distribuição normal de média µ e variância σ 2 por N(µ,σ 2 ).
27 Curso de Probabilidade Avançada - Prof. Glauco Valle 27 Teorema 5.10 (Teorema de Lindenberg) Para cada n, sejam X n1,...,x nkn v.a s independentes com média 0 e variância finita σ nj, 1 j k n. Definimos S n = X n X nkn e s n = σ 2 n σ 2 nk n. Se para todo ǫ > 0, então Sn s n 1 k n s 2 n j=1 D N(0,1). X nj >ǫs n X 2 njdp 0 quando n Os próximos dois resultados são corolários do Teorema de Lindenberg: Teorema 5.11 Se, para algum δ > 0, 1 s 2+δ n k n j=1 E[ X nj 2+δ ] 0, quando n, então Sn s n D N(0,1). Teorema 5.12 Se X 1,X 2,... forem v.a s i.i.d com média 0 e variância finita σ 2 > 0, então 1 σ n n D X k N(0,1). Exercício 5.4 Discuta exemplos de aplicações a estatística dos resultados acima. k=1 5.2 O Teorema de Prohorov Nesta seção estaremos considerando um espaço métrico fixo (M, d), e denotamos por P o espaço de probabilidades sobre (M, B(M)). Uma das noções fundamentais em análise matemática é a de compacidade, sendo um dos alicerces no estudo estudo de convergência em espaços topológicos. Os conjuntos compactos são aqueles para os quais toda sequência de pontos do conjunto possui uma subsequência convergindo a outro ponto do mesmo conjunto. Dessa forma, compacidade serve para estabelecer existência de limites para subsequências. Neste sentido, este conceito pode ser um pouco enfraquecido, é o que chamamos de compacidade relativa: Um conjunto é relativamente compacto se toda a sequência de pontos do conjunto possui uma subsequência convergente (cujo limite não precisa pertencer necessariamente ao conjunto). Nesta seção estudaremos uma condição para reconhecer os conjuntos de probabilidades em P que são relativamente compactos com respeito a convergência fraca. Obs: A convergência fraca induz uma topologia sobre P, essa topologia aparece na literatura com o nome de topologia vaga. Certas propriedades do espaço métrico M se transferem para P e podemos nos perguntar se esse espaço é um espaço métrico, se é separável, etc. Uma aplicação desse conceito, como veremos adiante, é na obtenção de um resultado do tipo TCL, ou seja, mostrar que uma sequência de probabilidades converge a uma probabilidade específica. O método geralmente empregado para demosntrar o TCL é caracterizado por 3 etapas: (i) Mostrar que a sequência é relativamente compacta. (ii) Mostrar que o limite é único. (iii) Caracterizar o limite.
28 Curso de Probabilidade Avançada - Prof. Glauco Valle 28 Definição: Uma família de probabilidades Γ P é relativamente compacta se toda sequência de probabilidades em Γ contém uma subsequência fracamente convergente, isto é, para toda sequência (P n ) n 1 em Γ existe um subsquência (P nk ) k 1 e uma probabilidade Q P tal que P n Q. Exemplo 5.4 Suponha que para uma sequência de probabilidades P n em (C([0,1]), B(C([0,1]))) os conjuntos finito-dimensionais P n πt 1 1,...,t k convergem fracamente a µ t1,...,t k. Se a sequência P n for relativamente compacta, então toda subsequência fracamente convergente de P n possui a família µ t1,...,t k como as distribuições finito-dimensionais. Do fato que em C[0,1] a classe dos conjuntos finito-dimensionais determina probabilidade, segue que todo ponto limite da sequência P n coincide, logo temos que P n converge fracamente a uma probabilidade Q caracterizada pelos finitodimensionais µ t1,...,t k. A forma de reconhecermos se uma família é relativamente compacta é através da propriedade conhecida como Rigidez, que definimos abaixo: Definição: Uma família de probabilidades Γ P é rígida se para todo ǫ > 0 existe K M compacto tal que inf P(K) > 1 ǫ. P Γ Ou seja, intuitivamente a noção de Rigidez de uma família de probabilidades Γ P implica que temos uniformemente em Γ uma grande concentração de probabilidade em conjuntos compactos. Note que se o espaço for R d, rigidez de uma família de probabilidades Γ é equivalente a existir, para cada ǫ > 0, uma constante r = r(ǫ) > 0 tal que inf P(B(r,0)) > 1 ǫ. P Γ Lema 5.13 Sejam (M,d) e (M,d ) espaços métricos. Se Γ for uma família de probabilidades rígida em (M, B(M)) e h : M M for contínua então {Ph 1 : P Γ} é uma família rígida em (M, B(M )). Exercício 5.5 Faça os exercícios 1, 3, 5, 6 do Capítulo 1, seção 6 em [1]. As noções de rigidez e compacidade relativa são equivalentes em certos espaços de probabilidade. Uma parte desta afirmação é consequência do Teorema de Prohorov abaixo: Teorema 5.14 (Teorema de Prohorov)Toda família de probabilidades sobre um espaço métrico que seja rígida é também relativamente compacta. Na estratégia descrita acima para provarmos um TCL, o Teorema de Prohorov permite repor (i) por (i ) Mostrar que a sequência é rígida. Veremos aplicações desta estratégia quando estudarmos convergência fraca em C[0,1]. Uma aplicação do Teorema de Prohorov é o Teorema de continuidade de Paul Lévy que caracteriza convergência fraca em termos de convergência de funções características. Seja P uma probabilidade sobre R d, a função característica de P é a funçao complexa ϕ P (t) = e i t x P(dx), t R d, R d onde t x = d i=1 t ix i é o produto escalar entre os vetores t, x R d. A função característica de uma v.a. é a função característica de sua distribuição df X. A função característica em R d é unicamente determinada pela probabilidade:
29 Curso de Probabilidade Avançada - Prof. Glauco Valle 29 Proposição 5.15 Se ϕ P (t) = ϕ Q (t) para todo t R d, então P = Q. Além disso, as funções características servem também para determinar convergência fraca em R d. Teorema 5.16 (Teorema de Continuidade de Paul Lévy) Uma condição necessária e suficiente para a convergência fraca de probabilidades em (R d, B(R d )), P n P, é a de que ϕ Pn (t) ϕ P (t) para todo t R d. Além disso, se uma sequência de funções características ϕ Pn (t) convergem ponto por ponto para uma funçâo ϕ contínua na origem, então existe uma probabilidade P tal que ϕ = ϕ P (t) e P n P. 5.3 Convergência fraca em C[0, 1] Nesta seção estudaremos convergência fraca no espaço de funções reais contínuas com domínio em [0,1], o qual denotamos por C[0,1], sobre o qual consideramos a métrica d(x,y) = sup x(t) y(t), x, y C[0,1]. 0 t 1 A principal aplicação deste estudo está na Teoria de Processos estocásticos a tempo contínuo com trajetórias contínuas que são elementos aleatórios em C[0, 1] e cujas realizações são as chamadas séries temporais. Como vimos anteriormente, convergência fraca das distribuições finito dimensionais de uma sequência de probabilidades em C[0, 1] não implica convergência fraca desta sequência. Entretanto, pelas distribuições finito dimensionais nos reconhecemos a probabilidade limite caso o limite fraco exista, pois as finito dimensionais caracterizam probabilidade. Dessa forma, uma vez estabelecida convergência das distribuições finito dimensionais, resta apenas mostrar que a sequência de probabilidades em C[0, 1] é rígida. Assim, o primeiro objetivo desta seção é estabelecer condições para verificação de rigidez no espaço de probabilidades sobre C[0, 1]. Resumimos esta discussão com o seguinte resultado: Lema 5.17 Sejam (P n ) n 1 e P probabilidades sobre (C[0,1], B(C[0,1])). Se as distribuições finito dimensionais de P n convergem fracamente as finito dimensionais de P, e se (P n ) n 1 for rígida, então P n P. Em nosso estudo de rigidez será relevante quantificar para uma função em C[0,1] qual a diferença máxima entre os valores que a função assume em pontos distintos, mas suficientemente próximos. Para isto definimos o módulo de continuidade de um elemento x C[0,1] que é a função ζ(x,δ) = sup x(s) x(t), 0 < δ < 1. t s <δ Por um resultado da Análise matemática, toda função em C[0, 1] é uniformemente contínua, isto é, ζ(x,δ) 0, quando δ 0, para todo x C[0,1]. Observe ainda que o módulo de continuidade é crescente na variável δ. O módulo de continuidade permite uma descrição simples do Teorema de Arzelà-Ascoli que caracteriza os compactos de C[0,1]: Um conjunto K C[0,1] é compacto se K é fechado e valem (i) sup x(0) < + x K (ii) limsup δ 0 sup ζ(x,δ) = 0. x K O próximo resultado fornece uma caracterização de rigidez em C[0, 1] que é basicamente uma consequência direta das condições de compacidade obtidas do Teorema de Arzelà-Ascoli.
30 Curso de Probabilidade Avançada - Prof. Glauco Valle 30 Teorema 5.18 Uma sequência de probabilidades (P n ) n 1 em (C[0,1], B(C[0,1])) é rígida se e somente se as duas condições abaixo são satisfeitas: (i) Para todo γ > 0, existe uma constante c = c(γ) > 0 tal que P n (x : x(0) > c) γ, n 1. (ii) Para todo ǫ > 0 e γ > 0, existe δ = δ(ǫ,γ) > 0, com 0 < δ < 1, e um inteiro n 0 = n 0 (ǫ,γ) tal que P n (x : ζ(x,δ) ǫ) γ, n n 0. No teorema anterior podemos ainda substituir a condição (ii) por uma condição mais fraca. Obtemos o seguinte resultado: Teorema 5.19 Uma sequência de probabilidades (P n ) n 1 em (C[0,1], B(C[0,1])) é rígida se as duas condições abaixo são satisfeitas: (i) Para todo γ > 0, existe uma constante c = c(γ) > 0 tal que P n (x : x(0) > c) γ, n 1. (ii) Para todo ǫ > 0 e γ > 0, existe δ = δ(ǫ,γ) > 0, com 0 < δ < 1, e um inteiro n 0 = n 0 (ǫ,γ) tal que ( ) 1 δ P n x : sup x(s) x(t) ǫ γ, n n 0 e 0 t 1. t s t+δ Funções mensuráveis Seja (Ω, O,P) um espaço de probabilidade arbitrário. Um elemento aleatório de C[0,1] é um funcional X : (Ω, O,P) (C[0,1], B(C[0,1])) que é mensurável, isto é, X 1 (B(C[0,1])) O. Lembre-se que neste caso para cada realização ω Ω temos que X(ω) é uma função contínua com domínio [0,1]. Daí darmos o nome de função aleatória a um elemento aleatório do espaço C[0,1]. Observe que se X for uma função aleatória, então temos que X(t) é uma v.a para todo t em [0,1]. De fato, a projeção canônica π t é contínua, portanto X(t) = π t X é mensuável. Em particular, se t 1,...,t k são pontos em [0,1], então (X(t 1 ),...,X(t k )) é um vetor aleatório. Por outro lado, suponha seja X : (Ω, O, P) (C[0, 1], B(C([0, 1]))) um funcional qualquer, então X 1 (B C[0,1] (δ,y)) = r Q {ω : X(r) δ < X(r,ω) < X(r) + δ}. Assim, se X(t) for uma variável aleatória para todo 0 t 1, a interseção acima está em O, logo a pré-imagem por X de toda bola aberta em C[0,1] pertence a σ-algebra O e, como C[0,1] é sparável, X é um função aleatória de C[0,1]. Dessa forma, nós mostramos: Lema 5.20 X é um função aleatória de C[0,1] se e somente se X(t) for uma v.a. para todo 0 t 1. Esse último Lema nada mais é do que um reflexo do fato que as finito dimensionais geram B(C[0,1]). Os Teoremas 5.18 e 5.19 podem ser interpretados em termos de distribuições de funções aleatórias. No caso do Teorema 5.18: Uma sequência de funções aleatórias (X n ) n 1 em C[0,1] é rígida se e somente se as duas condições abaixo são satisfeitas:
31 Curso de Probabilidade Avançada - Prof. Glauco Valle 31 (i) Para todo γ > 0, existe uma constante c = c(γ) > 0 tal que P( X n (0) > c) γ, n 1. (ii) Para todo ǫ > 0 e γ > 0, existe δ = δ(ǫ,γ) > 0, com 0 < δ < 1, e um inteiro n 0 = n 0 (ǫ,γ) tal que P(ζ(X n,δ) ǫ) γ, n n 0. E no caso do Teorema 5.19: Uma sequência de funções aleatórias (X n ) n 1 em C[0,1] é rígida se as duas condições abaixo são satisfeitas: (i) Para todo γ > 0, existe uma constante c = c(γ) > 0 tal que P( X n (0) > c) γ, n 1. (ii) Para todo ǫ > 0 e γ > 0, existe δ = δ(ǫ,γ) > 0, com 0 < δ < 1, e um inteiro n 0 = n 0 (ǫ,γ) tal que ( ) 1 δ P sup X(s) X(t) ǫ γ, n n 0 e 0 t 1. t s t+δ Nosso interesse agora está em aplicar esses resultados para estabelecer rigidez e convergência fraca de certas sequências de funções aleatórias em C[0,1]. Uma classe de sequências de interesse é a de funções aleatórias lineares por partes obtidas por interpolação linear entre pontos cujas imagens são determinadas por uma sequência de v.a s. Seu interesse está em resultados de existência de certas medidas em (C[0, 1], B(C[0, 1])) e em resultados de aproximação por discretização de processos estocásticos contínuos. Sejam (ξ k ) k 1 uma sequência de v.a s. Ponha S 0 = 0 e S k = ξ ξ k, k 1. Defina e Z n (t,ω) = Z n ( i/n,ω ) = S i (ω) σ n ( (i/n) t ) ( ) ( t (i 1)/n ( ) Z n (i 1)/n,ω + )Z n i/n,ω 1/n 1/n = S i 1(ω) σ n (5.1) + (nt (i 1))ξ i(ω) σ i 1, para todo n n t < i n. (5.2) Se para r R + nos denotarmos por r o maior inteiro menor que r, então nt = i 1, se i 1 n t < i n, logo podemos escrever Z n (t,ω) = S nt (ω) σ n + (nt nt )ξ nt +1(ω) σ. (5.3) n Para todo 0 t 1, temos que Z n (t) é uma função contínua das v.a s ξ k, logo é também uma v.a. Pelo Lema 5.20, Z n é um função aleatório de C[0,1] para todo n 1. Na proxima seção nós estudaremos um TCL envolvendo as funções aleatórias Z n, mas primeiramente precisamos de resultados que nos permitam estabelecer rigidez desta sequência. Vamos usar o Teorema 5.19, para obter uma condição para verificar rigidez para sequência (Z n ) n 1. Ora, verificamos facilmente a condição (i) do Teorema, pois (Z n (0)) n 1 é trivialmente rígida, já que Z n (0) = 0 para todo n. Temos então que lidar apenas com a condição (ii) do Teorema. Podemos verificar que a condição (ii) do teorema pode ser reduzida a 1 δ P ( S k+i S k max i nδ σ ǫ n ) γ, (5.4)
32 Curso de Probabilidade Avançada - Prof. Glauco Valle 32 para todo n suficientemente grande e 0 k < n. Para ver isto observe que por Z n ser linear por partes temos que sup Z n (s) Z n (t) 2 max t s t+δ 0 i nδ+1 S nt +i S nt σ, para todo 0 t < 0. n Fazendo m = nδ e λ = ǫ/ δ em (5.4) obtemos que para todo λ e m suficientemente grandes ( P max S k+i S k λσ ) m γǫ2 i m λ 2. Podemos ainda incoporar algumas constantes nas demais e por fim obtemos o seguinte resulta: Teorema 5.21 Seja (Z n ) n 1 a sequência de funções aleatórias em (5.3). Esta sequência é rígida se para todo ǫ > 0 existe λ > 1 e n 0 1 um inteiro tais que se n n 0 então ( P max S k+i S k λ ) n ǫ, para todo k. i n λ2 Em particular se (ξ n ) n 1 for estacionária, isto é, (ξ n ) n 1 tem a mesma distribuição que (ξ n+k ) n 1 para todo k 1, temos que a expressão no Teorema 5.21 se escreve como ( P max S i λ ) n ǫ i n λ A medida de Wiener e o Movimento Browniano A principal medida de probabilidade sobre o espaço C[0,1] é a chamada Medida de Wiener. Uma função aleatória sobre o espaço C[0,1] cuja distribuição é a medida de Wiener é chamada de Movimento Browniano. O movimento Browniano foi introduzido por Robert Brown na descrição do movimento aleatório de uma partícula de Polen suspensa na água. O primeiro estudo quantitativo do movimento Browniano se deve a L. Bachelier (1900) que sugeriu o movimento Browniano para descrever a evolução de preços no mercado financeiro, seu trabalho foi bastante criticado e a relevância de sua observação só seria reconhecida anos mais tarde. Einstein estudou o movimento Browniano do ponto de vista da Teoria cinética molecular do calor, neste sentido, o movimento Browniano tornou-se de extrema importância no estudo do movimento microscópico na física de partículas. atualmente o movimento Browniano é a base do cálculo estocástico que entre suas várias aplicações é a Teoria matemática que fundamenta a Teoria moderna de finanças. Definição:Uma medida de probabilidade W em (C[0, 1], B(C[0, 1])) é chamada de Medida de Wiener se as três condições abaixo são satisfeitas: (i) W(x : x(0) = 0) = 1 (ii) Wπ 1 t N(0,t) (iii) O processo estocástico (x(t)) t 0 com distribuição W tem incrementos independentes, isto é, para todo 0 t 1 < t 2 <... < t k 1 as v.a s x(t 2 ) x(t 1 ), x(t 3 ) x(t 2 ),..., x(t k ) x(t k 1 ) são independentes. Obs: Note que como consequência de (ii) e (iii), para todo 0 s < t 1 temos que x(t) x(s) N(0,t s). Em particular, os incrementos de (x(t)) t 0 além de independentes são também estacionários. Exercício 5.6 Obtenha a distribuição de (x(t 1 ),...,x(t k )) sob a medida de Wiener.
33 Curso de Probabilidade Avançada - Prof. Glauco Valle 33 posição posição tempo tempo posição posição tempo tempo Figure 5.1: Simulações de realizações das trajetórias do Movimento Browniano Nosso primeiro objetivo é o de estabelecer a existência e unicidade da Medida de Wiener, ou seja, provar que existe uma única probabilidade sobre (C[0, 1], B(C[0, 1])) tal que as condições (i),(ii) e (iii) da definição são satisfeitas. A unicidade é imediata, já que as finito-dimensionais determinam probabilidade e são especificadas na definição. Dessa forma, nós temos em mãos o problema de mostrar a existência de uma medida em C[0, 1] cujas finito-dimensionais são especificadas. Observe que para uma especificação qualquer das finito-dimensionais, essa medida pode ou não existir, por exemplo, não existe uma medida em C[0,1] cujas finito-dimensionais sejam x(t) δ 0 para t < 1/2, e x(t) δ 1 para t 1/2. Teorema 5.22 Existe sobre (C[0, 1], B(C[0, 1])) uma única medida de probabilidade W satisfazendo a definição acima. Para demonstrar este resultado, consideramos a sequência de funções aleatórias (Z n ) n 1 definidas em (5.3), com as v.a s (ξ n ) n 1 sendo v.a s i.i.d com distribuição normal padrão. Mostra-se que a sequência (Z n ) n 1 é rígida e que todo ponto limite satisfaz as condições da definição da medida de Wiener. Em particular, W existe e Z n D W.
34 Curso de Probabilidade Avançada - Prof. Glauco Valle 34 Também denotaremos por W qualquer função aleatória em C[0,1] cuja distribuição é a medida de Wiener. Além disso, denotamos por W t (ω) = W(t,ω) o valor em t da função aleatória W(ω), para uma realização ω. Então (W t ) 0 t 1 é um processo estocástico cujas trajetórias são contínuas. Este processo será chamado de processo de Wiener ou Movimento Browniano. Vamos estudar algumas propriedades das trajetórias do Movimento Browniano. A primeira propriedade de interesse é a de que as trajetórias do Movimento Browniano são quase certamente de variação ilimitada. Isto indica que essas trajetórias são altamente irregulares apesar da continuidade, veja a figura 1.1 que apresenta algumas simulações do Movimento Browniano geradas pelo programa R. Lema 5.23 A medida de Wiener do conjunto de funções de C[0,1] com variação limitada é nula. Citamos aqui algumas outras propriedades das trajetórias do Moviemento Browniano, isto é, ocorrendo com a menos de um conjunto com medida de Wiener nula: (i) Para quase toda realização ω, o conjunto dos pontos onde a trajetória do Movimento Browniano se anula, isto é, {t [0, 1] : W(t, ω) = 0}, é um cojunto perfeito. (ii) Para quase toda realização ω, a trajetória (W(t,ω)) 0 t 1 não é monótona em nenhum subinteralo de [0,1]. (iii) Para quase toda realização ω, a trajetória (W(t,ω)) 0 t 1 não é diferenciável em nenhum ponto de [0,1]. A medida de Wiener é para C[0,1] o equivalente do que a distribuição normal é para R no que se refere a convergência fraca. Uma das razões é a existência de resultados tipo TCL em C[0,1] que são versões dos TCL em R com W fazendo o papel de N(0,1). Um exemplo é o TCL funcional conhecido como Teorema de Donsker que aparece como versão funcional do Teorema Teorema 5.24 (Princípio de Invariância de Donsker) Seja (ξ k ) k 1 uma sequência de v.a s i.i.d de média 0 e variância finita σ 2. Então a sequência de funções aleatórias Z n definidas em (5.3) convergem fracamente ao Movimento Browniano, Z n D W. Uma última propriedade importante a ser considerada para o Movimento Browniano é a chamada propriedade forte de Markov, que aqui nós somente mencionamos sem formalismos. Intuitivamente a propriedade de Markov significa que a distribuição das trajetórias (W(t)) 0 s 1 do processo a partir de um tempo t conhecido seus valores no intervalo 0 s t só depende do seu valor no instante t, W(t). Ou seja, conhecida a história do processo até o instante t considerado como o tempo presente, temos que o futuro não depende do passado. Sob certas condições, t pode ser um tempo aleatório. A simetria do Movimento Browniano e a propriedade de Markov juntos, nos dão o chamado princípio de reflexão que significa que qualquer conjunto trajetórias obtidadas como por continuação de uma trajetória no intervalo [0, t] ocorre com igual probabilidade que o conjunto obtido pela reflexão dessas trajetórias em torno de W(t). 6 Teorema Central do Limite - Caso geral Caracterização das distribuições limites de somas de v.a s iid. Sejam (X n ) + n=1 v.a s independentes e ponha S n = n i+1 X i. Fazemos as seguintes perguntas: Para duas sequências de números reais (a n ) n 1 e (b n ) n 1, a sequência de v.a s S n a n b n
35 Curso de Probabilidade Avançada - Prof. Glauco Valle 35 converge em distribuição? Qual a classe de limites possíveis? Para uma distribuição µ nesta classe, quais condições devem ser satisfeitas por (X n ) n 1, (a n ) n 1 e (b n ) n 1 para que S n a n b n D µ? Extendemos as questões acimas para o contexto mais geral de arrays de variáveis aleatórias independentes. Um array de v.a s independentes é uma coleção de v.a s {X nk : n 1,1 k k n }. Defina D S n = k n j=1 Existe uma distribuição µ tal que Sn µ? Que propriedades teria µ? Para uma distribuição µ particular na classe de limites possíveis, quais seriam as condições para que Sn D µ? O principal resultado no estudo de convergência desta seção é o Teorema de continuidade de Paul Lévy. Vamos começar considerando três exemplos usuais. Proposição 6.1 (i) Seja (X n ) n 1 uma sequência de variáveis aleatórias independentes com X n Bern(p) então e S n n D δ 0 X nj. (Lei Fraca dos Gr. Números) S n np npq D N(0,1). (TCL) (ii) Seja {X nk : n 1,1 k n} um array de variáveis aleatórias independentes com X nj Bern(p n ) para todo 1 j n. Se np n λ > 0 então S n D P(λ). Demonstração: Começamos mostrando a primeira convergência em (i): [ { ( )}] Sn n [ { ( )}] E exp it n p Xj p = E exp it n j=1 n ( { } { }) itq itp = pexp + q exp n n = = j=1 ( p ( 1 + itq ( 1 + o Agora provamos a segunda convergência em (i): [ { ( )}] Sn np n [ { ( )}] Xj p E exp it = E exp it npq npq = = = j=1 ( 1 ) ) ( n + o + q 1 + itp ( 1 ) )) n n n + o n ( 1 n) ) n 1 quando n t. ( { } { itq pexp + q exp itp }) n npq npq ( ( p 1 + itq t2 q 2 npq (1 + t2 2n + o ( 1 n ( 1 2npq + o n ) ) n exp ) ) + q ( 1 itp npq t2 p 2 { t2 2 ) )) n ( 1 2npq + o n } = F N(0,1) (t) quando n t.
36 Curso de Probabilidade Avançada - Prof. Glauco Valle 36 References [1] Billingsley: Convergence of probability measures, John Wiley & Sons (1968) [2] Breiman, L.: Probability, Addison-Wesley series in Statistics (1968) [3] Chung K. L.: A course in probability theory, Academic press, 3 o edição (2001). [4] Durrett R.: Probability: Theory and Examples, Thomson, 3 o edição (2005). [5] Loeve: [6] Rudin W.: Real and complex analysis, McGraw-Hill, 3 o edição (1987). [7] Taylor S. J.: Introduction to measure and integration, Cambridge University Press, (1973)
Exercícios de Teoria da Probabilidade e Processos Estocásticos Parte I
Exercícios de Teoria da Probabilidade e Processos Estocásticos Parte I 2013/2014 Exercício 1. Seja (, F) um espaço mensurável. Mostre que 1. F. 2. se A i F, i = 1, 2,... então n i=1 A i F. 3. se A i F,
Exercícios de Teoria da Probabilidade e Processos Estocásticos Parte I
Exercícios de Teoria da Probabilidade e Processos Estocásticos Parte I 2014/2015 Os exercícios assinalados com (*) têm um nível de dificuldade superior. Exercício 1. Seja (X, F) um espaço mensurável. Mostre
Demonstração. Ver demonstração em [1]. . Para que i j se tem µ i µ j? Determine a derivada no sentido de Radon-Nikodym em cada caso.
Proposição 2.39 (Propriedades de e.). Sejam µ, λ, λ 1, λ 2 medidas no espaço mensurável (X, F). Então 1. se λ 1 µ e λ 2 µ então (λ 1 + λ 2 ) µ. 2. se λ 1 µ e λ 2 µ então (λ 1 + λ 2 ) µ. 3. se λ 1 µ e λ
Notas de Teoria da Probabilidade e Processos Estocásticos
Notas de Teoria da Probabilidade e Processos Estocásticos José Pedro Gaivão Resumo Estas notas destinam-se à disciplina de Teoria da Probabilidade e Processos Estocásticos do Mestrado de Matemática Financeira
1.3 Conjuntos de medida nula
1.3 Conjuntos de medida nula Seja (X, F, µ) um espaço de medida. Um subconjunto A X é um conjunto de medida nula se existir B F tal que A B e µ(b) = 0. Do ponto de vista da teoria da medida, os conjuntos
Teoria da Medida e Integração (MAT505)
Transporte de medidas Teoria da Medida e Integração (MAT505) Transporte de medidas e medidas invariantes. Teorema de Recorrência de Poincaré V. Araújo Instituto de Matemática, Universidade Federal da Bahia
UNIVERSIDADE FEDERAL DE PERNAMBUCO DEPARTAMENTO DE ESTATÍSTICA. Medida e Probabilidade
UNIVERSIDADE FEDERAL DE PERNAMBUCO DEPARTAMENTO DE ESTATÍSTICA Medida e Probabilidade Aluno: Daniel Cassimiro Carneiro da Cunha Professor: Andre Toom 1 Resumo Este trabalho contem um resumo dos principais
Teoria da Medida e Integração (MAT505)
Teoria da Medida e Integração (MAT505) Teoria de Derivação de Lebesgue. Teorema Fundamental do Cálculo. V. Araújo Mestrado em Matemática, UFBA, 204 Conteúdo Riemann. vs Lebesgue..............................2
MEDIDAS COM SINAL.. Uma medida com sinal σ-aditiva (ou, simplesmente, uma medida com sinal) µ(a n ) def = lim
MEDIDAS COM SINAL DANIEL V. TAUSK 1. Definição. Seja C uma coleção de conjuntos tal que C. Uma medida com sinal finitamente aditiva em C é uma função µ : C R tal que: µ( ) = 0; se (A n ) t é uma seqüência
Teoria da Medida e Integração (MAT505)
Riemann Derivadas Variação Limitada Cont. Abs. Teoria da Medida e Integração (MAT505) Teoria de Derivação de Lebesgue. Teorema Fundamental do Cálculo. V. Araújo Instituto de Matemática, Universidade Federal
DANIEL V. TAUSK. se A é um subconjunto de X, denotamos por A c o complementar de
O TEOREMA DE REPRESENTAÇÃO DE RIESZ PARA MEDIDAS DANIEL V. TAUSK Ao longo do texto, denotará sempre um espaço topológico fixado. Além do mais, as seguintes notações serão utilizadas: supp f denota o suporte
Exercício 18. Demonstre a proposição anterior. (Dica: use as definições de continuidade e mensurabilidade)
Proposição 2.7. Sejam Y e Z espaços métricos e X um espaço mensurável. Se f : X Y é uma função mensurável e g : Y Z é uma função contínua então g f : X Z é uma função mensurável. Exercício 18. Demonstre
Capítulo 1. Fundamentos
Capítulo 1 Fundamentos A probabilidade moderna se baseia fortemente na Teoria da Medida e supomos durante esse curso que o leitor esteja bem familiarizado com conceitos tais como: Medida de Lebesgue, extensões
MAT 5798 Medida e Integração Exercícios de Revisão de Espaços Métricos
MAT 5798 Medida e Integração Exercícios de Revisão de Espaços Métricos Prof. Edson de Faria 30 de Março de 2014 Observação: O objetivo desta lista é motivar uma revisão dos conceitos e fatos básicos sobre
MAT 5798 Medida e Integração IME 2017
MAT 5798 Medida e Integração IME 2017 http://www.ime.usp.br/ glaucio/mat5798 Lista 11 - Integral de Bochner Fixemos um espaço de medida completo (X, M, µ) até o final desta lista. As duas primeiras questões
Teoria Ergódica (9 a aula)
Outubro 2012 Espaços de Sequências Seja (X, d 0 ) um espaço métrico compacto. B Z (X ) = X Z = { x = (x j ) j Z : x j X, j Z } B N (X ) = X N = { x = (x j ) j N : x j X, j N } B(X ) designa indiferentemente
Lista 4. Esta lista, de entrega facultativa, tem três partes e seus exercícios versam sobre séries, funções contínuas e funções diferenciáveis em R.
UFPR - Universidade Federal do Paraná Departamento de Matemática CM095 - Análise I Prof José Carlos Eidam Lista 4 INSTRUÇÕES Esta lista, de entrega facultativa, tem três partes e seus exercícios versam
Topologia. Fernando Silva. (Licenciatura em Matemática, 2007/2008) 13-agosto-2018
Topologia (Licenciatura em Matemática, 2007/2008) Fernando Silva 13-agosto-2018 A última revisão deste texto está disponível em http://webpages.fc.ul.pt/~fasilva/top/ Este texto é uma revisão do texto
Laboratório Nacional de Computação Científica LNCC, Brasil URL: alm URL: alm/cursos/medida07.
Introdução à Medida e Integração Pós-graduação da EPGE FGV 1 Alexandre L. Madureira Laboratório Nacional de Computação Científica LNCC, Brasil URL: http://www.lncc.br/ alm URL: http://www.lncc.br/ alm/cursos/medida07.html
Universidade Federal de Viçosa Centro de Ciências Exatas - CCE Departamento de Matemática Primeira Lista de MAT641 - Análise no R n
Universidade Federal de Viçosa Centro de Ciências Exatas - CCE Departamento de Matemática Primeira Lista de MAT641 - Análise no R n 1. Exercícios do livro Análise Real, volume 2, Elon Lages Lima, páginas
Probabilidade IV. Ulisses U. dos Anjos. Departamento de Estatística Universidade Federal da Paraíba. Período
Probabilidade IV Ulisses U. dos Anjos Departamento de Estatística Universidade Federal da Paraíba Período 2014.2 Ulisses Umbelino (DE-UFPB) Probabilidade IV Período 2014.2 1 / 20 Sumário 1 Apresentação
Notas Para o Curso de Medida e. Daniel V. Tausk
Notas Para o Curso de Medida e Integração Daniel V. Tausk Sumário Capítulo 1. Medida de Lebesgue e Espaços de Medida... 1 1.1. Aritmética na Reta Estendida... 1 1.2. O Problema da Medida... 6 1.3. Volume
O Teorema de Radon-Nikodým
Universidade stadual de Maringá - Departamento de Matemática Cálculo Diferencial e Integral: um KIT de Sobrevivência c Publicação eletrônica do KIT http://www.dma.uem.br/kit O Teorema de Radon-Nikodým
Matemática I. 1 Propriedades dos números reais
Matemática I 1 Propriedades dos números reais O conjunto R dos números reais satisfaz algumas propriedades fundamentais: dados quaisquer x, y R, estão definidos a soma x + y e produto xy e tem-se 1 x +
Noções (básicas) de Topologia Geral, espaços métricos, espaços normados e espaços com produto interno. André Arbex Hallack
Noções (básicas) de Topologia Geral, espaços métricos, espaços normados e espaços com produto interno André Arbex Hallack Setembro/2011 Introdução O presente texto surgiu para dar suporte a um Seminário
Notas de Aula. Medida e Integração
Notas de Aula Medida e Integração Rodney Josué Biezuner 1 Departamento de Matemática Instituto de Ciências Exatas (ICEx Universidade Federal de Minas Gerais (UFMG Notas de aula do curso Medida e Integração
1 Álgebra linear matricial
MTM510019 Métodos Computacionais de Otimização 2018.2 1 Álgebra linear matricial Revisão Um vetor x R n será representado por um vetor coluna x 1 x 2 x =., x n enquanto o transposto de x corresponde a
MAT Cálculo Avançado - Notas de Aula
bola fechada de centro a e raio r: B r [a] = {p X d(p, a) r} MAT5711 - Cálculo Avançado - Notas de Aula 2 de março de 2010 1 ESPAÇOS MÉTRICOS Definição 11 Um espaço métrico é um par (X, d), onde X é um
Leandro F. Aurichi de novembro de Instituto de Ciências Matemáticas e de Computação - Universidade de São Paulo, São Carlos, SP
Espaços Métricos Leandro F. Aurichi 1 30 de novembro de 2010 1 Instituto de Ciências Matemáticas e de Computação - Universidade de São Paulo, São Carlos, SP 2 Sumário 1 Conceitos básicos 5 1.1 Métricas...........................................
Exercícios de topologia geral, espaços métricos e espaços vetoriais
Exercícios de topologia geral, espaços métricos e espaços vetoriais 9 de Dezembro de 2009 Resumo O material nestas notas serve como revisão e treino para o curso. Estudantes que nunca tenham estudado estes
Teoria da Medida e Integração (MAT505)
Modos de convergência Teoria da Medida e Integração (MAT505) Modos de convergência. V. Araújo Instituto de Matemática, Universidade Federal da Bahia Mestrado em Matemática, UFBA, 2014 Modos de convergência
Faremos aqui uma introdução aos espaços de Banach e as diferentes topologías que se podem definir nelas.
Capítulo 2 Espaços de Banach Faremos aqui uma introdução aos espaços de Banach e as diferentes topologías que se podem definir nelas. 2.1 Espaços métricos O conceito de espaço métrico é um dos conceitos
VARIÁVEIS ALEATÓRIAS
UNIVERSIDADE FEDERAL DE JUIZ DE FORA INSTITUTO DE CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA VARIÁVEIS ALEATÓRIAS Joaquim H Vianna Neto Relatório Técnico RTE-03/013 Relatório Técnico Série Ensino Variáveis
Introdução à Linguagem da Topologia
Introdução à Linguagem da Topologia Corpos Define-se corpo por um conjunto K, munido de duas operações básicas chamadas de adição e multiplicação. São os axiomas do corpo: Axiomas da Adição Associatividade:
Lista de Exercícios da Primeira Semana Análise Real
Lista de Exercícios da Primeira Semana Análise Real Nesta lista, a n, b n, c n serão sempre sequências de números reais.. Mostre que todo conjunto ordenado com a propriedade do supremo possui a propriedade
Probabilidade IV. Ulisses U. dos Anjos. Departamento de Estatística Universidade Federal da Paraíba. Período
Probabilidade IV Ulisses U. dos Anjos Departamento de Estatística Universidade Federal da Paraíba Período 2015.2 Ulisses Umbelino (DE-UFPB) Probabilidade IV Período 2015.2 1 / 60 Sumário 1 Apresentação
Teoria Geométrica da Medida Aula 1
Teoria Geométrica da Medida Aula 1 Diego Marcon 08 de Agosto de 2016 Ver www.chasqueweb.ufrgs.br/~dmarcon em Teaching Referências principais 1. Evans, L.C. e Gariepy, R.C., Measure Theory and Fine Properties
1 Limites e Conjuntos Abertos
1 Limites e Conjuntos Abertos 1.1 Sequências de números reais Definição. Uma sequência de números reais é uma associação de um número real a cada número natural. Exemplos: 1. {1,2,3,4,...} 2. {1,1/2,1/3,1/4,...}
Espaços Euclidianos. Espaços R n. O conjunto R n é definido como o conjunto de todas as n-uplas ordenadas de números reais:
Espaços Euclidianos Espaços R n O conjunto R n é definido como o conjunto de todas as n-uplas ordenadas de números reais: R n = {(x 1,..., x n ) : x 1,..., x n R}. R 1 é simplesmente o conjunto R dos números
Axiomatizações equivalentes do conceito de topologia
Axiomatizações equivalentes do conceito de topologia Giselle Moraes Resende Pereira Universidade Federal de Uberlândia - Faculdade de Matemática Graduanda em Matemática - Programa de Educação Tutorial
3 3. Variáveis Aleatórias
ÍNDICE 3. VARIÁVEIS ALEATÓRIAS...49 3.. VARIÁVEIS ALEATÓRIAS UNIDIMENSIONAIS...49 3.2. VARIÁVEIS DISCRETAS FUNÇÃO DE PROBABILIDADE E FUNÇÃO DISTRIBUIÇÃO DE PROBABILIDADE...50 3.2.. Função de probabilidade...50
Teoremas de uma, duas e três séries de Kolmogorov
Teoremas de uma, duas e três séries de Kolmogorov 13 de Maio de 013 1 Introdução Nestas notas Z 1, Z, Z 3,... é uma sequência de variáveis aleatórias independentes. Buscaremos determinar condições sob
Carlos Tenreiro. Apontamentos de Medida e Integração.
Carlos Tenreiro Apontamentos de Medida e Integração Coimbra, 2000 Versão de Dezembro de 2004 Nota prévia Os presentes apontamentos têm por base o curso de Medida e Integração leccionado no primeiro semestre
Probabilidade II. Departamento de Estatística. Universidade Federal da Paraíba. Prof. Tarciana Liberal (UFPB) Aula Desigualdades 02/14 1 / 31
Probabilidade II Departamento de Estatística Universidade Federal da Paraíba Prof. Tarciana Liberal (UFPB) Aula Desigualdades 02/14 1 / 31 Um teorema de grande importância e bastante utilidade em probabilidade
Física Matemática II: Notas de aula
Física Matemática II: Notas de aula Rafael Sussumu Y. Miada Nessas notas, faremos uma introdução à teoria dos espaços métricos e normados, e aos operadores lineares em espaços normados. Os resultados obtidos
Probabilidade II. Departamento de Estatística. Universidade Federal da Paraíba
Probabilidade II Departamento de Estatística Universidade Federal da Paraíba Prof. Tarciana Liberal (UFPB) Aula Variáveis Aleatórias Bidimensionais 11/13 1 / 1 Variáveis Bidimensionais Até o momento, consideramos
ÁLGEBRA LINEAR I - MAT0032
UNIVERSIDADE FEDERAL DA INTEGRAÇÃO LATINO-AMERICANA Instituto Latino-Americano de Ciências da Vida e Da Natureza Centro Interdisciplinar de Ciências da Natureza ÁLGEBRA LINEAR I - MAT32 12 a Lista de exercícios
Notas Sobre Sequências e Séries Alexandre Fernandes
Notas Sobre Sequências e Séries 2015 Alexandre Fernandes Limite de seqüências Definição. Uma seq. (s n ) converge para a R, ou a R é limite de (s n ), se para cada ɛ > 0 existe n 0 N tal que s n a < ɛ
Começamos relembrando o conceito de base de um espaço vetorial. x = λ 1 x λ r x r. (1.1)
CAPÍTULO 1 Espaços Normados Em princípio, os espaços que consideraremos neste texto são espaços de funções. Isso significa que quase todos os nossos exemplos serão espaços vetoriais de dimensão infinita.
Processos Estocásticos. Variáveis Aleatórias. Variáveis Aleatórias. Luiz Affonso Guedes. Como devemos descrever um experimento aleatório?
Processos Estocásticos Luiz Affonso Guedes Sumário Probabilidade Funções de Uma Variável Aleatória Funções de Várias Momentos e Estatística Condicional Teorema do Limite Central Processos Estocásticos
Curso: MAT 221- CÁLCULO DIFERENCIAL E INTEGRAL IV Professor Oswaldo Rio Branco de Oliveira Período: Segundo Semestre de 2008
Curso: MAT 221- CÁLCULO DIERENCIAL E INTEGRAL IV Professor Oswaldo Rio Branco de Oliveira Período: Segundo Semestre de 2008 SÉRIES E SOMAS EM ÁLGEBRAS: C([a, b]), M n n (R), M n n (C), etc. O PRODUTO DE
O Teorema de Peano. f : D R n. uma função contínua. Vamos considerar o seguinte problema: Encontrar um intervalo I R e uma função ϕ : I R n tais que
O Teorema de Peano Equações de primeira ordem Seja D um conjunto aberto de R R n, e seja f : D R n (t, x) f(t, x) uma função contínua. Vamos considerar o seguinte problema: Encontrar um intervalo I R e
Variedades diferenciáveis e grupos de Lie
LISTA DE EXERCÍCIOS Variedades diferenciáveis e grupos de Lie 1 VARIEDADES TOPOLÓGICAS 1. Seja M uma n-variedade topológica. Mostre que qualquer aberto N M é também uma n-variedade topológica. 2. Mostre
Probabilidade IV. Ulisses U. dos Anjos. Departamento de Estatística Universidade Federal da Paraíba. Período
Probabilidade IV Ulisses U. dos Anjos Departamento de Estatística Universidade Federal da Paraíba Período 2015.2 Ulisses Umbelino (DE-UFPB) Probabilidade IV Período 2015.2 1 / 49 Sumário 1 Apresentação
Estatística Descritiva e Exploratória
Gledson Luiz Picharski e Wanderson Rodrigo Rocha 9 de Maio de 2008 Estatística Descritiva e exploratória 1 Váriaveis Aleatórias Discretas 2 Variáveis bidimensionais 3 Váriaveis Aleatórias Continuas Introdução
4.1. ESPERANÇA x =, x=1
4.1. ESPERANÇA 139 4.1 Esperança Certamente um dos conceitos mais conhecidos na teoria das probabilidade é a esperança de uma variável aleatória, mas não com esse nome e sim com os nomes de média ou valor
Os Teoremas Fundamentais do Cálculo
Os Teoremas Fundamentais do Cálculo Manuel Ricou IST, 1 de Fevereiro de 2010 O que são os TFC s? Para já, um pretexto para discutirmos algumas das questões mais básicas e mais antigas da Matemática, Alguns
Topologia geral Professor: Fernando de Ávila Silva Departamento de Matemática - UFPR
Topologia geral Professor: Fernando de Ávila Silva Departamento de Matemática - UFPR LISTA 1: Métricas, Espaços Topológicos e Funções Contínuas 1 Métricas Exercício 1 Sejam M um espaço métrico e A M um
Processos Estocásticos. Variáveis Aleatórias. Variáveis Aleatórias. Variáveis Aleatórias. Variáveis Aleatórias. Luiz Affonso Guedes
Processos Estocásticos Luiz Affonso Guedes Sumário Probabilidade Funções de Uma Variável Aleatória Funções de Várias Momentos e Estatística Condicional Teorema do Limite Central Processos Estocásticos
Análise II (a parte no IR n )
Análise II (a parte no IR n ) Notas de aulas André Arbex Hallack Janeiro/2008 Índice 1 Noções Topológicas no IR n 1 1.1 O espaço vetorial IR n................................ 1 1.2 Seqüências......................................
Processos Estocásticos. Luiz Affonso Guedes
Processos Estocásticos Luiz Affonso Guedes Sumário Probabilidade Variáveis Aleatórias Funções de Uma Variável Aleatória Funções de Várias Variáveis Aleatórias Momentos e Estatística Condicional Teorema
Então (τ x, ) é um conjunto dirigido e se tomarmos x U U, para cada U vizinhança de x, então (x U ) U I é uma rede em X.
1. Redes Quando trabalhamos no R n, podemos testar várias propriedades de um conjunto A usando seqüências. Por exemplo: se A = A, se A é compacto, ou se a função f : R n R m é contínua. Mas, em espaços
Topologia de Zariski. Jairo Menezes e Souza. 25 de maio de Notas incompletas e não revisadas RASCUNHO
Topologia de Zariski Jairo Menezes e Souza 25 de maio de 2013 Notas incompletas e não revisadas 1 Resumo Queremos abordar a Topologia de Zariski para o espectro primo de um anel. Antes vamos definir os
Propriedades das Funções Contínuas
Propriedades das Funções Contínuas Prof. Doherty Andrade 2005- UEM Sumário 1 Seqüências 2 1.1 O Corpo dos Números Reais.......................... 2 1.2 Seqüências.................................... 5
Variáveis Aleatórias. Departamento de Matemática Escola Superior de Tecnologia de Viseu
Variáveis Aleatórias Departamento de Matemática Escola Superior de Tecnologia de Viseu Exemplo No lançamento de duas moedas ao ar, os resultados possíveis são: FF, FC, CF ou CC. No entanto, o nosso interesse
A = B, isto é, todo elemento de A é também um elemento de B e todo elemento de B é também um elemento de A, ou usando o item anterior, A B e B A.
Capítulo 1 Números Reais 1.1 Conjuntos Numéricos Um conjunto é uma coleção de elementos. A relação básica entre um objeto e o conjunto é a relação de pertinência: quando um objeto x é um dos elementos
Apostila Minicurso SEMAT XXVII
Apostila Minicurso SEMAT XXVII Título do Minicurso: Estrutura algébrica dos germes de funções Autores: Amanda Monteiro, Daniel Silva costa Ferreira e Plínio Gabriel Sicuti Orientadora: Prof a. Dr a. Michelle
Probabilidade de Ruína e Processos de Lévy α-estáveis
Apresentação Probabilidade de Ruína e Processos de Lévy α-estáveis Universidade de São Paulo IME - USP 08 de abril, 2010 Apresentação Distribuições Estáveis e Processos de Lévy α-estáveis Convergência
Uma breve análise do movimento Browniano
Universidade Federal do Espírito Santo UFES Departamento de Matemática Programa de Pós-Graduação em Matemática Uma breve análise do movimento Browniano Vitória -ES, Brasil de Dezembro de 04 Universidade
MCTB Álgebra Linear Avançada I Claudia Correa Exercícios sobre transformações lineares. Os Exercícios 3 e 4 são os exercícios bônus dessa lista.
MCTB002-13 Álgebra Linear Avançada I Claudia Correa Exercícios sobre transformações lineares Os Exercícios 3 e 4 são os exercícios bônus dessa lista. Definição 1. Dados conjuntos X e Y, uma função ϕ :
13 de novembro de 2007
13 de novembro de 2007 Objetivos - Definição Subgrupos Axiomas de Separação Bases e Sistema fundamental de vizinhanças para a identidade Euclidianos e o Quinto Problema de Hilbert Objetivos - Medida de
Topologia Geral. Ofelia Alas Lúcia Junqueira Marcelo Dias Passos Artur Tomita
Topologia Geral Ofelia Alas Lúcia Junqueira Marcelo Dias Passos Artur Tomita Sumário Capítulo 1. Alguns conceitos básicos 5 Capítulo 2. Espaços topológicos 9 1. Espaços topológicos. Conjuntos abertos
As leis dos grandes números
As leis dos grandes números PE0708 25 de Fevereiro de 2008 Introdução este capítulo estudamos algumas formulações da lei dos grandes números. Uma lei dos grandes números dá o comportamento limite, ou assimptótico,
