Processos estocásticos

36341 - Introdução aos Processos Estocásticos Curso de Pós-Graduação em Engenharia Elétrica Departamento de Engenharia Elétrica Universidade de Brasília Processos estocásticos Geovany A. Borges gaborges@ene.unb.br

Definições Processo estocástico: x t (ω) com t sendo o tempo e ω Ω. Portanto x t (ω) é uma v.a. e x (ω) é uma realização do processo. Classificação: x t classificação contínuo contínuo função aleatória contínuo discreto seqüência aleatória discreto contínuo cadeia de parâmetro contínuo discreto discreto cadeia de parâmetro discreto Exemplos: I. x t = acos(ωt + φ), com a e φ sendo v.a.s II. x t = 0,8x t 1 com x 0 N(0,σ 2 0) 1

III. Passeio aleatório (random walk): x t = x t 1 + w t com w t = { + com probabilidade p com probabilidade 1 p 2

Caracterização de processos estocásticos Caso parâmetro contínuo: x t1, x t2,,x tn FDP conjunta: p(x t1,x t2,, x tn ) (1) Caso parâmetro discreto: x 1, x 2,,x n FDP conjunta: p(x 1,x 2,,x n ) (2) Exemplo 1: Considerando x t = a + bt, com [a,b] T N(0,P), determinar p(x t1, x t2,,x tn ). 3

Caracterização de processos estocásticos Particular interesse nas densidades de primeira e segunda ordens: p(x t ) e p(x t1,x t2 ),que são funções de t e t 1 e t 2, respectivamente. Valor médio (processos escalares e vetoriais) : m X (t) E{x t } (3) Função de auto-correlação (processos escalares): R X (t, τ) E{x t x τ } (4) Função de auto-covariância (processos escalares): C X (t,τ) E {(x t m X (t))(x τ m X (τ))} (5) = R X (t,τ) m X (t)m X (τ) (6) 4

Caracterização de processos estocásticos Matriz de auto-correlação cruzada (processos vetoriais): Processo X R n Γ X (t, τ) E{x t x T τ } (7) Processo X C n Γ X (t,τ) E{x t x τ} (8) com representanto complexo conjugado. Verificar propriedades de Γ X (t,τ). 5

Caracterização de processos estocásticos Matriz de covariância cruzada (processos vetoriais): { P X (t,τ) E (x t m X (t))(x τ m X (τ)) T} (9) = Γ X (t,τ) m X (t)m X (τ) T (10) cujos elementos são dados pelas funções de covariância cruzada (processos escalares): C Xi X j (t,τ) E { (x i,t m Xi (t)) ( x j,τ m Xj (τ) )} Os elementos da diagonal P X (t,τ) são C Xi X i (t,τ) = C Xi (t, τ). No caso especial de t = τ, P X (t,t) = P X (t) que é a matriz de covariâncias do vetor x t. 6

Caracterização de processos estocásticos Exemplo 2: Considerando x t = acos(ωt + φ) com a e φ sendo v.a.s independentes e φ U( π,π), tem-se que m X (t) = 0 (11) R X (t,τ) = E{a2 } E {cos(ωt ωτ)} 2 (12) C X (t,τ) = R X (t,τ) (13) Coeficiente de correlação (processos escalares): ρ X (t,τ) = C X (t,τ) CX (t,t)c X (τ, τ) que assume valores 1 ρ X (t,τ) 1. 7

Propriedades de processos estocásticos Estacionaridade Processo estacionário no sentido estrito (ESE): p(x t ) = p(x t+τ ) = p(x) (14) que significa m X (t) = E{x t } = x t p(x t )dt = = m X (t + τ) = m X = constante. x t+τ p(x t+τ )d(t + τ) 8

Propriedades de processos estocásticos Estacionaridade Processo estacionário no sentido amplo (ESA): satisfaz simultaneamente a (i) ESE e (ii) R X (t,t + τ) depende apenas de τ: R X (t, t + τ) = R X (τ) Exemplo 3: Sendo x t = acos(ωt) + b sin(ωt) com a e b v.a.s independentes: a) O processo é ESE se E{a} = E{b} = 0 b) O processo é ESA se E{a} = E{b} = 0 e E{a 2 } = E{b 2 } = σ 2 resultando em m X (t) = 0 R X (τ) = σ 2 cos(ωτ) 9

Propriedades de processos estocásticos Exemplo 4: Considerando x t ESA com m X (t) = 0 e R X (τ) = sin(ωτ) ωτ então a matrix de covariâncias cruzadas do processo vetorial x t = [ x t1 x t2 ] T com t 1 = t e t 2 = t + τ 12 é dada por P X (t,τ) = E {(x t m X (t))(x τ m X (τ)) T} [ E {x = t x τ } E {x t x τ+τ12 } E {x t+τ12 x τ } E {x t+τ12 x τ+τ12 } ] 10

Propriedades de processos estocásticos Exemplo 5: (Papoulis, pp 388) Sendo x t ESA com R X (τ) = aexp( α τ ) determinar E{[x 8 x 5 ] 2 }. 11

Propriedades de processos estocásticos Ergodicidade na média Cálculo empírico de m X (t): m X (t) = E{x t } = 1 M x t (ω m ) M m=1 em que x t (ω m ) é a m-ésima realização do processo. Convergência se x t é ESE e M. 12

Propriedades de processos estocásticos Ergodicidade na média Um PE é ergódico na média se: as expectâncias estatísticas puderem ser substituídas por médias temporais de uma única realização : E{x t } = ˆm X = lim T 1 M M m=1 x m 1 2T T T x t dt com x m sendo a m-ésima amostra da realização x t (ω). Sendo x t ESE, E{ ˆm X } = m X, ou seja ˆm X é não polarizado. 13

Propriedades de processos estocásticos Ergodicidade na média Teorema 1 (Slutsky): x t é ergódico na média se e somente se for ESA e lim T 1 T T 0 C X (τ)dτ = 0 em que C X (τ) = C X (t,t + τ) = E {(x t m X (t))(x t+τ m X (t + τ))} 14

Propriedades de processos estocásticos Exemplo 6: Considerando x t = acos(ωt) + b sin(ωt) + c com a e b sendo v.a.s independentes, e ω e c são constantes. Seria este processo ergódico na média? O mesmo é ESA se E{a} = E{b} = 0 E{a 2 } = E{b 2 } = σ 2 que resulta em C X (τ) = σ 2 cos(ωτ) 15

Propriedades de processos estocásticos Exemplo 7: Considerando x t e y t dois processos ergódicos na média, com médias m X e m Y. Sendo z t = x t + cy t (15) com c sendo uma v.a. tal que c = { 0, com probabilidade 0,5 1, com probabilidade 0,5 Que condições seriam necessárias para que z t seja ergódico na média? Solução: Pela eq. (15) e com E{c} = E{c 2 } = 1/2, e x t e y t processos descorrelacionados, i.e., C XY (τ) = E{(x t m X )(y t+τ m Y )} = 0 = R XY (τ) = m X m Y 16

obtem-se E{z t } = m X + m Y (16) 2 R Z (t,t + τ) = E{z t z t+τ } (17) = E{x t x t+τ + cx t y t+τ + cx t+τ y t + c 2 y t y t+τ } (18) = R X (τ) + 1 2 m Xm Y + 1 2 m Xm Y + R Y (τ) 2 (19) = R X (τ) + R Y (τ) + m X m Y 2 (20) Assim, sendo E{z t } constante e R Z (t,t + τ) = R Z (τ), conclui-se que z t é ESA. C Z (τ) é portanto dado por C Z (τ) = R Z (τ) m 2 Z (21) = R X (τ) + R Y (τ) 2 + m X m Y m 2 X m X m Y m2 Y 4 (22) 17

Sendo R X (τ) = C X (τ) + m 2 X e R Y (τ) = C Y (τ) + m 2 Y, obtem-se C Z (τ) = C X (τ) + 1 2 C Y (τ) + m2 Y 4 (23) Aplicando o teorema de Slutsky, e sendo x t e y t ergódicos na média, tem-se que 1 T lim C X (τ)dτ = m2 Y (24) T T 4 0 Isto significa que z t não é ergódico para quaisquer processos x t e y t. De fato, conforme o valor da v.a. c, tem-se a seguinte forma para a média temporal ˆm Z, que dependente da realização c(ω): ˆm Z = { m X, com probabilidade 0,5 m X + m Y, com probabilidade 0,5 enquanto que E{z t } é dado por (16). Se m Y = 0, tem-se então que E{z t } = ˆm Z, o que significaria que z t é ergódico na média. Esta solução satisfaz o Teorema de Slutsky no sentido que faz (24) 0. (25) 18

Exemplo 8: Considere um processo estacionário no sentido amplo x t com função de auto-correlação R X (τ) = a τ com 0 < a < 1 e E{x t } = µ. Seria x t ergódico na média? Caso não, quais condições seriam necessárias para que x t seja ergódico na média? 19

Movimento Browniano Também conhecido como Processo de Wiener. Definição de incrementos independentes: um PE x t possui incrementos independentes se x t2 x t1,x t3 x t2, são independentes para todo t 1 < t 2 < t 3 <. Ou seja, p(x t2 x t1,x t3 x t2, ) = p(x t2 x t1 )p(x t3 x t2 ) Incrementos independentes estacionários: para t > τ e h > 0. p(x t+h x τ+h ) = p(x t x τ ) 20

Movimento Browniano Propriedades de um processo Movimento Browniano x t : P1: t [0, ) P2: x t tem incrementos independentes estacionários P3: x t tem distribuição normal para todo t 0 P4: E{x t } = 0 P5: Pr{x 0 = 0} = 1 Derivação de p(x t ): De P3, x t e x τ são Gaussianas, então x t x τ, t > τ, é Gaussiano com média E{x t x τ } = E{x t x τ } = 0 (26) de P2 e P4. Mas ainda var{x t x τ } = E{(x t x τ ) 2 } (27) 21

Em se tratando de incrementos estacionários independentes, para todo h > 0 p(x t+h x τ+h ) = p(x t x τ ) (28) que implica que os incrementos possuem a mesma variância. Assim var{x t+h x τ+h } = var{x t x τ }. (29) De P5, tem-se que var{x 0 } = 0. (30) Empiricamente, var{x t x τ } = σ 2 (t τ) (31) satisfaz a todas as condições acima. Sendo τ = 0, tem-se para t [0, ) var{x t } = σ 2 t (32) que também satisfaz P5. 22

Portanto, o Movimento Browniano é um processo Gaussiano, de média nula (P4) e variância crescendo linearmente com o tempo: p(x t ) = { 1 2πσ2 t exp 1 2 x 2 t σ 2 t } (33) Pode-se mostrar que o Movimento Browniano é um caso limite do Passeio Aleatório: Passeio Aleatório: x tn = x tn 1 + x tn com t = t n t n 1 x tn = { + x com probabilidade p x com probabilidade 1 p Movimento Browniano: x 0 e t 0, σ 2 = lim x 0, t 0 ( x) 2 t. 23

Processos Gaussianos Processos com função de densidade Gaussiana. Exemplo 1: sendo [a,b] T de distribuição Gaussiana, x t = a + bt. Exemplo 2: Movimento Browniano p(x t ) = { 1 2πσ2 t exp 1 2 x 2 } t σ 2. t Exemplo 3: Equação de diferenças estocástica, com v k+1 um processo Gaussiano e/ou x 0 sendo uma v.a. Gaussiana: x k+1 = Ax k + v k+1 24

Processos Markovianos No contexto de equações diferenciais determinísticas, a solução de dx(t) dt = f(x(t)) para t > t 0, dado x(t 0 ) = x 0, é uma função do tipo x(t) = g(t, x 0, t 0 ) Esta solução não depende de x(t 1 ), se t 1 < t 0. 25

Processos Markovianos Propriedade fundamental de processos Markovianos: Pr{x tn λ x t0,,x tn 1 } = Pr{x tn λ x tn 1 } (34) p(x tn λ x t0,,x tn 1 ) = p(x tn λ x tn 1 ) para todo λ R n e t i < t j, com i < j. No caso de parâmetro contínuo, Pr{x n λ x τ,τ t 1 } = Pr{x tn λ x t1 } (35) p(x n λ x τ,τ t 1 ) = p(x tn λ x t1 ) 26

Processos Markovianos FDP conjunta de um processo Markoviano: p(x tn,x tn 1,,x t0 ) = p(x tn x tn 1,,x t0 )p(x tn 1,,x t0 ) (36) = p(x tn x tn 1 )p(x tn 1,,x t0 ) = p(x tn x tn 1 )p(x tn 1 x tn 2,,x t0 )p(x tn 2,,x t0 ) = p(x tn x tn 1 )p(x tn 1 x tn 2 )p(x tn 2,,x t0 ). = p(x tn x tn 1 )p(x tn 1 x tn 2 ) p(x t1 x t0 )p(x t0 ) (37) Assim, se p(x t0 ) for Gaussiano e p(x ti x ti 1 ), 0 < i n, for também Gaussiano, então p(x tn,x tn 1,,x t0 ) é Gaussiano! 27

Processos Markovianos Exemplo 9: Seria este o caso do processo a parâmetro discreto x k+1 = Ax k + v k+1 com v k+1 N(0,Q k+1 ) e x 0 N(0,P 0 ) independentes? Como seria a FDP p(x k x k 1 )? p V (v k+1 ) = 1 (2π) n/2 det(q k+1 ) 1/2 exp{ 1 2 vt k+1q 1 k+1 v k+1} 28

Processos Markovianos Exemplo 10: Seria o Movimento Browniano um processo Markoviano? Solução: Considere a FDP condicional p(x tn x tn 1,,x t1 ). Sendo x 0 = 0, t 0 = 0 e x tn 1 x tn 1 = 0, obtem-se incrementos independentes p(x tn x tn 1,,x t1 ) = p(x tn x tn 1 + x tn 1 x 0 x tn 1 x 0,,x t1 x 0 ). Sendo x tn x tn 1 + x tn 1 x 0 dependente apenas de x tn 1 x 0, p(x tn x tn 1,, x t1 ) = p(x tn x tn 1 + x tn 1 x 0 x tn 1 x 0 ), = p(x tn x tn 1 ) 29

Processos Markovianos FDPs de instantes de tempo não adjacentes: p(x n x n 2 ) = = p(x n,x n 1 x n 2 )dx n 1, p(x n x n 1, x n 2 )p(x n 1 x n 2 )dx n 1. Sendo o processo Markoviano, p(x n x n 2 ) = p(x n x n 1 )p(x n 1 x n 2 )dx n 1. que é conhecida com Equação de Chapman-Kolmogorov. 30

p(x n ) pode ser obtido por meio de p(x n ) = E xn 2 {p(x n x n 2 )} = E xn 2 { p(x n x n 1 )p(x n 1 x n 2 )dx n 1 } = = p(x n x n 1 )E xn 2 {p(x n 1 x n 2 )}dx n 1 p(x n x n 1 )p(x n 1 )dx n 1 = E xn 1 {p(x n x n 1 )} que é um resultado conhecido. 31

Ruído Branco Recurso matemático de não previsibilidade ; Recurso prático para justificar o nível de ruído. Propriedade principal do Ruído Branco: p(x k x i ) = p(x k ) com k > i, significando que o conhecimento de x i não ajuda em nada na determinação de x k. 32

Ruído Branco Ruído Branco Gaussiano: p(x k ) N, caracterizada pela média e pela função/matriz de auto-covariância. Caso parâmetro discreto: E{(x n E{x n })(x m E{x m }) T } = Q n δ nm com Q n > 0 e o Delta de Kronecker dado por δ nm = { 1, n = m 0, n m Caso parâmetro contínuo: p(x t x τ ) = p(x t ), t > τ E{(x t E{x t })(x τ E{x τ }) T } = Q(t)δ(t τ) 33

com Q(t) > 0 e o Dirac possuindo as propriedades seguintes: δ(t τ) = 0, t τ 0 δ(t τ)dt = 1 Dificuldade em determinar C X (t, t + τ) de um ruído branco devido à função Dirac. No caso escalar, um artifício consiste em avaliar o ruído branco como um caso particular de um Processo Gaussiano ESA x t com média nula e função de auto-covariância C X (τ) = E{(x t E{x t})(x t+τ E{x t+τ}) T } = σ 2 δ( τ) = σ 2 δ(τ) com δ(τ) = δ( τ) ( ρ ) δ(τ) = exp{ ρ τ } 2 34

Pode-se verificar que δ(t τ)dt = 1. Na verdade δ(τ) é uma aproximação para o Dirac: δ(τ) = lim δ(τ). ρ Assim x t x t (ruído branco) com ρ e C X (τ) = R X (τ) = σ 2 δ(τ) 35

Ruído Branco Exemplo 11: Relação entre Movimento Browniano e Ruído Branco Sendo x t um Movimento Browniano, que possui média nula, C X (t,τ) = R X (t,τ) = E{x t x τ } = E{[(x t x τ ) + x τ ] x τ } = E{(x t x τ ) x τ + x 2 τ} = E{(x t x τ ) x τ } + E{x 2 τ} = E{(x t x τ ) (x τ x 0 )} + E{x 2 τ} sendo t > τ > 0, os incrementos são independentes e C X (t,τ) = E{x 2 τ} = σ 2 τ Como C X (t,τ) = C X (τ,t), para quaisquer t,τ, C X (t,τ) = σ 2 min(t, τ). 36

Considerando agora o processo obtido pela derivada temporal do Movimento Browniano y t = dx t dt então, de acordo com [1], (teorema 3.6, pp. 64), C Y (t, τ) = 2 C X (t, τ) t τ = σ 2 2 min(t, τ). t τ Sendo a derivada segunda da função min(t,τ) igual a δ(τ t) = δ(t τ), obtem-se C Y (t,τ) = σ 2 δ(t τ) que, por meio da transformação de variáveis, implica em C Y (τ) = σ 2 δ(τ). Ou seja, o Ruído Branco Gaussiano é a derivada do Movimento Browniano. 37

Espectro de um processo estocástico Análise espectral: interesse pela distribuição das componentes de um PE estacionário no espaço da freqüência. Potência Média: sendo x t um PE estacionário E{ x t 2 } = E{x t x t } = R X (t,t) = R X (0) Densidade Espectral de Potência (DEP): S X (ω) = F{R X (τ)} = R X (τ)e jωτ dτ com ω sendo a freqüência em rad/s e F{ } é a transformada de Fourier. 38

R X (τ) pode ser obtido por R X (τ) = F 1 {S X (ω)} = 1 2π S X (ω)e jωτ dω Mais especificamente, a relação entre Potência Média e DEP é dada por E{ x t 2 } = R X (0) = F 1 {S X (ω)} τ=0 = 1 2π = S X (ω)dω S X (2πf)df com f = ω 2π sendo a freqüência em Hz. Portanto, este resultado justifica o nome Densidade Espectral de Potência. 39

Espectro de um processo estocástico Exemplo 12: DEP do Ruído Branco Sendo x t uma aproximação do Ruído Branco, tal que sua DEP é dada por ( R X (τ) = σ 2 ρ ) exp{ ρ τ } 2 S X (ω) = = 1 + σ 2 ( ( σ 2 ρ ) exp{ ρ τ jωτ}dτ 2 ω ρ ) 2 40

Como o ruído branco x t é obtido a partir de x t fazendo ρ conclui-se que S X (ω) = σ 2 E{ x t 2 } = R X (0) = Portanto, o Ruído Branco caracteriza-se por: (i) possuir componentes em todas as freqüências (origem do termo Ruído Branco, fazendo referência à luz branca) (ii) ter potência média infinita (o que faz com que não exista na realidade) 41

Espectro de um processo estocástico Propriedades da Densidade Espectral de Potência: S X (ω) é uma função real de ω: uma vez que R X (τ) = R X (t, t+τ) = E{x t x t+τ } = E{x t+τ x t } = R X (t+τ, t) = R X ( τ), então R X (τ) é uma função par. Sendo assim, então Portanto, S X (ω) = = R X (τ)e jωτ dτ = R X (τ)sin(ωτ)τ = 0 R X (τ) [cos(ωτ) j sin(ωτ)]dτ R X (τ) cos(ωτ)dτ (38) 42

S X (ω) é uma função par de ω: como cos(ωτ) é função par de ω, (38) resulta em uma função par. Referências [1] JAZWINSKI, A. H. Stochastic Processes and Filtering Theory. [S.l.]: Academic Press, 1970. 43