Métodos Estatísticos Cristina Maria Martins Maria da Graça Temido Departamento de Matemática Universidade de Coimbra Hidrologia Urbana Módulo I
Conceitos básicos Probabilidade Experiência aleatória Acontecimentos Como calcular as probabilidades de acontecimentos? Definição frequencista Hidrologia Urbana Módulo I 1
Definição clássica de probabilidade (Laplace). Se Ω é finito e todos os seus elementos têm a mesma possibilidade de ocorrência, então a probabilidade de um acontecimento A é o quociente entre o número de casos favoráveis à ocorrência de A e o número de casos possíveis de obter ao realizar a experiência. Simbolicamente, P (A) = #A #Ω. Hidrologia Urbana Módulo I 2
Definição axiomática de probabilidade (Kolmogorov). Uma probabilidade é uma função P com valores em [0, 1] que verifica P (Ω) = 1 e tal que, para qualquer sucessão de acontecimentos A 1, A 2,..., A n,..., dois a dois incompatíveis, verifica P (A 1 A 2... A n...) = P (A 1 ) + P (A 2 ) +... + P (A n ) +... Hidrologia Urbana Módulo I 3
1. P ( ) = 0. 2. Se A e B são acontecimentos incompatíveis, então P (A B) = P (A) + P (B). 3. Se A B, então P (A) P (B). 4. Se A e B são acontecimentos quaisquer, então a) P (A) = 1 P (A); b) P (A B) = P (A) + P (B) P (A B). Hidrologia Urbana Módulo I 4
Variáveis aleatórias e distribuições Seja Ω um espaço fundamental. Damos o nome de variável aleatória real a uma função X : Ω R para a qual é sempre possível calcular para qualquer real x. P (X x) = P ({ω : X(ω) x}), A F (x) = P (X x), chamamos função de distribuição de X. Hidrologia Urbana Módulo I 5
A partir da função de distribuição de X podemos calcular as probabilidades de qualquer tipo de acontecimentos definidos à custa de X. Por exemplo: P (a < X b) = F (b) F (a) P (X > a) = 1 F (a) Variáveis aleatórias discretas e contínuas. Distinção Suporte e distribuição Hidrologia Urbana Módulo I 6
Em rigor, uma variável aleatória contínua é definida a partir de uma função densidade. Damos o nome de função densidade (ou apenas densidade) sobre R a uma função real de variável real, f, que seja não negativa e verifique + f(x) dx = 1. Uma variável aleatória real X diz-se absolutamente contínua se existe uma densidade f tal que F (u) = u f(x)dx, u R. Hidrologia Urbana Módulo I 7
1. a função de distribuição, F, de uma variável aleatória contínua é contínua; 2. P (X [a, b]) = P (X ]a, b]) = P (X [a, b[) = P (X ]a, b[) = F (b) F (a) = b a f(t)dt. Figura 1: Representação gráfica da probabilidade P (a X b), com X contínua de densidade f. Hidrologia Urbana Módulo I 8
Valor médio, desvio padrão e quantis de uma variável aleatória 1. Se X é uma variável discreta, a média (valor médio ou esperança matemática) de X é definida por E(X) = x S X xp (X = x). 2. Se X é uma variável contínua com densidade f, a média (valor médio ou esperança matemática) de X é definida por E(X) = + xf(x) dx. Hidrologia Urbana Módulo I 9
A variância de X é dada por V (X) = E((X E(X)) 2 ) = E(X 2 ) (E(X)) 2 O desvio padrão de X é definido por V (X). V (ax) = a 2 V (X), a R (em particular, V ( X) = V (X)); V (X + b) = V (X), b R. Definir Quantis de uma variável aleatória contínua Hidrologia Urbana Módulo I 10
Lei normal ou de Gauss Uma variável aleatória X tem distribuição normal de parâmetros m e σ ( σ > 0) se tem densidade da forma f(x) = 1 2πσ e 1 2 (x m σ )2, x R. Usamos a notação X N (m, σ). Figura 2: Esboço do gráfico da densidade de uma lei N (m, σ). Hidrologia Urbana Módulo I 11
1. Se X N (m, σ) então Z = X m σ N (0, 1). 2. Se Z N (0, 1) então X = σz + m N (m, σ). 3. Se Z N (0, 1), tem-se a) F Z (x) = 1 F Z ( x), x R, b) P ( x Z 0) = P (0 Z x), x R. F X (x) = P (X x) = P ( X m σ x m ) σ ( ) x m = F Z σ (1) Hidrologia Urbana Módulo I 12
Cálculo de probabilidades e de quantis da lei normal.(excel) Exercício: X N (2, 5) Calcular P (1 X < 4) Calcular x tal que P (X > x) = 0.68 Hidrologia Urbana Módulo I 13
Validação de uma lei de Gauss Amostra de precipitações totais anuais (em mm), obtidos a partir dos registos diários num determinado posto udométrico, referentes a 17 anos. Ano 1 2 3 4 5 6 7 8 9 Prec. total anual 800 1000 1340 1100 830 900 930 950 1111 Ano 10 11 12 13 14 15 16 17 Prec. total anual 1000 810 1410 1200 1210 1010 1038 1010 Histograma Papel de probabilidade Teste de Kolmogorov-Smirnov Hidrologia Urbana Módulo I 14
Somos assim conduzidos a aceitar a hipótese de que a variável aleatória T, que representa a precipitação total anual registada no posto udométrico em causa, segue a lei N (1038.2, 174.9). Calcular P (T > 950) P (800 < T < 850) t tal que P (T > t) = 0, 02 Hidrologia Urbana Módulo I 15
Teorema limite central Se X 1,..., X n são variáveis aleatórias independentes seguindo todas a mesma lei de média m e desvio padrão σ > 0, então a soma X 1 +... + X n é uma variável aleatória com lei aproximadamente normal de valor médio nm e desvio padrão n σ. Hidrologia Urbana Módulo I 16
Teoria de Extremos Modelar a ocorrência e frequência de acontecimentos raros Secas, inundações, terramotos, furacões, ventos ciclónicos, etc Método dos máximos anuais versus leis de máximos O Método dos máximos anuais ou método de Gumbel é de algum modo natural quando observamos fenómenos hidrológicos ao longo do tempo, como, por exemplo, níveis máximos de água num rio ou de alturas de precipitação, onde se espera uma certa repetição de valores semelhantes em períodos de um ano. Hidrologia Urbana Módulo I 17
Objectivos Perante uma amostra de máximos pretendemos calcular Probabilidades de ocorrência Quantis elevados Tempos de recorrência (ou período de retorno) T R = 1 P (A) Hidrologia Urbana Módulo I 18
Leis de máximos A função de distribuição do máximo de amostras suficientemente grandes pode ser aproximada por uma função de distribuição que apresenta uma das três formas seguintes: Ψ(x) := { exp ( ( x λ δ )α) x λ 0 x > λ, Φ(x) := ( Λ(x) := exp { ( exp ( x λ δ ) α) x λ 0 x < λ, e x λ δ ), x R, onde α > 0, δ > 0 e λ é um real qualquer. Estas três funções de distribuição recebem os nomes de Weibull, Fréchet e Gumbel, respectivamente. Hidrologia Urbana Módulo I 19
Validação de uma lei de extremos Papel de probabilidade da Gumbel x i:n versus ln( ln i n+1 ) Amostra: 39 104 118 119 122 132 143 152 177 177 178 182 206 212 237 237 239 241 242 258 265 276 277 329 333 344 351 357 359 361 368 370 372 376 378 391 409 418 429 431 435 578 679 920 Hidrologia Urbana Módulo I 20
Estimação de λ e de δ Exemplo continuação δ = 0.7797 s = 0.7797 160.792 = 125.369 e λ = x 0.45 s = 302.750 0.45 160.792 = 230.394 Q(0.98)= 230.394 125.369 ln( ln(0.98)) = 719.576 l/s O tempo de recorrência de um caudal igual a 800 l/s é dado por T R (800) = exp ( ) 800 230.394 125.369 94 anos. Hidrologia Urbana Módulo I 21
Exemplo 1.3.4 Construção de comporta Altura significativa da onda máxima anual em zonas costeiras, em metros, respeitantes aos últimos 24 anos. O estudo foi baseado na amostra de máximos seguinte: 1.04 1.13 1.43 2.04 2.16 2.26 2.38 2.53 2.59 2.80 2.87 2.93 3.11 3.23 3.41 3.44 3.51 3.60 3.69 3.78 3.84 3.92 3.93 4.02 Papel de probabilidade Hidrologia Urbana Módulo I 22
Exemplo 1.3.4 Continuação G(x) = exp ( ( 1 + ξ x λ ) ) 1/ξ, 1 + δ 0, 1 + ξ(x λ) δ ξ(x λ) δ > 0, ξ 0 0 Estimação de ξ λ e de δ: ξ = 0.6335 δ = 1.0115 λ = 2.7366 Hidrologia Urbana Módulo I 23
Exemplo 1.3.4 Continuação A variável aleatória M (representa a altura máxima anual da altura significativa da onda) segue uma lei de Weibull com função de distribuição G(x) = exp ( (1 0.6335 x 2.7366 ) 1.0115 )1.5785 x < 4.3333 1 x 4.3333. Hidrologia Urbana Módulo I 24
Exemplo 1.3.4 Continuação A probabilidade do máximo anual da altura significativa da onda exceder 4 metros é P (M > 4) = 1 G(4) = 0.08 T R (3.8) = 1/(1 G(3.8)) 6 anos. O valor de altura da onda máxima anual com probabilidade 0.01 de ser excedido é 1 ( ln(0.99))0.6335 Q(0.99) = 2.7366 1.0115 0.6335 4.24 metros. Hidrologia Urbana Módulo I 25