Fundamentos de Estatística

Fundamentos de Estatística Clássica Workshop Análise de Incertezas e Validação Programa de Verão 2017 Marcio Borges 1 1LABORATÓRIO NACIONAL DE COMPUTAÇÃO CIENTÍFICA mrborges@lncc.br Petrópolis, 9 de Fevereiro de 2017 M. Borges (LNCC) Programa de Verão Fev. 2017 1 / 25

Outline 2 Lei dos Grandes Números M. Borges (LNCC) Programa de Verão Fev. 2017 2 / 25

Outline 3 Teorema do Limite Central M. Borges (LNCC) Programa de Verão Fev. 2017 3 / 25

Parte I Lei dos Grandes Números M. Borges (LNCC) Programa de Verão Fev. 2017 4 / 25

Lei dos Grandes Números Desigualdade de Tchebycheff (Chebyshev) Seja X uma variável aleatória contínua com µ = E [X ] e σ 2 finitas e pdf f(x). Seja c R e ε um número positivo qualquer, vamos calcular a seguinte probabilidade P ( X c ε) = P (c + ε X c ε) f (x) = = c ε f(x) dx + f(x) dx c+ε f(x) dx (c ε) c (c + ε) Ω={x: x c ε} M. Borges (LNCC) Programa de Verão Fev. 2017 5 / 25

Lei dos Grandes Números Desigualdade de Tchebycheff: Sabemos que x c ε é equivalente a P ( X c ε) = Ω f(x) dx Ω (x c)2 ε 2 1, então: (x c) 2 f(x) dx ε 2 (x c) 2 ε 2 f(x) dx = 1 ε 2 E [ (X c) 2] Então a Desigualdade de Tchebycheff fica assim definida: P ( X c ε) 1 ε 2 E [ (X c) 2] M. Borges (LNCC) Programa de Verão Fev. 2017 6 / 25

Lei dos Grandes Números Desigualdade de Tchebycheff: Se escolhermos c = µ, temos que: ou, o evento complementar: P ( X µ ε) 1 ε 2 E [ (X µ) 2] }{{} σ 2 P ( X µ < ε) 1 σ2 ε 2 M. Borges (LNCC) Programa de Verão Fev. 2017 7 / 25

( M. Borges (LNCC) Programa de Verão Fev. 2017 8 / 25

Distribuições de Probabilidades Provas de Bernoulli Provas de Bernoulli Admite apenas dois resultados: sucesso fracasso Variável aleatória (discreta): X = { 1, com probabilidade P(1) = p 0, com probabilidade P(0) = 1 p (1) onde p é a probabilidade de sucesso em cada prova de Bernoulli. M. Borges (LNCC) Programa de Verão Fev. 2017 9 / 25

Distribuições de Probabilidades Provas de Bernoulli f (x) p (1 p) 0 1 x Características: f (x) = p x (1 p) 1 x, x = 0, 1 1 E [X ] = x i f (x i ) = p σ 2 X i=0 = p(1 p) M. Borges (LNCC) Programa de Verão Fev. 2017 10 / 25

Distribuições de Probabilidades Distribuição Binomial Distribuição Binomial Uma variável aleatória B(N, p) representa o número de sucessos obtidos em um número fixo N de provas de Bernoulli. Características: cada prova só admite sucesso ou fracasso; cada prova é independente das demais; a probabilidade p de sucesso é mesma em todas as tentativas; o número N de provas deve ser o mesmo em todas as realizações. M. Borges (LNCC) Programa de Verão Fev. 2017 11 / 25

Distribuições de Probabilidades Distribuição Binomial Variável aleatória associada: Ex.: Jogar uma moeda 10 vezes e anotar o número de caras que aparecem: R X = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10} p = 0.5 e N = 10 M. Borges (LNCC) Programa de Verão Fev. 2017 12 / 25

Distribuições de Probabilidades Distribuição Binomial M. Borges (LNCC) Programa de Verão Fev. 2017 13 / 25

Distribuições de Probabilidades Distribuição Binomial Características: ( ) N f (x) = p x x (1 p) N x, x = 0, 1,..., N N ( ) N E [X ] = x i p x i (1 p) N x i = Np x i σ 2 X i=0 = Np(1 p) Obs: x i = 0, 1,..., N para i = 0, 1,..., N M. Borges (LNCC) Programa de Verão Fev. 2017 14 / 25

) M. Borges (LNCC) Programa de Verão Fev. 2017 15 / 25

Lei dos Grandes Números Exemplo Desejamos determinar a probabilidade de uma peça ser defeituosa em uma linha de produção. Definimos o evento A={peça defeituosa} Prova de Bernoulli P (A) = p (probabilidade de sucesso = peça defeituosa) a Se tomarmos um número N de peças e anotarmos n A (número de peças defeituosas), então n A é uma variável aleatória binomial, portanto: E [n A ] = Np e σ 2 n A = Np(1 p) a apesar do contraditório significado M. Borges (LNCC) Programa de Verão Fev. 2017 16 / 25

Lei dos Grandes Números Exemplo Definimos a frequência relativa do evento A como: f A = n A N Portanto, f A é uma variável aleatória que depende de N e p = P (A) (probabilidade real, mas desconhecida). Então, E [f A ] = Np N = p σ 2 f A = Np(1 p) N 2 = p(1 p) N M. Borges (LNCC) Programa de Verão Fev. 2017 17 / 25

Lei dos Grandes Números Exemplo Usamos agora a desigualdade de Tchebycheff para f A : p(1 p) P ( f A p ε) ε 2 N, ou de forma equivalente, P ( f A p < ε) 1 Tomando o limite quando N, temos p(1 p) ε 2 N lim P ( f A p < ε) = 1, N ou seja, f A converge, estatisticamente, para P (A) quando N cresce M. Borges (LNCC) Programa de Verão Fev. 2017 18 / 25

Lei dos Grandes Números Conclusão: O resultado anterior quer dizer que a probabilidade do evento { n A N P (A) < ε } pode se tornar arbitrariamente próxima da unidade, ao se tomar N suficientemente grande. Esse resultado é a Lei dos Grandes Números. M. Borges (LNCC) Programa de Verão Fev. 2017 19 / 25

Lei dos Grandes Números Outra formulação: Suponha que X 1,..., X n sejam variáveis aleatórias independentes e identicamente distribuídas (iid), como média (µ) e variância (σ 2 ) finitas. Definimos a variável aleatória média amostral da seguinte forma: n X = 1 n i=1 X i E [ X ] = µ e V [ X ] = σ 2 /n Usando o teorema de Tchebycheff: P ( X µ < ε ) 1 σ2 ε 2 n M. Borges (LNCC) Programa de Verão Fev. 2017 20 / 25

Lei dos Grandes Números P ( X µ < ε ) 1 σ2 ε 2 n Conclusão: À medida que n a probabilidade de X assumir valores próximos a µ tende para a unidade, ou seja, P ( X µ < ε ) 1. M. Borges (LNCC) Programa de Verão Fev. 2017 21 / 25

Parte II Teorema do Limite Central M. Borges (LNCC) Programa de Verão Fev. 2017 22 / 25

Teorema do Limite Central Definição Teorema do Limite Central Seja X 1,..., X n uma sequência de variáveis aleatórias independentes, com E [X i ] = µ i e V [X i ] = σ 2 finitas, i = 1,..., n e seja i Y = X 1 + + X n, então, n Y Z n = i=1 n tem, aproximadamente, distribuição normal N (0, 1), quando n Em outras palavras, se uma variável aleatória Y puder ser representada pela soma de quaisquer n variáveis aleatórias independentes, para n suficientemente grande, Y terá distribuição aproximadamente normal. M. Borges (LNCC) Programa de Verão Fev. 2017 23 / 25 i=1 µ i σ 2 i,

Teorema do Limite Central Importância Este resultado explica a grande importância que a distribuição normal desempenha na teoria de probabilidade (Exemplo numérico) M. Borges (LNCC) Programa de Verão Fev. 2017 24 / 25

Teorema do Limite Central (a) n=3 (b) n=5 (c) n=10 (d) n=100 M. Borges (LNCC) Programa de Verão Fev. 2017 25 / 25