Princípios de Modelagem Matemática Aula 10 Prof. José Geraldo DFM CEFET/MG 19 de maio de 2014
1 Alguns resultados importantes em estatística
A distribuição normal tem importante papel em estatística pois é utilizada para descrever um grande número de fenômenos naturais, biológicos e sociais; fundamenta a inferência estatística.
A distribuição normal é uma distribuição de probabilidade associada a variáveis aleatórias contínuas. É completamente descrita, no caso de uma única variável, por dois parâmetros: a média µ e o desvio padrão σ N (µ, σ) designa distribuição normal com média µ e o desvio padrão σ. Sua expressão é dada por [ ρ (x) = 1 exp 2πσ com < x + e σ > 0. ] (x µ)2 2σ 2 (1)
ρ(x) Figura: ρ (x) = 1 2πσ exp [ (x µ)2 µ = 0 para três diferentes valores de desvio padrão. x 2σ 2 ] σ = 0, 2 σ = 0, 5 σ = 1 com média
ρ(x) Figura: Gráfico de uma distribuição normal. A área abaixo da curva no intervalo [a, b] é igual à probabilidade de se obter, como resultado de uma medida da variável aleatória, um valor x compreendido neste intervalo. Em outras palavras, Pr (a x b) = b ρ (x) dx. a a b x
Exercício Alguns resultados importantes em estatística 1 Verifique que a distribuição de probabilidades dada em Eq. (1) está corretamente normalizada, i.e., ˆ + ρ (x) dx = 1 ˆ [ ] + (x µ)2 exp 2πσ 2σ 2 dx = 1. 2 Verifique que a média da variável aleatória X, dado que esta obedece à distribuição normal dada por Eq. (1), é µ, como esperado.
Independência de variáveis aletórias Em um experimento (observação experimental/simulação computacional), a amostragem é uma etapa fundamental. Amostragem bem feita deve refletir a estatística da população mas, como inferir, a partir de uma amostra, a estatística de toda a população? Dois importantes resultados da teoria de probabilidades o teorema do limite central e a lei dos grandes números permitem inferir a média e o desvio padrão da população a partir da média e do desvio padrão amostrais.
Independência de variáveis aletórias Grosso modo, a lei dos grandes números estabelece que a média de uma amostra caracterizada por variáveis aleatórias independentes e igualmente distribuídas converge para a média da população à medida que o número de indivíduos amostrados aumenta; o teorema do limite central (muitas vezes também citado como teorema central do limite) estabelece que a distribuição de probabilidades da soma de variáveis aleatórias independentes e igualmente distribuídas converge para uma distribuição normal caracterizada pela média e desvio padrão da própria soma.
Independência de variáveis aletórias Em ambos teoremas, assume-se, por hipótese, que as variáveis aleatórias são independentes e igualmente distribuídas (iid). Duas variáveis aleatórias X e Y são independentes se a distribuição conjunta de probabilidades 1 ρ (x, y) do par (X, Y ) puder ser escrita como ρ X,Y (x, y) = ρ X (x) ρ Y (y), onde ρ X (x) e ρ Y (y) são distribuições de probabilidade associadas a cada uma das variáveis aleatórias, X e Y, resp. Se X e Y representam grandezas, sua independência significa que a probabilidade de se obter um determinado valor na medida de uma delas independe do valor obtido na medição da outra. 1 Sem perda de generalidade, consideramos as variáveis aleatórias X e Y contínuas.
Variáveis aleatórias identicamente distribuídas Duas variáveis aleatórias X e Y são igualmente distribuídas se são descritas pela mesma distribuição de probabilidades. Por exemplo, se X e Y são variáveis aleatórias com distribuição normal e possuem médias e variâncias idênticas, então X e Y são igualmente distribuídas.
Theorem (do limite central) Sejam X 1, X 2,..., X n variáveis aleatórias i.i.d. com média µ e desvio padrão σ. A soma S n = n X i (2) i=1 também é uma variável aleatória cuja distribuição de probabilidades, nestas condições, se aproxima de uma distribuição normal N ( nµ, σ n ) à medida que n.
Uma outra maneira de estabelecer o teorema do limite central é dada a seguir: Theorem [do limite central]sejam X 1, X 2,..., X n variáveis aleatórias i.i.d. com média µ e desvio padrão σ. A soma n S n = X i (3) é uma variável aleatória com média nµ e variância σ n. Então, a distribuição de probabilidades da variável aleatória Z n = i=1 Sn nµ σ n se aproxima de uma distribuição normal N (0, 1) à medida que que n. (4)
O teorema do limite permite obter um resultado importante para a distribuição da média amostral. Sejam X 1, X 2,..., X n variáveis aleatórias i.i.d. com média µ e desvio padrão σ. Então, a média amostral deste conjunto X = 1 n n X i (5) i=1 é variável aleatória com média µ e desvio padrão σ/ n, cuja distribuição de probabilidades se aproxima de uma distribuição normal N ( µ, σ/ n ) à medida que n (verifique!).
Um exemplo: Suponha que determinada empresa fabrique parafusos cujo diâmetro segue uma distribuição uniforme de média µ = 5, 00 mm e desvio padrão σ = 0, 01 mm. Qual é a probabilidade de se obter uma amostra de 100 parafusos com diâmetro médio maior que 5, 001 mm? O diâmetro D i de cada parafuso na amostra pode ser considerado uma variável aleatória i.i.d. O diâmetro médio dos parafusos da amostra D é variável aleatória que segue uma distribuição aproximadamente normal N ( µ, σ/ n ) = N (5, 00; 0, 001) com n = 100.
Um exemplo. Para este cálculo, é necessário conhecer a distribuição acumulada da variável aleatória D, definida como F D ( D d ) = ˆ d ρ D (x) dx, que dá a probabilidade de se obter um valor para D menor ou igual a d. Deste modo, a probabilidade de se obter D > 5, 001 mm para a amostra é Pr ( D > 5, 10 ) ( 1 F D D 5, 001 ) ˆ 5,001 = 1 ρ D (x) dx.
Como ρ D (x) representa uma função de distribuição de probabilidades normal com média µ D = 5, 00 mm e desvio padrão σ D = 0, 001 mm temos Pr ( D > 5, 10 ) 1 0, 8413 = 0, 1587.
Exercícios 1 Verifique a equivalência dos dois enunciados do teorema do limite central. 2 Verifique, usando o teorema do limite central, o resultado para a distribuição da média amostral. 3 Peças são embaladas em engradados com capacidade para 100 peças. Os pesos das peças são variáveis aleatórias i.i.d. com distribuição uniforme no intervalo 0, 49 kg M i 0, 51 kg. Vinte engradados são carregados em um veículo que suporta o peso de, no máximo, uma 980 kg. Desprezando o peso dos engradados, qual a probabilidade de que a capacidade de carga do veículo seja ultrapassada?
O resultado que enunciamos para a distribuição da média amostral X de um conjunto de variáveis aleatórias i.i.d. pode ser complementado com a lei dos grandes números. Há duas formas de se enunciar esta lei a forma fraca e a forma forte.
Theorem ((Lei fraca dos grandes números)) Sejam X 1, X 2,..., X n variáveis aleatórias i.i.d. com média µ finita. Definimos a média amostral como a variável aleatória Então, para qualquer ε > 0, X = 1 n n X i. i=1 lim Pr ( X µ < ε ) = 1. n
Theorem ((Lei forte dos grandes números)) Sejam X 1, X 2,..., X n variáveis aleatórias i.i.d. com média µ finita. Então, para qualquer ε > 0, ( Pr lim X µ ) < ε = 1. n
A diferença entre as duas formulações da lei dos grandes números é sutil. A forma fraca da lei dos grandes números estabelece que, se o número de indivíduos n da amostra for suficientemente grande, a probabilidade de a média amostral X estar suficientemente próxima da média da distribuição µ, dentro de um intervalo de tamanho 2ε centrado em µ, é muito próxima de 1. No entanto, amostras com n suficientemente grande ainda podem apresentar média amostral que se desvie da média da distribuição, embora isto aconteça com pouca frequência. A forma forte estabelece que, para todo n suficientemente grande, a média amostral X se mantém suficientemente próxima da média da distribuição µ e a probabilidade de se obter amostras que se desviem desse resultado é nula.