Probabilidade e Estatística stica Prof. Dr. Narciso Gonçalves da Silva http://paginapessoal.utfpr.edu.br/ngsilva Inferência Estatística stica e Distribuições Amostrais
Inferência Estatística stica O objetivo principal da inferência estatística é obter informações sobre determinada característica da população baseando-se apenas das informações obtidas de uma amostra. Parâmetro: quantidades da população, em geral, desconhecidas e sobre as quais temos interesse. Representados por letras gregas: µ, σ, etc. Estatística: quantidades calculadas com base nos elementos da amostra. Representadas por letras do alfabeto latino:, s, etc.
Inferência Estatística stica Estimador: é uma estatística destinada a estimar um parâmetro de interesse da população. Por exemplo: é um estimador de µ. Estimativa: é o valor numérico do estimador. µˆ Denominação Estimador Parâmetro Média Variância Número de elementos Proporção X S n pˆ 2 µ 2 σ N p
Inferência Estatística stica Vício ou viesado: um estimador é não viciado ou não viesado para um parâmetro θ se, ou seja, se a esperança matemática do estimador é igual ao valor do parâmetro. Consistência: um estimador é consistente, se à medida que o tamanho da amostra aumenta, sua esperança matemática converge para o parâmetro de interesse e sua variância converge para zero. Eficiência: dados dois estimadores e, não viciados para uma parâmetro, dizemos que é ^ θ 2 ^ θ 1 mais eficiente que se V( ) < V( ). θ ^ θ 2 ^ θ 1 ^ θ 2 ^ θ 1
Distribuições Amostrais As estatísticas e os parâmetros são funções de variáveis aleatórias e são, também, variáveis aleatória, portanto possuem distribuição de probabilidade, esperança matemática e variância. Distribuições amostrais são distribuições de probabilidades para estimadores como média, variância e proporção.
1. Distribuição Amostral da MédiaM Considere uma população em que a VA X assume os valores do conjunto {1, 3, 5, 5, 7}. A distribuição de probabilidade de X é dada por: X = x 1 3 5 7 P(X = x) 1/5 1/5 2/5 1/5 µ = E(X) = 1.1/5 + 3.1/5 + 5.2/5 + 7.1/5 = 4,2 σ²= V(X) = (1-4,2) 2.1/5 + (3-4,2) 2.1/5 + + (7 4,2) 2.1/5 = 4,16
1. Distribuição Amostral da MédiaM Vamos relacionar todas as amostras possíveis de tamanho n = 2, selecionadas ao acaso e com reposição dessa população, x e encontrar a distribuição da média amostral de tal que: x x+ x = 1 2 sendo: 1 : valor selecionado na primeira extração, 2 : valor selecionado na segunda extração x 2
1. Distribuição Amostral da MédiaM
1. Distribuição Amostral da MédiaM A distribuição de probabilidade para a média amostral é: x µ = E( ) = 1.(1/25) + 2.(2/25) + + 7.(1/25) = 4,2 x σ² = V( ) = (1 4,2) 2.1/25 +... + (7 4,2) 2.1/25 = 2,08 x σ² = V( ) = 4,16/2
1. Distribuição Amostral da MédiaM Repetindo o mesmo procedimento para amostras de tamanho n = 3, tem-se a seguinte distribuição de probabilidade para a média amostral: x E( ) = 1.(1/125) +... + 7.(1/125) E( ) = 4,2 V( ) = (1 4,2) 2.1/125 + + (7-4,2) 2.1/125 V( ) = 1,39 = 4,16/3
1. Distribuição Amostral da MédiaM Os histogramas correspondentes da variável aleatória X e da variável aleatória para n = 2 e n = 3 estão apresentados abaixo:
1. Distribuição Amostral da MédiaM Dos histogramas observamos que: Conforme n aumenta os valores da média amostral tendem a se concentrar cada vez mais em torno da E(X), pois a variância diminui Os valores extremos passam a ter pequenas probabilidades de ocorrência Conforme n aumenta, a forma da distribuição das médias se aproxima da distribuição normal
1. Distribuição Amostral da MédiaM
1. Distribuição Amostral da MédiaM
1. Distribuição Amostral da MédiaM Observação: Logo, se X tem média µ e variância então
1. Distribuição Amostral da MédiaM Exemplo 1: Uma variável aleatória X assume os valores 3, 6 e 8 com, respectivamente, probabilidades 0,4; 0,3 e 0,3. Uma amostra de 40 observações com reposição é obtida aleatoriamente. Qual a probabilidade da média amostral ser maior que 5? Exemplo 2: O faturamento diário de um supermercado está normalmente distribuído com média de R$ 20.000,00 e desvio-padrão de R$ 2000,00. Qual a probabilidade do faturamento ultrapassar R$ 1230000,00 em 60 dias?
1. Distribuição Amostral da MédiaM Exemplo 3: Considere que a distribuição dos níveis de colesterol para todos os homens de 20 a 74 anos está normalmente distribuído com média 211 mg e desvio-padrão de 46 mg. Selecionando 25 homens desta população, determine: a) A proporção destes 25 homens que terá um valor médio inferior a 230 mg; b) O valor médio de nível de colesterol que limita os 10% dos valores mais baixos da distribuição amostral; c) Os limites superior e inferior que incluem 95% das médias das amostras de tamanho 25; d) Qual deve ser o tamanho das amostras para que 95% de suas médias se encontrem a ±5 mg da média da população?
1. Distribuição Amostral da MédiaM Se amostra de tamanho n é retirada de uma população finita (sem reposição) de tamanho N (N > n), utiliza-se o fator de correção para a variância. Exemplo: As lâmpadas fabricadas por uma indústria tem duração média de 800 horas e desvio-padrão de 100 horas. É escolhida aleatoriamente 200 lâmpadas de um lote de 2000 lâmpadas. Determine a probabilidade da média destas lâmpadas escolhidas ser superior a 810 horas.
2. Distribuição Amostral da Proporção Considere que a proporção de elementos de uma população com determinada característica é p. Para cada elemento da população pode ser definida uma VA X tal que: Ou seja, X é uma VA com distribuição de Bernoulli com E(X) = p e V(X) = p.(1 p).
2. Distribuição Amostral da Proporção Seja x 1, x 2,..., x n uma amostra simples retirada aleatoriamente com reposição dessa população e, seja, S n = x 1 + x 2 +... + x n o total de elementos portadores da característica na amostra. S n tem distribuição binomial com parâmetros n e p. A proporção amostral pode ser reescrita como: Logo, Então, é um estimador não viciado e consistente para p.
2. Distribuição Amostral da Proporção Utilizando o Teorema do Limite Central tem-se que a distribuição amostral de para n suficientemente grande tem distribuição normal com µ = p e σ 2 = p.(1 p)/n. Ou seja,
2. Distribuição Amostral da Proporção Exemplos: 1)A proporção de peças defeituosas de um lote é de 40%. Foi coletada aleatoriamente uma amostra de 30 peças com reposição. Determine a probabilidade desta amostra fornecer uma proporção de peças defeituosas menor que 50%. 2)Qual a probabilidade de ocorrer entre 40% e 50% de caras em 120 lançamentos de uma moeda não viciada?
3. Distribuição Amostral da Diferença a de MédiasM Sejam duas populações 1 e 2, com médias µ 1 e µ 2 e desvios-padrão σ 1 e σ 2, respectivamente. São retiradas, independentemente e com reposição, amostras de tamanho n 1 da população 1 e de tamanho n 2 da população 2. De todas as possíveis amostras retiradas pode-se obter a distribuição amostral da diferença entre as duas médias. Se n 1 e n 2 forem suficientemente grandes: x x N 2 2 σ + 1 2 ( - ) ~ ( -, n σ µ µ n) 1 Logo: 2 z = ( 1 x x 2 1 2 2 1-2) - ( µ 1 - µ 2) 2 + 2 σ1 σ2 n 1 n
3. Distribuição Amostral da Diferença a de MédiasM Exemplo: As lâmpadas elétricas do fabricante A têm duração média de 1400 horas, com desvio-padrão de 200 horas, enquanto as do fabricante B têm duração média de 1200 horas, com desvio-padrão de 100 horas. Se forem ensaiadas amostras aleatórias de 125 lâmpadas de cada marca, qual será a probabilidade de que as lâmpadas da marca A tenham vida média maior do que as da marca B de pelo menos 160 horas?
4. Distribuição Amostral da Diferença a de Proporções Considere que seja extraídas amostras de tamanho n 1 da população 1 cuja proporção de elementos com uma determinada característica seja p 1 e que se seja extraídas amostras de tamanho n 2 da população 2 cuja proporção de elementos com a referida característica seja p 2. A distribuição amostral da diferença das duas proporções é dada por: Logo:
4. Distribuição Amostral da Diferença a de Proporções Exemplo: Duas pessoas A e B jogam uma partida do tipo cara e coroa onde cada uma lança 50 vezes uma moeda não viciada. O jogador A vencerá o jogo se conseguir 5 ou mais caras do que o jogador B e, se isso não ocorrer, o jogador B vencerá. Determine a probabilidade de cada jogador ganhar.
Tabela Z