Introdução ao Planejamento e Análise Estatística de Capítulo 3 Introdução à Probabilidade e à Inferência Estatística
INTERVALOS DE CONFIANÇA: Diferentes pesquisadores, selecionando amostras de uma mesma população, poderão obter estimativas pontuais diferentes para o mesmo parâmetro. Isto está relacionado com a variabilidade amostral do estimador pontual. ALTERNATIVA: Construir um estimador que leve em conta essa variabilidade. Obter um estimador por intervalo que combina o estimador pontual com o erro amostral máximo esperado.
INTERVALOS DE CONFIANÇA: DEFINIÇÃO 8: Introdução ao Planejamentos e Análise Estatística de P [ I θ S ] = 1 - α sendo 0 < α < 1. Assim, temos uma probabilidade de 1 - α de selecionar uma amostra que produzirá um intervalo contendo o valor verdadeiro de θ.
INTERVALOS DE CONFIANÇA: As grandezas l e S são chamadas de limites inferior e superior de confiança, respectivamente, e 1 - α é chamado de coeficiente de confiança. Interpretação: Introdução ao Planejamentos e Análise Estatística de Intervalo de confiança considera que, se um número infinito de amostras aleatórias forem selecionadas e um intervalo com 100(1 - α)% de confiança para θ for obtido a partir de cada amostra, então 100(1 - α)% desses intervalos conterão o valor verdadeiro de θ.
INTERVALOS DE CONFIANÇA:
INTERVALOS DE CONFIANÇA:
INTERVALOS DE CONFIANÇA: Na prática: Obtemos somente uma amostra aleatória e calculamos um intervalo de confiança. Introdução ao Planejamentos e Análise Estatística de Uma vez que esse intervalo conterá ou não o valor verdadeiro de θ, não é razoável fixar um nível de probabilidade a esse evento específico. A afirmação apropriada é: O intervalo observado [l, S] contém o valor verdadeiro de θ com 100(1 - α)% de confiança. Essa afirmação tem uma interpretação de frequência, ou seja, não sabemos se a afirmação é verdadeira para essa amostra especifica, mas o método usado para obter o intervalo [l, S] resulta em afirmações corretas em 100(1 - α)% do tempo.
INTERVALOS DE CONFIANÇA: O comprimento S - l do intervalo observado de confiança é uma importante medida da qualidade da informação obtida a partir da amostra. A metade do comprimento do intervalo θ - l ou S - θ é chamada de precisão do estimador. Quanto maior for o intervalo de confiança, mais confiantes estaremos de que o intervalo realmente contém o valor verdadeiro de θ. Por outro lado, quanto maior for o intervalo, menos informação teremos a respeito do valor verdadeiro de θ. IDEAL: Obter um intervalo relativamente pequeno com alta precisão.
SITUAÇÃO: Temos interesse em construir um intervalo de confiança para a média µ de uma característica que pode ser representada pelo modelo normal: DUAS SITUAÇÕES Variância Conhecida Variância Desconhecida
Intervalo de Confiança para Média com Variância Conhecida: Assim, fixado um valor 100(1 - α)% tal que 0 < α < 1, podemos encontrar um valor de zα/2 tal que:
Intervalo de Confiança para Média com Variância Conhecida: A amplitude do intervalo de confiança: -
z α / 2 Introdução ao Planejamentos e Análise Estatística de Intervalo de Confiança para Média com Variância Conhecida: Exemplo 1: RETORNANDO AO PROBLEMA Questão: É considerado doente todo indivíduo para o qual a concentração de A é menor que 1,488 mg/cm3. O que concluir a respeito da população estudada?
Intervalo de Confiança para Média com Variância Conhecida: TAMANHO DE AMOSTRA: Observação: Exemplo anterior: n= 867 Consequência: Erro padrão baixo Quanto maior o tamanho da amostra menor o erro padrão QUESTÃO: Como determinar o tamanho de amostra adequado de forma a garantir um erro padrão e um nível de confiança desejado?
Intervalo de Confiança para Média com Variância Conhecida: TAMANHO DE AMOSTRA: Fixado um erro máximo admissível: e = z σ / max α / 2 n n z * σ α 2 = emax 2
Intervalo de Confiança para Média com Variância Conhecida: EXEMPLO: A distribuição dos pesos de pacotes de sementes de milho, enchidos automaticamente por certa máquina, é normal com desvio padrão ( σ ) conhecido e igual a 0,20 Kg. a) Encontre I.C. de 95% para o peso médio, quando n = 15 e a média amostral = 20,02. b) Que tamanho de amostra será necessário coletar para garantir um erro amostral de no máximo 0,05 Kg, com 95% de confiança, na estimação do verdadeiro peso médio?
Intervalo de Confiança para Média com Variância Conhecida: EXEMPLO: SOLUÇÃO a: Construa um intervalo de confiança de 99% para o peso médio de pacotes de sementes de milho e compare-os.
Intervalo de Confiança para Média com Variância Conhecida: EXEMPLO: SOLUÇÃO b:
Intervalo de Confiança para Média com Variância Desconhecida: DUAS SITUAÇÕES Variância Conhecida Variância Desconhecida
Intervalo de Confiança para Média com Variância Desconhecida: SITUAÇÃO: (USUAL) Parâmetros do modelo são desconhecidos, portanto devem ser estimados a partir dos dados da própria amostra. No caso do modelo normal, nessa situação tanto a média µ e a variância σ 2 não são conhecidas e seus valores serão estimados pela média e variância amostral.
Intervalo de Confiança para Média com Variância Desconhecida: NOVA ESTATÍSTICA: T ( 0,1) X µ Normal = t S 2 X χn n n Essa estatística tem distribuição conhecida como t-student com n - 1 graus de liberdade, sendo n o tamanho da amostra. A forma da distribuição t-student é parecida com a da normal. É simétrica em relação a zero, mas apresenta caudas grossas, ou seja, maior variância do que a normal. Aumentando-se o tamanho de amostra n, a distribuição t-student aproximase do modelo normal. n 1
Intervalo de Confiança para Média com Variância Desconhecida: NOVA ESTATÍSTICA:
Intervalo de Confiança para Média com Variância Desconhecida: Exemplo: Para estimar o rendimento semanal de operários de construção de uma grande cidade, um sociólogo seleciona uma amostra aleatória de 75 operários. A média amostral é dada por 423,00 reais e s = 15,00 reais. Determine um intervalo de confiança para µ considerando coeficientes de confiança 0,90 e 0,95.
Intervalo de Confiança para Média com Variância Desconhecida: Dados do Problema: X : Rendimento semanal dos operários n : tamanho da amostra = 75
Intervalo de Confiança para Média com Variância Desconhecida: Exemplo 2: Em uma pesquisa para toxinas produzidas por um parasita que infecta as safras de milho, um bioquímico preparou extratos da cultura do parasita com solventes orgânicos e mediu a quantidade de substância tóxica por grama de solução. Para uma amostra de 9 culturas encontrou uma quantidade média de substância tóxica igual a 1,02 miligramas e um desvio padrão de 0,26 miligramas. Seja µ a verdadeira quantidade média de substância tóxica. Construir um Intervalo de 95% de confiança para µ.
Intervalo de Confiança para Média com Variância Desconhecida: Dados do Problema: X : quantidade de substância tóxica por grama de solução n : tamanho da amostra = 9
Intervalo de Confiança para Média com Variância Desconhecida: Dados do Problema: X : quantidade de substância tóxica por grama de solução n : tamanho da amostra = 9
Intervalo de Confiança para Diferenças de Médias: Intervalo de Confiança para Diferença de Médias com Variâncias Desconhecidas e Iguais: Nessa situação temos que a variância dos dois tratamentos em estudo são desconhecidas, logo devem também ser estimadas pela amostra. Porém, embora desconhecidas, têm-se a informação que as variâncias dos dois tratamentos são iguais.
Intervalo de Confiança para Diferenças de Médias: Intervalo de Confiança para Diferença de Médias com Variâncias Desconhecidas e Iguais: PROBLEMA: Considerando que as variâncias são desconhecidas, porém iguais, e que é possível obter uma estimativa para variância amostral em cada um dos tratamentos, como pode-se estimar, a partir desses valores, a variância que é igual para ambos os tratamentos?
Intervalo de Confiança para Diferenças de Médias: Intervalo de Confiança para Diferença de Médias com Variâncias Desconhecidas e Iguais: Assim: E, IC (1-α)% para µ 1 - µ 2 é dado por:
Intervalo de Confiança para Diferenças de Médias: Intervalo de Confiança para Diferença de Médias com Variâncias Desconhecidas e Iguais: Exemplo 1: As análises de dois lotes de carbono de cálcio apresentaram os seguintes teores de cinzas (%) indicadas na tabela a seguir. Construir um intervalo de confiança de 95% para à diferença de médias destes dois lotes. Amostras Lote 1 Lote 2 1 1.7 5.9 2 5.9 6.9 3 1.5 3.6 4 4.1 4.3 5 5.9 8.0 6 1.7 2.0 7 3.7 4.8 8 3.1 6.8 9 1.7 9.1 10 3.2 1.5 Média Amostral 3.25 5.29 Variância Amostral 2.805 6.263
Intervalo de Confiança para Diferenças de Médias: 10 Teor de Cinza Lote 1 Lote 2 1.7 5.9 9 5.9 6.9 8 1.5 3.6 7 4.1 4.3 Data 6 5 4 3 2 1 Lote 1 Lote 2 5.9 8.0 1.7 2.0 3.7 4.8 3.1 6.8 1.7 9.1 3.2 1.5
Intervalo de Confiança para Diferenças de Médias: Intervalo de Confiança para Diferença de Médias com Variâncias Desconhecidas e Iguais: Logo: Qual o significado do intervalo conter apenas valores negativos?
Intervalo de Confiança para Diferença de Médias com Variâncias Desconhecidas e Iguais: Exemplo 2: Introdução ao Planejamentos e Análise Estatística de Intervalo de Confiança para Diferenças de Médias: Na fabricação de semicondutores, o ataque químico por via úmida é frequentemente usado para remover silicone da parte posterior das pastilhas antes da metalização. A taxa de ataque é uma característica importante nesse processo e é sabido que ela segue uma distribuição normal. Duas soluções diferentes para ataque químico têm sido comparadas, usando duas amostras aleatórias de 10 pastilhas para cada solução. As taxas observadas de ataque (10-3mils/min) são dadas na tabela a seguir: Solução 1 Solução 2 9.9 10.2 9.4 10.6 9.3 10.7 9.6 10.4 10.2 10.5 10.6 10.0 10.3 10.2 10.0 10.7 10.3 10.4 10.1 10.3 Questão: A taxa média de ataque é a mesma para ambas as soluções???
Intervalo de Confiança para Diferença de Médias com Variâncias Desconhecidas e DIFERENTES: Exemplo : Introdução ao Planejamentos e Análise Estatística de Intervalo de Confiança para Diferenças de Médias: Foi realizado um estudo para verificar a influência da incidência solar sobre a produção de espiguetas nas gramíneas da espécie Paspalum notatum Flügge, conhecida como grama batatais, pois se julga que a reprodução sexuada da espécie é prejudicada em áreas com menor luminosidade. Com esta finalidade efetuou-se a contagem das espiguetas produzidas pelas plantas em dois locais, sendo um deles iluminado (adjacente ao sol) e o outro sombrio. Determine um intervalo de confiança de 95% para a diferença média de espiguetas destes dois locais.
Intervalo de Confiança para Diferenças de Médias: Intervalo de Confiança para Diferença de Médias com Variâncias Desconhecidas e DIFERENTES: Boxplot of Contagem de Espiguetas vs Ambiente Individual Value Plot of Contagem de Espiguetas vs Ambiente 90 Ambiente Iluminado Sombrio Contagem de Espiguetas 80 70 60 50 40 30 20 30 40 50 60 70 Contagem de Espiguetas 80 90 20 Iluminado Ambiente Sombrio
v Intervalo de Confiança para Diferenças de Médias: Intervalo de Confiança para Diferença de Médias com Variâncias Desconhecidas e DIFERENTES: = Solução: 7.78 10 7.78 10 11 2 Introdução ao Planejamentos e Análise Estatística de + + 218.62 10 2 218.62 10 11 2 v 2 = = 2 ( 0.778) ( 21.862) 11 S n 1 2 1 512.5696 + 1 2 S 1 n1 n + 2 + S n 2 + 1 n2 11 2 2 2 S n 2 2 + 1 2 2 2 2 512.5696 = = 9.781921 10 0.05502582 + 43.44973
Intervalo de Confiança para Diferenças de Médias: Intervalo de Confiança para Diferença de Médias com Variâncias Desconhecidas e DIFERENTES: 7.78 224.23 I. C.( µ I µ S ;0,95) : (85.00 39.30) ± t10,0.025 + 10 10 [ ± ] : 45, 7 2.228* 4.8167 :[34,97; 56,43]
2º Semestre de 2010 Observação: Intervalos de confiança podem ser obtidos para outros parâmetros como por exemplo: Uma certa proporção: p ; Uma diferença de proporções : p 1 p 2 ; Uma Variância: σ 2 2 Razão de Duas Variâncias: σ 12 / σ 2 Estes intervalos não serão apresentados neste curso mas podem ser vistos em Mongtomery e Runger (2009).