Centro de Ciências e Tecnologia Agroalimentar - Campus Pombal Disciplina: Estatística Básica - 203 Aula Professor: Carlos Sérgio UNIDADE 7 - TESTES DE HIPÓTESES (NOTAS DE AULA) Hipótese Nula e Hipótese Alternativa Consideraremos aqui problemas estatísticos envolvendo um parâmetro θ cujo valor é desconhecido mas deve cair dentro de um certo domínio Ω (isto é, Ω é o conjunto de todos os possíveis valores de θ). Vamos supor que Ω possa ser particionado em 2 (dois) subconjuntos distintos Ω 0 e Ω, e que o pesquisador deva decidir se o valor desconhecido de θ cai em Ω 0 ou em Ω. Seja H 0 a hipótese de que θ Ω 0 e H a hipótese de que θ Ω, isto é: H 0 : θ Ω 0 H : θ Ω Como Ω 0 e Ω são disjuntos (Ω 0 Ω = Ω), somente uma das hipóteses é verdadeira. O pesquisador deve decidir se aceita H 0 ou se aceita H. Um problema desse tipo é chamado um problema de teste de hipóteses. H 0 é denominada hipótese nula, e H é denominada hipótese alternativa 2 Região Crítica do teste Antes de decidir se aceita ou não a hipótese nula, observa-se uma amostra aleatória X, X 2,..., X n. Seja S o espaço amostral, isto é, o conjunto de todos os possíveis resultados da amostra. Especifica-se um procedimento de teste que consiste em dividir o espaço amostral em dois subconjuntos: Um deles consiste dos valores da amostra para o qual ele rejeita H 0, Outro contém os valores para o qual se rejeita H. O subconjunto para o qual H 0 será rejeitada é chamada região crítica do teste. O complemento da região crítica contém todos os possíveis valores para qual H 0 será aceita.
3 Erros do Tipo I e erros do Tipo II Quando estabelecemos um procedimento do teste, podemos incorrer em dois tipos de erros: O de rejeitar H 0 quando ela é de fato verdadeira. Este erro é denominado erro do tipo I. A probabilidade (α) deste tipo de erro ocorrer é controlada pelo pesquisador e é denominada nível de signicância do teste. O de aceitar H 0 quando ela é falsa. Este erro é denominado erro do tipo II. A probabilidade deste erro ocorrer é representada por β Tabela : Representação dos erros do tipo I e II. H 0 é verdadeira H 0 é falsa aceita H 0 α (coef. de confiança) β rejeita H 0 α (nível de significância) β (poder do Teste) 4 Teste da hipótese para média populacional µ 4. σ conhecido H 0 : µ = µ 0 H : µ µ 0 ou µ < µ 0 ou µ > µ 0 - Retira-se uma amostra de tamanho "n"e calcula-se x. 2 - Calcula-se o valor da estatística Z = x µ 0 σ/ n 3 - Sob a hipótese nula, tem-se que Z possui uma distribuição normal padrão. Portanto, Rejeita-se H 0 se Z > Z α/2 (isto é, se Z < Z α/2 ou Z > Z α/2 ) Aceita-se H 0 se Z < Z α/2 (isto é, se Z α/2 Z Z α/2 ) em que α é o nível de significância do teste. 2
Exemplo: O salário médio dos empregados das indústrias siderúrgicas é de 2,5 salários mínimos, com um desvio padrão de 0,5 salários mínimos. Se uma firma particular emprega 49 operários com um salário médio de 2,3 salários mínimos, podemos afirmar que essa indústria paga salários inferiores, ao nível de 5%? 4.2 σ desconhecido H 0 : µ = µ 0 H : µ µ 0 ou µ < µ 0 ou µ > µ 0 Calcula-se a estatística t = x µ 0 S/ n Sob a hipótese nula, tem-se que t possui uma distribuição t-student com n graus de liberdade. Portanto, Rejeita-se H 0 se t > t α/2;(n ) Aceita-se H 0 se t t α/2;(n ) Observação Se os testes tiverem uma hipótese alternativa unilateral (isto é, se H : µ > µ 0 ou H : µ < µ 0 ) o teste deverá rejeitar unilateralmente (isto é, se t > t α;(n ) ou t < t α;(n ), respectivamente) Exemplo: Um fabricante afirma que seus cigarros contém não mais que 30 mg de nicotina. Uma amostra de 25 cigarros fornece média de 3,5 mg e desvio padrão de 3 mg. Ao nível de 5%, os dados refutam ou não a afirmação do fabricante? 5 Teste para Proporção Suponha que se deseje testar a hipótese: H 0 : p = p 0 H : p p 0 ou p < p 0 ou p > p 0 Calcula-se a estatística Z = ˆp p 0 p 0 ( p 0 ) n Rejeita-se H 0 se Z > z α/2 Aceita-se H 0 se Z z α/2 3
Exemplo: De um grande lote de CD s produzidos tiramos uma amostra de 240 CD s e observamos que 6 apresentavam problemas. Com esse resultado, pode-se concluir que a proporção de CD s com problemas no lote é inferior a 3%? (use 5% de significância). 6 Teste de hipótese para variância Suponha que uma variável seja normalmente distribuída com uma variância desconhecida e se deseje efetuar o seguinte teste de hipóteses: H 0 : σ 2 = σ 2 0 H : σ 2 σ 2 0 ou σ2 < σ 2 0 ou σ2 > σ 2 0 Calcula-se a estatística X 2 = (n )s2 σ 2 0 Rejeita-se H 0 se X 2 < χ 2 α/2,[n ] ou X2 > χ 2 α/2,[n ] Aceita-se H 0 se χ 2 α/2,[n ] X2 χ 2 α/2,[n ] Observações - Se a hipótese alternativa fosse H : σ 2 > σ 2 0 H 0 seria rejeitada se X 2 > χ 2 α,[n ] 2 - Se a hipótese alternativa fosse H : σ 2 < σ 2 0 H 0 seria rejeitada se X 2 < χ 2 α,[n ] Exemplo: Uma das maneiras de manter sob controle a qualidade de um produto é controlar a sua variabilidade. Uma máquina de encher pacotes de café está regulada para enchê-los com média de 500 g e desvio padrão de 0 g. Colheu-se uma amostra de 6 pacotes e observou-se uma variância s 2 = 69g 2. Supondo que o peso de cada pacote segue uma distribuição normal, você diria que a máquina está desregulada com relação à variância? Solução: Deseja-se testar: A estatística a ser calculada é: H 0 : σ 2 = 00 H : σ 2 00 4
X 2 (n )s2 = σ0 2 = (5)(69) 00 = 25, 35 e o procedimento do teste é: Aceita-se H 0 se χ 2 α/2,[n ] X2 χ 2 α/2,[n ] isto é, Aceita-se H 0 se 6, 262 X 2 27, 488, e Rejeita-se H 0 sex 2 < 27, 488 ou X 2 > 27, 488 Portanto, aceita-se H 0, e concluímos que a máquina não está desregulada quanto à variância. 7 Teste da hipótese da igualdade de duas médias Suponha que se tenha H 0 : µ = µ 2 H : µ µ 2 ou µ > µ 2 ou µ < µ 2 7. σ 2 e σ2 2 conhecidas calcula-se a estatística Z = x x 2 σ 2 n + σ2 2 n 2 Sabe-se que, sob a hipótese H 0, a variável Z possui uma distribuição normal padrão. Portanto, o procedimento do teste consiste em: Rejeita-se H 0 se Z > Z α/2 Aceita-se H 0 se Z Z α/2 7.2 σ 2 e σ2 2 desconhecidas Suponha que a hipótese de igualdade de variâncias não seja rejeitada. Então podemos supor que σ 2 = σ2 2, mas esta variância comum não é conhecida. Para efetuar o teste de igualdade de médias, neste caso, procedemos da seguinte maneira: 5
t = x x 2 + n n 2 (n )S 2+(n 2 )S2 2 n +n 2 2 Esta estatística possui uma distribuição t-student com n +n 2 2 graus de liberdade. Portanto. Rejeita-se H 0 se t > t α/2;n +n 2 2 Aceita-se H 0 se t t α/2;n +n 2 2 8 Teste de hipótese da diferença entre proporções Suponha que se tenha H 0 : p = p 2 H : p p 2 ou p > p 2 ou p < p 2 Como µˆp ˆp 2 = p p 2 = 0 (sob H 0 ) e σ 2ˆp A ˆp B = p q em que é adotado como estimativa de p. Calcula-se e aceita-se H 0 se Z Z α/2 P = n ˆp + n 2 ˆp 2 n + n 2 Z = ˆp ˆp 2 σˆp ˆp 2 n + p 2q 2 ) n 2 = pq( n + n 2 (sob H 0 ) 9 Teste da razão de variâncias Suponha que se deseje testar: H 0 : σ 2 = σ 2 2 ou, equivalentemente, H : σ 2 σ 2 2 H 0 : σ2 σ 2 2 H : σ2 σ 2 2 = 6
O procedimento do teste é: Calcula-se a estatística f = s2 s 2 2 Vimos que, sob a hipótese H 0, a estatística f possui uma distribuição F com n e n 2 graus de liberdade. Portanto, Aceita-se H 0 ao nível de significância α se F α/2,[n2 ],[n ] f F α/2,[n ],[n 2 ] Rejeita-se H 0 ao nível de significância de α se f < F α/2,[n2 ],[n ] ou f > F α/2,[n ],[n 2 ] Exemplo: Uma das maneiras de medir o grau de satisfação dos empregados de uma mesma categoria quanto à política salarial é por meio do desvio padrão de seus salários. A fábrica A diz ser mais coerente na política salarial do que a fábrica B. Para verificar essa afirmação, sorteou-se uma amostra de 0 funcionários não especializados de A, e 5 de B, obtendo-se as variâncias s 2 A = 000 reais e s2 B = 600 reais. Qual seria a sua conclusão ao nível de 5%? Solução: A hipótese a ser testada é: H 0 : σ 2 A = σ 2 B Temos que: H : σ 2 A < σ 2 B f = s2 A s 2 = 000 = 0, 625 B 600 Devemos aceitar H 0 ao nível de significância α = 0, 05 se ou seja, se f F 0,05,[4],[9] f 0, 33 Como este é o caso, aceitamos H 0 ao nível de significância de 0,05, e concluímos que a fábrica A não é mais coerente na política salarial do que a fábrica B.. 7
Exercícios. Sabe-se que o consumo mensal per capita de determinado produto tem distribuição normal, com desvio padrão de 2 kg. A diretoria da empresa que fabrica esse produto resolveu que retiraria o produto da linha de produção se a média de consumo per capita fosse menor do que 8 kg, caso contrário, continuaria a fabricá-lo. Foi realizado uma pesquisa de mercado, tomando-se uma amostra aleatória de 25 pessoas e verificou-se um consumo total de 80 kg do produto. Construa um teste de hipótese adequado para verificar a hipótese acima a um nível de significância de 2,5% e diga qual deve ser a decisão a ser adotada pela empresa? 2. Ao final de 90 dias de uma dieta alimentar envolvendo 25 pessoas, constatou-se o seguinte ganho médio de peso de 40g, e desvio padrão de,378g. Supondo que o ganho de peso médio dessas pessoas é de 45g, teste a hipótese para α = 5%, se esse valor é o mesmo. 3. Um processo de fabricação de arame de aço dá um produto com resistência média de 200 psi. O desvio padrão é de 20 psi. O engenheiro de controle de qualidade deseja elaborar um teste que indique se houve ou não variação na média do processo, usando uma amostra de 25 arames obteve-se uma média de 285 psi. Use um nível de significância de 5%. 4. Suponha que alguém tenha sugerido de experiências passadas que 60% das larvas de mosquito num certo lago deveriam ser da espécie Aedes detritus. Foram encontrados 60 desse tipo de uma amostra de 80. Os dados suportam esta hipóteste? Use α = 5% 5. As condições de mortalidade de uma região são tais que a proporção de nascidos que sobrevivem até 60 anos é de 0,6. Testar essa hipótese ao nível de 2%, se em 000 nascimentos amostrados aleatoriamente, verificou-se 530 sobreviventes até 60 anos. 6. Observou-se a produção mensal de uma indústria durante alguns anos e verificou-se que ela obedecia a uma distribuição normal com variância igual a 300 u 2. Foi adotada então uma nova técnica de produção e durante um período de 24 meses observou-se a produção mensal. Após este período constatou-se que a variância foi de 400 u 2. Há motivos para se acreditar que houve alteração na variância ao nível de 0%? 7. Uma amostra de dez elementos extraída de uma população suposta normal forneceu variância igual a 2,4. Pergunta-se: esse resultado é suficiente para se concluir, ao nível α = 5% de significância, que a variância dessa população é inferior a 25? 8. Para verificar se a variabilidade das espessuras de um tipo de disco metálico é inferior a 3 mm, considerou-se uma amostra de 25 desses discos e obteve-se uma estimativa para o desviopadrão de,8 mm. Com este resultado, qual seria a conclusão a respeito da variabilidade das espessuras? (use α = 5%) 9. Uma amostra de 0 lâmpadas elétricas, da marca A, apresentou a vida média de 400 horas e uma amostra de 20 lâmpadas elétricas, da marca B, apresentou a vida média de 200 horas. Suponha que os desvios padrões populacionais dos tempos de vida das lâmpadas das duas marcas sejam conhecidos e iguais a 20 e 00, respectivamente. Teste, ao nível de significância de %, a hipótese que as duas marcas produzem lâmpadas com o mesmo tempo médio de vida. 0. Sendo Testar a igualdade das duas média usando α = 5% 8
Amostra n = 60 x = 5, 7 σ 2 = 43 Amostra 2 n 2 = 35 x 2 = 4, 2 σ2 2 = 28. Duas fábricas devem ser comparadas em relação ao tempo gasto por seus trabalhadores para executar determinada tarefa. Na fábrica A são considerados 5 trabalhadores e são obtidos um tempo médio estimado de 2 min e um desvio padrão de 2 min. Na fábrica B são considerados 20 trabalhadores e o tempo médio obtido é de 0 min e o desvio padrão é de 3 min. Sabendo-se que o tempo de execução da tarefa tem a mesma variabilidade nas duas fábricas, pode-se considerar que os trabalhadores da fábrica B são mais rápidos que os da A?(use α = 0, 05) 2. Duas técnicas de vendas são aplicadas por dois grupos de vendedores: a técnica A, por 2 vendedores, e a técnica B, por 5 vendedores. Espera-se que a técnica B produza melhores resultados que a técnica A. No final de um mês, os vendedores de A venderam uma média de 68 ítens, com uma variância de 50, enquanto que os vendedores de B venderam uma média de 76 ítens com uma variância de 75. Testar, ao nível de significância de 5%, se a técnica B é realmente melhor que a técnica A. 3. Uma amostra de 370 azulejos tirados da produção de um dado dia acusou 9 azulejos com defeito. Numa amostra de 65 azulejos da produção do dia seguinte havia 5 azulejos com defeito. Há razões estatísticas válidas para se afirmar que nesse segundo dia a produção tenha piorado? (Use nível de 5% de significância). 4. Uma empresa de pesquisa de opinião seleciona, aleatóriamente, 300 eleitores de São Paulo e 400 do Rio de Janeiro, e pergunta a cada um se votará ou não num determinado candidato nas próximas eleições. 75 eleitores de SP e 20 do RJ responderam afirmativo. Há diferença entre as proporções de eleitores favoráveis ao candidato naqueles dois Estados? (use α = 0, 0) 5. Dois programas de treinamento de funcionários foram efetuados. Os 2 funcionários treinados no programa antigo apresentaram uma variância de 46 pontos em sua taxa de erro. No novo programa, funcionários apresentaram uma variância de 200. Sendo α = 0%, pode-se concluir que a variância é diferente para os dois programas? 6. O fabricante I de um tipo especial de aço afirma que, em relação à resistência à tração, seu produto é mais homogênio que o do fabricante II. Para verificar essa afirmação foi considerada uma amostra de cabos de aço do fabricante I e uma de 5 do II. As estimativas dos desvios padrões obtidas foram, respectivamente, 5 kg/cm e 8 kg/cm. Com esses resultados, qual seria a conclusão a respeito da afirmação do fabricante I? (Use nível de 2,5% de significância). 7. A Hudson Valley Boaling Company distribui um tipo de cerveja sem álcool em garrafas que indicam o conteúdo de 32 oz. O Bureau of Weights anel Measures seleciona aleatoriamente 26 dessas garrafas, mede seu conteúdo e obtém uma média amostral de 3,8 oz, com desviopadrão de 0,75 oz. Ao nível de 0,0 de significância, teste a afirmação do Instituto de que a companhia está ludibriando os consumidores. Deve-se formalizar uma queixa? 8. Estão em teste dois processos para fechar latas de comestíveis. Em duas seqüências de 000 latas, o processo gera 50 rejeições, enquanto o processo 2 acusa 200 rejeições. Pode ao nível de 5%, concluir que os dois processos sejam diferentes? 9
9. Em uma pesquisa de opinião, 32 dentre 80 homens declararam apreciar certa revista, acontecendo o mesmo com 26 dentre 50 mulheres. Ao nível de 5% de significância os homens e as mulheres apreciam igualmente a revista? 20. A variabilidade de dois produtos similares deve ser comparada. Coletam-se 5 observações do produto e 8 do produto 2. A amostra de produto apresenta S = 5, e a amostra de produto 2 apresenta S 2 = 8. Teste a hipótese de que as variâncias sejam as mesmas (considere α = 0, 0). 2. Um fornecedor de matéria-prima afirma que o teor de impureza de seu produto é 2,5%. 52 amostras são analisadas, sendo 8 delas classificadas como impuras. Conclua a respeito da hipótese do fornecedor (use α = 0, 05). 22. Um fabricante garante que 90% das peças que fornece a um cliente estão de acordo com as especificações exigidas. O exame de uma amostra aleatória de 200 destas peças revelou 25 fora das especificações. Verifique se aos níveis de 5% e % de significância se há exagero na afirmativa do fabricante. 23. Diversas políticas, em relação às filiais de uma rede de supermercados, estão associadas ao gasto médio dos clientes em cada compra. Deseja-se comparar estes parâmetros de duas novas filiais, através de duas amostras de 50 clientes, selecionados ao acaso, de cada uma das novas filiais. As médias obtidas foram 62 e 7 unidades monetárias. Supondo que os desvios padrões sejam idênticos e iguais a 20 um, teste a hipótese de que o gasto médio dos clientes não é o mesmo nas duas filiais. Utilize uma significância de 5%? 24. Em dois anos consecutivos foi feito um levantamento de mercado sobre a preferência dos consumidores por um determinado produto. No primeiro ano o produto era anunciado com frequência semanal nos veículos de comunicação e no segundo ano com frequência mensal. No levantamento foram utilizados duas amostras independentes de 400 consumidores cada. No primeiro ano o percentual de compradores ficou em 33% e no segundo ano em 29%. Considerando o nível de significância de 5%, teste a hipótese de que a frequência do anúncio tem influência na manutenção da fatia de mercado. 25. Uma agência de empregos alega que os candidatos por elas colocados nos últimos 6 meses têm salários de R$ 9.000,00 anuais, em média. Uma agência governamental extraiu uma amostra aleatória daquele grupo, encontrando um salário médio de R8.000,00, com desviopadrão de R$.000,00 com base em 30 empregados. Teste a afirmação da agência, contra a alternativa de que o salário médio é inferior a R$ 9.000,00, ao nível de significância de 0,05. 26. Um pesquisador deseja saber se a média da ingestão calórica diária em população rural de um país desenvolvido é menor do que 2000 calorias, valor considerado como ideal. Estudando 500 pessoas, obteve média de 985 e desvio padrão de 20. Realize o teste de hipótese.(use α = 3%) 27. Um pesquisador quis determinar os efeitos de um programa orientado de exercícios de longa duração em uma empresa. Os dados foram coletados de 3 pessoas que participavam voluntariamente do programa de exercícios e que praticavam atividade física por uma média de 3 anos. O grupo controle foi formado por 7 pessoas. A variável resposta medida foi o número de vezes que as pessoas se erguiam em 30 segundos. O grupo de exercícios teve uma média de 2.0 e um desvio padrão de 4.9. O grupo controle teve média de 2. e desvio 0
padrão de 5.6. Assumindo que as duas populações têm distribuição normal e que as variâncias populacionais são iguais, realize o teste de hipóteses de que as médias são iguais. (use α = 5%) 28. Estudos sobre mortalidade de homens com idade superior a 65 anos de uma cidade mostram que 4% deles morrem dentro de um ano. Num grupo de 000 indivíduos selecionados dessa população, 60 morreram no período de um ano. Suspeita-se de que houve um aumento da mortalidade anual nessa população. (use α = 5%) 29. Um restaurante compra frangos abatidos inteiros com peso médio de 3 quilos há vários anos de um fornecedor. Outro fornecedor propõe ao gerente do restaurante vender frangos com peso médio maior que 3 quilos ao mesmo preço do fornecedor antigo. Antes de mudar de fornecedor, o gerente do restaurante decidiu comprar 25 frangos do novo fornecedor e pesálos. Encontrou um peso médio de 3,2 quilos com um desvio padrão de 0,4 quilos. (use α = 2, 5%) 30. Uma fábrica de automóveis anuncia que seus carros consomem, em média, litros por 00 km, com desvio padrão de 0,8 litro. Uma revista resolve testar essas afirmação e analisa 35 automóveis dessa marca, obtendo,3 litros por 00 km como consumo médio (considerar distribuição normal). O que a revista pode concluir sobre o anuncio da fábrica, ao nível de 0%? 3. Um especialista em marketing de uma fábrica de massas acredita que 40% dos amantes de massas preferem lasanha. Se nove de 20 amantes de massas escolhem lasanha em vez de outras massas, o que podemos concluir sobre a afirmação? Use um nível de significância de 0,05. 32. Examinaram-se 2 classes de 4 e 5 alunos de um mesmo período de um curso. Na primeira, o grau médio foi de 7,4 com desvio padrão de 0,8. Na segunda, a média foi de 7,8, com desvio padrão de 0,7. Há uma diferença significativa entre os aproveitamentos das 2 classes ao nível de 5%? 33. Em um estudo para estimar a proporção de residentes em certa cidade e seus arredores que é a favor da construção de uma usina nuclear, descobriu-se que 63 de cem moradores da área urbana são a favor, enquanto somente 59 de 25 moradores dos arredores são a favor. Há uma diferença significante entre a proporção de moradores da área urbana e dos arredores que são a favor da construção da usina? (use α = %) 34. Deseja-se testar ao nível de 5% se duas populações têm as mesmas variâncias. Os dados obtidos nas amostras são: n = 0, s 2 = 5, 22, n 2 = 2 e s 2 2 = 6, 9. Qual a conclusão fornecida pelos dados? 35. A vida média das lâmpadas elétricas produzidas por uma empresa era de 20 horas. Uma amostra de 8 lâmpadas extraída recentemente apresentou a vida média de 070 horas, com desvio padrão de 25 horas. Testar a hipótese de que a vida média das lâmpadas não se alterou ao nível de %. 36. Uma amostra aleatória de cem registros de mortes nos Estados Unidos durante o ano passado mostrou uma expectativa de vida é de 7,8 anos. Assumindo um desvio padrão de 8,9 anos, isso parece indicar que a média da expectativa de vida hoje é maior do que 70 anos? Use um nível de significância de 0,05.