GET008 - Estatística II Lista de Exercícios Inferência para uma população Profa. Ana Maria Farias. Seja X, X,, X 6 uma amostra aleatória simples de tamanho 6 de uma população Nµ; σ. Determine o valor da constante C tal que σ = C [X X + X 3 X 4 + X 5 X 6 ] seja um estimador não viesado de σ. Temos que provar que E σ = E Como as X i s são iid, segue que [ C X X + X 3 X 4 + X 5 X 6 ] = σ EX i X i+ = EX i + EX i+ EX ix i+ = VarX i + [EX i ] + VarX i+ + [EX i+ ] EX i EX i+ = σ + µ + σ + µ µ µ = σ Logo, E σ = σ C [ 3 σ ] = σ C = 6. Seja X, X,, X n uma amostra aleatória simples de uma população X Poiλ. Determine o valor da constante C tal que λ = C [X X X + X X X 3 + + X n X n X n ] seja um estimador não viesado de λ. Temos que provar que E λ = EC [X X X + X X X 3 + + X n X n X n ] = λ Como as X i s são iid, segue que E [X i X i X i+ ] = EX i EX i X i+ = EX i EX i EX i+ = EX i [EX i ] = VarX i = λ Logo, E λ = λ Cn λ = λ C = n 3. Suponha que Γ e Γ sejam estimadores independentes e não viesados para um parâmetro γ, com variâncias σ e σ, respectivamente. a Mostre que Γ = aγ + aγ é também um estimador não viesado de γ. b Ache o valor de a que minimiza a variância de Γ.
a EΓ = E[aΓ + aγ ] = a EΓ + a EΓ = aγ + aγ = γ b Como Γ e Γ são independentes, resulta que Varγ = a VarΓ + a VarΓ = a σ + a σ Derivando em relação a a obtemos d Varγ da = 0 aσ aσ = 0 a = σ σ + σ d Varγ da = σ + σ > 0 mínimo! 4. Suponha que Γ e Γ sejam estimadores independentes e não viesados para um parâmetro γ, tais que a variância de Γ é o dobro da variância de Γ. A partir desses estimadores constrói-se um novo estimador Γ = a Γ + a Γ. Determine os valores das constantes a e a para que Γ seja não viesado para estimar γ e tenha variância mínima. EΓ = γ E[a Γ + a Γ ] = γ a γ + a γ = γ a + a = Como Γ e Γ são independentes, resulta que Varγ = a VarΓ + a VarΓ = a σ + a σ = 4a + 3a σ Derivando em relação a a obtemos d Varγ da = 0 6a 4σ = 0 a = 3 a = 3 d Varγ da = 6σ > 0 mínimo! 5. O Diretório Acadêmico DA do seu curso deseja realizar uma pesquisa entre os alunos sobre o nível de satisfação com o horário de funcionamento da biblioteca. Você vai ajudar o DA a planejar a pesquisa e analisar os resultados. a Calcule o tamanho da amostra necessário para se estimar a verdadeira proporção de alunos satisfeitos com o horário de funcionamento da biblioteca, com margem de erro 0,08 e nível de confiança de 99%. b Querendo garantir que a amostra não seja desnecessariamente grande por causa dos custos envolvidos, você faz uma pesquisa piloto que aponta uma proporção de apenas 8% de alunos satisfeitos com o horário de funcionamento da biblioteca. Calcule o novo tamanho de amostra, incorporando essa informação auxiliar. c Seguindo suas diretrizes, o DA realiza uma pesquisa com 0 alunos, obtendo nessa amostra 67 alunos satisfeitos com o horário de funcionamento da biblioteca.
Construa um intervalo de 99% de confiança para a verdadeira proporção de alunos satisfeitos com o horário de funcionamento da biblioteca. a ε = 0, 08 α = 0, 99 z 0,005 =, 58 0, 5.0, 5 0, 08 =, 58 n = n, 58 0, 5 = 6, 5 n 6 0, 08 0, 8.0, 7 b 0, 08 =, 58, 58 n = n 0, 08 0, 8.0, 7 = 4, 48 n 0 c p = 67 = 0, 39 0 0, 39.0, 68 ε =, 58 = 0, 083 0 Intervalo de confiança: 0, 39 0, 083 ; 0, 39 + 0, 083 = 0, 36 ; 0, 40 6. Seja X, X,, X 9 uma amostra aleatória simples de tamanho 9 de uma população X Nµ;. Calcule a P X µ b P X µ a P X µ = P Z = Φ0, 5 Φ 0, 5 = Φ0, 5 [ Φ0, 5] = 0, 695 = 0, 3830 b P X µ = P X µ 3 3 [ Φ, 5] = 0, 933 = 08664 = P Z, 5 = Φ, 5 Φ, 5 = Φ, 5 7. Seja X, X uma amostra aleatória simples de uma população X N0; σ. Calcule a P X + X σ b P X + X σ X i N0, σ Xi χ σ X, X independentes X a P X + X σ = Pχ b P X + X σ = Pχ σ + X σ χ = 0, 393469 = 0, 63 3
8. Suponha que uma amostra aleatória simples de tamanho seja retirada de uma população X N0; σ ; suponha, também, que x = 0, 75 e x = 0, 6. Quão confidentes podemos estar em que a σ, 0? b σ 0, 44? c σ, 7909? a Queremos que σ 0, 44, ou equivalentemente, de confiança é σ. Logo, nosso nível 0, 44 X P σ + X 0, 588 = Pχ σ, 386374 = 0, 50 0, 44 X b P σ + X 0, 588 = Pχ σ 0, 575384 = 0, 5, 0 X c P σ + X 0, 588 = Pχ σ 0, 07 = 0, 0, 7909 Veja Figura, onde se ilustram os três níveis de confiança calculados. Figura Níveis de confiança para o Exercício 8 9. Determinada característica populacional é descrita por uma distribuição normal. Uma amostra de 5 observações resultou nas seguintes estimativas: x = 5 s = 5, 9 Obtenha o intervalo de confiança L, L para a média populacional de modo que, à desconfiança de que µ < L seja atribuída probabilidade de % e à desconfiança de que µ > L seja atribuída probabilidade 0,%. Esse é um intervalo de confiança assimétrico. A ideia aqui é distribuir o erro de forma assimétrica; veja a Figura. Temos, então: 4
Figura Intervalo de confiança assimétrico P, 49 t 4 3, 47 = 0, 989 P P 3, 47S X 5 µ X +, 49S 5, 49S 5 = 0, 989 X µ 3, 47S 5 = 0, 989 Para a amostra dada, o intervalo de confiança assimétrico é 3, 47 5, 9, 49 5, 9 5 ; 5 + = 0, 9054 ; 7, 938 5 5 0. Seja X, X,, X 0 uma amostra aleatória simples de tamanho 0 de uma população X Nµ; σ. Calcule P X µ S em que S = 0 9 i= X i X 0 X µ S t 9. Logo, X µ P X µ S = P S X µ = P 0 S 0 = Pt 9 0 }{{} = 0, 99446 Minitab. A produção mensal de vacas leiteiras de Iowa é de aproximadamente 78 litros de leite por vaca. Para avaliar o efeito de uma onda de calor prolongada sobre a produção de leite, obteve-se uma amostra aleatória de vacas leiteiras de Iowa e a produção mensal no verão de leite em litros para cada uma é apresentada na tabela que segue. 70 699 7 73 7 70 77 76 703 74 77 708 75 7 78 77 7 77 73 77 74 74 73 79 5
a Há alguma evidência que sugira que a verdadeira produção média mensal de leite por vaca tenha decrescido? Use α = 0, 05. Se o teste for significante, você acredita que o calor tenha causado esse decréscimo? b Ache limites para o valor P associado a esse teste de hipótese. Obs.: 4 i= = 7 6 4 i= x i = 7 089 x = 76 = 75, 04 4 S = ] [7089 76 = 54, 7373 3 4 a H 0 : µ = 78 H : µ < 78 Estatística de teste: T 0 = 4 X 78 t 3 S Região crítica: T 0 < t 3;005 ou T 0 <, 74 Valor observado da ET: t 0 = 75, 04 78 4 =, 9588 <, 74 54, 7373 Rejeita-se H 0, ou seja, há evidências de que houve redução na produção leiteira. No entanto, não se pode dizer que o calor causou essa redução, uma vez que não foi feito um experimento planejado. Outros fatores que não foram controlados podem ter afetado a produção de leite. b P = Pt 3 <, 9588 0, 03 < P < 0, 04 Valor exato Minitab: P = 0, 96885 = 0, 0385. A educação em casa está se tornando muito popular nos Estados Unidos e muitas faculdades tentam atrair estudantes desse grupo. Há evidência de que aproximadamente 90% de todas as crianças que estudaram em casa vão para a faculdade. Para verificar essa afirmativa, obteve-se uma amostra aleatória de 5 crianças que estudaram em casa e verificou-se que 89 frequentaram a faculdade. a Verifique os critérios de simetria. Um teste de hipótese de grandes amostras sobre p é apropriado? b Realize o teste apropriado para determinar se a proporção de crianças que estudaram em casa que frequentaram a faculdade é diferente de 0,90. Use α = 0, 05. c Calcule o valor P associado a esse teste. p = proporção das crianças que vão para a faculdade dentre as que estudaram em casa 6
a p = 89 = 0, 84 0, 9 5 = 0, 5 > 5 0, 5 =, 5 > 5 5 Condições OK! b H 0 : p = 0, 90 H : p 0, 90 Estatística de teste: Z 0 = 5 P 0, 90 0, 9 0, N0; z 0,05 =, 96 Região crítica: Z 0 >, 96 Valor observado da ET: z 0 = 0, 84 0, 90 5 = 3, 0 <, 96 0, 9 0, Rejeita-se H 0 ; há evidências de que a proporção seja diferente de 0,90. c P = PZ < 3 = [ Φ3] = 0, 007 3. Considere a seguinte amostra aleatória de 6 observações de uma população que se alega ser normal com variância de 36,8. 33, 6, 0,3 47,6 3,9 3,8 35,9 3,4 49,4 07,4 3,8 3, 0,7 9,6 4,5 9,3 a Na figura a seguir apresenta-se a saída do Minitab para o teste de Anderson- Darling. O que se pode dizer sobre a normalidade dos dados? b Faça o teste apropriado sobre a variância populacional. c Ache limites para o valor P associado a esse teste de hipótese. Obs.: 6 i= = 3703, 9 6 i= x i = 85907, 65 a As hipóteses do este de Anderson-Darling são H 0 : os dados vêm de uma população normal H : os dados não vêm de uma população normal Como o valor P = 0, 37 é grande, não se rejeita H 0, ou seja, há evidências de que os dados vêm de uma população normal. 7
b Agora vamos fazer o teste sobre a variância. A variância amostral é S = 3703, 9 85907, 65 = 05, 8639. 5 6 Note que na saída do Minitab é dado o desvio padrão amostral. H 0 : σ = 36, 8 H : σ 36, 8 Estatística de teste: χ0 = 5S 36, 8 χ 5 Região crítica: χ0 < 6, 6 ou χ 0 > 7, 488 5 05, 8639 Valor observado da ET: c 0 = = 43, 5 > 7, 488 36, 8 Rejeita-se H 0 ; há evidências de que a variância seja diferente de 36,8. c P = Pχ5 > 43, 5. Pela tabela podemos dizer que P < 0, 00. O valor exato, pelo Minitab, é P = 0, 99985 = 0, 00098. 4. Sabe-se que os diâmetros de parafusos têm distribuição normal com desvio padrão de 0,000 in. Uma amostra aleatória simples de 0 parafusos acusou uma média de 0,546 in. a Teste a hipótese de que o verdadeiro diâmetro médio dos parafusos é igual a 0,55 in, com nível de significância de 0,05. b Qual o tamanho de amostra necessário para se detectar um verdadeiro diâmetro médio de 0,55 in com probabilidade de pelo menos 0,90? X = diâmetro em polegadas X Nµ; 0, 000 n = 0 x = 0, 546 a H 0 : µ = 0, 55 H : µ 0, 55 Estatística de teste: Z 0 = X 0, 55 0 N0; 0, 000 Região crítica: Z 0 >, 96 Valor observado da ET: z 0 = 0, 546 0, 55 0 =, 65 <, 96 0, 000 Rejeita-se H 0 ; há evidências de que o diâmetro médio seja diferente de 0,55 polegada. 8
b Queremos π0, 55 0, 90 π = 0, 90 z π =, 64 [ ] zα/ z π σ [ ], 96, 64 0, 000 n δ = = 3, 4 n 4 0, 55 0, 55 Note que a amostra tem tamanho n = 0. Logo, para essa amostra, π0, 55 > 0, 90. De fato: Prejeitar H 0 µ = 0, 55 = P, 96 X 0, 55 0 0, 000 = P = P, 96 0, 96 0, 96 µ = 0, 55 X 0, 55 + 0, 55 0, 55, 96 µ = 0, 55 0, 000 0, 000 0, 000 Z, 96 0, 000 0 0, 000 = P 8, 8 Z 4, 36 0 = > 0, 90 5. O gerente de um mercado acha que a maioria dos seus clientes gasta pelo menos 50 reais em qualquer visita feita à loja. Muitos de seus preços são decididos com base nessa suposição. Ele decide testá-la com uma amostra de 50 clientes, cujos gastos em ordem decrescente são exibidos a seguir. O que os dados revelam sobre o problema em pauta? a Para responder a essa questão, formule e resolva o teste de hipótese apropriado, usando um nível de significância de 5%. Certifique-se de definir o parâmetro envolvido, a estatística de teste, os resultados utilizados e estabelecer as conclusões em linguagem apropriada. b Calcule o valor P. 89,0 75,00 68,0 65,00 65,00 6,50 6,50 6,00 60,50 60,00 60,00 59,80 56,70 55,40 53,60 5,0 5,00 5,40 5,0 5,00 50,00 50,00 49,80 45,60 45,0 44,80 44,70 43,00 4,50 40,00 35,50 35,00 34,80 34,50 33,0 3,80 30,90 30,50 9,80 8,0 5,0 5,00,80,00 9,50 8,60 7,40 6,30 5,0 5,00 xi = 86, 60 x i = 0349, 56 x = 86, 6 50 = 43, 73 s = 49 0349, 56 86, 6 = 300, 536 s = 7, 3353 50 a H 0 : µ = 50 H : µ < 50 Estatística de teste: Z 0 = 50 X 50 N0; S Região critica: Z 0 <, 64 Valor observado da ET: z 0 = 43, 73 50 50 =, 5567 <, 64 7, 3353 Rejeita-se H 0 ; há evidências de que os clientes gastam menos de 50 reais. b P = PZ, 56 = Φ, 56 = Φ, 56 = 0, 005 6. A Associação de Tecnologia dos Motoristas, no Reino Unido, estudou, recentemente, o comportamento de motoristas que usam ou não detectores de radar. Obteve-se uma 9
amostra aleatória de 50 usuários e 56 não usuários de detectores. Nos últimos três anos, 08 usuários e 68 não usuários tinham se envolvido em acidentes. a Ache um intervalo de confiança de 99% para a verdadeira proporção de usuários de detector de radar que tiveram um acidente nos últimos três anos. b Ache um intervalo de confiança de 99% para a verdadeira proporção de não usuários de detector de radar que tiveram um acidente nos últimos três anos. c Há alguma evidência que sugira que as duas verdadeiras proporções sejam diferentes? Justifique sua resposta. Usuários de detector n = 50 p U = 08 = 0, 43 50 50 0, 43 = 08 5 50 0, 568 = 4 5 Usuários de detector n = 56 p U = 68 = 0, 56 56 0, = 68 5 56 0, = 494 5 Podemos usar a aproximação normal para as duas amostras. a Usuários: 0, 43 0, 568 ε =, 58 = 0, 08 50 I.C.: [0, 43 0, 08 ; 0, 43 + 0, 08] = [0, 35 ; 0, 53] b Não suários: 0, 0, 879 ε =, 58 = 0, 035 56 I.C.: [0, 0, 035 ; 0, + 0, 035] = [0, 086 ; 0, 56] c Como os intervalos de confiança não se sobrepõem, há indícios de que as proporções de usuários e não usuários que sofreram acidente nos últimos 3 anos sejam diferentes. 7. O sindicato de caminhoneiros informa que a quantidade média de combustível diesel comprado por semana é 330 litros, com desvio padrão de 68, litros. Essas informações são usadas pelos gerentes de postos de parada de caminhões para planejar esquemas de trabalho e suprimento do combustível. Manoel, gerente de um grande posto, resolve fazer um levantamento para verificar se as compras de diesel por caminhoneiros no seu posto seguem o padrão geral indicado pelo sindicato. Na tabela que segue estão os dados de uma amostra aleatória simples de 0 caminhoneiros. Suponha que o consumo possa ser bem aproximado por um modelo normal. Você vai ajudar Manoel nesse processo de decisão. 83 4 37 34 6 98 98 355 38 87 344 53 34 34 98 344 98 95 355 3 0
0 Obs.: x i = 5 978 i= 0 i= x i = 33 780 63 a Formule esse problema em termos de testes de hipóteses, especificando as hipóteses nulas e alternativas. b Estabeleça as regiões críticas para um nível de significância α = 0, 05. c Quais são as conclusões do gerente? Certifique-se de interpretar seus resultados no contexto do problema. d Estabeleça intervalos que contenham os verdadeiros valores P. e Construa intervalos de confiança para a média e para a variância da quantidade de diesel comprada por caminhoneiros no posto do Manoel. Use o nível de confiança de 95%. X =compras de diesel no posto do Manoel X Nµ; σ x = 5978 = 98, 9 s = 3378063 5978 = 989, 884 s = 44, 6 0 9 0 Inferência sobre a média H 0 : µ = 330 H : µ 330 Estatística de teste: T 0 = 0 X 330 t 9 S Região crítica: T 0 >, 093 Valor observado da ET: t 0 = 98, 9 330 0 = 3, 8 <, 093 44, 6 Rejeita-se H 0 : há evidências de que a quantidade média de combustível comprada no posto do Manoel seja diferente de 330 litros. 44, 6 Margem de erro: ε =, 093 = 0, 8779 0 Intervalo de confiança: 98, 9 0, 8779 ; 98, 9 + 0, 8779 Note que 330 não está no intervalo de confiança. Inferência sobre a variância H 0 : σ = 68, H : σ 68, Estatística de teste:χ0 = 9S 68, χ 9 Região crítica: χ0 < 8, 907 ou χ 0 > 3, 85 Valor observado da ET: c0 9 989, 884 = 68, = 8, 54 < 8, 907 Rejeita-se H 0 : há evidências de que o desvio padrão da quantidade de combustível comprada no posto do Manoel seja diferente de 68, litros. 9 989, 884 9 989, 884 Intervalo de confiança para a variância: ; = 3, 85 8, 907 50, 853 ; 444, 788 Intervalo de confiança para o desvio padrão: 33, 94 ; 65, 56. Note que 68, litros não está no intervalo de confiança para o desvio padrão.