Exercício 1 (Estimação) Um agente de viagens deseja estimar a proporção de clientes satisfeitos com os serviços da agência. (a) Determine o tamanho da amostra necessário para que o erro cometido na estimação seja de, no máximo, 0,05, com probabilidade 0,9. Se há a informação de que a proporção de clientes satisfeitos é superior a 60%, é possível diminuir o tamanho amostral? Se sim, em quanto? Neste caso, γ = 0,9 z = A(0,95) = 1,64 ; ε = 0,05. Assim, temos que n = ( ) p(1 p) (, ) 0,5(1 0,5) = 268,96 269, Portanto, uma amostra de pelo menos 269 clientes garante a estimação com as condições pedidas. Se há a informação de que a proporção de clientes satisfeitos é superior a 60%, temos: n = ( ) p(1 p) (,, Há uma diminuição de 10 clientes na amostra. ) 0,6(1 0,6) = 258,2 259 (b) Numa amostra de 150 clientes, verificou-se que 120 estavam satisfeitos com os serviços da agência. Calcule a estimativa pontual da proporção de clientes satisfeitos. Construa um intervalo de confiança para essa proporção com coeficiente de confiança igual a 0,9. Seja p a proporção de ratos que se curam em até 14 dias. Uma estimativa pontual de p é p = 120 150 = 0,8. Neste caso, γ = 0,9 e, portanto, z = A(0,95) = 1,64. Sendo assim, p (1 p ) p (1 p ) IC(p; 98%) = (p z ; p + z ) n n 0,8 (1 0,8) 0,8 (1 0,8) = (0,8 1,64 ; 0,8 + 1,64 ) 150 150 = (0,746; 0,854) Página 1 de 7
Exercício 2 (Teste de hipótese I) Em pesquisa realizada em 2009, constatou-se que 25% dos alunos do IME não gostavam do mascote do instituto. Uma professora do Departamento de Estatística propôs um trabalho para seus alunos de estatística do primeiro ano: verificar se essa proporção aumentou. Para isso sugeriu uma pesquisa com 18 alunos selecionados aleatoriamente no IME. Desses, a metade afirmou não gostar do mascote. a) Estabeleça as hipóteses do teste. H: p = 0,25 (a proporção de alunos que não gostam do mascote se manteve.) A: p > 0,25 (a proporção de alunos que não gostam do mascote aumentou em relação à proporção observada em 2009) b) Interprete os erros de tipo I e tipo II do teste no contexto do problema. Erro de tipo I: Rejeitar H sendo H verdadeira, ou seja, concluir que a proporção de alunos que não gostam do mascote é superior a 25% sendo que, na realidade, essa proporção é igual a 25%. Erro de tipo II: Não rejeitar H sendo H falsa, ou seja, concluir que a proporção de alunos que não gostam do mascote é 25% sendo que, na realidade, essa proporção é superior a 25%. c) Construa a região crítica do teste usando um nível de significância de 2%. Baseando-se na amostra selecionada, qual é a conclusão? Seja X: número de alunos na amostra que não gostam do mascote do instituto. Se H for verdadeira, então b(18; 0,25). A seguir, é apresentada a tabela da distribuição de probabilidades de X. k Pr k Pr 0 5.637710E-03 0.0056 10 4.177800E-03 0.0042 1 3.382626E-02 0.0338 11 1.012800E-03 0.0010 2 9.584107E-02 0.0958 12 1.969333E-04 0.0002 3 1.703841E-01 0.1704 13 3.029744E-05 0.0000 4 2.129802E-01 0.2130 14 3.606838E-06 0.0000 5 1.987815E-01 0.1988 15 3.206078E-07 0.0000 6 1.435644E-01 0.1436 16 2.003799E-08 0.0000 7 8.203680E-02 0.0820 17 7.858034E-10 0.0000 8 3.760020E-02 0.0376 18 1.455192E-11 0.0000 9 1.392600E-02 0.0139 Precisamos de k tal que P(X k p = 0,25) 0,02, o mais próximo possível de 0,02. Página 2 de 7
Note que MAE116 Noções de Estatística P(X 8 p = 0,25) = 0,0569 e P(X 9 p = 0,25) = 0,0193. Assim, k = 9 e a região crítica do teste é RC={X 9}. Como foi observado X=9, então rejeitamos a hipótese nula ao nível de significância de 2% e, portanto, há evidências de que a proporção de alunos do IME que não gostam do mascote do instituto aumentou em relação ao ano de 2009. Exercício 3 (Teste de Hipótese II) Sabe-se que 40% das vítimas fatais de acidentes em uma determinada estrada no estado de Pernambuco eram pessoas que viajavam de moto. Um deputado desenvolveu uma nova proposta de regras (velocidade máxima, faixa exclusiva, etc) para os motociclistas nas estradas e afirma que a proporção de óbitos de motociclistas, quando submetidos a essas novas regras, é inferior a 40%. Para pôr à prova a afirmação do deputado, sua equipe aplica a nova proposta a um trecho da estrada de Pernambuco por 3 meses. a) Formule este problema como um problema de testes de hipótese (quem é p?) Sendo p a proporção de óbitos de motociclistas que viajaram na estrada de Pernambuco sob novas regras, podemos formular o teste da seguinte forma: H: p = 0,4 (a proporção de óbitos de motociclistas na estrada de Pernambuco se manteve com as novas regras) A: p < 0,4 (a proporção de óbitos de motociclistas na estrada de Pernambuco diminuiu com as novas regras) b) Interprete os erros de tipo I e tipo II no contexto do problema I. Erro tipo I: Rejeitar H sendo H verdadeira, ou seja, afirmar que a proporção de óbitos de motociclistas na estrada de Pernambuco quando submetidos às novas regras é menor que 40%, quando na verdade essa proporção é igual a 40%. II. Erro tipo II: Não rejeitar H sendo H falsa, ou seja, afirmar que a proporção de óbitos de motociclistas na estrada de Pernambuco quando submetidos às novas regras é igual a 40%, quando na verdade essa proporção é menor que 40%. Página 3 de 7
c) Se, entre 25 óbitos nessa estrada sob a novas regras, 8 eram motociclistas, qual o nível descritivo e qual a decisão a ser tomada, adotando =3%? Não use a aproximação da distribuição binomial pela normal para resolver esse item. Seja X: número de motociclistas mortos dentre 25 óbitos na estrada de Pernambuco sob as novas regras. Assim, X b(25; p). Então, o nível descritivo do teste é dado por: P = P(X 8 p = 0,4) = P(X = 0 p = 0,4) + P(X = 1 p = 0,4) + + P(X = 8 p = 0,4) = 0,2735. Portanto, como o nível descritivo é maior que o nível de significância do teste (0,03) não rejeitamos a hipótese nula. Não há evidências, ao nível de significância de 3%, de que a proporção de óbitos de motociclistas tenha diminuído com as novas regras. Tabela da distribuição binomial com n=25 e p=0,4 x P( X = x ) 0 2.843029e-06 0.0000 1 4.738381e-05 0.0000 2 3.790705e-04 0.0004 3 1.937471e-03 0.0019 4 7.104062e-03 0.0071 5 1.989137e-02 0.0199 6 4.420305e-02 0.0442 7 7.998648e-02 0.0800 8 1.199797e-01 0.1200 9 1.510856e-01 0.1511 10 1.611579e-01 0.1612 11 1.465072e-01 0.1465 12 1.139501e-01 0.1140 13 7.596671e-02 0.0760 14 4.340955e-02 0.0434 15 2.122244e-02 0.0212 16 8.842685e-03 0.0088 17 3.120948e-03 0.0031 18 9.247253e-04 0.0009 19 2.271255e-04 0.0002 20 4.542510e-05 0.0001 21 7.210333e-06 0.0000 22 8.739798e-07 0.0000 23 7.599824e-08 0.0000 24 4.222125e-09 0.0000 25 1.125900e-10 0.0000 Página 4 de 7
d) Se dentre 100 óbitos da estrada sob as novas regras, 70 não eram motociclistas, qual a decisão a ser tomada? Responda usando o nível descritivo do teste. Use um nível de significância =3%. Neste caso, iremos utilizar a aproximação da distribuição binomial pela normal, dado que o tamanho da amostra é grande. Temos que, se a hipótese nula for verdadeira, E(X) = np = 100 0,4 = 40 Var(X) = np(1 p) = 100 0,4 0,6 = 24 Assim, se a hipótese nula for verdadeira, X tem distribuição aproximadamente normal de média 40 e variância 24. Como 70 óbitos não eram de motociclistas, 30 eram. Assim, o nível descritivo é dado por: 30 40 P = P(X 30 p = 0,4) = p (Z ) = P(Z 2,04) = P(Z 2,04) = 1 P(Z 2,04) 24 = 1 0,9793 = 0,0207 Portanto, como o nível descritivo é menor que o nível de significância do teste (0,03), há evidências, ao nível de significância de 3%, de que a proporção de óbitos de motociclistas diminuiu com as novas regras. Página 5 de 7
Exercício 4 (Qui-quadrado) O estudo das mutações e sua associação com doenças é um objetivo central em Biologia Molecular. Com a finalidade de verificar a associação entre o número de mutações em uma certa base na composição genética dos indivíduos (0,1 ou 2 mutações) e a ocorrência de uma doença, foram pesquisados 237 indivíduos escolhidos ao acaso entre aqueles submetidos ao sequenciamento genético, obtendo a tabela abaixo: doentes saudáveis total 0 mutações 23 32 55 1 mutação 35 33 68 2 mutações 71 43 114 total 129 108 237 a) Se o número de mutações não está associado com a ocorrência da doença, quantos indivíduos doentes e com duas mutações são esperados? Quantos foram observados nesse caso? São esperados 114x129/237 = 62,05 (aproximadamente 62). Foram observados 71. b) Escreva as hipóteses e informe o número de graus de liberdade da estatística do teste apropriado. H: não há associação entre número de mutações e ocorrência da doença A: há associação entre o número de mutações e ocorrência da doença número de graus de liberdade = (3 1) x (2-1) = 2 c) A saída do R para o teste de hipótese apropriado forneceu X 2 = 6,5998 e P = 0,036. Por meio do nível descritivo, conclua sobre suas hipóteses utilizando um nível de significância de 5%. Página 6 de 7
Como P<0,05, H é rejeitada ao nível de significância de 5%. Há, portanto, evidências de associação entre o número de mutações e a ocorrência da doença. doentes saudáveis total 0 mutações 23 (41,8%) 32 (58,2%) 55 (100%) 1 mutação 35 (51,4%) 33 (48,6%) 68 (100%) 2 mutações 71 (62,2%) 43 (37,8%) 114 (100%) total 129 (54,4%) 108 (45,6%) 237 (100%) Nota-se a proporção de doentes aumentando com o número de mutações e o posto correndo com a proporção de saudáveis. Página 7 de 7