EXERCÍCIOS DE INFERÊNCIA ESTATÍSTICA 1. De uma população normal com variância σ 2 = 6 extraiu-se uma amostra de 25 elementos. Qual a probabilidade de que a amostra tenha uma variância S 2 : a) maior que 9.1; b) entre 3.10 e 9.10? 2. X 1 e X 2 são v.a. independentes contínuas com função densidade assim definida: f Xi (x) = xi 1 e x/θ Considere os seguintes estimadores de θ: θ i x > 0, θ > 0 i = 1, 2. T 1 (X 1, X 2 ) = 1 3 (X 1 + X 2 ) T 2 (X 1, X 2 ) = 1 2 (X 1 + X 2 ) e diga qual deles é centrado. (Exame 21/7/1992) 3. Seja X 1, X 2,..., X 10 uma amostra aleatória de variáveis independentes, retirada de uma população normal N(µ, σ). Seja Y = 10 i=1 (X i µ) 2. a) Calcular a probabilidade de que o intervalo aleatório ( Y, ) Y 20.5 3.25 contenha o ponto σ 2. b) Calcule P[Y > 16 σ 2 ]. 4. Seja X uma população com distribuição normal, de média µ e desvio padrão σ=2. Uma amostra aleatória de dimensão 25 foi extraída desta população, com média x = 78.3. a) Calcule o intervalo de confiança a 99% para µ. b) Qual o erro máximo cometido (a 99% de confiança) ao estimar µ por x =78.3? c) Qual deverá ser a dimensão da amostra para que o erro máximo cometido, a 99% de confiança, ao estimar µ por x, não exceda ǫ =0.1? 45
5. Uma fábrica de relógios de alta precisão pretende estudar a fiabilidade da sua produção. É escolhida uma amostra aleatória de 10 relógios (de entre a produção de um dia, e após o habitual controlo de qualidade). Ao fim de um mês, estes relógios são confrontados com um relógio padrão e o seu desvio é registado. Resulta que a média da amostra é de 0,7 segundos e o seu desvio padrão 0,4 segundos. Admitindo que a distribuição dos erros dos relógios (relativamente ao relogio padrão) é normal, construa um intervalo de confiança a 90% para o erro médio. Que pode afirmar com 90% de confiança quanto à fiabilidade dos relógios da fábrica? 6. Suponha que o rendimento de um pé de tomateiro expresso em kg é uma variável aleatória com distribuição normal de valor médio 1 kg. Numa parte da produção foi utilizado um novo fertilizante. Observada uma amostra de 10 pés de tomateiro da parte da produção em que foi utilizado o novo fertilizante obtiveram-se os seguintes resultados: 1.375 1.223 1.773 1.752 0.779 1.407 1.068 1.633 1.201 1.042 expressos em kg. Que decisão se deverá tomar perante estes resultados, face ao novo fertilizante? 7. Depois de fabricado e embalado, a actividade de um certo adubo pode considerarse tendo uma distribuição normal com µ =120 dias e σ =40 dias. Pretende-se enviar um lote de embalagens do referido adubo de modo que a vida média amostral (X) não seja inferior a 118 dias com probabilidade 0.95. Qual o tamanho do lote a enviar? (Exame 10/7/1992) 8. Um processo de determinação do conteúdo de enxofre de um determinado produto forneceu os seguintes resultados: 1.12 1.10 1.08 1.06 1.08 1.14 1.10 1.11 1.14 a) Encontre um intervalo de confiança a 95% para o verdadeiro conteúdo médio de enxofre, apresentando as hipóteses a fazer sobre a população que achar convenientes. b) De acordo com certas normas, o conteúdo de enxofre não deve ter um desvio padrão superior a 0.02. Acha que a amostra recolhida permite afirmar que o produto está dentro das normas? Justifique convenientemente a resposta. 46
c) De uma outra fábrica que produz idêntico produto recolheu-se uma mostra de 20 elementos que proporcionou um desvio padrão de 0.085. Pode concluir que a variabilidade do conteúdo de enxofre é, nesta fábrica, três vezes superior à da outra? 9. O tempo requerido pelos trabalhadores de uma exploração agrícola para executarem uma certa tarefa tem uma média de 50 minutos e um desvio padrão de 8 minutos. Para testar o progresso no rendimento dos trabalhadores num dado dia, o empresário decidiu registar os tempos que 60 trabalhadores levaram para executar tal tarefa. a) Qual a probabilidade de que a média da amostra seja superior a 52 minutos? Justifique convenientemente. b) Se a média da amostra for 53 minutos deveria o empresário considerar que o rendimento dos trabalhadores na execução da dita tarefa diminuiu? Justifique convenientemente o método utilizado na resolução e a resposta dada. (Admita que o desvio padrão não sofreu alteração). 10. Uma empresa produz baterias para as quais as normas de fabrico indicam uma duração média mínima de ano e meio. Recolhida uma amostra de 9 baterias, estas foram ensaiadas, tendo fornecido os seguintes tempos de duração (em anos): 2 1.4 1.6 1.4 1.8 1.5 1.9 1.6 1.2 (suponha que a duração de vida de uma bateria segue uma distribuição aproximadamente normal.) a) Apresente uma estimativa para a variância da duração das baterias. b) Pressupondo σ 2 = 0.11, diga se será de admitir uma duração média conforme às normas de fabrico. 11. Para avaliar a tensão máxima suportada por uma barra de aço testaram-se n barras tendo-se obtido x n = 20 e para extremo superior do intervalo de confiança a 95% obteve-se 21.7. Sabendo que se admite que a tensão suportada por uma barra de aço é uma v.a. normal com desvio padrão σ = 3, determine o extremo inferior do intervalo de confiança e a dimensão n da amostra. 12. Numa amostra de 16 elementos, que se supõe ter sido retirada de uma população com distribuição normal, o desvio padrão obtido foi de 5.2 47
a) Foi calculado um intervalo de confiança para a média populacional tendo-se obtido ]24.2297; 29.7703[ Indique justificando: i) Qual a média da amostra; ii) Qual o grau de confiança do intervalo calculado. b) Qual o intervalo de confiança a 95% para a variância populacional. 13. Uma fábrica de produção de instrumentos de precisão efectua estudos de qualidade na sua produção. Num destes estudos, são escolhidos aleatoriamente 9 instrumentos, e usados na medição de um objecto-padrão, a que deverá corresponder uma leitura de 1 unidade. Sabe-se que em anteriores experiências o desvio-padrão das leituras obtidas foi 0.008, e admite-se que esse valor se mantem. Admitindo que as leituras nos nove instrumentos foram: 0.991 0.998 1.005 0.992 1.011 0.993 0.986 0.994 0.985 a) Construa um intervalo de confiança a 95% para a leitura média dos instrumentos produzidos e diga se os dados apontam para algum desvio sistemático na calibragem dos instrumentos. Explicite as hipóteses necessárias. b) Estude estatisticamente a possibilidade de os dados apontarem para uma alteração no anterior valor do desvio-padrão das leituras (que, recorde-se, era de 0.008). Explicite as hipóteses necessárias. 14. Uma amostra aleatória de dimensão n 1 =25 foi escolhida de uma população com distribuição normal, de desvio padrão σ 1 =5. Verificou-se que a média da amostra era x 1 =80. Uma segunda amostra aleatória de dimensão n 2 =36 foi extraída de outra população com distribuição normal de desvio padrão σ 2 =3. A sua média resultou ser x 2 =75. Calcule um intervalo de confiança a 94% para a diferença das médias das populações µ 1 µ 2 admitindo a independência das amostras. 15. Numa experiência agronómica pretende-se avaliar o crescimento total de uma certa espécie de plantas (expresso em peso seco) relativamente a dois regimes de fertilização A e B. Ao fim de determinado tempo procedeu-se a medições, tendo-se obtido os seguintes resultados: A 5.44 5.36 5.60 6.46 6.75 6.03 4.15 4.44 B 5.12 3.80 4.96 6.43 5.03 5.08 3.22 4.42 48
a) Numa experiência anterior (com um elevado numero de plantas da mesma cultivar) relativa ao tratamento A, obteve-se uma variância de 0.42. Verifique se os dados actuais são consistentes com esse valor. Diga, justificando, se haveria alguma(s) hipótese(s) necessária(s) à resolução do problema. b) Verifique se os dois regimes de fertilização A e B evidenciam diferenças significativas no que respeita ao crescimento das plantas. Explicite as hipóteses necessárias à resolução do problema. 16. Cada um de dois fabricantes de máquinas de lavar tem uma rede de vendas nacional, COM UM REPRESENTANTE POR CIDADE. Seleccionaram-se aleatoriamente dez representantes de cada fabricante. A média de máquinas vendidas pelos 10 representantes do fabricante A (durante um ano) foi x 1 = 84 com um desvio padrão s 1 = 8. A média de máquinas vendidas pelos 10 representantes do fabricante B foi x 2 = 77, com um desvio padrão s 2 =10 (no mesmo ano). Responda às seguintes alíneas, explicitando em cada caso qualquer hipótese adicional que seja necessária. a) Será que a variância das vendas dos representantes de cada fabricante é igual? b) Comente a veracidade da seguinte afirmação: os representantes do fabricante A vendem em média tantas máquinas de lavar como os representantes do fabricante B. c) Suponha agora que foram seleccionadas aleatoriamente 10 cidades do país onde os resultados das vendas (durante o mesmo ano) foram as seguintes: Fab. A 76 60 85 58 91 75 82 64 79 90 Fab. B 81 52 87 70 86 77 90 63 85 85 Comente neste caso a afirmação da alínea b). d) Independentemente dos resultados concretos obtidos nas alíneas b) e c), se tivesse que decidir qual o processo estatístico a utilizar para aferir da validade da afirmação da alínea b), qual escolheria: a selecção aleatória de 10 representantes de cada fabricante ou a selecção aleatória de dez cidades? Justifique a sua resposta. 17. Faz-se uma experiência para saber se dois regimes alimentares A e B produzem o mesmo aumento de peso nos animais, durante um período de tempo fixado. Tomam-se 20 animais e de entre eles 10 ao acaso aos quais é dado o limento A. Aos outros 10 é dado o alimento B. Os aumentos de peso (expressos em kg) no mesmo intervalo de tempo são os seguintes: Regime A -2.0 0.0 4.2 6.3 9.6 4.3 10.2 11.0 12.4 13.1 Regime B 4.0 6.0 8.0 11.3 12.3 14.4 14.5 14.7 14.7 16.0 49
Diga se existe diferença significativa entre os dois regimes alimentares, justificando convenientemente todas as hipóteses necessárias à resolução do problema. 18. Um estudo pretende comparar um tipo de semente melhorada com o tipo de semente usado anteriormente. A nova semente passará a ser utilizada se, em média, o crescimento das plantas após 20 dias fôr superior ao das obtidas das velhas sementes. São criadas 15 diferentes situações laboratoriais, variando temperatura e humidade. Em cada situação planta-se uma semente de cada tipo e obtêm-se os seguintes resultados para o crescimento (em cms) das plantas após 20 dias : Situação 1 2 3 4 5 6 7 8 novas sementes 3.46 3.48 2.74 2.83 4.00 4.95 2.24 6.92 velhas sementes 3.18 3.67 2.92 3.10 4.10 4.86 2.21 6.91 Situação 9 10 11 12 13 14 15 novas sementes 6.57 6.18 8.30 3.44 4.47 7.59 3.87 velhas sementes 6.83 6.19 8.05 3.46 4.18 7.43 3.85 Deverá passar a usar-se o novo tipo de sementes? Responda justificando e explicitando quaisquer hipóteses adicionais que seja necessário impôr. 19. Pretende-se verificar se um dado tratamento aos metais tem algum efeito na quantidade de metal removido numa certa operação. Uma amostra aleatória de 100 peças foi introduzida num liquido durante 24 horas sem ser feito o tratamento, obtendo-se uma média de 12.2 mm de metal removido e um desvio padrão de 1.1 mm. Uma segunda amostra de 200 peças foi primeiro tratada e depois introduzida durante 24 horas no tal liquido, resultando uma média de 9.1 mm de metal removido com um desvio padrão de 0.9 mm. Determine um intervalo de confiança a 98% para a diferença entre as verdadeiras quantidades médias de metal removido sem tratamento e com tratamento. Reduzirá o tratamento a quantidade de metal removido? 20. É desencadeado um programa de controlo da poluição de um rio em que são efectuadas medições, antes de lançar a campanha antipoluição e um ano após. As medições são combinações de vários índices; quanto maior for o valor resultante maior é a poluição. Obtiveram-se os seguintes resultados: Ponto de controlo 1 2 3 4 5 6 7 8 9 10 Antes da campanha 68 88 101 82 96 74 65 74 52 99 Um ano após 67 87 90 76 98 69 68 65 59 70 Será que a campanha antipoluição reduziu de facto a poluição? Explicite e verifique todas as hipóteses necessárias à resolução do problema, justificando. 50
21. Um caçador diz que abate 80% das aves a que atira. Concordaria com ele se em determinado dia ele acertava 9 tiros num total de 15? Use o nível de significância de 0.05. 22. Pretende-se testar se a proporção de ulmeiros afectados pela grafiose é idêntica em duas zonas A e B. Na zona A foi recolhida uma amostra aleatória de 30 ulmeiros e verificou-se que 20 estavam afectados pela grafiose. Na zona B recolheu-se uma amostra de 35 ulmeiros e verificou-se que 27 estavam afectados pela grafiose. Que conclusão se pode tirar ao nível de significância de 0.05? 23. Uma dada espécie de pássaros põe 4 ovos cada primavera. Um cientista afirma que o pássaro que nasce do 1 ō ovo é maior que o do último. Para analisar esta afirmação, pesa o mais jovem e o mais velho de 8 famílias e obtém os seguintes resultados: Família 1 2 3 4 5 6 7 8 Mais velho 2.92 3.58 3.39 3.29 3.44 3.13 3.22 3.80 Mais novo 2.90 3.68 3.33 3.06 3.30 2.99 3.26 3.51 Que conclusão tira? 24. Numa Estação Florestal estudam-se problemas de escoamento de precipitação. Nesse sentido em 12 dias de chuva (suponha que se trata de uma amostra aleatória de dias com precipitação) são colocados dois receptáculos para medir a quantidade de precipitação: um numa zona desarborizada e outro sob as copas das árvores. As leituras da quantidade de água em cada receptáculo (medidas em cm de altura) deram os seguintes valores (cada linha corresponde a um dia): Precipitação na zona descoberta Precipitação sob coberto 5.87 4.96 1.30 1.14 2.34 2.24 2.82 2.26 5.89 4.75 9.09 7.83 1.93 1.86 9.27 8.85 4.65 4.17 4.35 3.65 5.00 4.08 8.43 7.99 a) Estime a precipitação média na zona desarborizada e na zona sob coberto. b) Será admíssivel supor que a 95% de confiança as precipitações médias nos dois casos são iguais? Explicite as hipóteses necessárias à resolução desta 51
questão. c) Tendo em conta que, pela própria natureza do problema, o nível de precipitação sob coberto nunca será superior ao nível da correspondente precipitação a descoberto, discuta a possnível influência deste facto no intervalo de confiança obtido na alínea a). 25. Para decidir se deveria ou não lançar um novo produto no mercado, uma empresa de bens alimentares fez um inquérito em 10 supermercados do Sul e 20 do Norte do país, acerca do número de unidades X do referido produto que estes esperam poder vender semanalmente. Obtiveram-se os seguintes resultados: xi x 2 i Sul 1000 102550 Norte 1200 75950 a) Determine estimativas para o número médio e para a variância das unidades que os supermercados do Sul e do Norte esperam vender. b) Embora a média de vendas difira significativamente no Norte e Sul, a variabilidade das vendas é praticamente igual. Critique fundamentadamente a afirmação anterior, justificando. (Exame 10/7/1992) 26. A fim de investigar os efeitos de ambientes nitrosos e de ambientes fosfatados no desenvolvimento de colónias de bactérias, contaminam-se 10 plaquetas envolvidas em cada um daqueles ambientes com as bactérias em estudo, e deixa-se incubar durante 24 horas. Após esse tempo, procede-se à contagem do número de colónias de bactérias em cada plaqueta, tendo-se obtido os seguintes resultados: Ambiente 60 47 12 29 0 46 49 121 63 101 nitroso Ambiente 8 46 21 13 58 33 20 46 31 38 fosfatado a) Investigue a hipótese de o tipo de ambiente não influir no desenvolvimento das colónias de bactérias. b) Que hipótese(s) foi necessário considerar para poder resolver a alínea a)? 27. O dono de uma ervanária produz um chá relativamente ao qual afirma que é 90% eficaz para curar dores de cabeça. Num inquérito feito a 250 pessoas, 198 concordaram que o chá cura as dores de cabeça. Acha que o resultado do inquérito é compatível com a pretensão do produtor? (Exame 21/7/1992) 52
28. Um investigador pretende estudar a incidência a nível nacional, de uma doença que ataca os pinheiros. Observações efectuadas através do país resultaram em 1233 casos de pinheiros afectados (a nível nacional) num total de 4250 observações. a) Estime a percentagem de pinheiros afectados a nível nacional. b) Determine um intervalo a 95% de confiança para a verdadeira proporção de pinheiros afectados. 29. Uma empresa agrícola tem uma estação agronómica experimental onde produz novas variedades de ervilhas. Uma amostra sobre as características das ervilhas resultou em 310 ervilhas amarelas de casca macia, 109 ervilhas amarelas de casca dura, 100 ervilhas verdes de casca macia e 37 ervilhas verdes de casca dura. Para uma experiência semelhante as leis de Mendel prevêm que o resultado seja 56.25% de ervilhas amarelas de casca macia, 18.75% de ervilhas amarelas de casca dura, 18.75% de ervilhas verdes de casca macia e 6.25% de ervilhas verdes de casca dura. Serão os resultados da estação agronómica compatíveis com as leis de Mendel para um nível de significância de 1%? 30. Um criador de gado ovino afirma que o peso das ovelhas existentes nos rebanhos de uma dada zona de pastorícia segue uma distribuição normal. Recolheu-se uma amostra de 10 ovelhas, cujos pesos (em kg) foram 65 75 75 70 75 70 80 70 75 80 Com base nestes dados o que poderá dizer quanto à afirmação do criador? 53
INFERÊNCIA ESTATÍSTICA Soluções de alguns exercícios 8. a) Supondo a normalidade da v.a. conteúdo de enxofre, tem-se o intervalo a 95% de confiança para o valor médio ]1.0819; 1.12405[ 15. a) O intervalo de confiança para σ 2 a 95% (consideremos este valor para a confiança) é ]0.3584, 3.3952[ Como o intervalo a 95% de confiança contém o valor 0.42 não temos razões para afirmar que os dados não são consistentes com aquele valor. b) Hipóteses necessárias: normalidade das v.a. s cujos valores são os que resultam da aplicação dos regimes A e B; igualdade das variâncias. Vejamos um I.C. para estudarmos esta última hipótese. Assim o I.C a 95% para o quociente σ1 2/σ2 2, é ]0.1757, 4.3763[. Como o intervalo contém o valor 1 não temos razão para afirmar, com 95% de confiança, que as variâncias não são iguais, por isso iremos considerar o I.C. para a diferença das médias (amostras independentes). I.C. a 95% ] 0.2544, 1.7544[. Logo, a 95% de confiança, como o intervalo contém o zero, não podemos afirmar que não são iguais. 19. n 1 = 100 n 2 = 200 x 1 = 12.2 x 2 = 9.1 s 1 = 1.1 s 2 = 0.9 Trata-se de duas amostras independentes. Como n 1 e n 2 são grandes"podemos usar a aproximação à normal e estimar σ 2 1 e σ 2 2 por s2 1 e s2 2 respectivamente. Intervalo de confiança para µ 1 µ 2 a (1 α) 100% s 2 x 1 x 2 z 1 α/2 + s2 2 s 2, x 1 x 2 + z 1 α/2 + s2 2 n 1 n 2 n 1 54 n 2
] 2.804; 3.396 [ Como o intervalo só contém valores positivos, com uma confiança de 95% é de admitir que µ 1 > µ 2, logo o tratamento deve reduzir a quantidade de metal removido. 23. Trata-se de amostras emparelhadas por família. I.C. a 95% para µ D ] 0.01845, 0.2034[ Como o intervalo contém o valor zero, não há razões para afirmar que não são iguais. 24. X i - precipitação na zona descoberta Y i - precipitação sob coberto D i = X i Y i d = 0.5967 ; s D = 0.3970 Supondo a normalidade dos D i a) x = 5.0783 ; ȳ = 4.4816 b) I.C. a 95% ]0.3445 ; 0.8489[ Não é admissível supor iguais as precipitações, visto que, com 95% de confiança a diferença entre elas é sempre positiva. 28. x = 1233 n = 4250 a) p = 1233 = 0.29. 29% é então uma estimativa da verdadeira percentagem. 4250 b) ]0.2763; 0.3036[ 55