INSTITUTO POLITÉCNICO DE SETÚBAL ESCOLA SUPERIOR DE SAÚDE EAME DE ESTATÍSTICA / ESTATÍSTICA I Cursos: Licenciatura em Enfermagem e Licenciaturas Bi-etápicas em Fisioterapia e em Terapia da Fala Época de Recurso o Ano/3 o Semestre 006/07 Data: 5 a feira, 13 de Setembro de 007 Duração: 10h às 1h Instruções: 1. Leia atentamente o teste antes de começar.. Justifique convenientemente todas as respostas. 3. É permitida a utilização individual de máquina de calcular. 4. O abandono da sala por desistência só deverá ocorrer depois de decorridos 45 minutos a partir do início da prova. O abandono da sala implica a entrega definitiva do teste/exame. Questões: 1. O número de filhos numa amostra de 100 utentes da Consulta de Planeamento Familar de um dado Centro de Saúde, é apresentada na tabela seguinte: N o de filhos 1 3 4 5 Frequência absoluta acumulada 44 78 90 97 100 [1.0] (a) Complete a tabela, determinando as frequências absolutas e as frequências relativas (simples e acumuladas); [1.0](b) Calculeamédia,amediana,amodaeodesviopadrãodonúmerodefilhos dos elementos da amostra; [1.5] (c) Determine o diagrama de extremos e quartis e o coeficiente de assimetria, associados aos dados. Compare e comente os resultados obtidos; [.5] (d) Tendo-se obtido o intervalo de confiança ]0.14; 0.316[ a (1 α) 100%, para a proporção de utentes com pelo menos 3 filhos, determine o grau de confiança do intervalo;. Na tabela seguinte estão registados os resultados de uma experiência realizada com 9 amostras de sangue do mesmo indivíduo, para conhecer como varia o tempo que demora a coagular o sangue humano a diferentes temperaturas: Temperatura ( o C.) 5 10 15 0 5 30 35 45 Tempo de coagulação (s) 45 38 3 8 4 4 19 1 xi y i = 5455 x i = 715 y i = 7715 [1.0] (a) Identifique a variável dependente e a variável independente, e avalie a qualidade da relação linear entreasduasvariáveis. (b) [.0] Determine a recta de regressão linear e calcule o tempo de coagulação previsível para uma temperatura de o C..
3. Num estudo foram comparadas as percentagens de retenção de partículas nos brônquios em pares de gémeos homozigóticos com hábitos tabágicos opostos, tendo sido obtidos os seguintes resultados: Média Amostral Desvio Padrão Amostral Gémeo fumador 43.8 1.79 Gémeo não fumador 38.1 16.03 [.0] (a) Através de um teste de hipóteses adequado e utilizando o valor p, diga justificando, para um nível de significância de 0.05, se os hábitos tabágicos determinam que as percentagens de retenção sejam superiores para os gémeos fumadores (admitindo a normalidade das populações)? [.5] (b) Determine a probabilidade de aceitar que a diferença das médias percentuais de partículas, não difere nos dois grupos, sabendo que a diferença dessas médias é efectivamente de 15. Qual a potência do teste nestas circunstâncias? 4. Um aluno desloca-se todos os dias de manhã na sua viatura para ir à escola. A duração da viagem (em minutos) é uma variável aleatória normal com média 0 e variância 16. [1.5] (a) Determine a probabilidade da viagem demorar mais de 5 minutos. [1.5] (b) Determine a percentagem de vezes que chega atrasado à aula das 9:00h quando sai de casa às 8:45h. [3.5] 5. O responsável pelo fornecimento alimentar a um hospital deseja lançar uma nova embalagem para os seus produtos perecíveis, sendo desejável que o tempo de conservação (em dias) passe a ser superior. Para tal decidiu testar o protótipo de uma embalagem recolhendo duas amostras de 6 elementos cada, tendo obtido os seguintes resultados: Tipo de embalagem Dias de conservação Nova embalagem 10 7 5 9 9 10 Embalagem actual 8 6 3 4 6 3 Qual a decisão que a empresa deve tomar? (utilize um nivel de significância de 1%) Fim.
Tópicos de Resolução 1. O número de filhos numa amostra de 100 utentes da Consulta de Planeamento Familar de um dado Centro de Saúde, é apresentada na tabela seguinte: N o de filhos 1 3 4 5 Frequência absoluta acumulada 44 78 90 97 100 [1.0] (a) Complete a tabela, determinando as frequências absolutas e as frequências relativas (simples e acumuladas); x i f a F a f r F r 1 44 44 0.44 0.44 34 78 0.34 0.78 3 1 90 0.1 0.9 4 7 97 0.07 0.97 5 3 100 0.03 1 Total 100 1 [1.0](b) Calculeamédia,amediana,amodaeodesviopadrãodonúmerodefilhos dos elementos da amostra; Média: Mediana e Moda: Variância Corrigida: x = f ri x i = = 0.44 1+0.34 +... +0.03 5=1.91 ex = Mo = 1 s = 1 fai (x i x) = n 1 = 1 99 h44 (1 1.91) +... +3 (5 1.91) i = = 1.11303 Desvio padrão: s = 1.11303 ' 1.055 [1.5] (c) Determine o diagrama de extremos e quartis e o coeficiente de assimetria, associados aos dados. Compare e comente os resultados obtidos; Mínimo: 1; 1 o quartil : q 0.5 =1;Mediana- o quartil : q 0.5 =;3 o quartil : q 0.75 =; Máximo: 5. 3
Diagrama de extremos e quartis: 6 5 4 3 1 0 1c ) As famílias menos numerosas apresentam menor dispersão: mais de 75% das famílias da amostra têm até filhos. Coeficiente de assimetria: T = x Mo s T = 1.91 1 1.055 ' 0.86 > 0 logo a distribuição dos dados é assimétrica positiva. A assimetria positiva verifica-se em distribuições que apresentam menor dispersão na parte inferior à mediana, como se constata no diagrama de extremos e quartis. [.5] (d) Tendo-se obtido o intervalo de confiança ]0.14; 0.316[ a (1 α) 100%, para a proporção de utentes com pelo menos 3 filhos, determine o grau de confiança do intervalo; Trata-se de um IC para p : # r " p q p z 1 α n Atendendo à tabela obtida em 1a) tem-se p = 1+7+3 =0. 100. Deste modo tem-se, utilizando por exemplo o limite inferior do IC: 0.14 = 0. z 1 α r 0. 0.78 100 0.0414 z 1 α = 0.096 z 1 α =.3 1 α ' 0.9898 1 α ' 0.98 4
. Na tabela seguinte estão registados os resultados de uma experiência realizada com 9 amostras de sangue do mesmo indivíduo, para conhecer como varia o tempo que demora a coagular o sangue humano a diferentes temperaturas: Temperatura ( o C.) 5 10 15 0 5 30 35 45 Tempo de coagulação (s) 45 38 3 8 4 4 19 1 xi y i = 5455 x i = 715 y i = 7715 [1.0] (a) Identifique a variável dependente e a variável independente, e avalie a qualidade da relação linear entreasduasvariáveis. - var. independente - Temperatura; Y - var. dependente - Tempo de coagulação. Vamos averiguar a existência de relação linear entre as variáveis através do coeficiente de correlação linear empírico - r: r = = P xi y i n x y q P = x i nx P yi ny 5455 9 5 r ³ 715 9 5 9 ³ 9 53 9 7715 9 53 9 = = 0.914 O valor de r indica uma correlação linear negativa muito forte. [.0] (b) Determine a recta de regressão linear e calcule o tempo de coagulação previsível para uma temperatura de o C.. b = n P x i y i P x i P yi n P x i (P x i ) = = 9 5455 5 53 9 715 5 = 0.58 logo a recta de regressão estimada é: a = y bx = = 8.11 + 0.58 5 = 4.611 by =4.611 0.58x A uma temperatura de o C. prevê-se que o sangue cemore a coagular: by =4.611 0.58 = 9.85 s 3. Num estudo foram comparadas as percentagens de retenção de partículas nos brônquios em pares de gémeos homozigóticos com hábitos tabágicos opostos, tendo sido obtidos os seguintes resultados: Média Amostral Desvio Padrão Amostral Gémeo fumador 43.8 1.79 Gémeo não fumador 38.1 16.03 [.0] (a) Através de um teste de hipóteses adequado e utilizando o valor p, diga justificando, para um nível de significância de 0.05, se os hábitos tabágicos determinam que as percentagens de retenção sejam superiores para os gémeos fumadores (admitindo a normalidade das populações)? 5
( Gémeos F umadores : x F =43.8; s F =1.79; n F = Dados: Gémeos Não Fumadores : x NF =38.1; s NF =16.03; n NF =. α =0.05 Queremos testar μ F μ NF sendo σ F e σ NF desconhecidos e n F e n NF > 30, através do seguinte teste unilateral direito: n H0 : μ F = μ NF H 1 : μ F >μ NF n H0 : μ F μ NF =0 H 1 : μ F μ NF > 0 A estatística teste (ET)será: F NF (μf μ Z = NF ) q S F n F + S NF n NF N (0, 1) Destemodotem-separap v : Z = 43.8 38.1 q 1.79 + 16.03 p v = P (Z Z )= ' 1.33 = P (Z 1.33) = 1 Φ (1.33) = = 1 0.908 = 0.0918 Como p v =0.0918 >α=0.05, nãoserejeitah 0 para este nível de significância,istoé,asmédias percentuais de partículas não são significativamente diferentes nos dois grupos. [.5] (b) Determine a probabilidade de aceitar que a diferença das médias percentuais de partículas, não difere nos dois grupos, sabendo que a diferença dessas médias é efectivamente de 15. Qual a potência do teste nestas circunstâncias? Pretende-seobteroerrotipoIIquesedefine como: β = P (Não rejeitar H 0 H 0 Falsa) Atendendo a que α =0.05, a Região Crítica na escala da ET é: [z 0.95, + [ =[1.645, + [ tendo-se na escala dos dados F NF K q 1.79 + 16.03 = 1.645 F NF =1.645 4.77 K F NF K ' 7.036 RC : F NF 7.036 logo tem-se β = P F NF < 7.036 (μf μ NF )=15 = = P Z < 7.036 15 q 1.79 + 16.03 = Φ ( 1.86) = 1 Φ (1.86) = = 1 0.9686 = 0.0314 = 6
Para a potência do teste vem: π = 1 β π = 0.9686 4. Um aluno desloca-se todos os dias de manhã na sua viatura para ir à escola. A duração da viagem (em minutos) é uma variável aleatória normal com média 0 e variância 16. [1.5] (a) Determine a probabilidade da viagem demorar mais de 5 minutos. v.a que representa a duração da viagem (em minutos) de um dado aluno para ir à escola. N (μ = 0; σ =4) P ( >5) = µ μ = 1 P σ = 1 P (Z 1.5) = = 1 Φ(1.5) = = 1 0.8944 = 0.1056 5 0 = 4 [1.5] (b) Determine a percentagem de vezes que chega atrasado à aula das 9:00h quando sai de casa às 8:45h. P ( >15) = Chega atrasado à escola 89.44% das vezes. µ μ = 1 P σ = 1 P (Z 1.5) = = 1 Φ( 1.5) = 15 0 = 4 = 1 [1 Φ(1.5)] = 0.8944 [3.5] 5. O responsável pelo fornecimento alimentar a um hospital deseja lançar uma nova embalagem para os seus produtos perecíveis, sendo desejável que o tempo de conservação (em dias) passe a ser superior. Para tal decidiu testar o protótipo de uma embalagem recolhendo duas amostras de 6 elementos cada, tendo obtido os seguintes resultados: Tipo de embalagem Dias de conservação Nova embalagem 10 7 5 9 9 10 Embalagem actual 8 6 3 4 6 3 Qual a decisão que a empresa deve tomar? (utilize um nivel de significância de 1%). Formulação das hipóteses: - Tempo de conservação na embalagem actual; 7
Y - Tempo de conservação na embalagem nova. ½ H0 : P (+) = P ( ) H 1 : P (+) >P( ) (com a nova embalagem o tempo de conservação é maior) Estatística do teste: T B (m, p =0.5) Tempo de conservação: Comanovaembalagem(Y ) 10 7 5 9 9 10 Com a embalagem actual () 8 6 3 4 6 3 Sinal: D i =(Y ) + + + + + + Como T =6, m =6e o teste é unilateral esquerdo, p v = P (T T )=P (T 6) = P (T =6)=0.0156 Como p v =0.0156 <α=0.05 rejeita-se H 0, i.e., para um nível de significância de 0.05 e face à amostra utilizada, pode considerar-se que com a nova embalagem o tempo de conservação é maior. Fim. 8