Aula 4. Inferência para duas populações. Teos duas aostras independentes de duas populações P e P : população P aostra x, x,..., x n população P aostra y, y,..., y Observação: taanho de aostras pode ser diferentes (n não é necessario igual à ). O problea geral é testar hipotese sobre a igualdade de populções: H 0 : a distribução populacional de P a distribução populacional de P A : a distribiução populacional de P a distribiução populacional de P () Exeplo. U grupo de pacientes toa reédio A e outro o reédio B. Objetivo coparar a eficiência de trataentos. Consideraos o caso particular. Vaos supor que as populações P e P são norais. Por isso para testar hipótese sobre igualdade de distribuições é suficiente testar hipótese sobre igualdades das édias e variâncias que corresponde as populações: MODELO X, X,..., X n X i N(µ, σ) Y, Y,..., Y Y i N(µ, σ) () O objetivo de aula é testar 3 hipóteses:. Hipótese sobre a igualdade de variâncias. Hipótese sobre a igualdade de édias, dado que as variâncias populacionais são iguais 3. Coo que podeos testar hipótese sobre a igualdade de édias, sabendo que as variâncias populacionais são diferentes?. Coparação das Variâncias de Duas Populações Norais. Quereos testar Seja S e S variâncias aostrais. Ja sabeos que H 0 : σ σ A : σ σ (3) U (n )S σ χ n e V ( )S σ χ (4) Coo que nos podeos coparar as duas variâncias? Podeos dividir u no outro e razão coparar co. Será que rezão pode dar algua distribuição universal? S S σu n σv, onde U χ n e V χ (5) Para ser ua distribuição universal teos que se livrar dos parâetros σ e σ. Notaos que a hipótese nula é que eles são iguais: se a hipótese nula é verdadeira (3) teos σ U n σ V U n, onde U χ V n e V χ (6) Distribução dessa varável chaareos F (n, ) F -distribuição co n e graus de liberdades. Assi a estatística de teste é S S F (n, ) (7)
Coo ja virou a rotina para dado (nível de significância) para o teste bilateral precisaos dois quantis da distribuição de F : f n ; e f n ;. S S F (n, ) P f n ; S S f n ; } P S S RC [0, f n ; decisão(, s s ) No caso de distribuição de F (n, ) RC } P S S aceitaos H 0 ] [f n ;, ) aceitaos A se s s f n ; f ;n f n ; se f n ; f n ; ou S S s s f n ; f n ; } ou s s f n ; (8) Por isso basta saber u valor, e nas tabelas usualente usa-se o valor aior de que : o quantil f n ;. Por este otivo na pratica o algorito é seguinte:. Seja s e s estiações de variâncias. Escolheos eles de tal fora que s /s seja aior de que.. Escolheos e achareos valor quantil f n ; 3. Se s /s > f n ; então rejeitaos H 0, caso contrário aceitaos H 0. (este quantil sepre aior de para < 50%) Exeplo. (p.359, []) Quereos verificar se duas áquinas produze peças co a esa hoogeneidade quanto à resistência à tensão. Para isso, sorteaos duas aostras de seis peças de cada áquina, e obtiveos as seguintes resistências: de áquina A 45, 7, 36, 4, 4, 37 e de áquina B As hipóteses a sere testadas são 43, 8, 3, 38, 4, 33, 34, 38. H 0 : A : σa σ B σa σ B. s A 40, e s B 6.6, assi o valor de estatística do teste é 40/6.6 >. Assi a distribuição e de F (6 ; 8 ) F (5; 7).. Para 5% pela tabela deu f 5;7 0.975 5.9 (verifique!) 3. 40/6.6.5 < 5.9 não rejeitaos H 0, ou seja, as áquinas produze co a esa hoogeneidade quanto à variabilidade. Caso tivésseos rejeitado a hipótese de igualdade das variâncias, seria conveniente obter u intervalo de confiânça para o quociente das duas variâncias: (5) S /σ S /σ F (n, ) P f n ; S /σ S /σ f n ; } IC P f n ; S S [ f n ; s s σ σ ; f n ; f n ; ] [ s s S S f ;n } s s ; f n ; s s ]. Coparação das Médias de Duas Populações Norais. Coparaos as édias µ e µ, usando estiadoores X e Ȳ. Neste caso é conviente estiar a diferença e coparar ela co 0. As propriedades da diferença: Problea Provar que X Ȳ N(µ µ, σ n + σ )
. Coparação das Médias de Duas Populações Norais. Caso de Mesa Variância. Se a hípótese de igualdade de variância não foi rejeitada então podeos supor que as variâncias populacionais são iguais, as não conhecidas. Dois estiadores S e S podeos cobinar para obter u estiador cou que tabe u estiador não viesado S p (n )S + ( )S n + n i (X i X) + n i (Y i Ȳ ) n + (9) Problea Se X i N(µ, σ ) e Y i N(µ, σ ) provar que o estiador de variância σ (9) não viesado. A distribuição de teste é A estatística de teste é (n + )S p σ χ n+ (0) T X Ȳ (µ µ ) t n+ () Intervalo de confiânça: S p n + (0) P t ;n+ X Ȳ (µ µ ) } S p n + t ;n+ P X Ȳ t ;n+ S p n + µ µ X Ȳ t ;n+ S p n + IC x ȳ ± t ;n+ s p n + } Co o intervalo de confiânça o teste de hipótese bilateral pode ser verificada no odo seguite: } Se 0 IC, então não rejeitaos hipótese µ µ. Se 0 / IC, então aceitaos µ µ. Exeplo. (pp.363-364 []) Duas técnias de venda são aplicadas por dois grupos de vendedores: a técnica A, por vendedores, e a técnica B, por 5 vendedores. Espera-se que a técnica B produza elhores resulatdos. no final de u ês, observa-se os resultados da tabela dados técnica A técnica B édia 68 76 variância 50 75 vendedores 5 Vaos testar, para o nível de significância de 5%. Inforações adicionais perite supor que as venda seja noralente distribuidas, co variância cou σ, desconhecida. As hipóteses a sere testadas fica H 0 : A : µ A µ B µ A < µ B Pelas suposições acia, podeos usar a estatística (9), co n, 5 e S p ( )S A + (4 )S B + 5 A estatística do teste () sob a hipótese hula vira: 50 + 4 75 5 64 t 76 68 8 / + /5.56 Pela tabela achareos o valor crítico t ;5.708. Coo t >.708 rejeitaos hipótese nula, ou seja, existe evidência de que a tècnica B produz elhores resultados do que a técnica A.
. Coparação das Médias de Duas Populações Norais. Caso de Variâncias Desiguais, Desconhecidas. Neste caso pode-se provar que na qual X T Ȳ t ν, onde ν S n + S A s n, B s (A + B) A n + B () Exercícios Doésticos.. veja Problea.. veja Problea. 3. E estudo genêtico u gene A foi destacado para detectar a doença X. Dita-se que e pessoas doentes (pacientes) este gene ostra atividade aior de que e pessoas sadias. Para testar essa hipótese foi criado u estudo caso controle: 0 pessoas co a doença X e 5 pessoas sadias. A atividade (expressão gênica) de gene A foi edida. E grupo de pacientes deu E grupo de controle (pessoas sadias) 5.9,.0, 7.7,.3,.8, 0.8, 8.7, 7.5,.5, 8.8 5., 9.3, 5.8, 3.8, 8.4, 8.8, 9.4, 5., 9.3, 9.6, 6., 6.5, 0., 6.9, 7.3 Existe as evidencias para aceitar a hipótese co nível de significância de 5%? e de %? Para testar hipótese assuios, que a distribuição de expressão de gene é distribuição noral co as variâncias iguais, desconhecidas. 4. Construir intervalo de confiânça para diferença das édias. 5. Para ite anterior assuios que as variâncias são iguais. Pelos dados podeos eso assuir isso, por exeplo, co nível de significância de 5%? e co %? 6. ([], p.369, ex.7) U grupo de planejaento urbano está interessado e estiar a diferença entre a édia de rendientos failhares para dois bairros e ua grande área etropolitana. Aostras aleatórias independentes de faílhas nos bairros fornece os seguintes resultados. Bairro : n 8, x $5.700, s $700 Bairro : n, x $4.500, s $850 a) Desenvolva ua estiativa pontual da diferença entre a édia de rendientos nos dois bairros. b) Desenvolva u intervalo de confiança de 95% para a diferença entre a édia de rendientos nos bairros. c) Que hipótese fora feitas para calcular as estiativas por intervalo no ite (b)? 7. ([], p.369, ex.8) A Associação Nacional dos Construtores de Casas forneceu dados sobre o custo dos ais populares projetos de refora de casas (USA Today, 7 de junho de 997). Dados de aostra sobre o custo e ilhares de dólares para dois tipos de projetos de refora são apresentadas a seguir. Cosinha: 5., 7.4,.8,.9, 9.7, 3.0, 9.7, 6.9,.8, 3.6 Quarto do Casal: 8.0,.9, 6.4, 4.8, 6.9, 7.8, 4.6,.0 a) Desenvolva ua estiativa pontual da diferença entre os custos édios de refora da população para os dois tipos de projetos. b) Desenvolva o intervalo de confiança de 90% para a diferença entre as duas édias da população.
8. ([], p.377, ex.6) E u caso de discriinação de salários envolvendo epregados do sexo asculino e feinino, aostras independentes de epregados do sexo asculino e feinino co experiência de cinco anos ou ais fornecera os seguintes resultados de salários (e salário por hora). Epregados do Sexo F: n 3, x $8.70, s $0.80 Epregados do Sexo M: n 44, x $9.5, s $.00 Parece haver discriinação salarial neste caso? Forule hipótese nula e alternativa. Teste hipótese co 0.0. 9. ([4], p.4, -) Dois analgésicos populares, A e B estão sendo coparados e relação ao velocidade de absorção e corpo. Especificaente, afira-se que a velocidade de absorção do analgèsico A pelo corpo é duas vezes ais rápido de que do analgèsico B. Supoos que σa e σ B são conhecidas. Cosntruir o teste estatístico para H : µ A µ B contra A : µ A µ B. 0. ([4], p.40, -8) E tabela são representados os tepos (e inutos) de queia de tochas de dois diferentes tipos. Tipo 65 8 57 66 8 8 67 59 75 70 Tipo 64 7 83 59 65 56 69 74 8 79 (a) Testa hipótese que as duas variâncias são iguais co nível de significância 5%. (b) Usando resultado de ite anterior, testa hipótese que os tepos édios de queia de tochas são iguais. Referências [] P.A.Morettin e W. de O.Bussab (00) Estatística Básica. 5 a edição, Editora Saraiva. (capítulo 3 - inferência para duas populações) [] D.R.Andreson, D.J.Sweeney e T.A.Willians (000) Estatística Aplicada à Adniistração e Econoia. Tradução da a edição norte-aericada. Thoson. [3] G.W.Snedecor e W.G.Cochran (973) Statistical Methods. 6 a edição. The Iowa State University Press. [4] D.C.Montgoery (984) Design and Analysis of Experients. a edição, John Wiley & Sons.