Estatística II Aula 8 Pro. Patricia Maria Bortolon, D. Sc.
Tsts Qui Quadrado
Objtivos da Aula 8 Nsta aula, você aprndrá: Como quando utilizar o tst qui-quadrado para tablas d contingência Como utilizar o procdimnto d Marascuilo para dtrminar dirnças m pars, ao avaliar mais d duas proporçõs Como tstar a indpndência ntr duas variávis catgóricas
Tablas d Contingência Tablas d Contingência Útil m situaçõs nvolvndo múltiplas proporçõs Usada para classiicar as obsrvaçõs d uma amostra d acordo com duas ou mais caractrísticas Também conhcida como tabla d classiicação cruzada.
Exmplo d Tabla d Contingência Dstro ou canhoto x Sxo Habilidad: Canhoto x Dstro Sxo: Masculino x Fminino catgorias para cada variávl, ntão a tabla srá x Suponha qu xaminmos uma amostra d 300 studants
Exmplo d Tabla d Contingência Rsultados da amostra organizados m uma tabla d contingência: Tamanho amostra = n = 300: 10 Mulhrs, 1 são canhotas 180 Homns, 4 são canhotos Canhoto x Dstro F Sxo M Canhoto 1 4 36 Dstro 108 156 64 10 180 300
Exmplo d Tabla d Contingência H 0 : π 1 = π (Proporção d homns canhotos é igual à proporção d mulhrs canhotas) H 1 : π 1 π (As proporçõs não são iguais Sr canhoto ou dstro não é indpndnt do sxo) S H 0 é vrdadira, ntão a proporção d mulhrs canhotas dvria sr a msma qu a proporção d homns canhotos. As duas proporçõs acima dvriam sr iguais à proporção d canhotos na população como um todo.
Estatística d Tst Qui-Quadrado A statística d tst Qui-quadrado é: χ todas células ( o ) ond: o = rquncia obsrvada m uma célula particular = rquência sprada para aqula célula s H 0 é vrdadira para o caso d tablas x tm 1 grau d librdad Prmissa: cada célula da tabla d contingência tm uma rquncia sprada d plo mnos 5
Tst Qui-Quadrado para dirnça ntr duas proporçõs A statística d tst sgu aproximadamnt uma distribuição qui-quadrado com 1 grau d librdad Rgra d Dcisão: S > S, rjita H 0, caso contrário, não rjita H 0 0 Não rjita H 0 S Rjita H 0
Calculando a proporção gral stimada A proporção gral é: p X n 1 1 X n X n 10 Mulhrs, 1 são canhotas 180 Homns, 4 são canhotos Aqui: 1 p 10 4 180 36 300 0,1 A proporção gral d canhotos stimada na população é d 0.1, ou sja, 1%
Encontrando as rquências spradas Para obtr a rquência sprada d mulhrs canhotas, multipliqu a proporção gral d canhotos plo númro total d mulhrs Para obtr a rquência sprada d homns canhotos, multipliqu a proporção gral d canhotos plo númro total d homns S as duas proporçõs são iguais, ntão P(Canhotas Mulhrs) = P(Canhotos Homns) = 0,1 i.., spraríamos qu (0,1)(10) = 14,4 mulhrs canhotas (0,1)(180) = 1,6 homns canhotos
Frquências obsrvadas x spradas Sxo Canhoto x Dstro F M Canhoto Obsrvado = 1 Esprado = 14,4 Obsrvado = 4 Esprado = 1,6 36 Dstro Obsrvado = 108 Esprado = 105,6 Obsrvado = 156 Esprado = 158,4 64 10 180 300
Tst Qui-Quadrado para dirnça ntr duas proporçõs Canhoto x Dstro Canhoto Dstro Sxo F M Obsrvado = 1 Obsrvado = 4 Esprado = 14.4 Esprado = 1.6 36 Obsrvado = 108 Obsrvado = 156 Esprado = 105.6 Esprado = 158.4 64 10 180 300 A statística d tst é: todas células ( o (114,4) 14,4 ) (108105,6) 105,6 (4 1,6) 1,6 (156158,4) 158,4 0,7576
Tst Qui-Quadrado para dirnça ntr duas proporçõs A statística d tsté 0,7576, S com1 g.l. 3,841 Rgra d dcisão: S > 3,841, rjita H 0, snão, não rjita H 0 0 Não rjita H 0 S=3,841 =.05 Rjita H 0 Aqui, = 0,7576 < S = 3,841, ntão não rjita H 0 conclui qu não há vidências suicints d qu as duas proporçõs sjam dirnts.
Rlação ntr o tst Qui-Quadrado o Tst Z para dirnças ntr duas proporçõs A statística d tst corrspond ao quadrado da statística d tst Z; Para o msmo nívl d signiicância, o valor crítico para a statística é o dobro do valor crítico para a statística d tst Z; Para tsts unidircionais us o tst Z; Essas rlaçõs são válidas para comparaçõs ntr duas proporçõs, ou sja, tablas d contingência x ; Vriiqu stas rlaçõs azndo o xrcício 3 da Lista 8; Para comparaçõs ntr mais d duas proporçõs não é possívl usar o tst Z, us o tst quiquadrado conorm vrmos a sguir.
Tst para dirnças ntr mais d duas proporçõs O tst pod sr xtndido para o caso d mais d duas populaçõs indpndnts: H 0 : π 1 = π = = π c H 1 : Nm todos os π j são iguais (j = 1,,, c)
ond: Estatística d Tst Qui-Quadrado ( o ) all clls o = rquência obsrvada m uma das células d uma tabla x c ( linhas c colunas) = rquência sprada m uma célula s H 0 é vrdadira para a tabla x c tm (-1)(c-1) = c - 1 graus d librdad Prmissa: cada célula da tabla d contingência tm rquência sprada d plo mnos 1
Calculando a Proporção Gral Estimada A proporção gral é: p X1 n 1 X n... X... n c c X n As rquências spradas m cada célula para as c catgorias são calculadas como no caso da tabla x, a rgra d dcisão é a msma: Rgra d Dcisão: S > S, rjita H 0, caso contrário, não rjita H 0 Ond S é d uma distribuição qui-quadrado com c 1 graus d librdad
Tst com mais d duas proporçõs: Exmplo O compartilhamnto d inormaçõs d pacints nos EUA é uma qustão controvrsa na ára d saúd. Uma psquisa ita com 500 indivíduos prguntou s havia objçõs ao compartilhamnto d dados ntr sguradoras, armácias médicos psquisadors. Os rsultados são rsumidos na tabla sguint:
Tst com mais d duas proporçõs: Exmplo Objção ao compartilha mnto? Organização Sguradoras Farmácias Médicos Psquisadors Sim 410 95 335 Não 90 05 165
Tst com mais d duas proporçõs: Exmplo A proporção gral é: p X X n n 1... X... n 410 95 335 500 500 500 1 c c 0,6933 Objção ao compartilhamnto? Sim o = 410 Organização Sguradoras Farmácias = 346,667 Não o = 90 = 153,333 o = 95 = 346,667 o = 05 = 153,333 Médicos Psquisador s o = 335 = 346,667 o = 165 = 153,333
Tst com mais d duas proporçõs: Exmplo Objção? Sim Não Organização Sguradoras Farmácias Médicos Psquisadors o o o 11,571 6,159 7,700 o 17,409 o o 0,396 0,888 A statística d tst qui-quadrado é: todas as células ( o ) 64,1196
Tst com mais d duas proporçõs: Exmplo H 0 : π 1 = π = π 3 H 1 : Nm todos os π j são iguais (j = 1,, 3) Rgra d dcisão: S > S, rjita H 0, caso contrário, não rjita H 0 S = 5,991 vm da distribuição qui-quadrado com dois graus d librdad (c 1). Conclusão: Como 64,1196 > 5,991, rjita-s H 0 você conclui qu plo mnos uma das proporçõs d rspondnts qu izram objção ao compartilhamnto d sus dados é dirnt ntr as organizaçõs.
O procdimnto d Marascuilo O procdimnto d Marascuilo prmit azr comparaçõs ntr todos os pars. Primiro, calcul as dirnças obsrvadas p j - p j ntr todos os pars das c(c-1)/ células. Sgundo, calcul o intrvalo crítico corrspondnt para o procdimnto d Marascuilo.
O procdimnto d Marascuilo Intrvalo crítico para o procdimnto d Marascuilo : Intrvalo Crítico S p j (1 n j p j ) p j / (1 p / ) n j / j
O procdimnto d Marascuilo Calcul um intrvalo crítico para cada par d comparaçõs ntr as proporçõs da amostra. Compar cada um dos c(c - 1)/ pars d proporçõs na amostra com su intrvalo crítico corrspondnt. Dclar a dirnça ntr proporçõs signiicant s a dirnça absoluta no par d proporçõs p j p j or maior qu o intrvalo crítico corrspondnt.
O procdimnto d Marascuilo Exmplo Objção? Organização Sguradoras Farmácias Médicos Psquisadors Sim 410 P 1 = 0,8 95 P = 0,59 335 P 3 = 0,67 Não 90 05 165
O procdimnto d Marascuilo Exmplo Dirnça Absoluta das Proporçõs p j p j' Intrvalo Crítico p j (1 p j ) p j' (1 p j' ) S n j n j' p1 p 0,8 0,59 0,3 0,8(1 0,8) 0,59(1 0,59) 5,991 0,084 410 95 p1 p3 0,8 0,67 0,15 0,8(1 0,8) 0,67(1 0,67) 5,991 0,078 410 335 p p3 0,59 0,67 0,08 0,59(1 0,59) 0,67(1 0,67) 5,991 0,094 95 335 Conclusão: Como as dirnças absoluta da proporção 1 (sguradoras) m rlação às outras duas é maior qu o intrvalo crítico corrspondnt, você conclui qu há dirnça signiicativa ntr las. Entrtanto, ntr as proporçõs 3 (armácias médicos psquisadors) a dirnça não pod sr considrada signiicativa.
Tst d Indpndência Smlhant ao tst para igualdad ntr mais d duas proporçõs, mas xtnd o concito a tablas d contingência com r linhas c colunas H 0 : As duas variávis catgóricas são indpndnts (i.., não há nnhuma rlação ntr las) H 1 : As duas variávis catgóricas são dpndnts (i.., xist uma rlação ntr las)
ond: Tst d Indpndência A statística d tst Qui-Quadrado é: ( o ) todascélulas o = rquência obsrvada m uma célula particular da tabla r x c = rquência sprada m uma célula s H 0 é vrdadira para uma tabla r x c tm (r-1)(c-1) graus d librdad Prmissa: cada célula da tabla d contingência tm rquência sprada d plo mnos 1
Frquências Espradas Frquências spradas m cada célula: total da linha total n da coluna Ond: Total da linha = soma do total d rquências naqula linha Total da coluna = soma do total d rquências naqula coluna n = tamanho total da amostra
Rgra d Dcisão A rgra d dcisão é: S > S, rjita-s H 0, caso contrário, não rjita H 0 Ond S vm da distribuição qui-quadrado com (r 1)(c 1) graus d librdad
Exmplo: Tst d Indpndência O plano d riçõs slcionado por 00 studants é mostrado abaixo: Tipo Mnu No. d riçõs por smana 0/sm. 10/sm. nnhuma Total Saudávl 4 3 14 70 Soist. 6 1 60 Junior 10 14 6 30 Snior 14 16 10 40 Total 70 88 4 00
Exmplo: Tst d Indpndência A hipóts a sr tstada é: H 0 : No. d riçõs tipo do mnu são indpndnts (i.., não há nnhuma rlação ntr ls) H 1 : No. d riçõs tipo do mnu são dpndnts (i.., há rlação ntr ls)
Exmplo: Tst d Indpndência Frquências spradas m cada célula s H 0 é vrdadira: Exmplo p/ uma célula: No. d riçõs por smana total linha 3070 00 10.5 x total coluna n Tipo Mnu 0/sm. 10/sm. 0 Total Saudávl 4.5 30.8 14.7 70 Soist. 1.0 6.4 1.6 60 Junior 10.5 13. 6.3 30 Snior 14.0 17.6 8.4 40 Total 70 88 4 00
Exmplo: Tst d Indpndência O valor da statística d tst é: todascélulas ( o (4 4,5) 4,5 ) (330,8) 30,8 (108,4) 8,4 0,709 S = 1,59 para α = 0,05 sndo a distribuição com (4 1)(3 1) = 6 graus d librdad
Exmplo: Tst d Indpndência A statística d tsté 0,709, S com 6 g.l. 1,59 Rgra d Dcisão: S > 1,59, rjita H 0, caso contrário, não rjita H 0 0 Não rjita H 0 =0.05 Rjita H 0 S=1,59 Aqui, = 0,709 < S = 1,59, ntão não rjita H 0 Conclusão: não há vidências suicints d qu haja rlação ntr o no. d riçõs o tipo do mnu scolhido.