Objtivos: Dscrição d dados catgóricos por tablas gráficos Tst qui-quadrado d adrência Tst qui-quadrado d indpndência Tst qui-quadrado d homognidad
O qu são dados catgóricos? São dados dcorrnts da obsrvação d variávis catgóricas, ou sja, aquls qu idntificam para cada caso uma catgoria. As catgorias podm sr drivadas d variávis qualitativas (nominais ou ordinais) ou quantitativas.
O qu fazr para dscrvr dados catgóricos? 1. Faça uma figura: A xibição dos sus dados irá rvlar coisas qu você talvz não vja numa tabla numérica. Auxilia no planjamnto d sua abordagm analítica contribui para pnsar claramnt sobr os padrõs rlacionamntos qu podm star scondidos nos sus dados.. Faça uma figura: Uma xibição bm projtada irá xcutar muito do trabalho da anális dos sus dados. A figura pod rvlar padrõs, valors atípicos ou valors xtraordinários qu rssaltam rros. 3. Faça uma figura: Uma figura bm scolhida ajuda a rlatar aos outros o qu você ncontrou nos sus dados m sua anális.
4. Faça uma tabla d frquências: Uma tabla d frquências ou d frquências rlativas é o primiro passo para s obtr uma visualização prliminar quantitativa sobr as variávis possívis associaçõs ntr las. 5. Faça uma tabla d contingência: Tabla d dupla ntrada qu mostra como as frquências das catgorias d uma variávl s distribum ao longo das catgorias d outra variávl. 6. Analis as distribuiçõs condicionais: Uma distribuição condicional mostra a distribuição d uma variávl apnas para aquls casos qu satisfazm uma condição m outra.
7. Vrifiqu s há indpndência ntr as variávis: Numa tabla d contingência quando a distribuição d uma variávl é a msma para todas as catgorias da outra, dizmos qu as variávis são indpndnts. 8. Dscrva a associação ntr as variávis por mio d coficints adquados: Uma das mdidas mais usuais é o qui-quadrado dparson. ( oij ij ) i j ij
Tst d Adrência: Utilizado para vrificar s a distribuição d frquências d uma variávl catgórica s distribui d acordo com um modlo. Tst d Homognidad: Utilizado para comparar a distribuição d frquências para dois ou mais grupos da msma variávl catgórica. Tst d Indpndência: Utilizado para vrificar s duas variávis catgóricas são indpndnts ou não associadas.
Sja qurmos tstar a hipóts H : P ond podmos scrvr a hipóts H : ond X P p 1 p 1, i X P,..., tm uma distribuição d probabilidads spcífica d tal modo qu p 1, p X n uma amostra alatória qu caractriza uma população P p,... p H s como : são proporçõs spcificadas s p qu caractrizam P. Prgunta : A população sgu o modlo(padrão) spcificado?
Suposiçõs condiçõs: 1. Os dados dvm sr drivados d contagm(frquências) para as catgorias da variávl catgórica;. As frquências das células da tabla d dupla ntrada dvm sr indpndnts umas das outras; 3. Os sujitos contados na tabla dvm sr d uma amostra alatória xtraída d alguma população; 4. Dvmos tr dados suficints;
5. Dvmos sprar qu a frquência sja d plo mnos 5 lmntos m cada célula da tabla; 6. Part-s d um modlo probabilístico considrado satisfatório para dscrvr o comportamnto da população, ou sja, quando s tm uma toria d qu as proporçõs dvriam ocorrr m cada catgoria qu acrditam qu a sua toria é vrdadira
H : p1 p1; p p;...; p s p s Estatística d tst: i s 1 Rgra d dcisão: Considrando um nívl d significância α, rjitar a hipóts nula s: ( o i i i ) ( s 1) ; s é o númro d células.
A rgra d dcisão pod sr basada também no Valor P: P P( ( s 1) ) ára sob a curva à dirita d S, para α fixado, obtmos P < α, rjitamos a hipóts nula Valor P Obs.: o tst d adrência nos prmit, na mlhor das hipótss, rssaltar s os dados são consistnts ou não com a toria proposta. O tst não prova s o modlo tórico é vrdadiro.
Exmplo1: A Mars, Inc. diz qu as cors d sus chocolats M&M são 14% amarlos, 13% vrmlhos, % laranjas, 4% azuis, 16% vrds 13% marrons. Um consumidor curioso rsolvu vrificar s ssas proporçõs s vrificam d fato. Tomando um saquinho d M&M, l obsrvou qu continha 9 amarlos, 3 vrmlhos, 1 laranjas, 14 azuis, 8 vrds marrons. Esta amostra é consistnt com as proporçõs anunciadas? O qu dvria concluir o consumidor sobr sua suspita? Exmplo: A política d uma mprsa xig qu os spaços do stacionamnto sjam dsignados alatoriamnt a cada pssoa, mas você suspita qu não sja bm assim. Existm 3 áras d igual tamanho com 8 vagas cada: ára A, próximo ao prédio; ára B, um pouco mais long; ára C, do outro lado da rua. Você colta dados sobr os funcionários d grência d nívl médio acima para vr quantos foram dsignados para cada ára. 18 stão na ára A; 13 stão na ára B 8 stão na ára C. Os dados stão consistnts com a proposta da mprsa?
Sjam X11, X1,..., X1 s X 1, X,..., X s Duas amostras alatórias qu caractrizam as populaçõs P 1 P quanto à variávl catgórica X. S dsjamos tstar a hipóts d qu as frquências são as msmas para ambas populaçõs das quais as amostras foram xtraídas, stamos diant d um tst d homognidad cuja hipóts nula é formulada como sgu: H : P 1 P Prgunta: As populaçõs são homogênas?
Estatística d tst: ( o ij i j ij ij ) ond: n n ij i.. j n i. n. j n é o númro total d lmntos na amostra xtraída d são frquências totais obsrvadas para cada catgoria da variávl P i X. Populaçõs 1 3 4 X Total P 1 O 11 O 1 O 13 O 14 n 1. P O 1 O O 3 O 4 n. Total n.1 n. n.3 n.4 n
Suposiçõs condiçõs: 1. Os dados dvm sr drivados d contagm(frquncias) para as catgorias da variávl catgórica;. As frquências das células da tabla d dupla ntrada dvm sr indpndnts umas das outras; 3. Os sujitos contados na tabla dvm sr d amostras alatórias xtraídas d populaçõs distintas condição d alatoridad 4. Dvmos tr dados suficints 5. A frquência sprada dv sr d plo mnos 5 lmntos m cada célula da tabla; 6. O tst é aplicávl tanto para variávl qualitativa como quantitativa, dsd qu ssa última sja catgorizada.
Exmplo: Sab-s qu, mbora os usuários da Intrnt gostm da convniência das compras on-lin, ls ralmnt têm procupaçõs m rlação à privacidad a sgurança. Um studo buscou sabr s ssa procupação é a msma ntr homns mulhrs. Utilizando uma amostra d 85 mulhrs 775 homns usuários da Intrnt, qustionou-s o grau d concordância com a dclaração: Eu não gosto d forncr o númro d mu cartão d crédito ou informaçõs pssoais on-lin. Os dados obtidos stão na tabla abaixo: Concorda fortmnt Concorda Discorda Discorda fortmnt Total Mulhrs 68 76 16 65 85 Homns 358 34 118 65 775 Total 66 51 34 13 O qu s pod intrprtar dos rsultados?
Sjam X, X,..., X S dsjarmos tstar a hipóts d indpndên cia ou não associação ntr X Y, stamos diant d um tst d indpndên cia, ond a hipóts nula é formulada como sgu : H H 1 Y, Y,..., Y 1 n 1 m duas amostras alatórias qu dscrvm as variávis X Y. : As variávis X Y são indpndn ts : As variávis não são indpndn ts Prgunta: As variávis X Y são indpndnts?
Estatística d tst: ( o ij i j ij ij ) ond: n ij i. n i. n. j n são frquências marginais rlativas a variávl X n. marginais rlativas à variávl Y. j são frquências X 1 3 4 Y Total A O 11 O 1 O 13 O 14 n 1. B O 1 O O 3 O 4 n. Total n.1 n. n.3 n.4 n
Suposiçõs condiçõs: 1. Os dados dvm sr drivados d contagm(frquncias) para as catgorias das variávis catgóricas. As frquências das células da tabla d dupla ntrada dvm sr indpndnts umas das outras 3. Os sujitos contados na tabla dvm sr d uma amostra alatória xtraída d uma única população 4. Dvmos tr dados suficints 5. Dvmos sprar qu a frquência sja d plo mnos 5 lmntos m cada célula da tabla 6. O tst é aplicávl tanto para variávl qualitativa como quantitativa
Exmplo: Uma grand mprsa do nordst dos Estados Unidos qu compra pixs d pscadors locais os distribui para grands firmas rstaurants stá studando o lançamnto d uma nova campanha publicitária sobr os bnfícios do pix para a saúd. Como vidência, ls gostariam d citar o sguint studo. Psquisadors médicos acompanharam 67 homns sucos durant 3 anos para vr s havia alguma associação ntr a quantidad d pix na sua dita câncr d próstata ( Fatty Fish Consumption and Risk of Prostat Cancr, Lanct, Junho 1 ). Consumo d pix Sm câncr Com câncr Nunca/raramnt 11 14 Pquna part da dita 4 1 Part modrada 769 9 Grand part 57 4
a) Isto é um lvantamnto d dados, um studo prospctivo ou um xprimnto? b) Há vidência d uma associação ntr a quantidad d pix na dita d um homm o risco d dsnvolvr câncr d próstata? c) Est studo prova qu comr pix não prvin do câncr d próstata? Expliqu.