Testes Qui-Quadrado - Teste de Aderência Consideremos uma tabela de frequências com k frequências, k 2 k: total de categorias frequências observadas: O 1,, O k seja p 1 = p 01,, p k = p 0k as probabilidades especificadas e associadas as k categorias n i=1 O i = n frequências esperadas: E 1,, E k, E i = np 0i n i=1 E i = n
Testes Qui-Quadrado - Teste de Aderência H 0 : p 1 = p 01,, p k = p 0k vs H 1 : ao menos uma é diferente Estatística do teste: χ 2 = k (O i E i ) 2 i=1 E i Resultado: assumindo H 0 como verdadeira, se as k categorias são mutuamente exclusivas e as E i são suficientemente grandes, então χ 2 tem distribuição Qui-Quadrado com k 1 graus de liberdade Rejeição do teste: se χ 2 assumir valores grandes O i é muito diferente de E i, logo H 0 não é verdadeira R c = {χ 2 c} onde c depende do nível de significância α
Testes Qui-Quadrado - Teste de Homogeneidade Suponha r subpopulações S 1,, S r De cada subpopulação é extraída uma amostra de n i elementos, i = 1,, r, com r i=1 n i = n Em seguida, os n i elementos de S i são distribuídos segundo c categorias A 1,, A C A 1 A C Total S 1 n 11 n 1C n 1 S r n r1 n rc n r Total n 1 n C n
Testes Qui-Quadrado - Teste de Homogeneidade Objetivo: verificar se as distribuições de probabilidade das categorias A 1,, A C são as mesmas para as r subpopulações H 0 : P 1 (A 1 ) = = P r (A 1 ),, P 1 (A C ) = = P r (A C ) vs H 1 : ao menos uma é diferente P i (A j ) =probabilidade de um elemento da subpopulação i ser classificado na categoria A j Estatística do teste: χ 2 = r C (O ij E ij ) 2 i=1 j=1 E ij
Testes Qui-Quadrado - Teste de Homogeneidade O ij : frequência observada na subpopulação i, na categoria j E ij : frequência esperada na subpopulação i, na categoria j sob H 0 : E ij = n i n j n Região crítica do teste: R c = {χ 2 c} χ 2 tem uma distribuição Qui-Quadrado com (r 1)(C 1) graus de liberdade
Testes Qui-Quadrado - Exemplo 1 Teste de Aderência: Conforme a herança mendeliana, a descendência de certo cruzamento deveria ser só vermelho, preta ou branca na seguinte proporção: p 01 = 9 16, p 02 = 3 16 e p 03 4 16 Se um experimento mostrou O 1 = 74, O 2 = 32 e O 3 = 38 descendentes nessas categorias respectivamente, a teoria está afirmada? O 1 + O 2 + O 3 = n = 144 E 1 = np 01 = 81, E 2 = np 02 = 27 e E 3 = np 03 = 36 χ 2 = 060 + 093 + 011 = 164 se α = 005, o valor c da região de rejeição é c = 59915 (2 graus de liberdade) não rejeita H 0
Testes Qui-Quadrado - Exemplo 2 Teste de Homogeneidade: considere 2 escolas diferentes, e seus estudantes são submetidos a um mesmo exame, em que A, B, C, D e E são as notas por eles obtidas A B C D E Total escola 1 18 39 129 48 66 300 escola 2 18 26 41 6 9 100 Total 36 65 170 54 75 400
Testes Qui-Quadrado - Exemplo 2 A distribuição das notas obtidas pelos alunos é a mesma nas duas escolas? r = 2 C = 5 E 11 = 27, E 12 = 4875, E 13 = 1275, E 14 = 405, E 15 = 5625 E 21 = 9, E 22 = 1625, E 23 = 425, E 24 = 135, E 5 = 1875 χ 2 = 32186 se α = 005, com (r 1)(C 1) = 4 graus de liberdade, c = 94877 rejeita H 0
Testes Qui-Quadrado - Teste de Independência Sejam n indivíduos selecionados aleatoriamente de uma população Vamos classificar cada indivíduo segundo 2 variáveis A e B A tem r categorias B tem c categorias A 1 A r Total B 1 n 11 n 1r n 1 B C n C1 n Cr n C Total n 1 n r n
Testes Qui-Quadrado - Teste de Independência Objetivo: testar se A e B são independentes H 0 : P(A i e B j ) = P(A i )P(B j ) vs H 1 : ao menos uma é diferente Observação: diferença entre os testes de homogeneidade e independência Teste de homogeneidade: selecionamos uma amostra de elementos de cada uma das r subpopulações e distribuímos os elementos de cada uma dessas amostras segundo C categorias Teste de independência: distribuímos uma amostra de n elementos de uma população segundo as categorias da variável A e as categorias da variável B