Probabilidade e Estatística Teste Qui-quadrado Prof. Dr. Narciso Gonçalves da Silva http://paginapessoal.utfpr.edu.br/ngsilva
Teste Qui-quadrado É um teste não paramétrico, pois independe dos parâmetros populacionais (média, variância, etc.); É utilizado quando se deseja comparar freqüências observadas com freqüências esperadas, estas baseadas em distribuições de probabilidades conhecidas. O método é aplicado a dois tipos de testes: 1º) Teste de aderência ou teste de bondade de ajustamento; º) Teste de independência de duas variáveis aleatórias.
Teste de Aderência É utilizado para testar a natureza de uma distribuição de probabilidade amostral, ou seja, se os dados da amostra aderem a uma determinada distribuição de probabilidade (Binomial, Poisson, Hipergeométrica, Normal, etc.). As hipóteses são: H o : os dados da amostra aderem à distribuição H 1 : os dados da amostra não aderem à distribuição 3
calc UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ Teste de Aderência A estatística do teste é calculada através da expressão: calc k ( f oi - fei ) calc = i= 1 fei Onde: f oi é a freqüência observada da classe i f ei é a freqüência esperada da classe i tem aproximadamente distribuição qui-quadrada com (k 1) graus de liberdade. será tanto menor, quanto mais se aproximarem os valores esperados dos valores observados. 4
Teste de Aderência A hipótese nula será aceita se calc crit < crit onde é a abscissa da distribuição qui-quadrada para (k 1) graus de liberdade e um nível de significância α. 5
Teste de aderência UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ Exemplos 1) No lançamento de uma moeda 00 vezes, ocorreram 80 caras e 10 coroas. Testar se a moeda é honesta ao nível de significância de 1%. ) Um dado foi lançado 300 vezes e o resultado observado está apresentado na tabela abaixo. Verifique se o dado é honesto ao nível de significância de,5%. 1 3 4 5 6 f oi 58 55 5 43 40 5 f ei 50 50 50 50 50 50 6
Teste de aderência UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ 3) Um livro foi impresso com 1000 páginas. Acreditase que o número de erros por página observado no livro, apresentado na tabela abaixo, estão distribuídos segundo a distribuição de Poisson. Utilize o nível de significância de 1% para avaliar esta hipótese. Número de erros por página Número de páginas observado (f oi ) Número de páginas esperado (f ei ) 0 1 3 4 500 340 10 30 10 49 349 14 9 5 7
Teste de aderência UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ H o : as freqüências observadas distribuem-se segundo Poisson H 1 : as freqüências observadas não distribuem-se segundo Poisson calc < crit Logo, aceita-se a hipótese nula, ou seja, ao nível de significância de 1%, o número de erros por páginas do livro estão distribuídos segundo a distribuição de Poisson. 8
Teste de Independência Este teste é utilizado para verificar se há independência entre duas variáveis aleatórias X e Y, sendo que X tem n amostras e Y tem m amostras. A tabela de contingência abaixo apresenta as freqüências observadas. X 1 X... X n Y 1 f o11 f o1... f o1n Y f o1 f o... f on............... Y m f om1 f om... f omn 9
Teste de Independência Procedimentos: 1º) Definir as hipóteses: H o : as variáveis X e Y são independentes H 1 : as variáveis X e Y não são independentes º) Fixar o nível de significância (α); 3º) Determinar a região de aceitação (RA) de H o através da abscissa na tabela da distribuição qui-quadrado para (n - 1).(m - 1) graus de liberdade e nível de significância α; 10
4º) Montar a tabela de contingência das freqüências esperadas f eij que é a soma dos elementos da linha i multiplicado pela soma dos elementos da coluna j dividido pelo total de observações; 5º) Determinar o valor da estatística: Teste de Independência n m ( f oij - feij ) calc = i= 1 j= 1 feij calc crit 6º) Se < aceita-se H o, caso contrário rejeita-se H o. 11
Teste de Independência UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ Exemplo Pesquisou-se a preferência de 4 emissoras de rádio em 3 bairros diferentes com 500 pessoas, numa determinada cidade. O resultado está apresentado na tabela abaixo. Verifique se há independência entre o bairro onde foi realizado a pesquisa e a preferência pela emissora, ao nível de significância de 10%. Tabela de contingência das freqüências observadas (f oij ) Emissora Bairro B1 B B3 E1 56 4 10 00 E 39 30 56 15 E3 19 9 50 E4 36 19 70 15 150 100 50 500 1
Teste de Independência UNIVERSIDADE TECNOLÓGICA FEDERAL DO PARANÁ Exemplo H o : as variáveis Bairro e Emissora são independentes H 1 : as variáveis Bairro e Emissora não são independentes Tabela de contingência das freqüências esperadas (f eij ) Bairro Emissora B1 B B3 E1 60 40 100 00 E 37,5 5 6,5 15 E3 15 10 5 50 E4 37,5 5 6,5 15 150 100 50 500 13
calc < crit Logo, aceita-se a hipótese nula, ou seja, ao nível de significância de 10%, existe independência entre o bairro onde foi realizado a pesquisa e a preferência pela emissora de rádio. 14