Testes não-paramétricos Pro. Lorí Viali, Dr. http://www.pucrs.br/amat/viali/ viali@pucrs.br Um teste não paramétrico testa outras situações que não parâmetros populacionais. Estas situações podem ser relacionamentos, modelos, dependência ou independência e aleatoriedade. Algumas vantagens São menos exigentes do que os paramétricos. Dispensam, por exemplo, a normalidade dos dados; Independem da orma da população da qual a amostra oi obtida; Em geral, as probabilidades das estatísticas são exatas, salvo quando se usam aproximações para grandes amostras. Algumas restrições ao seu uso Em, geral, não permitem testar interações. Isto restringe a sua aplicação aos modelos mais simples; A obtenção, utilização e interpretação das distribuições de probabilidade, são em geral, mais complexas. Existem muitos testes estatísticos não paramétricos. Alguns itens devem ser levados em conta na sua escolha: a maneira como a amostra oi obtida, a natureza da população da qual se extraiu a amostra, o tipo de variável envolvida e o tamanho da amostra disponível. 1
Formular as hipóteses; Deinir ou ixar um valor crítico (α); Deinir a região crítica (ponto de corte); Identiicar e calcular a estatística teste; Tomar uma decisão; Formular (expressar) a conclusão. Uma amostra Duas amostras Várias amostras Dependentes Independentes Dependentes Independentes O teste qui-quadrado O teste ² de uma amostra pode ser utilizado para veriicar se os valores de uma variável se enquadram em duas ou mais categorias. Veriica-se se existe dierença signiicativa entre o número observado de valores, em cada categoria, e o número esperado, baseado na hipótese de nulidade.
Hipóteses H 0 : O modelo é adequado H 1 : O modelo não é adequado A variável teste é: k ( ) O -E i 1 i E i i Onde: O i número de casos observados classiicados na categoria i. E i número de casos esperados na categoria i sob H o, onde k número de categorias. Se há concordância entre os valores observados e os esperados, as dierenças (O i - E i ) serão pequenas e, conseqüentemente, será também pequeno. Se as divergências, entretanto, orem grandes, o valor de, será também grande. Pode-se mostrar que a distribuição amostral de, sob H o, calculada pela órmula acima, segue a distribuição quiquadrado com um número de graus de liberdade igual a k-1 onde k é igual ao número de categorias em que a variável oi classiicada. Suponha que uma moeda é lançada 800 vezes ornecendo 43 caras. Veriique se a moeda pode ser considerada viciada ao nível de % de signiicância. Realize o teste paramétrico correspondente para veriicar se a mesma conclusão poderá ser obtida. 3
Hipóteses H 0 : A moeda é honesta H 1 : A moeda não é honesta Dados: Moeda Cara Coroa Resultados 43 368 800 Moeda Caras Coroas O i 43 368 800 Resultado E i (Oi Ei) /E i 400,6 400,6 800,1 1 A variável vel teste é: Então: (43-400) + 400,6+,6,1 k ( ) O -E i 1 i E (368-400) i 400 i Qual X utilizar? O número n de graus de liberdade é dado por: v k 1, onde k número n de linhas das tabela. Como k, então v 1. Ponto de Corte Região Crítica Como α % e v 1, tem-se: α % Assim: 1 3,84 Região de Não Rejeição c RC,1 [ 3,84 ; ) 4
DECISÃO e CONCLUSÃO: O valor crítico é tal que: P( > 3,84) %. Então RC [3,84; ). Como,1 RC ou,1 > 3,84, Rejeito H 0, isto é,, a % de signiicância, pode-se airmar que a moeda é viciada. OPÇÃO Trabalhar com o valor p, isto é,, com a signiicância dor resultado obtido. Como este valor é,1, tem-se: Assim o valor-p,37% que é menor que a signiicância do teste que é %. Portanto, rejeita-se a hipótese de que a moeda é honesta e airma-se, com base nesta amostra, e a uma signiicância de %, que ela é viciada. Objetivos Hipóteses O teste de Kolmogorov-Smirnov, ou simplesmente K-S, tem o mesmo propósito do teste qui-quadrado, mas além de mais poderoso, pode ser aplicada a amostras, em geral, menores. H 0 : O modelo é adequado H 1 : O modelo não é adequado A variável teste é: d max F ( x ) -G ( x )
Onde: F(x) P(X x) é a unção de distribuição acumulada do modelo, isto é, de acordo com a hipótese nula G(x) representa as reqüências acumuladas da amostra. Se a dierença observada d, de acordo com a expressão dada or maior do que o valor crítico tabelado em unção de α e n, rejeita-se a hipótese nula. A tabela Para valores de n até 0 existe uma tabela que ornece os valores críticos da dierença d, para os valores de α % e α 1%. Se n > 0 os valores críticos para os valores de ala acima são dados por: 1,36 1,63 e n n Respectivamente. Uma amostra de n 10 valores, orneceu o seguinte resultado: 1,9 9,16 8,07 7,17 9,74 10,66 13,10 11,6 9,6 7,41 10,81 10,6 11,73 9,41 10,70 9,6 9,8 8,60 8,84 10,10 6
x F(x) G(x) Esquerda Direita 7,11 0,0741 0,1000 0,0741 0,09 Teste a hipótese de que ela 8,84 8,89 0,804 0,900 0,000 0,3000 0,1804 0,0900 0,0804 0,0100 possa ter sido originada de uma população normal de média 10 e desvio padrão. 9,4 10,98 11,09 11,64 1,30 0,4086 0,6877 0,707 0,794 0,8747 0,4000 0,000 0,6000 0,7000 0,8000 0,1086 0,877 0,07 0,194 0,1747 0,0086 0,1877 0,107 0,094 0,0747 13,4 0,9476 0,9000 0,1476 0,0476 14,0 0,9786 1,0000 0,0786 0,014 Conclusão Veriica-se, portanto que a maior dierença em valores absolutos é: 0,877. Consultando a tabela dos valores críticos da distribuição desta dierença tem-se: 0,410 para uma signiicância de % e e 0,490 para uma signiicância de 1%. Como a maior dierença obtida D 0,88 não supera os valores críticos 0,410 e 0,490, aceito H 0, isto é, a % (1%) de signiicância não se pode airmar que a população não é proveniente de uma N(10; ). Opção Realizar o teste utilizando o SPSS. Exercício! 7
O teste qui-quadrado O teste ² de duas ou mais amostras independentes pode ser utilizado para veriicar a dependência ou independência entre as variáveis sendo consideradas. As variáveis devem estar tabuladas em tabelas de contingência. Para o caso de duas variáveis tem-se uma tabela de dupla entrada. Hipóteses e Cálculo H 0 : As variáveis são independentes H 1 : As variáveis são dependentes A variável teste é: k l O -E i 1 j 1 υ E ( ) Expressão alternativa A variável teste é: υ k E ( ) O -E i 1 E O k i 1 l j 1 l j 1 - n Onde: Onde: r número de linhas da tabela; L número de colunas da tabela; O reqüência observada na interseção da linha i com a coluna j. E número de casos esperados na interseção da linha i com a coluna j. υ n é a estatística teste; k 1 i l O tamanho da amostra; j 1 E n p são as reqüências esperadas de cada célula da tabela. 8
p é a probabilidade de ocorrer uma observação na célula. Se as variáveis são supostamente independentes (H 0 é Verdadeira), então p p i. p.j, onde p i. é a probabilidade marginal correspondente à linha i e p.j é a probabilidade marginal correspondente a coluna j. Como não se conhecem as probabilidades marginais, elas devem ser estimadas através das correspondentes reqüências relativas. Então: E n p n p i.. p. j n. n i.. n. j i. n. j i. l j 1 e. j k 1 i A tabela mostra os resultados de uma avaliação de satisação com a compra de um novo modelo de automóvel de luxo. Teste a hipótese de que o novo modelo está agradando mais aos consumidores homens do que os consumidores mulheres. Consumidores Homens Mulheres Muito 30 Avaliação Pouco Não Satiseito 0 1 9
Hipóteses Totais marginais H 0 : Homens e mulheres estão igualmente satiseitos. H 1 : Homens e mulheres não estão igualmente satiseitos. Consumidores Homens Mulheres M 30 P 0 NS 1 0 6 3 100 Freqüências Esperadas Cálculo do Qui-Quadrado Consumidores Homens Mulheres M 3,7 19, P 16, 8,7 NS 13 7 0 6 3 100 Consumidores Homens Mulheres M 0,9 1,71,64 P 0,86 1,607,473 NS 0,310 0,70 0,880,100 3,900,990 A estatística stica amostral O grau de liberdade é: ν ( k -1 )( l -1 ) ( -1).( 3-1) Então: ( ) O -E i 1 3 j 1 E,990 Qual a signiicância deste resultado? Estes resultado 4,99% < % signiicância do teste. Rejeito H 0. 10
Objetivos A prova de Kolmogorov-Smirnov de duas amostras veriica se elas oram extraídas da mesma população (ou de populações com a mesma distribuição). A prova bilateral é sensível a qualquer dierença nas distribuições das quais se extraíram as amostras (posição central, dispersão ou assimetria). Metodologia A prova unilateral é utilizada para determinar se os valores da população da qual se extraiu uma das amostras são, ou não, estocasticamente maiores do que os valores da população que originou a outra amostra. O teste utiliza as distribuições acumuladas. A prova de uma amostra veriica a concordância entre a distribuição de um conjunto de valores amostrais e uma distribuição teórica. A prova de duas amostras visa a concordância entre dois conjuntos de valores amostrais. Aplicação Se as duas amostras oram extraídas da mesma população, então se espera que as distribuições acumuladas das amostras estejam próximas. Se as distribuições estão distantes isto sugere que as amostras provenham de populações distintas e um desvio grande pode levar a rejeição da hipótese de nulidade. Para aplicar a prova constrói-se a distribuição das reqüências acumuladas relativas de cada uma das amostras, utilizando os mesmos intervalos (amplitude de classes) para cada uma delas. Em cada intervalo subtraí-se uma unção da outra. A prova utiliza como estatística o maior destas dierenças. 11
Hipóteses H 0 : As amostras são da mesma pop. H 1 : As amostras não são da mesma pop. A variável teste é: d max S 1 ( x ) - S ( x ) S 1 (x) Fr 1 (x) é a Freqüência acumulada da amostra 1 e Onde: S (x) Fr (x) é a Freqüência acumulada da amostra. Se a dierença observada d, de acordo com a expressão dada or maior do que o valor crítico tabelado em unção de α e n, rejeita-se a hipótese nula. A tabela Se o n > 40 e o teste é bilateral, então o valor crítico é dado por: d 1,36 n1 + n n n Se o teste é unilateral, então o valor crítico é dado por: n n 1 4 D n + n 1 1 Amostras de n 1 n 0 valores das opiniões de diretores inanceiros de grandes e pequenas empresas mostraram os resultados da tabela seguinte, medidos em uma escala Likert de pontos: 1
Amostras de n 1 n 0 valores das opiniões de diretores de empresas Grande e Pequenas Escala 1 3 4 Grandes 8 10 1 1 0 Pequenas 1 13 10 8 4 0 Teste a hipótese de que opiniões dos diretores dos dois tipos de empresa são divergentes. Determinação das Dierenças Escala 1 3 4 Grandes 8 10 1 1 0 Pequenas 1 13 10 8 4 0 Fr 1 (x) 0,10 0,6 0,46 0,76 1,00 Fr (x) 0,30 0,6 0,76 0,9 1,00 D 0,0 0,30 0,30 0,16 0,00 0,30 Como as amostras são grandes n > 40, o qui-quadrado deve ser utilizado. Assim: d 1,36 n n n + 1 n 1 0,7 Conclusão Conclusão - SPSS A menos de um erro de % (signiicância), posso airmar que as opiniões dos diretores inanceiros de empresas grandes e pequenas são divergentes. Most Extreme Dierences K-S Z Assymp. Sig. (-tailed) Absolute Positive Negative Result 0,3 0,00-0,3 1,600 0,01 13