Testes não-paramétrcos Prof. Lorí Val, Dr. http://www.mat.ufrgs.br/val/ val@mat.ufrgs.br Um teste não paramétrco testa outras stuações que não parâmetros populaconas. Estas stuações podem ser relaconamentos, modelos, dependênca ou ndependênca e aleatoredade. Algumas vantagens São menos exgentes do que os paramétrcos. Dspensam, por exemplo, a normaldade dos dados; Independem da forma da população da qual a amostra fo obtda; Em geral, as probabldades das estatístcas são exatas, salvo quando se usam aproxmações para grandes amostras. Algumas restrções ao seu uso Em, geral, não permtem testar nterações. Isto restrnge a sua aplcação aos modelos mas smples; A obtenção, utlzação e nterpretação das dstrbuções de probabldade, são em geral, mas complexas. Exstem mutos testes estatístcos não paramétrcos. Alguns tens devem ser levados em conta na sua escolha: a manera como a amostra fo obtda, a natureza da população da qual se extrau a amostra, o tpo de varável envolvda e o tamanho da amostra dsponível. 1
Formular as hpóteses; Defnr ou fxar um valor crítco (α); Defnr a regão crítca (ponto de corte); Identfcar e calcular a estatístca teste; Tomar uma decsão; Formular (expressar) a conclusão. Uma amostra Duas amostras Váras amostras Dependentes Independentes Dependentes Independentes Qu-Quadrado Bnomal KS (Kolmogorov-Smrnov)
O teste qu-quadrado O teste χ² de uma amostra pode ser utlzado para verfcar se os valores de uma varável se enquadram em duas ou mas categoras. Verfca-se se exste dferença sgnfcatva entre o número observado de valores, em cada categora, e o número esperado, baseado na hpótese de nuldade. Hpóteses H 0 : O modelo é adequado H 1 : O modelo não é adequado A varável teste é: χ = k ( ) O -E =1 E Onde: O = número de casos observados classfcados na categora. E = número de casos esperados na categora sob H o, onde k = número de categoras. Se há concordânca entre os valores observados e os esperados, as dferenças (O - E ) serão pequenas e, conseqüentemente, χ será também pequeno. Se as dvergêncas, entretanto, forem grandes, o valor de χ, será também grande. Pode-se mostrar que a dstrbução amostral de χ, sob H o, calculada pela fórmula acma, segue a dstrbução ququadrado com um número de graus de lberdade gual a k-1 onde k é gual ao número de categoras em que a varável fo classfcada. 3
Suponha que uma moeda é lançada 800 vezes fornecendo 43 caras. Verfque se a moeda pode ser consderada vcada ao nível de 5% de sgnfcânca. Realze o teste paramétrco correspondente para verfcar se a mesma conclusão poderá ser obtda. Hpóteses H 0 : A moeda é honesta H 1 : A moeda não é honesta Dados: Moeda Cara Coroa Total Resultados 43 368 800 A varável vel teste é: Moeda Caras Coroas Total O 43 368 800 Resultado E (O E) /E 400,56 400,56 800 5,1 χ 1 Então: χ χ = (43-400) = + 400 =,56+,56 = 5,1 k ( ) O -E = 1 E (368-400) 400 = Qual X utlzar? O número de graus de lberdade é dado por: v = k 1, onde k = número de lnhas das tabela. Como k =, então v = 1. Ponto de Corte Como α = 5% e v = 1, tem-se: Assm: χ 1 = 3,84 4
Regão Crítca DECISÃO e CONCLUSÃO: O valor crítco χ é tal que: P(χ > 3,84) = 5%. Então RC = [3,84; ). Regão de Não Rejeção χ c α = 5% RC = [ 3,84 = 5,1 ; ) Como χ = 5,1 RC ou 5,1 > 3,84, Rejeto H 0, sto é,, a 5% de sgnfcânca, pode-se afrmar que a moeda é vcada. OPÇÃO Trabalhar com o valor p, sto é,, com a sgnfcânca dor resultado obtdo. Como este valor é 5,1, tem-se: Assm o valor-p =,37% que é menor que a sgnfcânca do teste que é 5%. Portanto, rejeta-se a hpótese de que a moeda é honesta e afrma-se, com base nesta amostra, e a uma sgnfcânca de 5%, que ela é vcada. Objetvos O teste é aplcado a varáves dcotômcas. Assm a população é supostamente uma Bernoull de parâmetro p de onde uma amostra de tamanho n é retrada. 5
Suposções (a) O resultado de cada tentatva é classfcado como sm ou não ou anda como sucesso ou falha ; (b) A probabldade de sucesso p é constante em todas as tentatvas; (c) As n tentatvas são ndependentes. Hpóteses H 0 : p = p 0 H 1 : p p 0 p > p 0 p < p 0 A varável teste: X = número de sucessos nas n tentatvas ndependentes é uma Bnomal de parâmetros n e p, sto é, X ~ B(n; p). Fxado um nível de sgnfcânca α, rejetamos H 0 se: P(X x) = F(x) α, no teste unlateral à esquerda; P(X x) = 1 F(x-1) α no teste unlateral à dreta; P(X x 0 ) + P(X x 1 ) = = F(x 0 ) + 1 F(x 1 ) α, onde α = α 1 + α com α 1 α, em geral. Se n for grande (np 5 e nq 5) então é possível aproxmar pela dstrbução normal. Admtndo-se a proporção de 3:1 em F 1, da le de Mendel, para 80 observações obteve-se o segunte resultado: Domnante: 56 Recessvo: 4 Verfque se esses dados estão de acordo com a le. 6
Teste pela Bnomal Aproxmando pela Normal Resolva com o SPSS Objetvos O teste de Kolmogorov-Smrnov, ou smplesmente K-S, tem o mesmo objetvo do teste qu-quadrado, mas além de mas poderoso, pode ser aplcada a amostras, em geral, menores. Em 1933 Kolmogorov defnu a estatístca e em 1939 Smrnov a utlzou para construr o teste. Lmtações Só é aplcável a varáves contínuas; Tende a ser mas sensível próxmo ao centro da dstrbução do que nas caudas; A dstrbução precsa ser totalmente especfcada. Se os parâmetros forem estmados a partr dos dados a regão crítca não é mas válda. Hpóteses H 0 : O modelo é adequado H 1 : O modelo não é adequado A varável teste é: d 1 1 = max ( F ( x ) 1 n n ; n F( x ) Onde: F(x) = P(X x) é a função de dstrbução acumulada do modelo, sto é, de acordo com a hpótese nula 7
A tabela Se a dferença observada d, de acordo com a expressão dada for maor do que o valor crítco tabelado em função de α e n, rejeta-se a hpótese nula. Para valores de n até 50 exste uma tabela que fornece os valores crítcos da dferença d, para os valores de α = 5% e α = 1%. Se n > 50 os valores crítcos para os valores de alfa acma são dados por: 1,36 n e 1,63 n Respectvamente. Uma amostra de n = 10 valores, forneceu o segunte resultado: 1,9 10,66 10,81 9,65 9,16 13,10 10,65 9,8 8,07 11,56 11,73 8,60 7,17 9,56 9,41 8,84 9,74 7,41 10,70 10,10 Teste a hpótese de que ela possa ter sdo orgnada de uma população normal de méda 10 e desvo padrão. 8
x 7,11 8,84 8,89 9,54 10,98 11,09 11,64 1,30 13,4 14,05 F(x) 0,0741 0,804 0,900 0,4086 0,6877 0,7075 0,794 0,8747 0,9476 0,9786 G(x) 0,1000 0,000 0,3000 0,4000 0,5000 0,6000 0,7000 0,8000 0,9000 1,0000 Esquerda 0,0741 0,1804 0,0900 0,1086 0,877 0,075 0,194 0,1747 0,1476 0,0786 Dreta 0,059 0,0804 0,0100 0,0086 0,1877 0,1075 0,094 0,0747 0,0476 0,014 Verfca-se, portanto que a maor dferença em valores absolutos é: 0,877. Consultando a tabela dos valores crítcos da dstrbução desta dferença tem-se: 0,410 para uma sgnfcânca de 5% e e 0,490 para uma sgnfcânca de 1%. Conclusão Como a maor dferença obtda D = 0,88 não supera os valores crítcos 0,410 e 0,490, aceto H 0, sto é, a 5% (1%) de sgnfcânca não se pode afrmar que a população não é provenente de uma N(10; ). Opção Realzar o teste utlzando o SPSS. Exercíco! 9