TESTES NÃO - PARAMÉTRICOS As técnicas da Estatística Não-Paramétrica são, particularmente, adaptáveis aos dados das ciências do comportamento. A aplicação dessas técnicas não exige suposições quanto à distribuição da variável populacional. Os testes não-paramétricos são extremamente interessantes para análises de dados qualitativos. Na Estatística Paramétrica, para aplicação de teste como o t de Student, a variável em análise precisa ser numérica. Como o próprio nome sugere, a Estatística Não-Paramétrica independe dos parâmetros populacionais e de suas respectivas estimativas. Assim, se a variável populacional analisada não segue uma distribuição normal e/ou as amostras forem pequenas, pode-se aplicar um teste Não- Paramétrico. Vantagens dos Métodos Não-Paramétricos. Os métodos Não-Paramétricos podem ser aplicados a uma ampla diversidade de situações, porque não exigem populações distribuídas normalmente.. Ao contrário dos métodos Paramétricos, os métodos Não-Paramétricos podem freqüentemente ser aplicados a dados não-numéricos. 3. Os métodos Não-Paramétricos em geral envolvem cálculos mais simples do que seus correspondentes Paramétricos, sendo, assim, mais fáceis de entender. Desvantagens dos Métodos Não-Paramétricos. Os métodos Não-Paramétricos tendem a perder informação, porque os dados numéricos são freqüentemente reduzidos a uma forma qualitativa.. Os testes Não-Paramétricos não são tão eficientes quanto os testes Paramétricos; assim, com um teste Não-Paramétrico, em geral necessitamos de uma amostra maior ou maiores diferenças para então rejeitarmos uma hipótese nula.
Teste para Amostras Dependentes (Pareadas) Teste dos Sinais É utilizado para análise de amostras dependentes. Logo, esse teste é uma alternativa para o teste t para amostras dependentes. É aplicado em situações em que o pesquisador deseja determinar se duas condições são diferentes. O teste do sinal tem pouco poder, pois usa como informação apenas o sinal das diferenças entre pares. A única pressuposição exigida pelo teste do sinal é a de que a distribuição da variável seja contínua. Esse teste não faz qualquer suposição sobre a forma da distribuição das diferenças de médias. É útil nos trabalhos de pesquisa em que é impossível ou inviável a obtenção de uma mensuração quantitativa, mas é possível estabelecer postos em relação a cada um dos dois membros de cada par. A lógica do teste é que as condições podem ser consideradas iguais quando as quantidades de "+" e "-" forem aproximadamente iguais. Procedimento: a) Formular as hipóteses: a hipótese em teste é a de que as medidas feitas no par são iguais; b) Comparar o valor da primeira medida com o valor da segunda medida, feita no mesmo par de pessoas, animais ou objetos; atribuir o símbolo + para todo par de observações em que a primeira medida for maior do que a segunda e - quando acontecer o contrário; c) Contar o número de + e de - ; d) Para pequenas amostras utilize: Distribuição amostral. A probabilidade associada de ocorrência é dada pela distribuição binomial com p = q =. d) Para grandes amostras utilize: Aproximação da distribuição binomial pela normal. Do mesmo modos: p = q =
z = (x ± 0,5) - n n N ( 0, ) (x + 0,5) é utilizado quando x < n e (x 0,5) é utilizado quando x > n x - número de vezes que o sinal menos freqüente ocorre; n - tamanho da amostra descontando os empates. Obs.: Diferenças iguais a zero devem ser ignoradas. Essa solução, porém, só é satisfeita se houver poucos zeros. O teste dos sinais é fácil de aplicar e praticamente não exige pressuposições. Mas possui pouco poder. Siegel (977) apresenta um estudo referente ao efeito da ausência do pai no desenvolvimento das crianças. Dezessete casais foram entrevistados, pais e mães separadamente, e foi verificado o grau de discernimento quanto à disciplina paterna após o retorno dos pais ao lar, após uma grande ausência. Buscou-se então verificar se havia ou não diferença entre os cônjuges. Apesar de serem esperadas diferenças favoráveis à mãe, tendo em vista a ausência prolongada dos pais, considerou-se como hipótese inicial (nula) a de não diferença entre os pais. Além disso, três casais foram eliminados do estudo, tendo em vista que o pai e a mãe apresentaram graus de discernimento considerados iguais. Assim, os resultados referentes aos 4 casais restantes, as diferenças no grau de discernimento (Di) e o sinal destas diferenças, representados por se é positivo e por 0 se este sinal é negativo, são mostrados na tabela. Verifica-se que para casais o grau de discernimento da mãe é superior ao do pai, ou seja, existe uma forte evidência de que a suspeita dos psicólogos era correta em relação ao discernimento da autoridade paterna após o retorno ao lar. º Passo: Definição das hipóteses. 3
H H 0 : Não existe diferença : Existe diferença º Passo: Definição da estatística de teste. Supondo H 0 como verdadeira: X ~ Binomial n; 3º Passo: Introdução dos dados do problema. Os dados mostram que apenas 4 casais apresentam diferenças então X ~ Binomial 4;. p = P( X 3) = P( X = 0) + P( X = ) + P( X = ) + P( X = 3) = 4 4 4 4 3 4 4 = 0 = C + C4 + C4 + C 0,09 4º Passo: Definição do nível de significância e construção da região crítica. α = 5% Rejeite H 0 se p 0, 05 5º Passo: Conclusão. Rejeitamos H 0 utilizando 5% de significância. O exemplo a seguir é apresentado por Siegel (977). Suponha que um pesquisador esteja interessado em avaliar se determinado filme sobre delinqüência juvenil contribui para modificar a opinião de uma comunidade sobre quão severa deve ser a punição para tais casos. Para isso extrai-se uma amostra de tamanho 00 e realiza-se um estudo do tipo antes e depois. O resultado encontra-se resumido no quadro abaixo: 4
º Passo: Definição das hipóteses. H H 0 : O filme não produz efeito sistemático : O filme produz efeito sistemático º Passo: Definição da estatística de teste. Supondo 0 n (x ± 0,5) - n H como verdadeira: z = N ( 0, ) 3º Passo: Introdução dos dados do problema. Os dados mostram que 8 + 7 = 5 adultos não modificaram sua opinião. Logo a hipótese em estudo se aplica somente aos 85 adultos restantes. Desses 85 adultos 6 modificaram a sua opinião de mais para menos enquanto 59 modificaram de menos para mais. 85 (6 + 0,5) - = Z Calculado = 3,47 pois x < n, isto é, 6 < 85 = 4, 5 85 Ou, do mesmo modo: 85 (59 0,5) - = Z Calculado = 3,47 pois x > n, isto é, 59 > 85 = 4, 5 85 5
4º Passo: Definição do nível de significância e construção da região crítica. α = 5% Rejeite H 0 se Z Calculado, 96 ou Z Calculado, 96 5º Passo: Conclusão. Como Z Calculado = 3,47 >, 96 então rejeitamos H 0 utilizando 5% de significância, ou seja, rejeitamos a hipótese de que o filme não produz um efeito sistemático. Teste de Wilcoxon Trata-se de uma extensão do teste dos sinais. É mais interessante pois leva em consideração a magnitude da diferença para cada par. O teste de Wilcoxon exige que a variável em análise seja medida em escala ordinal ou numérica, e a diferença entre duas observações, feitas no mesmo par, também possa ser ordenada. Procedimento: a) Formular as hipóteses: a hipótese em teste é a de que as medidas feitas no par são iguais; b) Preparação: Calcular a diferença entre a primeira e a segunda medida, feitas no mesmo par, para todos os pares da amostra. Excluir as diferenças iguais a zero. Isso significa reduzir a amostra se houver diferenças iguais a zero; Independentemente do sinal, atribuir um posto a cada diferença; em caso de empates, atribuir a média dos postos empatados; Atribuir sinais nos postos, respeitando os sinais das diferenças; Obter o valor T que representa a menor das somas de postos de mesmo sinal; Determinar N que é o total das diferenças com sinal. c) Cálculo da estatística de teste: Se N 5, obter valor crítico através da tabela apropriada. Valores críticos da T Prova de Wilcoxon Exemplo da construção da Tabela de valores críticos para N = 8. Casos possíveis: 8 = 56 6
Distribuição de freqüência. 7
Se N > 5, determinar a média e o desvio-padrão aproximado da soma dos postos. Em seguida, obter o valor de z calculado e o valor de z tabelado. Significa 8
portanto, a utilização da aproximação da distribuição binomial pela distribuição Normal z calculado = T - µ σ N( N + ) sendo: µ T = e 4 T T σ T = N( N + )(N + ) 4 d) Critério de decisão: Se N 5, Rejeite H 0 se um Tcalculado Ttabela. Ou seja, rejeite H 0 para todos os valores de T tão pequenos que a probabilidade associada à sua ocorrência sob H 0 não seja superior a α %. Se N > 5, Para um teste bilateral: Rejeite H 0 se Z claculado < Para um teste unilateral superior: Rejeite H 0 se Para um teste unilateral inferior: Rejeite H 0 se Z α ou Z calculado Z calculado < Z calculado Exemplo: Foram ministrados dois testes similares para verificar o aprendizado. O objetivo é verificar se os dois testes apresentados são equivalentes. Os testes foram aplicados ao mesmo grupo de alunos; um no início do período letivo e outro no fim do período. Os resultados dos testes estão no quadro abaixo. > Z Z α α > Z α º Passo: Definição das hipóteses. H H 0 : Não existe diferença : Existe diferença 9
º Passo: Preparação e cálculo da estatística de teste. O valor T representa a menor das somas de postos de mesmo sinal e o valor de N que é o total das diferenças com sinal. 3º Passo: Critério de decisão. N = 8 T = 4 Como a amostra apresenta N 5, o valor crítico é obtido na tabela dos valores críticos de Wilcoxon. Como T calculado = 4 > Ttabela = 3 nesse caso não se rejeita-se a hipótese das médias serem iguais utilizando α = 5%. Repare que o p valor = 0,073 = 0,0547 > 5%. a probabilidade associada à sua ocorrência sob H 0 é superior a α %, logo não podemos rejeitar H 0. Obs.: Um ou outro empate não atrapalha o resultado, principalmente se a amostra é grande. Mas se os empates são muitos, não se pode aplicar a estatística de teste como definida acima. É preciso usar a fórmula com uma correção para os empates. Os programas computacionais fazem essa correção automaticamente. 0
Testes Não-Paramétricos para Amostras Independentes Teste de Mann-Whitney É usado para testar se duas amostras independentes foram retiradas de populações com médias iguais. Esse teste é, portanto, uma alternativa para o teste t para amostras independentes quando a amostra for pequena e/ou as pressuposições, exigidas pelo teste t, estiverem seriamente comprometidas. A única exigência do teste de Mann-Whitney é a de que as observações sejam medidas em escala ordinal ou numérica. Procedimento a) Formular as hipóteses: a hipótese em teste é a de que as medidas feitas no par são iguais b) Coloque os dados dos dois grupos em uma única ordenação crescente. Às observações empatadas atribuir a média dos postos correspondentes; c) Considerar n = número de casos do grupo ; n = número de casos do grupo ; d) Calcular R = soma dos postos do grupo ; R = soma dos postos do grupo ; e) Calcular a estatística de Mann-Whitney ( U ) U U n ( n + ) = nn + R, ou o que é equivalente: = n n + n n ( + ) R f) Escolher o menor valor de U, se n < 0 utilizar a tabela de valores críticos de Mann-Whitney ( U ), caso contrário para ser utilizado no cálculo de z. z = U - µ R σ R µ R = n n σ R = n ( n + n ) n +
A eficácia da publicidade dos dois produtos concorrentes (Marca X e Marca Y) foi comparado. Uma pesquisa de mercado realizada em um centro comercial local ofereceu a cada participante uma xícara de café e depois de degustar cada participante deu uma nota. º Passo: Ordenar as notas: º Passo: Calcular R e R 3º Passo: Calcular Calcular a estatística de Mann-Whitney ( U )
( n + ) n 6 7 U = n n + R = 6 6 + 3 = 34, n ( n + ) 6 7 U = n n + R = 6 6 + 55 = Menor valor de U = 4º Passo: Decisão O valor calculado U = é menos ou igual aos valores da tabela. Para α = 5%, U = 5 e para α = %, = Tabela U Tabela Nesse caso rejeita-se a hipótese nula de igualdade entre as médias populacionais. Teste Kruskal-Wallis Trata-se de teste extremamente útil para decidir se k amostras (k > ) independentes provêm de populações com médias iguais. Esse teste só deve ser aplicado se a amostra for pequena e/ou as pressuposições, exigidas para proceder à Análise de Variância, estiverem seriamente comprometidas. Como o teste de Mann-Whitney, esse teste também condiciona que a variável em análise seja medida em escala ordinal ou numérica. Procedimento a) Dispor, em ordem crescente, as observações de todos os k grupos, atribuindolhes postos de a n. Caso haja empates, atribuir o posto médio; b) Determinar o valor da soma dos postos para cada um dos k grupos: R i, i =,,..., k; c) Escolher uma variável Qui-quadrado com ν = k (cada amostra deve conter pelo menos 5 observações); d) Realizar o teste: H = N(N + ) K i= ( R ) i n i ( + ) 3 N Obs.: Esse teste exige variâncias iguais, por isso não deve ser usado se as diferentes amostras têm variâncias muito diferentes. O teste de Kruskal-Wallis é um teste unilateral à direita. 3
Obs.: Quando ocorrem muitos empates, não se deve utilizar a estatística H. É preciso aplicar uma correção na fórmula. Os aplicativos fazem essa correção automaticamente. Assim, se mais de um terço dos dados está envolvido em empates, use um software de estatística. 4
Valores críticos - Teste de Wilcoxon Fonte: http://www.sussex.ac.uk/users/grahamh/rmweb/wilcoxontable005.pdf 5
Valores críticos - Teste de Mann-Whitney Fonte:http://www.sussex.ac.uk/Users 6