TESTE DE MANN-WHITNEY

TESTE DE MANN-WHITNEY A importância deste teste é ser a alternativa não paramétrica ao teste t para a diferença de médias. Sejam (X,X,...,X n ) e (Y,Y,...,Y m ) duas amostras independentes, de tamanhos n e m respectivamente, com n m. Suponhamos que µ X = E(X) e µ Y = E(Y) Pretende-se testar H 0 : µ X = µ Y H : µ X µ Y ou µ X > µ Y ou µ X < µ Y Cristina Lucas e Carla Henriques Departamento de Matemática ESTV

Procedimentos:. Tome-se a amostra conjunta, isto é, sem fazer diferenciação entre os dois grupos, e ordenem-se os valores de até n+m, mas sem perder o grupo de origem de cada observação.. Caso não haja empates a observação de valor mais baixo recebe o posto, a segunda mais baixa recebe o posto e assim sucessivamente. 3. Caso haja empates às observações com o mesmo valor (empatadas) atribui-se o posto médio dos postos que lhe corresponderiam casos tais empates não existissem. Cristina Lucas e Carla Henriques Departamento de Matemática ESTV

Estatística de teste Supondo (X, X,..., X i,..., X n ) a amostra de menor tamanho. Seja R(X i ) o posto da observação X i. A estatística de teste é dada por: T = n i= R(X i ) Cristina Lucas e Carla Henriques Departamento de Matemática ESTV 3

Testes bilaterais (H : µ X µ Y ) A região crítica será determinada com base na observação, na tabela de Mann- Whitney, de dois pontos críticos: T α/ directo da tabela Regra de Decisão T -α/ = nm - T α/ Rejeitar H 0 se T obs < T α/ ou T obs > T -α/ Não rejeitar H 0 se T α/ T obs T -α/ Cristina Lucas e Carla Henriques Departamento de Matemática ESTV 4

Testes unilaterais (H : µ X < µ Y ou µ X > µ Y ) A região crítica será determinada com base na observação, na tabela de Mann- Whitney, de um ponto crítico: T α directo da tabela Regra de decisão, para um teste unilateral à esquerda (µ X < µ Y ) Rejeitar H 0 se T obs < T α Regra de decisão, teste unilateral à direita (µ X > µ Y ) Rejeitar H 0 se T obs > T -α Cristina Lucas e Carla Henriques Departamento de Matemática ESTV 5

Quando os valores de m e n são elevados, a variável aleatória T tem uma distribuição aproximadamente Normal com média µ T e desvio padrão σ T. n(m + n + ) µ T = e σ T = nm(m + n + ) Isto é, a correspondente variável com valor médio nulo e variância unitária, é Z T T µ = σ T T ~ N(0,) Cristina Lucas e Carla Henriques Departamento de Matemática ESTV 6

TESTE DE KRUSKALL-WALLIS O teste de Kruskall-Wallis é uma generalização para k > amostras, do teste de Mann- Whitney. A estatística de teste baseia-se nos postos das observações e como tal, a variável em estudo (nos diferentes grupos) é uma variável ordinal. Cristina Lucas e Carla Henriques Departamento de Matemática ESTV 7

Suponha-se então a existência de k populações X, X,..., X k das quais foram retiradas k amostras aleatórias X, X,..., X n da população X X, X,..., X n da população X...... X k, X k,..., X n da população X k k e que existe independência, não só entre os elementos de cada amostra mas também entre os elementos de amostras distintas. H 0 : µ = µ =... = µ k H : i, j: µ i µ j, sendo µ i = E(X i ), i =,,...,k Cristina Lucas e Carla Henriques Departamento de Matemática ESTV 8

A estatística de teste baseia-se nos postos das observações:. Ordenem-se as k amostras conjuntamente. A observação de mais baixo valor tomará o posto, a segunda o posto e assim sucessivamente.. Caso existam empates, será atribuído o mesmo posto às observações empatadas. Este é a média aritmética dos postos que lhe corresponderiam se tais empates não existissem. Cristina Lucas e Carla Henriques Departamento de Matemática ESTV 9

Seja R(X ij ) o posto atribuído a X ij e R n = i R(X ) i ij j= a soma dos pontos das observações da i-ésima amostra (i=,,...,k). Seja o número total de observações. N = k n i i= Cristina Lucas e Carla Henriques Departamento de Matemática ESTV 0

No caso de não haver empates a estatística de teste de Kruskall-Wallis é: k R T = i 3(N ) N(N + ) n + No caso de haver empates a estatística de teste é dada por: onde S i= k R i N(N + ) T = S i= n i 4 k n i N(N + ) R N i= j= = i ( X ) ij 4 Cristina Lucas e Carla Henriques Departamento de Matemática ESTV

No caso de apenas três grupos, em que o tamanho dos grupos não exceda 5 e não existam empates, os valores críticos da estatística do teste encontram-se tabelados. Nas outras situações, utiliza-se como distribuição aproximada o χ com (k-) graus de liberdade, onde k é o número de amostras. Cristina Lucas e Carla Henriques Departamento de Matemática ESTV