Les-0773: ESTATÍSTICA APLICADA III TESTES NÃO-PARAMÉTRICOS AULA 3 26/05/17 Prof a Lilian M. Lima Cunha Maio de 2017 Revisão... Teste dos Sinais A Comparar valores de medianas de uma amostra com um valor hipotético k que representa uma mediana hipotética B Comparar cada valor da amostra 1 com respectivo valor da amostra 2, sendo ambas dependentes ou pareadas 1
Revisão... Teste dos Sinais CASO A EXEMPLO 2 Aula 2 (passada) Revisão... Respostas Teste dos Sinais CASO A Rejeita-se Ho pois z e menor ou igual ao valor critico (tabela Z) Formula usada 2
Revisão... Teste dos Sinais CASO B EXEMPLO 5 Aula 2 (passada) Revisão... Teste dos Sinais CASO B Ho: notas não melhoraram Ha: Notas melhoraram (maiores) x = Valores positivos = 18 Valores negativos = 26 Valores nulos = 2 n = 44 Excel... Tabela 4 valor critico = -1,65 z = - 1,055 Não Rejeita Ho 3
TESTE DE WILCOXON TESTE DE POSTOS DE SINAIS DE WILCOXON Teste não paramétrico que pode ser usado para determinar se 2 amostras dependentes foram selecionadas de populações que possuem a mesma distribuição - O Teste de Wilcoxon é uma extensão do Teste de Sinais. É mais interessante pois leva em consideração a magnitude da diferença para cada par. - O teste de sinal analisa apenas o sinal das diferenças, mas o Teste de Wilcoxon usa o sinal e ordena as diferenças. 4
TESTE DE POSTOS DE SINAIS DE WILCOXON Quando nós temos dados emparelhados e os pressupostos de um teste-t emparelhado não forem atendidos, temos duas maneiras para elaborar o teste de hipóteses: O Teste de Wilcoxon é sempre preferido ao Teste dos Sinais já que usa mais informação contida nos dados (já que usa as ordens). O Teste de Wilcoxon tem muito mais potência do que o Teste dos Sinais para detectar uma diferença significativa. Não há uma grande perda de potência no Teste de Wilcoxon comparado a um teste-t quando se mantém a suposição de normalidade. Por outro lado, o Teste de Wilcoxon é muito mais potente do que o teste-t quando não é válida a suposição de normalidade. TESTE DE POSTOS DE SINAIS DE WILCOXON Passo1 Hipóteses Teste unicaudal à esquerda, à direita e bicaudal intuitivamente H 0 : Mediana = 0 H a : Mediana > 0 ou Mediana < 0 ou Mediana 0 5
TESTE DE POSTOS DE SINAIS DE WILCOXON Passo 2 Especificar o nível de significância Passo 3 Cálculo da estatística do teste: TESTE DE POSTOS DE SINAIS DE WILCOXON Passo 4 Determine o tamanho da amostra n a partir da soma dos sinais + e - desconsiderar os valores nulos Passo 5 Determine o valor crítico (tabelado) tabela 9- wilcoxon - impressa Passo 6 6
TESTE DE POSTOS DE SINAIS DE WILCOXON Grandes amostras n > 25 A estatística do teste, dada por w s deve ser calculada considerando a aproximação para a normal: calculado sendo W s terá distribuição aprox. normal Para determinar o valor crítico (tabelado) usar tabela Z- impressa distribuição normal padrão REGRA DE DECISÃO Tabela 9 wilcoxon-impressa : : : 7
EXEMPLO 1 TESTE DE POSTOS DE SINAIS DE WILCOXON amostras pareadas/dependentes com musica 45 38 28 39 41 47 62 54 33 44 sem musica 38 40 33 36 42 41 54 47 28 35 Hip pesquisa = crença do psicólogo EXEMPLO 1 Ho: Não há diferença na duração das sessões de exercícios Ha: Há diferença na duração das sessões de exercícios com musica sem musica diferença valor absoluto posto posto de sinais 45 38 7 7 38 40-2 2 28 33-5 5 39 36 3 3 41 42-1 1 47 41 6 6 62 54 8 8 54 47 7 7 33 28 5 5 44 35 9 9 8
EXEMPLO 1 sem ordem ordenando... valor absoluto valor absoluto posto 7 1 1 2 2 2 5 3 3 3 5 4,5 1 5 4,5 6 6 6 8 7 7,5 7 7 7,5 9 5 8 8 9 9 9 EXEMPLO 1 Soma dos postos negativos = -7,5 Soma dos postos positivos = 47,5 Adicionar os sinais da coluna diferença na coluna posto com musica sem musica diferença valor absoluto posto posto de sinais 45 38 7 7 7,5 7,5 38 40-2 2 2-2 28 33-5 5 4,5-4,5 39 36 3 3 3 3 41 42-1 1 1-1 47 41 6 6 6 6 62 54 8 8 9 9 54 47 7 7 7,5 7,5 33 28 5 5 4,5 4,5 44 35 9 9 10 10 9
EXEMPLO 1 Soma dos postos negativos = -7,5 Soma dos postos positivos = 47,5 Em módulo, a soma dos postos negativos é menor Corresponde a estatística do teste o valor crítico (tabelado), com 5% de significância, bicaudal, n = 10 Vale 8 ( ver tabela 9- wilcoxon - impressa ) Logo, REJEITO Ho Ho: Não há diferença na duração das sessões de exercícios Ha: Há diferença na duração das sessões de exercícios TESTE DE SOMA DE POSTOS DE WILCOXON Conhecido como Teste Wilcoxon Mann-Whitney É um teste não-paramétrico que pode ser usado para determinar se 2 amostras independentes foram selecionadas de populações que possuem a mesma distribuição * O tamanho das amostras deve ser no mínimo 10 informações * As amostras podem ou não ter o mesmo tamanho * Quando amostras tiverem tamanhos diferentes, então determinar como n 1 = menor amostra 10
TESTE DE SOMA DE POSTOS DE WILCOXON Passo1 Hipóteses Teste unicaudal ou bicaudal Passo 2 Especificar o nível de significância Passo 3 Determine os tamanhos das amostras (n 1 e n 2 ) Passo 4 Listar as informações das 2 amostras em ordem crescente e encontre o posto: TESTE DE SOMA DE POSTOS DE WILCOXON Passo 5 1) Encontre a soma dos postos (R) para a menor amostra (n 1 ) 3) Calcule a estatística do teste, dada por: sendo e Passo 6 Para determinar o valor crítico (tabelado) usar tabela Z- impressa distribuição normal padrão 11
TESTE DE SOMA DE POSTOS DE WILCOXON Passo 7 Regra de Decisão : : : OBSERVAÇÃO Apesar de os valores n 1 e n 2 serem relativamente pequenos, a aproximação normal de R mostra-se satisfatória. Portanto, pode-se usar z calculado para pequenas amostras nesse caso. (Hoffmann, pg 227-229) 12
EXEMPLO 2 A tabela abaixo mostra os ganhos (milhares de dólares) de uma amostra aleatória de representantes de vendas farmacêuticas de 10 homens e 12 mulheres. Com nível de significância de 10%, você pode concluir que há uma diferença entre ganhos de homens e mulheres? Ganhos dos homens 58 73 94 81 78 74 66 75 97 79 Ganhos das mulheres 66 57 81 73 65 78 71 67 64 77 80 70 EXEMPLO 2 Passo 1 Ho: Não há diferença entre ganhos de homens e mulheres Ha: Há diferença entre os ganhos de homens e mulheres Passo 2 Passo 3 n 1 = menor amostra = amostra de homens = 10 n 2 = amostra de mulheres = 12 13
EXEMPLO 2 Passo 4 Listar as informações das 2 amostras em ordem crescente e encontre o posto: Imformações empilhadas 58 73 94 81 78 74 66 75 97 79 66 57 81 73 65 78 71 67 64 77 80 70 Homens Mulheres Imformações empilhadas Amostra POSTO 57 M 1 58 H 2 64 M 3 65 M 4 66 H 5,5 66 M 5,5 67 M 7 70 M 8 71 M 9 73 H 10,5 73 M 10,5 74 H 12 75 H 13 77 M 14 78 H 15,5 78 M 15,5 79 H 17 80 M 18 81 H 19,5 81 M 19,5 94 H 21 97 H 22 EXEMPLO 2 Passo 4 Listar as informações das 2 amostras em ordem crescente e encontre o posto: 14
EXEMPLO 2 Passo 5 R = soma dos postos de homens (menor amostra) = 2+5,5 +...+21 +22 = 138 Então: EXEMPLO 2 Passos 6 e 7 Valor critico = z critico = + 1,645 Valor calculado = z calculado = 1,52 NÃO REJEITA Ho +1,52-1,645 +1,645 15
TESTE QUI-QUADRADO Teste de Qui-Quadrado Utiliza dados de 2 amostras para comparar dados de populações, visando determinar: - Independência ou associação entre 2 variáveis aleatórias; - Homogeneidade dessa distribuição. Para isso, mede-se a distância entre os valores observados e aqueles que seriam esperados se eles possuíssem determinada distribuição 16
Teste de Independência -Usa dados amostrais para testar independência de 2 variáveis -Determinar se a ocorrência de uma das variáveis afeta a probabilidade de ocorrência de outra variável EXEMPLO: Em uma análise dos segmentos de mercado das 3 cervejas, a equipe de pesquisa de mercado da empresa levantou a seguinte questão: As preferências pelos 3 tipos de cerveja diferem entre os consumidores masculinos e femininos? Considere 5% de significância. Nesse caso, um teste de independência = trata da questão referente a se a preferencia pelo tipo de cerveja (light, comum ou escura) independe do sexo do consumidor (masculino e feminino). Então, as hipóteses são: Ho: A preferencia pelo tipo de cerveja independe do sexo Ha: A preferencia pelo tipo de cerveja depende do sexo Teste de Independência - Tabela de contingência DADOS Light Comum Escura Total Masculino 20 40 20 80 Feminino 30 30 10 70 Total 50 70 30 150 Tabela de contingencia = resume as respostas do estudo FREQUENCIAS OBSERVADAS 17
Teste de Independência FREQUENCIAS OBSERVADAS Light Comum Escura Total Masculino 20 40 20 80 Feminino 30 30 10 70 Total 50 70 30 150 FREQUENCIAS ESPERADAS Light Comum Escura Total Masculino 26,67 37,33 16 80 Feminino 23,33 32,67 14 70 Total 50 70 30 150 Teste de Independência OBSERVADAS Light Comum Escura Total Masculino 20 40 20 80 Feminino 30 30 10 70 Total 50 70 30 150 Do total de 150 consumidores de cerveja, temos que 50 preferem a light, 70 preferem a comum e 30 preferem a escura. Logo: Se Ho de independência for verdadeira, essas frações devem ser aplicáveis tanto para consumidores de cerveja homens e consumidores de cerveja mulheres. 18
Teste de Independência Generalizando..., FREQUENCIAS ESPERADAS Light Comum Escura Total Masculino 26,67 37,33 16 80 Feminino 23,33 32,67 14 70 Total 50 70 30 150 e 12 = (7/15) * 80 = 37,33 Teste de Independência Estatística do Teste = Oij = frequência observada da tabela de contingencia da linha i e coluna j eij = frequência esperada calculada a partir da tabela de contingencia da linha i e coluna j sob hipótese Ho considerada. Com n linhas e m colunas na tabela de contingencia, a estatística do teste tem uma distribuição qui-quadrado com (n-1) (m-1) graus de liberdade; Por ser qui-quadrado, usa-se teste qui-quadrado = teste cauda superior. Rejeitar se o calculado for maior ou igual ao tabelado 19
Teste de Independência RESOLVENDO... B A A 2 A 2 /B Sexo Cerveja preferida Observada Esperada diferenca diferenca quadrado estatistica do teste masculino Light 20 26,67-6,67 44,49 1,67 masculino Comum 40 37,33 2,67 7,13 0,19 masculino Escura 20 16 4 16,00 1,00 feminino Light 30 23,33 6,67 44,49 1,91 feminino Comum 30 32,67-2,67 7,13 0,22 feminino Escura 10 14-4 16,00 1,14 = =,,,,,,6,12,, Graus de liberdade = (n-1).(m-1) = (2-1).(3-1)= 2 Rejeito Ho, Graficamente..., çã 0 5,991 6,12 Rejeito Ho Ho: A preferencia pelo tipo de cerveja independe do sexo Ha: A preferencia pelo tipo de cerveja depende do sexo 20
Teste de Independência - RESUMO 1)Definir hipóteses 2)Definir nível de significância 3)Determinar tabela de contingencia (frequência observadas) e frequências esperadas 4)Estatística do teste 5)Determinar o valor critico (sempre unicaudal superior) 6)Rejeitar ou não Ho (calculado maior ou igual tabelado. 21
REFERENCIAS BIBLIOGRÁFICAS *ANDERSON, et al. Estatistica aplicada a administração e economia. Cap6 pg223-225; cap5 pg 181 189; Cap11 pg411-415. *HOFFMANN, R. Estatística para economistas. 2006, cap 12, pg212-215; cap13 pg221-229. *LARSON, R.; FARVER, B. Estatística aplicada. 2010, cap10, pg453-456;, cap11, pg585-502. 22