Teste de Wilcoxon-Mann-Whitney

Documentos relacionados
Coeficientes de correlação

Teste de Cochran-Mantel-Haenszel

Função discriminante linear de Fisher

Coeficientes de correlação e testes de independência

Curso R. Teste de Hipóteses. Alexandre Adalardo de Oliveira. Ecologia- IBUSP maio 2017

Análise de agrupamentos por métodos hierárquicos aglomerativos

Análise fatorial em R

Introdução ao R. Anderson Castro Soares de Oliveira

Estimação e Testes de Hipóteses

Função prcomp em R. 1. Introdução

Função prcomp. 1. Introdução

Exame Final de Métodos Estatísticos

Testes qui-quadrado e da razão de verossimilhanças

Estatística descritiva

Trabalho 4. Simulações e exemplo

CE-003: Estatística II - Turma: K/O, 2 a Prova (22/06/2016)

Notas de aula Testes de Hipóteses. Idemauro Antonio Rodrigues de Lara

Testes de Hipóteses. : Existe efeito

1. Conceitos básicos de estatística Níveis de medição Medidas características de distribuições univariadas 21

Apontamentos de Introdução às Probabilidades e à Estatística

Testes não paramétricos são testes de hipóteses que não requerem pressupostos sobre a forma da distribuição subjacente aos dados.

Resolução dos exemplos da apostila Capítulo 5 - Teste de Hipóteses

Teste de hipóteses. Testes de Hipóteses. Valor de p ou P-valor. Lógica dos testes de hipótese. Valor de p 31/08/2016 VPS126

Se a afirmação de João é verdadeira, temos o seguinte conjunto em seu bolso.

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

Pesquisa Quantitativa. Comparações de Médias. Pesquisa Quantitativa Roteiro Geral. Roteiro do Módulo. Prof. Lupércio França Bessegato - UFJF 1

ANÁLISE DE SOBREVIVÊNCIA Teoria e aplicações em saúde. Caderno de Respostas Capítulo 4 Estimação não-paramétrica

Prof. a Dr. a Simone Daniela Sartorio de Medeiros. DTAiSeR-Ar

Exame de Recorrência de Métodos Estatísticos. Departamento de Matemática Universidade de Aveiro

Módulo VII: Estatística elementar

Técnicas Computacionais em Probabilidade e Estatística I. Aula I

Testes de significância com dados multivariados

MLG gama em R. # Estatísticas descritivas by(dados$resist, dados[, c("volt", "temp")], function(x) c(length(x), mean(x), sd(x), sd(x) / mean(x)))

Análise Estatística em Epidemiologia Utilizando o Ambiente R - I

Por que testes não-paramétricos?

Prof. Lorí Viali, Dr.

Comparando Duas Amostras (abordagem não-paramétrica)

1) Como vou comparar 3 grupos realizo uma Anova one way:

Capítulo 4 Inferência Estatística

Capítulo 6. Experimentos com um Fator de Interesse. Gustavo Mello Reis José Ivo Ribeiro Júnior

Importação e Exportação de dados

Case Processing Summary

Uso de procedimentos de estatistica na obtenção de resultados de toxicidade

SUMÁRIO. Prefácio, Espaço amostrai, Definição de probabilidade, Probabilidades finitas dos espaços amostrais fin itos, 20

Teoria da Estimação. Fabricio Goecking Avelar. junho Universidade Federal de Alfenas - Instituto de Ciências Exatas

ME613 - Análise de Regressão

Teste Mann-Whitney. Contrapartida não-paramétrica para. Teste-t para amostras independentes

EXEMPLOS DE CÁLCULO DO TAMANHO AMOSTRAL. Desenvolvido por Lucas Lima Ayres

MINICURSO DE TESTES DE HIPÓTESES E INTERVALOS DE CONFIANÇA

Bioestatística. Paulo Nogueira quarta-feira, 11 de Janeiro de 2012

Incerteza, exatidão, precisão e desvio-padrão

Inferência Estatística:

Escolha dos testes INTRODUÇÃO À BIOESTATÍSTICA QUANTIFICAÇÃO DOS GRUPOS DO ESTUDO PESQUISA INFERÊNCIA ESTATÍSTICA TESTE DE HIPÓTESES E

RAD1507 Estatística Aplicada à Administração I Prof. Dr. Evandro Marcos Saidel Ribeiro RESUMO -

Capacitação em R e RStudio PROJETO DE EXTENSÃO. Software R: capacitação em análise estatística de dados utilizando um software livre.

Estatística Computacional A - Aula SAS 01 Estatísticas Descritivas Prof. José Carlos Fogo

ESTUDO DE CASO. Terapêutica e prevenção secundária no tumor do pulmão

BOOTSTRAP. - APLICAÇÃO DO MB: podem ser aplicados quando existe, ou não, um modelo probabilístico bem definido para os dados.

O teste qui-quadrado. A variável teste é: χ E. Os testes. Hipóteses e Cálculo H 0 : As variáveis são independentes H 1 : As variáveis são dependentes

Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística PPGEMQ / PPGEP - UFSM

Os testes. O teste de McNemar O teste de Wilcoxon O teste do sinais

Capítulo 6 Estatística não-paramétrica

Filho, não é um bicho: chama-se Estatística!

INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA. Prof. Anderson Rodrigo da Silva

1 AULA 3 - MODELO DE REGRESSÃO LINEAR

Estatística Aplicada. Inferência estatística com desvio padrão populacional desconhecido Estimativa de proporção Capítulo 10 Itens 10.4 a 10.

SUMÁRIO. 1.1 Introdução, Conceitos Fundamentais, 2

Transcrição:

## Distribuição exata de U m <- 3 n <- 4 faixa <- 0:(m * n) d0 <- dwilcox(faixa, m, n) plot(faixa, d0, type = "h", xlab = "u", ylab = "P(U = u)", lwd = 3) Teste de Wilcoxon-Mann-Whitney m <- 7 n <- 9 faixa <- 0:(m * n) d0 <- dwilcox(faixa, m, n) plot(faixa, d0, type = "h", xlab = "u", ylab = "P(U = u)", lwd = 3) ## Dados # Ex. 21, p. 119 em Noether (1991) # Ganho de peso em ratos (em g) # Dieta nova é mais econômica. # Verifique se o ganho de peso justifica adotar a dieta nova. padrao <- c(22.5, 19.1, 11.4, 16.8, 23.5, 22.3, 19.7, 21.2, 16.0, 20.4, 25.3, 17.5) nova <- c(11.4, 13.7, 20.3, 14.7, 11.8, 17.7, 14.5, 12.3, 14.5, 13.0, 22.0, 13.6) cat("\ Tamanhos amostrais: m =", m <- length(padrao), ", n =", n <- length(nova)) Tamanhos amostrais: m = 12, n = 12 summary(padrao) Min. 1st Qu. Median Mean 3rd Qu. Max. 11.40 17.32 20.05 19.64 22.35 25.30 summary(nova) Min. 1st Qu. Median Mean 3rd Qu. Max. 11.40 12.82 14.10 14.96 15.45 22.00 # Amostra combinada comb <- c(nova, padrao) 1

# Gráfico de pontos dieta <- factor(rep(c("nova", "Padrão"), times = c(m, n))) stripchart(comb ~ dieta, method = "stack", pch = 20, cex = 2, xlab = "Ganho de peso (g)", col = c("red", "blue"), ylab = "Dieta") Os valores mínimos ( = 11,4) para as duas dietas são iguais. # Função distribuição empírica Sm <- ecdf(nova) Sn <- ecdf(padrao) plot(sm, main = "", pch = 20, xlim = range(comb), xlab = "Ganho de peso (g)", ylab = "Probabilidade", col = "red") lines(sn, col = "blue", pch = 20) legend("bottomright", c("nova", "Padrão"), lty = 1, col = c("red", "blue"), bty = "n") 2

## Gráfico de quantis (QQ) faixa <- range(comb) qqplot(padrao, nova, pch = 20, xlim = faixa, ylim = faixa, xlab = "Ganho de peso - padrão (g)", ylab = "Ganho de peso - nova (g)", col = "blue") abline(0, 1, lty = 2) # Teste de Wilcoxon-Mann-Whitney wilcox.test(nova, padrao, alternative = "greater") Wilcoxon rank sum test with continuity correction data: nova and padrao W = 26.5, p-value = 0.9961 alternative hypothesis: true location shift is greater than 0 Warning message: In wilcox.test.default(nova, padrao, alternative = "greater") : cannot compute exact p-value with ties Adotando um nível de significância de 5%, com base nos dados coletados e utilizando o teste de Mann- Whitney, não há evidência de aumento no ganho de peso com a dieta nova (p = 0,9961). Neste exemplo, em que há empates, o valor-p é calculado com correção de continuidade (correct = TRUE é a opção por default). Nota 1. Como você justificaria a aplicação do teste de Mann-Whitney a estes dados? Uma estimativa do deslocamento entre as duas funções distribuição pode ser obtida com a opção conf.int = TRUE. result <- wilcox.test(nova, padrao, alternative = "greater", conf.int = TRUE) 3

A estimativa da diferença (= -5,20) está no componente result$estimate. Com esta estimativa podemos obter a função distribuição empírica do ganho de peso com a dieta nova após deslocamento e comparar com a função distribuição empírica do ganho de peso com a dieta padrão. # Função distribuição empírica com deslocamento Smloc <- ecdf(nova - result$estimate) plot(sn, main = "", pch = 20, xlim = range(nova, padrao - result$estimate), xlab = "Ganho de peso (g)", ylab = "Probabilidade", col = "blue") lines(smloc, col = "red", pch = 20) legend("bottomright", c("padrão", "Nova deslocada"), lty = 1, col = c("blue", "red"), bty = "n") Nota 2. Utilize o gráfico acima para responder à pergunta da Nota 1. Nota 3. Verifique se é apropriado utilizar o teste t de Student para amostras independentes. Um intervalo de confiança (IC) para a diferença de localização (diferença mediana) está no componente result$confint. 95 percent confidence interval: -7.799986 Inf A função wilcox_test do pacote coin permite obter inferências exatas para a diferença de localização, mesmo quando há empates. Havendo empates, a distribuição da estatística de teste é exata condicional. Esta função requer uma formula com a variável resposta do lado esquerdo e a variável de classificação (da classe factor) do lado direito. 4

library(coin) wilcox_test(comb ~ dieta, distribution = "exact", conf.int = TRUE, alternative = "greater") Exact Wilcoxon Mann-Whitney Rank Sum Test data: comb by dieta (Nova, Padrão) Z = -2.6281, p-value = 0.9968 alternative hypothesis: true mu is greater than 0 95 percent confidence interval: -7.8 Inf sample estimates: difference in location -5.2 Neste exemplo a função wilcox_test efetua a comparação utilizando nova padrão respeitando a ordem alfabética dos níveis do fator dieta. Se for necessário, a ordem dos níveis de um fator pode ser modificada com o argumento levels na chamada da função factor. Nota 4. Procure refazer o exemplo utilizando outros pacotes estatísticos (SAS, SPSS, Minitab e Statistica, por exemplo). A obtenção manual das estimativas para a diferença de localização (θ) é apresentada abaixo. ## Estimação de teta alfa <- 0.05 # Nível de sig. De <- sort(outer(nova, padrao, FUN = "-")) # Diferenças ordenadas qalfa <- qwilcox(alfa, m, n) # Quantil alfa As diferenças ordenadas podem ser calculadas sem a função outer. De <- sort(nova[rep(1:m, each = n)] - padrao[rep(1:n, times = m)]) # Posição do limite inferior do IC if (pwilcox(qalfa, m, n) == alfa) k <- qalfa else k <- qalfa - 1 cat("\n Estimativa pontual de teta =", median(de)) Estimativa pontual de teta = -5.2 cat("\n Limite inferior do IC de", 100 * (1 - alfa), "% para teta =", De[k + 1]) Limite inferior do IC de 95 % para teta = -7.8 Nota 5. Apresente um IC bilateral para θ com coeficiente de confiança igual a 90%. 5