Métodos Não Paramétricos

Documentos relacionados
Estimador: combinação dos elementos da amostra, construída com a finalidade de representar, ou estimar, um parâmetro de interesse na população.

Testes de Hipóteses Não Paramétricos

Universidade Federal do Paraná Seminário de Bioestatistica. Teste de Wilcoxon. Danielle Pierin Olivia Cleto

Stela Adami Vayego DEST/UFPR

Stela Adami Vayego Estatística II CE003/DEST/UFPR

Em aplicações práticas é comum que o interesse seja comparar as médias de duas diferentes populações (ambas as médias são desconhecidas).

Estatística Não Paramétrica

A moeda é honesta ou é desequilibrada? Qual é a probabilidade de "cara"no lançamento de uma moeda?

Por que testes não-paramétricos?

Comparando Duas Amostras (abordagem não-paramétrica)

Exemplo 1: Sabemos que a média do nível sérico de colesterol para a população de homens de 20 a 74 anos é 211 mg/100ml.

Testes de Aderência Testes de Independência Testes de Homogeneidade

Testes para dados categóricos

7 Teste de Hipóteses

Teste U de Mann-Whitney BRUNA FERNANDA BATTISTUZZI BARBOSA KAUANA SOARES PAULO ROGÉRIO DA SILVA

Os testes. O teste de McNemar O teste de Wilcoxon O teste do sinais

TESTES NÃO-PARAMÉTRICOS

TESTES NÃO PARAMÉTRICOS (para mediana/média)

1 Probabilidade - Modelos Probabilísticos

Aula 9 Planejamento e Análise de Experimentos

Estudar a relação entre duas variáveis quantitativas.

Planejamento de Experimentos Introdução - Teste t

INTRODUÇÃO À ESTATÍSTICA BÁSICA AULA 4

Parte 8 Testes de hipóteses Comparação de dois grupos

TESTES NÃO-PARAMÉTRICOS

Escolha dos testes INTRODUÇÃO À BIOESTATÍSTICA QUANTIFICAÇÃO DOS GRUPOS DO ESTUDO PESQUISA INFERÊNCIA ESTATÍSTICA TESTE DE HIPÓTESES E

Teste Mann-Whitney. Contrapartida não-paramétrica para. Teste-t para amostras independentes

Análise Multivariada Aplicada à Contabilidade

Métodos Quantitativos Aplicados

PROBABILIDADE E ESTATÍSTICA INFERÊNCIA ESTATÍSTICA Parte II

Estimação e Testes de Hipóteses

Testes de Hipótese PARA COMPUTAÇÃO

Métodos Quantitativos em Medicina. Prof. Neli Ortega

Intervalos de Confiança

AULA 07 Inferência a Partir de Duas Amostras

Amostragem Aleatória e Descrição de Dados - parte I

Princípios de Bioestatística Teste de Hipóteses

Bioestatística. Mestrado Saúde Materno Infantil 2005 Prof. José Eulálio Cabral Filho

AULA 04 Teste de hipótese

Capítulo 6 Estatística não-paramétrica

Apostila de estatística básica Minitab Organizador: Daniel Magalhães Lima. Autores:

Variância pop. * conhecida Teste t Paramétrico Quantitativa Distribuição normal Wilcoxon (teste dos sinais, Wilcoxon p/ 1 amostra)

TESTE DE MANN-WHITNEY

Inferência a partir de duas amostras

PROJETO E ANÁLISES DE EXPERIMENTOS (PAE) INTRODUÇÃO AOS MÉTODOS ESTATÍSTICOS EM ENGENHARIA

Aula 5. Teste de Hipóteses II. Capítulo 12, Bussab&Morettin Estatística Básica 7ª Edição

Probabilidade e Estatística

AULA 05 Teste de Hipótese

José Aparecido da Silva Gama¹. ¹Professor do Instituto Federal de Educação, Ciência e Tecnologia de Alagoas.

ANÁLISE DOS RESÍDUOS. Na análise de regressão linear, assumimos que os erros E 1, E 2,, E n satisfazem os seguintes pressupostos:

Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística PPGEMQ / PPGEP - UFSM

Capítulo 4 Probabilidade. Seção 4-1 Visão Geral. Visão Geral. Regra do Evento Raro para Inferência Estatísticas:

Estatística aplicada a ensaios clínicos

Análise da Regressão múltipla: MQO Assintótico y = β 0 + β 1 x 1 + β x +... β k x k + u 3. Propriedades assintóticas Antes, propriedades sobre amostra

O teste qui-quadrado. A variável teste é: χ E. Os testes. Hipóteses e Cálculo H 0 : As variáveis são independentes H 1 : As variáveis são dependentes

Curso de Especialização em Fisioterapia Traumato-Ortopédica / 2010 NOÇÕES DE STICA

Notas de Aula. Estatística Elementar. by Mario F. Triola. Tradução: Denis Santos

Testes de hipóteses. Wagner H. Bonat Fernando P. Mayer Elias T. Krainski

MÉTODOS EXPERIMENTAIS E TÉCNICAS DE MEDIDAS

TESTES DE HIPÓTESES. Conceitos, Testes de 1 proporção, Testes de 1 média

Resposta da questão. ÐR(s) = -45R/77. Resposta da questão. Resposta da questão. Resposta da questão R = R³ (Ë2) / 2. Resposta da questão.

TESTE DE HIPÓTESES NÍVEL DESCRITIVO

POPULAÇÃO X AMOSTRA INTRODUÇÃO À BIOESTATÍSTICA TIPOS DE VARIÁVEIS CLASSIFICAÇÃO DAS VARIÁVEIS CLASSIFICAÇÃO DAS VARIÁVEIS 1) TIPOS DE VARIÁVEIS

Testes t para comparação de médias de dois grupos independentes

Bioestatística e Computação I

ANÁLISE DE VARIÂNCIA - ANOVA. Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística - PPGEMQ / PPGEP - UFSM

Teste de hipóteses. Testes de Hipóteses. Valor de p ou P-valor. Lógica dos testes de hipótese. Valor de p 31/08/2016 VPS126

Métodos Estatísticos Avançados em Epidemiologia

Testes de hipóteses com duas amostras CURSO DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA. Módulo: ESTIMATIVA E TESTE DE HIPÓTESE.

TESTE t-student TESTE IGUALDADE DE VARIÂNCIAS

PROBABILIDADE E ESTATÍSTICA. Profa. Dra. Yara de Souza Tadano

Prof. Dr. Alfredo J Rodrigues. Departamento de Cirurgia e Anatomia Faculdade de Medicina de Ribeirão Preto Universidade de São Paulo

Carlos Antonio Filho

1 Teoria da Decisão Estatística

Conceitos Básicos Teste t Teste F. Teste de Hipóteses. Joel M. Corrêa da Rosa

CÁLCULO DIFERENCIAL E INTEGRAL (CDI) PROF. APARECIDO E. MORCELLI

MATEMÁTICA DISCRETA E LÓGICA MATEMÁTICA PROF. APARECIDO EDILSON MORCELLI

INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA. Prof. Anderson Rodrigo da Silva

X ~ Binomial (n ; p) H: p = p 0 x A: p p 0 (ou A: p > p 0 ou A: p < p 0 ) { X k 1 } U { X k 2 } (ou { X k } ou { X k }) x RC não rejeitamos H

Métodos Quantitativos para Ciências Sociais Professor: Marcos Vinicius Pó

Inferência Estatística

Transcrição:

Métodos Não Paramétricos Para todos os testes estatísticos que estudamos até este ponto, assumimos que as populações tinham distribuição normal ou aproximadamente normal. Essa propriedade era necessária para que os testes fossem válidos. Testes paramétricos : assumem que a distribuição seja conhecida e que somente os valores de certos parâmetros tais como as médias e os desvios padrões sejam desconhecidos. Se os dados não satisfazem as suposições feitas pelas técnicas tradicionais, métodos não paramétricos de inferência estatística devem ser usados. Técnicas não paramétricas fazem poucas suposições sobre as distribuições originais. Testes de hipóteses não paramétricos seguem o mesmo procedimento geral que os testes paramétricos: Formulamos as hipóteses a serem testadas; calculamos o valor da estatística do teste usando os dados contidos em uma amostra aleatória de observações Dependendo da grandeza dessa estatística, ou rejeitamos ou não a hipótese nula. 1

Amostras dependentes (Pareadas) Exemplo: Estudo para investigar o uso de oxigenação extracorpórea (ECMO),um sistema mecânico para oxigenar o sangue, no tratamento de recém-nascidos com falha respiratória neonatal. Imagina-se que o uso desse procedimento pode reduzir o rendimento do ventrículo esquerdo de uma criança, diminuindo a quantidade de sangue bombeado ao corpo. Gostaríamos de comparar a dimensão do ventrículo esquerdo antes e durante o uso do ECMO. Tabela 13.4 Amostra de 15 bebês com dificuldade respiratória dimensão (cm) Sujeito Antes Durante Di=Yi-Xi Posto Posto Sinalizado (Xi) (Yi) 1 1,6 1,6 0,0-2 2,0 2,0 0,0-3 1,2 1,2 0,0-4 1,6 1,6 0,0-5 1,6 1,5 0,1 2,5 2,5 6 1,7 1,6 0,1 2,5 2,5 7 1,6 1,5 0,1 2,5 2,5 8 1,6 1,7-0,1 2,5-2,5 9 1,6 1,4 0,2 5,5 5,5 10 1,7 1,5 0,2 5,5 5,5 11 1,0 1,3-0,3 8,0-8,0 12 1,5 1,8-0,3 8,0-8,0 13 1,5 1,8-0,3 8,0-8,0 14 1,4 1,8-0,4 10,0-10,0 15 1,5 2,0-0,5 11,0-11,0 Total 18,5-47,5 2

Não assumiremos que a população das diferenças da dimensão do ventrículo esquerdo seja normalmente distribuída usaremos um teste não paramétrico H: não existe efeito do ECMO (diferença mediana = 0 ou se a distribuição for simétrica D= 0). A: existe efeito do ECMO (diferença mediana 0 ou se a distribuição for simétrica D 0). Teste do Sinal Calculamos a diferença para cada par de observações. D i = X i -Y i Se D i > 0, ao par é atribuído um sinal + se D i < 0, ele recebe um sinal - Se D i = 0 não fornece informação e em geral são excluídos da análise. Quando as diferenças são excluídas, o tamanho da amostra n deve ser coerentemente reduzido. Seja S= D i (quantidade de sinais + na amostra) Sob a hipótese nula esperamos ter aproximadamente no. iguais de sinais + e -. Equivalentemente, a probabilidade de que uma diferença seja positiva é ½ e a probabilidade de que seja negativa é também ½. S ~ b(n; 0,5). O teste do sinal não faz suposição sobre a distribuição das diferenças, mas leva em conta apenas o sinal da diferença ignorando a grandeza dessas diferenças. O teste do sinal não é freqüentemente usado na prática. 3

Teste de Postos Sinalizados de Wilcoxon Leva em consideração as grandezas das diferenças, assim como seus sinais. Procedimento: selecionamos uma aa. de n pares de observações calculamos a diferença de cada um dos pares ignorando os sinais dessas diferenças, ordenamos seus valores absolutos do menor até o maior obtendo os postos. Uma diferença = 0 não é ordenada; ela é eliminada da análise e o tamanho da amostra é reduzido de 1 para cada par eliminado. Se houver empate é atribuído um posto médio. Finalmente, atribuímos a cada posto ou um sinal de mais ou um sinal de menos dependendo do sinal da diferença. Exemplo: Xi Yi Di Di Posto Posto sinalizado 300 350-50 50 4-4 410 390 20 20 1 +1 420 490-70 70 5-5 410 435-25 25 2-2 400 440-40 40 3-3 H: D = 0 A: D < 0 Sejam T + = soma dos postos positivos = 1 T - = -(soma dos postos negativos) = 14 T + + T - = 15 = n(n+1)/2 4

Podemos utilizar como estatística do teste T + ou T -. Em geral utiliza-se a menor soma. Rejeito H se T + for pequeno ou Rejeito H se T - for grande Trabalharemos com T +. Para realizar o teste precisamos da distribuição dessa estatística sob a hipótese H. Sob a hipótese H (a mediana da população original de diferenças é igual a 0), esperamos que a amostra tenha aproximadamente no. iguais de postos positivos e negativos. a soma dos postos positivos deve ser comparável em grandeza à soma dos postos negativos. cada ponto tem a mesma probabilidade de ser associado com um sinal + ou com um sinal -. Logo a seqüência de postos sinalizados é uma de todas as possíveis combinações de 1, 2, 3, 4, 5. Há 2 5 = 32 combinações. Todas equiprováveis sob H, ou seja com probabilidade 1/32. 5

Tabela: 1 2 3 4 5 T + 1 2 3 4 5 T + + + + + + 15 + + - + - 7 - + + + + 14 - + - - + 7 + - + + + 13 - - + + - 7 + + - + + 12 + - - - + 6 - - + + + 12 + + + - - 6 + + + - + 11 - + - + - 6 - + - + + 11 + - - + - 5 + + + + - 10 - + + - - 5 - + + - + 10 - - - - + 5 + - - + + 10 + - + - - 4 - + + + - 9 - - - + - 4 - - - + + 9 + + - - - 3 + - + - + 9 - - + - - 3 + + - - + 8 - + - - - 2 + - + + - 8 + - - - - 1 - - + - + 8 - - - - - 0 Tabela: T + 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 Frequência 1 1 1 2 2 3 3 3 3 3 3 2 2 1 1 1 Nível descritivo P 0,05, n é pequeno, devemos rejeitar H, ou seja, indicação de que a medida após o tratamento é menor do que a medida antes. 6

Estatística T + Existe tabela para a realização do teste Para n >50 aproximação normal Voltando ao exemplo: Como diferença = 0 não é ordenada e existem 4 dessas no conjunto de dados, o tamanho da amostra é reduzido para n = 11. A menor soma de postos é T + = 18,5. Como n é pequeno, não utilizaremos a aproximação normal. Pela tabela temos que P 2.(0,12) = 0,24 não rejeitamos a hipótese nula. Conclusão: O tratamento com ECMO parece não ter efeito no rendimento dos ventrículos esquerdos dos bebês. O teste pode ser feito utilizando um computador (Minitab). 7

Amostras independentes Teste de Wilcoxon ou Mann-Whitney avalia a hipótese nula de que as medianas de duas populações sejam idênticas Exemplo: Considere as distribuições de escores de idade mental normalizados de duas populações de crianças que sofrem de fenilcetonúria (PKU). Os indivíduos com essa desordem são incapazes de metabolizar a proteína fenilalanina. Acredita-se que um elevado nível sérico de fenilalanina aumenta a probabilidade de deficiência mental da criança. Grupo 1: crianças com níveis séricos de fenilalanina diários médios abaixo de 10,0 mg/dl; Grupo 2 : crianças com níveis médios acima de 10,0 mg/dl. Gostaríamos de comparar os escores de idade mental normalizados para essas duas populações de crianças. Mas não vamos assumir que os escores de idade mental normalizados sejam normalmente distribuídos. 8

TABELA : Escores de idade mental normalizados (nma) para duas amostras de crianças sofrendo de fenilcetonúria. < 10,0 mg/dl > 10,0 mg/dl nma (mos) Posto nma (mos) Posto 34,5 2,0 28,0 1,0 37,5 6,0 35,0 3,0 39,5 7,0 37,0 4,5 40,0 8,0 37,0 4,5 45,5 11,5 43,5 9,0 47,0 14,5 44,0 10,0 47,0 14,5 45,5 11,5 47,5 16,0 46,0 13,0 48,7 19,5 48,0 17,0 49,0 21,0 48,3 18,0 51,0 23,0 48,7 19,5 51,0 23,0 51,0 23,0 52,0 25,5 52,0 25,5 53,0 28,0 53,0 28,0 54,0 31,5 53,0 28,0 54,0 31,5 54,0 31,5 55,0 34,5 54,0 31,5 56,5 36,0 55,0 34,5 57,0 37,0 58,5 38,5 58,5 38,5 TOTAL 467,0 313,0 Existem 21 crianças com baixa exposição e 18 crianças com alta exposição. 9

Procedimento: selecionar uma aa. independente de cada uma das populações de interesse. combinar as duas amostras em um grande grupo, ordenar as observações da menor até a maior e atribuir um posto a cada uma. Se existirem observações empatadas, atribuir um posto médio para todas as medidas com o mesmo valor. encontrar a soma dos postos correspondente a cada uma das amostras originais. A menor das duas somas é denotada por W. Estatística: W Sob a hipótese nula (as populações originais têm medianas idênticas) esperamos que os postos sejam distribuídos aleatoriamente entre os dois grupos e que os postos médios para cada uma das amostras sejam aproximadamente iguais. Distribuição de W, sob H, está tabelada (n 2 é o maior dos dois tamanhos de amostras e n 1 é o menor. Para cada combinação de W 0, n 1 e n 2, a entrada na tabela corresponde à probabilidade de que W seja menor ou igual a W 0 ) sendo n S : representa o número de observações na amostra que tem a menor soma de postos e n L o número de observações na amostra com a maior soma. 10

Para grandes valores de n S e n L, segue uma distribuição normal padrão aproximada, assumindo que a hipótese nula seja verdadeira. Os histogramas dos escores indicam que a distribuição não é normal, distribuição parece ser assimétrica à esquerda para os dois grupos. grupo de baixa exposição: soma dos postos é 467 grupo de alta exposição: soma dos postos é 313 W = 313. Além disso, E(W)= 360 e Var(W) = 35,5 2 Logo, z W = -1,32, e P=2.P(Z W < -1,32) = 0,186 Como P> 0,05, não rejeitamos a hipótese nula. As amostras não fornecem evidência de uma diferença nos escores medianos de idade metal normalizados para as duas populações; crianças com alta exposição sérica de fenilalanina obtiveram um nível de funcionamento mental que é comparável ao nível de crianças com baixa exposição. 11

Uma estatística equivalente a W é: Chamada de estatística de Mann-Whitney. Nesse caso, 12

Vantagens e Desvantagens são simples não dependem da distribuição da população da qual a amostra foi selecionada não exigem que as populações originais sejam normalmente distribuídas dados não precisam ser quantitativos basta que tenham uma escala ordinal uso de postos faz as técnicas não paramétricas menos sensíveis aos erros de medidas do que os testes tradicionais Se as suposições básicas de um teste paramétrico são satisfeitas, os testes não paramétricos são menos poderosos do que a técnica paramétrica correspondente. OBS.: se uma grande proporção de observações são empatadas, um termo de correção precisa ser adicionado aos cálculos. 13

This document was created with Win2PDF available at http://www.daneprairie.com. The unregistered version of Win2PDF is for evaluation or non-commercial use only.