Testes não paramétricos. Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais

Documentos relacionados
Testes de Aderência, Homogeneidade e Independência. Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais

Testes de Aderência, Homogeneidade e Independência

Testes de Aderência, Homogeneidade e Independência

Testes de Aderência, Homogeneidade e Independência

CE001 - BIOESTATÍSTICA TESTE DO QUI-QUADRADO

Aula 16: Análise de Aderência e Associação

Teste Qui-Quadrado Rio de Janeiro, 23 de setembro de 2012

AULA 8 Experimentos multinomiais e tabelas de contingência

Análise de Aderência e de Associação

- Testes Qui-quadrado - Aderência e Independência

TESTES NÃO-PARAMÉTRICOS

TESTE DO QUI-QUADRADO DE INDEPENDÊNCIA

2. Testes de Independência

- Testes Qui-quadrado - Aderência e Independência

Probabilidade e Estatística

Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência

Universidade Federal do Pará Instituto de Ciências Exatas e Naturais Faculdade de Estatística Bacharelado em Estatística

- Testes Qui-quadrado - Aderência e Independência

MAE Introdução à Probabilidade e Estatística II Resolução Lista 5

MAE0229 Introdução à Probabilidade e Estatística II

- Testes Qui-quadrado. - Aderência e Independência

Intervalos de Confiança

Testes de Aderência Testes de Independência Testes de Homogeneidade

Testes para dados categóricos

Stela Adami Vayego DEST/UFPR

ANÁLISE DE VARIÂNCIA - ANOVA. Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística - PPGEMQ / PPGEP - UFSM

16/6/2014. Teste Qui-quadrado de independência

Testes de hipóteses. Wagner H. Bonat Fernando P. Mayer Elias T. Krainski

Teste Qui-quadrado. Dr. Stenio Fernando Pimentel Duarte

PROVA DE QUI-QUADRADO QUADRADO. Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística - PPGEMQ / PPGEP - UFSM -

Capítulo 6 Estatística não-paramétrica

Métodos Quantitativos para Ciências Sociais Professor: Marcos Vinicius Pó

Medidas de Semelhança

Capítulo 6 Estatística não-paramétrica

UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO. PROJETO DE EXTENSÃO Software R: de dados utilizando um software livre. Teste Qui-Quadrado

Distribuições Amostrais

Inferência Estatística:

MOQ 13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO. PROJETO DE EXTENSÃO Software R: de dados utilizando um software livre. Teste de Qui-quadrado

Stela Adami Vayego Estatística II CE003/DEST/UFPR

Exemplo (tabela um) distribuições marginais enquanto que. Distribuição Conjunta

Estimação e Testes de Hipóteses

Considerações. Planejamento. Planejamento. 3.3 Análise de Variância ANOVA. 3.3 Análise de Variância ANOVA. Estatística II

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Métodos Quantitativos para Ciências Sociais Professor: Marcos Vinicius Pó. Categoria O 1 O 2 O 3 O 4 Freqüência

Medidas de associação entre duas variáveis qualitativas

Teste Qui-Quadrado para Independência Texto criado na data. 7 de novembro de 2018

ESTATÍSTICA NÃO-PARAMÉTRICA Aula 5

Tópicos Extras 1ª parte. Testes Não Paramétricos, Análise Multivariada, Outras Técnicas

Testes de Hipóteses para. uma Única Amostra. Objetivos de Aprendizagem. 9.1 Teste de Hipóteses. UFMG-ICEx-EST-027/031 07/06/ :07

Análise da Variância. Prof. Dr. Alberto Franke (48)

PHD 5742 Estatística Aplicada ao Gerenciamento dos Recursos Hídricos

Tópicos em Gestão da Informação II

Métodos Quantitativos para Ciências Sociais Professor: Marcos Vinicius Pó

Análise de dados categóricos

Estudo das hipóteses não paramétricas χ² de Pearson aplicado ao número de acidentes envolvendo motos na cidade de Campina Grande Paraíba.

Estatística Não Paramétrica. Como construir testes de aderência

Prof. Lorí Viali, Dr.

DELINEAMENTO EM BLOCOS AO ACASO

Distribuição de Probabilidade. Prof.: Joni Fusinato

X ~ Binomial (n ; p) H: p = p 0 x A: p p 0 (ou A: p > p 0 ou A: p < p 0 ) { X k 1 } U { X k 2 } (ou { X k } ou { X k }) x RC não rejeitamos H

Testes de Hipóteses: exemplos

Tópicos em Gestão da Informação II

Inferência Estatística:

Universidade de São Paulo Faculdade de Filosofia, Letras e Ciências Humanas Departamento de Ciência Política

INSTRUÇÕES. O tempo disponível para a realização das duas provas e o preenchimento da Folha de Respostas é de 5 (cinco) horas no total.

Delineamento e Análise Experimental Aula 3

Prof. Lorí Viali, Dr.

Mas, para começar a aplicar métodos estatísticos, é preciso conhecer alguns conceitos básicos.

Prof. Lorí Viali, Dr.

Lucas Santana da Cunha de outubro de 2018 Londrina

Inferência Estatística Básica. Teste de Hipóteses: decidindo na presença de incerteza

AULA 05 Teste de Hipótese

Unidade I. Profa. Ana Carolina Bueno

DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA)

PROVA DE ESTATÍSTICA SELEÇÃO MESTRADO/UFMG 2006

AULA 07 Inferência a Partir de Duas Amostras

ESTATÍSTICA Distribuições qui-quadrado, t de Student e F de Snedecor Lucas Schmidt

Análise de Dados Categóricos

Professora Ana Hermínia Andrade. Universidade Federal do Amazonas Faculdade de Estudos Sociais Departamento de Economia e Análise. Período 2017.

Gilberto Müller Beuren

Variância pop. * conhecida Teste t Paramétrico Quantitativa Distribuição normal Wilcoxon (teste dos sinais, Wilcoxon p/ 1 amostra)

Algumas vantagens. Algumas restrições ao seu uso

Cauê Teixeira Rebeca Fuccio Thabata Oliveira

Introdução à Bioestatística Turma Nutrição

Estatística aplicada a ensaios clínicos

PHD 5742 Estatística Aplicada ao Gerenciamento dos Recursos Hídricos. 6 a aula Testes de Hipóteses

Análise de Dados Categóricos

Testes de Hipóteses Genéticas. Alan Silva. Doutorando PPG-GEN AU08

Escola Superior de Agricultura Luiz de Queiroz Universidade de São Paulo. Teste de Hipóteses

Conceito de Estatística

FMU- Cursos de Tecnologia Disciplina: Métodos Quantitativos em Gestão e Negócios-

Estatística e Probabilidade. Aula 11 Cap 06

Teorema do Limite Central, distribuição amostral, estimação por ponto e intervalo de confiança

Teste Chi-Quadrado de Independência. Prof. David Prata Novembro de 2016

Os testes. Objetivos. O teste Q de Cochran; O teste de Friedman (Análise de variância de duplo fator por postos)

INTRODUÇÃO. Exemplos. Comparar três lojas quanto ao volume médio de vendas. ... ANÁLISE DE VARIÂNCIA. Departamento de Matemática ESTV.

Universidade de São Paulo Faculdade de Filosofia, Letras e Ciências Humanas Departamento de Ciência Política

Lucas Santana da Cunha de outubro de 2018 Londrina

Transcrição:

Testes não paramétricos Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais

Teste de hipótese Queremos saber se a evidência que temos em mãos significa que encontramos algo diferente daquela que suponhamos existir e se essa evidência é forte para podermos fazer afirmações. Para isso nos valemos de amostras e tentamos verificar o quando podemos dizer que estamos tratando de um evento estatisticamente raro, incomum. Problemas: Como saber que a nossa amostra não é um mero acaso? Com que critérios faremos o nosso julgamento? Que tipo de estatística pode nos ajudar a tomar uma decisão? 2

Variáveis categóricas São definidas em termos de ordem, classes ou categorias (masculino/feminino; profissão; escolaridade...). Variáveis quantitativas eventualmente podem ser classificadas em categorias (faixas salariais; anos de instrução...). Podemos verificar a freqüência das nossas observações em cada uma das categorias e comparar com uma referência usando-se tabelas de contingência. Problema: quantificar o grau de associação entre duas amostras. Como fazer? Proposta: medir o afastamento em relação a uma distribuição esperada. De que forma? verificar o desvio (distanciamento) das freqüências observadas em relação às esperadas. Como medir? Com a estatística Qui-quadrado (χ 2 ). 3

Aderência, homogeneidade e independência Comparar dados de populações visando determinar: Aderência à uma distribuição específica; Homogeneidade dessa distribuição; Independência ou associação entre 2 variáveis aleatórias. Para isso mede-se a distância entre os valores observados e aqueles que seriam esperados se eles possuíssem determinada distribuição. São chamados de testes não-paramétricos. 4

Testes Paramétricos Referem-se diretamente a uma determinada distribuição de parâmetros da população. Pressupostos: A estatística de teste deve ter uma distribuição probabilística conhecida. Os erros possuem distribuição normal. Os resíduos são aleatórios e independentes. Mais eficientes e precisos. Testes Não Paramétricos Não se baseiam diretamente em um modelo de distribuição de parâmetros da distribuição. Requerem menos pressupostos em relação à população. Não exigem normalidade. Podem ser aplicados a dados categóricos. Aplicação mais simples. Menos eficientes que os testes paramétricos. 5

Tabelas de contingência Tipo de tabela em forma de matriz que mostra a distribuição de freqüências multivariada estudada. São muito úteis para verificar a inter-relação entre as variáveis. Exemplo: Origem Uso de drogas Ocasional Frequente Total Capitais e regiões metropolitanas 43 9 52 Cidades do interior 44 4 48 Total 87 13 100 6

Estatística Qui-quadrado Usada para mensurar o afastamento dos resultados amostrais em relação à uma dada distribuição esperada das variáveis estudadas. Parâmetro necessário para determinar as probabilidades: graus de liberdade na tabela (ν). 7

Estatística Qui-quadrado (χ 2 ) 2 r s ( * nij n ) 2 ij ( f Ou * obs f i 1 j 1 n ij 2 2 fe) e Onde: n*: freqüência esperada r: total de categorias da variável X s: total de categorias da variável Y Onde fobs = freqüência observada em qualquer célula fe = freqüência esperada em qualquer célula 8

Tabela Qui-quadrado 9

Graus de liberdade na tabela Qui-quadrado São determinados pelo número de células que teriam preenchimento livre em uma tabela de contingência considerando que já sabemos as totalizações de linhas e colunas. Fórmula básica: gl = (l-1).(c-1) Preferência por tipo de programa Jovens Meia-idade Idosos Total Música 14 10 3 27 Noticiário 4 15 11 30 Esporte 7 9 5 21 Total 25 34 19 78 10

Exemplo: aderência Um dado é lançado 1.200 vezes, com os resultados expostos na tabela abaixo. Teste a hipótese de que o dado é honesto ao nível de 5% Ocorrência 1 2 3 4 5 6 Freqüência 190 179 228 183 226 194 RC = [11,070; + [ χ 2 = (200-190) 2 /200 +(200-228) 2 /200 + (200-179) 2 /200 + (200-183) 2 /200 + (200-194) 2 /200 + (200-226) 2 /200 = 11,63 RC p-valor (gl=5) =4,02% 11

Exemplo Para investigar o envolvimento de filiados a um partido político foi tomada uma amostra de 180 homens e 120 mulheres. Definiram-se duas categorias de classificação e foram considerados como ativistas 100 homens e 80 mulheres, sendo os restantes classificados como ocasionais. Ao nível de 10% os dados fornecem evidência de possíveis diferenças de grau de fidelidade partidária entre os gêneros? 12

Exemplo: homogeneidade Duas novas drogas são testadas em 160 pessoas portadoras de determinada enfermidade. Cada metade da amostra recebe uma das drogas, obtendo-se o resultado abaixo. Teste a hipótese de que as duas drogas são igualmente eficazes. Eficaz Não eficaz Droga A 55 25 Droga B 48 32 RC=[3,841; + [ χ 2 obs=1,34 RC p-valor=0,248 13

Exemplo: pequenas frequências Um pesquisador deseja saber se há alguma diferença no perfil dos assaltos ocorridos na área urbana e rural de uma região. Para isso, analisou-se uma amostra de 200 boletins de ocorrência e os classificou quanto à arma utilizada. Podemos dizer, ao nível de 5%, que há diferenças no perfil do crime nas áreas urbanas e rurais? Arma Área urbana Área rural Total De fogo 100 20 120 Faca 39 21 60 Contundente 9 3 12 Outras 2 6 8 Total 150 50 200 14

Correção de continuidade de Yates Ao aplicar o teste do χ² supõe-se que o tamanho amostral será relativamente grande, assim como cada classe amostral (célula da tabela. Se isso não ocorrer o qui-quadrado calculado pode ser superestimado. Nestes casos alguns autores recomendam o uso do fator de correção de Yates. χ 2 = (f observado f esperado 0,5) 2 f esperado Nota: a diferença entre f observado e f esperado deve ser sempre reduzida em 0,5. Como regra geral, usa-se essa correção quando o qui-quadrado observado é maior que o crítico e: O tamanho da amostra é menor que 40; ou Há pelo menos uma classe com frequência esperada menor que 5. Prof. Marcos Vinicius Pó 15

Cuidados no uso do teste Qui-quadrado É pressuposto que a amostragem seja aleatória. Deve-se usar as frequências absolutas, nunca as relativas (porcentagens). As frequências medidas e, principalmente, as esperadas não devem ser muito pequenas, pois podem distorcer os resultados do teste. Nesse caso deve-se analisar a possibilidade de agrupamento de classes e/ou o uso de correções. Sempre analise a tabela de contingência para verificar se não há dados superestimando o resultado. 16