Testes de Aderência, Homogeneidade e Independência. Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais

Documentos relacionados
Testes não paramétricos. Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais

Testes de Aderência, Homogeneidade e Independência

Testes de Aderência, Homogeneidade e Independência

Testes de Aderência, Homogeneidade e Independência

Aula 16: Análise de Aderência e Associação

Análise de Aderência e de Associação

- Testes Qui-quadrado - Aderência e Independência

AULA 8 Experimentos multinomiais e tabelas de contingência

Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência

Teste Qui-Quadrado Rio de Janeiro, 23 de setembro de 2012

2. Testes de Independência

- Testes Qui-quadrado - Aderência e Independência

TESTES NÃO-PARAMÉTRICOS

CE001 - BIOESTATÍSTICA TESTE DO QUI-QUADRADO

- Testes Qui-quadrado - Aderência e Independência

TESTE DO QUI-QUADRADO DE INDEPENDÊNCIA

- Testes Qui-quadrado. - Aderência e Independência

Testes de hipóteses. Wagner H. Bonat Fernando P. Mayer Elias T. Krainski

Probabilidade e Estatística

MAE Introdução à Probabilidade e Estatística II Resolução Lista 5

Stela Adami Vayego DEST/UFPR

Testes para dados categóricos

Testes de Aderência Testes de Independência Testes de Homogeneidade

16/6/2014. Teste Qui-quadrado de independência

MAE0229 Introdução à Probabilidade e Estatística II

Métodos Quantitativos para Ciências Sociais Professor: Marcos Vinicius Pó

Universidade Federal do Pará Instituto de Ciências Exatas e Naturais Faculdade de Estatística Bacharelado em Estatística

Intervalos de Confiança

Teste Qui-quadrado. Dr. Stenio Fernando Pimentel Duarte

Tópicos Extras 1ª parte. Testes Não Paramétricos, Análise Multivariada, Outras Técnicas

Inferência Estatística:

Capítulo 6 Estatística não-paramétrica

Exemplo (tabela um) distribuições marginais enquanto que. Distribuição Conjunta

Métodos Quantitativos para Ciências Sociais Professor: Marcos Vinicius Pó. Categoria O 1 O 2 O 3 O 4 Freqüência

Capítulo 6 Estatística não-paramétrica

Teste Qui-Quadrado para Independência Texto criado na data. 7 de novembro de 2018

Inferência Estatística:

MOQ 13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

Stela Adami Vayego Estatística II CE003/DEST/UFPR

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Unidade I. Profa. Ana Carolina Bueno

UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO. PROJETO DE EXTENSÃO Software R: de dados utilizando um software livre. Teste Qui-Quadrado

Métodos Quantitativos para Ciências Sociais Professor: Marcos Vinicius Pó

Prof. Lorí Viali, Dr.

Estatística Não Paramétrica. Como construir testes de aderência

Estudo das hipóteses não paramétricas χ² de Pearson aplicado ao número de acidentes envolvendo motos na cidade de Campina Grande Paraíba.

UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO. PROJETO DE EXTENSÃO Software R: de dados utilizando um software livre. Teste de Qui-quadrado

Medidas de Semelhança

ESTATÍSTICA NÃO-PARAMÉTRICA Aula 5

ANÁLISE DE VARIÂNCIA - ANOVA. Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística - PPGEMQ / PPGEP - UFSM

Teste Qui-quadrado. Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas

Universidade de São Paulo Faculdade de Filosofia, Letras e Ciências Humanas Departamento de Ciência Política

PHD 5742 Estatística Aplicada ao Gerenciamento dos Recursos Hídricos

Mas, para começar a aplicar métodos estatísticos, é preciso conhecer alguns conceitos básicos.

Distribuições Amostrais

Distribuição de Probabilidade. Prof.: Joni Fusinato

Análise de Dados Categóricos Tabelas 2 2

Medidas de associação entre duas variáveis qualitativas

X ~ Binomial (n ; p) H: p = p 0 x A: p p 0 (ou A: p > p 0 ou A: p < p 0 ) { X k 1 } U { X k 2 } (ou { X k } ou { X k }) x RC não rejeitamos H

Tópicos em Gestão da Informação II

BIOESTATÍSTICA AULA 7. Anderson Castro Soares de Oliveira Jose Nilton da Cruz. Departamento de Estatística/ICET/UFMT

Análise de Dados Categóricos

PHD 5742 Estatística Aplicada ao Gerenciamento dos Recursos Hídricos. 6 a aula Testes de Hipóteses

Escola Superior de Agricultura Luiz de Queiroz Universidade de São Paulo. Teste de Hipóteses

PESQUISA QUANTITATIVA

Lucas Santana da Cunha de outubro de 2018 Londrina

Conceito de Estatística

Professora Ana Hermínia Andrade. Universidade Federal do Amazonas Faculdade de Estudos Sociais Departamento de Economia e Análise. Período 2017.

PROVA DE ESTATÍSTICA SELEÇÃO MESTRADO/UFMG 2006

Análise de Dados Categóricos

PROVA DE QUI-QUADRADO QUADRADO. Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística - PPGEMQ / PPGEP - UFSM -

Prof. Lorí Viali, Dr.

Estatística e Probabilidade. Aula 11 Cap 06

DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA)

Variância pop. * conhecida Teste t Paramétrico Quantitativa Distribuição normal Wilcoxon (teste dos sinais, Wilcoxon p/ 1 amostra)

Testes de Hipóteses para. uma Única Amostra. Objetivos de Aprendizagem. 9.1 Teste de Hipóteses. UFMG-ICEx-EST-027/031 07/06/ :07

Considerações. Planejamento. Planejamento. 3.3 Análise de Variância ANOVA. 3.3 Análise de Variância ANOVA. Estatística II

Tópicos em Gestão da Informação II

Stela Adami Vayego DEST/UFPR

ANOVA - parte I Conceitos Básicos

ANÁLISE DE VARIÂNCIA DE UM CRITÉRIO (DIC)

Análise de dados, tipos de amostras e análise multivariada

CAPÍTULO 3 POPULAÇÃO E AMOSTRA

Testes de Hipóteses: exemplos

Teste de hipótese de variância e Análise de Variância (ANOVA)

FERRAMENTAS ESTATÍSTICAS PARA ANÁLISE DA CLASSIFICAÇÃO

Análise da Variância. Prof. Dr. Alberto Franke (48)

ESTATÍSTICA Distribuições qui-quadrado, t de Student e F de Snedecor Lucas Schmidt

Estimação e Testes de Hipóteses

INSTRUÇÕES. O tempo disponível para a realização das duas provas e o preenchimento da Folha de Respostas é de 5 (cinco) horas no total.

Aderência. Rinaldo Artes Insper Instituto de Ensino e Pesquisa 2015

Cruzamento de Dados. Lorí Viali, Dr. DESTAT/FAMAT/PUCRS

Teorema do Limite Central, distribuição amostral, estimação por ponto e intervalo de confiança

Inferência Estatística Básica. Teste de Hipóteses: decidindo na presença de incerteza

Teste Chi-Quadrado de Independência. Prof. David Prata Novembro de 2016

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27

INTRODUÇÃO. Exemplos. Comparar três lojas quanto ao volume médio de vendas. ... ANÁLISE DE VARIÂNCIA. Departamento de Matemática ESTV.

AULA 05 Teste de Hipótese

ESTATÍSTICA. Tabelas e Gráficos. Elisabeti Kira - IME USP. Beti Kira (IME-USP) Estatística 18.abril.

Transcrição:

Testes de Aderência, Homogeneidade e Independência Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais

Teste de hipótese Queremos saber se a evidência que temos em mãos significa que encontramos algo diferente daquela que suponhamos existir e se essa evidência é forte para podermos fazer afirmações. Para isso nos valemos de amostras e tentamos verificar o quando podemos dizer que estamos tratando de um evento estatisticamente raro, incomum. Problemas: Como saber que a nossa amostra não é um mero acaso? Com que critérios faremos o nosso julgamento? Que tipo de estatística pode nos ajudar a tomar uma decisão? 2

Variáveis categóricas São definidas em termos de classes ou categorias (masculino/feminino; profissão; escolaridade...). Podemos verificar a freqüência das nossas observações em cada uma das categorias e comparar com uma referência (freqüências esperadas), usando-se tabelas de contingência. Variáveis quantitativas eventualmente podem ser classificadas em categorias (faixas salariais; anos de instrução...). 3

Medindo a associação de variáveis categóricas Por que isso é interessante? Permite que trabalhemos com dados qualitativos e categóricos Problema: quantificar o grau de associação entre duas amostras categóricas. Como fazer? Proposta: medir o afastamento global em relação a uma distribuição esperada. De que forma? verificar o desvio (distanciamento) das freqüências observadas em relação às esperadas. Como medir? Com a estatística Qui-quadrado (χ 2 ). 4

Aderência, homogeneidade e independência Comparar dados de populações visando determinar: Aderência à uma distribuição específica; Homogeneidade dessa distribuição; Independência ou associação entre 2 variáveis aleatórias. Para isso mede-se a distância entre os valores observados e aqueles que seriam esperados se eles possuíssem determinada distribuição. São chamados de testes não-paramétricos. 5

Testes Paramétricos Referem-se diretamente a um ou mais parâmetros da população. Pressupostos: A estatística de teste deve ter uma distribuição probabilística conhecida. Os erros possuem distribuição normal. Os resíduos são aleatórios e independentes. Mais eficientes e precisos. Testes Não Paramétricos Não se baseiam diretamente em parâmetros da distribuição. Requerem menos pressupostos em relação à população. Não exigem normalidade. Podem ser aplicados a dados categóricos. Aplicação mais simples. Menos eficientes que os testes paramétricos. 6

Tabelas de contingência Tipo de tabela em forma de matriz que mostra a distribuição de freqüências multivariada estudada. São muito úteis para verificar a inter-relação entre as variáveis. Exemplo: Origem Uso de drogas Capitais e regiões metropolitanas Ocasional Frequente Total 43 9 52 Cidades do interior 44 4 48 Total 87 13 100 7

Estatística Qui-quadrado Usada para mensurar o afastamento dos resultados amostrais em relação à uma dada distribuição esperada das variáveis estudadas. Parâmetro necessário para determinar as probabilidades: graus de liberdade na tabela (ν). 8

Estatística Qui-quadrado (χ 2 ) 2 r s ( * nij n ) 2 ij ( f Ou * obs f i 1 j 1 n ij 2 2 fe) e Onde: n*: freqüência esperada r: total de categorias da variável X s: total de categorias da variável Y Onde fobs = freqüência observada em qualquer célula fe = freqüência esperada em qualquer célula 9

Tabela Qui-quadrado 10

Graus de liberdade na tabela Qui-quadrado São determinados pelo número de caselas em uma tabela de contingência que teriam preenchimento livre considerando que temos as totalizações de linhas e colunas. Fórmula básica: ν = (l-1).(c-1) Exemplo: Preferência por tipo de programa Jovens Meia-idade Idosos Total Música 14 10 3 27 Noticiário 4 15 11 30 Esporte 7 9 5 21 Total 25 34 19 78 11

Exemplo: aderência Um dado é lançado 1.200 vezes, com os seguintes resultados: Ocorrência 1 2 3 4 5 6 Freqüência 190 179 228 183 226 194 Teste a hipótese de que o dado é honesto, ao nível de 5% RC = [11,070; + [ χ 2 = (200-190) 2 /200 +(200-228) 2 /200 + (200-179) 2 /200 + (200-183) 2 /200 + (200-194) 2 /200 + (200-226) 2 /200 = 11,63 RC p-valor (gl=5) =4,02% 12

Exemplo: homogeneidade Duas novas drogas são testadas em 160 pessoas portadoras de determinada enfermidade. Cada metade da amostra recebe uma das drogas, obtendo-se o resultado abaixo. Teste a hipótese de que as duas drogas são igualmente eficazes. Eficaz Não eficaz Droga A 55 25 Droga B 48 32 RC=[3,841; + [ χ 2 obs=1,34 RC p-valor=0,248 13

Exemplo: pequenas frequências Um pesquisador deseja saber se há alguma diferença no perfil dos assaltos ocorridos na área urbana e rural de uma cidade do interior. Para isso, analisou-se uma amostra aleatória de 200 boletins de ocorrência. Podemos dizer, ao nível de 5%, que há diferenças no perfil do crime nas áreas urbanas e rurais? Arma Área urbana Área rural Total De fogo 100 20 120 Faca 39 21 60 Contundente 9 3 12 Outras 2 6 8 Total 150 50 200 14

Exemplo Para investigar o envolvimento de filiados a um partido político foi tomada uma amostra de 180 homens e 120 mulheres. Definiram-se duas categorias de classificação e foram considerados como ativistas plenos 100 homens e 80 mulheres, sendo os restantes classificados como participantes ocasionais. Ao nível de 10% os dados fornecem evidência de possíveis diferenças de grau de fidelidade partidária entre os gêneros? 15

Cuidados no uso do teste Qui-quadrado É pressuposto que a amostragem seja aleatória. Deve-se usar as frequências absolutas, nunca as relativas (porcentagens). As frequências medidas e, principalmente, as esperadas não devem ser muito pequenas, pois podem distorcer os resultados do teste. Sempre analise a tabela de contingência para verificar se não há dados superestimando o resultado. 16