Testes de Aderência, Homogeneidade e Independência

Documentos relacionados
Testes de Aderência, Homogeneidade e Independência

Testes de Aderência, Homogeneidade e Independência

Testes de Aderência, Homogeneidade e Independência. Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais

Testes não paramétricos. Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais

Aula 16: Análise de Aderência e Associação

Análise de Aderência e de Associação

CE001 - BIOESTATÍSTICA TESTE DO QUI-QUADRADO

- Testes Qui-quadrado - Aderência e Independência

2. Testes de Independência

- Testes Qui-quadrado - Aderência e Independência

AULA 8 Experimentos multinomiais e tabelas de contingência

TESTE DO QUI-QUADRADO DE INDEPENDÊNCIA

Testes de hipóteses. Wagner H. Bonat Fernando P. Mayer Elias T. Krainski

- Testes Qui-quadrado - Aderência e Independência

Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência

- Testes Qui-quadrado. - Aderência e Independência

MAE Introdução à Probabilidade e Estatística II Resolução Lista 5

Probabilidade e Estatística

Intervalos de Confiança

TESTES NÃO-PARAMÉTRICOS

Teste Qui-quadrado. Dr. Stenio Fernando Pimentel Duarte

Testes para dados categóricos

Stela Adami Vayego DEST/UFPR

16/6/2014. Teste Qui-quadrado de independência

MAE0229 Introdução à Probabilidade e Estatística II

Teste Qui-Quadrado para Independência Texto criado na data. 7 de novembro de 2018

Exemplo (tabela um) distribuições marginais enquanto que. Distribuição Conjunta

PHD 5742 Estatística Aplicada ao Gerenciamento dos Recursos Hídricos. 6 a aula Testes de Hipóteses

Tópicos Extras 1ª parte. Testes Não Paramétricos, Análise Multivariada, Outras Técnicas

TESTES DE HIPÓTESES. Conceitos, Testes de 1 proporção, Testes de 1 média

Universidade Federal do Pará Instituto de Ciências Exatas e Naturais Faculdade de Estatística Bacharelado em Estatística

Capítulo 6 Estatística não-paramétrica

Capítulo 6 Estatística não-paramétrica

MOQ 13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA)

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Testes de Aderência Testes de Independência Testes de Homogeneidade

Prof. Lorí Viali, Dr.

Teste Qui-Quadrado Rio de Janeiro, 23 de setembro de 2012

Stela Adami Vayego Estatística II CE003/DEST/UFPR

Inferência Estatística:

X ~ Binomial (n ; p) H: p = p 0 x A: p p 0 (ou A: p > p 0 ou A: p < p 0 ) { X k 1 } U { X k 2 } (ou { X k } ou { X k }) x RC não rejeitamos H

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Variância pop. * conhecida Teste t Paramétrico Quantitativa Distribuição normal Wilcoxon (teste dos sinais, Wilcoxon p/ 1 amostra)

Métodos Quantitativos para Ciências Sociais Professor: Marcos Vinicius Pó

Prof. Lorí Viali, Dr.

Análise de dados, tipos de amostras e análise multivariada

Inferência Estatística:

AULA 05 Teste de Hipótese

UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO. PROJETO DE EXTENSÃO Software R: de dados utilizando um software livre. Teste de Qui-quadrado

ESTATÍSTICA Distribuições qui-quadrado, t de Student e F de Snedecor Lucas Schmidt

PHD 5742 Estatística Aplicada ao Gerenciamento dos Recursos Hídricos

ESTATÍSTICA NÃO-PARAMÉTRICA Aula 5

Estatística Não Paramétrica. Como construir testes de aderência

Testes de Hipóteses Paramétricos

Testes de Hipóteses Paramétricos

Testes de Hipóteses: exemplos

TESTE DE HIPÓTESES NÍVEL DESCRITIVO

PROVA DE ESTATÍSTICA SELEÇÃO MESTRADO/UFMG 2006

Escola Superior de Agricultura Luiz de Queiroz Universidade de São Paulo. Teste de Hipóteses

Unidade IV Inferência estatística

Estimação e Testes de Hipóteses

Medidas de Semelhança

Teste Qui-quadrado. Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas

UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO. PROJETO DE EXTENSÃO Software R: de dados utilizando um software livre. Teste Qui-Quadrado

Universidade de São Paulo Faculdade de Filosofia, Letras e Ciências Humanas Departamento de Ciência Política

Medidas de associação entre duas variáveis qualitativas

PROVA DE QUI-QUADRADO QUADRADO. Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística - PPGEMQ / PPGEP - UFSM -

Considerações. Planejamento. Planejamento. 3.3 Análise de Variância ANOVA. 3.3 Análise de Variância ANOVA. Estatística II

Métodos Quantitativos para Ciências Sociais Professor: Marcos Vinicius Pó

Métodos Empíricos de Pesquisa I. } Análise Bidimensional

INSTRUÇÕES. O tempo disponível para a realização das duas provas e o preenchimento da Folha de Respostas é de 5 (cinco) horas no total.

FERRAMENTAS ESTATÍSTICAS PARA ANÁLISE DA CLASSIFICAÇÃO

MAE116 Noções de Estatística

Unidade I. Profa. Ana Carolina Bueno

TESTE DE HIPÓTESE. Introdução

Métodos Quantitativos para Ciências Sociais Professor: Marcos Vinicius Pó. Categoria O 1 O 2 O 3 O 4 Freqüência

Inferência Estatística Básica. Teste de Hipóteses: decidindo na presença de incerteza

Estudo das hipóteses não paramétricas χ² de Pearson aplicado ao número de acidentes envolvendo motos na cidade de Campina Grande Paraíba.

Testes de Hipóteses para. uma Única Amostra. Objetivos de Aprendizagem. 9.1 Teste de Hipóteses. UFMG-ICEx-EST-027/031 07/06/ :07

Teorema do Limite Central, distribuição amostral, estimação por ponto e intervalo de confiança

Delineamento e Análise Experimental Aula 3

6 Teste de Normalidade das Cargas Fatoriais

Tópicos em Gestão da Informação II

Aula 5. Teste de Hipóteses II. Capítulo 12, Bussab&Morettin Estatística Básica 7ª Edição

Análise da Variância. Prof. Dr. Alberto Franke (48)

Introdução em Probabilidade e Estatística II

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27

AULA 07 Inferência a Partir de Duas Amostras

Aná lise QL QL Me todo do X²

Cruzamento de Dados. Lorí Viali, Dr. DESTAT/FAMAT/PUCRS

Stela Adami Vayego DEST/UFPR

Análise de Dados Categóricos

Análise de Dados Categóricos Tabelas 2 2

Análise de Dados Categóricos

Ajustar Técnica usada na análise dos dados para controlar ou considerar possíveis variáveis de confusão.

Estatística Aplicada I. } Análise Bidimensional

Nosso objetivo agora é apresentar procedimentos estatísticos simples para verificar se um conjunto de dados amostrais dá ou não suporte à uma

Algumas vantagens. Algumas restrições ao seu uso

Estatística e Probabilidade. Aula 11 Cap 06

Transcrição:

Testes de Aderência, Homogeneidade e Independência Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais

O que é um teste de hipótese? Queremos saber se a evidência que temos em mãos significa que encontramos algo diferente daquela que suponhamos existir e se essa evidência é forte para podermos fazer afirmações. Para isso nos valemos de amostras e tentamos verificar o quando podemos dizer que estamos tratando de um evento estatisticamente raro, incomum. Problemas: Como ter certeza de que a nossa amostra não é um mero acaso? Com que critérios faremos o nosso julgamento? Que tipo de estatística pode nos ajudar a tomar uma decisão? 2

Operacionalização de um teste de hipótese Definimos claramente uma hipótese: Hipótese nula (H 0 ): a nossa amostra, ainda que um pouco diferente, não é tão diferente assim da população referência. Hipótese alternativa (H A ): podemos afirmar, com alguma certeza, que temos uma amostra que não pertence à população referência. Como o nosso resultado amostral pode ter ocorrido por acaso, estabelecemos regras de decisão com base na probabilidades de termos cometido um erro: Com base em um critério de raridade (nível de significância α ou p-valor) estabelecemos um intervalo de valores (região crítica) que, caso ocorram em nossa amostra, significa ter ocorrido um evento raro, possibilitando contestar a hipótese nula. Com os critérios definidos, apreciamos a evidência em mãos e julgamos as nossas hipóteses. 3

Como saber se duas proporções são associadas? Problema: quantificar o grau de associação (ou dependência) entre duas amostras Por que isso é interessante? Permite que trabalhemos com dados qualitativos e categóricos Como fazer isso? Proposta: medir o afastamento global em relação a uma distribuição esperada Como medir? Com a estatística Qui-quadrado (χ 2 ) 4

Aderência, homogeneidade e independência Comparar dados de populações visando determinar: Aderência à uma distribuição específica; Homogeneidade dessa distribuição; Independência ou associação entre 2 variáveis aleatórias. Para isso mede-se a distância entre os valores observados e aqueles que seriam esperados se eles possuíssem determinada distribuição. São testes não-paramétricos. 5

Testes Paramétricos Referem-se diretamente a um ou mais parâmetros da população. Pressupostos: A estatística de teste deve ter uma distribuição probabilística conhecida. Os erros possuem distribuição normal. Os resíduos são aleatórios e independentes. Mais eficientes e precisos. Testes Não Paramétricos Não se baseiam diretamente em parâmetros da distribuição. Requerem menos pressupostos em relação à população. Não exigem normalidade. Podem ser aplicados a dados categóricos. Aplicação mais simples. Menos eficientes que os testes paramétricos. 6

Variáveis categóricas São definidas em termos de classes ou categorias (masculino/feminino; profissão; escolaridade...). Podemos verificar a freqüência das nossas observações em cada uma das categorias e comparar com uma referência (freqüências esperadas), usando-se tabelas de contingência. Variáveis quantitativas eventualmente podem ser classificadas em categorias (faixas salariais; anos de instrução...). Para avaliar o desvio das freqüências observadas em relação às esperadas utilizamos a estatística Qui-quadrado (χ 2 ). 7

Tabelas de contingência Tipo de tabela em forma de matriz que mostra a distribuição de freqüências multivariada das variáveis estudadas. São muito úteis para verificar a inter-relação entre as variáveis. Exemplo: Origem Uso de drogas Capitais e regiões metropolitanas Ocasional Frequente Total 43 9 52 Cidades do interior 44 4 48 Total 87 13 100 8

Estatística Qui-quadrado (χ 2 ) 2 r s ( * nij n ) 2 ij ( f Ou * obs f i 1 j 1 n ij 2 2 fe) e Onde: n*: freqüência esperada r: total de categorias da variável X s: total de categorias da variável Y Onde f obs = freqüência observada em qualquer célula f e = freqüência esperada em qualquer célula 9

Graus de liberdade na tabela Qui-quadrado São determinados pelo número de caselas em uma tabela de contingência que teriam preenchimento livre considerando que temos as totalizações de linhas e colunas. Fórmula básica: ν = (l-1).(c-1) Exemplo: Preferência por tipo de programa Jovens Meia-idade Idosos Total Música 14 10 3 27 Noticiário 4 15 11 30 Esporte 7 9 5 21 Total 25 34 19 78 10

Exemplo: aderência Um dado é lançado 1.200 vezes, com os seguintes resultados: Ocorrência 1 2 3 4 5 6 Freqüência 190 179 228 183 226 194 Teste a hipótese de que o dado é honesto, ao nível de 5% RC = [11,070; + [ χ 2 = (200-190) 2 /200 +(200-228) 2 /200 + (200-179) 2 /200 + (200-183) 2 /200 + (200-194) 2 /200 + (200-226) 2 /200 = 11,63 RC p-valor (gl=5) =4,02% 11

Exemplo: homogeneidade Duas novas drogas são testadas em 160 pessoas portadoras de determinada enfermidade. Cada metade da amostra recebe uma das drogas, obtendo-se o resultado abaixo. Teste a hipótese de que as duas drogas são igualmente eficazes. Eficaz Não eficaz Droga A 55 25 Droga B 48 32 RC=[3,841; + [ χ 2 obs=1,34 RC p-valor=0,248 12

Exemplo: independência Uma pesquisa sobre a qualidade de um serviço foi realizada enviando-se questionários com porte pago. Desconfiando-se que poderia haver um viés nas respostas, fez-se também uma pesquisa por e-mail e outra por telefone. Os resultados estão abaixo. Há relação entre a forma de pesquisa e os seus resultados? Correio E-mail Telefone Excelente 62 36 24 Satisfatório 84 42 16 Insatisfatório 24 22 20 RC=]9,488; + [ χ 2 obs=14,03 RC p-valor=0,007 13

Cuidados no uso do teste Qui-quadrado É pressuposto que a amostragem seja aleatória. Deve-se usar as frequências absolutas. Se tivermos como referencial as relativas (porcentagens), elas deverão ser convertidas em absolutas. As frequências medidas e esperadas (principalmente estas!) não devem ser muito pequenas, pois podem distorcer os resultados do teste. Sempre analise a tabela de contingência para verificar se não há dados enviesando demasiadamente o resultado. 14

Exemplo: pequenas frequências Um pesquisador deseja saber se há alguma diferença no perfil dos assaltos ocorridos na área urbana e rural de uma cidade do interior. Para isso, analisou-se uma amostra aleatória de 200 boletins de ocorrência. Podemos dizer, ao nível de 5%, que há diferenças no perfil do crime nas áreas urbanas e rurais? Arma Área urbana Área rural Total De fogo 100 20 120 Faca 39 21 60 Contundente 9 3 12 Outras 2 6 8 Total 150 50 200 15