2. Testes de Independência

Documentos relacionados
- Testes Qui-quadrado - Aderência e Independência

- Testes Qui-quadrado - Aderência e Independência

- Testes Qui-quadrado - Aderência e Independência

- Testes Qui-quadrado. - Aderência e Independência

Testes de Aderência Testes de Independência Testes de Homogeneidade

Capítulo 6 Estatística não-paramétrica

MAE0229 Introdução à Probabilidade e Estatística II

Inferência Estatística:

Testes de Aderência, Homogeneidade e Independência

Testes de Aderência, Homogeneidade e Independência

Capítulo 6 Estatística não-paramétrica

Testes de Aderência, Homogeneidade e Independência

Aula 16: Análise de Aderência e Associação

UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO. PROJETO DE EXTENSÃO Software R: de dados utilizando um software livre. Teste de Qui-quadrado

Medidas de associação entre duas variáveis qualitativas

Análise de Aderência e de Associação

Testes de Hipóteses: exemplos

Teste Qui-quadrado. Dr. Stenio Fernando Pimentel Duarte

MÓDULO V: Análise Bidimensional: Correlação, Regressão e Teste Qui-quadrado de Independência

Teste Qui-quadrado. Comparando proporções Verificando a hipótese de associação entre variáveis qualitativas

Testes de Aderência, Homogeneidade e Independência. Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais

UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO. PROJETO DE EXTENSÃO Software R: de dados utilizando um software livre. Teste Qui-Quadrado

Teste Qui-Quadrado para Independência Texto criado na data. 7 de novembro de 2018

Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência

Teste Qui-Quadrado Rio de Janeiro, 23 de setembro de 2012

Testes de hipóteses. Wagner H. Bonat Fernando P. Mayer Elias T. Krainski

4. Medidas de associação entre variáveis categóricas em tabelas de dupla entrada

ESTATÍSTICA Distribuições qui-quadrado, t de Student e F de Snedecor Lucas Schmidt

16/6/2014. Teste Qui-quadrado de independência

Testes não paramétricos. Prof. Marcos Vinicius Pó Métodos Quantitativos para Ciências Sociais

Prof. Lorí Viali, Dr.

Stela Adami Vayego Estatística II CE003/DEST/UFPR

Estatística para Geografia. Rio, 30/08/2017

Os testes. Objetivos. O teste Q de Cochran; O teste de Friedman (Análise de variância de duplo fator por postos)

X ~ Binomial (n ; p) H: p = p 0 x A: p p 0 (ou A: p > p 0 ou A: p < p 0 ) { X k 1 } U { X k 2 } (ou { X k } ou { X k }) x RC não rejeitamos H

Stela Adami Vayego DEST/UFPR

Introdução em Probabilidade e Estatística II

Professora Ana Hermínia Andrade. Período

TESTE DO QUI-QUADRADO DE INDEPENDÊNCIA

Probabilidade e Estatística

Testes para dados categóricos

NOÇÕES DE TESTE DE HIPÓTESES (II)

TESTES NÃO-PARAMÉTRICOS

AULA 10 RELACIONAMENTOS ENTRE DUAS VARIÁVEIS

Exemplo (tabela um) distribuições marginais enquanto que. Distribuição Conjunta

AULA 8 Experimentos multinomiais e tabelas de contingência

Prof. Lorí Viali, Dr.

Aula de hoje. Associação e Proporções. Tabela 2x2 (valores esperados dados hipotéticos) Tabela 2x2 (valores esperados dados reais)

Análise de Dados Categóricos

Prof. Lorí Viali, Dr.

Análise de Dados Categóricos

A teoria postulada por Mendel estabelece que a segregação, neste caso, deve ocorrer na seguinte proporção: 9/16 : 3/16 : 3/16 : 1/16

Intervalos de Confiança

7.13 Exercicios sobre Qui-quadrado

Análise de Correspondência: introdução

9. Medidas de associação entre variáveis categóricas em tabelas de dupla entrada

Estimação e Testes de Hipóteses

Inferência Estatística Básica. Teste de Hipóteses: decidindo na presença de incerteza

Medidas de associação para variáveis categóricas em tabelas de dupla entrada

Estimação parâmetros e teste de hipóteses. Prof. Dr. Alberto Franke (48)

Prof. Lorí Viali, Dr.

CE001 - BIOESTATÍSTICA TESTE DO QUI-QUADRADO

A moeda é honesta ou é desequilibrada? Qual é a probabilidade de "cara"no lançamento de uma moeda?

Teste do Qui2. O tamanho de amígdala está associado com a presença da bactéria Streptoccocus pyogenes?

CONSULTADORIA INFORMÁTICA, LDA. Análise Bivariada

6. Medidas de associação entre variáveis categóricas em tabelas de dupla entrada

Introdução à análise estatística com SPSS. Guião nº6: Medidas de associação

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Unidade IV Inferência estatística

TESTE DE HIPÓTESES NÍVEL DESCRITIVO

Análise Exploratória de Dados

Métodos Quantitativos para Ciências Sociais Professor: Marcos Vinicius Pó

Associação entre variáveis categóricas e IC95%

Inferência Estatística Básica. Teste de Hipóteses para uma média populacional Cálculo do Valor p

Delineamento e Análise Experimental Aula 3

Variável dependente Variável independente Coeficiente de regressão Relação causa-efeito

Aula 5. Teste de Hipóteses II. Capítulo 12, Bussab&Morettin Estatística Básica 7ª Edição

Testes de Hipóteses para. uma Única Amostra. Objetivos de Aprendizagem. 9.1 Teste de Hipóteses. UFMG-ICEx-EST-027/031 07/06/ :07

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Análise de Dados da Avaliação II

BIOESTATÍSTICA AULA 7. Anderson Castro Soares de Oliveira Jose Nilton da Cruz. Departamento de Estatística/ICET/UFMT

Universidade Federal de Minas Gerais Instituto de Ciências Exatas Departamento de Estatística. Princípios de Bioestatística.

Testes de Hipótese PARA COMPUTAÇÃO

(Hipótese alternativa unilateral)

Métodos Quantitativos para Ciências Sociais Professor: Marcos Vinicius Pó

Aula prática 4 Parte I - Correlação e regressão linear simples

rio de Guerra Eletrônica EENEM 2008 Estatística stica e Probabilidade de Variância (ANOVA) 1/24

Teste de Cochran (Homogeneidade de Variância)

Conceitos Básicos Teste t Teste F. Teste de Hipóteses. Joel M. Corrêa da Rosa

Teste Chi-Quadrado de Independência. Prof. David Prata Novembro de 2016

Estatística Descritiva (III) Associação entre Variáveis

Medidas de Semelhança

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves

Universidade de São Paulo Faculdade de Filosofia, Letras e Ciências Humanas Departamento de Ciência Política

Modelos de Regressão Linear Simples - parte III

Análise de Dados Categóricos Tabelas 2 2

( ) = σ 2. Capítulo 8 - Testes de hipóteses. 8.1 Introdução

Transcrição:

. Testes de Independência Objetivo: Verificar se existe independência entre duas variáveis medidas nas mesmas unidades experimentais. Exemplo 3: A Associação de Imprensa do Estado de São Paulo fez um levantamento com 1300 leitores, para verificar se a preferência por leitura de um determinado jornal é independente do nível de instrução do indivíduo. Os resultados obtidos foram: Grau de instrução Tipo de Jornal Jornal A Jornal B Jornal C Outros Total 1 o Grau 10 8 5 7 50 o Grau 90 16 15 73 450 Universitário 00 50 0 130 800 Total 300 40 350 30 1300 19

Vamos calcular proporções segundo os totais das colunas (poderiam também ser calculadas pelos totais das linhas). Temos a seguinte tabela: Grau de instrução Tipo de Jornal Jornal A Jornal B Jornal C Outros Total 1 o Grau 3,33% 1,90% 1,43% 11,74% 3,85% o Grau 30,00% 38,57% 35,71% 31,74% 34,6% Universitário 66,67% 59,5% 6,86% 56,5% 61,54% Total 100,00% 100,00% 100,00% 100,00% 100,00% Independentemente da preferência por um tipo de jornal, 3,85% dos leitores têm o 1º Grau, 34,6% têm o º Grau e 61,54% são universitários. 0

Sob independência entre grau de instrução e preferência por um tipo de jornal, o número esperado de leitores que têm o 1º Grau e preferem o jornal A é igual a 300 x 0,0385 = 11,54, que têm o º Grau e preferem o Jornal A é 300 x 0,346 = 103,85 e que são universitários e preferem o jornal A é 300 x 0,6154 = 184,6. Grau de instrução 1 o Grau 10 11,54 (3,85%) o Grau 90 103,85 (34,6)% 00 Universitário 184,6 (61,54%) Tipo de Jornal Jornal A Jornal B Jornal C Outros Total 8 16,15 (3,85%) 16 145,38 (34,6%) 50 58,46 (61,54%) 5 13,46 (3,85%) 15 11,15 (34,6%) 0 15,38 (61,54%) 7 8,85 (3,85%) 73 79,6 (34,6%) 130 141,54 (61,54%) As diferenças entre os valores observados e os esperados não são muito pequenas. Preferência por um tipo de jornal e grau de instrução parecem não ser independentes. 50 450 800 Total 300 40 350 30 1300 1

Testes de Independência Metodologia Em geral, os dados referem-se a mensurações de duas características (A e B) feitas em n unidades experimentais, que são apresentadas conforme a seguinte tabela: A \ B B 1 B... B s Total A 1 O 11 O 1... O 1s O 1. A O 1 O... O s O................... A r O r1 O r... O rs O r. Total O.1 O.... O.s n Hipóteses a serem testadas Teste de independência: H: A e B são variáveis independentes A: As variáveis A e B não são independentes

Quantas observações devemos esperar em cada casela, se A e B forem independentes? Sendo O ij o total de observações na casela (i, j), se A e B forem independentes, esperamos que, para todos os possíveis pares (A i e B j ): O i1 /O.1 = O i /O. =... = O is /O.s = O i. /n, i = 1,..., r ou ainda O ij /O.j = O i. /n = 1,..., r, j = 1,..., s de onde se deduz, finalmente, que O ij = (O i. x O.j )/n, i = 1,,, r e j = 1,,,s. Logo, o número esperado de observações com as características (A i e B j ), entre as n observações, sob a hipótese de independência, é dado por E ij O i. n O. j 3

Distância entre os valores observados e os valores esperados sob a suposição de independência: χ s r ( Oij Eij ) i 1 j 1 E ij Estatística do teste de independência Supondo H verdadeira, aproximadamente, ( O E ) r s ij ij ~ q i 1 j 1 Eij sendo q = ( r 1) ( s 1 ) o número de graus de liberdade. 4

Regra de decisão: Pode ser baseada no valor P (nível descritivo), neste caso obs em que é o valor calculado, a partir dos dados, usando a expressão apresentada para. Graficamente: P P ( q obs ) P Se, para fixado, obtemos P, rejeitamos a hipótese H de independência. obs 5

Exemplo (continuação): Estudo da independência entre preferência por um tipo de jornal e grau de instrução. 1300 eleitores foram entrevistados ao acaso. Hipóteses H: As variáveis preferência por um tipo de jornal e grau de instrução são independentes. A: Existe dependência entre as variáveis. Grau de instrução Tipo de Jornal Jornal A Jornal B Jornal C Outros Total 1 o Grau 10 8 5 7 50 o Grau 90 16 15 73 450 Universitário 00 50 0 130 800 Total 300 40 350 30 1300 Exemplo do cálculo dos valores esperados sob H (independência): Número esperado de leitores que têm 1º Grau e preferem o jornal A: E 11 300 50 1300 11,54. 6

Tabela de valores observados e esperados (entre parênteses) Tipo de Jornal Grau de instrução Jornal A Jornal B Jornal C Outros Total 1 o Grau 10 8 5 7 (11,54) (16,15) (13,46) (8,85) 50 o Grau 90 16 15 73 (103,85) (145,38) (11,15) (79,6) 450 Universitário 00 50 0 130 (184,6) (58,46) (15,38) (141,54) 800 Total 300 40 350 30 1300 º Grau e prefere jornal B: Universitário e prefere outros jornais: E 40 450 1300 145,38 E Lembre-se: ij O i. n.. O.j E 34 30 800 141,54 1300 7

Cálculo da estatística de qui-quadrado: obs (90 103,85) 103,85 (00 184,6) 184,6 53,910. Tipo de Jornal Grau de instrução Jornal A Jornal B Jornal C Outros Total 1 o Grau 10 8 5 7 (11,54) (16,15) (13,46) (8,85) 50 o Grau 90 16 15 73 (103,85) (145,38) (11,15) (79,6) 450 Universitário 00 50 0 130 (184,6) (58,46) (15,38) (141,54) 800 Total 300 40 350 30 1300 (10 11,54) 11,54 (8 16,15) 16,15 (16 145,38) 145,38 (50 58,46) 58,46 (5 13,46) 13,46 (15 11,15) 11,15 (0 15,38) 15,38 (7 8,85) 8,85 (73 79,6) 79,6 (130 141,54) 141,54 8

Determinação do número de graus de liberdade: Categorias de Grau de instrução: s = 3 Categorias de Tipo de jornal: r = 4 O nível descritivo (valor P): P P ( 6 53,910) q = (r 1) (s 1) = 3 = 6 0,0001 Supondo 0,05, temos P < Assim, temos evidências para rejeitar a independência entre as variáveis grau de instrução e preferência por tipo de jornal ao nível de 5% de significância. Os cálculos podem ser feitos diretamente no Rcmdr: Estatísticas Tabelas de Contingência Digite e analise tabela de dupla entrada 9

Saída do Rcmdr: data:.table X-squared = 53.9099, df = 6, p-value = 7.69e-10 >.Test$expected # Expected Counts 1 3 4 1 11.53846 16.15385 13.46154 8.846154 103.84615 145.3846 11.15385 79.615385 3 184.61538 58.46154 15.3846 141.53846 > round(.test$residuals^, ) # Chi-square Components 1 3 4 1 0.1 4.1 5.3 37.5 1.85 1.90 0.1 0.55 3 1.8 0.8 0.10 0.94 30

Exemplo 4: 137 indivíduos adultos classificados segundo a pressão sanguínea (mm Hg) e o nível de colesterol (mg/100cm 3 ). Verificar se existe independência entre essas variáveis. Colesterol Pressão < 17 17 a 166 > 166 Total < 00 117 168 307 00 a 60 04 418 63 685 > 60 67 145 33 45 Total 388 731 118 137 H: Pressão sanguínea e nível de colesterol são independentes; A: Nível de colesterol e pressão sanguínea são variáveis dependentes. Os cálculos podem ser feitos diretamente no Rcmdr: Estatísticas Tabelas de Contingência Digite e analise tabela de dupla entrada 31

Saída do Rcmdr: data:.table X-squared = 13.5501, df = 4, p-value = 0.008878 >.Test$expected # Expected Counts 1 3 1 96.946 181.404 9.8537 14.85853 404.7979 65.34357 3 76.8471 144.7817 3.37106 > round(.test$residuals^, ) # Chi-square Components 1 3 1 4.45 0.99 1.81 0.55 0.43 0.08 3 1.6 0.00 3.97 Para α = 0,05, temos P < α. Assim, temos evidências para rejeitar a hipótese de independência entre as variáveis pressão sanguínea e nível de colesterol ao nível de 5% de significância. 3