Testes Não Paramétricos

Documentos relacionados

TESTE DO QUI-QUADRADO DE INDEPENDÊNCIA

Capítulo 4 Inferência Estatística

TESTES DE AJUSTAMENTO (TESTES DA BONDADE DO AJUSTAMENTO)

Testes Qui-Quadrado - Teste de Aderência

AULA 11 Experimentos Multinomiais e Tabelas de Contingência

Métodos Quantitativos Aplicados

Consideremos os seguintes exemplos de hipóteses cuja veracidade interessa avaliar:

Análise estatística. Aula de Bioestatística. 17/9/2008 (2.ª Parte) Paulo Nogueira

Aula 8. Teste Binomial a uma proporção p

MAE116 - Noções de Estatística

Aula 12 Teste de hipótese sobre proporções amostras grandes

Teste de Hipótese e Intervalo de Confiança. Parte 2

INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA. Prof. Anderson Rodrigo da Silva

Estimação. Como definir um estimador. Como obter estimativas pontuais. Como construir intervalos de confiança

AULA 12 Inferência a Partir de Duas Amostras

Introdução. Ou seja, de certo modo esperamos que haja uma certa

Modelos de Probabilidade e Inferência Estatística

Distribuições Conjuntas (Tabelas de Contingência)

Plano da Apresentação. Correlação e Regressão linear simples. Correlação linear. Associação entre hábitos leitura e escolaridade.

Correlação e Regressão linear simples

Teorema do Limite Central e Intervalo de Confiança

BIOESTATÍSTICA. Parte 1 - Estatística descritiva e análise exploratória dos dados

ANOVA. (Analysis of Variance) Prof. Dr. Guanis de Barros Vilela Junior

AULA 04 Estimativas e Tamanhos Amostrais

Estatística. Slide 0. Ana M. Abreu /07

AMOSTRAGEM: DIMENSIONAMENTO DE AMOSTRAS. SELEÇÃO DOS ELEMENTOS DE UMA AMOSTRA. ESTIMATIVA DA CARACTERÍSTICA TOTAL DA POPULAÇÃO INVESTIGADA

ESTATÍSTICA PARTE 1 OBJETIVO DA DISCIPLINA

IND 1115 Inferência Estatística Aula 8

Estatística - exestatmedposic.doc 25/02/09

cuja distribuição é t de Student com n 1 graus de liberdade.

Aula 8 Intervalos de confiança para proporções amostras grandes

Regressão linear múltipla. Prof. Tatiele Lacerda

Análise de Regressão Linear Simples III

Inferência sobre duas proporções

Análise de Regressão. Notas de Aula

ESCOLA SUPERIOR DE TECNOLOGIA DE SETÚBAL DEPARTAMENTO DE MATEMÁTICA PROBABILIDADES E ESTATÍSTICA Teste Final 2009/2010. Curso: 12/06/2010.

Variáveis Frequências Gráficos Medidas de Posição Medidas de Dispersão Medidas Complementares Inferência

Regressão Linear Múltipla

Unidade 5.2. Teste de hipóteses. Hipótese estatística. (uma população) Formulando as hipóteses. Teste de Hipóteses X Intervalo de Confiança

Matemática Aplicada às Ciências Sociais

Desvio Padrão ou Erro Padrão

Teste de hipóteses para médias e proporções amostrais

Capítulo 5. Inferência no Modelo de Regressão Simples: Estimação de Intervalos, Teste de Hipóteses e Previsão

1 Introdução. 1.1 Importância da Utilização da Amostragem

x = xi n x = xifi fi 1. MÉDIA Exercício: Quando a distribuição é simétrica, a média e a mediana coincidem.

AGRUPAMENTO DE ESCOLAS DA SÉ GUARDA. MATEMÁTICA B Curso de Artes Visuais

População e Amostra POPULAÇÃO AMOSTRA AMOSTRAGEM TIPOS DE AMOSTRAGEM I. Amostra probabilística: II. Amostra não-probabilística

DISTRIBUIÇÃO DE FREQUÊNCIA DE VARIÁVEIS QUALITATIVAS E QUANTITATIVAS DISCRETAS (TABELAS E GRÁFICOS)

Probabilidade e Estatística, 2009/2

EXAME DE MACS 2º FASE 2014/2015 = 193

Testes de variância e Análise de Variância (ANOVA)

é 4. Portanto, o desvio padrão é 2. Neste caso 100% dos valores da população estão a um desvio padrão da média.

Stela Adami Vayego DEST/UFPR

Lição 5 Medidas Descritivas Medidas de Dispersão

ANÁLISE EXPLORATÓRIA DE DADOS

Aula 11 Teste de hipótese sobre a média de uma população normal - σ 2 conhecida

Medidas de Tendência Central. Introdução Média Aritmética Moda Mediana

Medidas de dispersão e assimetria

Planejamento e Análise Estatística de Experimentos Fatoriais em blocos completos

Aula 1 Variáveis aleatórias contínuas

UNIDADE 6 TESTES DE HIPÓTESES OBJETIVOS ESPECÍFICOS DE APRENDIZAGEM

Modelo Uniforme. como eu e meu colega temos 5 bilhetes, temos a mesma probabilidade de ganhar a rifa:

Coeficiente de Assimetria e Curtose. Rinaldo Artes. Padronização., tem as seguintes propriedades: Momentos

Probabilidade III. Ulisses U. dos Anjos. Departamento de Estatística Universidade Federal da Paraíba. Período

1. Estatística Descritiva

Conteúdo. 1 Introdução. Histograma do 1o Sorteio da Nota Fiscal Paraná 152/15. 1º Sorteio Eletrônico da Nota Fiscal Paraná

Conteúdo. 1 Introdução. Histograma do Quinto Sorteio da Nota Fiscal Paraná 065/16. Quinto Sorteio Eletrônico da Nota Fiscal Paraná

MEDIDAS DE DISPERSÃO. o grau de variabilidade, ou dispersão, dos valores em torno da média.

Avaliação e Desempenho Aula 1 - Simulação

Técnicas estatísticas para análise de dados e de resultados de modelos de simulação

Plano de Ensino PROBABILIDADE E ESTATÍSTICA APLICADA À ENGENHARIA - CCE0292

Os dados quantitativos também podem ser de natureza discreta ou contínua.

Química Analítica IV ERRO E TRATAMENTO DE DADOS ANALÍTICOS

IV Regressão e correlação IV.4. (cont.) Significância Estatística e Regressão Múltipla

Modelos de Probabilidade e Inferência Estatística

2) Escreva um algoritmo que leia um conjunto de 10 notas, armazene-as em uma variável composta chamada NOTA e calcule e imprima a sua média.

Erros e Incertezas. Rafael Alves Batista Instituto de Física Gleb Wataghin Universidade Estadual de Campinas (Dated: 10 de Julho de 2011.

(1, 6) é também uma solução da equação, pois = 15, isto é, 15 = 15. ( 23,

Amostragem: Desenho e Procedimentos

Estatística Não Paramétrica

CAPÍTULO 8. de Variância - ANOVA ANOVA. Análise

Medidas de Localização

3 Modelos de Simulação

Probabilidade e Estatística, 2011/2

Processos Estocásticos

Contabilometria. Análise Discriminante

Capítulo 6 Estatística não-paramétrica

Testes de Ajustamento (testes da bondade do ajustamento)

25 a 30 de novembro de 2013

Aula 6 Medidas de Tendência Central

Unidade Medidas de Posição ou de Tendência Central

Diplomados com o Ensino Superior

Medidas e Escalas: Escalas não Comparativas

Aula 6 Propagação de erros

Probabilidade. Distribuição Binomial

índice Introdução Estatística Descritiva Capítulo 1 Capítulo 2 O que é a Estatística Escalas de medida Escalas Nominais Escalas Ordinais

Para mais de duas variáveis independentes, em função de uma variável dependente.

Teste 1. (a) 0.33 (b) 0.50 (c) 0.30 (d) 0.20

Transcrição:

Testes Não Paramétricos Nos testes abordados até agora, ditos testes paramétricos, as hipóteses envolvem apenas parâmetros populacionais, como a média, a variância, uma proporção, etc. Além disso, em geral, estes testes comportam uma diversidade de suposições fortes a que o seu emprego deve subordinar-se de que são exemplo: as observações devem ser extraídas de populações com distribuição especificada; as variáveis em estudo devem ser medidas em escala intervalar ou de rácios, de modo a que seja possível utilizar operações aritméticas sobre os valores obtidos das amostras (adição, multiplicação,...), etc. 1

Vamos agora abordar um conjunto de testes que nos permitem testar outro tipo de hipóteses que não apenas sobre parâmetros populacionais (e.g., se a distribuição populacional em estudo pode ser considerada Normal). Estes são chamados testes não paramétricos. Estes testes são, em geral, fáceis de aplicar, pois podem ser usados quando as hipóteses exigidas por outras técnicas não são satisfeitas. Apesar de haver certas suposições básicas associadas à maioria das provas não paramétricas, essas suposições são em menor número e mais fracas do que as associadas às provas paramétricas. A maior parte das provas não paramétricas servem para pequenas amostras e, além disso, aplicam-se a dados medidos em escala ordinal, e alguns mesmo a dados em escala nominal. 2

Testes de Ajustamento Testes de Ajustamento (testes da bondade do ajustamento) Os testes de ajustamento servem para testar a hipótese de que uma determinada amostra aleatória tenha sido extraída de uma população com distribuição especificada. Hipóteses a testar: H 0 : a amostra provém de uma população com distribuição especificada H 1 : a população de onde provém a amostra não segue a distrib. especificada 3

Testes de Ajustamento Exemplo: Pretende-se construir um modelo de simulação das operações de um determinado terminal de um porto situado na Europa. Uma das variáveis a considerar no modelo é a diferença entre a data de chegada dos navios provenientes dos EUA e a respectiva data planeada. Há razões para supor que tal diferença é uma variável aleatória com distribuição Normal de média 0.1 e desvio padrão 7.2. Uma amostra de 30 navios revelou os resultados que se apresentam na tabela seguinte. -6.6-2 5 2.4-1.8-0.3 15-7.6-0.6 2.6-7.4 12.4-6 -5.8 15.2-2.4-8.9-5.6-3.7 2.2 8.2-9 13.2 7.6-2.8-1.8 1.8 4.4 2.2 4 Diferença entre a data de chegada e a data planeada para 30 navios. Será mesmo de admitir que tais dados foram extraídos de uma pop. N(0.1, 7.2)? 4

Testes de Ajustamento Neste exemplo, estamos perante um problema de ajustamento de dados a uma determinada distribuição. Existem vários testes de ajustamento que nos permitem fazer uma análise de problemas deste tipo, entre os quais: o Teste de Ajustamento do Qui-quadrado sugerido por Karl Pearson, o teste de Kolmogorov ou Kolmogorov-Smirnov e o teste de normalidade de Lilliefors, que apresentamos a seguir. 5

Testes de Ajustamento Teste do Qui-quadrado Considere-se uma amostra aleatória de n elementos, extraída de uma população com distribuição desconhecida, sobre os quais se observa uma característica (qualitativa ou quantitativa). Os valores possíveis da característica em estudo são, num primeiro passo, repartidas por m classes mutuamente exclusivas, A 1, A 2,..., A m (serão intervalos da recta real se a característica é quantitativa e contínua). 6

Testes de Ajustamento Denote-se por: - O i o nº de observações ou frequência absoluta observada da classe A i ; - p i a probabilidade desconhecida de obter uma observação na classe A i ; - p 0i a probabilidade de obter uma observação na classe A i, assumindo que a observação foi extraída de uma população com a distribuição especificada em H 0. Hipóteses a testar: H 0 : p i =p 0i, i=1,...,m H 1 : p i p 0i para algum i 7

Testes de Ajustamento Assim, a frequência esperada da classe A i, quando H 0 é verdadeira, é dada por e i = n p 0i. A estatística de teste, do teste de ajustamento do Qui-quadrado, é dada por Q ( Oi ei ) = m i= 1 e i 2 que, sendo verdadeira a hipótese nula, tem distribuição assimptótica do Quiquadrado com m-k-1 graus de liberdade (χ 2 m-k-1), onde k é o número de parâmetros desconhecidos da distribuição proposta em H 0, estimados a partir da amostra. 8

Testes de Ajustamento Se a hipótese nula for verdadeira, a diferença entre cada valor observado e o respectivo valor esperado, O i e i, não deve ser muito grande e, consequentemente, a estatística de teste terá um valor observado, Q obs, também não muito grande. De modo intuitivo, quanto maior for o valor observado de Q, menos plausível é a hipótese nula, isto é, mais nos encaminhamos de concluir que as frequências observadas não foram provenientes da população em que se baseou a hipótese nula, levando à rejeição desta. Trata-se portanto de um teste unilateral à direita. 9

Testes de Ajustamento Na aplicação deste teste deve-se ter particular atenção às frequências esperadas, e i s, pois se estas forem muito pequenas a aproximação ao Qui-quadrado não é a mais apropriada. São referidas na literatura várias regras práticas de aplicação do teste, das quais avançamos a seguinte. Se tivermos: ou, - mais de 20% das classes com e i inferior a 5 - alguma classe com e i inferior a 1 devemos proceder à agregação de algumas classes contíguas, e iniciar novamente o teste, agora com menos classes. 10

Testes de Ajustamento Retomemos o exemplo exposto atrás. Exemplo: Denotando por X a diferença entre a data de chegada dos navios e a data planeada, as hipóteses a testar são H 0 : X ~ N(0.1, 7.2 2 ) H 1 : X ~/ N(0.1, 7.2 2 ) Neste caso a distribuição proposta em H 0 é contínua e, deste modo, as classes A i, i=1,...m, são intervalos da forma A 1 =]-, a 1 [, A 2 =[ a 1, a 2 [ A 3 =[ a 2, a 3 [... A m =[ a m-1, + [. 11

Testes de Ajustamento Para a determinação das classes é sugerida a regra de Mann e Wald: Número de classes = m, com m tal que n/m>5. Os limites dos intervalos são tais que as probabilidades decorrentes da hipótese nula sejam iguais a 1/m para todas as classes. Assim, as frequências esperadas são todas iguais a n/m>5. Para o exemplo escolheu-se m=4 classes (e i =30/4=7.5>5), donde p 0i = P(A i \H 0 ) = 1/4, para i=1,2,3,4. 12

Testes de Ajustamento Cálculo dos limites dos intervalos de classe: a 3 : p 03 = 0.25 a 3 =4.96 (EXCEL: INV.NORM(0.75;0.1;7.2)); 1/4 1/4 1/4 1/4 Da simetria da distribuição normal: a 1 a 2 =0.1 a 3 a 2 =0.1 e a 1 =0.1-(4.924-0.1)= -4.724 (EXCEL: INV.NORM(0.25;0.1;7.2)) 13

Testes de Ajustamento -6.6-2 5 2.4-1.8-0.3 15-7.6-0.6 2.6-7.4 12.4-6 -5.8 15.2-2.4-8.9-5.6-3.7 2.2 8.2-9 13.2 7.6-2.8-1.8 1.8 4.4 2.2 4 Classes Frequências observadas p 0i Frequências esperadas A 1 =]-, -4.76[ 8 0.25 7.5 A 2 =[-4.76,0.1[ 8 0.25 7.5 A 3 =[0.1, 4.96[ 7 0.25 7.5 A 4 =[4.96, + [ 7 0.25 7.5 O valor observado da estatística de teste é Q obs = (8 7.5) 7.5 2 + (8 7.5) 7.5 2 (7 + 7.5) 7.5 2 (7 + 7.5) 7.5 2 = 0.13 14

Testes de Ajustamento A estatística teste, sob o pressuposto de H 0 ser verdadeira, tem aproximadamente distribuição Qui-quadrado com m-1=4-1=3 graus de liberdade. Para α=0.05: R.C.=[7.81, + [. (EXCEL: 7.81=INV.CHI(0,05;3)) Como Q obs R.C., somos levados a não rejeitar a hipótese de que a diferença entre os tempos de chegada e os tempos planeados tem distribuição N(0.1, 7.2 2 ). 15

Testes de Ajustamento Teste de Kolmogorov-Smirnov (K-S) O teste de Kolmogorov-Smirnov (K-S) ao contrário do teste do Qui-quadrado, não se aplica a dados qualitativos nem a variáveis discretas, pois a tabela disponível para este teste só é exacta caso a distribuição em teste seja contínua. No entanto, tem a vantagem de não estar dependente de classificações dos dados, que além de serem sempre algo arbitrárias envolvem perdas de informação. De facto, no ajustamento de uma distribuição contínua a uma amostra usando o teste do Qui-quadrado, temos de proceder à agregação dos dados em classes, sendo por isso mais adequado utilizar o teste K-S. 16

Testes de Ajustamento Por outro lado, o teste K-S só pode ser aplicado quando a distribuição indicada na hipótese nula está completamente especificada (o que não sucede com o teste do Qui-quadrado). No caso de pretendermos, por exemplo, efectuar um ajustamento de uma distribuição normal, sem especificar µ e σ, podemos recorrer a outro teste, neste caso o teste desenvolvido por Lilliefors (teste de normalidade de Lilliefors) que será abordado mais tarde. Além disso, o teste do Qui-Quadrado está orientado essencialmente para grandes amostras, enquanto que o teste K-S é aplicável a pequenas amostras. 17

Testes de Ajustamento Seja F a função de distribuição da população em estudo e F 0 a função de distribuição proposta, contínua e completamente especificada. Hipóteses a testar: H 0 : F(x)=F 0 (x), para qualquer x H 1 : F(x) F 0 (x), para algum x No teste de Kolmogorov-Smirnov comparam-se as frequências relativas acumuladas registadas na amostra com as que se esperariam se a distribuição populacional fosse a especificada na hipótese nula. 18

Testes de Ajustamento A Estatística do teste de K-S considera a maior das diferenças, em valor absoluto, entre a proporção de observações inferiores ou iguais a x, S(x), e a probabilidade de se observar um valor inferior ou igual a x se a distribuição populacional for a especificada em H 0, F 0 (x): D n = sup S ( x ) F 0( x ) < x<+ F 0 (x) S (x) 19

Testes de Ajustamento Uma vez que F 0 é uma função (contínua) não decrescente e S é uma função em escada, o supremo ocorre num ponto onde se verifica um salto de S : { F ( x ) S( x ), F ( x ) S( x ) } D. n, obs = i i= 1,..., n max 0 i i 0 i 1 Assim, se H 0 for verdadeira, a distância vertical máxima entre as imagens das duas distribuições não deve de ser muito grande, e logo espera-se que D n,obs tome um valor pequeno. Então, para um nível de significância α, rejeita-se H 0, se o valor observado for superior ou igual ao ponto crítico D n,α (os valores críticos D n,α podem ser consultados numa tabela). 20

Testes de Ajustamento Exemplo: Acredita-se que o tempo despendido na execução de uma determinada tarefa é uma variável aleatória com distribuição normal de média 290 minutos e desvio padrão 56 minutos. Foram registados os tempos despendidos em 10 tarefas seleccionadas ao acaso, tendo-se registado o seguinte: 198 254 262 272 275 278 285 287 287 292 Ao nível de significância de 5%, há evidência para rejeitar a hipótese de normalidade da referida variável? 21

Testes de Ajustamento Denote-se por X o tempo despendido na execução de uma tarefa. As hipóteses a testar são, neste caso, H 0 : X N(290, 56 2 ) H 1 : X ~/ N(290, 56 2 ). O ponto crítico da estatística de teste D 10 é, para α=0.05, D 10,0.05 = 0.409 (consulte a tabela). Para calcular o valor observado da estatística de teste, começa-se por ordenar os valores da amostra por ordem crescente. Os cálculos estão efectuados na tabela seguinte. 22

Testes de Ajustamento EXCEL: DIST.NORM(198;290;56;VERDADEIRO) x i S(x i ) S(x i-1 ) F 0 (x i ) F 0 (x i )- S(x i ) F 0 (x i )- S(x i-1 ) 198 0,1 0 0,0502 0,05 0,0502 254 0,2 0,1 0,2602 0,06 0,1602 262 0,3 0,2 0,3085 0,009 0,1085 272 0,4 0,3 0,3739 0,026 0,0739 275 0,5 0,4 0,3944 0,106 0,0056 278 0,6 0,5 0,4152 0,185 0,0848 285 0,7 0,6 0,4644 0,236 0,1356 287 0,9 0,7 0,4786 0,421 0,2214 292 1 0,9 0,5142 0,486 0,3858 Como D 10,obs =0.486>0.409, ao nível de significância de 5%, rejeitamos a hipótese de o tempo despendido na execução de uma tarefa seguir distribuição N(290, 56 2 ). 23

Testes de Ajustamento Teste de Normalidade Lilliefors Pretende-se testar se uma dada variável aleatória X tem distribuição N(µ, σ 2 ) sem especificar µ e σ, isto é, para algum µ e algum σ. Hipóteses a testar H 0 : X ~ N(µ, σ 2 ) H 1 : X ~/ N(µ, σ 2 ) Este teste processa-se como o teste de K-S, usando estimativas de µ e σ, respectivamente, x e s. Os pontos críticos são consultados na tabela elaborada por Lilliefors. 24

Testes de Ajustamento Exemplo: Um distribuidor pretende estimar o tempo médio de entrega dos seus produtos a um cliente bastante importante. Foi recolhida uma amostra aleatória de cinco tempos: 29, 33, 35, 36 e 36. O senhor quer estimar o tempo médio pretendido através de um intervalo de confiança, mas nada sabe acerca da distribuição do tempo de entrega X, e além disso, a dimensão da amostra é muito pequena (n=5). Poderá fazê-lo? Sabemos que caso a distribuição subjacente aos dados seja normal, o intervalo pode ser calculado usando a fórmula: S X m t, onde t: P(-t<T<t) =λ, T ~ t n-1 n 25

Testes de Ajustamento Assim, interessa testar, em primeiro lugar, as hipóteses H 0 : X ~ N(µ, σ 2 ) H 1 : X ~/ N(µ, σ 2 ) Uma vez que nada sabemos acerca de µ e σ, podemos utilizar o teste de Lilliefors, recorrendo às estimativas x =33.8 s=2.95. D O valor crítico da estatística teste, ao nível de significância de 0.05 é * 5,0.05 =0.337 (consulte a tabela). 26

Testes de Ajustamento EXCEL: DIST.NORM(29;33.8;2.95;VERDADEIRO) Cálculo do valor observado da estatística de Teste: x i S(x i ) S(x i-1 ) F 0 (x i ) F 0 (x i )- S(x i ) F 0 (x i )- S(x i-1 ) 29 0,2 0 0,0519 0,1481 0,0519 33 0,4 0,2 0,3931 0,0069 0,1931 35 0,6 0,4 0,6579 0,0579 0,2579 36 1 0,6 0,772 0,2279 0,1721 Como D * 5, obs =0.2579<0.337, então, ao nível se significância de 5%, não rejeitamos a hipótese de a população em estudo ter distribuição normal. 27

Tabelas de Contingência Tabelas de Contingência Teste do Qui-quadrado de Independência Suponha que numa amostra aleatória de tamanho n de uma dada população são observados dois atributos ou características A e B (qualitativas ou quantitativas), uma com r e outra com s modalidades ou categorias, respectivamente A 1, A 2,..., A r e B 1, B 2,..., B s. 28

Tabelas de Contingência Cada indivíduo da amostra é classificado numa e numa só categoria (ou classe) de A e numa e numa só categoria (ou classe) de B. A classificação dos elementos da amostra dá origem a uma tabela de dupla entrada, designada por tabela de contingência r s, com o seguinte aspecto: B 1 B 2... B s A 1 O 11 O 12... O 1s A 2 O 21 O 22... O 2s M M M O M A r O r1 O r2... O rs O ij (i=1,...,r e j=1,...,s) número de elementos classificados simultaneamente nas categorias A i de A e B j de B, numa amostra de tamanho n. 29

Tabelas de Contingência Sejam: O i = s j= 1 O (i=1,...,r) nº de elementos na amostra com modalidade A i ; ij O j = r i= 1 O (j=1,...,s) nº de elementos na amostra com modalidade B j. ij Tem-se, n = r s i= 1j= 1 O ij = r i= 1 O = s i j= 1 O j onde n é a dimensão da amostra. 30

Tabelas de Contingência O objectivo a que nos propomos é o de tentar inferir sobre a existência ou não de qualquer relação ou associação entre os atributos (variáveis) A e B, mais concretamente, inferir se A e B são ou não independentes. Hipóteses a testar: H 0 : A e B são independentes H 1 : A e B não são independentes 31

Tabelas de Contingência Denote-se por: p ij =P(A i B j ) (i=1,..,r e j=1,...,s) a probabilidade (desconhecida) de um indivíduo da população ser classificado simultaneamente nas categorias A i de A e B j de B; p i =P(A i) (i=1,...,r) a probabilidade (desconhecida) de um indivíduo da população ser classificado na categoria A i de A; p j =P(B j ) (j=1,...,s) a probabilidade (desconhecida) de um indivíduo da população ser classificado na categoria B j de B. r s i= 1j= 1 i= 1 1 = p = p = p. ij r s i j= 1 j 32

Tabelas de Contingência Ora, se os atributos são independentes, verifica-se a conhecida relação, isto é, P(A i B j ) = P(A i ) P(B j ), p ij = p i p j Assim, as hipóteses anteriores podem ser formuladas do seguinte modo: H 0 : p ij = p i p j (para todo i e j) H 1 : p ij p i p j (para algum i j). 33

Tabelas de Contingência Os verdadeiros valores das probabilidades p i e p j são estimadas, a partir dos dados amostrais, por O pˆ i i = e n O j pˆ j =, n Notação: e ij =n p ij número esperado de indivíduos na classe A i de A e B j de B. Quando H 0 é verdadeira, i.e, p ij = p i p j, temos e ij =n p ij =n p i p j estimado por ê ij = n pˆ pˆ = i j O O i n j 34

Tabelas de Contingência A estatística do teste de independência é então: χ 2 = r s i= 1j= 1 (O ij ê ê ij ij ) 2, que, sob o pressuposto de H 0 ser verdadeira, tem distribuição assimptótica do Qui-quadrado com (r-1)(s-1) graus de liberdade. Vimos que quando H 0 é verdadeira e ij pode ser estimado por ê ij = n pˆ pˆ. i j Logo, a diferença entre O ij (frequência observada) e ê ij (estimativa da frequência esperada supondo a independência) não deve ser grande. Assim, a estatística teste, mede o afastamento dos dados em relação à hipótese de independência. Trata-se então de um teste unilateral à direita. 35

Tabelas de Contingência Exemplo: Um supermercado quer testar ao nível de significância de 5% a hipótese de que o modo de pagamento dos clientes nesse estabelecimento é independente do período do dia em que fazem as compras. Existem três modos de efectuar os pagamentos: por cheque, dinheiro e cartão de débito/crédito. A seguinte tabela de contingência 3 3 apresenta os resultados obtidos numa amostra de 4000 clientes: PERÍODO DO DIA MODO DE PAGAMENTO Manhã Tarde Noite Cheque 750 1500 750 Dinheiro 125 300 75 Cartão de débito/crédito 125 200 175 36

Tabelas de Contingência Denotando por A o atributo Modo de pagamento e por B o atributo Período do dia em que faz as compras, as hipóteses as testar são H 0 : A e B são independentes H 1 : A e B não são independentes Uma vez que A e B assumem cada uma 3 modalidades, sob H 0, a estatística teste tem distribuição assimptótica do Qui-quadrado com (r-1)(s-1)=(3-1)(3-1)= 4 graus de liberdade. Ao nível de significância de 0.05, a região crítica é então [9.49, + [ (consulte tabela ou faça no EXCEL: INV.CHI(0,05;4)). 37

Tabelas de Contingência PERÍODO DO DIA MODO DE PAGAMENTO Manhã Tarde Noite Totais Cheque 750 1500 750 3000 Dinheiro 125 300 75 500 Cartão de Crédito 125 200 175 500 Totais 1000 2000 1000 4000 Cálculo das frequências esperadas: ê ij O = n pˆ i pˆ j=n i n ê 11 =(3000 1000)/4000=750 ê 12=(3000 2000)/4000=1500 ê 13 =(3000 1000)/4000=750. M O j Oi = n no j 38

Tabelas de Contingência Frequências esperadas PERÍODO DO DIA MODO DE PAGAMENTO Manhã Tarde Noite Totais Cheque 750 1500 750 3000 Dinheiro 125 250 125 500 Cartão de Crédito 125 250 125 500 Totais 1000 2000 1000 4000 Valor observado da estatística teste: χ 2 obs = (750 750) 750 2 (1500 1500) + 1500 2 (200 250) +...+ 250 2 (175 125) + 125 2 =60. Uma vez que 60 excede o valor crítico 9.49, ao nível de significância de 0.05, rejeitamos a hipótese de que o modo de pagamento é independente do período do dia em que as compras são feitas. 39

Tabelas de Contingência Medidas de Associação No teste do Qui-Quadrado apresentado, se for rejeitada a hipótese de independência entre os atributos, pode interessar medir a intensidade da associação entre os mesmos, através de uma medida adequada. Uma vez que a estatística do teste mede o afastamento em relação à hipótese de independência, o seu valor observado poderá ser usado para avaliar o grau de associação entre os atributos. 40

Tabelas de Contingência Coeficiente de Contingência de Pearson: C = χ χ 2 2 + n Este coeficiente varia entre 0 e ( q 1) q onde q=min{r,s} e portanto nunca assume o valor 1. Valores pequenos de C indicam fraca associação entre os atributos, enquanto que valores grandes de C indicam forte associação. O facto deste coeficiente não assumir o valor 1 no caso de associação completa é uma sua limitação. Para obviar este problema, Tshuprow propôs o seguinte coeficiente. 41

Tabelas de Contingência Coeficiente de Tshuprow: T = n (r χ 2 1) (s 1) Este coeficiente varia entre 0 e 1, tomando o valor 0 no caso de existir independência e o valor 1 quando r=s e houver associação completa. Por último, referimos o coeficiente proposto por Cramer que atinge o valor 1 quando há associação completa. Coeficiente V de Cramer: V 2 χ =, com q=min{r,s} 0 V 1. n(q 1) 42

Tabelas de Contingência Para o exemplo anterior, rejeitámos a hipótese de independência entre o modo de pagamento e o período do dia em que as compras eram efectuadas. Para ter uma ideia da intensidade de associação entre estes dois atributos, calculam-se os coeficientes que acabámos de descrever. χ 60 Coeficiente de Contingência de Pearson: C = = = 0. 122 2 χ + n 60 + 4000 2 0 C ( q 1) q, onde q=min{r,s}=3, i.e, 0 C 0.816. 43

Tabelas de Contingência Coeficiente de Tshuprow: T χ 2 60 = = n (r 1) (s 1) 4000 2 2 =0.087 Coeficiente V de Cramer: 2 V χ 60 = = n(q 1) 4000 2 =0.087 Verificamos, então, que apesar de haver associação entre os atributos, esta pode considerar-se fraca. 44

Tabelas de Contingência Teste de Homogeneidade Suponha que são recolhidas amostras aleatórias de s populações (sub-populações ou estratos) B 1, B 2,..., B s, nas quais se observa um atributo A com r categorias A 1, A 2,..., A r. Neste contexto, surge também uma tabela de contingência r s: B 1 B 2... B s A 1 O 11 O 12... O 1s A 2 O 21 O 22... O 2s M M M O M A r O r1 O r2... O rs O ij (i=1,...,r e j=1,...,s) número de elementos da amostra da população B j classificados na categoria A i de A. 45

Tabelas de Contingência Sejam: O i = s j= 1 amostras; O (i=1,...,r) nº de elementos na categoria A i de A em todas as ij O j = r i= 1 O (j=1,...,s) tamanho da amostra recolhida na população B j. ij Neste caso, cada B j rotula uma sub-população cujos elementos se distribuem pelas r modalidades do atributo A, e o que se pretende saber é se existe homogeneidade, isto é, se não há diferença entre as populações no modo como os seus elementos se distribuem pelas modalidades do atributo A. 46

Tabelas de Contingência À semelhança do teste de independência, a estatística do teste é χ 2 = r s i= 1j= 1 (O ij ê ê ij ij ) 2, que, sob o pressuposto de H 0 ser verdadeira, tem distribuição assimptótica do Qui-Quadrado com (r-1)(s-1) graus de liberdade. Valores muito grandes da estatística de teste traduzem um grande afastamento dos dados em relação à hipótese nula, conduzindo à rejeição desta. Assim, a estatística de teste mede o afastamento dos dados em relação à hipótese de homogeneidade. 47

Tabelas de Contingência Para aplicar os testes de independência e de homogeneidade devem ser seguidas as mesmas regras que vimos para o teste de ajustamento do Quiquadrado, isto é, se tivermos: ou, - mais de 20% das frequências esperadas, e i s, inferiores a 5 - alguma frequência esperada inferior a 1 devemos proceder à agregação de algumas classes contíguas. 48

Tabelas de Contingência Teste exacto de Fisher O teste do Qui-quadrado é, como já se disse, baseado numa distribuição assimptótica, o que portanto limita a sua aplicação ao caso de grandes amostras (recorde as limitações sobre as frequências esperadas). Em tabelas de contingência 2x2, existe uma alternativa ao teste do Qui-quadrado, o teste de Fisher, que é um teste exacto, i.e., a distribuição da estatística é exacta (os pontos críticos e valores-p são calculados de forma exacta). 49

Ajuste entre duas Amostras Independentes AJUSTE ENTRE DUAS AMOSTRAS INDEPENDENTES Objectivo: Dadas duas amostras aleatórias e independentes provenientes de duas populações, pretende-se testar a hipótese H 0 de que as duas distribuições populacionais são idênticas, isto é, as duas amostras podem ser consideradas como provenientes de populações com a mesma distribuição. Hipóteses a testar: H 0 : As duas amostras são retiradas de populações com a mesma distribuição H 1 : As duas amostras são retiradas de populações com distribuições diferentes 1

Ajuste entre duas Amostras Independentes Teste do Qui-quadrado Os valores possíveis da característica em estudo são repartidos por m classes mutuamente exclusivas A 1, A 2,...,A m. A hipótese H 0 que se pretende testar é a de que as duas populações em estudo têm a mesma distribuição, isto é, não há diferença entre as duas populações no modo como os seus elementos se distribuem pelas diversas classes. Por outras palavras, as duas populações são homogéneas. Trata-se então do teste do Qui-quadrado de homogeneidade para duas populações (s=2). 2

Ajuste entre duas Amostras Independentes Teste de Kolmogorov-Smirnov Este teste aplica-se a distribuições contínuas. Comparam-se as frequências relativas acumuladas registadas nas duas amostras (digamos A e B). Se não se registarem diferenças significativas, não é rejeitada a hipótese nula de que as duas amostras provêm de populações com a mesma distribuição. A estatística de teste considera a maior das diferenças, em valor absoluto, entre as proporções de valores inferiores ou iguais a x observadas em cada amostra, S A (x) S B (x). Estatística de teste: D' = sup < x<+ S A ( x) S Para um nível de significância α, a hipótese H 0 é rejeitada se o valor observado da estatística de teste for superior ao ponto crítico B ( x) D ' α (a ser consultado numa tabela). 3

Ajuste entre duas Amostras Independentes Exemplo: Registaram-se os valores de uma análise feita a 80 indivíduos com a variante A de uma dada doença, obtendo-se os seguintes resultados VALORES 20 22 23 26 29 30 31 33 34 N.º indivíduos 2 3 9 12 27 16 7 2 2 Seleccionaram-se aleatoriamente 70 indivíduos com a variante B da mesma doença. Os valores da análise para estes 70 indivíduos estão registados seguidamente. VALORES 23 24 26 28 30 31 32 33 34 36 38 N.º indivíduos 1 2 3 6 15 20 13 4 3 2 1 Pode-se admitir que a distribuição dos valores da análise é a mesma para as duas variantes da doença? Servirá esta análise como meio de diagnostico da variante A ou B desta doença? (Use α=0.01) 4

Ajuste entre duas Amostras Independentes Variante A: Variante B: VALORES 20 22 23 26 29 30 31 33 34 N.º indivíduos 2 3 9 12 27 16 7 2 2 Freq. acumuladas 2 5 14 26 53 69 76 78 80 S A (x) 2/80 5/80 14/80 26/80 53/80 69/80 76/80 78/80 1 VALORES 23 24 26 28 30 31 32 33 34 36 38 N.º indivíduos 1 2 3 6 15 20 13 4 3 2 1 Freq. acumuladas 1 3 6 12 27 47 60 64 67 69 70 S B (x) 1/70 3/70 6/70 12/70 27/70 47/70 60/70 64/70 67/70 69/70 1 5

Ajuste entre duas Amostras Independentes Cálculo do valor observado da estatística de teste: Valores 20 22 23 24 26 28 29 30 31 32 33 34 36 38 S A (x) 2/80 5/80 14/80 14/80 26/80 26/80 53/80 69/80 76/80 76/80 78/80 1 1 1 S B (x) 0 0 1/70 3/70 6/70 12/70 12/70 27/70 47/70 60/70 64/70 67/70 69/70 1 S A (x)- S B (x) 0,025 0,063 0,161 0,132 0,239 0,154 0,491 0,477 0,279 0,093 0,061 0,043 0,014 0 O valor observado da estatística de teste é então D obs =0.491. 80 + 70 Para α=0.01, o ponto crítico é (consulte tabela): 1.63 = 0. 267. 80 70 6

Ajuste entre duas Amostras Independentes Dado que o valor observado da estatística de teste é 0.491>0.267, então rejeita-se a hipótese nula de as duas variantes da doença não se distinguirem quanto à distribuição dos valores da análise. Há portanto evidência estatística, ao nível de significância de 0.01, de que os valores da análise de distribuem de forma diferente na variante A e B da doença. 7

Teste de Kruskal_Wallis TESTE DE KRUSKAL-WALLIS Objectivo: Dadas k populações nas quais se estuda uma característica comum e de onde foram extraídas k amostras aleatórias e independentes, pretende-se testar a hipótese H 0 de que as distribuições populacionais são idênticas, isto é, as k amostras podem ser consideradas como provenientes de populações com a mesma distribuição. Nota: O teste de Krukal-Wallis constitui uma alternativa à análise de variância com um factor, a ser abordada mais tarde, quando os pressupostos desta não podem ser verificados. 1

Teste de Kruskal_Wallis Hipóteses a testar: H 0 : As k amostras são retiradas de populações com a mesma distribuição H 1 : As k amostras não são retiradas de populações com a mesma distribuição, isto é, há pelo menos duas populações com distribuições diferentes O teste de Kruskal-Wallis é particularmente sensível a diferenças nas medidas de localização. Por esta razão as hipóteses são geralmente formuladas em termos das médias ou das medianas populacionais. 2

Teste de Kruskal_Wallis Notação: µ i média da i-ésima população M i mediana da i-ésima população H 0 : µ 1 =µ 2 = =µ k H 1 : µ i µ j, i j (as médias populacionais são iguais para as k populações) (há pelo menos duas populações com médias diferentes) H 0 : M 1 =M 2 = =M k (as k medianas populacionais são iguais) H 1 : M i =M j, i j (há pelo menos duas populações com medianas diferentes) 3

Teste de Kruskal_Wallis Notação: n i - o tamanho da amostra retirada da população i (i=1,...k); N = k n i i= 1 - nº total de observações; X ij - a j-ésima observação da amostra da população i. Procedimento: ordenam-se todas as observações por ordem crescente dos seus valores; atribui-se um nº de ordem, ou posto, R ij, a cada observação X ij (a observação mais pequena fica com o nº de ordem, ou posto, 1 e a observação maior com o posto N); para cada população i determina-se o valor R i da soma dos postos das observações correspondentes a esse grupo populacional: R n = i i R ij j= 1 4

Teste de Kruskal_Wallis Quando há empates nos valores observados, o número de ordem, ou posto, que deve ser atribuído a cada valor empatado deve ser a média dos números de ordem que seriam atribuídos a estes valores se não estivessem empatados. Por exemplo, suponhamos que ordenando os valores observados obtínhamos 100, 102, 102, 102, 102.5, 103, 103, 104. Neste caso, os números de ordem seriam respectivamente, 1, 3, 3, 3, 5, 6.5, 6.5, 8. 5

Teste de Kruskal_Wallis Quando não há empates nos valores observados das amostras, ou o nº de empates é muito pequeno, a estatística de teste é: 12 k R H= i 3(N + 1) N(N + 1) = n i 1 A hipótese nula deve ser rejeitada se o valor observado da estatística H for muito grande, i.e., superior ao ponto crítico (teste unilateral à direita). Pontos críticos: o Se k=3 e n i 5 para todo i=1,...,k, consultar tabela da distribuição exacta da estatística H, sob H 0. o Se n i 5 para todo i=1,...,k, sob H 0, H tem aproximadamente 2 distribuição ; consultar tabela desta distribuição. χ k 1 2 i 6

Teste de Kruskal_Wallis Quando há muitos empates nos valores observados das amostras a estatística de teste a usar deve ser: onde, 1 H'= S 2 k 2 Ri N(N + 1) i= 1 ni 4 2 Pontos críticos: S 2 1 k ni 2 N(N + 1) Rij N 1 i= 1 j= 1 4 = 2 o Se n i 5 para todo i=1,...,k, sob H 0, H tem aproximadamente 2 distribuição ; consultar tabela desta distribuição. χ k 1 7

Teste de Kruskal_Wallis Exemplo: Para avaliar o mérito de três métodos de ensino diferentes, cada um de 14 estudantes foi aleatoriamente matriculado em uma de três turmas. Em cada turma utilizou-se um método de ensino diferente. Após algumas aulas, pediu-se a cada estudante que resolvesse o mesmo problema. Os tempos respectivos (em minutos) constam do quadro seguinte. Método 1 Método 2 Método 3 15 21 11 12 16 19 18 13 17 20 9 22 10 24 Será possível afirmar que os métodos de ensino produzem resultados diferentes no que diz respeito à rapidez de um aluno para resolver um problema? (Use α=0.05) 8

Teste de Kruskal_Wallis Ordenam-se as observações, registando o grupo (mét. ensino) a que pertencem, e determina-se o posto de cada uma: Observação 9 10 11 12 13 15 16 17 18 19 20 21 22 24 Posto - R ij 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Grupo (mét.) 2 1 3 1 2 1 2 3 1 3 1 2 3 3 R 1 =2+4+6+9+11=32 R 2 =1+5+7+12=25 R 3 =3+8+10+13+14=48 9

Teste de Kruskal_Wallis 12 k R Não havendo empates, a estatística de teste é H= i 3(N + 1) N(N + 1) = n i 1 2 i cujo 2 2 2 12 valor observado é: H obs = 32 25 48 + + 3(14 + 1) = 1.963. 14(14 + 1) 5 4 5 Consultando a tabela da distribuição exacta de H, sob H 0, retira-se o ponto crítico para α=0.05: 5.6429. Dado que H obs =1.963<5.6429, não se rejeita a hipótese nula dos três métodos de ensino produzirem efeitos idênticos. Por outras palavras, não há evidência estatística de que o tipo de método de ensino influencie o desempenho dos estudantes na resolução de problemas. 10

Teste de Kruskal_Wallis Testes de Comparações múltiplas Quando rejeitamos a hipótese H 0, surge a questão de identificar onde se encontram as diferenças, i.e., quais são as amostras onde se encontram diferenças significativas. Para isso temos de comparar cada par de amostras da seguinte maneira: para cada amostra, calcula-se o posto médio postos R i pelo tamanho da amostra n i ; R i, dividindo a soma dos Determinam-se as diferenças absolutas entre cada par de postos médios R i R j, i,j=1,,k 11

Teste de Kruskal_Wallis Cada diferença absoluta R R é comparada com o valor crítico i j c ij 2 = χα,k 1 N(N + 1) 12 1 n i + 1 n j onde, 2 α, k 1 χ é o ponto crítico usado para o teste de Kruskal-Wallis. Se R R > i j c ij, então, considera-se significativa a diferença entre as amostras i e j, havendo, portanto, evidência de existirem diferenças entre as populações de onde se extraíram estas amostras. 12