Os testes. Objetivo. O teste de Kruskal-Wallis (Análise de variância de uma classificação por postos) O teste qui-quadrado

Documentos relacionados
Modelos de Regressão Linear Simples - Erro Puro e Falta de Ajuste

Métodos Estatísticos Avançados em Epidemiologia

AULA 19 Análise de Variância

AULA 07 Distribuições Discretas de Probabilidade

Teste de Hipótese e Intervalo de Confiança. Parte 2

ANOVA. "ANalysis Of VAriance" - Análise de Variância. ANOVA One Way ANOVA de um fator. Comparar mais de dois grupos através de suas médias

Probabilidade. Evento (E) é o acontecimento que deve ser analisado.

Probabilidade e Estatística

PESQUISA OPERACIONAL -PROGRAMAÇÃO LINEAR. Prof. Angelo Augusto Frozza, M.Sc.

Prof. Daniela Barreiro Claro

Testes de Hipóteses Estatísticas

Pressuposições à ANOVA

Avaliação Econômica Projeto de Inclusão Digital. Naercio Aquino Menezes Filho Centro de Políticas Públicas Insper FEA-USP e Fundação Itaú Social

DISTRIBUIÇÕES ESPECIAIS DE PROBABILIDADE DISCRETAS

Técnicas de Contagem I II III IV V VI

Avaliação de Empresas Profa. Patricia Maria Bortolon

Análise Qualitativa no Gerenciamento de Riscos de Projetos

Métodos Estatísticos Avançados em Epidemiologia

Aula 6 Medidas de Tendência Central

O teste de McNemar. A tabela 2x2. Depois

Adição de probabilidades. O número de elementos da união dos conjuntos A e B n(aub) = n(a B) Dividindo os dois membros por n(e):

Probabilidade. Luiz Carlos Terra

A dependência entre a inflação cabo-verdiana e a portuguesa: uma abordagem de copulas.

Aula de Exercícios - Teorema de Bayes

Cap. II EVENTOS MUTUAMENTE EXCLUSIVOS E EVENTOS NÃO- EXCLUSIVOS

Teste de hipótese em modelos normais lineares: ANOVA

Estatística Analítica

Capítulo 4 Inferência Estatística

Inteligência Artificial

Modelos de Probabilidade e Inferência Estatística

Economia da SHT. Custos e benefícios da segurança

Se A =, o evento é impossível, por exemplo, obter 7 no lançamento de um dado.

Métodos Quantitativos Aplicados

Modelos Lineares Generalizados - Verificação do Ajuste do Modelo

COLÉGIO SHALOM 9 ANO Professora: Bethânia Rodrigues 65 Geometria. Aluno(a):. Nº.

P R O G R A M A TERCEIRA FASE. DISCIPLINA: Estatística Aplicada à Pesquisa Educacional Código: 3EAPE Carga Horária: 54h/a (crédito 03)

Métodos Quantitativos em Contabilidade. Análise da Variância ANOVA. Prof. José Francisco Moreira Pessanha

Introdução. Ou seja, de certo modo esperamos que haja uma certa

FÍSICA EXPERIMENTAL 3001

AULA 11 Experimentos Multinomiais e Tabelas de Contingência

Análise de Variância simples (One way ANOVA)

Pós-Graduação em Computação Distribuída e Ubíqua

OPERAÇÕES COM FRAÇÕES

ANOVA. (Analysis of Variance) Prof. Dr. Guanis de Barros Vilela Junior

QUESTIONAMENTO ACERCA DO EDITAL DO PREGÃO ELETRÔNICO AA Nº 03/ BNDES

Os dados quantitativos também podem ser de natureza discreta ou contínua.

Códigos de bloco. Instituto Federal de Santa Catarina Curso superior de tecnologia em sistemas de telecomunicação Comunicações móveis 2

Função. Adição e subtração de arcos Duplicação de arcos

A vida sem reflexão não merece ser vivida Sócrates Disciplina: ESTATÍSTICA e PROBABILIDADE

Medidas de Tendência Central

DEPARTAMENTO DE MATEMÁTICA

é 4. Portanto, o desvio padrão é 2. Neste caso 100% dos valores da população estão a um desvio padrão da média.

ActivALEA. ative e atualize a sua literacia

ESTRUTURA DO CURSO 08:00-10:00 RTQ-R

25 a 30 de novembro de 2013

Medidas de dispersão e assimetria

Plano da Apresentação. Correlação e Regressão linear simples. Correlação linear. Associação entre hábitos leitura e escolaridade.

Correlação e Regressão linear simples

Álgebra Linear. Bacharelado em Sistemas de Informação. Período Prof. da Disciplina Luiz Gonzaga Damasceno, M. Sc

Inspeção de Qualidade

Coeficiente de Assimetria e Curtose. Rinaldo Artes. Padronização., tem as seguintes propriedades: Momentos

Data: 13 de Julho de º CAMPEONATO EUROPEU FEMININO EM MATERA, ITÁLIA

Seu pé direito nas melhores Faculdades

Tecnologia da Construção Civil - I Locação de Obra e Serviços em Terra. Roberto Monteiro

EXAME DE MACS 2º FASE 2014/2015 = 193

UM JOGO BINOMIAL 1. INTRODUÇÃO

UMA ANÁLISE BAYESIANA DO PERFIL COR/RAÇA DOS INDIVÍDUOS QUE TEM CURSO SUPERIOR NO BRASIL

Modelo Lógico: Tabelas, Chaves Primárias e Estrangeiras

MOQ-14 Projeto e Análise de Experimentos

AULA 4 DELINEAMENTO EM QUADRADO LATINO (DQL)

Aula 4 Gráficos e Distribuição de Frequências

REGIMENTO INTERNO RECOMENDADO PARA O ROTARY CLUB

M =C J, fórmula do montante

ANÁLISE COMPARATIVA DOS DADOS METEOROLÓGICOS NAS ESTAÇÕES AUTOMÁTICAS E CONVENCIONAIS DO INMET EM BRASÍLIA DF.

O QUE SÃO E QUAIS SÃO AS PRINCIPAIS MEDIDAS DE TENDÊNCIA CENTRAL EM ESTATÍSTICA PARTE I

LINEARIZAÇÃO DE GRÁFICOS

Olimpíada Brasileira de Raciocínio Lógico Nível III Fase II 2014

Aula 03. Processadores. Prof. Ricardo Palma

Avaliação e Desempenho Aula 1 - Simulação

TESTES SOCIOMÉTRICOS

Árvores. ! utilizada em muitas aplicações. ! modela uma hierarquia entre elementos. ! O conceito de árvores está diretamente ligado à recursão

A presença de Outliers interfere no Teste f e no teste de comparações múltiplas de médias

3 - Bacias Hidrográficas

Aula 6 Propagação de erros

Prof. José Maurício S. Pinheiro - UGB

Registro de Retenções Tributárias e Pagamentos


Análise de Variância (ANOVA)

REGULAMENTO ESPECÍFICO DE BASQUETEBOL

3º Ano do Ensino Médio. Aula nº06

CURSO DE MATEMÁTICA BÁSICA PROGRAMA DE EDUCAÇÃO TUTORIAL CENTRO DE ENGENHARIA DA MOBILIDADE

MBA em Gerenciamento de Projetos. Teoria Geral do Planejamento. Professora: Maria Erileuza do Nascimento de Paula

Modelo Entidade Relacionamento (MER) Professor : Esp. Hiarly Alves

Relatório das Provas da 2ª. Fase - Vestibular 2016

RESENHAS REVIEWS RESPONSABILIDADE CIVIL DA ATIVIDADE MÉDICA NO CÓDIGO DE DEFESA DO CONSUMIDOR

Gerenciamento do Escopo do Projeto (PMBoK 5ª ed.)

Ondas EM no Espaço Livre (Vácuo)

Transcrição:

Pro. Lorí Viali, Dr. http://www.mat.urgs.br/viali/ viali@mat.urgs.br Os testes O teste de Kruskal-Wallis (Análise de variância de uma classiicação por postos) O teste qui-quadrado William Henry Kruskal (1919-005) William Allen Wallis (191-1998) Objetivo O teste de Kruskal-Wallis é utilizado para decidir se k amostras independentes podem ter sido extraídas de populações dierentes. Os valores amostrais dierem entre si e deve-se decidir se essas dierenças amostrais signiicam dierenças eetivas entre as populações, ou se representam apenas variações casuais. 1

O teste supõe que a variável em estudo tenha distribuição contínua e exige mensuração no mínimo ao nível ordinal. Metodologia Cada um dos n valores é substituído por um posto. Isto é, os escores de todas as k amostras combinadas são dispostos em uma única série de postos. Ao menor escore é atribuído o posto 1, ao seguinte o posto e assim por diante até o maior posto que é n número total de observações. Feito isso, determina-se a soma dos postos em cada amostra (coluna). A prova então testa se estas somas são tão dierentes entre si, de modo que não seja provável que tenham sido todas retiradas de uma mesma população. Tratamentos T 1 T... T k X 11 X 1... X 1k X 1 X... X k X 1 X... X k............ X n1 X n... X nk Suposições No artigo original de Kruskal-Wallis de 195 apenas suposições gerais oram estabelecidas: (i) As observações são independentes; (ii) Dentro de cada amostra as observações são da mesma população e (iii) As k populações são da mesma orma e Hipóteses H 0 : Os k tratamentos não dierem entre si; H 1 : Pelos menos dois tratamentos dierem entre si. contínuas.

A estatística teste Se as k amostras orem de uma mesma população (H 0 é V) então a estatística de Kruskal-Wallis tem distribuição conhecida (Tabela O) se as amostras orem pequenas (n < 5) ou Qui-Quadrado com gl k - 1, desde que os tamanhos das k amostras não sejam muito pequenos (5 ou mais elementos). A estatística amostral é: 1 k ( R j ) H n( n + 1 ) j 1 n j ( n + 1 ) Onde: k número de amostras; n j número de elementos na amostra j ; R j soma dos postos do tratamento (amostra ou coluna) j ; n n j número total de elementos de todas as amostras combinadas; Alguns autores recomendam que se existe um número grande de empates o valor de H dever ser corrigido. A correção consiste em aumentar levemente o valor de H. A seguinte equação é utilizada para obter o valor da correção de H: s Onde: ( t i t i ) i 1 S número de grupos empatados; C 1 n n t i número de valores empatados. O valor de H corrigido será igual então a: H C H/C Decisão: Rejeitamos H 0 se H h, onde P(H h) α. A tabela O ornece os limites de h para n i 6 e k. À medida que os n i crescem a distribuição de H sob H 0 tende para a χ com k -1 graus de liberdade.

Veriicar a inluência do Fator Idade sobre a variável tempo, em dias, para conseguir um emprego, considerando as seguintes amostras: Acima de 40 anos Entre 5 e 40 Abaixo de 5 6 5 0 4 1 4 7 6 58 8 14 57 51 18 71 64 45 1 0 Tem-se n 1 (total de inormações). Então o maior posto será 1. Postos (1) Postos () Postos () 1 5 1 14 7 15 8 4 4 17 9 6 5 18 11,5 10 6 19 1 11,5 7 1 16 8 0 ΣR j 109 86,5 5,5 Média 15,57 10,81 5,9 A variável teste será: 1 k ( R j ) H ( n + 1 ) n( n + 1 ) j 1 n j 1 109 86,5 5,5 ( + + ) - (1 + 1) 1( 1 + 1 ) 7 8 6 7,84-66 7,84 O grau de liberdade é: v k -1 1 4

Como ocorreu apenas um conjunto de O qui-quadrado tabelado será: empates e com apenas dois valores, não vale a pena utilizar a correção para H. s ( t i t i ) i 1 C 1 n n Contudo se isto osse eito o novo valor de H, isto é, Hc 7,89. Assim o valor-p deste resultado será 1 0,9751,49% Conclusão A 5% de signiicância é possível airmar que o ator idade tem inluência sobre o tempo para encontrar trabalho. Resultados SPSS Kruskal-Wallis Test Controle n Mean Rank 0 7 15,57 1 8 10,81 6 5,9 Total 1 Tempo Chi-Square 7,89 d Assyp. Sig. 0,00 5

Uma indústria de pneus testou a distância de renagem, em pista molhada, das suas cinco opções de pneus. As distâncias observadas, em metros, estão na tabela. Veriique se existe dierença entre as marcas. A B C D E 1 45,8 47,6 40,9 44,5 44, 4, 47,9 44, 5,7 51,8 48,1 45,4 4,0 54, 50,6 4 46,0 4,0 9,1 49,4 4,9 5 47, 4,4 4,1 44,8 44,5 6 50,0 50, 1 4 5 6 Total Média A B C D E Quando a dierença or signiicativa, isto é, existem tratamentos que dierem é possível identiicar qual ou quais pares dierem por intermedio das comparações múltiplas. Para j 1,,..., k, sejam R j a soma dos postos e r j R j /n j a média do postos do tratamento j. Dados r i e r j diremos que os dois tratamentos dierem se r i - r j or signiicativamente grande. 6

Para comparar todos os tratamentos dois a dois é necessário azer k(k 1)/ comparações. Nesse caso, é razoável adotar uma probabilidade maior de erro. Em geral 10% ou até um pouco mais. Para um dado determinamos se dois tratamentos dierem adotando o seguinte procedimento: Determinar o valor z que corresponde à probabilidade α.α/k(k -1) da cauda superior da normal padrão. Para cada para i, j com i j calcula-se: Onde: r r j z iσ σ n( n + 1 ) 1 1 + 1 ni n j Diremos que o tratamento i produz medidas menores que o j se z < -z; medidas maiores do que j se z > z e medidas da mesma ordem de grandeza se z z z. Retornando ao exercício dos pneus, onde queremos comparar as cinco marcas, duas a duas, com respeito ao desempenho na renagem. Vamos supor que estamos dispostos a tolerar uma signiicância de 10%. Então α α/k(k -1) 1% e z,6. Os postos médios são: 15,0 1,1 4, 0,1 16,8 quociente Ao invés de compara z,6 com o r r j z iσ dierenças r i r j com os produtos zσ. vamos comparar as 7

Como os tamanhos das amostras são dierentes temos σ dierentes. Então: Tamanhos das amostras σ zσ 5 e 5 5,0 5 e 6 4,81 6 e 6 4,58 O teste qui-quadrado O teste χ² de k amostras independentes pode ser utilizado para veriicar a dependência ou independência entre as variáveis sendo consideradas. O teste é uma extensão direta do quiquadrado para duas amostras independentes. Em geral, o teste é o mesmo, tanto para duas, como para k amostras independentes. Hipóteses e Cálculo H 0 : As variáveis são independentes Expressão alternativa H 1 : As variáveis são dependentes A variável teste é: A variável teste é: χ υ k l i1 j 1 ( ) O -E E χ ( O E ) k l - i 1 j 1 υ E k l i 1 j 1 E O - n 8

Onde: r número de linhas da tabela; L número de colunas da tabela; O requência observada na interseção da linha i com a coluna j. E número de casos esperados na interseção da linha i com a coluna j. Onde: χ υ n é a estatística teste; k i1 l O j1 tamanho da amostra; E np são as requências esperadas de cada célula da tabela. p é a probabilidade de ocorrer uma observação na célula. Se as variáveis são supostamente independentes (H 0 é Verdadeira), então p p i. p.j, onde p i. é a probabilidade marginal correspondente à linha i e p.j é a probabilidade marginal correspondente a coluna j. Como não se conhecem as probabilidades marginais, elas devem ser estimadas através das correspondentes requências relativas. Então: E p p p i.. j n n. n.. i.. j n n i. n. j i. l j1 e. j k i1 9

Jonckheere-Terpstra Test. This test or dierences among several independent samples is more powerul than the Kruskal-Wallis H or median tests. However, it requires that the independent samples be ordinally arranged on the criterion variable (ex., city samples arranged by welare caseload per 10,000 population, where this is the variable o interest). The J-T test tests the hypothesis that as one moves rom samples low on the criterion to samples high on the criterion, the withinsample magnitude o the criterion variable increases. Correção para empates http://www.ens.gu.edu.au/stats/aes11/lec tures/exam_ho.htm KRUSKAL, William Henry; WALLIS, William Allen. Use o ranks in one-criterion variance analysis. Journal o the American Statistical Association, v. 47, n. 60, p. 58 61, 195. 10