ANOVA. (Analysis of Variance) Prof. Dr. Guanis de Barros Vilela Junior

Documentos relacionados
Medidas de Tendência Central. Introdução Média Aritmética Moda Mediana

CAPÍTULO 8. de Variância - ANOVA ANOVA. Análise

Métodos Quantitativos Aplicados

Tópico 9. Teste t-student

Introdução. Ou seja, de certo modo esperamos que haja uma certa

INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA. Prof. Anderson Rodrigo da Silva

Capítulo 4 Inferência Estatística

Modelos de Probabilidade e Inferência Estatística

Análise estatística. Aula de Bioestatística. 17/9/2008 (2.ª Parte) Paulo Nogueira

AULA 12 Inferência a Partir de Duas Amostras

Modelos de Probabilidade e Inferência Estatística

25 a 30 de novembro de 2013

MEDIDAS DE DISPERSÃO. o grau de variabilidade, ou dispersão, dos valores em torno da média.

Conteúdo. 1 Introdução. Histograma do Quinto Sorteio da Nota Fiscal Paraná 065/16. Quinto Sorteio Eletrônico da Nota Fiscal Paraná

Conteúdo. 1 Introdução. Histograma do 1o Sorteio da Nota Fiscal Paraná 152/15. 1º Sorteio Eletrônico da Nota Fiscal Paraná

cuja distribuição é t de Student com n 1 graus de liberdade.

Análise de Regressão Linear Simples III

SEEC UNIVERSIDADE DO ESTADO DO RIO GRANDE DO NORTE UERN FACULDADE DE CIÊNCIAS EXATAS E NATURAIS FANAT DEPARTAMENTO DE CIÊNCIAS BIOLÓGICAS DECB

Medidas de Localização

MOQ-14 PROJETO E ANÁLISE DE EXPERIMENTOS LISTA DE EXERCÍCIOS 3

Erros e Incertezas. Rafael Alves Batista Instituto de Física Gleb Wataghin Universidade Estadual de Campinas (Dated: 10 de Julho de 2011.

Medidas de Tendência Central

Aula 6 Propagação de erros

Contabilometria. Análise Discriminante

Métodos Estatísticos Avançados em Epidemiologia

Curso de Análise Estatística Comparação entre variáveis contínuas: correlação e regressão Linear

Regressão linear múltipla. Prof. Tatiele Lacerda

AMOSTRAGEM: DIMENSIONAMENTO DE AMOSTRAS. SELEÇÃO DOS ELEMENTOS DE UMA AMOSTRA. ESTIMATIVA DA CARACTERÍSTICA TOTAL DA POPULAÇÃO INVESTIGADA

Estatística - exestatmedposic.doc 25/02/09

IND 1115 Inferência Estatística Aula 8

Aula 8. Teste Binomial a uma proporção p

Teste de Hipótese e Intervalo de Confiança. Parte 2

Variáveis Frequências Gráficos Medidas de Posição Medidas de Dispersão Medidas Complementares Inferência

BIOESTATÍSTICA. Parte 1 - Estatística descritiva e análise exploratória dos dados

A. Equações não lineares

Testes de variância e Análise de Variância (ANOVA)

MAE116 - Noções de Estatística

AULA 11 Experimentos Multinomiais e Tabelas de Contingência

Engenharia Econômica

Medidas de dispersão e assimetria

Capítulo 5. Inferência no Modelo de Regressão Simples: Estimação de Intervalos, Teste de Hipóteses e Previsão

Aula 2 - Avaliação de fluxos de caixa pelos métodos do Valor Presente Líquido

Distribuições Conjuntas (Tabelas de Contingência)

Doença de base 2. CARACTERIZAÇÃO DAS LESÕES

Instituto Nacional de Estudos e Pesquisas Educacionais Anísio Teixeira INEP Ministério da Educação MEC. Cálculo do Conceito ENADE

PLANO DE ENSINO CONTEÚDO PROGRAMÁTICO. Unidade 1: MEDIDAS E GRANDEZAS Introdução Padrões usados para avaliar grandezas físicas

Controle Estátistico de Processo.

Teste de hipóteses para médias e proporções amostrais

Inferência sobre duas proporções

Desvio Padrão ou Erro Padrão

é 4. Portanto, o desvio padrão é 2. Neste caso 100% dos valores da população estão a um desvio padrão da média.

Análise de Regressão. Notas de Aula

Carta de controle para o desvio-padrão

PARTE I - EVOLUÇÃO DO PENSAMENTO. Curso Análise de Dados e Políticas Públicas. Ementa. Metodologia. Plano de Aula

Unidade 5.2. Teste de hipóteses. Hipótese estatística. (uma população) Formulando as hipóteses. Teste de Hipóteses X Intervalo de Confiança

Aula 11 Teste de hipótese sobre a média de uma população normal - σ 2 conhecida

x = xi n x = xifi fi 1. MÉDIA Exercício: Quando a distribuição é simétrica, a média e a mediana coincidem.

Probabilidade e Estatística, 2009/2

Aula 6 Medidas de Tendência Central

I COLIFORMES E ph MÉDIAS ARITMÉTICAS, MÉDIAS GEOMÉTRICAS E MEDIANAS

Aula 12 Teste de hipótese sobre proporções amostras grandes

Plano da Apresentação. Correlação e Regressão linear simples. Correlação linear. Associação entre hábitos leitura e escolaridade.

Correlação e Regressão linear simples

Planejamento e Análise Estatística de Experimentos Fatoriais em blocos completos

Química Analítica IV ERRO E TRATAMENTO DE DADOS ANALÍTICOS

Prova Escrita de MATEMÁTICA A - 12o Ano a Fase

CURSO DE MATEMÁTICA BÁSICA PROGRAMA DE EDUCAÇÃO TUTORIAL CENTRO DE ENGENHARIA DA MOBILIDADE

Para mais de duas variáveis independentes, em função de uma variável dependente.

Teorema do Limite Central e Intervalo de Confiança

Consideremos os seguintes exemplos de hipóteses cuja veracidade interessa avaliar:

Nome: N.º: Endereço: Data: Telefone: PARA QUEM CURSA O 9 Ọ ANO DO ENSINO FUNDAMENTAL EM 2016 Disciplina: MATEMÁTICA

Lição 5 Medidas Descritivas Medidas de Dispersão

COMO DETERMINAR O IMPACTO DAS VARIAÇÕES PERCENTUAIS

ROTEIRO PARA ELABORAÇÃO DO PROJETO DE PESQUISA

Estimação. Como definir um estimador. Como obter estimativas pontuais. Como construir intervalos de confiança

ANÁLISE EXPLORATÓRIA DE DADOS

ANÁLISE DE VARIÂNCIA - ANOVA. Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística - PPGEMQ / PPGEP - UFSM

AULA 04 Estimativas e Tamanhos Amostrais

2) Escreva um algoritmo que leia um conjunto de 10 notas, armazene-as em uma variável composta chamada NOTA e calcule e imprima a sua média.

Disciplina: Álgebra Linear - Engenharias ], C = Basta adicionar elemento a elemento de A e B que ocupam a mesma posição na matriz.

ESTATÍSTICA E TÉCNICAS DE AMOSTRAGEM

Plano de Ensino PROBABILIDADE E ESTATÍSTICA APLICADA À ENGENHARIA - CCE0292

7º Simpósio de Ensino de Graduação CÁLCULO DOS CUSTOS E DA MARGEM DE CONTRIBUIÇÃO DE UM CURSO SUPERIOR DE PIRACICABA/SP

Estatística Multivariada. Visão Panorâmica. Aplicações: Associação. Classificação. Comparação. Associação. Correlação Bivariada.

Aula demonstrativa Apresentação... 2 Prova Resolvida Matemática Financeira TRF 3ª Região... 4

MATEMÁTICA PROVA 3º BIMESTRE

Unidade Medidas de Posição ou de Tendência Central

GESTÃO DA MANUTENÇÃO

3 Modelos de Simulação

Medida de Tendência Central

Apresentação da disciplina

n Xi = X1 + X2 + X Xn i = 1 n Xi, deve ser lida soma dos valores xi, para i variando de 1 até n. i = 1

Matemática. A probabilidade pedida é p =

FOLHA 5. Problemas de Transportes e de Afectação

f (x) = a n x n + a n - 1 x n a 0 = 0 (a n > 0)

Matrizes e Sistemas Lineares. Professor: Juliano de Bem Francisco. Departamento de Matemática Universidade Federal de Santa Catarina.

Prova Final de Matemática

Bioexperimentação. Prof. Dr. Iron Macêdo Dantas

Transcrição:

ANOVA (Analysis of Variance) Prof. Dr. Guanis de Barros Vilela Junior

Para que serve a ANOVA? Para comparar três ou mais variáveis ou amostras. Por exemplo, queremos testar os efeitos cardiorrespiratórios de 4 programas (A, B, C, D) de treinamento, através do VO 2máx, aplicados simultaneamente em 4 diferentes grupos de 20 sujeitos cada. Se (por absurdo) fossem comparados aos pares (AB; AC; AD; BC; BD; CD) cada comparação aceitando uma margem de erro de 5%, teríamos uma chance de erro Tipo I (rejeitar a hipótese verdadeira) de: 6x5% = 30%. H o : não existe diferenças entre as médias dos 4 programas de treinamento. H 1 : a média de pelo menos um dos grupos se difere das demais.

Para que serve a ANOVA? Se H 0 for rejeita isto mostra a existência de diferença entre os grupos e com a ANOVA é possível localizar onde está localizada está diferença. Para isto é necessário testar a variabilidade em cada grupo e também entre os grupos, ou seja, intragrupos e intergrupos. Para isto é calculado o F, pela fórmula: F = variância entre os grupos variância dentro dos grupos

Variância intergrupos e intragrupos GRUPO A GRUPO B GRUPO C GRUPO D = variabilidade intragrupos = variabilidade intergrupos

Distribuição F e Graus de Liberdade Aceitar H 0 GL = número de grupos 1 soma dos GL de cada grupo No exemplo citado: Rejeitar H 0 GL = 4 1 20 1 + 20 1 + 20 1 + (20 1) F a = 2,76 Distribuição F GL = 3 76 a = 5% Ver Tabela da Distribuição F

Calculando F e comparando-o com o F a Após calcular o F pela equação: F = variância entre os grupos variância dentro dos grupos Se o F calculado for MAIOR que F a da tabela, rejeitamos H 0, ou seja, existem diferenças entre dois ou mais grupos.

Sobre a ANOVA ATENÇÃO: A ANOVA informa apenas se existem diferenças entre dois ou mais grupos, mas não identifica quais são os grupos diferentes. Para identificar tais grupos é necessário fazer a comparação entre pares. Existem vários testes para isto, tais como: Teste de Fisher, Teste de Duncan, Teste de Tukeys, Teste de Scheffé, dentre outros. A distribuição deve ser normal para aplicar a ANOVA. ANOVA one-way: só um critério, por exemplo, o número de artigos publicados por diferentes grupos de pesquisadores. ANOVA two-way: dois critérios, por exemplo, o número de artigos e o sexo dos membros dos diferentes grupos de pesquisadores.

Finalizando DADOS CONTÍNUOS + de 2 grupos EMPARELHADOS NÃO EMPARELHADOS ANOVA 2-WAY FRIEDMAN ANOVA 1-WAY KRUSKAL-WALLIS

Exercício A tabela ao lado mostra o número de artigos publicados num período de 2 anos de quatro grupos de pesquisadores. Cada grupo é formado por 7 pesquisadores. Calcule o F (ANOVA) para averiguar se as diferenças na produção de artigos nestas universidades é estatisticamente significante. Para isto seguiremos o passa-a-passo: G1 G2 G3 G4 2 5 5 8 1 7 4 4 3 9 6 6 3 8 5 8 4 9 5 5 2 7 6 6 3 10 4 7

PASSO-A-PASSO PARA REALIZAR A ANOVA Passo 1: calcular a soma e média de cada grupo Passo 2: calcular a média total Passo 3: calcular os desvios (d) de cada escore em relação à média (d= x-x) Passo 4: calcular o quadrado dos desvios (d 2 ) Passo 5: calcular a soma dos quadrados (SQ intra ) para cada grupo Passo 6: calcular os d s para cada grupo a partir da média total dos grupos (d g ) Passo 7: calcular o quadrado dos desvios (d g 2 ) e sua somatória Passo 8:calcular a soma dos quadrados entre os grupos (SQ entre ) Passo 9: calcular os graus de liberdade (GL) entre os grupos e dentro dos grupos Passo 10: calcular o quadrado médio (QM) dentro e entre os grupos Passo 11: calcular o F, comparar com o valor crítico tabelado e aplicar teste de Scheffé para identificar quais grupos são estatisticamente diferentes.

Solução: Obs: A realização da ANOVA possui vários detalhes e requer uma boa organização dos dados para a realização dos cálculos. G1 G2 G3 G4 2 5 5 8 1 7 4 4 3 9 6 6 3 8 5 8 4 9 5 5 2 7 6 6 3 10 4 7 Passo 1 SOMA 18 55 35 44 MÉDIA 2,57 7,86 5,00 6,29

Solução: Passo 2: calcular a média total S total = S 1 +S 2 +S 3 +S 4 = 18+55+35+44 = 152 Σ n = 7 + 7 + 7 + 7 = 28 X = 152 28 = 5,43

Solução: Passo 3: calcular os desvios (d) de cada escore em relação à média (d= x-x) Passo 4: calcular o quadrado dos desvios (d 2 ) d1 d1 2 d2 d2 2 d3 d3 2 d4 d4 2-0,57 0,33-2,86 8,16 0,00 0,00 1,71 2,94-1,57 2,47-0,86 0,73-1,00 1,00-2,29 5,22 0,43 0,18 1,14 1,31 1,00 1,00-0,29 0,08 0,43 0,18 0,14 0,02 0,00 0,00 1,71 2,94 1,43 2,04 1,14 1,31 0,00 0,00-1,29 1,65-0,57 0,33-0,86 0,73 1,00 1,00-0,29 0,08 0,43 0,18 2,14 4,59-1,00 1,00 0,71 0,51 Sd1 2 = 5,71 Sd2 2 = 16,86 Sd3 2 = 4,00 Sd4 2 = 13,43

Solução: Passo 5: calcular a soma dos quadrados (SQ intra ) para cada grupo SQ intra = 5,71 + 16,86 + 4,00 + 13,43 = 40,0 Passo 6: calcular os d s para cada grupo a partir da média total dos grupos (d g ) Passo 7: calcular o quadrado dos desvios (d g 2 ) e sua somatória X grupo X total d g = X grupo X total d g 2 Grupo 1 2,57 5,43-2,86 8,163 Grupo 2 7,86 5,43 2,43 5,897 Grupo 3 5,00 5,43-0,43 0,183 Grupo 4 6,29 5,43 0,86 0,734 Sd g2 = 14,979

Solução: Passo 8: calcular a soma dos quadrados entre os grupos (SQ entre ) SQ entre = Sd g2. n = 14,979 x 7 = 104,85 Passo 9: calcular os graus de liberdade (GL) entre os grupos e dentro dos grupos GL entre = número de grupos 1 = 4 1 = 3 GL intra = número de observações número de grupos = 28 4 = 24

Solução: Passo 10: calcular o quadrado médio (QM) dentro e entre os grupos, dividindo-os pelos respectivos GL. QM dentro = SQ dentro GL dentro = 40,0/24 = 1,666 QM entre = SQ entre = 104,85 GL entre 3 = 34,95

Solução: Passo 11: calcular o F e comparar com o valor crítico tabelado. F = QM entre QM dentro = 34,95 1,66 = 21,05 Como F > F a (21,05 > 3,01) com significância de 5%, podemos rejeitar a hipótese nula, ou seja, as diferenças na produção de artigos são estatisticamente significantes entre as 4 universidades, mas onde estão tais diferenças?

Solução: Para identificarmos onde a(s) diferença(s) está (estão) localizada(s), é necessário realizar uma comparação Post Hoc. Para isto, utilizaremos o Teste de Sheffé: 2. QM I = K 1. F a. ( I = 4 1. 3,01. 2.1,66 7 n ) F a é o F tabelado Onde: K é o número de grupos QM é a soma dos quadrados médios dentro dos grupos n é o tamanho dos grupos = 4,28 O Intervalo (I) calculado (4,28) é o valor mínimo da diferença entre as médias de dois grupos para que esta possa ser considerada significante.

Solução: Para localizar a diferença usando este I = 4,28, optamos por uma tabela das diferenças entre as médias: G1 G2 G3 G4 G1 0 5,29 2,43 3,72 G2 0 2,86 1,57 G3 0 1,29 G4 0 G2 G1 = 7,86 2,57 = 5,29 > 4,28, UFA!!! portanto a diferença só ocorre entre G1 e G2.

Referências BARROS, M.V.G. & REIS, R.S. Análise de dados em atividade física e saúde. Londrina: Mediograf, 2003. DORIA FILHO, U. Introdução à bioestatística. São Paulo: Negócio, 1999. THOMAS, J.R. & NELSON, J.K. Métodos de pesquisa em atividade física. Porto Alegre: Artmed, 2002. VILELA JUNIOR, G.B. Conteúdos ministrados na disciplina Estatística em cursos de graduação e pós graduação. Campinas: UNIMEP / Metrocamp, 2003 2014.