Análise da Variância (ANOVA) A Análise da Variância (ANalysis Of VAriance) é procedimento para testar a hipótese de que três ou mais médias populacionais são iguais de modo que: H 0 : µ 1 = µ = µ 3 H 1 : pelo menos uma das médias é diferente das outras. O teste é feito com base na análise das variâncias amostrais. Utiliza-se a distribuição F.
ANOVA de um fator Um tratamento (ou fator) é uma propriedade, ou característica, que nos permite distinguir as diferentes populações umas das outras. Estatística teste: F teste = variância entre amostras variância dentro das amostras
ANOVA de um fator Cálculos com tamanhos amostrais iguais F = teste n s s p s s p é a variância das médias amostrais é a média das variâncias amostrais Graus de liberdade: Numerador: gl 1 = k -1 Denominador: gl = k (n -1) k = número de amostras n = tamanho amostral
F ANOVA de um fator Cálculos com tamanhos amostrais diferentes teste i = k = 1 k n i= 1 k i= 1 i ( ) ( n 1) i i k 1 ( ) n 1 i s i Componentes-chave: é a média de todos os valores amostrais combinados Grau de Liberdade Numerador: gl 1 = k -1 Denominador: gl = N - k N = n i SQ(tratamento) Soma de quadrados SQ(erro) Representa a variação MQ(...) = SQ(...)/número: Média Quadrática
ANOVA de um fator Eemplo com tamanhos amostrais diferentes Níveis de álcool no sangue após o consumo de cinco doses da bebida. Grupos de homens A B C 0,11 0,08 0,04 0,10 0,09 0,04 0,09 0,07 0,05 0,09 0,07 0,05 0,10 0,06 0,06 0,04 0,05 Os integrantes do grupo A foram testados uma hora depois; do grupo B, duas horas depois e do grupo C quatro horas depois n i i s i N k
ANOVA de dois fatores Cálculos individuais em categorias de acordo com dois fatores. Em outras palavras: os valores amostrais são categorizados de duas maneiras. E. Na corrida de NY: Fatores: idade e seo. Seo Masculino Feminino Tempo (s) para corredores da Maratona NY Idade 1-9 30-39 40 ou mais 13615 14677 1458 18784 16090 17034 1456 14086 14935 10905 16460 14996 1077 0808 146 16401 15357 1760 1416 16771 5399 1540 15036 18647 1536 1697 15077 1047 17636 5898
ANOVA de dois fatores Cálculos individuais em categorias de acordo com dois fatores. Em outras palavras, os valores amostrais são categorizados de duas maneiras. E. Na corrida de NY: Fatores: idade e seo. Subcategorias (células), neste caso seis células Seo Masculino Feminino Tempo (s) para corredores da Maratona NY Idade 1-9 30-39 40 ou mais 1 3 4 5 6
Procedimento para o cálculo: ANOVA de dois fatores Passo 1. Efeito da interação: Teste H 0, de que não há interação entre os dois fatores. Um procedimento é o gráfico de interação de médias de células. Verifique a estatística teste Tempo Médio (s) Milhares 5 0 15 10 1 3 Idade Masculino Feminino F =MQ(interação) MQ(Erro) Se rejeitar H 0, para por aqui.
ANOVA de dois fatores =. j. L C n i= 1 j= 1 k = 1 = L LCn n i= 1 k = 1 Ln ijk ijk Média global n = número de repetições em uma célula i.. = C n j= 1 k = 1 Cn ijk Média do fator j (fatores em colunas) Média do fator i (fatores em linhas) ij. = n k =1 n ijk Média da célula i,j
Variação Total Variação Fator B ANOVA de dois fatores SQ( Total) = L C n ( ) ijk i= 1 j= 1 k = 1 Variação Fator A C SQ( C) = Ln Variação Decorrente da Interação SQ j= 1 ( ). j. L SQ( L) = Cn i= 1 ( ) i L C ( ) ( Interação) = n ij. i... j. + i= 1 j= 1 ( ) Erro SQ( Erro) = ijk ij. L C n i= 1 j= 1 k= 1..
Anova: fator duplo com repetição RESUMO 1-9 30-39 40 ou mais Total Masculino ANOVA de dois fatores Contagem 5 5 5 15 Soma 69637 811 83639 35397 Média 1397,4 1644, 1677,8 15693,1 Variância 9087754,3 696640, 1015758, 9165617,8 Feminino Contagem 5 5 5 15 Soma 7339 81097 1081 56770 Média 14678,4 1619,4 0456, 17118 Variância 76103,3 111530,3 411787,7 1439308,6 Seo Masculino Feminino Tempo (s) para corredores da Maratona NY Idade 1-9 30-39 40 ou mais 13615 14677 1458 18784 16090 17034 1456 14086 14935 10905 16460 14996 1077 0808 146 16401 15357 1760 1416 16771 5399 1540 15036 18647 1536 1697 15077 1047 17636 5898 Total Contagem 10 10 10 Soma 14309 16318 18590 Média 1430,9 1631,8 1859 Variância 54370,3 3601847,5 19080511,1 MQ(seo) MQ(idade) MQ(interação) MQ(erro) ANOVA Fonte da variação SQ gl MQ F valor-p F crítico Amostra 156837,6 1 156837,6 1,69 0,1 4,6 Colunas 9087146,9 46043573,4 5,10 0,01 3,40 Interações 1040438,9 105019,4 1,17 0,33 3,40 Dentro 16683384,0 4 908474,3 Total 345037807,4 9 Ecel: Ferramenta > Análise de dados > ANOVA Fator Duplo com repetição
ANOVA de dois fatores Procedimento para o cálculo (continuação) Passo. Efeitos de Linha/Coluna Linha: Teste H 0, Não há qualquer efeito do fator linha (As médias das linhas são iguais) F = MQ(seo) / MQ(erro) ANOVA Fonte da variação SQ gl MQ F valor-p F crítico Seo Amostra 156837,6 1 156837,6 1,69 0,1 4,6 Idade Colunas 9087146,9 46043573,4 5,10 0,01 3,40 Interação Interações 1040438,9 105019,4 1,17 0,33 3,40 Erro Dentro 16683384,0 4 908474,3 Total 345037807,4 9
ANOVA de dois fatores Procedimento para o cálculo (continuação) Passo. Efeitos de Linha/Coluna Linha: Teste H 0, Não há qualquer efeito do fator coluna (As médias das colunas são iguais) F = MQ(idade) / MQ(erro) ANOVA Fonte da variação SQ gl MQ F valor-p F crítico Seo Amostra 156837,6 1 156837,6 1,69 0,1 4,6 Idade Colunas 9087146,9 46043573,4 5,10 0,01 3,40 Interação Interações 1040438,9 105019,4 1,17 0,33 3,40 Erro Dentro 16683384,0 4 908474,3 Total 345037807,4 9
Conclusão do eemplo: ANOVA de dois fatores Com base nos dados amostrais, concluímos que os tempos parecem ter médias desiguais para diferentes categorias de idade, mas os tempos parecem ter médias iguais para ambos os seos.