ANOVA FACTORIAL Quando a variável dependente é influenciada por mais do que uma variável independente (Factor) estamos interessados em estudar o efeito não só de cada um dos factores mas e também a possível influência que cada um dos factores pode exercer sobre a resposta da variável dependente ao outro factor. Esse efeito designa-se por interacção entre os factores. 1 EXEMPLO 1. ANOVA TWO-WAY COM O SPSS Exemplo 1 Para testar a influência do olfacto no sono dos recém-nascidos, um investigador efectuou um estudo em que mediu otempoquebebés com uma semana demoram a adormecer após terem sido amamentados pela mãe. Num 1º grupo foi colocada no berço umapeçaderoupa utilizada pela mãe e no 2º grupo uma peça de roupa utilizada por outra pessoa. Suponha, ainda, que se pretende testar se existe interacção entre a capacidade de reconhecimento do odor materno e amaternidade onde foi efectuado o estudo (as maternidades podem utilizar detergentes diferentes para lavar a roupa.). 2
ANOVA FACTORIAL Examinam-se não só os efeitos separados dos factores na variável dependente mas também as interacções; Neste caso os tratamentos (ou amostras) referem-se a todas as combinações dos valores das variáveis independentes (factores); A hipótese nula considera que nem os factores nem as interacções têm qualquer efeito sobre a variável dependente. basta que um factor ou a interacção tenha dois níveis distintos para ser significativo 3 ANOVA FACTORIAL Condições de aplicação Normalidade As populações têm distribuições normais Homogeneidade da Variância As populações têm variâncias iguais Independência dos Erros As amostras são aleatórias resume todas as condições anteriores, semelhante à regressão linear Os desvios seguem uma distribuição Normal de média zero e variância constante; 4
Ex: Quando existem apenas 2 factores (ANOVA two-way), as observações da variável dependente (Y) podem organizarse numa tabela de duas entradas, por exemplo: 5 MODELO ANOVA TWO WAY yijr = y + ( yi y) + ( y j y) + ( yij yi y j + y) + ( yijr yij ) Yijr = u + α i + βj + γij +εijr = Variável Média Global de uma Dependente população comum + Efeito do factor A cada indivíduo está sujeito a tratamentos definidos por dois factores independentes no SPSS podemos escolher os componentes que queremos incluir no modelo + + + Efeito do factor B Efeito da interacção entre A e B Erro aleatório e Normal 6
DECOMPOSIÇÃO DA VARIÂNCIA Variância devida ao factor A SQFA g.l.= a-1 + Variância Total SQT g.l.= N-1 = Variância devida ao factor B Variância devida à interacção Variância devida ao erro aleatório SQFB g.l.= b-1 SQAxB g.l.= (a-1)(b-1) SQE g.l.= (r-1)ab + + 7 A ESTATÍSTICA F PARA ANOVA TWO-WAY H vs H A 0 A 1 : : µ 1 = µ =... = i, j: µ µ 2 i j µ a ; i Teste F para factor A F = QMFA / QME j (i, j = 1,..., a) QMFA=SQFA/(a 1) B H : µ = µ =... = µ 0 1 2 b vs B H :, : ; 1 i j µ µ i j H vs H γ 0 γ 1 : : γ γ ij ij = 0 0 i j (i, (existeinteracção) j = (nãoexisteinteracção) 1,..., b) Teste F para factor B F = QMFB / QME QMFB=SQFB/(b 1) Teste F para a interacção F = QMAxB / QME representa a média cruzada menos a média de cada factor e mais a média global QMAxB = SQAxB/[(a-1)x(b-1)] 8
TABELA ANOVA TWO WAY Fonte de variação Soma de Quadrados g.l. Quadrados Médios F Factor A (linhas) factor B (colunas) AxB (interacção) SQFA a-1 QMFA FA=QMFA/QME SQFB b-1 QMFB FB=QMFB/QME SQFAxB (a-1)(b-1) QMAxB FAxB=QMAxB/QME Erro SQE (r-1)a b QME total SQT N-1 no SPSS temos ainda no SPSS podem-se obter estimativas para a potência do teste resultados para um teste à média global (µ=0, intercept) e para o modelo corrigido 9 ANOVA tipo I (Factores fixos) ex. em que o investigador fixou à partida as maternidades nas quais efectuaria o estudo e os 2 níveis do factor peças de roupa (o sim e o não ). ANOVATipoIII (um factor fixo roupa da mãe e outro aleatório maternidade): Se, por exemplo, as maternidades fossem escolhidas aleatoriamente da lista das maternidades do país, então o factor maternidade seria aleatório e a variável Maternid deveria ir para a caixa Random Factor(s). 10
DESENHO EXPERIMENTAL Desenho experimental completo ou factorial: os níveis dos factores fixos são combinados todos com todos; resulta em naxnbx xny tratamentos nº igual de observações -> equilibrado ou balanceado nº diferente por célula -> desequilibrado ou não balanceado Com factores aleatórios (randomized): factor não controlado durante o desenho; pode surgir em cada célula com valores diferentes; mais robusto nas análises ANOVA mas exige um grande número de observações muito comum quando não se sabem os níveis a obter num factor ou em amostras pequenas em ambos os casos os indivíduos são homogéneos e escolhidos aleatoriamente para os tratamentos. 11 Existem mais 4 tipos de soma de quadrados que se pode definir no menu Model: a soma dos quadrados tipo III (não confundir com a ANOVA tipo III) é a mais genérica e é apropriada quer as amostras tenham a mesma dimensão quer não. Somas de quadrados tipo I e II apropriadas para delineamentos balanceados (i.e. todos os tratamentos possíveis estão presentes e todas as amostras têm a mesma dimensão). Somas de quadrados tipo IV apropriada quando existem tratamentos ausentes. 12
EXEMPLO 1. ANOVA TWO-WAY COM O SPSS Exemplo 1 Para testar a influência do olfacto no sono dos recém-nascidos, um investigador efectuou um estudo em que mediu otempoquebebés com uma semana demoram a adormecer após terem sido amamentados pela mãe. Num 1º grupo foi colocada no berço umapeçaderoupa utilizada pela mãe e no 2º grupo uma peça de roupa utilizada por outra pessoa. Suponha, ainda, que se pretende testar se existe interacção entre a capacidade de reconhecimento do odor materno e amaternidade onde foi efectuado o estudo (as maternidades podem utilizar detergentes diferentes para lavar a roupa.). 13 14
Obs: Este exemplo é um caso de uma ANOVA tipo 1 (factores fixos), em que o investigador fixou à partida as maternidades nas quais efectuaria o estudo e os dois níveis do factor peças de roupa (o Sim e o Não ). 15 16
Existem diferenças significativas entre o tempo médio demorado a adormecer pelos bebés das 3 maternidades (isto é o factor Maternidade tem um efeito significativo sobre o tempo que os bébés demoram a adormecer); Existem diferenças significativas entre os tempos médios dos bebés do grupo 1 e do grupo 2,isto é o factor roupa_mãe tem um efeito significativo. Com α=5%, não há evidência estatística para rejeitar a hipótese de não existir interacção significativa entre o factor Maternidade e o factor Peça de roupa da mãe, (ou seja, não há evidência estatística para rejeitar a hipótese de que o factor maternidade não influencia a resposta da variável dependente (Tempo_adormecer) ao factor peça de roupa da mãe. 17 Finalmente, podemos afirmar com α=5% que não há evidência estatística para rejeitar a hipótese de não existir interacção significativa entre o factor Maternidade e o factor Peça de roupa da mãe (pvalue=0.880), (ou seja, não há evidência estatística para rejeitar a hipótese de que o factor maternidade não influencia a resposta da variável dependente (Tempo demorado a adormecer) ao factor peça de roupa da mãe. 18
A ANOVA no SPSS é um caso particular de um modelo de regressão mais generalista de tipo linear designado por Modelo Linear Generalizado (do inglês General Linear Model), onde faz sentido testar a significância do modelo, da constante (intercept) e dos efeitos principais combinados. soma de quadrados referente à ordenada na origem (intercept). Esta quantidade é referente à variabilidade em torno do parâmetro µ do modelo da ANOVA e o p-value associado testa a hipótese : H0: µ=0 vs. H1: µ 0. 19 A soma dos quadrados referentes ao modelo corrigido (Corrected Model) é uma estimativa da variabilidade explicada pelo efeito dos factores isoladamente e da sua interacção. A soma dos quadrados do erro (Error) é uma estimativa da variabilidade que não é explicada pelo modelo corrigido. A soma dos quadrados total corrigida- é uma estimativa da variabilidade total e pode obter-se somando a soma dos quadrados do modelo corrigido com a soma dos quadrados dos erros. 20
EXEMPLOS. ANOVA TWO-WAY COM O SPSS Exemplo 2: Numa determinada escola primária foi efectuado um certo teste para medir o nível de agressividade em crianças que frequentavam pela primeira vez a 1ª classe. Para tal foram seleccionadas aleatoriamente 6 crianças que até aos 5 anos de idade ficavam com os avós (ou outro familiar), 6 crianças que até aos 5 anos de idade frequentavam o infantário e 6 crianças que até aos 5 anos de idade ficavam com uma ama. Os resultados do teste foram organizados com essa informação e de acordo com o sexo. 21 22
Sabendo que em estudos anteriores se verificou que os resultados do teste de agressividade têm distribuição normal, averigúe o que pode concluir com base nestes dados (α=0.01). 23 Neste exemplo a variável resultados do teste de agressividade é função de duas variáveis independentes, o sexo e o tipo de acompanhamento pré-escolar escolar. É possível analisar os dados através de uma ANOVA a dois factores, desde que estejam verificadas as suas condições de aplicação. 24
Sendo a probabilidade de significância (Sig.) maior que 0.05 para todos os níveis do factor, concluímos que a variável possui distribuição normal. Testando a normalidade da variável dependente: 25 Testando a homogeneidade das variâncias Sendo as variâncias homogéneas e tendo a variável dependente distribuição normal, podemos finalmente efectuar a ANOVA. 26
27 28
Concluímos que o tipo de acompanhamento tem um efeito significativo sobre a agressividade (existem diferenças significativas entre as médias dos resultados do teste consoante o tipo de acompanhamento pré-escolar foi feito pela família, no infantário ou com uma ama) e que a interacção entre o Sexo e o acompanhamento é também significativa. Quais as médias significativamente diferentes? recurso à comparação múltipla de médias. 29 ANOVA COM MAIS DE 2 FACTORES (ANOVA MULTIFACTORIAL) Há um vasto leque de experiências onde tem todo o interesse medir o efeito de 3 ou mais factores e as suas interacções. Existem múltiplas interacções, cujos efeitos podem confundir os efeitos dos factores. Por exemplo numa ANOVA com 3 factores o modelo seria : 30