Análise de Variância (ANOVA) Exemplo: os lírios por espécie. A ANOVA como caso particular do Modelo Linear. A ANOVA a um Factor



Documentos relacionados
Análise de Variância com Dois Factores

O modelo ANOVA a dois factores, hierarquizados

Semelhança e áreas 1,5

Simbolicamente, para. e 1. a tem-se

PROJETO E ANÁLISES DE EXPERIMENTOS (PAE) EXPERIMENTOS COM UM ÚNICO FATOR E A ANÁLISE DE VARIÂNCIA

APONTAMENTOS DE ÁLGEBRA LINEAR E GEOMETRIA ANALÍTICA

Programação Linear Introdução

POLINÔMIOS. Definição: Um polinômio de grau n é uma função que pode ser escrita na forma. n em que cada a i é um número complexo (ou

Algoritmos de Busca de Palavras em Texto

1. VARIÁVEL ALEATÓRIA 2. DISTRIBUIÇÃO DE PROBABILIDADE

Material envolvendo estudo de matrizes e determinantes

COPEL INSTRUÇÕES PARA CÁLCULO DA DEMANDA EM EDIFÍCIOS NTC

Professores Edu Vicente e Marcos José Colégio Pedro II Departamento de Matemática Potências e Radicais

AULA 1. 1 NÚMEROS E OPERAÇÕES 1.1 Linguagem Matemática

Prof. Ms. Aldo Vieira Aluno:

1º semestre de Engenharia Civil/Mecânica Cálculo 1 Profa Olga (1º sem de 2015) Função Exponencial

Transporte de solvente através de membranas: estado estacionário

Projecções Cotadas. Luís Miguel Cotrim Mateus, Assistente (2006)

Incertezas e Propagação de Incertezas. Biologia Marinha

ESTATÍSTICA APLICADA. 1 Introdução à Estatística. 1.1 Definição

CINÉTICA QUÍMICA CINÉTICA QUÍMICA. Lei de Velocidade

Cálculo Numérico Faculdade de Engenharia, Arquiteturas e Urbanismo FEAU

Operadores momento e energia e o Princípio da Incerteza

Fluxo Gênico. Desvios de Hardy-Weinberg. Estimativas de Fluxo gênico podem ser feitas através de dois tipos de métodos:

CDI-II. Resumo das Aulas Teóricas (Semana 12) y x 2 + y, 2. x x 2 + y 2), F 1 y = F 2

Universidade Federal do Rio Grande FURG. Instituto de Matemática, Estatística e Física IMEF Edital 15 - CAPES MATRIZES

x 0 0,5 0,999 1,001 1,5 2 f(x) 3 4 4,998 5,

ÁLGEBRA LINEAR Equações Lineares na Álgebra Linear EQUAÇÃO LINEAR SISTEMA LINEAR GEOMETRIA DA ESQUAÇÕES LINEARES RESOLUÇÃO DOS SISTEMAS

Introdução ao estudo de equações diferenciais

II.3. Análise de Variância (ANOVA)

SERVIÇO PÚBLICO FEDERAL Ministério da Educação

Função Modular. x, se x < 0. x, se x 0

Aula 27 Integrais impróprias segunda parte Critérios de convergência

CONJUNTOS NUMÉRICOS Símbolos Matemáticos

Apoio à Decisão. Aula 3. Aula 3. Mônica Barros, D.Sc.

Vestibular UFRGS 2013 Resolução da Prova de Matemática

1 Fórmulas de Newton-Cotes

Um disco rígido de 300Gb foi dividido em quatro partições. O conselho directivo ficou. 24, os alunos ficaram com 3 8

COLÉGIO NAVAL 2016 (1º dia)

Integral. (1) Queremos calcular o valor médio da temperatura ao longo do dia. O valor. a i

II.3. Análise de Variância (ANOVA)

Bhaskara e sua turma Cícero Thiago B. Magalh~aes

Um modelo para Y ij. Um modelo para Y ij (cont.) As variáveis indicatrizes. O modelo ANOVA como um Modelo Linear A equação geral

EQUAÇÃO DO 2 GRAU. Seu primeiro passo para a resolução de uma equação do 2 grau é saber identificar os valores de a,b e c.

II.3. Análise de Variância (ANOVA)

3. Cálculo integral em IR 3.1. Integral Indefinido Definição, Propriedades e Exemplos

TRIGONOMETRIA. A trigonometria é uma parte importante da Matemática. Começaremos lembrando as relações trigonométricas num triângulo retângulo.

1 As grandezas A, B e C são tais que A é diretamente proporcional a B e inversamente proporcional a C.

Matrizes. Matemática para Economistas LES 201. Aulas 5 e 6 Matrizes Chiang Capítulos 4 e 5. Márcia A.F. Dias de Moraes. Matrizes Conceitos Básicos

3 Teoria dos Conjuntos Fuzzy

Trigonometria FÓRMULAS PARA AJUDÁ-LO EM TRIGONOMETRIA

Recordando produtos notáveis

CPV O cursinho que mais aprova na GV

, então ela é integrável em [ a, b] Interpretação geométrica: seja contínua e positiva em um intervalo [ a, b]

Resolução Numérica de Sistemas Lineares Parte I

UNIVERSIDADE FEDERAL DE PERNAMBUCO CCEN DEPARTAMENTO DE MATEMÁTICA EXAME DE QUALIFICAÇÃO PARA O MESTRADO EM MATEMÁTICA

Pontos onde f (x) = 0 e a < x < b. Suponha que f (x 0 ) existe para a < x 0 < b. Se x 0 é um ponto extremo então f (x 0 ) = 0.

Definição de áreas de dependência espacial em semivariogramas

ALGEBRA LINEAR AUTOVALORES E AUTOVETORES. Prof. Ademilson

Capítulo 4. Matrizes e Sistemas de Equações Lineares

Matemática Aplicada. A Mostre que a combinação dos movimentos N e S, em qualquer ordem, é nula, isto é,

FÓRMULA DE TAYLOR USP MAT

Os números racionais. Capítulo 3

Capítulo 7 - Estimação por intervalos 3

PLANIFICAÇÃO ANUAL PROFIJ II T2 Ano letivo 2015 / 2016

Diogo Pinheiro Fernandes Pedrosa

Comprimento de arco. Universidade de Brasília Departamento de Matemática

ROTAÇÃO DE CORPOS SOBRE UM PLANO INCLINADO

Módulo 02. Sistemas Lineares. [Poole 58 a 85]

Diagrama de Blocos. Estruturas de Sistemas Discretos. Grafo de Fluxo. Sistemas IIR Forma Directa I

UNIVERSIDADE FEDERAL DE PERNAMBUCO. Resumo. Nesta aula, utilizaremos o Teorema Fundamental do Cálculo (TFC) para o cálculo da área entre duas curvas.

Prova 1 Soluções MA-602 Análise II 27/4/2009 Escolha 5 questões

Rresumos das aulas teóricas Cap Capítulo 4. Matrizes e Sistemas de Equações Lineares

Matemática para Economistas LES 201. Aulas 5 e 6 Matrizes Chiang Capítulos 4 e 5. Luiz Fernando Satolo

1 Distribuições Contínuas de Probabilidade

RESOLUÇÃO DA PROVA DE MATEMÁTICA DA FASE 1 DO VESTIBULAR DA UFBA/UFRB-2007 POR PROFA. MARIA ANTÔNIA CONCEIÇÃO GOUVEIA

FUNÇÃO DO 2º GRAU OU QUADRÁTICA

Formas Quadráticas. FUNÇÕES QUADRÁTICAS: denominação de uma função especial, definida genericamente por: 1 2 n ij i j i,j 1.

MATRIZES. 1) (CEFET) Se A, B e C são matrizes do tipo 2x3, 3x1 e 1x4, respectivamente, então o produto A.B.C. (a) é matriz do tipo 4 x 2

Prova Escrita de MATEMÁTICA A - 12o Ano a Fase

Capítulo III INTEGRAIS DE LINHA

Integrais Duplas em Regiões Limitadas

MTDI I /08 - Integral de nido 55. Integral de nido

Capítulo 3. Autómatos e respectivas linguagens

Capítulo 1 Introdução à Física

INTEGRAIS DEFINIDAS. Como determinar a área da região S que está sob a curva y = f(x) e limitada pelas retas verticais x = a, x = b e pelo eixo x?

INTEGRAIS DEFINIDAS. Como determinar a área da região S que está sob a curva y = f(x) e limitada pelas retas verticais x = a, x = b e pelo eixo x?

Problemas e Algoritmos

Eletrotécnica TEXTO Nº 7

Área entre curvas e a Integral definida

XXVIII OLIMPÍADA BRASILEIRA DE MATEMÁTICA PRIMEIRA FASE NÍVEL 3 (Ensino Médio) GABARITO

Do programa... 2 Descobre o teu livro... 4

5) Para b = temos: 2. Seja M uma matriz real 2 x 2. Defina uma função f na qual cada elemento da matriz se desloca para a posição. e as matrizes são:

Gabarito - Matemática Grupo G

Introdução à Programação Linear

07 AVALIAÇÃO DO EFEITO DO TRATAMENTO DE

Aula 8: Gramáticas Livres de Contexto

TÓPICOS. Equação linear. Sistema de equações lineares. Equação matricial. Soluções do sistema. Método de Gauss-Jordan. Sistemas homogéneos.

PROVA DE MATEMÁTICA DA UNESP VESTIBULAR a Fase RESOLUÇÃO: Profa. Maria Antônia Gouveia.

FUNC ~ OES REAIS DE VARI AVEL REAL

Transcrição:

Análise de Vriânci (ANOVA) Exemplo: os lírios por espécie 2.0 3.0 4.0 0.5 1.5 2.5 A Regressão Liner vis modelr um vriável respost numéric (quntittiv), à cust de um ou mis vriáveis preditors, igulmente numérics. 2.0 3.0 4.0 Sepl.Length Sepl.Width 4.5 6.0 7.5 Ms um vriável respost numéric pode depender de um ou mis vriáveis qulittivs (ctegórics), ou sej, de um ou mis fctores. Em tis situções pode ser útil um Análise de Vriânci (ANOVA), metodologi esttístic desenvolvid nos nos 30 n Estção Experimentl Agrícol de Rothmsted (Reino Unido), por R.A. Fisher. 0.5 1.5 2.5 Petl.Length Petl.Width Species 4.5 6.0 7.5 1 3 5 7 1.0 2.0 3.0 1 3 5 7 1.0 2.0 3.0 As medições ds pétls vrim muito entre s espécies dos lírios. As medições ds sépls nem por isso. J. Cdim (ISA) Esttístic e Delinemento 2011-12 255 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 256 / 424 A ANOVA como cso prticulr do Modelo Liner A ANOVA um Fctor Embor Análise de Vriânci tenh surgido como método utónomo, quer Análise de Vriânci, quer Regressão Liner, são prticulrizções do Modelo Liner. Introduzir ANOVA trvés ds sus semelhnçs com Regressão Liner permite proveitr bo prte d teori estudd té qui. Terminologi: Vriável respost Y : um vriável numéric (quntittiv), que se pretende estudr e modelr. Fctor : um vriável preditor ctegóric (qulittiv); Níveis do fctor : vlores (distints ctegoris) do fctor, ou sej, diferentes situções experimentis onde se frão observções de Y. Começmos por nlisr o mis simples de todos os modelos ANOVA: ANOVA um Fctor (totlmente csulizdo). Considermos que vriável respost (numéric) Y depende de um único fctor, com k níveis. Efectumos observções de Y ns k diferentes situções experimentis. Admite-se que os vlores de Y poderão vrir por corresponderem níveis diferentes do fctor, ou ind devido flutução letóri. J. Cdim (ISA) Esttístic e Delinemento 2011-12 257 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 258 / 424 As n observções As n observções (cont.) Pr estudr os efeitos dum fctor, com k níveis, sobre um vriável respost Y, dmitimos que temos n observções independentes de Y, sendo n i (i = 1,...,k) correspondentes o nível i do fctor. Logo, n 1 + n 2 + + n k = n. Embor fosse possível continur indexr s n observções de Y com um único índice, vrindo de 1 n (como se fez n Regressão), é preferível utilizr dois índices pr indexr s observções de Y : um pr indicr o nível do fctor que observção corresponde; outro pr distinguir cd observção dentro de um ddo nível. Em gerl, Y ij indic j-ésim observção no i-ésimo nível do fctor, com i = 1,...,k e j = 1,...,n i. No cso de igul número de observções em cd nível, n 1 = n 2 = n 3 = = n k ( = n c ), diz-se que estmos pernte um delinemento equilibrdo. Os delinementos equilibrdos são conselháveis, por váris rzões. J. Cdim (ISA) Esttístic e Delinemento 2011-12 259 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 260 / 424

A modelção de Y A nturez mis pobre d noss vriável preditor estrá ssocid um modelo mis simples do que n regressão. Em gerl, dmitimos que o vlor esperdo (médio) de Y pode diferir em cd um ds k situções (níveis do fctor) em que é observdo. Um primeir formulção do modelo pode ssim ser dd pel equção de bse: E[Y ij ] = µ i. A modelção de Y (cont.) Pr poder enqudrr ANOVA n teori do Modelo Liner já estudd, é conveniente re-escrever s médis de nível n form: E[Y ij ] = µ i = µ + α i. O prâmetro µ é comum tods s observções, enqunto os prâmetros α i são específicos pr cd nível (i) do fctor. Cd α i é designdo o efeito do nível i. Admite-se que Y ij oscil letorimente em torno do seu vlor médio: Y ij = µ + α i + ε ij, com E[ε ij ] = 0. J. Cdim (ISA) Esttístic e Delinemento 2011-12 261 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 262 / 424 O modelo ANOVA como um Modelo Liner As vriáveis indictrizes A equção de bse do modelo ANOVA um fctor pode ser escrito n form vectoril/mtricil, como no modelo de regressão liner. Sej Y o vector n-dimensionl com totlidde ds observções d vriável respost. Admite-se que s n 1 primeirs correspondem o nível 1 do fctor, s n 2 seguintes o nível 2, e ssim de seguid. 1 n o vector de n uns, já considerdo n regressão. I i vriável indictriz de pertenç o nível i do fctor. Pr cd observção, est vriável tom o vlor 1 se observção corresponde o nível i do fctor, e o vlor 0 cso contrário (i = 1,...,k). ε o vector dos n erros letórios. Por exemplo, se se fizerem n = 9 observções, com n 1 = 3 observções no primeiro nível do fctor, n 2 = 4 no segundo nível e n 3 = 2 observções no terceiro nível, os vectores I 2 e I 3 serão: 0 0 0 1 I 2 = 1 1 1 0 0 0 0 0 0, I 3 = 0 0 0 1 1 J. Cdim (ISA) Esttístic e Delinemento 2011-12 263 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 264 / 424 A relção de bse em notção vectoril Em notção vectoril, equção de bse que descreve s n observções de Y pode escrever-se como no Modelo Liner: Y = µ 1 n + α 1 I 1 + α 2 I 2 + α 3 I 3 + ε. No exemplo com s n 1 = 3, n 2 = 4 e n 3 = 2 observções: Y 11 1 1 0 0 ε 11 Y 12 1 1 0 0 ε 12 Y 13 1 1 0 0 Y 21 1 0 1 0 µ ε 13 Y 22 = 1 0 1 0 α 1 Y 23 1 0 1 0 α 2 + ε 21 ε 22 Y 24 1 0 1 0 α 3 ε 23 ε 24 Y 31 1 0 0 1 ε 31 Y 32 1 0 0 1 ε 32 Y = X β + ε O problem do excesso de prâmetros Existe um problem técnico : s coluns d mtriz X são linermente dependentes, pelo que mtriz X t X não é invertível. Existe um excesso de prâmetros no modelo. Soluções possíveis: 1 retirr o prâmetro µ do modelo. corresponde retirr colun de uns d mtriz X; cd αi equivle µ i, médi do nível; não se pode generlizr situções mis complexs; mis difícil de encixr n teori já dd. 2 tomr α 1 = 0: será solução utilizd. corresponde excluir 1. vriável indictriz do modelo (e de X); permite proveitr teori do modelo RLM e é generlizável. 3 impor restrições os prâmetros: e.g., k α i = 0. Foi solução clássic, ind hoje frequente em livros de ANOVA; mis difícil de encixr n teori já dd. Cd solução tem implicções n form de interpretr os prâmetros. J. Cdim (ISA) Esttístic e Delinemento 2011-12 265 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 266 / 424

A relção de bse pr o nosso exemplo (cont.) Admitindo α 1 = 0, re-escrevemos o modelo como: Y 11 1 0 0 ε 11 Y 12 1 0 0 ε 12 Y 13 1 0 0 ε 13 Y 21 1 1 0 µ 1 ε 21 Y 22 = 1 1 0 α 2 + ε 22 Y 23 1 1 0 α 3 ε 23 Y 24 1 1 0 ε 24 Y 31 1 0 1 ε 31 Y 32 1 0 1 ε 32 Agor µ 1 é o vlor médio ds observções do nível i = 1: E[Y 1j ] = µ 1, j = 1,...,n 1 E[Y 2j ] = µ 1 + α 2, j = 1,...,n 2 A mtrix X num ANOVA um fctor Agor, mtriz X tem ns coluns os vectores 1 n, I 2, I 3,..., I k. N ANOVA um fctor, mtriz do modelo X indic quis s observções correspondentes cd nível do fctor. Est nturez especil d mtriz X n ANOVA fz com que resultdos geris válidos pr qulquer Modelo Liner tenhm expressões específics no contexto d ANOVA. Explorremos esss expressões específics. E[Y 3j ] = µ 1 + α 3, j = 1,...,n 3 Cd α i (i > 1) represent um créscimo à médi do primeiro nível. J. Cdim (ISA) Esttístic e Delinemento 2011-12 267 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 268 / 424 Os estimdores dos prâmetros Os estimdores dos prâmetros (cont.) Como equção do modelo ANOVA é um cso prticulr d equção do Modelo Liner, fórmul dos estimdores de mínimos qudrdos dos prâmetros é igulmente ˆβ = (X t X) 1 X t Y. Devido à nturez ds coluns d mtriz X, tem-se: n n 2 n 3 n 4 n k n 2 n 2 0 0 0 X t n 3 0 n 3 0 0 X = n 4 0 0 n 4 0........ n k 0 0 0 n k Tem-se tmbém: 1 1 1 1 1 n 1 1 +n 2 n 1 1 1 2 ( X t X ) n 1 1 1 1 1 +n 3 n 1 1 = 3 n n 1 1 1 1 +n 4 1 n 1 4........ n 1 1 1 1 1 +n k n k k n i j=1 Y ij n 2 j=1 X t Y 2j Y = n 3 j=1 Y 3j. n k j=1 Y kj J. Cdim (ISA) Esttístic e Delinemento 2011-12 269 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 270 / 424 Os estimdores dos prâmetros (cont.) Os estimdores ds médis de nível Logo, ˆµ 1 = Y 1 ˆα 2 = Y 2 Y 1 ˆα 3 = Y 3 Y 1... ˆα k = Y k Y 1 Ddos os estimdores referidos no cetto nterior, e um vez que s médis de cd nível (lém do primeiro) são dds por µ i = µ 1 + α i, temos que os estimdores de cd médi de nível são ˆµ 1 = Y 1 ˆµ 2 = Y 2 ˆµ 3 = Y 3... onde Y i = 1 n i n i j=1 Y ij é médi ds n i observções de Y no nível i. Ou sej, os prâmetros são estimdos pels quntiddes mostris correspondentes. ˆµ k = Y k sendo Y i médi ds n i observções de Y no nível i do fctor. J. Cdim (ISA) Esttístic e Delinemento 2011-12 271 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 272 / 424

Os vlores justdos Ŷij Do que foi visto, decorre que qulquer observção tem vlor justdo: Ŷ ij = ˆµ i = ˆµ 1 + ˆα i = Y i. Ou sej, os vlores justdos Ŷij são iguis pr tods s observções num mesmo nível i do fctor, e são dds pel médi mostrl ds observções nesse nível. Tl como n Regressão, os vlores justdos de Y resultm de projectr ortogonlmente os vlores observdos d vriável respost Y sobre o subespço de R n gerdo pels coluns d mtriz X. Num ANOVA um fctor, o subespço C (X) tem nturez especil. O subespço C (X) num ANOVA um fctor Qulquer vector no subespço C (X) tem de ter vlores iguis pr tods s observções dum mesmo nível do fctor: 1... 1 1 + 2... 1 + 2 1 1 n + 2 I 2 + 3 I 3 +... + k I k = 1 + 3... 1 + 3 (...) 1 + k... 1 + k O vector Ŷ pertence C (X), logo tem ess crcterístic, como se viu. J. Cdim (ISA) Esttístic e Delinemento 2011-12 273 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 274 / 424 O modelo ANOVA 1 fctor pr efeitos inferenciis Pr se poder fzer inferênci no modelo ANOVA um fctor, dmite-se não pens que cd observção individul Y ij é d form Y ij = µ 1 + α i + ε ij, i = 1,...,k, j = 1,...,n i, com E[ε ij ] = 0 e α 1 = 0. Admite-se ind que os erros letórios ε ij têm s mesms proprieddes que no modelo de regressão liner: Normis, de vriânci constnte e independentes. O modelo ANOVA um fctor Modelo ANOVA um fctor, com k níveis Existem n observções, Y ij, n i ds quis ssocids o nível i (i = 1,...,k) do fctor. Tem-se: 1 Y ij = µ 1 + α i + ε ij, i = 1,...,k, j = 1,...,n i (α 1 = 0). 2 ε ij N (0, σ 2 ) 3 {ε ij } n v..s independentes. O modelo tem k prâmetros desconhecidos: médi de Y no primeiro nível do fctor, µ 1, e os créscimos α i (i > 1) que germ s médis de cd um dos k 1 restntes níveis do fctor. Ou sej, β = (µ 1, α 2, α 3,,α k ) t. J. Cdim (ISA) Esttístic e Delinemento 2011-12 275 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 276 / 424 O modelo ANOVA um fctor - notção vectoril Versão vectoril/mtricil do modelo um fctor De form equivlente, em notção vectoril, Modelo ANOVA um fctor - notção vectoril O vector Y ds n observções verific: 1 Y = µ 1 1 n + α 2 I 2 + α 3 I 3 +... + α k I k + ε, sendo 1 n o vector de n uns e I 2, I 3,..., I k s vriáveis indictrizes dos níveis indicdos. 2 ε N n (0, σ 2 I n ), sendo I n mtriz identidde n n. Trt-se de um modelo nálogo um modelo de Regressão Liner Múltipl, diferindo pens n nturez ds vriáveis preditors, que são qui vriáveis indictrizes dos níveis 2 k do fctor. Um terceir form equivlente de escrever o Modelo: Modelo ANOVA um fctor - notção vectoril/mtricil O vector Y ds n observções verific: 1 Y = Xβ + ε, onde X = [ 1 n I 2 I 3 I k ] e β = (µ 1,α 2,α 3,,α k ) t, sendo 1 n o vector de n uns e I 2, I 3,..., I k s vriáveis indictrizes dos níveis indicdos. 2 ε N n (0, σ 2 I n ), sendo I n mtriz identidde n n. J. Cdim (ISA) Esttístic e Delinemento 2011-12 277 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 278 / 424

O teste os efeitos do fctor A hipótese de que nenhum dos níveis do fctor fecte médi d vriável respost corresponde à hipótese α 2 = α 3 =... = α k = 0 µ 1 = µ 2 = µ 3 = = µ k Ddo o prlelismo com os modelos de Regressão Liner, est hipótese corresponde dizer que todos os coeficientes ds vriáveis preditors (n ANOVA, s vriáveis indictrizes I i ) são nulos. Logo, é possível testr est hipótese, trvés dum teste F de justmento globl do modelo (ver cetto 208). Trtndo-se dum cso prticulr do modelo liner, neste contexto há fórmuls específics. Os grus de liberdde Num ANOVA um fctor, o número de prâmetros do modelo é p + 1 = k. Logo, os grus de liberdde ssocidos cd Som de Qudrdos são: SQxx g.l. SQF k 1 SQRE n k No contexto d ANOVA um fctor, utiliz-se SQF em vez de SQR, pr indicr Som de Qudrdos relciond com o Fctor (embor su definição sej idêntic). Os Qudrdos Médios continum ser os quocientes ds Soms de Qudrdos dividir pelos respectivos grus de liberdde. J. Cdim (ISA) Esttístic e Delinemento 2011-12 279 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 280 / 424 O Teste F os efeitos do fctor num ANOVA Sendo válido o Modelo de ANOVA um fctor, tem-se então: Teste F os efeitos do fctor Hipóteses: H 0 : α i = 0 i=2,...,k vs. H 1 : i=2,..,k t.q. α i 0. [FACTOR NÃO AFECTA] vs. [FACTOR AFECTA Y ] Esttístic do Teste: F = QMF QMRE F (k 1,n k) se H 0. Nível de significânci do teste: α Região Crític (Região de Rejeição): Unilterl direit Rej. H 0 se F clc > f α(k 1,n k) df(x, 4, 16) 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0 1 2 3 4 Tmbém s Soms de Qudrdos e Qudrdos Médios têm fórmuls específics este contexto. J. Cdim (ISA) Esttístic e Delinemento 2011-12 281 / 424 x Os resíduos e SQRE Viu-se ntes (cetto 272) que Ŷij = ˆµ i = Y i, pelo que o resíduo d observção Y ij é ddo por: E ij = Y ij Ŷij = Y ij Y i, Logo, Som de Qudrdos dos Resíduos é dd por: onde S 2 i = 1 SQRE = n i n i 1 j=1 k n i j=1 ( k 2 Yij Y i ) = (n i 1) Si 2, (Y ij Y i ) 2 é vriânci mostrl ds n i observções no i-ésimo nível do fctor. SQRE mede vribilidde no seio dos k níveis. J. Cdim (ISA) Esttístic e Delinemento 2011-12 282 / 424 A Som de Qudrdos ssocid o Fctor A Som de Qudrdos ssocid à Regressão tom, neste contexto, designção Som de Qudrdos ssocid o Fctor e será representd por SQF. É dd por: SQF = SQF = sendo Y = 1 n k n i Y ij j=1 k n i j=1 (Ŷij Y ) 2 = k k n i (Y 2 i Y ) n i j=1 ( Y i Y ) 2 médi d totlidde ds n observções. SQF mede vribilidde entre s médis mostris de cd nível. A relção entre Soms de Qudrdos A relção fundmentl entre s três Soms de Qudrdos gnh, neste contexto, um significdo prticulr: onde: k n i SQT = SQF + SQRE (Y ij Y ) 2 = k j=1 n i (Y i Y ) 2 + k (n i 1) Si 2. SQT numerdor d vriânci mostrl SY 2 d totlidde ds n observções de Y ; SQF medid d vribilidde ds k médis de nível (vribilidde inter-níveis); SQRE som ponderd ds vriâncis mostris de Y em cd um dos k níveis (vribilidde intr-níveis). J. Cdim (ISA) Esttístic e Delinemento 2011-12 283 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 284 / 424

O qudro-resumo d ANOVA 1 Fctor Pode-se coleccionr est informção num tbel-resumo d ANOVA. Fonte g.l. SQ QM f clc Fctor k 1 SQF = k n i (y i y ) 2 QMF = SQF k 1 Resíduos n k SQRE = k (n i 1)si 2 QMRE = SQRE n k QMF QMRE Totl n 1 SQT = (n 1)s 2 y Fctores no O tem um estrutur de ddos específic pr vriáveis qulittivs (ctegórics), designd fctor. Um fctor, é crido pelo comndo fctor, plicdo um vector de tipo chrcter contendo os nomes dos vários níveis: > fctor(c( Adubo 1, Adubo 1,..., Adubo 5 )) NOTA: Explore o comndo rep pr instruções curts que crim repetições de vlores. E.g., no objecto iris, colun Species é um fctor. Vejmos como função summry lid com fctores: > summry(iris) Sepl.Length Sepl.Width Petl.Length Petl.Width Species Min. :4.300 Min. :2.000 Min. :1.000 Min. :0.100 setos :50 1st Qu.:5.100 1st Qu.:2.800 1st Qu.:1.600 1st Qu.:0.300 versicolor:50 Medin :5.800 Medin :3.000 Medin :4.350 Medin :1.300 virginic :50 Men :5.843 Men :3.057 Men :3.758 Men :1.199 3rd Qu.:6.400 3rd Qu.:3.300 3rd Qu.:5.100 3rd Qu.:1.800 Mx. :7.900 Mx. :4.400 Mx. :6.900 Mx. :2.500 J. Cdim (ISA) Esttístic e Delinemento 2011-12 285 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 286 / 424 ANOVAs um Fctor no Pr efectur um ANOVA um Fctor no ddos num dt.frme com dus coluns:, convém orgnizr os 1 um pr os vlores (numéricos) d vriável respost; 2 outr pr o fctor (com indicção dos seus níveis). As fórmuls usds no pr indicr um ANOVA um fctor são semelhntes às d regressão liner, indicndo o fctor preditor. Por exemplo, pr efectur um ANOVA de comprimentos ds pétls sobre espécies, nos ddos dos n = 150 lírios, fórmul é: Petl.Length Species um vez que dt frme iris contém um colun de nome Species que foi definid como fctor. ANOVAs um fctor no (cont.) Embor sej possível usr o comndo lm pr efectur um ANOVA ( ANOVA é cso prticulr do Modelo Liner), existe outro comndo que orgniz informção d form mis trdicionl num ANOVA: ov. E.g., ANOVA de comprimento de pétls sobre espécies pr os lírios invoc-se d seguinte form: > ov(petl.length ~ Species, dt=iris) É produzido o seguinte resultdo (diferente do do comndo lm): Cll: ov(formul = Petl.Length ~ Species, dt=iris) Terms: Species Residuls Sum of Squres 437.1028 27.2226 Deg. of Freedom 2 147 Residul stndrd error: 0.4303345 J. Cdim (ISA) Esttístic e Delinemento 2011-12 287 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 288 / 424 ANOVAs um fctor no (cont.) Os prâmetros estimdos, no A função summry tmbém pode ser plicd o resultdo de um ANOVA, produzindo o qudro-resumo d ANOVA: > iris.ov <- ov(petl.length ~ Species, dt=iris) > summry(iris.ov) Df Sum Sq Men Sq F vlue Pr(>F) Species 2 437.10 218.55 1180.2 < 2.2e-16 *** Residuls 147 27.22 0.19 --- Signif. codes: 0 ~***~ 0.001 ~**~ 0.01 ~*~ 0.05 ~.~ 0.1 ~ ~ 1 Neste cso, rejeit-se clrmente hipótese de que os créscimos de nível, α i, sejm todos nulos, pelo que se rejeit hipótese de comprimentos médios de pétls iguis em tods s espécies. O fctor fect vriável respost. Pr obter s estimtivs dos prâmetros µ 1, α 2, α 3,..., α k, pode plicr-se função coef o resultdo d ANOVA. No exemplo dos lírios, temos: > coef(iris.ov) (Intercept) Speciesversicolor Speciesvirginic 1.462 2.798 4.090 Estes são os vlores estimdos dos prâmetros ˆµ 1 : médi mostrl de comprimentos de pétls setos; ˆα 2 : créscimo que, somdo à médi mostrl d 1. espécie, nos dá médi mostrl dos comprimentos de pétls versicolor; ˆα 3 : créscimo que, somdo à médi mostrl d 1. espécie, nos dá médi mostrl dos comprimentos de pétls virginic. J. Cdim (ISA) Esttístic e Delinemento 2011-12 289 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 290 / 424

Prâmetros estimdos no (cont.) Pr melhor interpretr os resultdos, vejmos s médis por nível do fctor d vriável respost, trvés d função model.tbles, com o rgumento type= mens : > model.tbles(iris.ov, type="men") Tbles of mens Grnd men 3.758 Species Species setos versicolor virginic 1.462 4.260 5.552 O orden os níveis de um fctor por ordem lfbétic. ANOVAs como modelo Liner no Tmbém é possível estudr um ANOVA trvés do comndo lm, nomedmente pr fzer inferênci sobre os prâmetros do modelo: > summry(lm(petl.length ~ Species, dt=iris)) Cll: lm(formul = Petl.Length ~ Species, dt=iris) Residuls: Min 1Q Medin 3Q Mx -1.260-0.258 0.038 0.240 1.348 Coefficients: Estimte Std. Error t vlue Pr(> t ) (Intercept) 1.46200 0.06086 24.02 <2e-16 *** Speciesversicolor 2.79800 0.08607 32.51 <2e-16 *** Speciesvirginic 4.09000 0.08607 47.52 <2e-16 *** --- Residul stndrd error: 0.4303 on 147 degrees of freedom Multiple R-squred: 0.9414, Adjusted R-squred: 0.9406 F-sttistic: 1180 on 2 nd 147 DF, p-vlue: < 2.2e-16 J. Cdim (ISA) Esttístic e Delinemento 2011-12 291 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 292 / 424 A explorção ulterior de H 1 A explorção ulterior de H 1 (cont.) A Hipótese Nul, no teste F num ANOVA 1 Fctor, firm que todos os níveis do fctor têm efeito nulo, isto é, que médi d vriável respost Y é igul nos k níveis do Fctor: α 2 = α 3 =... = α k = 0 µ 1 = µ 2 = µ 3 = = µ k A Hipótese Alterntiv diz que pelo menos um dos níveis do fctor tem um médi de Y diferente do primeiro nível: i tl que α i 0 (i > 1) i tl que µ 1 µ i (i > 1) Cso se opte pel Hipótese Alterntiv, fic em berto (excepto qundo k = 2) questão de sber quis os níveis do fctor cujs médis diferem entre si. Mesmo com k = 3, rejeição de H 0 pode dever-se : µ 1 = µ 2 µ 3 i.e., α 2 = 0 ; α 3 0 µ 1 = µ 3 µ 2 i.e., α 3 = 0 ; α 2 0 µ 1 µ 2 = µ 3 i.e., α 2 = α 3 0; µ i todos diferentes i.e., α 2 α 3 e α 2,α 3 0. Como optr entre ests diferentes lterntivs? Ou sej, nem tods s médis de nível de Y são iguis J. Cdim (ISA) Esttístic e Delinemento 2011-12 293 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 294 / 424 A explorção ulterior de H 1 (cont.) As comprções múltipls Um hipótese consiste em efectur testes os α i s, com bse n teori já estudd nteriormente. Ms qunto mior fôr k, mis sub-hipóteses lterntivs existem, mis testes hverá pr fzer. Não se trt pens de um questão de serem necessários muitos testes. A multiplicção do número de testes fz perder o controlo do nivel de significânci α globl pr o conjunto de todos os testes. É possível construir testes de hipóteses reltivos tods s diferençs µ i µ j, definids pels médis populcionis de Y nos níveis i, j de um fctor (i,j = 1,...,k, com i j), controlndo o nível de significânci globl α do conjunto dos testes. Tis testes chmm-se testes de comprções múltipls de médis. O nível de significânci α nos testes de comprção múltipl é probbilidde de rejeitr qulquer ds hipóteses µ i = µ j, cso el sej verdde, ou sej, é um nível de significânci globl. Alterntivmente, podem-se construir intervlos de confinç pr cd diferenç µ i µ j, com um nível (1 α) 100% de confinç de que os verddeiros vlores de µ i µ j pertencem todos os intervlos. J. Cdim (ISA) Esttístic e Delinemento 2011-12 295 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 296 / 424

Distribuição de Tukey pr Amplitudes Studentizds O mis usdo teste de comprções múltipls é o teste de Tukey, que se bsei no seguinte resultdo. Teorem (Distribuição de Tukey) Sejm {W i } k vriáveis letóris independentes, com distribuição Norml, de iguis prâmetros: W i N (µ W,σW 2 ), i = 1,...,k. Sej SW 2 um estimdor d vriânci comum σ W 2, tl que ν S2 W σw 2 Sej R W = mxw i minw i mplitude mostrl. i i Sejm S w e R w independentes. χ 2 ν. Então, mplitude Studentizd, R W SW, tem distribuição de Tukey, que depende de dois prâmetros: k e ν. A utilidde d distribuição de Tukey Num ANOVA um fctor, dmitimos que Y ij = µ 1 + α } {{ } i +ε ij, (α 1 = 0), = µ i pelo que (com os pressupostos reltivos os erros letórios do modelo ANOVA) Y ij N (µ i, σ 2 ). Logo, médi mostrl de cd nível, Y i = 1 n i Y i N (µ i, σ 2 ) n i n i j=1 Y ij, tem distribuição Y i µ i N (0, σ 2 ) n i J. Cdim (ISA) Esttístic e Delinemento 2011-12 297 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 298 / 424 A utilidde d distribuição de Tukey (cont.) Cso o delinemento sej equilibrdo, isto é, n 1 = n 2 =... = n k (= n c ), s k diferençs Y i µ i terão mesm distribuição N ( 0, σ 2 /n c ), e serão s vriáveis W i do Teorem no cetto (297). Um estimdor d vriânci comum σ 2 /n c é ddo por QMRE/n c, e: (n k) QMRE/n c σ 2 /n c = SQRE σ 2 χ 2 n k, (cettos 188 e 189, pois no modelo ANOVA há k prâmetros). Os vlores justdos Y i e os resíduos que definem SQRE são independentes, logo, mplitude mostrl R = mx(y i µ i ) min(y j µ j ) i j é independente do estimdor d vriânci comum, QMRE/n c. Aplic-se o Teorem do cetto (297). J. Cdim (ISA) Esttístic e Delinemento 2011-12 299 / 424 Intervlos de Confinç pr µ i µ j Sej q α (k,n k) o vlor que num distribuição de Tukey com prâmetros k e n k, deix à direit um região de probbilidde α. Então, por definição: [ ] R P S < q α (k,n k) = 1 α Logo, um intervlo de confinç (1 α) 100% pr mplitude R é ddo por: QMRE R < q α (k,n k) n c Os vlores d função distribuição cumultiv e os quntis q α (k,n k) dum distribuição de Tukey são clculdos no, trvés ds funções ptukey e qtukey, respectivmente. A utilidde d distribuição de Tukey (cont.) Assim, R S = mx i (Y i µ i ) min(y j µ j ) j QMRE n c tem distribuição de Tukey, com prâmetros k e n k. O quociente R S não pode ser negtivo, por definição. Este resultdo pode ser usdo pr construir testes de hipóteses ou intervlos de confinç pr o conjunto de tods s diferençs de médis de nível de Y, µ i µ j. J. Cdim (ISA) Esttístic e Delinemento 2011-12 300 / 424 Intervlos de Confinç pr µ i µ j (cont.) Ms R = mx(y i µ i ) min(y j µ j ) é mior de tods s i j diferençs do tipo (Y i µ i ) (Y j µ j ), pr qulquer i,j = 1,...,k. Logo, pr todos os pres de níveis i e j, tem-se, com gru de confinç globl (1 α) 100%, ( y i y j ) (µi µ j ) R < q α (k,n k) QMRE nc ( y i y j ) qα (k,n k) QMRE < (µ nc i µ j ) < ( y i y j ) + qα (k,n k) QMRE nc J. Cdim (ISA) Esttístic e Delinemento 2011-12 301 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 302 / 424

Testes de Hipóteses pr µ i µ j = 0, i,j Comprções Múltipls de Médis no Alterntivmente, prtir do resultdo do cetto (300) é possível testr Hipótese Nul de que tods s diferençs de pres de médis de nível, µ i µ j, sejm nuls, em cujo cso Y i Y j < q α (k,n k) QMRE nc, com probbilidde (1 α). Qulquer diferenç de médis mostris de nível, Y i Y j, que exced o limir q α (k,n k) QMRE nc indic que, pr esse pr de níveis i,j, se deve considerr µ i µ j. O nível (globl) de significânci de tods ests comprções é α, ou sej, probbilidde de se concluir que µ i µ j (pr lgum pr i,j), se em todos os csos µ i = µ j, é α. As comprções múltipls de médis de nível, com bse no resultdo de Tukey, podem ser fcilmente efectuds no. Pr se obter o termo de comprção nos testes de hipóteses que µ i µ j = 0, o quntil de ordem 1 α n distribuição de Tukey é obtido prtir do comndo > qtukey(1-α, k, n k) (com os vlores numéricos de α, k e n k). O vlor de QMRE é ddo pelo comndo ov, sob designção Residul stndrd error. J. Cdim (ISA) Esttístic e Delinemento 2011-12 303 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 304 / 424 Comprções Múltipls de Médis no (cont.) Comprções Múltipls de Médis no (cont.) Os intervlos de Confinç (1 α) 100% pr s diferençs de médis são obtidos trvés do comndo TukeyHSD. Por exemplo, pr os ddos dos lírios, > TukeyHSD(ov(Sepl.Width ~ Species, dt=iris)) Tukey multiple comprisons of mens 95% fmily-wise confidence level $Species diff lwr upr p dj versicolor-setos -0.658-0.81885528-0.4971447 0.0000000 virginic-setos -0.454-0.61485528-0.2931447 0.0000000 virginic-versicolor 0.204 0.04314472 0.3648553 0.0087802 Neste exemplo, nenhum dos intervlos inclui o vlor zero, pelo que considermos que µ i µ j, pr qulquer i j, ou sej, tods s médis de espécie são diferentes. O vlor de prov indicdo (p dj) deve ser interpretdo como o vlor de α pr o qul cd diferenç de médis, y i. y j., seri, pel primeir vez, considerdo não significtivo. > TukeyHSD(ov(Sepl.Width ~ Species, dt=iris)) Tukey multiple comprisons of mens 95% fmily-wise confidence level $Species diff lwr upr p dj versicolor-setos -0.658-0.81885528-0.4971447 0.0000000 virginic-setos -0.454-0.61485528-0.2931447 0.0000000 virginic-versicolor 0.204 0.04314472 0.3648553 0.0087802 Assim, pr α = 0.00878, diferenç de médis mostris pr s espécies virginic e versicolor já seri considerd não significtiv. Ou sej, o intervlo (1 α) 100% = 99.122% de confinç pr ess diferenç de médis já conteri o vlor zero. J. Cdim (ISA) Esttístic e Delinemento 2011-12 305 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 306 / 424 Representção gráfic ds comprções múltipls O disponibiliz ind um uxilir gráfico pr visulizr s comprções ds médis de nível, trvés d função plot, plicd o resultdo d função TukeyHSD. virginic versicolor virginic setos versicolor setos 95% fmily wise confidence level 0.8 0.6 0.4 0.2 0.0 0.2 0.4 Differences in men levels of Species Delinementos não equilibrdos Qundo o delinemento d ANOVA um Fctor não é equilibrdo (isto é, existe diferente número de observções nos vários níveis do fctor), os resultdos gor enuncidos não são, em rigor, válidos. Ms, pr delinementos em que o desequilíbrio no número de observções não sej muito centudo, é possível justr os vlores d distribuição de Tukey. A função TukeyHSD do incorpor esss correcções. J. Cdim (ISA) Esttístic e Delinemento 2011-12 307 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 308 / 424

Análise de Resíduos n ANOVA 1 Fctor A vlidde dos pressupostos do modelo estud-se de form idêntic o que foi visto n Regressão Liner. Ms há lgums prticulriddes. Num ANOVA um fctor, os resíduos precem empilhdos em k coluns nos gráficos de ŷ ij vs. e ij, porque qulquer vlor justdo ŷ ij é igul pr observções num mesmo nível do fctor. Este pdrão não indici qulquer violção os pressupostos do modelo. Análise de Resíduos n ANOVA 1 Fctor (cont.) Pdrão de resíduos num ANOVA 1 Fctor (o exemplo considerdo é Sepl.Width Species, nos lírios) Residuls 1.0 0.5 0.0 0.5 1.0 Residuls vs Fitted 118 2.8 2.9 3.0 3.1 3.2 3.3 3.4 16 42 Fitted vlues ov(sepl.width ~ Species) J. Cdim (ISA) Esttístic e Delinemento 2011-12 309 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 310 / 424 Inspeccionndo homogeneidde de vriâncis Outr prticulridde d ANOVA, resultnte do fcto de hver n i repetições em cd um dos k níveis do fctor: é possível testr formlmente se s vriâncis dos erros letórios diferem entre os níveis do fctor. O Teste de Brtlett test s hipóteses vs. H 0 : σ 2 1 = σ 2 2 = = σ 2 k H 1 : i,i t.q. σ 2 i σ 2 i, sendo σ 2 i vriânci comum dos erros letórios ε ij do nível i. Médis ritmétics e médis geométrics Relção gerl entre médi ritmétic e médi geométric (mesmo que ponderds) de quisquer k números positivos. Sejm τ 1, τ 2,..., τ k números positivos, e p 1, p 2,..., p k números entre 0 e 1, de som 1. A médi ritmétic (ponderd com pesos p i ) dos τ i s é MA = k p i τ i. A médi geométric (ponderd com pesos p i ) dos τ i s é MG = k τ p i i. Qundo p i = 1 k, i, temos s médis ritmétic e geométric simples. J. Cdim (ISA) Esttístic e Delinemento 2011-12 311 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 312 / 424 A desiguldde entre médi ritmétic e geométric Quisquer que sejm os vlores (positivos) dos τ i e ds ponderções p i, tem-se seguinte desiguldde entre médi ritmétic e geométric dos k vlores de τ: MG MA (4) A iguldde em (4) verific-se se e só se os k vlores de τ são iguis: τ 1 = τ 2 = = τ k. Qunto mior fôr dispersão dos τ, mior será diferenç entre médi geométric e médi ritmétic. O nosso contexto Admit-se que os erros letórios, e portnto s observções Y ij, do nível i do fctor têm vriânci comum V [ε ij ] = V [Y ij ] = σi 2, podendo, no entnto os σi 2 diferir entre níveis. A idei subjcente à esttístic do teste de Brtlett é de comprr um médi ritmétic (MA) e geométric (MG) ds vriâncis mostris Si 2 n i ( 2 = Yij Y i ), 1 n i 1 j=1 que estimm s vriâncis populcionis σ 2 i. Se fôr verddeir Hipótese Nul do teste de Brtlett (σi 2 todos iguis), é nturl que s vriâncis mostris Si 2 sejm proximdmente iguis e MA MG sej próximo de 1. Qunto mior est rzão ds médis, mis duvidos se torn H 0. J. Cdim (ISA) Esttístic e Delinemento 2011-12 313 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 314 / 424

Estimndo s vriâncis de nível No cálculo ds médis ritmétic e geométric ds vriâncis mostris de nível S 2 i, vmos utilizr ponderções proprids o contexto. Se usrmos como ponderções p i = n i 1 i (n i 1) = n i 1 n k, médi ritmétic ponderd dos estimdores Si 2 é o Qudrdo Médio Residul d ANOVA (ver o Acetto 282): MA = k n i 1 n k S2 i = k n i j=1 (Y ij Y i ) 2 n k = QMRE. A idei subjcente o teste de Brtlett A médi geométric dos k estimdores de vriâncis de nível é: MG = k (S 2 i ) n i 1 n k. Sbemos que MA/MG 1. Qunto mior fôr este quociente, mior será vribilidde dos S 2 i, e portnto mis duvidos será Hipótese Nul d iguldde dos σ 2 i. Logo, o quociente MA MG é um cndidto esttístic do teste à iguldde de vriâncis, com Região Crític unilterl direit. Ms é necessário conhecer distribuição de probbiliddes dum esttístic do Teste, sob H 0. J. Cdim (ISA) Esttístic e Delinemento 2011-12 315 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 316 / 424 O teste de Brtlett Brtlett demonstrou que, sob H 0, um trnsformção monóton crescente do quociente MA/MG tem distribuição ssintoticmente χ 2, cso s vriáveis subjcentes às vriâncis tenhm distribuição Norml. Concretmente, demonstrou que K 2 = n k C ln [ ] MA MG = n k C tem, ssintoticmente distribuição χ 2 k 1, sendo 1 C = 1 + 3(k 1) [ k (ln MA ln MG), ] 1 n i 1 1. n k O Teste de Brtlett Teste de Brtlett à homogeneidde de vriâncis Hipóteses: H 0 : σ1 2 = σ 2 2 =... = σ k 2 vs. H 1 : i,i t.q. σi 2 σi 2 [Vriâncis homogénes] [Vr. heterogénes] Esttístic do Teste: K 2 = (n k)lnqmre k (n i 1) lnsi 2 C onde C = 1 + 1 3(k 1) [ k Nível de significânci do teste: α 1 n i 1 1 n k ]. Região Crític (Região de Rejeição): Unilterl direit Rejeitr H 0 se K 2 clc > χ2 α(k 1) χ 2 k 1 J. Cdim (ISA) Esttístic e Delinemento 2011-12 317 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 318 / 424 O Teste de Brtlett no Precuções No, o teste de Brtlett é invocdo pelo comndo brtlett.test, tendo por rgumento um fórmul (nálog à usd no comndo ov pr indicr vriável respost e o fctor). E.g., > brtlett.test(sepl.width ~ Species, dt=iris) Brtlett test of homogeneity of vrinces dt: Sepl.Width by Species Brtlett s K-squred = 2.0911, df = 2, p-vlue = 0.3515 Dus precuções n utilizção do teste de Brtlett: O teste de Brtlett é fortemente sensível à Normlidde ds observções subjcentes. A distribuição χ 2 é pens ssintótic. Um regr comum é considerr que o teste pens deve ser usdo cso n i 5, i = 1,..,k. Neste cso, o teste de Brtlett indic não rejeição de H 0, ou sej, é dmissível hipótese de iguldde ns vriâncis em cd nível do fctor. J. Cdim (ISA) Esttístic e Delinemento 2011-12 319 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 320 / 424

Violções os pressupostos d ANOVA Violções os pressupostos do modelo não têm sempre igul grvidde. Alguns comentários geris: O teste F d ANOVA e s comprções múltipls de Tukey são reltivmente robustos desvios à hipótese de normlidde. As violções o pressuposto de vriâncis homogénes são em gerl pouco grves no cso de delinementos equilibrdos, ms podem ser grves em delinementos não equilibrdos. A flt de independênci entre erros letórios é violção mis grve dos pressupostos e deve ser evitd, o que é em gerl possível com um delinemento experimentl dequdo. Um dvertênci N formulção clássic do modelo ANOVA um Fctor, e prtir d equção-bse Y ij = µ + α i + ε ij, em vez de impor condição α 1 = 0, impõe-se condição i α i = 0. Est condição lterntiv: mud form de interpretr os prâmetros (µ é gor um espécie de médi gerl ds observções e α i o desvio médio ds observções do nível i em relção ess médi gerl); Mud os estimdores dos prâmetros. Não mud o resultdo do teste F à existênci de efeitos do fctor, nem qulidde globl do justmento. A noss formulção, lém de generlizável modelos com mis Fctores, permite proveitr directmente os resultdos d Regressão Liner Múltipl. J. Cdim (ISA) Esttístic e Delinemento 2011-12 321 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 322 / 424 Delinementos e Uniddes experimentis No delinemento ds experiêncis pr posterior nálise trvés dum ANOVA (ou regressão liner), é frequente que s n observções d vriável respost correspondm n diferentes uniddes experimentis (indivíduos, prcels de terreno, locis, etc.). É conveniente que s uniddes experimentis ns quis se recolhem os ddos sejm tão homogénes qunto possível, excepto em spectos ssocidos os fctores incorpordos no modelo. Uniddes experimentis (cont.) Qulquer vribilidde não controld ns uniddes experimentis (isto é, que não se pode tribuir os preditores) é considerd no modelo como vrição letóri, pelo que irá contribuir pr umentr o vlor de SQRE e de QMRE. Aumentr QMRE signific, no teste os efeitos do fctor, diminuir o vlor clculdo d esttístic F, fstndo- d região crític. Assim, num ANOVA heterogeneidde não controld ns uniddes experimentis contribui pr esconder presenç de eventuis efeitos do fctor. num Regressão Liner heterogeneidde não controld ns uniddes experimentis contribui pr piorr qulidde de justmento do modelo, diminuindo o seu Coeficiente de Determinção. J. Cdim (ISA) Esttístic e Delinemento 2011-12 323 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 324 / 424 Controlr heterogeneidde Crir fctores pr controlr vribilidde N prátic, é frequentemente impossível tornr s uniddes experimentis totlmente homogénes. A nturl vribilidde de plntes, nimis, terrenos, locliddes geográfics, céluls, etc. signific que em muits situções existirá vribilidde não controlável entre uniddes experimentis. Algum protecção contr efeitos não controldos result dos princípios de: repetição; csulizção. Mesmo que sej possível encontrr uniddes experimentis homogénes, isso pode ter um efeito indesejável: restringir vlidde dos resultdos o tipo de uniddes experimentis com s crcterístics utilizds n experiênci. Cso se sib que existe um fctor de vribilidde importnte ns uniddes experimentis, melhor form de controlr os seus efeitos consiste em contemplr existênci desse fctor de vribilidde no delinemento e no modelo, de form filtrr os seus efeitos. Deve-se ssocir níveis do fctor às uniddes experimentis de form letóri (csulizd). J. Cdim (ISA) Esttístic e Delinemento 2011-12 325 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 326 / 424

Um exemplo Pretende-se nlisr o rendimento de 5 diferentes vrieddes de trigo. Os rendimentos são tmbém fectdos pelos tipo de solos usdos. Nem sempre é possível ter terrenos homogéneos num experiênci. Mesmo que sej possível, pode não ser desejável, por se limitr vlidde dos resultdos um único tipo de solos. Admit-se que existem terrenos com qutro diferentes tipos de solos. Cd terreno pode ser dividido em cinco prcels viáveis pr o trigo. Em vez de reprtir letorimente s 5 vrieddes pels 20 prcels, é preferível forçr cd tipo de terreno conter um prcel com cd vriedde. Apens dentro dos terrenos hverá csulizção. Num delinemento experimentl deste tipo, os terrenos designm-se blocos csulizdos. Um exemplo (cont.) A situção descrit no cetto nterior é seguinte: Bloco 1 (Solo 1) Vr.1 Vr.3 Vr.4 Vr.5 Vr.2 Bloco 2 (Solo 2) Vr.4 Vr.3 Vr.5 Vr.1 Vr.2 Bloco 3 (Solo 3) Vr.2 Vr.4 Vr.1 Vr.3 Vr.5 Bloco 4 (Solo 4) Vr.5 Vr.2 Vr.4 Vr.1 Vr.3 Houve um restrição à csulizção totl: dentro de cd bloco há csulizção, ms obrig-se cd bloco ter um prcel ssocid cd nível do fctor vriedde. J. Cdim (ISA) Esttístic e Delinemento 2011-12 327 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 328 / 424 Delinementos fctoriis dois fctores O delinemento gor exemplificdo é um cso prticulr de um delinemento fctoril dois fctores, sendo um dos fctores vriedde de trigo e outr o tipo de solos. A existênci de mis do que um fctor pode resultr de: tenttiv de controlr vribilidde experimentl; pretender-se relmente estudr eventuis efeitos de mis do que um fctor sobre vriável respost. Historicmente, primeir situção ficou ssocid à designção blocos, e n segund fl-se pens em fctores. Ms são situções nálogs. Modelo ANOVA 2 Fctores (sem intercção) A um delinemento com 2 fctores pode ser ssocido um modelo ANOVA que prevê existênci de dois diferentes tipos de efeitos: os efeitos ssocidos os níveis de cd um dos fctores. Admit-se existênci de: Um vriável respost Y, d qul se efectum n observções. Um Fctor A, com níveis. Um Fctor B, com b níveis. Um delinemento fctoril é um delinemento em que há observções pr tods s possíveis combinções de níveis de cd fctor. J. Cdim (ISA) Esttístic e Delinemento 2011-12 329 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 330 / 424 Modelo ANOVA 2 Fctores (sem intercção) Modelo ANOVA 2 Fctores (sem intercção) Notção: Cd observção d vriável respost será gor identificd com três índices, Y ijk, onde: i indic o nível i do Fctor A. j indic o nível j do Fctor B. k indic repetição k no nível i do fctor A e nível j do Fctor B. Cd situção experimentl é dd pelo cruzmento dum nível dum Fctor com um nível do outro Fctor, cruzmento chmdo célul. O número de observções n célul (i,j) é representdo por n ij. Tem-se b j=1 n ij = n. Se o número de observções fôr igul em tods s céluls, n ij = n c, i,j, estmos pernte um delinemento equilibrdo. J. Cdim (ISA) Esttístic e Delinemento 2011-12 331 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 332 / 424

A modelção de Y A modelção de Y (cont.) Vmos dmitir que o vlor esperdo de cd observção depende pens dos níveis de cd Fctor, sendo d form: E[Y ijk ] = µ ij = µ + α i + β j. O prâmetro µ é comum tods s observções. Cd prâmetro α i funcion como um créscimo que pode diferir entre níveis do Fctor A, e é designdo o efeito do nível i do fctor A. Cd prâmetro β j funcion como um créscimo que pode diferir entre níveis do Fctor B, e é designdo o efeito do nível j do fctor B. Admite-se que vrição de Y ijk em torno do seu vlor médio é letóri: Y ijk = µ + α i + β j + ε ijk, com E[ε ijk ] = 0. Tmbém neste cso, será necessário introduzir lgum restrição os prâmetros, não podendo estimr-se prâmetros α i e β j pr todos os níveis de cd Fctor. J. Cdim (ISA) Esttístic e Delinemento 2011-12 333 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 334 / 424 A equção-bse em notção vectoril A equção de bse do modelo ANOVA dois fctores (sem intercção) tmbém pode ser escrit n form vectoril. Sej Y o vector n-dimensionl com totlidde ds observções d vriável respost. 1 n o vector de n uns. I Ai vriável indictriz de pertenç o nível i do Fctor A. I Bj vriável indictriz de pertenç o nível j do Fctor B. ε o vector dos n erros letórios. A equção-bse em notção vectoril: primeir tenttiv Se se dmitem efeitos pr todos os níveis de mbos os fctores, temos equção-bse: Y = µ1 n + α 1 I A1 + α 2 I A2 +... + α I A + β 1 I B1 + β 2 I B2 +... + β b I Bb +ε A mtriz X definid com bse neste modelo teri dependêncis lineres por dus diferentes rzões: som ds indictrizes do Fctor A dri colun dos uns, 1 n ; som ds indictrizes do Fctor B dri colun dos uns, 1 n. J. Cdim (ISA) Esttístic e Delinemento 2011-12 335 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 336 / 424 A mtriz X n primeiro tenttiv X = 1 1 0... 0 1 0... 0 1 1 0... 0 1 0... 0 1 1 0... 0 0 1... 0..................... 1 1 0... 0 0 0... 1 1 1 0... 0 0 0... 1 1 0 1... 0 1 0... 0 1 0 1... 0 1 0... 0 1 0 1... 0 1 0... 0..................... 1 0 1... 0 0 0... 1 1 0 1... 0 0 0... 1..................... 1 0 0... 1 1 0... 0..................... 1 0 0... 1 0 0... 1 1 0 0... 1 0 0... 1 1n I A1 I A2... I A I B1 I B2... I Bb Equção-bse em notção vectoril: 2. tenttiv Dorvnte, dmitimos que form excluíds do modelo s prcels ssocids o primeiro nível de cd Fctor, isto é: α 1 = 0 e β 1 = 0, o que corresponde excluir s coluns I A1 e I B1 d mtriz X. A equção-bse do modelo ANOVA 2 Fctores, sem intercção, fic: Y = µ1 n + α 2 I A2 +... + α I A + β 2 I B2 +... + β b I Bb + ε Nem mesmo exclusão d colun 1 n resolve o problem. J. Cdim (ISA) Esttístic e Delinemento 2011-12 337 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 338 / 424

A mtriz do delinemento n ANOVA 2 Fctores (sem intercção) X = 1 0... 0 0... 0 1 0... 0 0... 0 1 0... 0 1... 0................. 1 0... 0 0... 1 1 0... 0 0... 1 1 1... 0 0... 0 1 1... 0 0... 0 1 1... 0 0... 0................. 1 1... 0 0... 1 1 1... 0 0... 1................. 1 0... 1 0... 0................. 1 0... 1 0... 1 1 0... 1 0... 1 1n I A2... I A I B2... I Bb A nturez do prâmetro Um observção de Y efectud n célul (1, 1), correspondente o cruzmento do primeiro nível de cd fctor será d form: Y 11k = µ + ε 11k = E[Y 11k ] = µ O prâmetro µ corresponde o vlor esperdo d vriável respost Y n célul cujs indictrizes form excluíds d mtriz do delinemento. Será dorvnte chmdo µ 11. J. Cdim (ISA) Esttístic e Delinemento 2011-12 339 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 340 / 424 A nturez dos prâmetros α i A nturez dos prâmetros β j Um observção de Y efectud n célul (i,1), com i > 1, correspondente o cruzmento dum nível do fctor A diferente do primeiro, com o primeiro nível do Fctor B será d form: Y i1k = µ 11 + α i + ε i1k = µ i1 = E[Y i1k ] = µ 11 + α i Um observção de Y efectud n célul (1,j), com j > 1, correspondente o cruzmento do primeiro nível do fctor A com um nível do Fctor B diferente do primeiro será d form: Y 1jk = µ 11 + β j + ε 1jk = µ 1j = E[Y 1jk ] = µ 11 + β j O prâmetro α i = µ i1 µ 11 corresponde o créscimo no vlor esperdo d vriável respost Y ssocido observções do nível i > 1 do Fctor A (reltivmente às observções do primeiro nível do Fctor A). Design-se o efeito do nível i do fctor A. O prâmetro β j = µ 1j µ 11 corresponde o créscimo no vlor esperdo d vriável respost Y ssocido observções do nível j do Fctor B (reltivmente às observções do primeiro nível do Fctor B). Design-se o efeito do nível j do fctor B. J. Cdim (ISA) Esttístic e Delinemento 2011-12 341 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 342 / 424 Observções de Y no cso gerl O modelo ANOVA dois fctores, sem intercção Juntndo os pressupostos necessários à inferênci, Ests interpretções dos prâmetros α i e β j confirmm-se pr observções de Y efectuds num célul genéric (i, j), com i, j > 1, correspondente o cruzmento de níveis diferentes do primeiro, quer no Fctor A, quer no Fctor B. Esss observções serão d form: Y ijk = µ 11 + α i + β j + ε ijk = E[Y ijk ] = µ 11 + α i + β j. Os vlores esperdos de Y são, neste cso, crescidos em relção o vlor esperdo dum observção n célul (1, 1), quer pel prcel α i, quer pel prcel β j. Modelo ANOVA dois fctores, sem intercção Existem n observções, Y ijk, n ij ds quis ssocids à célul (i,j) (i = 1,...,; j = 1,...,b). Tem-se: 1 Y ijk = µ 11 +α i +β j +ε ijk,,...,; j=1,...,b; k=1,...,n ij (α 1 = 0;β 1 = 0). 2 ε ijk N (0, σ 2 ), i,j,k 3 {ε ijk } i,j,k v..s independentes. O modelo tem + b 1 prâmetros desconhecidos: o prâmetro µ 11 ; os 1 créscimos α i (i > 1); e os b 1 créscimos β j (j > 1). J. Cdim (ISA) Esttístic e Delinemento 2011-12 343 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 344 / 424

Testndo existênci de efeitos Um teste globl de justmento do modelo não distinguiri entre os efeitos do Fctor A e os efeitos do Fctor B. Mis útil será testr existênci dos efeitos de cd fctor seprdmente. Seri útil dispôr de testes pr s hipóteses: H 0 : α i = 0, H 0 : β j = 0, i = 2,..., ; e j = 2,...,b. Teste os efeitos do Fctor B O modelo do Acetto ANOVA 2 Fctores, sem intercção (Acetto 344) tem equção de bse, em notção vectoril, Y = µ1 n + α 2 I A2 +... + α I A + β 2 I B2 +... + β b I Bb + ε O fcto de ser um Modelo Liner permite plicr teori já conhecid pr este tipo de modelos, pr testr s hipóteses H 0 : β j = 0, j = 2,...,b vs. H 1 : j tl que β j 0. Trt-se dum teste F prcil comprndo o modelo (Modelo M A+B ) Y ijk = µ 11 + α i + β j + ε ijk, com o submodelo de equção de bse (Modelo M A ) Y ijk = µ 11 + α i + ε ijk, que é um modelo ANOVA 1 Fctor (fctor A). J. Cdim (ISA) Esttístic e Delinemento 2011-12 345 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 346 / 424 A construção do teste os efeitos do Fctor B Sej o delinemento equilibrdo, ou não, podemos: construir s mtrizes X do delinemento pr os dois modelos (M A+B e M A ). Obter s respectivs estimtivs de prâmetros, ˆβ = (X t X) 1 X t Y, pr mtriz X correspondente cd modelo. Obter s respectivs Soms de Qudrdos Residuis. Efectur o teste F prcil indicdo, com esttístic de Teste proprid: (Efeitos Fctor B) F = =SQB { }} { SQRE A SQRE A+B b 1 SQRE A+B n (+b 1) J. Cdim (ISA) Esttístic e Delinemento 2011-12 347 / 424 O Teste F os efeitos do fctor A Sendo válido o Modelo de ANOVA dois fctores, sem intercção, e definindo QMA = SQA 1, temos: Teste F os efeitos do fctor A Hipóteses: H 0 : α i = 0 i=2,..., vs. H 1 : i=2,.., t.q. α i 0. [A NÃO AFECTA Y ] vs. [A AFECTA Y ] Esttístic do Teste: F = QMA QMRE F ( 1,n (+b 1)) se H 0. Nível de significânci do teste: α Região Crític (Região de Rejeição): Unilterl direit Testndo os efeitos principis de cd Fctor Consideremos tmbém um teste os efeitos do Fctor A. Definindo: SQA como Som de Qudrdos do Fctor no Modelo M A ; e SQB como no cetto nterior, temos: SQB = SQRE A SQRE A+B SQA = SQF A = SQT SQRE A Somndo ests SQs SQRE A+B, obtém-se: SQRE A+B + } SQA {{ + SQB } = SQT =SQF A+B que é um decomposição de SQT. Usmos s Soms de Qudrdos de cd fctor pr definir os numerdores ds esttístics dos dois testes, e o Qudrdo Médio Residul do modelo A + B pr definir o denomindor ds dus esttístics. J. Cdim (ISA) Esttístic e Delinemento 2011-12 348 / 424 O Teste F os efeitos do fctor B Sendo válido o Modelo de ANOVA dois fctores, sem intercção definindo QMB = SQB b 1, temos: Teste F os efeitos do fctor B Hipóteses: H 0 : β j = 0 j=2,...,b vs. H 1 : j=2,..,b t.q. β j 0. [B NÃO AFECTA Y ] vs. [B AFECTA Y ] Esttístic do Teste: F = QMB QMRE F (b 1,n (+b 1)) se H 0. Nível de significânci do teste: α Região Crític (Região de Rejeição): Unilterl direit Rejeitr H 0 se F clc > f α( 1,n (+b 1)) df(x, 4, 16) 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 Rejeitr H 0 se F clc > f α(b 1,n (+b 1)) df(x, 4, 16) 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0 1 2 3 4 x 0 1 2 3 4 x J. Cdim (ISA) Esttístic e Delinemento 2011-12 349 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 350 / 424

Fórmuls pr delinementos equilibrdos Sejm: Y i médi mostrl ds b n c observções do nível i do Fctor A, Y i = 1 b n c b n c Y ijk j=1 k=1 Y j médi mostrl ds n c observções do nível j do Y Fctor B, Y j = 1 n c n c Y ijk k=1 médi mostrl d totlidde ds n = b n c observções, Y = 1 n b j=1 n c k=1 Se o delinemento é equilibrdo, ou sej, n ij ˆµ 11 = Y 1 + Y 1 Y Y ijk. = n c, i,j, tem-se: Fórmuls pr delinementos equilibrdos (cont.) Tendo em cont ests fórmuls e equção bse do Modelo, tem-se que os vlores justdos de cd observção dependem pens ds médis dos respectivos níveis em cd fctor e d médi gerl de tods s observções: Ŷ ijk = ˆµ 11 + ˆα i + ˆβ j = Y i + Y j Y, i,j,k Consideremos gor s fórmuls ds três Soms de Qudrdos no Modelo M A+B. ˆα i = Y i Y 1 ˆβ j = Y j Y 1 J. Cdim (ISA) Esttístic e Delinemento 2011-12 351 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 352 / 424 As Soms de Qudrdos (delinemento equilibrdo) A Som de Qudrdos dos Fctores É preciso somr vrindo os 3 índices: SQT = SQF = SQRE = b n c j=1 k=1 b n c j=1 k=1 b n c j=1 k=1 ( Yijk Y ) 2 (Ŷijk Y ) 2 ( ) 2 Y ijk Ŷijk No Modelo M A+B, Som de Qudrdos ssocid os Fctores (SQF A+B ) tem, pr delinementos equilibrdos, seguinte decomposição: SQF A+B = = b n c j=1 k=1 b j=1 = b n c [ (Y i + Y j Y ) Y ] 2 n c [(Y i Y ) + (Y j Y ) ] 2 (Y i Y ) 2 } {{ } =SQA + n c b j=1 (Y j Y ) 2 } {{ } =SQB J. Cdim (ISA) Esttístic e Delinemento 2011-12 353 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 354 / 424 SQA e SQB em delinementos equilibrdos A Som de Qudrdos ssocid o fctor A obtid no cetto 354 e usdo no teste os efeitos do Fctor A é Som de Qudrdos do Fctor (SQF A ) do Modelo M A, pens com o Fctor A. Nesse modelo, os vlores justdos são Ŷijk = Y i.. (cetto 273), logo: O qudro-resumo d ANOVA 2 Fctores (sem intercção; delinemento equilibrdo) Fonte g.l. SQ QM f clc SQF A = b n c j=1 k=1 (Ŷijk Y ) 2 = b n c (Y i Y ) 2 = SQA. D mesm form, num delinemento equilibrdo, SQB é Som de Qudrdos do Fctor (SQF B ) do Modelo M B, pens com o Fctor B: Nesse modelo, os vlores justdos são Ŷijk = Y.j. (cetto 273), logo: Fctor A 1 SQA = b n c (y i y ) 2 QMA = SQA 1 b ( 2 Fctor B b 1 SQB = n c y j y ) QMB = SQB b 1 j=1 Resíduos n (+b 1) SQRE= b nc ) 2 QMRE= SQRE (yijk ŷijk n (+b 1) j=1 k=1 QMA QMRE QMB QMRE SQF B = b n c j=1 k=1 (Ŷijk Y ) 2 = n c b j=1 (Y j Y ) 2 = SQB. Totl n 1 SQT = (n 1)s 2 y J. Cdim (ISA) Esttístic e Delinemento 2011-12 355 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 356 / 424

ANOVA dois Fctores, sem intercção no Pr efectur um ANOVA dois Fctores (sem intercção) no, convém orgnizr os ddos num dt.frme com três coluns: 1 um pr os vlores (numéricos) d vriável respost; 2 outr pr o fctor A (com indicção dos seus níveis); 3 outr pr o fctor B (com indicção dos seus níveis). As fórmuls utilizds no pr indicr um ANOVA dois Fctores, sem intercção, são semelhntes às usds n Regressão Liner com dois preditores, devendo o nome dos dois fctores ser seprdo pelo símbolo +: y fa + fb Um exemplo O rendimento de cinco vrieddes de vei (mnchuri, svnsot,velvet, trebi e petlnd) foi registdo em seis diferentes locliddes 1. Em cd loclidde foi semed um e um só prcel com cd vriedde (hvendo csulizção em cd loclidde). > summry(ov(y1 ~ Vr + Loc, dt=immer)) Df Sum Sq Men Sq F vlue Pr(>F) Vr 4 2756.6 689.2 4.2309 0.01214 * Loc 5 17829.8 3566.0 21.8923 1.751e-07 *** Residuls 20 3257.7 162.9 Há lgum indicção de efeitos significtivos entre vrieddes, e muit entre locliddes. E num modelo sem efeito de locliddes (blocos)? > summry(ov(y1 ~ Vr, dt=immer)) Df Sum Sq Men Sq F vlue Pr(>F) Vr 4 2756.6 689.2 0.817 0.5264 Residuls 25 21087.6 843.5 1 Ddos em Immer, Hyes e LeRoy Powers, Sttisticl dpttion of brley vrietl dpttion, Journl of the Americn J. Cdim (ISA) Esttístic e Delinemento 2011-12 357 / 424 Society for Agronomy, 26, 403-419, 1934. J. Cdim (ISA) Esttístic e Delinemento 2011-12 358 / 424 Delinementos não equilibrdos Se um delinemento não é equilibrdo, s fórmuls do cetto 351, e s que dels decorrem, não se plicm. É possível mnter um decomposição do tipo SQT = SQA + SQB + SQRE e justificr testes nálogos os considerdos nos cettos (349) e (350), ms de dus forms lterntivs e diferentes: Tomr SQA = SQF A e SQB = SQRE A SQRE A+B ( SQF B ) Tomr SQB = SQF B e SQA = SQRE B SQRE A+B ( SQF A ) Modelos com intercção Um modelo ANOVA 2 Fctores, sem intercção, foi considerdo pr um delinemento fctoril, isto é, em que se cruzm todos os níveis de um e outro fctor. Um modelo sem efeitos de intercção é utilizdo sobretudo qundo existe um únic observção em cd célul, i.e., n ij = 1, i,j. N presenç de repetições ns céluls, form mis nturl de modelr um delinemento com dois fctores é de prever existênci de um terceiro tipo de efeitos: os efeitos de intercção. A idei é incorporr n equção bse do modelo pr Y ijk um prcel (αβ) ij que permit que em cd célul hj um efeito específico d combinção dos níveis i do Fctor A e j do Fctor B: Y ijk = µ + α i + β j + (αβ) ij + ε ijk. J. Cdim (ISA) Esttístic e Delinemento 2011-12 359 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 360 / 424 Os vlores esperdos de Y ijk Vmos dmitir s seguintes restrições os prâmetros: Tem-se: α 1 = 0 ; β 1 = 0 ; (αβ) 1j = 0, j ; (αβ) i1 = 0, i. Pr primeir célul (i = j = 1): µ 11 = E[Y 11k ] = µ. Ns restntes céluls (1,j) do primeiro nível do Fctor A: µ 1j = E[Y 1jk ] = µ 11 + β j. Ns restntes céluls (i,1) do primeiro nível do Fctor B: µ i1 = E[Y i1k ] = µ 11 + α i. Ns céluls genérics (i,j), com i > 1 e j > 1, µ ij = E[Y ijk ] = µ 11 + α i + β j + (αβ) ij. Os efeitos α i e β j designm-se efeitos principis de cd Fctor. Vriáveis indictrizes de célul A versão vectoril do modelo com intercção ssoci os novos efeitos (αβ) ij vriáveis indictrizes de cd célul, excluíndo, mis um vez, s céluls ssocids o primeiro nível de qulquer fctor. A equção-bse do modelo ANOVA 2 Fctores, com intercção, é: Y = µ1 n + α 2 I A2 +... + α I A + β 2 I B2 +... + β b I Bb + + (αβ ) 22 I A2 :B 2 + (αβ ) 23 I A2 :B 3 +... + (αβ ) b I A:B b + ε onde I Ai :B j represent vriável indictriz d célul correspondente o nível i do Fctor A e nível j do fctor B. Existem neste modelo b prâmetros. Cd indictriz de célul é d form I Ai :B j = I Ai I Bj, com o operdor indicr um multiplicção, elemento elemento, entre dois vectores. J. Cdim (ISA) Esttístic e Delinemento 2011-12 361 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 362 / 424

Modelo ANOVA 2 fctores, com intercção (cont.) O justmento deste modelo fz-se de form nálog o justmento de modelos nteriores. A mtriz X do delinemento é gor constituíd por b coluns: um colun de uns, 1 n, ssocid o prâmetro µ 11. 1 coluns de indictrizes de nível do fctor A, I Ai, (i > 1), ssocids os prâmetros α i. b 1 coluns de indictrizes de nível do fctor B, I Bj, (j > 1), ssocids os prâmetros β j. ( 1)(b 1) coluns de indictrizes de célul, I Ai :B j, (i,j > 1), ssocids os efeitos de intercção (αβ) ij. Os três testes ANOVA Neste delinemento, desejmos fzer um teste à existênci de cd um dos três tipos de efeitos: H 0 : (αβ) ij = 0, i = 2,...,, j = 2,...,b ; H 0 : α i = 0, i = 2,..., ; e H 0 : β j = 0, j = 2,...,b. As esttístics de teste pr cd um destes testes obtêm-se prtir d decomposição d Som de Qudrdos Totl em prcels convenientes. Como em modelos nteriores, Ŷ = HY, sendo H mtriz que project ortogonlmente sobre o espço C (X) gerdo pels coluns dest mtriz X. E tmbém, SQRE A B = Y Ŷ 2 = n ij b j=1 k=1 (Y ijk Ŷijk) 2. J. Cdim (ISA) Esttístic e Delinemento 2011-12 363 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 364 / 424 O modelo ANOVA dois fctores, com intercção Juntndo os pressupostos necessários à inferênci, Modelo ANOVA dois fctores, com intercção (Modelo M A B ) Existem n observções, Y ijk, n ij ds quis ssocids à célul (i,j) (i = 1,...,; j = 1,...,b). Tem-se: 1 Y ijk = µ 11 + α i + β j + (αβ) ij + ε ijk,,..., ; j=1,...,b ; k=1,...,n ij (α 1 =0 ; β 1 =0 ; (αβ) 1j =0, j; (αβ) i1 =0, i). 2 ε ijk N (0, σ 2 ) 3 {ε ijk } i,j,k v..s independentes. O modelo tem b prâmetros desconhecidos: µ 11 ; os 1 créscimos α i (i > 1); os b 1 créscimos β j e os ( 1)(b 1) efeitos de intercção (αβ) ij, pr i > 1, j > 1. Testndo efeitos de intercção Pr testr existênci de efeitos de intercção, H 0 : (αβ) ij = 0, i = 2,...,, j = 2,...,b, pode efectur-se um teste F prcil comprndo o modelo (Modelo M A B ) Y ijk = µ 11 + α i + β j + (αβ) ij + ε ijk, com o submodelo (Modelo M A+B ) Y ijk = µ 11 + α i + β j + ε ijk, Design-se Som de Qudrdos ssocid à intercção à diferenç SQAB = SQRE A+B SQRE A B J. Cdim (ISA) Esttístic e Delinemento 2011-12 365 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 366 / 424 Testndo os efeitos principis de cd Fctor A decomposição de SQT Pr testr os efeitos principis do Fctor B, H 0 : β j = 0, j = 2,...,b, pode prtir-se dos modelos (Modelo M A+B ) Y ijk = µ 11 + α i + β j + ε ijk (Modelo M A ) Y ijk = µ 11 + α i + ε ijk, Definimos : SQAB = SQRE A+B SQRE A B SQB = SQRE A SQRE A+B SQA = SQF A e tomr Somndo ests Soms de Qudrdos SQRE A B, obtém-se: SQB = SQRE A SQRE A+B SQA = SQF A SQRE A B + SQAB } + SQA {{ + SQB } = SQT =SQF A B Est decomposição de SQT ger s quntiddes ns quis se bseim s esttístics dos três testes ssocidos o Modelo M A B. J. Cdim (ISA) Esttístic e Delinemento 2011-12 367 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 368 / 424

O qudro-resumo Com bse n decomposição do cetto 368 podemos construir o qudro resumo d ANOVA 2 Fctores, com intercção. Fonte g.l. SQ QM f clc Fctor A 1 SQA QMA = SQA 1 QMA QMRE Fctor B b 1 SQB QMB = SQB b 1 Intercção ( 1)(b 1) SQAB QMAB = SQAB ( 1)(b 1) QMB QMRE QMAB QMRE Resíduos n b SQRE QMRE = SQRE n b Totl n 1 SQT = (n 1)sy 2 O Teste F os efeitos de intercção Sendo válido o Modelo ANOVA dois fctores, com intercção: Teste F os efeitos de intercção Hipóteses: H 0 : (αβ) ij = 0 i,j vs. H 1 : i,j t.q. (αβ) ij 0. [NÃO HÁ INTERACÇÃO] vs. [HÁ INTERACÇÃO] Esttístic do Teste: F = QMAB QMRE F (( 1)(b 1),n b) se H 0. Nível de significânci do teste: α Região Crític (Região de Rejeição): Unilterl direit Rejeitr H 0 se F clc > f α(( 1)(b 1),n b ) df(x, 4, 16) 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0 1 2 3 4 x J. Cdim (ISA) Esttístic e Delinemento 2011-12 369 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 370 / 424 O Teste F os efeitos principis do fctor A Sendo válido o Modelo ANOVA dois fctores, com intercção (delinemento equilibrdo) tem-se então: Teste F os efeitos principis do fctor A Hipóteses: H 0 : α i = 0 i=2,..., vs. H 1 : i=2,.., t.q. α i 0. [ EFEITOS DE A] vs. [ EFEITOS DE A] Esttístic do Teste: F = QMA QMRE F ( 1,n b) se H 0. Nível de significânci do teste: α Região Crític (Região de Rejeição): Unilterl direit O Teste F os efeitos principis do fctor B Sendo válido o Modelo ANOVA dois fctores, com intercção (delinemento equilibrdo) tem-se então: Teste F os efeitos principis do fctor B Hipóteses: H 0 : β j = 0 j=2,...,b vs. H 1 : j=2,..,b t.q. β j 0. [ EFEITOS DE B] vs. [ EFEITOS DE B] Esttístic do Teste: F = QMB QMRE F (b 1,n b) se H 0. Nível de significânci do teste: α Região Crític (Região de Rejeição): Unilterl direit Rejeitr H 0 se F clc > f α( 1,n b) df(x, 4, 16) 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 Rejeitr H 0 se F clc > f α(b 1,n b) df(x, 4, 16) 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0 1 2 3 4 x 0 1 2 3 4 x J. Cdim (ISA) Esttístic e Delinemento 2011-12 371 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 372 / 424 ANOVA dois Fctores, com intercção no Estimção d intercção necessit de repetições Pr efectur um ANOVA dois Fctor, com intercção, no, convém orgnizr os ddos num dt.frme com três coluns: 1 um pr os vlores (numéricos) d vriável respost; 2 outr pr o fctor A (com indicção dos seus níveis); 3 outr pr o fctor B (com indicção dos seus níveis). As fórmuls utilizds no pr indicr um ANOVA dois Fctores, com intercção, recorrem o símbolo : y fa fb Pr se poder estudr efeitos de intercção, é necessário que hj repetições ns céluls. Os grus de liberdde do SQRE são n b. Se houver um únic observção em cd célul, tem-se n = b, ou sej, tntos prâmetros qunts s observções existentes. Num delinemento com um únic observção por célul é obrigtório optr por um modelo sem intercção. Hvendo repetições, é mis nturl considerr um modelo com intercção. J. Cdim (ISA) Esttístic e Delinemento 2011-12 373 / 424 J. Cdim (ISA) Esttístic e Delinemento 2011-12 374 / 424