5.3 Experimentos fatoriais a dois fatores. Ambos os fatores são supostos fixos e os efeitos de tratamento são definidos como desvios da média tal que

5. Experimentos Fatoriais 5.3 Experimentos fatoriais a dois fatores. Modelo de Efeitos Y ijk = µ+τ i +β j +(τβ) ij +ɛ ijk, i = 1, 2,..., a j = 1, 2,..., b k = 1, 2,..., n Ambos os fatores são supostos fixos e os efeitos de tratamento são definidos como desvios da média tal que a i=1 τ i = 0, b j=1 β j = 0, a i=1 (τβ) ij = 0 e b j=1 (τβ) ij = 0. Como são n replicações para cada combinação dos níveis de tratamento, tem-se N = abn observações. 1

Poderíamos também usar modelos de regressão que são particularmente úteis, quando os fatores são quantitativos. Ambos os fatores são de interesse tal que estamos interessados em testar H 0 : τ 1 = τ 2 =... = τ a = 0 versus pelo menos um deles é não-nulo; H 0 : β 1 = β 2 =... = β b = 0 versus pelo menos um deles é não-nulo e H 0 : (τβ) ij = 0, deles é não-nulo. i, j versus pelo menos um 2

Análise Estatística do Experimento Fatorial a b: dois fatores com a e b níveis, respectivamente. Agora, a soma de quadrados total, SQ T ot = em a b n i=1j=1k=1 (Y ijk Ȳ... ) 2, é decomposta SQ A }{{} a 1 + SQ B }{{} b 1 + SQ AB }{{} (a 1)(b 1) + SQ Res }{{} ab(n 1) 3

SQ A = a b n i=1 j=1 k=1 (ȳ i.. ȳ... ) 2 SQ B = a b n i=1 j=1 k=1 (ȳ.j. ȳ... ) 2 SQ AB = a b n i=1 j=1 k=1 (ȳ ij. ȳ i.. ȳ.j. + ȳ... ) 2 SQ Res = a b n i=1 j=1 k=1 (y ijk ȳ ij. ) 2 4

Supondo o modelo EF a dois fatores, podemos verificar que E[QM A ] = σ 2 + bn a 1 a τi 2 i=1 E[QM B ] = σ 2 + an b 1 b βj 2 j=1 E[QM AB ] = σ 2 + n (a 1)(b 1) a b i=1 j=1 (τβ) 2 ij e E[QM Res ] = σ 2 5

Fórmulas de cálculo SQ T ot = a b n i=1j=1k=1 yijk 2 y2... abn SQ A = 1 SQ B = 1 a bn i=1 b an j=1 yi.. 2 y2... abn y.j. 2 y2... abn SQ SubT otals = 1 n a b i=1j=1 yij. 2 y2... abn Esta soma também contém SQ A e SQ B. Desse modo, SQ AB = SQ SubT otals SQ A SQ B. SQ Res = SQ T ot SQ A SQ B SQ AB = SQ T ot SQ SubT otals 7

Comparações Múltiplas Quando a ANOVA indica que médias das linhas ou colunas são diferentes, poderá ser de interesse fazer comparações entre as médias de linhas ou colunas para descobrir diferenças específicas. Os métodos apresentados no capítulo 3 podem ser usados aqui com as devidas adaptações. Veremos a seguir os resultados obtidos com a aplicação do teste de Tukey ao exemplo dos tempos de vida das baterias. Como são 3 níveis de temperatura e três tipos de material, temos ao todo 42 intervalos, a saber, 3 para as comparações de médias de temperatura, 3 para as comparações de média de material e 36 para as comparações de médias de interação temperatura:material. 8

Tukey multiple comparisons of means 95% familywise confidence level temp. diferença lwr upr p adj 70-15 -37.25-63.55-10.95 0.0044 125-15 -80.7-106.97-54.36 0.0000001 125-70 -43.42-69.72-17.11 0.00098 material diferença lwr upr p adj ii-i 25.17-1.14 51.47 0.0628 iii-i 41.92 15.61 68.22 0.0014 iii-ii 16.75-9.55 43.05 0.2718 9

temp:mat diferença lwr upr p adj 70:i-15:i -77.50-139.32-15.68 0.0065 125:i-15:i -77.25-139.07-15.43 0.0067 15:ii-15:i 21.00-40.82 82.82 0.9616 70:ii-15:i -15.00-76.82 46.82 0.9953 125:ii-15:i -85.25-147.07-23.43 0.0022 15:iii-15:i 9.25-52.57 71.07 0.9998 70:iii-15:i 11.00-50.82 72.82 0.9995 125:iii-15:i -49.25-111.07 12.57 0.2017 125:i-70:i 0.25-61.57 62.07 1.0000 15:ii-70:i 98.50 36.68 160.32 0.0003 70:ii-70:i 62.50 0.68 124.32 0.0460 125:ii-70:i -7.75-69.57 54.07 0.9999 15:iii-70:i 86.75 24.93 148.57 0.0018 70:iii-70:i 88.50 26.68 150.32 0.0014 125:iii-70:i 28.25-33.57 90.07 0.8282 15:ii-125:i 98.25 36.43 160.07 0.0004 70:ii-125:i 62.25 0.43 124.07 0.0475 125:ii-125:i -8.00-69.82 53.82 0.9999 15:iii-125:i 86.50 24.68 148.32 0.0019 70:iii-125:i 88.25 26.43 150.07 0.0015 125:iii-125:i 28.00-33.82 89.82 0.8347 70:ii-15:ii -36.00-97.82 25.82 0.5819 125:ii-15:ii -106.25-168.07-44.43 0.0001 15:iii-15:ii -11.75-73.57 50.07 0.9991 70:iii-15:ii -10.00-71.82 51.82 0.9997 125:iii-15:ii -70.25-132.07-8.43 0.0172 125:ii-70:ii -70.25-132.07-8.43 0.0172 15:iii-70:ii 24.25-37.57 86.07 0.9165 70:iii-70:ii 26.00-35.82 87.82 0.8823 125:iii-70:ii -34.25-96.07 27.57 0.6420 15:iii-125:ii 94.50 32.68 156.32 0.0006 70:iii-125:ii 96.25 34.43 158.07 0.0005 125:iii-125:ii 36.00-25.82 97.82 0.5819 70:iii-15:iii 1.75-60.07 63.57 1.0000 125:iii-15:iii -58.50-120.32 3.32 0.0743 125:iii-70:iii -60.25-122.07 1.57 0.0604 10

Quando a interação é significante, comparações entre médias dos níveis de um fator podem ser obscurecidas pelo fator de interação. Uma abordagem para essa situação é fixar o fator B num nível específico e aplicar o teste de Tukey para as médias do fator A e viceversa. Suponha neste exemplo que desejamos detectar as diferenças entre médias devidas ao material. Como a interação é significante, fazemos uma comparação em apenas um nível de temperatura, por exemplo 70 F. 3vs1: 88,50> T 0.05 =45,47 3vs2: 26,0< T 0.05 =45,47 2vs1: 62,50> T 0.05 =45,47 11

Se a interação é significante, pode-se comparar todas as médias de celas da tabela de dados para determinar qual delas difere significativamente. Neste exemplo, analisar as diferenças entre médias das celas levaria a 36 comparações. Observe que elas incluem a interação bem como os efeito principais. 12

Verificação do Modelo Antes de adotar as conclusões da ANOVA, a adequação do modelo ajustado deve ser verificada. Podemos usar, por exemplo, análise de resíduos para tal verificação. e ijk = y ijk ŷ ijk e como os valores ajustados são dados por ȳ ij., segue que e ijk = y ijk ȳ ij. Os gráficos dos resíduos resultantes do exemplo das baterias são apresentados a seguir. 13

É possível ver nos gráficos de resíduos versus temperatura e resíduos versus material um ligeiro desvio da suposição de variâncias iguais. A combinação 15 F e material i apresentando maior variância que as demais. Analisando os valores dos resíduos, percebe-se que as celas 15F e material i contêm os dois maiores valores. Estes dois valores são primordialmente responsáveis pelas desigualdades detectadas nas variâncias. Um re-exame dos dados não revelou qualquer problema do tipo erro no registro tal que as respostas foram validadas. É possível que esta particular combinação de tratamentos produza impactos mais instáveis do que as outras. O problema, no entanto, não é forte o suficiente para ter grande impacto na análise e conclusões. 16

Estimação dos Parâmetros do Modelo Os estimadores de mínimos quadrados dos parâmetros do modelo a dois fatores são dados por ˆµ = ȳ... ˆτ i = ȳ i.. ȳ..., i = 1, 2,..., a ˆβ j = ȳ.j. ȳ..., j = 1, 2,..., b ˆ (τβ) ij = ȳ ij. ȳ i.. ȳ.j. + ȳ..., { i = 1, 2,..., a j = 1, 2,..., b 18

Escolha do Tamanho Amostral As curvas características de operação no Apêndice podem ser usadas para auxiliar na determinação de um tamanho amostral apropriado (número de replicações n) para o EF a dois fatores. O valor apropriado para o parâmetro Φ 2 é mostrado na tabela a seguir. fator Φ 2 g.l. num. g.l. den. A bn i τ i 2/aσ2 a 1 ab(n 1) B an j β2 j /bσ2 b 1 ab(n 1) AB n i j (τβ)2 ij /[(a 1)(b 1) + 1]σ2 (a 1)(b 1) ab(n 1) 19

Uma forma efetiva de usar tais curvas é determinar o menor valor de Φ 2 correspondendo a uma diferença especificada entre quaisquer duas médias de tratamento. Por exemplo, se a diferença em quaisquer duas médias do fator linha é D, então o valor mínimo de Φ 2 será Φ 2 = nb 2aσ 2D2 Se a diferença em quaisquer duas médias do fator coluna é D, então o valor mínimo de Φ 2 será Φ 2 = na 2bσ 2D2 Finalmente, se a diferença em quaisquer duas médias do fator interação linha-coluna é D, então o valor mínimo de Φ 2 será Φ 2 = n 2[(a 1)(b 1) + 1]σ 2D2 20

Considere o exemplo das baterias. Suponha que antes de rodar o experimento, decide-se que H 0 deve ser rejeitada com probabilidade alta se a diferença na média de vida quando comparamos duas temperaturas é tão grande quanto 40. D = 40. Suponha σ = 25. Φ 2 = na 2σ 2 b D2 1, 28n. Faça α = 0, 05. Usando-se o chart V do Apêndice, tem-se n Φ 2 Φ ν 1 ν 2 β 2 2,56 1,60 2 9 0,45 3 3,84 1,96 2 18 0,18 4 5,12 2,36 2 27 0,06 Com n = 4, P r(rejeitarh 0 Φ 2 ) 0, 94. 21

Concluímos que 4 replicações são suficientes para fornecer a sensibilidade desejada, desde que a nossa estimativa do desvio-padrão seja adequada. Na dúvida, deve-se repetir o procedimento com outros valores de σ para determinar o efeito de má-estimação deste parâmetro sobre a sensibilidade do plano. 22

5.3.6 A suposição de ausência de interação no modelo a dois fatores Se no modelo a dois fatores sabe-se que não há interação entre os dois, o modelo simplica para Y ijk = µ + τ i + β j + ɛ ijk, i = 1, 2,..., a j = 1, 2,..., b k = 1, 2,..., n Tome cuidado antes de descartar o termo de interação. Lembre que a presença de interação significante pode impactar fortemente a interpretação dos resultados. A análise estatística do modelo fatorial com 2 fatores sem interação é imediata. 23

A tabela a seguir apresenta a ANOVA do e- xemplo das baterias, ajustando o modelo sem interação. Como foi observado anteriormente ambos os efeitos principais são significativos. Porém, uma análise de resíduos irá revelar que o modelo sem interação não é adequado para estes dados. 24

5.3.7 Uma observação por cela Muitas vezes os recursos limitados impõem a restrição de apenas uma observação por cela. O modelo a dois fatores torna-se Y ij = µ + τ i + β j + (τβ) ij + ɛ ij, { i = 1, 2,..., a j = 1, 2,..., b A tabela ANOVA resultante desta restrição é apresentada a seguir. 27

Examinando-se os quadrados médios esperados, vemos que σ 2 não é estimável, isto é, o efeito de interação dos dois fatoreis (τβ) ij e o erro experimental não podem ser separados de maneira óbvia. Consequentemente, não há teste sobre os efeitos principais a não ser que o efeito de interação seja nulo. Se não há interação, então (τβ) ij = 0, i j e um modelo plausível é Y ij = µ + τ i + β j + ɛ ij { i = 1, 2,..., a j = 1, 2,..., b com o qual os efeitos principais podem ser testados. 29

Tukey (1949) desenvolveu um teste útil para verificar a presença de interação. O procedimento assume que (τβ) ij = γτ i β j, γ desconhecido Definindo o termo de interação deste modo, podemos usar uma abordadgem de regressão para testar a significância do termo de interação. O teste particiona SQ Res em um componente de 1 grau de liberdade devido a não aditividade (interação) e uma componente de erro com (a 1)(b 1) 1 g.l. A soma de quadrados devida à interação é SQ N = [ a i=1 b j=1 y ij y i. y.j y.. (SQ A + SQ B + y2.. ab absq A SQ B ) ] 2 com um grau de liberdade e SQ Erro = SQ Res SQ N com (a 1)(b 1) 1 g.l. 30

Para testar a presença de interação, calculamos SQ F 0 = N SQ Erro /[(a 1)(b 1) 1] Se F 0 > F 1 α,1,(a 1)(b 1) 1 a hipótese de ausência de interação deve ser rejeitada. Veja o exemplo 5.2 que ilustra uma aplicação do teste de Tukey para avaliar a presença de interação. Para terminar, observe que o EF2F com uma observação por cela é como um EBCA. De fato, o teste de Tukey pode ser diretamente aplicado para testar a presença de interação nos modelos em blocos aleatorizados. No entanto, lembre que as situações experimentais que levam aos experimentos em blocos aleatorizados e aos modelos fatoriais são bem diferentes. 31

Nos modelos fatoriais, todas as ab observações foram feitas em ordem aleatória, enquanto que no modelo em blocos aleatorizados a aleatorização se dá apenas em cada bloco. Os blocos são uma restrição em aleatorização. Portanto, a maneira na qual os experimentos são conduzidos e as interpretações dos dois modelos são bem diferentes. 32

Exercício(s) do capítulo 5 para entregar na aula do dia 03/11. aluno nome exercícios 1 Aline 9 2 Andre 10 3 Carolina 16 4 Felipe 13 5 Fernanda 6 6 Igor 15 7 Laura 8 8 Mariana 7 9 Michele 9 10 Pedro 10 11 Sandra 3 12 Veronica 15 13 Priscila 13 14 Dimas 6 15 Thaís 3 34