Planejamento de Experimentos 13. Experimentos com fatores aleatórios Até aqui assumimos que os fatores nos experimentos eram fixos, isto é, os níveis dos fatores utilizados eram níveis específicos de interesse. Inferências estatísticas sobre estes fatores estão confinadas a estes níveis específicos que foram estudados. Por exemplo, se três tipos de material são investigados como no caso do exemplo em que estudou-se a vida de certo tipo de bateria, nossas conclusões serão válidas somente sobre os três tipos de material estudados. 1
Uma variação desta situação ocorre quando o fator ou fatores são quantitativos. Nestas situações, geralmente usamos modelos de regressão relacionando a resposta aos fatores para prever a resposta sobre a região de variação dos níveis dos fatores usada no experimento. Em geral, com um efeito fixo, dizemos que o espaço deste experimento para fazer inferências é o conjunto específico de níveis investigados. Em algumas situações experimentais, os níveis do fator são escolhidos ao acaso de uma população grande de níveis possíveis e, desejase tirar conclusões sobre a população inteira de níveis, não apenas sobre aqueles níveis que foram utilizados no experimento. Nesta situação dizemos que trata-se de um fator aleatório. 2
13.1 Modelos de Efeitos Aleatórios Suponha que a níveis de um fator foram selecionados de uma população de níveis. Como os níveis usados no experimento foram selecionados ao acaso, inferências serão feitas sobre a população de níveis do fator. Assumimos que a população de níveis é grande o suficiente para ser considerada infinita ou é de fato infinita. Situações nas quais a população de níveis do fator é suficientemente pequena para usar uma abordagem de populações finitas não são encontradas com frequência. Bennett e Franklin (1954) e Searle e Fawcett (1970) apresentam esta abordagem. 3
O modelo linear estatístico é y ij = µ + τ i + ɛ ij, { i = 1, 2,..., a j = 1, 2,..., n (I) em que τ i e ɛ ij são variáveis aleatórias. Suposições sobre o modelo: (1) ɛ ij NID(0, σ 2 ), i, j; (2) Var(τ i ) = σ 2 τ, i e (3) ɛ ij e τ i são v.a. s independentemente distribuídas i, j. Segue destas suposições que Var(y ij ) = σ 2 τ + σ 2. 4
As variâncias στ 2 e σ2 são chamadas componentes de variância e o modelo (I) é chamado modelo de componentes de variância ou modelo de efeitos aleatórios. Para testar hipóteses neste modelo, assume-se também que τ i NID(0, σ 2 τ ), além das suposições (1), (2) e (3). Observe que a decomposição do modelo ANOVA básico ainda vale neste contexto, a saber, SQ T ot = SQ T rat + SQ Res. Porém, não faz sentido aqui testar hipóteses sobre valores específicos dos τ i s, pois agora τ i é uma variável aleatória. 5
Em vez disso, testamos hipóteses sobre o componente de variância σ 2 τ { H0 : σ 2 τ = 0 H 1 : σ 2 τ > 0 Se σ 2 τ = 0, todos os tratamentos são idênticos, mas se σ 2 τ > 0, existe variabilidade entre tratamentos. Como antes, tem-se SQ Res σ 2 χ 2 N a e, sob H 0, SQ T rat σ 2 χ 2 a 1 (independente de SQ Res). 6
Portanto, sob H 0, F 0 = QM T rat QM Res F a 1,N a, exatamente como no caso do modelo básico a efeitos fixos. A diferença está na interpretação dos resultados. No modelo clássico de efeitos fixos, vimos que E[QM T rat ] = σ 2 + a 1 n a i=1 τ 2 i. Porém, no modelo de efeitos aleatórios, este valor esperado é diferente. E[QM T rat ] = 1 a 1 E[SQ T rat] SQ T rat = a n i=1j=1 (ȳ i. ȳ.. ) 2 = com ȳ i. = 1 n n j=1 y ij, ȳ.. = 1 y ij = µ + τ i + ɛ ij. a n an i=1j=1 y ij e 7
SQ T rat = n a i=1 n (µ + τ i + ɛ ij ) 1 N 1 n j=1 a i=1j=1 n (µ + τ i + ɛ ij ) 2 Desenvolvendo o termo entre chaves, obtemse {τ i τ + ɛ i. ɛ.. } 2 com τ = 1 a ɛ i. = 1 n ɛ.. = 1 N a i=1 n j=1 τ i, ɛ ij e a n ɛ ij i=1j=1 8
E[QM T rat ] = 1 a 1 E[SQ T rat] = n a 1 E { ai=1 [(τ i τ) + ( ɛ i. ɛ.. )] 2} = usando a independência entre τ i s e ɛ ij s n a 1 Como a i=1 a i=1 { a i=1 E[(τ i τ) 2 ] + 2 E[(τ i τ) 2 ] = E[ E[( ɛ i. ɛ.. ) 2 ]E[ segue que E[QM T rat ] = 1 a 1 a i=1 a i=1 { τ 2 i a i=1 = E[(τ i τ)] E[( ɛ i. ɛ.. )] + } {{ } =0 } {{ } =0 a i=1 a τ 2 ] = aσ 2 τ a σ2 τ a = (a 1)σ2 τ ɛ 2 i. a ɛ2..] = a σ2 n aσ2 N = σ2a 1 n n a 1 σ2 τ + (a 1)σ2 } = σ 2 + nσ 2 τ E[( ɛ i. ɛ.. ) 2 ] } 9
Em geral, há interesse em estimar os componentes de variância σ 2 e σ 2 τ. O procedimento apresentado a seguir é chamado método da análise de variância, pois usa resultados da tabela ANOVA. De fato, é uma espécie de métodos dos momentos. QM T rat = ˆσ 2 + nˆσ 2 τ QM Res = ˆσ 2 tal que ˆσ τ 2 = QM T rat QM Res. n Para tamanhos amostrais desiguais, substitua n na equação anterior por n 0 = 1 a 1 a i=1 n i a n 2 i i=1 a n i i=1. 10
Este método não exige normalidade e produz estimativas de σ 2 e σ 2 τ que são as melhores estimativas quadráticas não viciadas. No entanto, o método pode produzir estimativas negativas de σ 2 τ, o que não faz sentido, pois qualquer variância é não-negativa. Uma possibilidade neste caso é aceitar a estimativa e usá-la como evidência de que o valor verdadeiro de σ 2 τ é zero, assumindo que a variabilidade amostral levou à estimativa negativa. Apesar do apelo intuitivo da abordagem anterior, ela padece de dificuldades teóricas. Por exemplo, usar um zero no lugar da estimativa negativa, pode perturbar as propriedades estatísticas das outras estimativas. 11
Outra alternativa é reestimar a variância negativa usando um método que sempre produza estimativas não-negativas. Ainda, outro método possível, é considerar a estimativa negativa como evidência de que o modelo linear assumido está incorreto e reexaminar o problema. Um tratamento completo de estimação de componentes de variância pode ser encontrado nas seguintes referências: Searle (1971(a) e 1971 (b)), Searle, Casella e McCullogh (1992) e Burdick e Graybill (1992). 12
Exemplo 13.1: Uma companhia têxtil fabrica um tecido sobre um grande número de teares. A companhia está interessada na variabilidade da resistência do tecido à tensão que ocorre entre os teares. Os teares deveriam ser homogêneos. Para investigar isso foram sorteados 4 teares e realizaram-se 4 observações de resistências nas amostras de tecido para cada tear. Os dados estão na tabela a seguir. tear(i) 1 2 3 4 y i. I 98 97 99 96 390 II 91 90 93 92 366 III 96 95 97 95 383 IV 95 96 99 98 388 Total 1527 (y.. ) 13
A tabela ANOVA para estes dados é FV SQ gl QM F p-valor Tear 89,19 3 29,73 15,68 < 0, 001 Erro 22,75 12 1,90 Total 111,94 15 Logo, ˆσ 2 = 1, 90 ˆσ 2 τ = 29, 73 1, 90 4 = 6, 96. Portanto, a variância de qualquer observação sobre resistência é estimada por ˆσ 2 y = ˆσ 2 + ˆσ 2 τ = 8, 86. A maior parte dela é atribuível às diferenças entre os teares. Este exemplo ilustra uma aplicação importante da ANOVA: a separação de diferentes fontes de variação que afetam um produto ou sistema. O problema da variabilidade do produto costuma aparecer em segurança da qualidade. 14
15
Intervalos de Confiança para σ 2 Lembre que N a QM Res χ 2 N a P ( σ 2 χ 2 α/2,n a < N a σ 2 QM Res < χ 2 1 α/2,n a tal que ) = 1 α P ( (N a)qm Res χ 2 1 α/2,n a < σ 2 < (N a)qm Res χ 2 α/2,n a ) = 1 α Assim, tem-se IC(σ 2, 1 α) : ( (N a)qm Res χ 2, (N a)qm Res χ 1 α/2,n a 2 α/2,n a ). 16
Considere agora o componente de variância σ 2 τ e seu estimador pontual dado por ˆσ 2 τ = QM T rat QM Res n a 1 A v.a. σ 2 +nστ 2 QM T rat tem distribuição de quiquadrado com a 1 graus de liberdade e N a σ 2 QM Res χ 2 N a. Logo, a distribuição de ˆσ τ 2 é uma combinação linear de duas distribuições de qui-quadrado, a saber, u 1 χ 2 a 1 u 2χ 2 N a com u 1 = σ2 +nσ 2 τ n(a 1) e u 2 = σ2 n(n a). Não é possível, no entanto, obter uma expressão anaĺıtica para a distribuição desta combinação linear, de tal modo que não será possível construir um intervalo de confiança exato para este componente de variância. 17
Procedimentos aproximados podem ser encontrados em Graybill (1961) e Searle (1971 (a)). Veja também a seção 13.7 deste capítulo. Observe no entanto que é fácil encontrar uma expressão exata de um intervalo de confiança σ para a razão τ 2 σ 2 +στ 2 que é chamada coeficiente de correlação intraclasse e reflete a proporção da variância de uma observação que é o resultado de diferenças entre tratamentos. Para construir este IC, considere o caso de amostras de tamanhos iguais para cada tratamento (balanceado) e observe que QM T rat e QM Res são v.a. s independentes tal que QM T rat /(σ 2 +nστ 2) QM Res /σ 2 / F a 1,N a Para simplificar a notação faça f 1 = F α/2,a 1,N a e f 2 = F 1 α/2,a 1,N a. 18
Assim, podemos escrever P ( f 1 < QM T rat QM Res σ 2 σ 2 +nσ 2 τ < f 2 ) = 1 α P ( QMRes QM T rat f 1 < σ2 σ 2 +nσ 2 τ < QM Res QM T rat f 2 ) = 1 α P ( QMT rat QM f 1 Res 2 < 1 + n σ2 τ σ 2 < QM ) T rat QM f 1 Res 1 = 1 α P { QMT rat f 1 QM Res } 2 1 /n } {{ } =L { QMT < σ2 τ rat < σ 2 QM Res f 1 } 1 1 } {{ } =U /n = 1 α 19
P ( L < σ2 τ σ 2 < U ) = 1 α P ( 1 + L < 1 + σ2 τ σ 2 < 1 + U ) = 1 α P P ( 1 1+U < σ2 σ 2 +στ 2 ( L 1+L < σ2 τ σ 2 +στ 2 ) < 1+L 1 ) < 1+U U = 1 α = 1 α 20
No exemplo 13.1, temos L = 0, 625 e U = ( σ 2 55, 633 tal que IC τ σ 2 +στ 2, 0, 95 ) : (0, 38; 0, 98). A variabilidade entre teares leva em conta de 38% a 98% da variância observada na resistência das peças produzidas. O IC é relativamente largo, porque o tamanho da amostra é pequeno. A variabilidade entre teares não é desprezível. 21
13.2 O modelo fatorial a dois fatores com efeitos aleatórios. Modelo: y ijk = µ+τ i +β j +(τβ) ij +ɛ ijk, i = 1, 2,..., a j = 1, 2,..., b k = 1, 2,..., n Suponha que ambos os fatores sejam aleatórios. Suposições adicionais: (1) τ i, β j, (τβ) ij e ɛ ijk são variáveis aleatórias independentes para todo i, j, k. (2) Todas são normalmente distribuídas com média zero e variâncias 22
efeito τ i β j comp. de variância στ 2 σβ 2 (τβ) ij ɛ ijk σ 2 σ 2 τβ 23
As hipóteses que estamos interessados em testar são H 0 : σ 2 τ = 0 versus H 1 : σ 2 τ > 0 H 0 : σ 2 β = 0 versus H 1 : σ 2 β > 0 H 0 : σ 2 τβ = 0 versus H 1 : σ 2 τβ > 0 Novamente, os cálculos que geram a tabela ANOVA são exatamente os mesmos do caso a efeitos fixos. No entanto, os valores esperados dos quadrados médios sob o modelo a efeitos aleatórios, são diferentes, a saber, Quadrado médio QM A QM B valor esperado σ 2 + nστβ 2 + nbσ2 τ σ 2 + nσ 2 τβ + naσ2 β QM AB σ 2 + nστβ 2 QM Res σ 2 24
Para testar H 0 : στβ 2 estatística = 0 usamos a seguinte F 0 = QM AB QM Res que, sob H 0, tem distribuição F (a 1)(b 1),ab(n 1). Mas, para testar H 0 : σ 2 τ = 0 usamos F 0 = QM A QM AB que, sob H 0, tem distribuição F a 1,(a 1)(b 1). QM B QM AB Para testar H 0 : σβ 2 = 0 usamos F 0 = que, sob H 0, tem distribuição F b 1,(a 1)(b 1). Observe que estas duas últimas estatísticas não são correspondentes à tabela ANOVA no caso do modelo a efeitos fixos no qual todas as razões F têm em seu denominador QM Res. 25
Estimação dos componentes de variância Usaremos o estimador não-viciado para σ 2, ˆσ 2 = QM Res. Método ANOVA (momentos) para os demais componentes, caso balanceado: ˆσ τβ = QM AB QM Res n ˆσ τ = QM A QM AB an ˆσ β = QM B QM AB bn Observe novamente, que este método pode produzir estimativas negativas. 26
Exemplo 13.2 Um estudo da capacidade de instrumento de medida. Experimentos estatisticamente planejados são muito usados para investigar fontes de variação que afetam um sistema. Uma aplicação comum na indústria é usar um experimento planejado para estudar os componentes de variação em um sistema de medição. Estes estudos costumam ser chamados estudos de capacidade do instrumento de medição ou estudos sobre a repetibilidade e reprodutibilidade do instrumento de medição (R& R studies), pois estes são os componentes de variação de interesse. Um experimento comum deste tipo é mostrado na tabela a seguir. 27
28
Um instrumento é usado para medir uma dimensão importante de uma peça. Vinte peças foram selecionadas do processo de produção e três operários selecionados ao acaso medem cada peça duas vezes com este instrumento. A ordem na qual as medidas são feitas é aleatorizada tal que este é um EF2 (peças e operadores) com duas replicações completamente aleatorizado. Ambos os fatores são aleatórios. Os componentes de variância são dados na equação a seguir σ 2 y }{{} var. total = var. peças {}}{ var. peça:operário {}}{ στ 2 + σβ 2 }{{} var. operário + σ 2 τβ + σ 2 }{{} var. erro exp. 29
Costuma-se chamar o componente σ 2 de repetibilidade do instrumento, pois σ 2 pode ser pensado como refletindo a variação observada quando a mesma peça é medida pelo mesmo operador. σβ 2 + σ2 τβ costuma ser chamado reprodutibilidade do instrumento, pois ela reflete a variabilidade adicional nas medições resultantes do uso do instrumento por operadores. Estes experimentos geralmente são realizados com o objetivo de estimar os componentes de variância. A tabela a seguir mostra a tabela ANOVA resultante destes dados. 30
31
Concluímos, baseados nos p-valores, que o efeito das peças é grande, operadores podem ter um efeito pequeno, e a interação peça:operador não é significante. Observe que a estimativa do componente correspondente à interação peça:operador é negativa! Isto certamente não é razoável, pois por definição variâncias são não-negativas. Infelizmente, estimativas negativas de variâncias podem resultar do método anova. Podemos lidar com este problema de várias formas. 32
Uma possibilidade é assumir que a estimativa negativa implica que o componente é de fato zero e, simplesmente, torná-la nula, mantendo inalteradas as demais estimativas não-negativas. Outra abordagem é estimar os componentes com um método que garanta que as estimativas serão não-negativas, por exemplo, estimação de máxima-verossimilhança com restrição. Finalmente, poderíamos observar que o P -valor correspondente ao termo de interação é muito grande e, a partir daí, rodar o modelo reduzido, desprezando a interação, a saber, y ijk = µ + τ i + β j + ɛ ijk A tabela a seguir mostra a tabela ANOVA do modelo reduzido. 33
34
Como não há o termo de interação, ambos os efeitos são testados contra o termo de erro. Poderíamos estimar a variância do instrumento como a soma de ˆσ 2 + ˆσ 2 β, ˆσ 2 inst. = 0, 88 + 0, 0108 = 0, 8908. A variabilidade do instrumento é pequena relativa à variabilidade no produto. Esta é a situação desejável, implicando que o instrumento é capaz de distinguir diferentes níveis do produto. 35
Estudos da capacidade de sistemas de medição representam uma aplicação muito comum de experimentos planejados. Tais experimentos geralmente envolvem fatores aleatórios. Montgomery recomenda Burdick, Borror e Montgomery (2003). A Review of Methos for Measurement Systems Capability Analysis. Journal of Quality Technology (35). pp.343-354, para maiores detalhes. 36