Planejamento de Experimentos. 13. Experimentos com fatores aleatórios

Documentos relacionados
Planejamento de Experimentos Experimento com um fator aleatório

2 ou mais fatores são de interesse.

5.3 Experimentos fatoriais a dois fatores. Ambos os fatores são supostos fixos e os efeitos de tratamento são definidos como desvios da média tal que

3. Experimentos a um único fator: Análise de Variância (ANOVA) 3.7 Comparações entre médias de tratamento

PROJETO E ANÁLISES DE EXPERIMENTOS (PAE) EXPERIMENTOS COM DOIS FATORES E O PLANEJAMENTO FATORIAL

Análise de Variância com mais de duas variáveis independentes (mais de dois fatores) Na aula do dia 17 de outubro (aula #08) introduzimos

4. Experimentos em Blocos aleatorizados, quadrados latinos e experimentos relacionados. 4.4 Experimentos em Blocos Incompletos Balanceados

Esquema Fatorial. Esquema Fatorial. Lucas Santana da Cunha 06 de outubro de 2018 Londrina

Análise de Dados Longitudinais Aula

ESQUEMA FATORIAL. Lucas Santana da Cunha Universidade Estadual de Londrina Departamento de Estatística

Cap. 9 Comparação entre tratamentos

Testes de Hipóteses sobre a média: Várias Amostras

CE219 - Controle Estatístico de Qualidade

Esquema Fatorial. Lucas Santana da Cunha Universidade Estadual de Londrina

Ralph S. Silva

PROBABILIDADE E ESTATÍSTICA INFERÊNCIA ESTATÍSTICA Parte II

Planejamento de Experimentos

ANÁLISE DE VARIÂNCIA DE UM CRITÉRIO (DIC)

Experimentos Fatoriais

Planejamento de Experimentos

AULA 05 Teste de Hipótese

CE219 - Controle Estatístico de Qualidade

5.3 Experimentos fatoriais a dois fatores (Revisando...)

Planejamento de Experimentos. 7 Blocagem e Confundimento(Superposição) nos Planos 2 k

Lucas Santana da Cunha de outubro de 2018 Londrina

UFRJ - CCMN - IM - Departamento de Métodos Estatísticos Planejamento de Experimentos - P2 Turma: MAA

Probabilidade e Estatística. Estimação de Parâmetros Intervalo de Confiança

Experimentos Balanceados com Dois Fatores

AULA 04 Teste de hipótese

Modelos de Regressão Linear Simples - parte III

Inferência Estatistica

4. Experimentos em Blocos aleatorizados, quadrados latinos e experimentos relacionados

Professora Ana Hermínia Andrade. Universidade Federal do Amazonas Faculdade de Estudos Sociais Departamento de Economia e Análise. Período 2017.

Lucas Santana da Cunha de outubro de 2018 Londrina

Modelos de Regressão Linear Simples - parte I

Distribuições por Amostragem

Delineamento e Análise Experimental Aula 3

Análise de Regressão EST036

ANÁLISE DE VARIÂNCIA DE DOIS CRITÉRIOS (DBC)

MAE Planejamento e Pesquisa I

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves

AULA 11 - Normalidade e Inferência em Regressão Múltipla - Parte 1

DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO PONTUAL INTRODUÇÃO ROTEIRO POPULAÇÃO E AMOSTRA. Estatística Aplicada à Engenharia

Testes de Hipóteses para. uma Única Amostra. Objetivos de Aprendizagem. 9.1 Teste de Hipóteses. UFMG-ICEx-EST-027/031 07/06/ :07

AULA 07 Inferência a Partir de Duas Amostras

Análise de Regressão EST036

Planejamento de Experimentos

AULA 12 - Normalidade e Inferência em Regressão Múltipla - Parte 2

Universidade Federal de Lavras

Delineamento em Quadrado Latino (DQL)

Estatística - Análise de Regressão Linear Simples. Professor José Alberto - (11) sosestatistica.com.br

MÓDULO V: Análise Bidimensional: Correlação, Regressão e Teste Qui-quadrado de Independência

Métodos Numéricos e Estatísticos Parte II-Métodos Estatísticos

Probabilidade e Estatística

Tópicos Extras 1ª parte. Testes Não Paramétricos, Análise Multivariada, Outras Técnicas

Planejamento de Experimentos Suposições do Modelo e Comparações Múltiplas

AULA 10 - MQO em regressão múltipla: Propriedades Estatísticas (Variância)

1 Probabilidade - Modelos Probabilísticos

Amostragem e distribuições por amostragem

AULA 12 - Normalidade e Inferência em Regressão Múltipla - Parte 2

DELINEAMENTO EM BLOCOS CASUALIZADOS (DBC)

Análise Multivariada Aplicada à Contabilidade

CONHECIMENTOS ESPECÍFICOS

AULA 10 - MQO em regressão múltipla: Propriedades Estatísticas (Variância)

Experimentos em Parcelas Subdivididas

Estudo de sistema de medição (gage) R&R (cruzado)

Aula 2 Uma breve revisão sobre modelos lineares

Correlação e Regressão Linear

EXPERIMENTOS EM PARCELAS SUBDIVIDIDAS

Inferência para duas populações

Instituto Federal Goiano

Inferência para várias populações normais análise de variância (ANOVA)

Modelo de Regressão Múltipla

Delineamento e Análise Experimental Aula 4

Modelos de Regressão Linear Simples - parte II

X 2. (σ 2 + µ 2 ) = 1 n (nσ 2 + nµ 2 ) = σ 2 + µ 2. µ = 0 E(T ) = σ 2

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves

AULA 13 Análise de Regressão Múltipla: MQO Assimptótico

Intervalos Estatísticos para uma única Amostra - parte I

MAE Planejamento e Pesquisa II

Análise da Regressão múltipla: MQO Assintótico y = β 0 + β 1 x 1 + β x +... β k x k + u 3. Propriedades assintóticas Antes, propriedades sobre amostra

Modelos de Regressão Linear Simples parte I

rio de Guerra Eletrônica EENEM 2008 Estatística stica e Probabilidade de Variância (ANOVA) 1/24

Modelos de Regressão Linear Simples - Análise de Resíduos

Princípios de Bioestatística

Estatística Básica. 13 de maio de 2009

Avaliação de Sistemas de Medição

MOQ 13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA)

MAE Introdução à Probabilidade e Estatística II Resolução Lista 5

DELINEAMENTO EM QUADRADO LATINO (DQL)

ESTATÍSTICA. Lucas Santana da Cunha 18 de setembro de Universidade Estadual de Londrina

Escola Superior de Agricultura Luiz de Queiroz Universidade de São Paulo

DELINEAMENTO EM BLOCOS AO ACASO

ESTATÍSTICA Distribuições qui-quadrado, t de Student e F de Snedecor Lucas Schmidt

DELINEAMENTO FATORIAL. Profª. Sheila Regina Oro

Cap. 4 - Estimação por Intervalo

TÉCNICAS DE AMOSTRAGEM

Poder do teste e determinação do tamanho da amostra:pca & PBC

Inferência. 1 Estimativa pontual de uma média 2 Estimativa intervalar de uma média. Renata Souza

Transcrição:

Planejamento de Experimentos 13. Experimentos com fatores aleatórios Até aqui assumimos que os fatores nos experimentos eram fixos, isto é, os níveis dos fatores utilizados eram níveis específicos de interesse. Inferências estatísticas sobre estes fatores estão confinadas a estes níveis específicos que foram estudados. Por exemplo, se três tipos de material são investigados como no caso do exemplo em que estudou-se a vida de certo tipo de bateria, nossas conclusões serão válidas somente sobre os três tipos de material estudados. 1

Uma variação desta situação ocorre quando o fator ou fatores são quantitativos. Nestas situações, geralmente usamos modelos de regressão relacionando a resposta aos fatores para prever a resposta sobre a região de variação dos níveis dos fatores usada no experimento. Em geral, com um efeito fixo, dizemos que o espaço deste experimento para fazer inferências é o conjunto específico de níveis investigados. Em algumas situações experimentais, os níveis do fator são escolhidos ao acaso de uma população grande de níveis possíveis e, desejase tirar conclusões sobre a população inteira de níveis, não apenas sobre aqueles níveis que foram utilizados no experimento. Nesta situação dizemos que trata-se de um fator aleatório. 2

13.1 Modelos de Efeitos Aleatórios Suponha que a níveis de um fator foram selecionados de uma população de níveis. Como os níveis usados no experimento foram selecionados ao acaso, inferências serão feitas sobre a população de níveis do fator. Assumimos que a população de níveis é grande o suficiente para ser considerada infinita ou é de fato infinita. Situações nas quais a população de níveis do fator é suficientemente pequena para usar uma abordagem de populações finitas não são encontradas com frequência. Bennett e Franklin (1954) e Searle e Fawcett (1970) apresentam esta abordagem. 3

O modelo linear estatístico é y ij = µ + τ i + ɛ ij, { i = 1, 2,..., a j = 1, 2,..., n (I) em que τ i e ɛ ij são variáveis aleatórias. Suposições sobre o modelo: (1) ɛ ij NID(0, σ 2 ), i, j; (2) Var(τ i ) = σ 2 τ, i e (3) ɛ ij e τ i são v.a. s independentemente distribuídas i, j. Segue destas suposições que Var(y ij ) = σ 2 τ + σ 2. 4

As variâncias στ 2 e σ2 são chamadas componentes de variância e o modelo (I) é chamado modelo de componentes de variância ou modelo de efeitos aleatórios. Para testar hipóteses neste modelo, assume-se também que τ i NID(0, σ 2 τ ), além das suposições (1), (2) e (3). Observe que a decomposição do modelo ANOVA básico ainda vale neste contexto, a saber, SQ T ot = SQ T rat + SQ Res. Porém, não faz sentido aqui testar hipóteses sobre valores específicos dos τ i s, pois agora τ i é uma variável aleatória. 5

Em vez disso, testamos hipóteses sobre o componente de variância σ 2 τ { H0 : σ 2 τ = 0 H 1 : σ 2 τ > 0 Se σ 2 τ = 0, todos os tratamentos são idênticos, mas se σ 2 τ > 0, existe variabilidade entre tratamentos. Como antes, tem-se SQ Res σ 2 χ 2 N a e, sob H 0, SQ T rat σ 2 χ 2 a 1 (independente de SQ Res). 6

Portanto, sob H 0, F 0 = QM T rat QM Res F a 1,N a, exatamente como no caso do modelo básico a efeitos fixos. A diferença está na interpretação dos resultados. No modelo clássico de efeitos fixos, vimos que E[QM T rat ] = σ 2 + a 1 n a i=1 τ 2 i. Porém, no modelo de efeitos aleatórios, este valor esperado é diferente. E[QM T rat ] = 1 a 1 E[SQ T rat] SQ T rat = a n i=1j=1 (ȳ i. ȳ.. ) 2 = com ȳ i. = 1 n n j=1 y ij, ȳ.. = 1 y ij = µ + τ i + ɛ ij. a n an i=1j=1 y ij e 7

SQ T rat = n a i=1 n (µ + τ i + ɛ ij ) 1 N 1 n j=1 a i=1j=1 n (µ + τ i + ɛ ij ) 2 Desenvolvendo o termo entre chaves, obtemse {τ i τ + ɛ i. ɛ.. } 2 com τ = 1 a ɛ i. = 1 n ɛ.. = 1 N a i=1 n j=1 τ i, ɛ ij e a n ɛ ij i=1j=1 8

E[QM T rat ] = 1 a 1 E[SQ T rat] = n a 1 E { ai=1 [(τ i τ) + ( ɛ i. ɛ.. )] 2} = usando a independência entre τ i s e ɛ ij s n a 1 Como a i=1 a i=1 { a i=1 E[(τ i τ) 2 ] + 2 E[(τ i τ) 2 ] = E[ E[( ɛ i. ɛ.. ) 2 ]E[ segue que E[QM T rat ] = 1 a 1 a i=1 a i=1 { τ 2 i a i=1 = E[(τ i τ)] E[( ɛ i. ɛ.. )] + } {{ } =0 } {{ } =0 a i=1 a τ 2 ] = aσ 2 τ a σ2 τ a = (a 1)σ2 τ ɛ 2 i. a ɛ2..] = a σ2 n aσ2 N = σ2a 1 n n a 1 σ2 τ + (a 1)σ2 } = σ 2 + nσ 2 τ E[( ɛ i. ɛ.. ) 2 ] } 9

Em geral, há interesse em estimar os componentes de variância σ 2 e σ 2 τ. O procedimento apresentado a seguir é chamado método da análise de variância, pois usa resultados da tabela ANOVA. De fato, é uma espécie de métodos dos momentos. QM T rat = ˆσ 2 + nˆσ 2 τ QM Res = ˆσ 2 tal que ˆσ τ 2 = QM T rat QM Res. n Para tamanhos amostrais desiguais, substitua n na equação anterior por n 0 = 1 a 1 a i=1 n i a n 2 i i=1 a n i i=1. 10

Este método não exige normalidade e produz estimativas de σ 2 e σ 2 τ que são as melhores estimativas quadráticas não viciadas. No entanto, o método pode produzir estimativas negativas de σ 2 τ, o que não faz sentido, pois qualquer variância é não-negativa. Uma possibilidade neste caso é aceitar a estimativa e usá-la como evidência de que o valor verdadeiro de σ 2 τ é zero, assumindo que a variabilidade amostral levou à estimativa negativa. Apesar do apelo intuitivo da abordagem anterior, ela padece de dificuldades teóricas. Por exemplo, usar um zero no lugar da estimativa negativa, pode perturbar as propriedades estatísticas das outras estimativas. 11

Outra alternativa é reestimar a variância negativa usando um método que sempre produza estimativas não-negativas. Ainda, outro método possível, é considerar a estimativa negativa como evidência de que o modelo linear assumido está incorreto e reexaminar o problema. Um tratamento completo de estimação de componentes de variância pode ser encontrado nas seguintes referências: Searle (1971(a) e 1971 (b)), Searle, Casella e McCullogh (1992) e Burdick e Graybill (1992). 12

Exemplo 13.1: Uma companhia têxtil fabrica um tecido sobre um grande número de teares. A companhia está interessada na variabilidade da resistência do tecido à tensão que ocorre entre os teares. Os teares deveriam ser homogêneos. Para investigar isso foram sorteados 4 teares e realizaram-se 4 observações de resistências nas amostras de tecido para cada tear. Os dados estão na tabela a seguir. tear(i) 1 2 3 4 y i. I 98 97 99 96 390 II 91 90 93 92 366 III 96 95 97 95 383 IV 95 96 99 98 388 Total 1527 (y.. ) 13

A tabela ANOVA para estes dados é FV SQ gl QM F p-valor Tear 89,19 3 29,73 15,68 < 0, 001 Erro 22,75 12 1,90 Total 111,94 15 Logo, ˆσ 2 = 1, 90 ˆσ 2 τ = 29, 73 1, 90 4 = 6, 96. Portanto, a variância de qualquer observação sobre resistência é estimada por ˆσ 2 y = ˆσ 2 + ˆσ 2 τ = 8, 86. A maior parte dela é atribuível às diferenças entre os teares. Este exemplo ilustra uma aplicação importante da ANOVA: a separação de diferentes fontes de variação que afetam um produto ou sistema. O problema da variabilidade do produto costuma aparecer em segurança da qualidade. 14

15

Intervalos de Confiança para σ 2 Lembre que N a QM Res χ 2 N a P ( σ 2 χ 2 α/2,n a < N a σ 2 QM Res < χ 2 1 α/2,n a tal que ) = 1 α P ( (N a)qm Res χ 2 1 α/2,n a < σ 2 < (N a)qm Res χ 2 α/2,n a ) = 1 α Assim, tem-se IC(σ 2, 1 α) : ( (N a)qm Res χ 2, (N a)qm Res χ 1 α/2,n a 2 α/2,n a ). 16

Considere agora o componente de variância σ 2 τ e seu estimador pontual dado por ˆσ 2 τ = QM T rat QM Res n a 1 A v.a. σ 2 +nστ 2 QM T rat tem distribuição de quiquadrado com a 1 graus de liberdade e N a σ 2 QM Res χ 2 N a. Logo, a distribuição de ˆσ τ 2 é uma combinação linear de duas distribuições de qui-quadrado, a saber, u 1 χ 2 a 1 u 2χ 2 N a com u 1 = σ2 +nσ 2 τ n(a 1) e u 2 = σ2 n(n a). Não é possível, no entanto, obter uma expressão anaĺıtica para a distribuição desta combinação linear, de tal modo que não será possível construir um intervalo de confiança exato para este componente de variância. 17

Procedimentos aproximados podem ser encontrados em Graybill (1961) e Searle (1971 (a)). Veja também a seção 13.7 deste capítulo. Observe no entanto que é fácil encontrar uma expressão exata de um intervalo de confiança σ para a razão τ 2 σ 2 +στ 2 que é chamada coeficiente de correlação intraclasse e reflete a proporção da variância de uma observação que é o resultado de diferenças entre tratamentos. Para construir este IC, considere o caso de amostras de tamanhos iguais para cada tratamento (balanceado) e observe que QM T rat e QM Res são v.a. s independentes tal que QM T rat /(σ 2 +nστ 2) QM Res /σ 2 / F a 1,N a Para simplificar a notação faça f 1 = F α/2,a 1,N a e f 2 = F 1 α/2,a 1,N a. 18

Assim, podemos escrever P ( f 1 < QM T rat QM Res σ 2 σ 2 +nσ 2 τ < f 2 ) = 1 α P ( QMRes QM T rat f 1 < σ2 σ 2 +nσ 2 τ < QM Res QM T rat f 2 ) = 1 α P ( QMT rat QM f 1 Res 2 < 1 + n σ2 τ σ 2 < QM ) T rat QM f 1 Res 1 = 1 α P { QMT rat f 1 QM Res } 2 1 /n } {{ } =L { QMT < σ2 τ rat < σ 2 QM Res f 1 } 1 1 } {{ } =U /n = 1 α 19

P ( L < σ2 τ σ 2 < U ) = 1 α P ( 1 + L < 1 + σ2 τ σ 2 < 1 + U ) = 1 α P P ( 1 1+U < σ2 σ 2 +στ 2 ( L 1+L < σ2 τ σ 2 +στ 2 ) < 1+L 1 ) < 1+U U = 1 α = 1 α 20

No exemplo 13.1, temos L = 0, 625 e U = ( σ 2 55, 633 tal que IC τ σ 2 +στ 2, 0, 95 ) : (0, 38; 0, 98). A variabilidade entre teares leva em conta de 38% a 98% da variância observada na resistência das peças produzidas. O IC é relativamente largo, porque o tamanho da amostra é pequeno. A variabilidade entre teares não é desprezível. 21

13.2 O modelo fatorial a dois fatores com efeitos aleatórios. Modelo: y ijk = µ+τ i +β j +(τβ) ij +ɛ ijk, i = 1, 2,..., a j = 1, 2,..., b k = 1, 2,..., n Suponha que ambos os fatores sejam aleatórios. Suposições adicionais: (1) τ i, β j, (τβ) ij e ɛ ijk são variáveis aleatórias independentes para todo i, j, k. (2) Todas são normalmente distribuídas com média zero e variâncias 22

efeito τ i β j comp. de variância στ 2 σβ 2 (τβ) ij ɛ ijk σ 2 σ 2 τβ 23

As hipóteses que estamos interessados em testar são H 0 : σ 2 τ = 0 versus H 1 : σ 2 τ > 0 H 0 : σ 2 β = 0 versus H 1 : σ 2 β > 0 H 0 : σ 2 τβ = 0 versus H 1 : σ 2 τβ > 0 Novamente, os cálculos que geram a tabela ANOVA são exatamente os mesmos do caso a efeitos fixos. No entanto, os valores esperados dos quadrados médios sob o modelo a efeitos aleatórios, são diferentes, a saber, Quadrado médio QM A QM B valor esperado σ 2 + nστβ 2 + nbσ2 τ σ 2 + nσ 2 τβ + naσ2 β QM AB σ 2 + nστβ 2 QM Res σ 2 24

Para testar H 0 : στβ 2 estatística = 0 usamos a seguinte F 0 = QM AB QM Res que, sob H 0, tem distribuição F (a 1)(b 1),ab(n 1). Mas, para testar H 0 : σ 2 τ = 0 usamos F 0 = QM A QM AB que, sob H 0, tem distribuição F a 1,(a 1)(b 1). QM B QM AB Para testar H 0 : σβ 2 = 0 usamos F 0 = que, sob H 0, tem distribuição F b 1,(a 1)(b 1). Observe que estas duas últimas estatísticas não são correspondentes à tabela ANOVA no caso do modelo a efeitos fixos no qual todas as razões F têm em seu denominador QM Res. 25

Estimação dos componentes de variância Usaremos o estimador não-viciado para σ 2, ˆσ 2 = QM Res. Método ANOVA (momentos) para os demais componentes, caso balanceado: ˆσ τβ = QM AB QM Res n ˆσ τ = QM A QM AB an ˆσ β = QM B QM AB bn Observe novamente, que este método pode produzir estimativas negativas. 26

Exemplo 13.2 Um estudo da capacidade de instrumento de medida. Experimentos estatisticamente planejados são muito usados para investigar fontes de variação que afetam um sistema. Uma aplicação comum na indústria é usar um experimento planejado para estudar os componentes de variação em um sistema de medição. Estes estudos costumam ser chamados estudos de capacidade do instrumento de medição ou estudos sobre a repetibilidade e reprodutibilidade do instrumento de medição (R& R studies), pois estes são os componentes de variação de interesse. Um experimento comum deste tipo é mostrado na tabela a seguir. 27

28

Um instrumento é usado para medir uma dimensão importante de uma peça. Vinte peças foram selecionadas do processo de produção e três operários selecionados ao acaso medem cada peça duas vezes com este instrumento. A ordem na qual as medidas são feitas é aleatorizada tal que este é um EF2 (peças e operadores) com duas replicações completamente aleatorizado. Ambos os fatores são aleatórios. Os componentes de variância são dados na equação a seguir σ 2 y }{{} var. total = var. peças {}}{ var. peça:operário {}}{ στ 2 + σβ 2 }{{} var. operário + σ 2 τβ + σ 2 }{{} var. erro exp. 29

Costuma-se chamar o componente σ 2 de repetibilidade do instrumento, pois σ 2 pode ser pensado como refletindo a variação observada quando a mesma peça é medida pelo mesmo operador. σβ 2 + σ2 τβ costuma ser chamado reprodutibilidade do instrumento, pois ela reflete a variabilidade adicional nas medições resultantes do uso do instrumento por operadores. Estes experimentos geralmente são realizados com o objetivo de estimar os componentes de variância. A tabela a seguir mostra a tabela ANOVA resultante destes dados. 30

31

Concluímos, baseados nos p-valores, que o efeito das peças é grande, operadores podem ter um efeito pequeno, e a interação peça:operador não é significante. Observe que a estimativa do componente correspondente à interação peça:operador é negativa! Isto certamente não é razoável, pois por definição variâncias são não-negativas. Infelizmente, estimativas negativas de variâncias podem resultar do método anova. Podemos lidar com este problema de várias formas. 32

Uma possibilidade é assumir que a estimativa negativa implica que o componente é de fato zero e, simplesmente, torná-la nula, mantendo inalteradas as demais estimativas não-negativas. Outra abordagem é estimar os componentes com um método que garanta que as estimativas serão não-negativas, por exemplo, estimação de máxima-verossimilhança com restrição. Finalmente, poderíamos observar que o P -valor correspondente ao termo de interação é muito grande e, a partir daí, rodar o modelo reduzido, desprezando a interação, a saber, y ijk = µ + τ i + β j + ɛ ijk A tabela a seguir mostra a tabela ANOVA do modelo reduzido. 33

34

Como não há o termo de interação, ambos os efeitos são testados contra o termo de erro. Poderíamos estimar a variância do instrumento como a soma de ˆσ 2 + ˆσ 2 β, ˆσ 2 inst. = 0, 88 + 0, 0108 = 0, 8908. A variabilidade do instrumento é pequena relativa à variabilidade no produto. Esta é a situação desejável, implicando que o instrumento é capaz de distinguir diferentes níveis do produto. 35

Estudos da capacidade de sistemas de medição representam uma aplicação muito comum de experimentos planejados. Tais experimentos geralmente envolvem fatores aleatórios. Montgomery recomenda Burdick, Borror e Montgomery (2003). A Review of Methos for Measurement Systems Capability Analysis. Journal of Quality Technology (35). pp.343-354, para maiores detalhes. 36