Planejamento de Experimentos Suposições do Modelo e Comparações Múltiplas

Documentos relacionados
Métodos Estatísticos Avançados em Epidemiologia

Métodos Estatísticos Avançados em Epidemiologia

Princípios de Bioestatística

Planejamento de Experimentos Experimento com um fator aleatório

Planejamento de Experimentos Introdução - Teste t

ANÁLISE DE VARIÂNCIA DE UM CRITÉRIO (DIC)

Tópicos Extras 1ª parte. Testes Não Paramétricos, Análise Multivariada, Outras Técnicas

3. Experimentos a um único fator: Análise de Variância (ANOVA) 3.7 Comparações entre médias de tratamento

MAE Planejamento e Pesquisa II

Lucas Santana da Cunha de outubro de 2018 Londrina

Delineamento e Análise Experimental Aula 3

Testes de hipóteses Paramétricos

Planejamento de Experimentos Medidas Repetidas

5.3 Experimentos fatoriais a dois fatores. Ambos os fatores são supostos fixos e os efeitos de tratamento são definidos como desvios da média tal que

ANOVA - Etapas de Análise

ANÁLISE DE VARIÂNCIA. y j = µ + τ i + e i j = µ i + e i j

Modelos de Análise de Variância

Lucas Santana da Cunha de outubro de 2018 Londrina

Testes de Hipóteses sobre a média: Várias Amostras

Teste de Cochran (Homogeneidade de Variância)

INTRODUÇÃO. Exemplos. Comparar três lojas quanto ao volume médio de vendas. ... ANÁLISE DE VARIÂNCIA. Departamento de Matemática ESTV.

DELINEAMENTO EM BLOCOS AO ACASO

Variância pop. * conhecida Teste t Paramétrico Quantitativa Distribuição normal Wilcoxon (teste dos sinais, Wilcoxon p/ 1 amostra)

Escolha dos testes INTRODUÇÃO À BIOESTATÍSTICA QUANTIFICAÇÃO DOS GRUPOS DO ESTUDO PESQUISA INFERÊNCIA ESTATÍSTICA TESTE DE HIPÓTESES E

BIOESTATÍSTICA. Parte 5 Testes de Hipóteses

DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA)

PROBABILIDADE E ESTATÍSTICA INFERÊNCIA ESTATÍSTICA Parte II

Regression and Clinical prediction models

MAE 317 Planejamento de Experimentos I. Profa. Júlia Maria Pavan Soler IME/USP

DELINEAMENTO EM BLOCOS CASUALIZADOS (DBC)

MAE Planejamento e Pesquisa I

Análise de Dados Longitudinais Aula

Planejamento e Análise de Experimentos

Projeto de Experimentos

Cap. 9 Comparação entre tratamentos

DPS1037 SISTEMAS DA QUALIDADE II ENGENHARIA DE PRODUÇÃO CT/UFSM

Análise de Dados Longitudinais Modelos de Regressão - Perspecitva Histórica

Lucas Santana da Cunha 28 de setembro de 2018 Londrina

Especialização em Engenharia de Processos e de Sistemas de Produção

ÍNDICE. Variáveis, Populações e Amostras. Estatística Descritiva PREFÁCIO 15 NOTA À 3ª EDIÇÃO 17 COMO USAR ESTE LIVRO? 21 CAPÍTULO 1 CAPÍTULO 2

Verificando as pressuposições do modelo estatístico

4. Experimentos em Blocos aleatorizados, quadrados latinos e experimentos relacionados. 4.4 Experimentos em Blocos Incompletos Balanceados

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

Experimentos Fatoriais

DELINEAMENTO INTEIRAMENTE CASUALIZADO. Profª. Sheila Regina Oro

Análise da Variância. Prof. Dr. Alberto Franke (48)

Inferência para várias populações normais análise de variância (ANOVA)

Delineamento e Análise Experimental Aula 6. Anderson Castro Soares de Oliveira

Testes de Hipóteses. : Existe efeito

Métodos Quantitativos para Avaliação de Políticas Públicas

Modelos de Regressão Linear Simples - Análise de Resíduos

ANÁLISE DE VARIÂNCIA (ANOVA) Prof. Anderson Rodrigo da Silva

Análise de Variância e outras análises. Airlane P. Alencar

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

Estatística Básica. 13 de maio de 2009

ANÁLISE DE VARIÂNCIA DE DOIS CRITÉRIOS (DBC)

UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO. PROJETO DE EXTENSÃO Software R: de dados utilizando um software livre.

rio de Guerra Eletrônica EENEM 2008 Estatística stica e Probabilidade de Variância (ANOVA) 1/24

Estatística aplicada a ensaios clínicos

ANÁLISE DE VARIÂNCIA - ANOVA. Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística - PPGEMQ / PPGEP - UFSM

Delineamento e Análise Experimental Aula 5

Conceitos Básicos Teste t Teste F. Teste de Hipóteses. Joel M. Corrêa da Rosa

Escola Superior de Agricultura Luiz de Queiroz Universidade de São Paulo. Testes de Comparações Múltiplas

Análise de Variância a um factor

Mario de Andrade Lira Junior lira.pro.br\wordpress

Aula 2 Uma breve revisão sobre modelos lineares

Testes de Hipótese para Comparação de 3 ou mais Médias

Estimação e Testes de Hipóteses

Apontamentos de Introdução às Probabilidades e à Estatística

Capacitação em R e RStudio PROJETO DE EXTENSÃO. Software R: capacitação em análise estatística de dados utilizando um software livre.

Esquema Fatorial. Esquema Fatorial. Lucas Santana da Cunha 06 de outubro de 2018 Londrina

POPULAÇÃO X AMOSTRA INTRODUÇÃO À BIOESTATÍSTICA TIPOS DE VARIÁVEIS CLASSIFICAÇÃO DAS VARIÁVEIS CLASSIFICAÇÃO DAS VARIÁVEIS 1) TIPOS DE VARIÁVEIS

Planejamento de Experimentos. 13. Experimentos com fatores aleatórios

EXPERIMENTAÇÃO AGRÍCOLA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

EXPERIMENTAÇÃO AGRÍCOLA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

PHD 5742 Estatística Aplicada ao Gerenciamento dos Recursos Hídricos

Delineamento e Análise Experimental Aula 4

UNIVERSIDADE FEDERAL DA PARAÍBA

Em aplicações práticas é comum que o interesse seja comparar as médias de duas diferentes populações (ambas as médias são desconhecidas).

Capítulo 11 Análise da Variância. Statistics for Managers Using Microsoft Excel, 5e 2008 Prentice-Hall, Inc. Chap 11-1

EXPERIMENTAÇÃO AGRÁRIA

Aula 7. Testes de Hipóteses Paramétricos (II)

Aula 7. Testes de Hipóteses Paramétricos (II)

Regression and Clinical prediction models

AULA 07 Inferência a Partir de Duas Amostras

Modelos de Regressão Linear Simples - Análise de Resíduos

5. Carta de controle e homogeneidade de variância

ESQUEMA FATORIAL. Lucas Santana da Cunha Universidade Estadual de Londrina Departamento de Estatística

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27

Experimentos Balanceados com Dois Fatores

Planejamento e Pesquisa 1. Dois Grupos

Estatística. Guia de Estudos P2

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

ANOVA - parte I Conceitos Básicos

DELINEAMENTO EM BLOCOS CASUALIZADOS COM REPETIÇÕES. Profª. Sheila Regina Oro

UNIVERSIDADE FEDERAL DA PARAÍBA

Análise Multivariada Aplicada à Contabilidade

Testes de Hipóteses para. uma Única Amostra. Objetivos de Aprendizagem. 9.1 Teste de Hipóteses. UFMG-ICEx-EST-027/031 07/06/ :07

Análise de Regressão EST036

Transcrição:

1 / 30 Planejamento de Experimentos Suposições do Modelo e Comparações Múltiplas Enrico A. Colosimo/UFMG Depto. Estatística - ICEx - UFMG

2 / 30 Exemplo típico: Resistência de uma nova fibra sintética para camisas de homens. (Montgomery, 1997, p.63) Um engenheiro de produto está interessado em investigar a resistência de uma nova fibra sintética. A resistência é afetada pela porcentagem de algodão usada na produção do tecido. O engenheiro decide testar o novo tecido com diferentes porcentagens de algodão: 15, 20, 25, 30 e 35 %. A resposta é a resistência da fibra medida em libra/polegada 2. O experimento usou 5 réplicas para cada nível do fator.

3 / 30 Exemplo típico: Resistência de uma nova fibra sintética para camisas de homens (Montgomery, 1997, p.63) Como realizar a aleatorização se temos somente um processo para produzir a fibra? Necessário aleatorizar a ordem/sequência de produção/medida da fibra. A aleatorização evita possíveis efeitos de variáveis de perturbação. Por exemplo: aquecimento, desgaste, aprendizado, etc.

4 / 30 Exemplo: Resistência da fibra sintética Tabela: Resistência da fibra sintética.(em libra/polegada 2 ) Réplicas Porcentagem de Algodão 15 20 25 30 35 1 7 12 14 19 7 2 7 17 18 25 10 3 15 12 18 22 11 4 11 18 19 19 15 5 9 18 19 23 11 7 12 14 19 7 Média 9,8 15,4 17,6 21,6 10,8 DP 3,3 3,1 2,1 2,6 2,9 Média e desvio-padrão para o conjunto de dados são: 15,0 e 5,2.

5 / 30 Boxplot Resistência (lb/pol2) 10 15 20 25 15 20 25 30 35 % Algodão

6 / 30 Fontes de variação De forma análoga, temos a seguinte tabela de análise de variância. Tabela: Tabela da Análise de Variância - ANOVA. Fontes de variação SQ GL QM F p-valor Entre os grupos 475,8 4 118, 94 14,765 < 0.001 Dentro dos grupos 161.2 20 8, 06 - - Total 637,0 24 - - -

7 / 30 Modelo Estatístico para Efeitos Fixos Y ij = µ + τ i + ɛ ij em que Y ij é o valor da resposta da j-ésima observação (j = 1,..., n) no i-ésimo nível do fator (i = 1,..., a); µ: efeito geral da média: τ i : efeito do i-ésimo tratamento. Var(ɛ ij ) = σ 2 Y ij N(µ + τ i, σ 2 )

8 / 30 Condições para o uso da ANOVA Para que os resultados da Análise de Variância sejam válidos, é necessário que: Os desvios padrões das distribuições das respostas dos grupos serem iguais (HOMOCEDASTICIDADE); e, a distribuição das respostas de cada grupo deve ser normal (NORMALIDADE). Independência das observações. A ANOVA é razoavelmente robusta a afastamentos da normalidade e da homocedasticidade, especialmente se os tamanhos amostrais forem grandes.

9 / 30 Como verificar as suposições da ANOVA? 1 Uma ferramente útil para esta tarefa são os resíduos do ajuste da ANOVA. 2 Os resíduos são definidos da seguinte forma: e ij = Y ij Ŷij = Y ij ˆµ ˆτ i = Y ij Ȳi. em que ˆµ e ˆτ i são os valores estimados pelos dados.

10 / 30 Verificando as suposições da ANOVA 1 HOMOCEDASTICIDADE Teste Bartlett ou Levene (σ 2 1 =... = σ2 a). Gráfico de resíduo (e ij ) vs ajustados (Y i. ) (não deve exibir tendências sob homocedasticidade) ou o gráfico Y i. vs e ij. 2 NORMALIDADE Teste Shapiro-Wilks, etc. Gráfico de Probabilidade Normal dos resíduos.

11 / 30 Exemplo: Resistência de Tecido Bartlett: valor-p = 0,9198 / Levene: valor-p=0,8626 (Validando a homocedasticidade) Shapiro-Wilks: valor-p = 0,182 (Validando a normalidade). As suposições, desta forma, foram consideradas satisfeitas.

Exemplo: Resistência de Tecido - Gráfico de Resíduos Residuals vs Fitted Normal Q Q Residuals 4 2 0 2 4 6 3 24 21 Standardized residuals 1 0 1 2 21 24 3 10 12 14 16 18 20 22 2 1 0 1 2 Fitted values Theoretical Quantiles Standardized residuals 0.0 0.4 0.8 1.2 3 24 21 Scale Location 10 12 14 16 18 20 22 Standardized residuals 1 0 1 2 Constant Leverage: Residuals vs Factor Levels 3 24 21 Algodao : 15 20 25 30 35 12 / 30

13 / 30 O que fazer se as suposições não valerem? 1 Testes Não-Paramétrico: Kruskal-Wallis, permutação, etc. 2 Transformação na Resposta. 3 Etc e etc...

14 / 30 Procedimentos de comparações múltiplas Um valor de F significativo indica a existência de pelo menos uma diferença entre os grupos estudados. A identificação de diferenças particulares entre médias, tomando-as duas a duas, deve ser realizada por um dos vários métodos de Comparações Múltiplas entre Médias existentes na literatura. Estes testes são semelhantes ao test t, com a diferença de que controlam o nível de significância ao levar em consideração o número de comparações a serem realizadas.

15 / 30 Tipo de Erro Família: Uma família de testes é um conjunto de testes baseado em alguma medida de erro global. Taxa de erro da família: (familywise error rate): é a probabilidade de rejeitarmos incorretamente ao menos umas das hipóteses nulas que compõem a família. Taxa de erro por comparação (per-comparison error rate): é a probabilidade de rejeitarmos incorretamente cada uma das hipóteses nulas que compõem a família.

16 / 30 Probabilidade de Erro Na presença de k tratamentos (ou níveis), temos comparações de pares de médias. ( a 2 ) = a(a 1) 2 A probabilidade de cometermos pelo menos um erro do tipo I é muito maior que α (note que estamos realizando vários testes simultaneamente). É difícil calcular de maneira exata a probabilidade global de erro (do tipo I) envolvendo comparações múltiplas. Uma cota superior para a probabilidade global de erro é dada por P(m erros tipo I 1) = 1 (1 α) m. OBS: a cota superior apresentada acima é obtida assumindo que as comparações entre os pares de médias são independentes (o que de fato não ocorre na prática).

17 / 30 Procedimentos de comparações múltiplas Correção de Bonferroni: simples e ineficiente. O procedimento de Bonferroni consiste em corrigir o valor do nível de significância α, calculando-se α = α m em que α é o nível de significância global e m é o número de comparações a serem realizadas (m = ( a 2), para a grupos). Por exemplo, para o caso de a = 5 populações, o total de testes é m = 10. Se definimos o nível de significância global em 5%, devemos utilizar α 0, 05 = = 0, 005 10 para cada teste individual.

18 / 30 Procedimentos de comparações múltiplas Correção de Bonferroni Para realizar um teste da hipótese nula devemos calcular t ij = H 0 : τ i = τ j ȳ i. ȳ j. s 2E [(1/n) + (1/n)]. Este é um teste t para duas médias. No entanto, utilizamos a informação das a amostras, s 2 E. Sob a hipótese nula, t ij tem uma distribuição t com N a graus de liberdade.

19 / 30 Outros Procedimentos de Comparações Múltiplas Tukey, Schefée, etc. Cada método fornece um valor de referência que deve ser comparado às diferenças de médias amostrais. De forma equivalente, eles fornecem um intervalo de confiança para a diferença de médias. Um procedimento usual consiste em: (1) ordenar as médias amostrais; (2) compará-las utilizando um método de comparação múltipla.

20 / 30 Comparações Múltiplas Método de Tukey O método de comparações múltiplas de Tukey é bastante popular por ser um dos mais antigos e razoavelmente eficiente. Neste teste, duas média amostrais são comparadas usando ( S T (1 α);a,n a 1 s 2 2 E n + 1 ) n em que S T (1 α);a,n a é o quantil de probabilidade (1 α) da distribuição Studentizada com a e N a graus de liberdade.

21 / 30 Comparações Múltiplas Método de Tukey A hipótese H 0 : τ i = τ j é rejeitada se ȳ i. ȳ j. S ( T (1 α);a,n a 1 s 2 2 E n + 1 ) n

22 / 30 Outros Procedimentos de Comparações Múltiplas Teste de Scheffé Neste teste a hipótese nula H 0 : τ i = τ j é rejeitada se ȳ i. ȳ j. ( 1 (a 1)F (1 α);a 1,N a se 2 n + 1 ) n em que, F (1 α) é o quantil de probabilidade (1 α) da distribuição F a 1,N a.

Comparações Múltiplas Forma alternativa de apresentar o Método de Tukey 90% family wise confidence level 35 30 30 25 30 20 35 15 25 15 15 10 5 0 5 10 15 Differences in mean levels of Algodao 23 / 30

24 / 30 Outro Exemplo: Volume expiratório forçado (FEV) (Pagano e Gauvreau, 2004, p.256) Deseja-se comparar o volume expiratório forçado de pacientes com doença coronária oriundos de três centros médicos diferentes (21 pacientes da Johns Hopkins University School of Medicine, 16 pacientes do Rancho Los Amigos Medical Center e 23 pacientes da St. Louis University School of Medicine). Ou seja, deseja-se testar a hipótese H 0 : τ 1 = τ 2 = τ 3 = 0 contra a alternativa de que pelo menos duas médias populacionais são diferentes. É possível aleatorizar?

25 / 30 Exemplo: Volume expiratório forçado (FEV) Tabela: Volume expiratório forçado em 1 segundo para pacientes com doença coronária de três diferentes centros médicos.(em litros) Johns Hopkins Rancho Los Amigos St. Louis 3,23 2,57 3,22 2,61 2,79 3,17 3,47 2,08 2,88 3,39 3,22 2,23 1,86 2,47 1,71 3,17 2,25 2,19 2,47 2,47 2,89 2,98 4,06 3,01 2,74 3,77 2,47 1,98 1,69 2,88 3,29 2,77 2,81 2,10 2,63 3,39 2,95 2,85 2,81 2,53 3,86 3,56 2,43 3,28 2,64 2,88 3,20 3,36 2,71 2,63 3,53 2,61 2,71 3,38 2,91 3,41 3,07 1,98 2,87 2,81 n 1 = 21 n 2 = 16 n 3 = 23 x 1 = 2, 63 litros x 2 = 3, 03 litros x 3 = 2, 88 litros s 1 = 0, 496 litros s 2 = 0, 523 litros s 3 = 0, 498 litros

26 / 30 Exemplo: FEV - Análise Descritiva - Box-plots 2.0 2.5 3.0 3.5 4.0 1 2 3 Figura: 1- John Hopkins, 2- Rancho Los Amigos e 3- St. Louis.

27 / 30 Teste NP - Kruskal-Wallis O teste de Kruskal-Wallis compara medianas e não médias. Todo teste não-paramétrico, basicamente, não tem suposições. O teste é baseado na ordenação dos dados amostrais. O teste de Kruskal-Wallis é menos eficiente que o teste-f. O primeiro passo de um teste não-paramétrico é ordenar todas as observações como se elas fossem de uma única amostra.

28 / 30 Exemplo: Teste Kruskal-Wallis Amostra I Amostra II Amostra III Posto Valor Posto Valor Posto Valor 2 3 1 2 10,5 9 3,5 5 3,5 5 14 12 5,5 7 5,5 7 16,5 16 7,5 8 7,5 8 18 18 10,5 9 10,5 9 19 19 10,5 9 15 15 20 20 13 11 16,5 16 21 24 T 1 (soma)=52,5 T 2 (soma)=59,5 T 3 (soma)=119

29 / 30 Exemplo: Teste Kruskal-Wallis Estatística de Kruskal-Wallis é: H = 12(n 1(T 1 T ) 2 +... n k (T k T ) 2 ) n(n + 1) Sob a hipótese de não haver diferença entre os grupos, H tem uma distribuição qui-quadrado com k 1 graus de liberdade. No exemplo, temos que: T 1 = 52, 5/7 = 7, 5, T 2 = 59, 5/7 = 8, 5, T 3 = 119/7 = 17 e T = 7.5+8.5+17 3 = 11 H = 12(7(7, 5 11)2 + 7(8, 5 11) 2 + 7(17 11) 2 2122)) valor-p = 0,0067, obtido a partir da qui-quadrado com 2 gl. Exemplo: VEF valor-p= 0,0498. = 9, 91

30 / 30 Conclusão Final: Exemplo VEF A média do FEV dos pacientes da Johns Hopkins é significativa menor que a daqueles do Rancho Los Amigos. Nenhuma outra diferença foi detectada. Intervalo de 90% de Confiança para a diferença média foi: ȳ 1. ȳ 2. ± t 57;1 (0,1/2 3) s 2 E [(1/n 1) + (1/n 2 )] = 2, 63 3, 03 ± 2, 18 0, 25[(1/21) + (1/16)] = ( 0, 77; 0, 04) ( 0, 68; 0, 12). Ou seja, o FEV médio dos pacientes do centro médico de Rancho Los Amigos é cerca de 0,4 l (IC; 90%, 0,04;0,77) maior que o FEV médio daqueles da Johns Hopkins.