Cap. 9 Comparação entre tratamentos

Documentos relacionados
PROBABILIDADE E ESTATÍSTICA INFERÊNCIA ESTATÍSTICA Parte II

PROBABILIDADE E ESTATÍSTICA INFERÊNCIA ESTATÍSTICA. Prof.ª Sheila Regina Oro Projeto Recursos Educacionais Digitais

Tópicos Extras 1ª parte. Testes Não Paramétricos, Análise Multivariada, Outras Técnicas

Pedro Alberto Barbetta / Marcelo Menezes Reis / Antonio Cezar Bornia São Paulo: Atlas, 2004

Cap. 11 Testes de comparação entre duas amostras

Probabilidade e Estatística

DELINEAMENTO EM BLOCOS AO ACASO

5.3 Experimentos fatoriais a dois fatores. Ambos os fatores são supostos fixos e os efeitos de tratamento são definidos como desvios da média tal que

PROJETO E ANÁLISES DE EXPERIMENTOS (PAE) EXPERIMENTOS COM DOIS FATORES E O PLANEJAMENTO FATORIAL

Estatística para Cursos de Engenharia e Informática

PROBABILIDADE E ESTATÍSTICA INFERÊNCIA ESTATÍSTICA

Poder do teste e Tamanho de Amostra

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

Delineamento e Análise Experimental Aula 3

Cap. 6 Variáveis aleatórias contínuas

ANÁLISE DE VARIÂNCIA DE DOIS CRITÉRIOS (DBC)

Cap. 6 Variáveis aleatórias contínuas

DELINEAMENTO FATORIAL. Profª. Sheila Regina Oro

EXPERIMENTAÇÃO AGRÁRIA

ANÁLISE DE VARIÂNCIA - ANOVA. Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística - PPGEMQ / PPGEP - UFSM

Delineamento em Quadrado Latino (DQL)

AULA 05 Teste de Hipótese

Estimação parâmetros e teste de hipóteses. Prof. Dr. Alberto Franke (48)

BIOESTATÍSTICA. Parte 5 Testes de Hipóteses

Métodos Estatísticos Avançados em Epidemiologia

Testes de Hipóteses sobre a média: Várias Amostras

AULA 04 Teste de hipótese

Experimentos em Parcelas Subdivididas

Lucas Santana da Cunha de outubro de 2018 Londrina

ANÁLISE DE VARIÂNCIA DE UM CRITÉRIO (DIC)

Esquema Fatorial. Lucas Santana da Cunha Universidade Estadual de Londrina

DELINEAMENTO EM QUADRADO LATINO (DQL)

Estatística para Cursos de Engenharia e Informática. Cap. 2 O planejamento de uma pesquisa

Lucas Santana da Cunha de outubro de 2018 Londrina

DELINEAMENTO INTEIRAMENTE CASUALIZADO. Profª. Sheila Regina Oro

COMPARAÇÕES MÚLTIPLAS

Projeto de Experimentos

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

EXPERIMENTAÇÃO AGRÁRIA

Estimação e Testes de Hipóteses

ESTATÍSTICA EXPERIMENTAL

Princípios de Bioestatística

Conceitos Básicos Teste t Teste F. Teste de Hipóteses. Joel M. Corrêa da Rosa

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

Cap. 4 - Probabilidade

Capítulo 11 Análise da Variância. Statistics for Managers Using Microsoft Excel, 5e 2008 Prentice-Hall, Inc. Chap 11-1

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves

Probabilidade e Estatística

AULA 07 Inferência a Partir de Duas Amostras

Planejamento de Experimentos Introdução - Teste t

Análise Multivariada Aplicada à Contabilidade

Inferência a partir de duas amostras

Modelo g.l. SQ Retas concorrentes ,46 Retas paralelas ,22 Retas com intercepto comum ,49 Retas coincidentes ,23

Estatística para Cursos de Engenharia e Informática

DELINEAMENTO EM BLOCOS CASUALIZADOS (DBC)

DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA)

Cap. 5 Variáveis aleatórias discretas

Delineamento e Análise Experimental Aula 4

Teste de hipótese de variância e Análise de Variância (ANOVA)

Teste de hipótese de variância e Análise de Variância (ANOVA)

EXPERIMENTAÇÃO AGRÍCOLA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

Esse material foi extraído de Barbetta (2007 cap 13)

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves

EXPERIMENTOS EM PARCELAS SUBDIVIDIDAS

Planejamento de Experimentos. 13. Experimentos com fatores aleatórios

Análise da Variância. Prof. Dr. Alberto Franke (48)

Experimentos Fatoriais

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

Inferência para duas populações

Métodos Quantitativos em Medicina. Prof. Neli Ortega

Planejamento de Experimentos Experimento com um fator aleatório

CE001 - BIOESTATÍSTICA TESTE DO QUI-QUADRADO

(a) Teste e IC para Duas Variâncias. (b) Teste para médias. Duas Amostras de Teste T e IC

Análise da Variância (ANOVA)

EXPERIMENTO FATORIAL BLOCADO PARA DETERMINAÇÃO DE DIFERENÇAS ENTRE TEMPO DE QUEIMA DE VELAS DE PARAFINA

EXPERIMENTAÇÃO AGRÍCOLA

Carlos Antonio Filho

MINISTE RIO DA EDUCAÇA O UNIVERSIDADE FEDERAL DE LAVRAS DEPARTAMENTO DE CIE NCIAS EXATAS

Concurso Público para provimento de cargo efetivo de Docentes

Análise de Dados Longitudinais Aula

Análise de Variância com mais de duas variáveis independentes (mais de dois fatores) Na aula do dia 17 de outubro (aula #08) introduzimos

Aula 2 Uma breve revisão sobre modelos lineares

EXPERIMENTOS EM PARCELAS SUBDIVIDIDAS

Modelo de Regressão Múltipla

ESQUEMA FATORIAL. Lucas Santana da Cunha Universidade Estadual de Londrina Departamento de Estatística

Correlação e Regressão Linear

Esquema Fatorial. Esquema Fatorial. Lucas Santana da Cunha 06 de outubro de 2018 Londrina

Análise de variância (ANOVA)

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

DIC com número diferente de repetições por tratamento

Transcrição:

Estatística para Cursos de Engenharia e Informática Pedro Alberto Barbetta / Marcelo Menezes Reis / Antonio Cezar Bornia São Paulo: Atlas, 004 Cap. 9 Comparação entre tratamentos APOIO: Fundação de Apoio à Pesquisa Científica e Tecnológica do Estado de Santa Catarina (FAPESC) Departamento de Informática e Estatística UFSC (INE/CTC/UFSC)

Amostras independentes Exemplo 9.1 Considere o problema de comparar dois materiais (A e B), para sola de tênis, em termos do grau de desgaste após um certo período de uso. Seguem dois projetos de experimentos alternativos: Projeto I Um grupo de indivíduos usa tênis com solas feitas com o material A; e outro grupo usa tênis com solas feitas com o material B.

Amostras independentes Material A divisão aleatória Material B Mensuração do grau de desgaste Mensuração do grau de desgaste

Amostras pareadas (se g >, em blocos ) Exemplo 9.1: Projeto II Fabricam-se, para a realização do experimento, pares de tênis com os dois tipos de sola, isto é, um dos pés com o material A e o outro pé com o material B. Em cada par, o material usado em cada pé (direito ou esquerdo) é decidido por sorteio

Amostras pareadas (se g >, em blocos ) Alocação aleatória de A e B em cada par A B A B B A B A A B Mensuração do grau de desgaste

Amostras pareadas Importância de considerar os pares na análise: desgaste desgaste material A material B 1 3 4 5 criança

Teste t para duas amostras H 0 : µ 1 = µ e H 1 : µ 1 µ onde: µ 1 é o valor esperado da resposta sob o tratamento 1 e µ é o valor esperado da resposta sob o tratamento. Na abordagem unilateral, a hipótese alternativa é do tipo H 1 : µ 1 > µ ou H 1 : µ 1 < µ.

Teste t para duas amostras pareadas Exemplo 9. Seja o problema de verificar se um novo algoritmo de busca em um banco de dados é mais rápido que o algoritmo atualmente usado. Para se fazer a comparação dos dois algoritmos, planeja-se realizar uma amostra aleatória de 10 buscas experimentais (ensaios). Em cada ensaio, uma dada busca é realizada pelos dois algoritmos e o tempo de resposta de cada algoritmo anotado. Observamos que em cada ensaio os dois algoritmos são usados em condições idênticas, caracterizando 10 pares de observações.

Teste t para duas amostras pareadas H 0 : em média, os dois algoritmos são igualmente rápidos e H 1 : em média, o algoritmo novo é mais rápido do que o algoritmo em uso. Ou: H 0 : µ = µ 1 e H 1 : µ 1 < µ onde: µ 1 é o tempo esperado de resposta do algoritmo novo e µ é o tempo esperado de resposta do algoritmo antigo.

Dados: Tempo de resposta (s) Ensaio Novo X 1 Antigo X Diferença D = X -X 1 1 3 4 5 6 7 8 9 10 1 8 30 33 33 6 4 31 5 8 6 36 3 39 8 33 30 7 3 7-6 -1 6 9-1 5

Teste t para duas amostras pareadas Estatística do teste t = d n s d onde: n é o tamanho da amostra (número de pares); é a média das diferenças observadas; e é o desvio padrão das diferenças observadas. d s d Usa distribuição t de Student com gl = n 1graus de liberdade (supondo populações com distribuição normal).

Exemplo 9. (continuação) Valores de D: 3, 7, -, 6, -1, 6,, 9, -1, 5 n = 10 d = 3,4 s d = n 1 1 i d i n.d = 46 ( 10)( 3,4) 9 = 3, 81 t = d. s d n = 3, 4. 10 3, 81 =, 8

Exemplo 9. (continuação). Teste considerando nível de significância de 5%. Abordagem do Valor p: Conclusão: rejeita H 0. Ver comentários e abordagem clássica no livro.

Teste t para duas amostras independentes Exemplo 9.3 Desejamos verificar se os catalisadores A e B têm efeitos diferentes no rendimento de uma certa reação química. As hipóteses são: H 0 : em média, os dois catalisadores são iguais em termos de rendimento; e H 1 : em média, os dois catalisadores são diferentes em termos de rendimento. Ou, ainda: H 0 : µ 1 = µ e H 1 : µ 1 µ, onde µ 1 : rendimento esperado com o catalisador A; e µ : rendimento esperado com o catalisador B.

Exemplo 9.3 amostras: Tabela 9. Rendimentos (%) de uma reação química em função do catalisador utilizado. catalisador A 45 51 50 6 43 4 53 50 48 55 catalisador B 45 35 43 59 48 45 41 43 49 39

Exemplo 9.3 amostras: catalizador A catalizador B 30 35 40 45 50 55 60 65 rendimento (%)

Teste t para duas amostras independentes Estatística do teste Se n 1 = n = n: s1 + s a = t = s n ( x ) 1 x s a n: tamanho da amostra em cada grupo; média da amostra 1 média da amostra x 1 x s 1 s s a variância da amostra 1 variância da amostra variância agregada das duas amostras Usa distribuição t de Student com gl = n graus de liberdade (supondo populações com distribuição normal).

Exemplo 9.3 (continuação). Abordagem valor p Portanto, 0,05 < Valor p < 0,10 Aceita H 0. Ver comentários, abordagem clássica e exemplo com n 1 n no livro.

Comparação entre vários tratamentos. Amostras independentes Análise de variância (ANOVA), que supõe: as observações devem ser independentes; as variâncias populacionais devem ser iguais nos g grupos; e a distribuição das observações em cada grupo deve ser normal.

Exemplo 9.4: Comparação de três tipos de rede. Considere o problema de comparar 3 tipos de rede de computadores, C1, C e C3, em termos do tempo médio de transmissão de pacotes de dados entre duas máquinas. Experimento (projeto completamente aleatorizado com um fator): 8 replicações com cada tipo de rede, aleatorizando a ordem dos 4 ensaios e mantendo fixos os demais fatores controláveis.

Exemplo 9.4 : Projeto do experimento. ensaios de 1 a 8: C1 ensaios de 9 a 16: C ensaios de 17 a 4: C3 Seqüência número Uso da dos testes do ensaio rede 1 16 C 14 C 3 4 C3 4 6 C1 4 11 C3

Exemplo 9.4. Dados do experimento: Seqüência número Tempo de dos testes do ensaio Rede resposta (y) 1 16 C 7,8 14 C 8, 3 4 C3 6,3 4 6 C1 7, 4 11 C 7,8

Exemplo 9.4: Perguntas a serem respondidas pela análise estatística. Existe diferença real (significativa) entre os 3 tipos de rede? Qual é a estimativa do tempo de resposta para cada tipo de rede?

Exemplo 9.4: Dados do experimento Tipo de rede Replicação C1 C C3 1 7, 7,8 6,3 9,3 8, 6,0 3 8,7 7,1 5,3 4 8,9 8,6 5,1 5 7,6 8,7 6, 6 7, 8, 5, 7 8,8 7,1 7, 8 8,0 7,8 6,8 Soma 65,7 63,5 48,1 Média 8,1 7,94 6,01

Modelo da ANOVA g = 3 grupos tratamento (1) () (3) y 11 y 1 y 31 ij y 1 y y 3 Média y 1n y n y 3n global: Média: y y 1.. y 3. y.. y = µ + τ + e i = 1,, 3 i ij j = 1,,, n observação média global efeito do tratamento i erro aleatório µ = µ + i τ i = média do fator i

Hipóteses H 0 : τ 1 = τ == τ g = 0 ou µ 1 = µ == µ g H 1 : τ i 0 ou µ i µ j para algum i para algum par (i, j) As observações Sob H 1 : Sob H 0 : y = + τ + ij µ e y = µ + e i ij ij ij

ij Hipóteses e modelo subjacente y = τ + Sob H 0 : τ 1 = τ == τ g = 0 µ + i eij y ij = µ + eij

Hipóteses e modelo subjacente Sob H 1 : τ i 0 para algum i y = µ + τ + ij i e ij

Análise de variância (ANOVA) com um fator Replicação 1 n Soma Média 1 y 11 y 1 y 1 y Tratamento y g1 y g y 1n y n y gn y 1. y. y g. y 1. y. y g. g y.. = y i. 1 y.. = y i. g i i Soma de quadrados total: SQ Tot = g n ( y ) ij y.. i= 1 j = 1 Graus de liberdade: gl = N -1 onde: N = ng

Análise de variância (ANOVA) com um fator Replicação 1 n Soma Média 1 y 11 y 1 y 1 y Tratamento y g1 y g y 1n y n y gn y 1. y. y g. y 1. y. y g. g y.. = y i. 1 y.. = y i. g i i Soma de quadrados dos tratamentos: SQ Trat = g n ( yi. y.. ) = n ( yi. y.. ) i= 1 j= 1 g i= 1 Graus de liberdade: gl = g -1

Análise de variância (ANOVA) com um fator Replicação 1 n Soma Média 1 y 11 y 1 y 1 y Tratamento y g1 y g y 1n y n y gn y 1. y. y g. y 1. y. y g. g y.. = y i. 1 y.. = y i. g i i Soma de quadrados do erro: SQ Erro = g n ( y ) ij yi. i= 1 j= 1 Graus de liberdade: gl = N - g

Análise de variância (ANOVA) com um fator Fórmulas equivalentes às anteriores Estatística do teste (possíveis valores da razão f): f = QM QM Trat Erro

Teste F Se H 0 : τ 1 = τ == τ g = 0 for verdadeira e considerando as suposições anteriormente enunciadas, a estatística f tem distribuição F com (g - 1) graus de liberdade no numerador e (N - g) graus de liberdade no denominador. 0,75 Densidade de probabilidade F densidade de probabilidade 0,50 valor p 0,5 0,00 0 1 3 4 possíveis valores da estatística F, sob H 0 f

Regra de decisão. Abordagem valor p α = nível de significância (probab. tolerável de se rejeitar H o quando esta for verdadeira) Usual: α = 0,05 = 5% p α rejeita H 0 (prova-se estatisticamente H 1 ) p > α aceita H 0 (os dados não mostram evidência para afirmar H 1 )

Teste F Ver no livro como usar a Tabela F e como fazer o teste pela abordagem clássica.

Análise dos resíduos Avaliação das suposições da ANOVA através de gráficos dos resíduos: 1,5 Resíduos x fator 3 Gráfico de probabilidade normal Resíduos 1,0 0,5 0,0-0,5-1,0 Valor esperado pela normal 1 0-1 - 0,99 0,95 0,75 0,55 0,35 0,15 0,05 0,01-1,5 C1 C C3 Rede -3-1 0 1 Resíduos

Estimação das médias Intervalo de confiança para o valor esperado da resposta sob o i-ésimo tratamento (nível de conf. γ): IC( µ, γ ) y ± t i = i. γ QM n erro Tempo de transmissão 9,5 9,0 8,5 8,0 7,5 7,0 6,5 6,0 5,5 5,0 C1 C C3 Rede

Teste F para amostras em blocos Notação para os dados: Tratamento Bloco 1 g Soma 1 y 11 y 1 y g1 y.1 y 1 y y g y. h y 1h y h y gh y.h Soma y 1. y. y g. y.. y i y. j i j =. =

Modelo para os dados Yij = µ + τ + β + i j ε ij µ τ i β j ε ij é a média global da resposta; é o efeito do i-ésimo tratamento; é o efeito do j-ésimo bloco; e é o efeito aleatório (i = 1,,, g; j = 1,,, h).

Teste F para amostras em blocos: quadro da ANOVA

Exemplo 9.5 Seja o problema de comparar 3 algoritmos de busca em um banco de dados. Realiza-se um experimento com 6 buscas experimentais, sendo que em cada uma é sorteado um número aleatório que indica o registro do banco de dados a ser localizado. Em cada um dos 6 processos de busca, são usados separadamente os três algoritmos em estudo, mas sob as mesmas condições, em termos dos fatores controláveis. São anotados os tempos de resposta ao usuário. Hipóteses: H 0 : em média, os três algoritmos são igualmente rápidos; e H 1 : em média, os três algoritmos não são igualmente rápidos

Ensaio (bloco) 1 3 4 5 6 Soma Média Exemplo 9.5 A1 8,3 9,4 9,1 9,9 8, 10,9 55,8 9,3 Algoritmo de busca A 8,1 8,9 9,3 9,6 8,1 11, 55, 9, A3 9, 9,8 9,9 10,3 8,9 13,1 61, 10,

Exemplo 9.5 Fonte da variação SQ gl QM f Algoritmos 3,64 1,8 14,9 Blocos 1,95 5 4,39 Erro 1,7 10 0,13 Total 6,86 17 Qual é a conclusão?

Exemplo 9.5 Densidade de probabilidade F 0,75 densidade de probabilidade 0,50 0,5 Distrib. F gl:, 10 valor p = 0,001 (usando o Excel) 0,00 0 1 3 4 possíveis valores da estatística F, sob H 0 f = 14,9 Conclusão?

ANOVA em projetos fatoriais com fatores Ver comentários sobre esse projeto e as hipóteses no livro.

ANOVA em projetos fatoriais com fatores Notação para os dados: Fator A Fator B 1 g Soma 1 y 111,, y 11n y 11,, y 1n y g11,, y g1n y.1. y 11,, y 1n y 1,, y n y g1,, y gn y.. h y 1h1,, y 1hn y h1,, y hn y gh1,, y ghn y.h. Soma y 1.. y.. y g.. y y i y. j. i j =.. =

ANOVA em projetos fatoriais com fatores Somas de quadrados Somas em cada célula: y ij y ijk. = n k= 1 SQ Subtot g h = i= 1 j= 1 y ij. n y N

ANOVA em projetos fatoriais com fatores

Exemplo 9.6 Considere o problema de comparar 3 topologias de rede de computadores (C1, C e C3) e protocolos (L1 e L), em termos do tempo de resposta ao usuário. Realizou-se um experimento com 4 replicações em cada combinação de topologia e protocolo. Deseja-se verificar se há diferenças entre as topologias, entre os protocolos e eventual interação entre topologia e protocolo. Então, quer-se testar as seguintes hipóteses nulas: H 0 (A) : os tempos esperados de resposta são iguais para as três topologias; H (B) 0 : os tempos esperados de resposta são iguais para os dois protocolos; H (AB) 0 : a mudança de protocolo não altera as diferenças médias do tempo de resposta nas três topologias (ausência de interação).

Dados: Exemplo 9.6

Exemplo 9.6 ANOVA: Quais as conclusões?

Exemplo 9.6 (a) Perfil das médias (b) Análise dos resíduos 10,0 9,5 9,0 8,5 8,0,5,0 1,5 1,0 Tempo 7,5 7,0 L Resíduos 0,5 0,0 6,5 6,0 L1-0,5-1,0 5,5-1,5 5,0 C1 C C3 Topologia -,0 5,5 6,0 6,5 7,0 7,5 8,0 8,5 9,0 9,5 Valores preditos Quais as conclusões?

ANOVA para projetos fatoriais k e k-p Ver no livro as técnicas e exemplos.