Estatística para Cursos de Engenharia e Informática Pedro Alberto Barbetta / Marcelo Menezes Reis / Antonio Cezar Bornia São Paulo: Atlas, 004 Cap. 9 Comparação entre tratamentos APOIO: Fundação de Apoio à Pesquisa Científica e Tecnológica do Estado de Santa Catarina (FAPESC) Departamento de Informática e Estatística UFSC (INE/CTC/UFSC)
Amostras independentes Exemplo 9.1 Considere o problema de comparar dois materiais (A e B), para sola de tênis, em termos do grau de desgaste após um certo período de uso. Seguem dois projetos de experimentos alternativos: Projeto I Um grupo de indivíduos usa tênis com solas feitas com o material A; e outro grupo usa tênis com solas feitas com o material B.
Amostras independentes Material A divisão aleatória Material B Mensuração do grau de desgaste Mensuração do grau de desgaste
Amostras pareadas (se g >, em blocos ) Exemplo 9.1: Projeto II Fabricam-se, para a realização do experimento, pares de tênis com os dois tipos de sola, isto é, um dos pés com o material A e o outro pé com o material B. Em cada par, o material usado em cada pé (direito ou esquerdo) é decidido por sorteio
Amostras pareadas (se g >, em blocos ) Alocação aleatória de A e B em cada par A B A B B A B A A B Mensuração do grau de desgaste
Amostras pareadas Importância de considerar os pares na análise: desgaste desgaste material A material B 1 3 4 5 criança
Teste t para duas amostras H 0 : µ 1 = µ e H 1 : µ 1 µ onde: µ 1 é o valor esperado da resposta sob o tratamento 1 e µ é o valor esperado da resposta sob o tratamento. Na abordagem unilateral, a hipótese alternativa é do tipo H 1 : µ 1 > µ ou H 1 : µ 1 < µ.
Teste t para duas amostras pareadas Exemplo 9. Seja o problema de verificar se um novo algoritmo de busca em um banco de dados é mais rápido que o algoritmo atualmente usado. Para se fazer a comparação dos dois algoritmos, planeja-se realizar uma amostra aleatória de 10 buscas experimentais (ensaios). Em cada ensaio, uma dada busca é realizada pelos dois algoritmos e o tempo de resposta de cada algoritmo anotado. Observamos que em cada ensaio os dois algoritmos são usados em condições idênticas, caracterizando 10 pares de observações.
Teste t para duas amostras pareadas H 0 : em média, os dois algoritmos são igualmente rápidos e H 1 : em média, o algoritmo novo é mais rápido do que o algoritmo em uso. Ou: H 0 : µ = µ 1 e H 1 : µ 1 < µ onde: µ 1 é o tempo esperado de resposta do algoritmo novo e µ é o tempo esperado de resposta do algoritmo antigo.
Dados: Tempo de resposta (s) Ensaio Novo X 1 Antigo X Diferença D = X -X 1 1 3 4 5 6 7 8 9 10 1 8 30 33 33 6 4 31 5 8 6 36 3 39 8 33 30 7 3 7-6 -1 6 9-1 5
Teste t para duas amostras pareadas Estatística do teste t = d n s d onde: n é o tamanho da amostra (número de pares); é a média das diferenças observadas; e é o desvio padrão das diferenças observadas. d s d Usa distribuição t de Student com gl = n 1graus de liberdade (supondo populações com distribuição normal).
Exemplo 9. (continuação) Valores de D: 3, 7, -, 6, -1, 6,, 9, -1, 5 n = 10 d = 3,4 s d = n 1 1 i d i n.d = 46 ( 10)( 3,4) 9 = 3, 81 t = d. s d n = 3, 4. 10 3, 81 =, 8
Exemplo 9. (continuação). Teste considerando nível de significância de 5%. Abordagem do Valor p: Conclusão: rejeita H 0. Ver comentários e abordagem clássica no livro.
Teste t para duas amostras independentes Exemplo 9.3 Desejamos verificar se os catalisadores A e B têm efeitos diferentes no rendimento de uma certa reação química. As hipóteses são: H 0 : em média, os dois catalisadores são iguais em termos de rendimento; e H 1 : em média, os dois catalisadores são diferentes em termos de rendimento. Ou, ainda: H 0 : µ 1 = µ e H 1 : µ 1 µ, onde µ 1 : rendimento esperado com o catalisador A; e µ : rendimento esperado com o catalisador B.
Exemplo 9.3 amostras: Tabela 9. Rendimentos (%) de uma reação química em função do catalisador utilizado. catalisador A 45 51 50 6 43 4 53 50 48 55 catalisador B 45 35 43 59 48 45 41 43 49 39
Exemplo 9.3 amostras: catalizador A catalizador B 30 35 40 45 50 55 60 65 rendimento (%)
Teste t para duas amostras independentes Estatística do teste Se n 1 = n = n: s1 + s a = t = s n ( x ) 1 x s a n: tamanho da amostra em cada grupo; média da amostra 1 média da amostra x 1 x s 1 s s a variância da amostra 1 variância da amostra variância agregada das duas amostras Usa distribuição t de Student com gl = n graus de liberdade (supondo populações com distribuição normal).
Exemplo 9.3 (continuação). Abordagem valor p Portanto, 0,05 < Valor p < 0,10 Aceita H 0. Ver comentários, abordagem clássica e exemplo com n 1 n no livro.
Comparação entre vários tratamentos. Amostras independentes Análise de variância (ANOVA), que supõe: as observações devem ser independentes; as variâncias populacionais devem ser iguais nos g grupos; e a distribuição das observações em cada grupo deve ser normal.
Exemplo 9.4: Comparação de três tipos de rede. Considere o problema de comparar 3 tipos de rede de computadores, C1, C e C3, em termos do tempo médio de transmissão de pacotes de dados entre duas máquinas. Experimento (projeto completamente aleatorizado com um fator): 8 replicações com cada tipo de rede, aleatorizando a ordem dos 4 ensaios e mantendo fixos os demais fatores controláveis.
Exemplo 9.4 : Projeto do experimento. ensaios de 1 a 8: C1 ensaios de 9 a 16: C ensaios de 17 a 4: C3 Seqüência número Uso da dos testes do ensaio rede 1 16 C 14 C 3 4 C3 4 6 C1 4 11 C3
Exemplo 9.4. Dados do experimento: Seqüência número Tempo de dos testes do ensaio Rede resposta (y) 1 16 C 7,8 14 C 8, 3 4 C3 6,3 4 6 C1 7, 4 11 C 7,8
Exemplo 9.4: Perguntas a serem respondidas pela análise estatística. Existe diferença real (significativa) entre os 3 tipos de rede? Qual é a estimativa do tempo de resposta para cada tipo de rede?
Exemplo 9.4: Dados do experimento Tipo de rede Replicação C1 C C3 1 7, 7,8 6,3 9,3 8, 6,0 3 8,7 7,1 5,3 4 8,9 8,6 5,1 5 7,6 8,7 6, 6 7, 8, 5, 7 8,8 7,1 7, 8 8,0 7,8 6,8 Soma 65,7 63,5 48,1 Média 8,1 7,94 6,01
Modelo da ANOVA g = 3 grupos tratamento (1) () (3) y 11 y 1 y 31 ij y 1 y y 3 Média y 1n y n y 3n global: Média: y y 1.. y 3. y.. y = µ + τ + e i = 1,, 3 i ij j = 1,,, n observação média global efeito do tratamento i erro aleatório µ = µ + i τ i = média do fator i
Hipóteses H 0 : τ 1 = τ == τ g = 0 ou µ 1 = µ == µ g H 1 : τ i 0 ou µ i µ j para algum i para algum par (i, j) As observações Sob H 1 : Sob H 0 : y = + τ + ij µ e y = µ + e i ij ij ij
ij Hipóteses e modelo subjacente y = τ + Sob H 0 : τ 1 = τ == τ g = 0 µ + i eij y ij = µ + eij
Hipóteses e modelo subjacente Sob H 1 : τ i 0 para algum i y = µ + τ + ij i e ij
Análise de variância (ANOVA) com um fator Replicação 1 n Soma Média 1 y 11 y 1 y 1 y Tratamento y g1 y g y 1n y n y gn y 1. y. y g. y 1. y. y g. g y.. = y i. 1 y.. = y i. g i i Soma de quadrados total: SQ Tot = g n ( y ) ij y.. i= 1 j = 1 Graus de liberdade: gl = N -1 onde: N = ng
Análise de variância (ANOVA) com um fator Replicação 1 n Soma Média 1 y 11 y 1 y 1 y Tratamento y g1 y g y 1n y n y gn y 1. y. y g. y 1. y. y g. g y.. = y i. 1 y.. = y i. g i i Soma de quadrados dos tratamentos: SQ Trat = g n ( yi. y.. ) = n ( yi. y.. ) i= 1 j= 1 g i= 1 Graus de liberdade: gl = g -1
Análise de variância (ANOVA) com um fator Replicação 1 n Soma Média 1 y 11 y 1 y 1 y Tratamento y g1 y g y 1n y n y gn y 1. y. y g. y 1. y. y g. g y.. = y i. 1 y.. = y i. g i i Soma de quadrados do erro: SQ Erro = g n ( y ) ij yi. i= 1 j= 1 Graus de liberdade: gl = N - g
Análise de variância (ANOVA) com um fator Fórmulas equivalentes às anteriores Estatística do teste (possíveis valores da razão f): f = QM QM Trat Erro
Teste F Se H 0 : τ 1 = τ == τ g = 0 for verdadeira e considerando as suposições anteriormente enunciadas, a estatística f tem distribuição F com (g - 1) graus de liberdade no numerador e (N - g) graus de liberdade no denominador. 0,75 Densidade de probabilidade F densidade de probabilidade 0,50 valor p 0,5 0,00 0 1 3 4 possíveis valores da estatística F, sob H 0 f
Regra de decisão. Abordagem valor p α = nível de significância (probab. tolerável de se rejeitar H o quando esta for verdadeira) Usual: α = 0,05 = 5% p α rejeita H 0 (prova-se estatisticamente H 1 ) p > α aceita H 0 (os dados não mostram evidência para afirmar H 1 )
Teste F Ver no livro como usar a Tabela F e como fazer o teste pela abordagem clássica.
Análise dos resíduos Avaliação das suposições da ANOVA através de gráficos dos resíduos: 1,5 Resíduos x fator 3 Gráfico de probabilidade normal Resíduos 1,0 0,5 0,0-0,5-1,0 Valor esperado pela normal 1 0-1 - 0,99 0,95 0,75 0,55 0,35 0,15 0,05 0,01-1,5 C1 C C3 Rede -3-1 0 1 Resíduos
Estimação das médias Intervalo de confiança para o valor esperado da resposta sob o i-ésimo tratamento (nível de conf. γ): IC( µ, γ ) y ± t i = i. γ QM n erro Tempo de transmissão 9,5 9,0 8,5 8,0 7,5 7,0 6,5 6,0 5,5 5,0 C1 C C3 Rede
Teste F para amostras em blocos Notação para os dados: Tratamento Bloco 1 g Soma 1 y 11 y 1 y g1 y.1 y 1 y y g y. h y 1h y h y gh y.h Soma y 1. y. y g. y.. y i y. j i j =. =
Modelo para os dados Yij = µ + τ + β + i j ε ij µ τ i β j ε ij é a média global da resposta; é o efeito do i-ésimo tratamento; é o efeito do j-ésimo bloco; e é o efeito aleatório (i = 1,,, g; j = 1,,, h).
Teste F para amostras em blocos: quadro da ANOVA
Exemplo 9.5 Seja o problema de comparar 3 algoritmos de busca em um banco de dados. Realiza-se um experimento com 6 buscas experimentais, sendo que em cada uma é sorteado um número aleatório que indica o registro do banco de dados a ser localizado. Em cada um dos 6 processos de busca, são usados separadamente os três algoritmos em estudo, mas sob as mesmas condições, em termos dos fatores controláveis. São anotados os tempos de resposta ao usuário. Hipóteses: H 0 : em média, os três algoritmos são igualmente rápidos; e H 1 : em média, os três algoritmos não são igualmente rápidos
Ensaio (bloco) 1 3 4 5 6 Soma Média Exemplo 9.5 A1 8,3 9,4 9,1 9,9 8, 10,9 55,8 9,3 Algoritmo de busca A 8,1 8,9 9,3 9,6 8,1 11, 55, 9, A3 9, 9,8 9,9 10,3 8,9 13,1 61, 10,
Exemplo 9.5 Fonte da variação SQ gl QM f Algoritmos 3,64 1,8 14,9 Blocos 1,95 5 4,39 Erro 1,7 10 0,13 Total 6,86 17 Qual é a conclusão?
Exemplo 9.5 Densidade de probabilidade F 0,75 densidade de probabilidade 0,50 0,5 Distrib. F gl:, 10 valor p = 0,001 (usando o Excel) 0,00 0 1 3 4 possíveis valores da estatística F, sob H 0 f = 14,9 Conclusão?
ANOVA em projetos fatoriais com fatores Ver comentários sobre esse projeto e as hipóteses no livro.
ANOVA em projetos fatoriais com fatores Notação para os dados: Fator A Fator B 1 g Soma 1 y 111,, y 11n y 11,, y 1n y g11,, y g1n y.1. y 11,, y 1n y 1,, y n y g1,, y gn y.. h y 1h1,, y 1hn y h1,, y hn y gh1,, y ghn y.h. Soma y 1.. y.. y g.. y y i y. j. i j =.. =
ANOVA em projetos fatoriais com fatores Somas de quadrados Somas em cada célula: y ij y ijk. = n k= 1 SQ Subtot g h = i= 1 j= 1 y ij. n y N
ANOVA em projetos fatoriais com fatores
Exemplo 9.6 Considere o problema de comparar 3 topologias de rede de computadores (C1, C e C3) e protocolos (L1 e L), em termos do tempo de resposta ao usuário. Realizou-se um experimento com 4 replicações em cada combinação de topologia e protocolo. Deseja-se verificar se há diferenças entre as topologias, entre os protocolos e eventual interação entre topologia e protocolo. Então, quer-se testar as seguintes hipóteses nulas: H 0 (A) : os tempos esperados de resposta são iguais para as três topologias; H (B) 0 : os tempos esperados de resposta são iguais para os dois protocolos; H (AB) 0 : a mudança de protocolo não altera as diferenças médias do tempo de resposta nas três topologias (ausência de interação).
Dados: Exemplo 9.6
Exemplo 9.6 ANOVA: Quais as conclusões?
Exemplo 9.6 (a) Perfil das médias (b) Análise dos resíduos 10,0 9,5 9,0 8,5 8,0,5,0 1,5 1,0 Tempo 7,5 7,0 L Resíduos 0,5 0,0 6,5 6,0 L1-0,5-1,0 5,5-1,5 5,0 C1 C C3 Topologia -,0 5,5 6,0 6,5 7,0 7,5 8,0 8,5 9,0 9,5 Valores preditos Quais as conclusões?
ANOVA para projetos fatoriais k e k-p Ver no livro as técnicas e exemplos.