Métodos Quatitativos em Cotabilidade Aálise da Variâcia AOVA Prof. José Fracisco Moreira Pessaha professorfmp@hotmail.com Rio de Jaeiro, 8 de setembro de 01
Aálise da Variâcia com um fator (OE WAY AOVA)
Cosidere m populações para as quais queremos testar a hipótese ula de que ão há difereça etre suas médias em uma determiada característica (variável resposta) Por exemplo, cosidere quatro (m=4) empresas de grade porte ligadas em diferetes atividades ecoômicas. Deseamos testar se em média os salários pagos por essas empresas são iguais, idepeedete da atividade ecoômica. H 0 : µ 1 = µ = µ = µ 4 H 1 : µ i µ Itrodução As médias dos salários são iguais as m empresas Pelo meos duas empresas i e têm salários médios diferetes Variável resposta: é aquela cua média queremos comparar, o exemplo é o salário. Fator: característica que pode iifluir sobre a variável resposta (o salário), o exemplo a atividade ecoômica é o fator. O fator pode assumir diferetes íveis ou valores deomiados por tratametos.
Itrodução Evidêcia para reeitar H0 Evidêcia para ão reeitar H0
Aálise de Variâcia com um fator (AOVA Aalysis of Variace) Cosidere m populações. Cada população correspode a diferetes coutos de codições experimetais (tratametos). Em cada população i, i=1,m a variável resposta segue distribuição ormal com média i, e variâcia. X i ~ ( i, ) i=1,k Queremos testar a hipótese ula de que ão há difereças etre suas médias: H 0 : µ 1 = µ = µ =... = µ m H 1 : µ i µ As médias de todas as m populações são iguais Pelo meos duas populações i e têm médias diferetes
Aálise de Variâcia com um fator (AOVA Aalysis of Variace) Pressupostos da AOVA As amostras aleatórias extraídas das diferetes populações são idepedetes Todas as populações tem a mesma variâcia A distribuição da variável resposta é ormal em todas as populações
Modelo com 1 fator a população, a variável resposta tem média µ e variâcia, (=1,m). A i-ésima resposta a -ésima amostra x i tem distribuição (µ, ) x i = µ + i Erro aleatório e pode ser decomposta em três parcelas x i = µ + ( µ - µ ) + i Observação Média global Efeito do -ésimo tratameto
Modelo com um fator De cada população é extraída uma amostra aleatória de tamaho, =1,m. xi x i x i x x x x i x x 1 1 1 i1 x i Observação k m 1i 1 x Estimativa do efeito do -ésimo Média amostral tratameto global i Média de todos os valores amostrados Média amostral da -ésima população Resíduo
Modelo com 1 fator xi i x i x x x x x i Observação x i Estimativa do efeito do -ésimo Média amostral tratameto global x Resíduo x x x x i Desvio da observação em relação a média global Variação total Desvio da média do - ésimo tratameto em relação a média global Variação etre amostras Desvio da observação em relação a média do tratameto Variação detro das amostras
Decomposição da soma dos quadrados totais Acumulado os quadrados dos desvios em todas as m amostras m 1i 1 m x x x x x x i 1 i m 1i 1 i Soma dos quadrados totais TSS Medida da variação total Soma dos quadrados etre amostras BSS (betwee) Parcela da variação devida aos efeitos dos tratametos Soma dos quadrados detro das amostras WSS (withi) Parcela da variação total ão explicada pelos tratametos
Tabela da AOVA m 1 Total de observações Uma evidêcia cotra a hipótese ula é a predomiâcia da parcela da variação etre as amostras a variação total (BSS >> WSS), ou sea, valores grades para a razão BSS/WSS.
Estatística teste Sob H 0 : µ 1 = µ = µ =... = µ m a estatística teste tem distribuição F com m-1 graus de liberdade o umerador e -m o deomiador Estatística teste F BSS WSS m 1 m H 0 é reeitada ao ível de sigificâcia se F F m 1, m
Região de reeição ao ível de sigificâcia Valor crítico = Fm 1, 1- m A hipótese ula é reeita quado o valor calculado da estatística teste F = [BSS/(m-1)]/[WSS/(-m)] é maior que o valor crítico o Excel IVF(alfa;m-1;-m)
Exemplo (Moore et al, 006) Uma empresa trabalha com materiais educacioais cuo públicoalvo são os pais de criaças pequeas. A empresa plaea um ovo produto, cuo propósito é melhorar a compreesão de leitura das criaças. Seu produto baseia-se em ovas idéias em pesquisa educacioal, e ser-lhe-ia iteressate poder afirmar que os ovos métodos promovem uma maior capacidade de compreesão de leitura etre as criaças, em comparação com os métodos tradicioais. O material para o marketig do produto icluirá os resultados de um estudo que comparou duas versões da ova abordagem (DRTA e Estrat) com o método tradicioal (Basal).
Exemplo (Moore et al, 006) Pesquisadores em educação destiam aleatoriamete 66 criaças a três grupos de idivíduos, e em cada um deles se esia por um dos três métodos. Como é comum em estudos desse tipo, aplica-se ates as criaças um pré-teste, que mede sua capacidade de leitura ates de recebeream qualquer istrução. O pré-teste tem por propósito costatar se, o iício do estudo, os três grupos de criaças se assemelham quato a suas habilidade de compreesão de leitura. Os dados sobre os sueitos de cada grupo são apresetados a próxima págia. Deseamos usar a AOVA para testar a hipótese ula de que os três grupos represetam três populações, todas, o mesmo escore médio o pré-teste.
Exemplo (Moore et al, 006) Escores dos idivíduos de cada grupo: m 1 1 amostras 66 X i escore do i-ésimo aluo o -ésimo método i=1,,,..., =1,,
Exemplo (Moore et al, 006) X X X 1 10,50 9,7 9,14 X 9,79 Média basal Média DRTA Média Estrat Média Global H 0 : µ 1 = µ = µ As médias das populações são iguais H 1 : µ i µ Pelo meos dois grupos apresetam médias diferetes
Exemplo (Moore et al, 006) Soma dos Quadrados Totais m xi X 4 1 i1 9,79 7 9,79 11 9,79 9 9,79 10 9,79 8 9,79 59, 0 Soma dos Quadrados Etre m 1 x X 10,5 9,79 9,7 9,79 i 9,14 9,79 0, 58
Exemplo (Moore et al, 006) Soma dos Quadrados Detro m 1 i1 1 x i X xi X1 xi X xi X i1 Soma dos Quadrados Detro i1 i1 4 10,5 6 10,5 9 10,5 7 9,7 7 9,7 10 9,7 11 9,14 7 9,14 8 9,14 57, 45 Calculado de outra forma Soma dos Quadrados Total = + Soma dos Quadrados Etre 57,45 = 59,0 + 0,57
Exemplo (Moore et al, 006) AOVA com ível de sigificâcia alfa igual a 5% Soma dos Quadrados Etre m-1 0,58 / =DISTF(1.1;;6) =IVF(0.05;;6) Soma dos Quadrados Total Soma dos Quadrados Detro -M -1 Estatística teste 10.9 / 9,09 57,45 / 6
Exemplo (Moore et al, 006) A estatística F calculada (1,1) é meor que o valor crítico,14, logo ão reeitamos a hipótese ula ao ível de 5%. Os três grupos apresetam escores médios iguais o pre-teste. Uma forma alterativa para aalisar o resultado da AOVA cosiste em cosiderar o valor-p. este caso o valor-p (0,) é superior ao ível de sigificâcia alfa (5%), logo ão reeitamos a hipótese ula ao ível de 5%. Os três grupos apresetam escores médios iguais o pre-teste.
AOVA o Excel Matriz de Dados, cada colua guarda os resultados obtidos sob um determiado tratameto 1) o meu Dados escolha a opção Aálise de Dados ) a caixa de diálogo escolha a opção AOVA: fator úico
AOVA o Excel ) Iforme o edereço dos dados a plailha e o ível de sigficiâcia alfa alfa Dados agrupados em coluas A primeira liha é o cabeçalho
Resultados AOVA o Excel
Testes multivariados versus uivariados 1) A utilização de repetidos testes uivariados, um para cada variável, provoca um erro tipo I demasiado grade. Isto é a probabilidade de reeitar H0 quado ela é verdadeira toma valores elevados que ultrapassam o acetável. ) Os testes uivariados igoram as correlações etre as variáveis. Os testes multivariados icorporam as correlações etre a variáveis, pois cosideram a matriz de covariâcias. ) Testes multiariados são mais potetes que os uivariados, ou sea, têm maior probabilidade de reeitar H 0 quado ela é falsa. 4) Primeiro deve-se proceder um teste multivariado e, em caso de difereças sigificativas, fazer testes uivariados para idetificar as variáveis que mais cotribuem para essa decisão.
Teste de Kruskal- Wallis
Teste de Kruskal-Wallis É um teste ão paramétrico Em um teste ão paramétrico iexiste a ecessidade da vigêcia da prerrogativa de populações ormalmete distribuidas. O pressuposto de amostras aleatórias e idepedetes permaece. A fialidade do teste de Kruskal-Wallis cosiste em testar se m amostras aleatórias idepedetes são origiárias ou ão de populações com médias iguais. H 0 : as médias populacioais das m populações são iguais H 1 : há pelo meos um par de médias populacioais diferetes
Teste de Kruskal-Wallis Sea o úmero de observações a -ésima amostra ( =1,m) O total de observações é Sea r k a posição (postos ou rak) da k-ésima observação o couto das observações dispostas em ordem crescete (k=1,) Sea R a soma das posições (raks) a -ésima amostra. A estatística teste H é dada por: m 1 H Sob H 0 a estatística teste tem distribuição qui-quadrado com m-1 graus de liberdade. 1 1 m 1 R 1 Ao ível de sigifiâcia a hipótese ula é reeitada se 1 H m
Correção para empates Se há empates a estátistica H deve ser corrigida: Estatística teste Estatística corrigida H H 1 1 1 i1 m 1 postos _ empatados Fator de correção t i = úmero de empates o i-ésimo posto c H R t i t i 1 6,91 0,86 8,7 Hc é maior que H. Portato, se H leva à reeição da hipótese ula, etão, ão é cessário calcular o valor corrigido para fis de classificação
Exemplo Três métodos de preveção de cáries são testados em um grupo de 0 criaças. As criaças foram divididas em três grupos igualmete, de maeira aleatória. Em cada grupo foi aplicado um método de preveção de cáries. o fial do tratameto as criaças foram examiadas e observou-se o úmero de detes com cáries que os métodos ão coseguiram evitar. Verificar através do teste de Kruskal-Wallis se há difereças sigificativas, a 5%, para os métodos.
Exemplo º de detes com cáries que os métodos ão coseguiram evitar: Escores ordeados por método Posições dos escores ordeados Grade Frequêcia de empastes
Exemplo º de detes com cáries que os métodos ão coseguiram evitar: Posições dos escores ordeados Médias dos postos
Exemplo 1 11,5 18,5 0 10 1 1 1 R R R soma das posições (raks) a -ésima amostra. 91 6, 1 0 10 1 10 11,5 10 18,5 1 0 0 1 1 1 1 1 H R H m
Exemplo Em fução dos empates observados há ecessidade de corrigir a estatítisca H t t H H R H m i i i c m 1 1 1 1 1 1 Fator de correção (FC)
Exemplo Cálculo do fator de correção (FC) 4 empates em,5 15 empates em 1 10 empates em 4,5 FC FC FC 1 1 0,86 m ti i1 t i 4 4 15 15 10 10 0 0
Exemplo Cálculo da estatística H corrigida: H c 1 m ti i1 H t i 6,91 0,86 8,7 Cálculo do valor crítico o ível de sigificâcia de 5%. Qui-quadrado com (m-1) graus de liberdade: Valor-p = DIST.QUI(8;) = 0,016 0,05 5, 99 =IV.QUI(0.05;)
Exemplo Coclusão do teste Estatistica calculada Hc = 8,7 é maior que o valor crítico 5,99 logo a hipótese deve ser reeitada. O valor-p é meor que ível de sigifiâcia de 5%, logo a hipótese ula é reeitada. Portato, os métodos apresetam médias diferetes.
Referêcias Brui, A.L. Estatística Aplicada à Gestão Empresarial, Editora Atlas, São Paulo, 011 Lappoi, J.C. Estatística usado Excel: versões 4 e 5. Lappoi Treiameto e Editora Ltda, São Paulo, 1995. Moore, D.S., McCabe, G.P., Duckworth, W.M., Sclove, S.L. A prática da estatística empresarial: como usar dados para tomar decisões, LTC, Rio de Jaeiro, 006. Piheiro, J.I.D., Cuha, S.P., Carvaal, S.R., Gomes, G.C. Estatística básica: a arte de trabalhar com dados, Elsevier, Rio de Jaeiro, 009. Siegel, Sidey Estatística ão-paramétrica para as ciêcias do comprimeto, McGraw Hill, São Paulo, 1975, Vieira, Soia Aálise de Variâcia (AOVA), Editora Atlas, São Paulo, 006.