Princípios de Bioestatística

Documentos relacionados
Métodos Estatísticos Avançados em Epidemiologia

Métodos Estatísticos Avançados em Epidemiologia

ANÁLISE DE VARIÂNCIA - ANOVA. Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística - PPGEMQ / PPGEP - UFSM

Considerações. Planejamento. Planejamento. 3.3 Análise de Variância ANOVA. 3.3 Análise de Variância ANOVA. Estatística II

EXPERIMENTAÇÃO AGRÍCOLA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

Métodos Quantitativos em Medicina

DELINEAMENTO EM BLOCOS AO ACASO

AULA 07 Inferência a Partir de Duas Amostras

Análise da Variância. Prof. Dr. Alberto Franke (48)

MAE Introdução à Probabilidade e Estatística II Resolução Lista 5

Conceitos Básicos Teste t Teste F. Teste de Hipóteses. Joel M. Corrêa da Rosa

Bioestatística Básica RCA 5804 COMPARANDO GRUPOS INDEPENDENTES. Prof. Dr. Alfredo J Rodrigues

Testes t para comparação de médias de dois grupos independentes

INTRODUÇÃO. Exemplos. Comparar três lojas quanto ao volume médio de vendas. ... ANÁLISE DE VARIÂNCIA. Departamento de Matemática ESTV.

Bioexperimentação. Prof. Dr. Iron Macêdo Dantas

Testes de hipóteses Paramétricos

Testes de Hipótese para uma única Amostra - parte II

Inferência a partir de duas amostras

Teste de Hipóteses. Enrico A. Colosimo/UFMG enricoc/ Depto. Estatística - ICEx - UFMG 1/24

DIC com número diferente de repetições por tratamento

TESTE T PARA POPULAÇÕES INDEPENDENTES ISABELA GOMES DA SILVA ISABELLA NAOMI FURUIE MARIA JÚLIA JORGE MAURO

Princípios de Bioestatística

SEEC UNIVERSIDADE DO ESTADO DO RIO GRANDE DO NORTE UERN FACULDADE DE CIÊNCIAS EXATAS E NATURAIS FANAT DEPARTAMENTO DE CIÊNCIAS BIOLÓGICAS DECB

H 0 : m 1 = m 2 =... = m I = 0 H a : pelo menos m u m k, para algum u k (u,k=1,2,...,i)

Parte 8 Testes de hipóteses Comparação de dois grupos

DELINEAMENTO FATORIAL. Profª. Sheila Regina Oro

Testes de Hipóteses sobre a média: Várias Amostras

Inferência para várias populações normais análise de variância (ANOVA)

SEEC UNIVERSIDADE DO ESTADO DO RIO GRANDE DO NORTE UERN FACULDADE DE CIÊNCIAS EXATAS E NATURAIS FANAT DEPARTAMENTO DE CIÊNCIAS BIOLÓGICAS DECB

Teste Anova. Prof. David Prata Novembro de 2016

AULA 05 Teste de Hipótese

TESTE DE HIPÓTESE. Introdução

PROJETO E ANÁLISES DE EXPERIMENTOS (PAE) INTRODUÇÃO AOS MÉTODOS ESTATÍSTICOS EM ENGENHARIA

Em aplicações práticas é comum que o interesse seja comparar as médias de duas diferentes populações (ambas as médias são desconhecidas).

Planejamento de Experimentos

Enrico A. Colosimo Depto. Estatística UFMG

Testes de Hipótese para uma única Amostra - parte I

ANOVA - parte I Conceitos Básicos

Análise de Variância com mais de duas variáveis independentes (mais de dois fatores) Na aula do dia 17 de outubro (aula #08) introduzimos

AULA 19 Análise de Variância

Intervalos de Confiança - Amostras Pequenas

Medidas de Dispersão ou variabilidade

Inferência Estatística:

Estatística: Objetivos e fundamentos

Testes de Hipóteses Paramétricos

Exemplo 1: Sabemos que a média do nível sérico de colesterol para a população de homens de 20 a 74 anos é 211 mg/100ml.

Especialização em Engenharia de Processos e de Sistemas de Produção

EXPERIMENTAÇÃO AGRÍCOLA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

Cap. 11 Testes de comparação entre duas amostras

Testes de Hipóteses Paramétricos

Bioestatística e Computação I

Princípios de Bioestatística Teste de Hipóteses

Bioestatística CE001 Prof. Fernando de Pol Mayer Departamento de Estatística DEST Exercícios: inferência Nome: GABARITO

Inferência Estatística

Razão para rejeitar H 0

MINISTÉRIO DA EDUCAÇÃO UNIVERSIDADE FEDERAL DE CAMPINA GRANDE CENTRO DE CIENCIAS E TECNOLOGIA AGROALIMENTAR UNIDADE IV

Capítulo 11 Análise da Variância. Statistics for Managers Using Microsoft Excel, 5e 2008 Prentice-Hall, Inc. Chap 11-1

PROJETO E ANÁLISES DE EXPERIMENTOS (PAE) EXPERIMENTOS COM DOIS FATORES E O PLANEJAMENTO FATORIAL

Carlos Antonio Filho

MAE Introdução à Probabilidade e Estatística II Resolução Lista 4

ANOVA FACTORIAL EXEMPLO 1. ANOVA TWO-WAY COM O SPSS. a capacidade de reconhecimento do odor materno

X e Y independentes. n + 1 m

Estimação parâmetros e teste de hipóteses. Prof. Dr. Alberto Franke (48)

EXPERIMENTAÇÃO AGRÁRIA

Intervalos de Confiança

Teste de hipótese de variância e Análise de Variância (ANOVA)

Uma estatística é uma característica da amostra. Ou seja, se

CE001 - BIOESTATÍSTICA TESTE DO QUI-QUADRADO

Escolha dos testes INTRODUÇÃO À BIOESTATÍSTICA QUANTIFICAÇÃO DOS GRUPOS DO ESTUDO PESQUISA INFERÊNCIA ESTATÍSTICA TESTE DE HIPÓTESES E

DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA)

EXPERIMENTOS COM INTERAÇÕES

PODER DO TESTE. Poder do Teste e Tamanho de Amostra para Testes de Hipóteses

Planejamento e Otimização de Experimentos

Teste de hipóteses para proporção populacional p

Testes de hipóteses com duas amostras CURSO DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA. Módulo: ESTIMATIVA E TESTE DE HIPÓTESE.

BAC011 - ESTATÍSTICA ANÁLISE DE VARIÂNCIA. Análise de Variância ANOVA. Prof. Dr. Emerson José de Paiva

Medidas de Dispersão. Introdução Amplitude Variância Desvio Padrão Coeficiente de Variação

Análise da Variância (ANOVA)

Professora Ana Hermínia Andrade. Período

MINISTE RIO DA EDUCAÇA O UNIVERSIDADE FEDERAL DE LAVRAS DEPARTAMENTO DE CIE NCIAS EXATAS

Variância pop. * conhecida Teste t Paramétrico Quantitativa Distribuição normal Wilcoxon (teste dos sinais, Wilcoxon p/ 1 amostra)

AULA 11 Heteroscedasticidade

DELINEAMENTO EM BLOCOS CASUALIZADOS (DBC)

Probabilidade II. Departamento de Estatística. Universidade Federal da Paraíba

TESTES NÃO PARAMÉTRICOS (para mediana/média)

EXPERIMENTAÇÃO AGRÁRIA

Por que testes não-paramétricos?

Probabilidade e Estatística. Prof. Dr. Jhames Sampaio

Estatística - Análise de Regressão Linear Simples. Professor José Alberto - (11) sosestatistica.com.br

Estatística. Nos exercícios que se seguem, e caso seja necessário, considere que os pressupostos necessários à aplicação da ANOVA são verificados.

TESTE t-student TESTE IGUALDADE DE VARIÂNCIAS

5. Carta de controle e homogeneidade de variância

Análise da Regressão múltipla: Inferência. Aula 4 6 de maio de 2013

Transcrição:

Princípios de Bioestatística Análise de Variância Enrico A. Colosimo Departamento de Estatística Universidade Federal de Minas Gerais http://www.est.ufmg.br/~enricoc 2011 1 / 25

Introdução Existem muitas situações nas quais um pesquisador deseja comparar mais do que dois grupos experimentais com relação a uma variável quantitativa. Exemplos: Comparar três drogas analgésicas para reduzir a dor pós-operatória em pacientes submetidos à mesma intervenção cirúrgica. Comparar a idade de pacientes entre três grupos de risco (baixo, médio, alto). 2 / 25

Introdução A primeira vista, pode parecer correto realizar vários testes t entre os grupos, comparando-os dois a dois. No caso da comparação de três grupos (grupo A, grupo B e grupo C), haveria três testes t de comparação entre médias: µ A vs µ B, µ A vs µ C e µ B vs µ C. Na comparação de quatro grupos, haveria seis testes t de comparação entre médias. Se o número de grupos é igual a 10, precisaríamos de 45 testes t dois a dois. 3 / 25

Introdução Observação 1: O número de testes aumenta conforme o número de grupos aumenta. Para k grupos temos ( k 2) comparações. Observação 2: Tal procedimento (a realização de todas as comparações dois a dois) é estatisticamente incorreto. O teste t foi delineado para, em um mesmo experimento, comparar-se uma média A com apenas outra, B, com probabilidade α de se concluir, incorretamente, por uma diferença que não existe. Se forem feitas mais de uma comparação envolvendo a média A, a probabilidade de um erro deste tipo passa a ser maior do que α. 4 / 25

Introdução O procedimento correto para se evitar esse aumento no nível global de significância do experimento consiste em utilizar a técnica da Análise de Variância (ANOVA). Este método compara todas as médias em um único teste e visa a identificar a existência de ao menos uma diferença entre grupos, se alguma existir. Caso o resultado seja significativo, aplica-se posteriormente uma das várias técnicas existentes de comparações múltiplas entre as médias. Estes procedimentos permitem identificar quais as populações são diferentes entre si, mantendo controlado o nível de significância do teste. 5 / 25

Exemplo: Volume expiratório forçado (FEV) Desejamos comparar o volume expiratório forçado de pacientes com doença coronária oriundos de três centros médicos diferentes (21 pacientes da Johns Hopkins University School of Medicine, 16 pacientes do Rancho Los Amigos Medical Center e 23 pacientes da St. Louis University School of Medicine). Estamos interessados em testar H 0 : µ 1 = µ 2 = µ 3 contra a alternativa que pelo menos uma das médias populacionais difere das outras. Os dados são apresentados a seguir. 6 / 25

Exemplo: Volume expiratório forçado (FEV) Tabela: Volume expiratório forçado em 1 segundo para pacientes com doença coronária de três diferentes centros médicos. Johns Hopkins Rancho Los Amigos St. Louis 3,23 2,57 3,22 2,61 2,79 3,17 3,47 2,08 2,88 3,39 3,22 2,23 1,86 2,47 1,71 3,17 2,25 2,19 2,47 2,47 2,89 2,98 4,06 3,01 2,74 3,77 2,47 1,98 1,69 2,88 3,29 2,77 2,81 2,10 2,63 3,39 2,95 2,85 2,81 2,53 3,86 3,56 2,43 3,28 2,64 2,88 3,20 3,36 2,71 2,63 3,53 2,61 2,71 3,38 2,91 3,41 3,07 1,98 2,87 2,81 x 1 = 2, 63 litros x 2 = 3, 03 litros x 3 = 2, 88 litros s 1 = 0, 496 litros s 2 = 0, 523 litros s 3 = 0, 498 litros 7 / 25

Fontes de variação Como o nome sugere, a análise de variância depende de estimativas da dispersão. Quando trabalhamos com diferentes populações, podemos calcular dois tipos de medidas de variância: a variação dos valores dos indivíduos em torno das médias populacionais (variância dentro dos grupos); e a variação das médias populacionais em torno da média global (variância entre os grupos). Se a variabilidade dentro das k diferentes populações é pequena em relação a variabilidade entre suas respectivas médias, isto sugere que as médias populacionais são de fato diferentes. 8 / 25

Fontes de variação Para testar a hipótese nula H 0 : µ 1 = µ 2 =... = µ k para um conjunto de k populações, primeiro precisamos encontrar uma medida de variabilidade das observações individuais em torno de suas médias populacionais. A estimativa combinada da variância comum σ 2 é tal medida. Seja n = n 1 + n 2 +... + n k (tamanho total da amostra), então sd 2 = (n1 1)s2 1 + (n 2 1)s2 2 +... + (n k 1)sk 2, n k em que s 2 j é a variância amostral do grupo j. Esta quantidade é simplesmente a média ponderada das k variâncias amostrais. O subscrito D se refere a variabilidade dentro de grupos. 9 / 25

Fontes de variação Precisamos de uma expressão que estime a variação das médias em torno da média global, ou seja, a variância entre grupos. Se a hipótese nula é verdadeira, esta quantidade também estima a variância comum σ 2 se 2 = n1( x1 x)2 + n 2( x 2 x) 2 +... + n k ( x k x) 2, k 1 em que x j é a média amostral do grupo j e x é a média global das n observações x = n1 x1 + n2 x2 +... + n k x k n 1 + n 2 +... + n k = n1 x1 + n2 x2 +... + n k x k. n 10 / 25

Fontes de variação Agora que temos as estimativas das variâncias, gostarímos de responder a seguinte questão: as médias amostrais variam em torno da média global mais do que as observações individuais variam em torno das médias amostrais? Se sim, isto implica que as correspondentes médias populacionais são diferentes. Para testar a hipótese nula que as médias populacionais são idênticas, usamos a seguinte estatística de teste F = s2 E. sd 2 11 / 25

Fontes de variação Sob a hipótese nula, tanto se 2 quanto sd 2 estimam a variância comum σ 2, e F é próximo de 1. Se existe uma diferença entre as populações, então a variância entre os grupos é maior que a variância dentro dos grupos, e F é maior que 1. Sob H 0, a razão F tem uma distribuição F com k 1 e n k graus de liberdade. 12 / 25

Fontes de variação f(x) 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0 5 10 15 20 x Figura: Distribuição F com 4 e 2 graus de liberdade. 13 / 25

Fontes de variação Observação: Podemos organizar o procedimento na seguinte tabela Tabela: Tabela da Análise de Variância. Fontes de variação SQ GL QM F Entre os grupos SQ entre k 1 QM entre=sq entre/k 1 QM entre/qm dentro Dentro dos grupos SQ dentro n k QM dentro=sq dentro/n k - Total SQ Total n 1 - - em que: SQ entre é a soma de quadrados entre os grupos e é numerador de s 2 E, ou seja, SQ entre = n 1 ( x 1 x) 2 + n 2 ( x 2 x) 2 +... + n k ( x k x) 2. SQ dentro é a soma de quadrados dentro dos grupos e é numerador de s 2 D, ou seja, SQ dentro = (n 1 1)s 2 1 + (n 2 1)s 2 2 +... + (n k 1)s 2 k. Note que QM entre= s 2 E e QM dentro= s2 D. 14 / 25

Fontes de variação Retomando o exemplo, estamos interessados em testar se a média da variável FEV é igual para os pacientes dos três diferentes centros médicos H 0 : µ 1 = µ 2 = µ 3. Para começar, calculamos a estimativa da variância dentro dos grupos s 2 D = (n1 1)s2 1 + (n 2 1)s 2 2 + (n 3 1)s 2 k n 1 + n 2 + n 3 3 = (21 1)(0, 496)2 + (16 1)(0, 523) 2 + (23 1)(0, 498) 2 21 + 16 + 23 3 = 0, 254 litros 2. 15 / 25

Fontes de variação Temos que a média global é x = n1 x1 + n2 x2 + n3 x3 n 1 + n 2 + n 3 = 21(2, 63)16(3, 03)23(2, 88) 21 + 16 + 23 = 2, 83 litros, e assim a estimativa da variância entre os grupos é s 2 E = n1( x1 x)2 + n 2( x 2 x) 2 + n 3( x 3 x) 2 3 1 = 21(2, 63 2, 83)2 + 16(3, 03 2, 83) 2 + 23(2, 88 2, 83) 2 3 1 = 0, 769 litros 2. 16 / 25

Fontes de variação Desta forma, a estatística de teste é F = s2 E s 2 D 0, 769 = 0, 254 = 3, 028. Para a distribuição F com k 1 = 3 1 = 2 e n k = 60 3 = 57 graus de liberdade, p valor = 0, 0563. Se rejeita a hipótese nula ao nível de 10% de significância, mas não se rejeita a hipótese nula ao nível de 5% de significância. Possivelmente haja alguma diferença entre as médias dos valores do FEV entre estas três populações. 17 / 25

Fontes de variação De forma, análoga temos a tabela de análise de variância. Tabela: Tabela da Análise de Variância. Fontes de variação SQ GL QM F p-valor Entre os grupos 14,48 57 0, 769 3,028 0,0563 Dentro dos grupos 1,54 2 0, 254 - - Total 16,02 59 - - - 18 / 25

Procedimentos de comparações múltiplas Um valor de F significativo na ANOVA não indica quais são os grupos significativamente diferentes entre si quando comparados dois a dois. Ele apenas mostra que existe ao menos uma diferença entre os grupos estudados. A identificação de diferenças particulares entre médias, tomando-as duas a duas, deve ser feita usando um dos vários testes de Comparações Múltiplas entre Médias existentes na literatura. Estes testes são semelhantes ao t, com a diferença de que controlam o nível de significância ao levar em conta o número de comparações feitas no experimento. 19 / 25

Procedimentos de comparações múltiplas Correção de Bonferroni O procedimento de Bonferroni consiste em corrigir o valor de α, calculando-se α = α m em que α é o nível de significância global e m é o número de comparações a serem realizadas (m = ( k 2), para k grupos). Para o caso de k = 3 populações, um total de m = ( 3 2) = 3 testes são necessários. Se definimos o nível de significância global em 10%, devemos utilizar para cada teste individual. α = 0, 10 3 = 0, 033 20 / 25

Procedimentos de comparações múltiplas Correção de Bonferroni Para realizar um teste da hipótese nula H 0 : µ i = µ j devemos calcular t ij = x i x j s 2 D [(1/n i ) + (1/n j )]. Note que este é um teste t para duas amostras, porém ao invés de estimarmos a variância somente com as duas amostras que estão sendo comparandas, estimamos utilizando a informação das k amostras. Sob a hipótese nula, t ij tem uma distribuição t com n k graus de liberdade. 21 / 25

Procedimentos de comparações múltiplas Correção de Bonferroni Considerando o exemplo do FEV, começamos comparando as populações 1 e 2, os pacientes da Johns Hopkins e pacientes do Rancho Los Amigos. Neste caso, t 12 = = x 1 x 2 s 2 D [(1/n 1) + (1/n 2)] 2, 63 3, 03 0, 254[(1/21) + (1/16)] = 2, 39. Para um teste t com n k = 60 3 graus de liberdade, o p valor = 0, 02. Assim, rejeitamos a hipótese nula ao nível 3,3% e concluímos que a média do FEV dos pacientes da Johns Hopkins é diferente da média do FEV dos pacientes do Rancho Los Amigos. 22 / 25

Procedimentos de comparações múltiplas Correção de Bonferroni Comparando as populações 1 e 3 (os pacientes da Johns Hopkins e os pacientes da St. Louis), temos t 13 = = x 1 x 3 s 2 D [(1/n 1) + (1/n 3)] 2, 63 2, 88 0, 254[(1/21) + (1/23)] = 1, 64. Como o p valor > 0, 10, não temos evidências suficientes para concluir que µ 1 difere de µ 3. 23 / 25

Procedimentos de comparações múltiplas Correção de Bonferroni Comparando os pacientes do Rancho Los Amigos e os pacientes da St. Louis (populações 2 e 3), temos t 23 = = x 2 x 3 s 2 D [(1/n 2) + (1/n 3)] 3, 03 2, 88 0, 254[(1/16) + (1/23)] = 0, 91. Novamente o p valor > 0, 10, e não temos evidências suficientes para concluir que µ 2 difere de µ 3. Resumindo, encontramos que a média do FEV dos pacientes da Johns Hopikins é um pouco menor que a média do FEV dos pacientes do Rancho Los Amigos. Nenhuma outra distinção entre as populações pode ser feita. 24 / 25

Condições para o uso da ANOVA Para que os resultados da Análise de Variância sejam válidos, é necessário que as variâncias amostrais sejam semelhantes nas diferentes amostras. Além disso, a variável a ser comparada deve ter distribuição normal. A ANOVA é um procedimento estatístico robusto e fornece resultados confiáveis mesmo com considerável heterocedasticidade (variâncias desiguais), desde que os tamanhos amostrais sejam aproximadamente iguais. Também é razoavelmente robusto ainda que a variável em estudo tenha uma distribuição bastante desviada da normal, especialmente se os tamanhos amostrais são grandes. 25 / 25