Bioestatística e Computação I

Documentos relacionados
Bioestatística e Computação I

Bioestatística e Computação I

Bioestatística e Computação I

Universidade Federal de Minas Gerais Instituto de Ciências Exatas Departamento de Estatística. Introdução à Bioestatística Turma Nutrição.

Testes t para comparação de médias de dois grupos independentes

Intervalos de Confiança - Amostras Pequenas

Bioestatística e Computação I

Em aplicações práticas é comum que o interesse seja comparar as médias de duas diferentes populações (ambas as médias são desconhecidas).

Conceitos Básicos Teste t Teste F. Teste de Hipóteses. Joel M. Corrêa da Rosa

Estimação parâmetros e teste de hipóteses. Prof. Dr. Alberto Franke (48)

Estatística Inferencial

Enrico A. Colosimo Depto. Estatística UFMG

Princípios de Bioestatística Teste de Hipóteses

Questão 1 Sabe-se que o consumo mensal per capita de um determinado produto tem distribuição normal com desvio padrão σ = 2kg

AULA 07 Inferência a Partir de Duas Amostras

Inferência a partir de duas amostras

Probabilidade e Estatística. Estimação de Parâmetros Intervalo de Confiança

Teste de Hipóteses. Enrico A. Colosimo/UFMG enricoc/ Depto. Estatística - ICEx - UFMG 1/24

Carlos Antonio Filho

Cap. 11 Testes de comparação entre duas amostras

Inferência Estatística:

Professora Ana Hermínia Andrade. Período

Testes de hipóteses com duas amostras CURSO DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA. Módulo: ESTIMATIVA E TESTE DE HIPÓTESE.

MAE Introdução à Probabilidade e Estatística II Resolução Lista 5

Amostragem Aleatória e Descrição de Dados - parte I

TESTE DE HIPÓTESE. Introdução

DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA)

ESTUDOS DE COORTE. Baixo Peso Peso Normal Total Mãe usuária de cocaína

Teste de hipóteses para proporção populacional p

Lista de Exercícios 2 - Estatística II

Testes de Hipótese para uma única Amostra - parte II

TESTE T PARA POPULAÇÕES INDEPENDENTES ISABELA GOMES DA SILVA ISABELLA NAOMI FURUIE MARIA JÚLIA JORGE MAURO

Estimação e Testes de Hipóteses

Prof. a Dr. a Simone Daniela Sartorio de Medeiros. DTAiSeR-Ar

Testes de Hipóteses. Professor: Josimar Vasconcelos Contato: ou

Exemplo 1: Sabemos que a média do nível sérico de colesterol para a população de homens de 20 a 74 anos é 211 mg/100ml.

Estimativas e Tamanhos de Amostras

Introdução ao Planejamento e Análise Estatística de Experimentos 1º Semestre de 2013 Capítulo 3 Introdução à Probabilidade e à Inferência Estatística

Métodos Estatísticos Avançados em Epidemiologia

Universidade Federal do Pará Instituto de Tecnologia. Estatística Aplicada I

Inferência Estatística

TÉCNICAS DE AMOSTRAGEM

Teste de hipóteses para uma média populacional com variância conhecida e desconhecida

Inferência Estatística Básica. Teste de Hipóteses para uma média populacional Cálculo do Valor p

Métodos Quantitativos para Ciência da Computação Experimental

Fernando de Pol Mayer

POPULAÇÃO X AMOSTRA INTRODUÇÃO À BIOESTATÍSTICA TIPOS DE VARIÁVEIS CLASSIFICAÇÃO DAS VARIÁVEIS CLASSIFICAÇÃO DAS VARIÁVEIS 1) TIPOS DE VARIÁVEIS

PODER DO TESTE. Poder do Teste e Tamanho de Amostra para Testes de Hipóteses

Intervalos de conança

HEP-5800 BIOESTATÌSTICA

Nessa situação, a média dessa distribuição Normal (X ) é igual à média populacional, ou seja:

Intervalos Estatísticos para uma única Amostra - parte I

Inferência Estatística: DEEST/UFOP Prof.: Spencer Barbosa da Silva

Estatística Indutiva

Inferência Estatística. Teoria da Estimação

CE001 - BIOESTATÍSTICA TESTE DO QUI-QUADRADO

Testes de Hipóteses Paramétricos

Lista Estimação Pontual Estatística Aplicada à Engenharia de Produção Prof. Michel H. Montoril

PROJETO E ANÁLISES DE EXPERIMENTOS (PAE) INTRODUÇÃO AOS MÉTODOS ESTATÍSTICOS EM ENGENHARIA

Testes de Hipóteses Paramétricos

7 Teste de Hipóteses

José Aparecido da Silva Gama¹. ¹Professor do Instituto Federal de Educação, Ciência e Tecnologia de Alagoas.

Inferência Estatística para Duas Amostras

Métodos Quantitativos em Medicina

Estatística - Análise de Regressão Linear Simples. Professor José Alberto - (11) sosestatistica.com.br

INTRODUÇÃO. Exemplos. Comparar três lojas quanto ao volume médio de vendas. ... ANÁLISE DE VARIÂNCIA. Departamento de Matemática ESTV.

Distribuições Amostrais

Aula 7. Testes de Hipóteses Paramétricos (II)

Aula 7. Testes de Hipóteses Paramétricos (II)

INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA. Prof. Anderson Rodrigo da Silva

Inferência Estatística para Duas Amostras

INFERÊNCIA ESTATÍSTICA. ESTIMAÇÃO PARA A PROPORÇÃO POPULACIONAL p

Inferência Estatística: Conceitos Básicos II

Universidade Federal de Lavras

Poder do teste e Tamanho de Amostra

X e Y independentes. n + 1 m

Teorema central do limite e es/mação da proporção populacional p

Por que testes não-paramétricos?

Teste de Hipóteses = 0 = 0

CENTRO UNIVERSITÁRIO ESTÁCIO DA BAHIA DEPARTAMENTO DE SAÚDE. ERROS E TRATAMENTO DE DADOS ANALÍTICOS.com

Razão para rejeitar H 0

Pedro Alberto Barbetta / Marcelo Menezes Reis / Antonio Cezar Bornia São Paulo: Atlas, 2004

Princípios de Bioestatística

Intervalos de Confiança

Escolha dos testes INTRODUÇÃO À BIOESTATÍSTICA QUANTIFICAÇÃO DOS GRUPOS DO ESTUDO PESQUISA INFERÊNCIA ESTATÍSTICA TESTE DE HIPÓTESES E

Prova Final de Estatística I

TÉCNICAS DE AMOSTRAGEM

Aula 9 Intervalo de confiança para a média da N(μ; σ 2 ), σ 2 desconhecida

Medidas de Dispersão ou variabilidade

Distribuição Normal. Estatística Aplicada I DISTRIBUIÇÃO NORMAL. Algumas característica importantes. 2πσ

P. P. G. em Agricultura de Precisão DPADP0803: Geoestatística (Prof. Dr. Elódio Sebem)

Inferência Estatística - Teoria da Estimação

Estatística e Probabilidade. Aula 11 Cap 06

Inferência Estatística

Lecture 3a Testes de Hipótese

Bioestatística e Computação I

Teste de hipóteses Página 1 de 8. Teste de hipóteses

MEDIDAS DE DISPERSÃO. Os dados a seguir referem-se ao índice pluviométrico de três cidades no Estado de São Paulo, em 3 diferentes ocasiões

Aula 6. Testes de Hipóteses Paramétricos (I)

TESTES DE HIPÓTESES. Conceitos, Testes de 1 proporção, Testes de 1 média

Transcrição:

Bioestatística e Computação I Testes de Hipótese para Comparação de 2 Médias Maria Virginia P Dutra Eloane G Ramos Vania Matos Fonseca Pós Graduação em Saúde da Mulher e da Criança IFF FIOCRUZ Baseado nas aulas de M. Pagano e Gravreau e Geraldo Marcelo da Cunha

Comparação de duas populações Invasão francesa na Itália - 1537 Os ferimentos por armas de fogo eram cauterizados com óleo de sabugueiro em ebulição. Numa ocasião o dito óleo faltou e o cirurgião do exército Ambroise Pare passou a aplicar um digestivo feito de gemas de ovos, óelo de rosas e terebentina. Surpreendentemente, no dia seguinte, os que haviam sido tratados com o digestivo estavam com pouca dor, inflamação ou inchaço, enquanto os que haviam sido tratados com o óleo quente estavam com febre e muita dor.

Comparação de duas populações Bioimpedância como indicador de gravidade Os parâmetros da bioimpedância são medidos em pacientes atendidos na puericultura (grupo controle) e em pacientes sépticos internados na UPG-IFF (grupo sepse). Deseja-se determinar se as médias dos parâmetros da bioimpedância são significativamente diferentes entre os dois grupos.

Comparação de duas populações Dieta de farelo de aveia para baixar o LDL Deseja-se determinar se o farelo de aveia auxilia a baixar os níveis séricos de colesterol. Alguns indivíduos foram aleatoriamente colocados em uma dieta de farelo de aveia ou de flocos de milho. Após duas semanas seus níveis de LDL foram medidos. A dieta de cada um foi então invertida e, após mais duas semanas, o nível de colesterol LDL foi novamente registrado. Um teste de hipótese será conduzido para determinar se as médias de nível de colesterol LDL são signif. diferentes entre os dois grupos.

Comparação de duas populações Efeito do ruído sonoro na FR de prematuros Deseja-se determinar se o ruído de alta intensidade afeta a FR de prematuros internados em UTI neonatal. Para cada recém-nascido, registrou-se simultaneamente a FR e o ruído sonoro no interior da incubadora. Dado que o limiar de ruído recomendado em ambiente hospitalar é 65dBA, comparou-se a média de FR durante o tempo em que o ruído ficou abaixo do limiar com a respectiva média durante o tempo de ruído acima do limiar.

Comparação de duas populações Ensaio clínico Divide-se um grupo homogêneo em dois e aplica-se duas intervenções distintas Estudo observacional Valores espontâneos da variável de interesse em dois grupos ou momentos distintos Amostras pareadas Cada indivíduo é medido duas vezes em momentos ou situações distintas Amostras independentes

Comparação de duas populações Comparação de duas médias desconhecidas μ1 μ2 Qual a diferença em relação ao teste de uma média?

Teste t para duas médias O teste é o mesmo para estudo de intervenção ou observacional Amostras pareadas Teste t pareado Amostras independentes Teste t para duas amostras

Teste t pareado Cada indivíduo tem duas medições. Uma antes e outra depois de uma intervenção ou de uma evolução natural. auto-emparelhamento Cada indivíduo recebe um par que seja parecido com ele em relação a variáveis de interesse (ex.: sexo, idade,...).

Teste t pareado Problema 63 indivíduos com DAC participaram de um estudo para determinar se existe relação entre a exposição a monóxido de carbono e o decréscimo de tempo para experimentar angina durante exercícios. Cada um dos indivíduos realizou 2 baterias de teste. Na primeira, foram feitos 2 testes: um antes e outro após 1 hora descansando em ar ambiente. O decréscimo de tempo para apresentar angina foi registrado. Na segunda bateria também realizaram 2 testes: um antes e outro após 1 hora descansando em ar com monóxido de carbono. O decréscimo de tempo para apresentar angina foi novamente registrado.

Teste t pareado Redução percentual do tempo para angina após 1 hora respirando ar puro ou ar poluído Primeiros 10 indivíduos Indivíduo Ar puro Ar poluído 1 2.6 13.2 2-11.5-3.9 3 31.0 33.5 4 25.2 35.7 5 16.7 22.7 6-1.0 1.6 7-0.4 29.7 8-4.2 16.2 9-13.1-23.0 10 26.3-5.7

Teste t pareado Queda do tempo (%) para angina após 1 hora respirando ar puro ou ar poluído Primeiros 10 indivíduos Há evidência de que a redução de tempo seja diferente? Percent decrease 40 Ar puro Ar poluído 30 20 10 0-10 -20-30.5 1 2 2.5

Teste t pareado Queda do tempo (%) para angina após 1 hora respirando ar puro ou ar poluído Primeiros 10 indivíduos Há evidência de que a redução de tempo seja diferente? Variabilidade entre indivíduos Percent decrease 40 Ar puro Ar poluído 30 20 10 0-10 -20-30.5 1 2 2.5

Teste t pareado Primeiro, defina as diferenças individuais d i Indivíduo i Ar puro Rt1 Ar poluído Rt2 Diferença d = Rt1 - Rt2 1 2.6 13.2-10.6 2-11.5-3.9-7.6 3 31.0 33.5-2.5 4 25.2 35.7-10.5 5 16.7 22.7-6.0 6-1.0 1.6-2.6 7-0.4 29.7-30.1 8-4.2 16.2-20.4 9-13.1-23.0 9.9 10 26.3-5.7 32 d = n d i i=1 n

Teste t pareado Segundo, defina as hipóteses do teste H 0 : μ d = 0 H A : μ d 0 μ d média populacional das diferenças d média amostral das difrenças d = n d i i=1 n Reduz-se a um teste t de uma média com μ 0 =0 e n-1 graus de liberdade

Teste t pareado Terceiro, calcule a estatística de teste t n 1 = d 0 s d / n s d desvio-padrão das diferenças s d = n i=1 d i d 2 n 1 μ 0 =0

Indivíduo i Ar puro Rt1 i Ar poluído Rt2 i Diferença d i = Rt1 i - Rt2 i 1 2.6 13.2-10.6 2-11.5-3.9-7.6 3 31.0 33.5-2.5 4 25.2 35.7-10.5 5 16.7 22.7-6.0 6-1.0 1.6-2.6 7-0.4 29.7-30.1 8-4.2 16.2-20.4 9-13.1-23.0 9.9 10 26.3-5.7 32 d i d d i d 2 d = x 1 x 2 s d não tem nenhuma relação com s 1 e s 2

Teste t pareado n=63 0 =0 d= 6,63 s d =20,29 Há evidência para rejeitar H 0? -6,63 d

Teste t pareado n=63 0 =0 d= 6,63 s d =20,29 Pela tabela A.4 P(t 60 >2,59) < 0,01, logo P(t 62 >2,59) < 0,01 Como o teste é bilateral t 62 = d 0 s d / n = 6,63 20,29/ 63 = 2,59 p = P(t 62 >2,59 ou t 62 <-2,59) < 2 x 0,01 p < 0,02 Se α=0,05, qual a conclusão do teste?

Teste t pareado n=63 0 =0 d= 6,63 s d =20,29 p < 0,02 Se α=0,05 Rejeita-se H 0 : μ d =0 t 62 = d 0 s d / n = 6,63 20,29/ 63 = 2,59 Em favor de H A : μ d 0, ou seja: existe diferença Há evidência significativa (α=5%) de que a exposição por 1 hora ao monóxido de carbono diminua o tempo para angina durante o teste de exercícios, mais do que a não exposição.

Teste t pareado Qual a média dessa redução? Na média, a exposição ao monóx. carb. causa uma redução estimada de 6,63 pp no tempo para angina em relação a exposição ao ar puro. Qual o intervalo de confiança de 95% para essa média? IC95 %= d± t c s d n Pela tab. A.4: P(t 60 >t c )=0,025 t c =2,0 IC95 % 6,63± 2 20,29 63 = 6,63±5,11=[ 11,74 a 1,52 ]

Teste t pareado Em que outras situações podemos usar o teste t pareado?

Teste t para duas populações independentes População Amostra Grupo 1 Grupo 1 Controle μ e σ 1 1 Grupo 2 tratamento, doentes n 1 x 1 e s 1 Grupo 2 n 2 μ 2 e σ 2 Parâmetros desconhecidos x 2 e s 2 Estimadores

Teste t para duas populações independentes Problema Deseja-se determinar se há evidências de que o nível sérico de ferro seja diferente entre crianças saudáveis e as que sofrem de fibrose cística. Para o grupo controle, são selecionadas aleatoriamente crianças que são atendidas na puericultura do IFF. Para o grupo FC, são selecionados os pacientes atendidos no Centro de Referência do mesmo hospital.

Teste t para duas populações independentes Os dois grupos são independentes μ 1 e σ 1 : média e desvio-padrão populacional do nível sérico de ferro no grupo controle. μ 2 e σ 2 : média e desvio-padrão populacional do nível sérico de ferro no grupo com FC. Nas amostras x 1 e x 2 s 1 e s 2

Teste t para duas populações independentes Hipótese nula H0 : μ 1 = μ 2 Hipótese alternativa HA : μ 1 μ 2 O que mudou em relação ao teste para uma média?

Teste t para duas populações independentes As hipóteses podem ser reescritas como H0 : μ 1 μ 2 = 0 HA : μ 1 μ 2 0 Selecionam-se as duas amostras e obtém-se x 1 e x 2 s 1 e s 2

Teste t para duas populações independentes Pelo TCL: X ~N, n z= x / n Analogamente, se os grupos são independentes z= x 1 x 2 1 2 1 2 /n 1 2 2 /n 2 X 1 X 2 é aproximadamente normal com média 1 2 e variância igual a soma das duas variâncias.

Teste t para duas populações independentes Como o desvio-padrão populacional é (quase) sempre desconhecido t gl = x 1 x 2 1 2 s 1 2 /n 1 s 2 2 /n 2 O número exato de gl é difícil de calcular Utiliza-se uma aproximação gl= s 2 1 /n 1 s 2 2 /n 2 2 s 1 2 /n 1 2 n 1 1 s 2 2 /n 2 2 n 2 1 estatística de teste Arredonda-se gl para o inteiro mais baixo

Teste t para duas populações independentes Dados do problema H 0 : 1 2 =0 H A : 1 2 0 Grupo controle: n 1 =9, x 1 =18,9 mol /l, s 1 =5,9 mol /l Grupo com FC: n 2 =13, x 2 =11,9 mol /l, s 2 =6,3 mol /l Há evidências a priori de que H 0 seja falsa? Controle FC IC 95% 8 12 16 20 24 Nível sérico ferro (μmol/l)

Teste t para duas populações independentes H 0 : 1 2 =0 H A : 1 2 0 n 1 =9, x 1 =18,9, s 1 =5,9 n 2 =13, x 2 =11,9, s 2 =6,3 Assumindo H 0 verdadeira t gl = x 1 x 2 1 2 s 1 2 /n 1 s 2 2 /n 2 = x 1 x 2 s 1 2 /n 1 s 2 2 /n 2 = 18,9 11,9 5,9 2 /9 6,3 2 /13 =2,66 gl= s 2 1 /n 1 s 2 2 /n 2 2 s 1 2 /n 1 2 n 1 1 s 2 2 /n 2 2 n 2 1 = 5,92 /9 6,3 2 /13 2 5,9 2 /9 2 9 1 6,32 /13 2 13 1 =18,14 18

Teste t para duas populações independentes t 18 =2,66 Pela tabela A.4 P(t 18 >2,66) < 0,01 Como o teste é bilateral p = P(t 18 >2,66 ou t 18 <-2,66) < 2 x 0,01 p-valor < 0,02 Se α=0,05, qual a conclusão do teste?

Teste t para duas populações independentes t 18 =2,66 p < 0,02 Se α=0,05 Rejeita-se H0 : μ 1 =μ 2 Em favor de HA : μ 1 μ 2 Há evidência significativa (α=5%) de que o nível sérico de ferro seja diferente entre crianças saudáveis e as que sofrem de fibrose cística.

Teste t para duas populações independentes Qual a média dessa diferença? Uma estimativa da média da diferença do nível sérico de ferro entre crianças normais e com FC é x 1 x 2 =18,9 11,9=7 mol /l Qual o intervalo de confiança de 95% para essa diferença média? IC95 %= x 1 x 2 ±t c s 2 1 n 1 s 2 Pela tab. A.4: P(t 18 > t c ) = 0,025 t c =2,101 IC95 %=7±2,101 2,63=7±5,53= 1,47 a 12,53 2 n 2

Teste t para duas populações independentes Cite mais alguns exemplos de estudos que necessitarão do teste t para duas populações independentes.

Resumindo 1 população 2 populações Independentes Pareadas H 0 = 0 1 = 2 ou 1 2 =0 d =0 Estatística de teste z= x 0 / n t= x 0 s/ n t= x 1 x 2 s 2 1 s 2 2 n 1 n 2 t= d s d / n gl - n 1 s 2 1 s 2 2 n 1 s 2 1 n 1 2 n 2 2 n 1 1 s2 n 1 2 n 2 2 n 2 1 p-valor bilateral 2 P Z z 2 P t gl t 2 P t gl t 2 P t gl t

Exercício Deseja-se investigar os efeitos de um medicamento anti-hipertensivo em pessoas acima de 60 anos com hipertensão sistólica isolada. Para tal, selecionou-se aleatoriamente uma amostra de 2308 indivíduos para tomarem o medicamento e outra de 2293 para tomarem placebo, durante 1 ano. A pressão sanguínea sistólica média populacional do grupo de tratamento é μ 1 e do grupo controle μ 2. Nas amostras encontrou-se x 1 =142,5 mmhg, s 1 =15,7 mmhg x 2 =156,5 mmhg, s 2 =17,3 mmhg Conduza o teste de hipótese adequado com α=0,05.