Inferência Estatística



Documentos relacionados
AULA 11 Teste de Hipótese

AULA 05 Teste de Hipótese

7 Teste de Hipóteses

AULA 04 Teste de hipótese

1 Teoria da Decisão Estatística

Estimação parâmetros e teste de hipóteses. Prof. Dr. Alberto Franke (48)

TESTE DE HIPÓTESE. Introdução

Intervalos de Confiança

Intervalos de Confiança - Amostras Pequenas

Inferência Estatística:

Métodos Quantitativos em Medicina

Conceitos Básicos Teste t Teste F. Teste de Hipóteses. Joel M. Corrêa da Rosa

INFERÊNCIA ESTATÍSTICA. ESTIMAÇÃO PARA A PROPORÇÃO POPULACIONAL p

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

PHD 5742 Estatística Aplicada ao Gerenciamento dos Recursos Hídricos. 6 a aula Testes de Hipóteses

Testes de hipóteses. Wagner H. Bonat Fernando P. Mayer Elias T. Krainski

Universidade Federal do Pará Instituto de Tecnologia. Estatística Aplicada I

Métodos Quantitativos em Medicina. Prof. Neli Ortega

Teste de Hipóteses Paramétricos

Teste de hipóteses para proporção populacional p

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

7. Testes de Hipóteses

Estatística Inferencial

Inferência. 1 Estimativa pontual de uma média 2 Estimativa intervalar de uma média. Renata Souza

DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA)

Estimação e Testes de Hipóteses

Unidade IV Inferência estatística

Introdução em Probabilidade e Estatística II

Testes de Hipóteses Paramétricos

Testes t para comparação de médias de dois grupos independentes

Testes de Hipóteses para. uma Única Amostra. Objetivos de Aprendizagem. 9.1 Teste de Hipóteses. UFMG-ICEx-EST-027/031 07/06/ :07

Testes de Hipóteses Paramétricos

Cap. 8 - Intervalos Estatísticos para uma Única Amostra

Capítulo 4 Inferência Estatística

Bioestatística e Computação I

1 Probabilidade - Modelos Probabilísticos

Inferência. 1 Estimativa pontual de uma média 2 Estimativa intervalar de uma média. Renata Souza

Enrico A. Colosimo Depto. Estatística UFMG

Testes de Hipóteses. Professor: Josimar Vasconcelos Contato: ou

ESTATÍSTICA Distribuições qui-quadrado, t de Student e F de Snedecor Lucas Schmidt

Testes de Hipóteses. Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística - PPGEMQ / PPGEP - UFSM

Professora Ana Hermínia Andrade. Período

TESTE DE HIPÓTESES ELISETE AUBIN E MONICA SANDOVAL - IME

Teste de Hipóteses = 0 = 0

Inferência Estatística

Associação entre variáveis categóricas e IC95%

TESTES DE HIPÓTESES. HIPÓTESES: São suposições que fazemos para testar a fixação de decisões, que poderão ser verdadeiras ou não.

Introdução à Bioestatística Turma Nutrição

Princípios de Bioestatística Teste de Hipóteses

Inferência Estatística Básica. Teste de Hipóteses: decidindo na presença de incerteza

Fernando de Pol Mayer

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

Inferência para duas populações

TESTES DE HIPÓTESES. Conceitos, Testes de 1 proporção, Testes de 1 média

Unidade IV Inferência estatística

Razão para rejeitar H 0

6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA

Estimativas e Tamanhos de Amostras

AULA 7 - Inferência em MQO: ICs e Testes de

AULA 10 Estimativas e Tamanhos Amostrais

Estatística Aplicada

Probabilidade e Estatística

6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA

Probabilidade e Estatística. Estimação de Parâmetros Intervalo de Confiança

Notas de aula Testes de Hipóteses. Idemauro Antonio Rodrigues de Lara

Testes de Hipótese para uma única Amostra - parte I

EXPERIMENTAÇÃO ZOOTÉCNICA. Profa. Dra. Amanda Liz Pacífico Manfrim Perticarrari

Medidas de Dispersão ou variabilidade

Professora Ana Hermínia Andrade. Período

NOÇÕES DE TESTE DE HIPÓTESES (I) Teste de hipóteses para a proporção populacional

6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA

Métodos Quantitativos

Princípios de Bioestatística

Intervalo de confiança4

MAE Introdução à Probabilidade e Estatística II Resolução Lista 4

TESTES DE HIPÓTESES. Lucas Santana da Cunha Universidade Estadual de Londrina

1.1. Definições importantes

AULA 03 Estimativas e tamanhos amostrais

Stela Adami Vayego DEST/UFPR. Resumo 11 - Testes de Hipóteses

Teste de Hipótese. Capítulo 8 Triola, 10 a. Ed. (Capítulo 7 Triola, 9 a. Ed.) 1 Visão Geral. 2 Fundamentos do teste de hipótese

Princípios de Bioestatística Inferência e Intervalo de Confiança

AULA 07 Inferência a Partir de Duas Amostras

Planejamento e Otimização de Experimentos

Inferência Estatística: DEEST/UFOP Prof.: Spencer Barbosa da Silva

Parte 8 Testes de hipóteses Comparação de dois grupos

Probabilidade e Estatística

AULA 11 - Normalidade e Inferência em Regressão Múltipla - Parte 1

Introdução a Estatística

Exemplo 7.0 Numa linha de produção, os pesos de pacotes de pó de café embalados por uma máquina têm distribuição Normal, com média

Teste de hipóteses. Testes de Hipóteses. Valor de p ou P-valor. Lógica dos testes de hipótese. Valor de p 31/08/2016 VPS126

Carlos Antonio Filho

Probabilidade e Estatística

NOÇÕES DE TESTE DE HIPÓTESES (I) Teste de hipóteses para a proporção populacional

Transcrição:

Inferência Estatística Profa Alcione Miranda dos Santos Departamento de Saúde Pública UFMA Núcleo de Estatística e Informática HUUFMA email: alcione.miranda@terra.com.br

Inferência Estatística Inferências a respeito de uma população são feitas, baseadas em uma amostra. Inferências a respeito de uma parâmetro (por ex. a média populacional) são feitas, examinando estatísticas amostrais (por ex., a média amostral).

Inferência Estatística Dois princípios Básicos: Testes de Hipóteses Estimação Estimação Pontual A média amostral é uma estimativa pontual da média populacional Estimação por Intervalos Intervalos de Confiança

Teoria da Estimação Em estatística, muitas vezes desejamos estimar a proporção com que determinado evento ocorre. Por exemplo: Prevalência de diabéticos no munícipio de São Luís- MA Prevalência de fumo entre os estudantes de Medicina da UFMA. Se desejarmos saber tais prevalências, sem erro aleatório, teremos que estudar toda a população dos estudantes.

Teoria da Estimação Através da teoria de estimação podemos tomar uma amostra aleatória da população de interesse e estimarmos, com uma probabilidade de erro conhecida, a verdadeira prevalência nesta população. Estimação é o processo pelo qual, usando-se um valor amostral (estatística) inferimos o valor populacional (parâmetro).

Teoria da Estimação Estimador- é uma estatística destinada a estimar um parâmetro. Existem dois tipos de estimação: Estimação Pontual Estimação por Intervalo

Estimativa Pontual Quando a partir de uma amostra representativa da população, o pesquisador procura obter um único valor para o parâmetro. Exemplo: Prevalência de fumo entre os estudantes de Medicina da UFMA. p ˆ = f n onde f é a freqüência do evento na amostra e n é o tamanho da amostra

Estimativa por Intervalo Neste caso, calculamos a margem de erro aleatório de uma estimativa e construímos um intervalo. O intervalo contém o parâmetro com uma probabilidade pré- definida. Um intervalo de confiança está associado a um grau de confiança que é a uma medida da nossa certeza que o intervalo contém o parâmetro. Esta maneira de estimar o parâmetro é mais interessante, pois fornece elementos para se discutir a precisão da estimativa.

Estimativa por Intervalo O grau de confiança é a probabilidade (1-α) do intervalo de confiança conter o verdadeiro valor do parâmetro. Geralmente, adota-se α = 1%, 5% ou 10%. α é chamado de nível de significância. A escolha do nível de confiança depende da precisão que desejamos estimar o parâmetro.

Intervalo de Confiança para a Proporção Populacional O IC para a proporção populacional é dado por IC[ π;(1 α)%] = pˆ ± zα / 2 pˆ.(1 n pˆ) Nota: O intervalo só poderá ser construído quando f 5 e n f + 5

EXEMPLO: Uma droga foi testada em 25 pacientes e apresentou efeitos colaterais em 8 casos. Qual a proporção de ocorrência de efeitos colaterais? Estimativa pontual: 8/25 = 0,32 ou 32%. Estimativa por intervalo: Adotando-se um nível de significância de 5%, tem-se: (0,32)(0,68) IC[ π;95%] = 0,32 ± 1,96 = 25 [0,15;0,53]

COMANDO STATA O comando usado para construir IC para proporção é cii n f com n = tamanho da amostra f = freqüência do evento na amostra Para o exemplo anterior, temos: cii 25 8 -- Binomial Exact -- Variable Obs Mean Std. Err. [95% Conf. Interval] -------------+--------------------------------------------------------------- 25.32.0932952.1494954.5350007 pˆ IC

Intervalo de Confiança para a Média Populacional Caso 1: Grandes Amostras (n 30) IC[ µ ;(1 α)%] = x ± zα / 2 s n Caso 2: Pequenas Amostras (n < 30) IC[ µ ;(1 α)%] = x ± t( n 1; α / 2) s n

Distribuição t Student A distribuição de t student tem um tem um formato semelhante ao da distribuição normal, mas a curva é mais larga. Uma característica importante da distribuição t student é o número de graus de liberdade.

Tabela t Student Se uma distribuição t student tem 11 graus de liberdade, encontre o valor de t que faz o a área sombreada ser de 0,025

EXEMPLO: Com o intuito de estudar o conteúdo de ácido láctico no sangue de indivíduos com demência precoce, uma amostra de 16 pacientes foi tomada e os resultados foram os seguintes: média = 13 mg/100 ml e desvio padrão = 4,6 mg/100 ml. Estime através de intervalo de confiança a média do teor de ácido láctico no sangue de indivíduos com demência precoce. 4,6 IC[ µ ;95%] = 13± t(15;0,025) 16 IC[ µ ;95%] = 13± 2,1315.1,15 = [10,55;15,45]

COMANDO STATA O comando usado para construir IC para média populacional é com n = tamanho da amostra me = média amostral sd = desvio padrão Para o exemplo anterior temos: cii n me sd. cii 16 13 4.6 Variable Obs Mean Std. Err. [95% Conf. Interval] -------------+--------------------------------------------------------------- 16 13 1.15 10.54883 15.45117 x S n IC

Testes de Hipóteses Profa Alcione Miranda dos Santos Departamento de Saúde Pública UFMA Núcleo de Estatística e Informática HUUFMA email: alcione.miranda@terra.com.br

Testes de Hipóteses Algumas vezes existe um particular interesse em decidir sobre a verdade ou não de uma hipótese específica. Por exemplo: Se dois grupos têm a mesma média ou se o parâmetro populacional tem um valor em particular. Teste de hipóteses fornece-nos a estrutura para que façamos isto.

Quando falamos em hipóteses estamos nos referindo à perguntas sobre a relação entre variáveis, por exemplo: A variável "doença" está associada à variável "fator de risco"? Repare que as hipóteses são apenas fundamentais em estudos analíticos ou experimentais. Estudos descritivos não necessitam de hipóteses, basta descrever as características da amostra em estudo.

Testes de Hipóteses Hipótese científica: existe um efeito E. Hipóteses estatísticas: diferenças, associação, estimação pontual Hipótese nula (H 0 ): ausência de diferença Hipótese alternativa (H A ): contrária à H 0 Testes de hipóteses: fornecem subsídios para se rejeitar ou não uma hipótese estatística.

Tipos de Erros Ao tomar uma decisão a favor ou contra uma hipótese, existem dois tipos de erros que podemos cometer: Erro Tipo I e Erro Tipo II Erro Tipo I: Rejeitar a hipótese nula quando de fato ela é verdadeira. Erro Tipo II: Aceitar a hipótese nula quando de fato ela é falsa.

Tipos de Erros Decisão H o verdadeira H o falsa Aceitar a hipótese Decisão correta (1- α) Erro de tipo II β Rejeitar a hipótese Erro de tipo I α nível de significância Decisão correta (1-β) Poder do teste

Testes Bilaterais e Unilaterais Teste bilateral: há interesse em identificar diferença para qualquer direção. Exemplo: droga altera a PAS Teste unilateral: apenas tem sentido diferença em uma direção. Exemplo: dieta para redução do nível sérico de colesterol.

Testes de Hipóteses Todos os testes de hipóteses têm suposições; As suposições devem ser verificadas; Se alguma suposição é violada, então os testes estatísticos podem ser inválidos.

Testes de Hipóteses Paramétricos: são baseados nas características das distribuições teóricas que a distribuição dos dados segue. não fazem suposições sobre a distribuição dos dados. Têm menos poder. Não-paramétricos:

Passos para realizar um Teste de Hipóteses Passo 1 : Definição da Hipótese O primeiro passo é o estabelecimento das hipóteses: Hipótese Nula (H 0 ): É um valor suposto para um parâmetro.se os resultados da amostra não forem muito diferentes de H 0, ela não poderá ser rejeitada. Hipótese Alternativa (H A ): É uma hipótese que contraria a hipótese nula, complementar de Ho, Essa hipótese somente será aceita se os resultados forem muito diferentes de Ho.

Passos para realizar um Teste de Hipóteses Passo 2: Calcular a estatística do Teste É o valor calculado a partir da amostra, que será usado na tomada de decisão. Uma maneira de tomar-se uma decisão é comparar o valor tabelado com a estatística do teste. Para o caso de testes de médias, a estatística do teste é a variável padronizada Z: Estatística do teste Zcal = ( X µ ) ( σ n ) Variabilidade das médias

Passos para realizar um Teste de Hipóteses Passo 3: Região Crítica A região crítica é a região onde H o é rejeitada. A área da região crítica é igual ao nível de significância (α), que estabelece a probabilidade de rejeitar H o quando ela é verdadeira. Por exemplo, se utilizarmos o nível de significância de 5%, a probabilidade de rejeitar H o quando ela é verdadeira é igual a 5%. Na prática, os valores usuais são: α = 0,01 ou 0,05 ou 0,10.

Passos para realizar um Teste de Hipóteses Unilateral à esquerda: H o : µ = 50 H A : µ > 50 Unilateral à direita: H o : µ = 50 H A : µ <50 Bilateral: H o : µ = 50 H A : µ 50

Passos para realizar um Teste de Hipóteses Passo 4. Regra de Decisão: Se o valor da estatística do teste cair na região crítica, rejeita-se H o. Ao rejeitar a hipótese nula existe uma forte evidência de sua falsidade. Ao contrário, quando aceitamos, dizemos que não houve evidência amostral significativa no sentido de permitir a rejeição de Ho.

p-valor Definição: probabilidade de obter o resultado que obtivemos ou mais estremo, sendo a hipótese nula é verdadeira. O p- valor é comparado ao nível de significância α prédeterminado. Se o p- valor for menor ou igual ao nível de significância, rejeitamos H 0. Note as seguintes interpretações de p-valores: p > 0,10 Não existe evidência contra H 0 p < 0,10 Fraca evidência contra H 0 p < 0,05 Evidência significativa contra H 0 p < 0,01 Evidência altamente significativa contra H 0

Testes de Hipóteses Estudaremos testes de hipóteses considerando: (a) Uma única amostra (b) Comparação de duas ou mais amostras Primeiramente, vamos estudar teste de hipótese para uma amostra.

Uma amostra - Variável quantitativa Com uma amostra de indivíduos queremos saber se a média da respectiva população é um determinado valor.

Teste de Hipótese para Média Populacional

PASSO 1: H 0 : µ M =128 versus H A : µ M 128 PASSO 2: Nível de significância: 5% PASSO 3: Estatística do teste: x µ 0 135 128 7 Z cal = = = = 2, 28. σ 24 3,1 n 60

PASSO 4: Construir a Região de Rejeição (RR) TESTE BILATERAL RA RR RR

Portanto, a amostra aleatória sugere que medicamento M aumenta a PAS. Agora, vamos calcular o p- valor para o teste de hipótese em questão: Temos que calcular a probabilidade de observarmos um valor igual ou superior a 2,28, isto é, p-valor: P(Z>2,28) =0,013 (distribuição normal) Como o teste é bilateral, temos que multiplicar por dois esta probabilidade. Assim, 0,013 x 2 = 0,026 Desde que o p- valor é menor que o nível de significância do teste (α = 5%), rejeita- se a hipótese nula.

Quando o desvio padrão populacional é desconhecido, porém n 30, podemos usar a distribuição Normal, mas você deve substituir o desvio padrão populacional pelo desvio padrão amostral. Quando o n<30 e o desvio padrão populacional é desconhecido, temos que aplicar o teste t de Student com a fórmula abaixo: t cal x = 0 ~ t( n 1) s µ n Suposição do teste: A variável quantitativa é normalmente distribuída na população.

Exemplo: Teste t A altura média dos estudantes da UFMA é de 1,70 m. Em uma amostra casual de tamanho 25 foi estimada a média de 1,72 m e desvio padrão da amostra de 0,08 m. Podese considerar que a média amostral não difere da média da população?

Solução: a) H 0 : µ = 1, 70m H A : µ 1, 70m b) α = 0,05; t crit 0,025; 24 g. l. ; = 2,064 x µ 1,72 1,70 c) t = = = s 0,08 n 25 1,25 d) Decisão: Não há evidência para rejeitar H 0.

Solução no STATA: contém 1,70m ttesti 25 1.72 0.08 1.70 One-sample t test ------------------------------------------------------------------------------ Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---------+-------------------------------------------------------------------- x 25 1.72.016.08 1.686978 1.753022 ------------------------------------------------------------------------------ mean = mean(x) t = 1.2500 Ho: mean = 1.70 degrees of freedom = 24 Ha: mean < 1.70 Ha: mean!= 1.70 Ha: mean > 1.70 Pr(T < t) = 0.8883 Pr( T > t ) = 0.2234 Pr(T > t) = 0.1117 H µ 1, 70m 0 : 0 = t cal =1,25 p valor> 0,05

Teste de Hipótese para Proporção Populacional Vejamos agora teste de hipótese para variáveis qualitativas. Por exemplo: prevalência de uma doença. Para construção de um teste de hipóteses, para esta situação, devemos seguir o mesmo raciocínio anteriormente aplicado para variáveis quantitativas.

Teste de Hipótese para Proporção Populacional Estabeleça a hipótese nula e a hipótese alternativa Exemplo: H 0 : π = π 0 versus H A : π π 0 Calcule a proporção amostral Calcule a estatística do teste pˆ π 0 z cal = π 0(1 π 0) n

Teste de Hipótese para Proporção Populacional Utilizar a tabela da Distribuição Normal para determinar o p-valor. Comparar o p-valor do teste com o nível de significância do teste. Nota: Uma regra geral é que o teste anterior é válido quando temos ambos nˆ p e n( 1 pˆ ) maiores do que 10.

Exemplo: Teste de Hipótese para Proporção Populacional Em um região afetada por um surto epidêmico, observou- se uma amostra de 2500 indivíduos, tendose encontrado 625 contaminados. Teste, ao nível de significância 5%, se a proporção de indivíduos contaminados é significativamente superior a 20%.

Solução: a) H 0 : π = 0,20 : π > 0, 20 b) α = 0,05; z 0, 05 = c) Z cal = pˆ π 0 d) Região crítica: π (1 n ) H A 1,65 0,25 0,2 0 = = π 0 0,25 (1 0,75 ) 2500 6,25 d) Decisão: Há evidência para rejeitar H 0.

Solução no STATA: Não contém 0,2 prtesti 2500 0.25 0.2v One-sample test of proportion x: Number of obs = 2500 ------------------------------------------------------------------------------ Variable Mean Std. Err. [95% Conf. Interval] -------------+---------------------------------------------------------------- x.25.0086603.2330262.2669738 ------------------------------------------------------------------------------ p = proportion(x) z = 6.2500 Ho: p = 0.2 Ha: p < 0.2 Ha: p!= 0.2 Ha: p > 0.2 Pr(Z < z) = 1.0000 Pr( Z > z ) = 0.0000 Pr(Z > z) = 0.0000 z cal = 6,25 H :π = 0 2 0, p-valor <0,05

Comparação de Dois grupos Na pesquisa médica, é muito freqüente necessitarmos comparar médias ou proporções de amostras diferentes (por ex. caso x controle). Se estamos estudando duas amostras, então amostras pareadas ou independentes?

Amostras Independentes Neste tipo de estudo, temos duas amostras, mas cada indivíduo participa apenas de uma das amostras. Amostras Pareadas Num estudo pareado, novamente se tem duas amostras, mas cada observação da primeira amostra é pareada com uma observação da segunda amostra.

Dois grupos independentes (uma observação em cada unidade amostral). Exemplos 1. Dois produtos 2. Duas drogas terapêuticas 3. Duas marcas comerciais 4. Dois procedimentos cirúrgicos 5. Dois gêneros

Dois grupos pareados (duas observações em cada unidade amostral). Exemplos 1. Antes e depois de uma intervenção cirúrgica 2. Lados direito e esquerdo 3. Dois períodos diferentes

Teste t para duas amostras independentes A variável de interesse é uma variável quantitativa e normalmente distribuída. Exemplo: Comparar produtos alimentícios (um novo, outro tradicional) no ganho de peso de ratos de laboratório. Você que saber se na população: As médias são diferentes? A média do novo produto é maior?

Você também precisa saber se, na população: A variabilidade é a mesma nos dois grupos? A variabilidade é diferente? Para verificar se a variabilidade é a mesma nos dois grupos, utiliza-se o Teste F. 2 H : = 0 σ 1 2 σ 2 versus H A 2 : σ 1 2 σ 2

1 o Caso: Considere a situação em que as duas variâncias populacionais são desconhecidas, mas é razoável assumir que elas sejam iguais. Neste caso, utiliza- se o teste t- Student para amostras independentes. Estatística do teste: ) 2 ( 2 1 2 1 2 1 ~ 1 1 + + = n n p cal t x x t n n s com 2 1) ( 1) ( 2 1 2 2 2 2 1 1 2 + + = n n s n s n s p

Exemplo: Duas amostras independentes com variâncias iguais Um pesquisador gostaria de testar a hipótese que os homens são mais pesados que as mulheres à idade adulta. Tomou ao acaso uma amostra de 35 alunos, sendo 17 do sexo feminino e 18 do masculino. Média n Variância Masculino 76,8 18 334,18 Feminino 72,9 17 303,11

Solução: a H :µ = µ ) 0 M M b H : µ > µ ) 1 F F c ) α 0,05 ; t, 05 ; 33 g. = 0 l = 1,69 d ) t cal = s p x 1 1 1 2 76,8 72,9 17,86 1 1 + 18 17 17,86 3,9 0,338 3,9 6,04 1 2 = = = = n x + n 0,645 e) Decisão: Não há evidência para rejeitar H 0.

Solução no STATA: Teste F Comando: stesti n1. sd1. n2. sd2 Para o exemplo anterior, temos: sdtesti 18. 18.28 17. 17.41 Variance ratio test ------------------------------------------------------------------------------ Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---------+-------------------------------------------------------------------- x 18. 4.308637 18.28.. y 17. 4.222545 17.41.. ---------+-------------------------------------------------------------------- combined 35..... ------------------------------------------------------------------------------ ratio = sd(x) / sd(y) f = 1.1024 Ho: ratio = 1 degrees of freedom = 17, 16 Ha: ratio < 1 Ha: ratio!= 1 Ha: ratio > 1 Pr(F < f) = 0.5753 2*Pr(F > f) = 0.8494 Pr(F > f) = 0.4247 Podemos concluir que as variâncias populacionais são iguais (p-valor=0,8494)

Solução no STATA: Teste t-student para variâncias iguais Comando: ttesti n1 me1 sd1 n2 me2 sd2 ttesti 18 76.8 18.28 17 72.9 17.41 Two-sample t test with equal variances ------------------------------------------------------------------------------ Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] ---------+-------------------------------------------------------------------- x 18 76.8 4.308637 18.28 67.70957 85.89043 y 17 72.9 4.222545 17.41 63.9486 81.8514 ---------+-------------------------------------------------------------------- combined 35 74.90571 2.993466 17.70959 68.82226 80.98917 ---------+-------------------------------------------------------------------- diff 3.9 6.041423-8.391367 16.19137 ------------------------------------------------------------------------------ diff = mean(x) - mean(y) t = 0.6455 Ho: diff = 0 degrees of freedom = 33 Ha: diff < 0 Ha: diff!= 0 Ha: diff > 0 Pr(T < t) = 0.7385 Pr( T > t ) = 0.5230 Pr(T > t) = 0.2615 Podemos concluir que as médias populacionais são iguais (p-valor=0,5230)

2 o Caso: Agora, considere a situação em que as duas variâncias populacionais são desconhecidas e desiguais. Neste caso, deve- se utilizar o teste t student com variâncias desiguais. A estatística do teste é dada por cal t v n s n s x x t ~ 2 2 2 1 2 1 2 1 + = 2 1 1 2 2 2 2 2 1 2 1 2 1 2 2 2 2 1 2 1 + + + + = n n S n n S n S n S ν com Comando no STATA: ttesti n1 me1 sd1 n2 me2 sd2, unequal

Teste de Hipóteses para Duas Médias Populacionais Agora, vamos considerar amostras pareadas. A variável de interesse é quantitativa e normalmente distribuída. Novamente, o interesse é testar a hipótese nula de que as duas médias das populações são iguais. As hipóteses a serem testadas são H 0 : µ 1 = µ 2 versus H A : µ 1 µ 2

Em vez de considerarmos os dois conjuntos de observações como amostras distintas, focalizamos a diferença de medições dentro de cada par. Amostra 1 Amostra 2 x 11 x 21 x 31 x 41. x n1 x 12 x 22 x 32 x 42. x n2

Usamos esses dados para criar novo conjunto de observações que representam as diferenças dentro de cada par: d 1= x 11 -x 12 d 2= x 21 -x 22 d 3= x 31 -x 32 d n= x n1 -x n2

A partir dessas diferenças calculamos a média e o desvio padrão Estatística do teste: n d d n i i = = 1 1 ) ( 1 = = n d d s n i i d 1) ( ~ = n d cal t n s d t

Teste de Hipóteses para Duas Proporções Populacionais Primeiramente, vamos considerar amostras independentes. O interesse é comparar dois grupos através do resultado observado em uma variável dicotômica. O problema de comparação das proporções populacionais nos dois grupos é formulado através das hipóteses: H 0 : π 1 = π 2 versus H A : π 1 π 2

Teste Qui Quadrado É um teste muito usado na área médica que se destina a comparar proporções. Utiliza-se o teste qui-quadrado quando deseja-se verificar se a freqüência com que um determinado acontecimento observado em uma amostra se desvia significativamente ou não da freqüência com que ele é esperado.

Teste Qui Quadrado Grupo Ocorrência do Evento Total SIM NÃO I a b a + b = n 1 II c d c + d = n 2 Total a + c = m 1 b + d = m 2 n 1 + n 2 = n

Exemplo Os dados a seguir são referentes ao sexo e condição de sobrevivência de uma amostra de recém- nascidos com síndrome de desconforto idiopático grave. Sexo sobrevivente Não sobrevivente Feminino Masculino Total 10 17 27 7 16 23 Total 17 33 50 Você diria que meninos sobrevivem mais do que meninas?

Exemplo Cálculos necessários para a construção do teste qui-quadrado: i O i E i O i -E i (O i -E i ) 2 (O i -E i ) 2 E i 1 10 9,18 0,82 0,6724 0,07 2 17 17,82-0,82 0,6724 0,04 3 7 7,82-0,82 0,6724 0,08 4 16 15,18 0,82 0,6724 0,04 Total 50 50 0 2,6896 0,23 O valor da estatística do teste é 0,23. Como este valor é maior do que 3,84, valor obtido da distribuição qui-quadrado, para um nível de de significância de 5%, não rejeitamos a hipótese nula, ou seja, os meninos não sobrevivem mais do que as meninas.

Restrições ao Uso do Teste Qui-Quadrado Quando 20 n 40, utilizar o teste qui-quadrado se nenhuma freqüência esperada seja inferior a 5. Em caso contrário, utilizar o Teste Exato de Fisher. Quando n < 20, utilizar o Teste Exato de Fisher. Quando n > 40, utilizar o teste qui-quadrado. Quando o número de categorias for maior do que 2, não mais que 20% das categorias devem ter freqüências menores que 5 e nenhuma categoria deve ter freqüência menor que 1.