Teste de hipóteses. Testes de Hipóteses. Valor de p ou P-valor. Lógica dos testes de hipótese. Valor de p 31/08/2016 VPS126

Documentos relacionados
Técnicas Computacionais em Probabilidade e Estatística I. Aula I

AULA 05 Teste de Hipótese

AULA 04 Teste de hipótese

Estatística descritiva

Teste de Hipótese e Intervalo de Confiança

Notas de aula Testes de Hipóteses. Idemauro Antonio Rodrigues de Lara

AULA 11 Teste de Hipótese

7 Teste de Hipóteses

Teste de hipóteses. Estatística Aplicada Larson Farber

Comparando Duas Amostras (abordagem não-paramétrica)

PHD 5742 Estatística Aplicada ao Gerenciamento dos Recursos Hídricos. 6 a aula Testes de Hipóteses

Variância pop. * conhecida Teste t Paramétrico Quantitativa Distribuição normal Wilcoxon (teste dos sinais, Wilcoxon p/ 1 amostra)

Estimação e Testes de Hipóteses

Análise de Dados da Avaliação II

Testes de significância com dados multivariados

Inferência Estatística:

1 Teoria da Decisão Estatística

HEP-5800 BIOESTATÌSTICA

Capacitação em R e RStudio PROJETO DE EXTENSÃO. Software R: capacitação em análise estatística de dados utilizando um software livre.

Tomada de Decisão para uma Única Amostra

4-Teste de Hipóteses. Teste de Hipóteses

Testes de Hipóteses Paramétricos

Probabilidade e Estatística

Estatística stica na Pesquisa Clínica

Testes de Hipóteses Paramétricos

Inferência Estatística

Estatística Inferencial

Teste de Hipóteses (ou Teste de Significância)

IV.4 Análise de Dados da Avaliação IV AVALIAÇÃO IV.4 ANÁLISE DE DADOS DA AVALIAÇÃO. Interactive System Design, Cap. 10, William Newman. Melhor e Pior?

Métodos Quantitativos em Medicina. Prof. Neli Ortega

Explorando os dados. Estatística Descritiva - Tabelas. Roteiro da aula. Tabelas

Intervalo de confiança. Intervalo de confiança. Inferência. Generalizar os resultados da pesquisa a todo o universo de eleitores margem de erro

Distribuição de frequências. Prof. Dr. Alberto Franke

Métodos Quantitativos em Medicina

Associação entre variáveis categóricas e IC95%

Intervalos de Confiança - Amostras Pequenas

Intervalo de confiança

6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA

AULA 11 - Normalidade e Inferência em Regressão Múltipla - Parte 1

UNIVERSIDADE DE SÃO PAULO

Profa.: Patricia Maria Bortolon, D.Sc. Statistics for Managers Using Microsoft Excel, 5e 2008 Pearson Prentice-Hall, Inc. Chap 9-1

Inferência Estatística Estimação de Parâmetros

BIOESTATÍSTICA TESTES DE HIPÓTESES

Bioestatística Básica

Aula de hoje. Associação e Proporções. Tabela 2x2 (valores esperados dados hipotéticos) Tabela 2x2 (valores esperados dados reais)

6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA

Probabilidade e Estatística

AULA 07 Inferência a Partir de Duas Amostras

Testes de Hipótese para uma única Amostra - parte I

Bioestatística UNESP. Prof. Dr. Carlos Roberto Padovani Prof. Titular de Bioestatística IB-UNESP/Botucatu-SP

Estimação parâmetros e teste de hipóteses. Prof. Dr. Alberto Franke (48)

TESTES NÃO-PARAMÉTRICOS

UMA PESQUISA EXPLORATORIA DOS INDICADORES DO IRBEM-2011 DA REDE NOSSA SÃO PAULO

Teste de hipóteses para proporção populacional p

TESTES DE HIPÓTESES. Lucas Santana da Cunha Universidade Estadual de Londrina

Testes de Hipóteses. : Existe efeito

Introdução à Bioestatística Turma Nutrição

TESTE DE HIPÓTESE. Introdução

Análise da Regressão múltipla: MQO Assintótico y = β 0 + β 1 x 1 + β x +... β k x k + u 3. Propriedades assintóticas Antes, propriedades sobre amostra

6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA

Estatística e Modelos Probabilísticos - COE241

Testes de Hipóteses: Média e proporção

Exame Final de Métodos Estatísticos

'HVFULomRH$QiOLVH([SORUDWyULDGRV'DGRV

Aula 7. Testes de Hipóteses Paramétricos (II)

Aula 7. Testes de Hipóteses Paramétricos (II)

Análise da Regressão múltipla: Inferência. Aula 4 6 de maio de 2013

Sumário dos exemplos:

Testes de Hipóteses para. uma Única Amostra. Objetivos de Aprendizagem. 9.1 Teste de Hipóteses. UFMG-ICEx-EST-027/031 07/06/ :07

Teste de Hipótese. Capítulo 8 Triola, 10 a. Ed. (Capítulo 7 Triola, 9 a. Ed.) 1 Visão Geral. 2 Fundamentos do teste de hipótese

Módulo 5 As modificações da 2ª. Edição. Cartas de controle para condições especiais (construção e interpretação).

DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA)

Teste de Hipótese. Comparação entre médias de dois grupos de dados 22/05/2009. Conteúdo. Valor de P. Tipos de Erro. Tipos de Erro

A moeda é honesta ou é desequilibrada? Qual é a probabilidade de "cara"no lançamento de uma moeda?

Curso de Metodologia da Pesquisa em Ciências da Vida. Tópicos em bioestatística fundamentais para o pesquisador em Ciências da Vida

Métodos Quantitativos

Projeto de Experimentos

(Hipótese alternativa unilateral)

Análise Multivariada Aplicada à Contabilidade

Inferência estatística

MEDIDAS DE POSIÇÃO E DE DISPERSÃO. Profª Andréa H Dâmaso

Instituto Tecnológico de Aeronáutica Divisão de Engenharia Mecânica-Aeronáutica. MOQ-13 Probabilidade e Estatística

Teste de Hipóteses Paramétricos

MB-210 Probabilidade e Estatística

Aula 8. Teste Binomial a uma proporção p

PONTIFÍCIA UNIVERSIDADE CATÓLICA DE SÃO PAULO FEA - Faculdade de Economia e Administração Programa de Estudos Pós-Graduados em Administração

Testes t para comparação de médias de dois grupos independentes

Estatística aplicada a ensaios clínicos

1 Probabilidade - Modelos Probabilísticos

Fernando de Pol Mayer

Ajustar Técnica usada na análise dos dados para controlar ou considerar possíveis variáveis de confusão.

Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Teste de Hipóteses. Prof.: Joni Fusinato

Inferência Estatística Básica. Teste de Hipóteses: decidindo na presença de incerteza

CE-003: Estatística II - Turma: K/O, 2 a Prova (22/06/2016)

Capítulo 6 Estatística não-paramétrica

Transcrição:

3/8/26 Teste de hipóteses Testes de Hipóteses VPS26 Ferramenta estatística para auxiliar no acúmulo de evidências sobre uma questão Média de glicemia de um grupo de animais é diferente do esperado? Qual o melhor tipo de dieta para cães diabéticos? Proporção de crianças daltônicas em uma cidade é a esperada? Qual o melhor método para inseminação artificial? Qual a relação entre peso de ovelhas e sua circunferência abdominal? Lógica dos testes de hipótese Elaborar uma Hipótese Nula (também chamada H), com a qual é possível prever a probabilidade de amostras aleatórias apresentarem uma certa característica. Calcular a probabilidade da amostra analisada ser obtida, dado que a hipótese nula é verdadeira (valor de p, p-valor). Comparar essa probabilidade (valor de p) com um valor prédefinido (alfa, nível crítico, Erro Tipo I). Caso a probabilidade seja baixa, menor que o valor pré-definido (alfa), temos evidências de que a Hipótese Nula seja falsa. Caso a probabilidade seja alta, maior que o valor pré-definido (alfa), não temos evidências de que a hipótese nula seja falsa Atenção: Isso não quer dizer, necessariamente, que H é verdadeira. Valor de p ou P-valor Dos dados pode-se calcular o valor da estatística do teste (expressão algébrica para a hipótese que está sendo testada). Há uma probabilidade relacionada a este valor da estatística do teste que se chama valor de p. O valor de p (nível descritivo) descreve a chance de obter o resultado observado (ou um mais extremo) se a hipótese nula for verdadeira. Valor de p Significância em alguns programas estatísticos Se o valor de p for muito pequeno, então é pouco provável que tenhamos obtido os resultados observados sendo H verdadeira, então rejeitamos H. Se o valor de p for muito grande, então há uma grande chance de termos obtido os dados observados sendo H verdadeira, então não rejeitamos H. muito altamente significante (*** representa p<,) altamente significante (** representa,<p<,) significante (* representa,<p<,5) não-significante (NS representa p>,5) Cuidado! Esse critério é arbitrário e deve considerado com precaução. A decisão com base no valor de p deve ser tomada em função do problema analisado.

3/8/26 Erros Tipo I e Tipo II Erros Tipo I e Tipo II A decisão de rejeitar ou não rejeitar H pode estar incorreta Erro tipo I: rejeitar H quando H é verdadeira. [ probabilidade de rejeitar H de forma incorreta a ] Erro tipo II: não rejeitar H quando H é falsa. [probabilidade de cometer um erro tipo II b ] Realidade Conclusão do teste (baseada H verdadeira H falsa na amostra) Rejeitar H erro tipo I (a) decisão correta Não rejeitar H decisão correta erro tipo II (b) a e b Probabilidade de cometer um erro tipo I : nível de significância do teste (a) Ex. Se a =,5, há uma chance de em 2 de rejeitar H quando H é verdadeira Escolha de a: H será rejeitada se p a H não será rejeitada se p>a a e b Probabilidade de cometer um erro tipo II (b) (probabilidade de não rejeitar H quando H é falsa) Normalmente se pensa em - b (poder do teste): probabilidade de rejeitar H quando H é falsa p: Valor de p ou P-valor é o nível descritivo (veja adiante) Escolha do teste Como escolher o teste de hipótese mais adequado para a pergunta a ser respondida? Diferentes testes de hipóteses foram desenvolvidos para lidar com diferentes situações. É necessário checar em quais situações cada teste é aplicável, e verificar se os dados atendem às premissas do teste escolhido. Lembre-se Sempre dê preferências aos testes Paramétricos: Quando as premissas desses são satisfeitas, eles possuem maior poder (menor erro Tipo II) do que os Nãoparamétricos. 2

3/8/26 Lembre-se Transformação de variáveis Variável nominal pode ser utilizada para dividir o conjunto de dados em grupos Quantitativa Qualitativa Ordinal Qualitativa Nominal Atenção! Dois modos de se testar H O que é estatisticamente significante pode não ser biológica ou clinicamente significante e vice-versa. Ex. Métodos de inseminação artificial (uma economia de ou 2% pode ser uma diferença econômica grande, mas estatisticamente difícil de se obter) Ex. Dois diferentes anestésicos (pequenas variações na pressão sangüínea; a diferença pode ser estatisticamente significante, mas de pequena importância biológica) Calcula-se a estatística (fórmula) do teste e o valor de p rejeita-se H se p for pequeno Calcula-se IC 95% rejeita-se H se o valor do parâmetro ficar fora dos limites de confiança (para um nível de 5%) Inferência sobre média de uma amostra de dados com distribuição Normal A distribuição dos dados é Normal? Variância populacional conhecida; amostra grande Uma amostra versus população Variância desconhecida Se a distribuição dos dados não for Normal, há dois modos de se prosseguir na análise dos dados: Transformar os dados para se aproximar da Normalidade (ex. transformação logarítmica) Teste não-paramétrico (que não faz nenhuma hipótese sobre a distribuição) Z t Adaptado de Fisher LD, Van Belle G. Biostatistics: a Methodology for the Health Sciences, Wiley, 993. 3

Ganho diário de peso (g) 3/8/26 Implicações do tamanho da amostra Observação: teste Z e teste t amostras pequenas (< 6 observações): é difícil dizer qual a distribuição da variável; podem ser pouco representativas da população amostras pequenas (< 3 observações): distribuição de t de Student para dados que se distribuem de modo Normal amostras grandes: distribuição do teste é Normal (Teorema do Limite Central) No curso, nos casos em que o teste Z seria adequado, utilizaremos o teste t, que fornece resultados equivalentes. Teste t para uma amostra Investigar se a média de um grupo de observações assume um certo valor. Exemplo (Petrie e Watson, 999): Questão: Deseja-se saber se suínos em crescimento de um certo lote de uma granja apresentam uma conversão alimentar média diária consistente com o ganho médio esperado para aquela granja (67 g/dia). Procedimento do teste ) Especificar a hipótese nula e a hipótese alternativa: H : 67 g / dia H : 67 g / dia 2) Estatística descritiva e gráfico para verificar a distribuição dos dados (diagrama de pontos, boxplot, histograma) Descriptive Statistics: suinos Variable N Mean Median TrMean StDev SE Mean suinos 36 599,9 6, 599,38 8,66 3, Variable Minimum Maximum Q Q3 suinos 559, 636, 586,5 6,25 65 6 55 592 56 Descriptive Statistics Variable: suinos Anderson-Darling Normality Test A-Squared:,9 P-Value:,997 Mean 599,9 StDev 8,656 Variance 38,7 Skewness -,3E- Kurtosis -,E- N 36 58 6 62 6 Minimum 559, st Quartile 586,5 Median 6, 3rd Quartile 6,25 95% Confidence Interval for Mu Maximum 636, 95% Confidence Interval for Mu 592,882 65,57 597 62 67 95% Confidence Interval for Sigma 5,32 2,336 95% Confidence Interval for Median 95% Confidence Interval for Median 593,26 66,265 Testa a Normalidade da distribuição de dados x s 3) Calcular a estatística (fórmula) do teste: t, onde sm s t=-2,5 m n ) Obter o valor de p : p=,7. Como p<2%, há uma chance de menos de 2% de se obter um ganho médio diário de 599,2 g/dia se H for verdadeira. 5) Decidir se rejeita ou não a hipótese nula H : É pouco provável que H seja verdadeira. Ou seja, os dados são inconsistentes com um ganho médio diário de 67 g. Para a=,5: como p<a, rejeitamos H para um nível de significância de 5%. 6) Determinar, se quiser, o intervalo de confiança de 95% IC 95% : (592,88 ; 65,5). O IC95% não contém o valor testado (67g/dia), confirmando a rejeição de H. One-Sample T: suinos Test of mu = 67 vs mu not = 67 Teste de Anderson-Darling: H : Distribuição é Normal H : Distribuição não é Normal Para a =,5 = 5%: Como p=,997, p > a Não se rejeita H, ou seja, assumimos que a distribuição seja Normal Variable N Mean StDev SE Mean suinos 36 599,9 8,66 3, Variable 95,% CI T P suinos ( 592,88; 65,5) -2,5,7

Frequency Frequency 3/8/26 Histogram of suinos (with Ho and 95% t-confidence interval for the mean) 8 _ X Ho [ ] 56 57 58 59 6 suinos 6 62 63 6 Distribuição t Mas, e se o teste fosse monocaudal? A hipótese alternativa deve ser especificada antes da coleta dos dados e deve ser independente deles. Quando houver conhecimento prévio para dizer que a diferença ocorre em uma dada direção (maior ou menor), aplicamos o teste monocaudal. H : 67 g / dia H : 67 g / dia One-Sample T: suinos Test of mu = 67 vs mu < 67 Variable N Mean StDev SE Mean suinos 36 599,9 8,66 3, Teste t monocaudal Variable 95,% Upper Bound T P suinos 6,5-2,5,8 8 Histogram of suinos (with Ho and 95% t-confidence bound for the mean) _ X ] Ho Conclusão: H é rejeitada, porque p=,8% é menor que um nível de significância de 5%. Observe que este valor de p é a metade do valor obtido no teste bicaudal. Cuidado: É mais fácil rejeitar H quando o teste é monocaudal. No entanto, lembre-se que a hipótese nula, neste caso, deve ser feita a priori com base em conhecimentos prévios. 56 57 58 59 6 6 62 63 6 suinos 5