Estatística II Antonio Roque Aula 9. Testes de Hipóteses



Documentos relacionados
Exemplos de Testes de Hipóteses para Médias Populacionais

Aula 4 Estatística Conceitos básicos

Eventos independentes

Exercícios Teóricos Resolvidos

A finalidade dos testes de hipóteses paramétrico é avaliar afirmações sobre os valores dos parâmetros populacionais.

1. Os métodos Não-Paramétricos podem ser aplicados a uma ampla diversidade de situações, porque não exigem populações distribuídas normalmente.

LISTA DE INTERVALO DE CONFIANÇA E TESTE DE HIPÓTESES

Processos Estocásticos

Aula 4 Conceitos Básicos de Estatística. Aula 4 Conceitos básicos de estatística

Distribuição de probabilidades

Realizando cálculos para o aparelho divisor (I)

Resolução de sistemas lineares

O teste de McNemar. A tabela 2x2. Depois

SÉRIE: Estatística Básica Texto 4: TESTES DE HIPÓTESES SUMÁRIO

1. A corrida de vetores numa folha de papel.

Correlação quando uma Variável é Nominal

MD Sequências e Indução Matemática 1

Probabilidade e Estatística I Antonio Roque Aula 11 Probabilidade Elementar: Novos Conceitos

4Distribuição de. freqüência

ANALISE COMBINATORIA Um pouco de probabilidade

A Matemática do ENEM em Bizus

PROVA RESOLVIDA E COMENTADA DA POLÍCIA RODOVIÁRIA FEDERAL(PRF) - Professor Joselias Out

Fração como porcentagem. Sexto Ano do Ensino Fundamental. Autor: Prof. Francisco Bruno Holanda Revisor: Prof. Antonio Caminha M.

A lei de Gauss é uma lei geral. Ela vale para qualquer distribuição de cargas e qualquer superfície fechada.

2 Pesquisa de valores em uma lista de dados

COMENTÁRIO AFRM/RS 2012 ESTATÍSTICA Prof. Sérgio Altenfelder

DETERMINAÇÃO DO TAMANHO DE UMA AMOSTRA

Especialização em Engenharia Clínica

O Princípio da Complementaridade e o papel do observador na Mecânica Quântica

7Testes de hipótese. Prof. Dr. Paulo Picchetti M.Sc. Erick Y. Mizuno. H 0 : 2,5 peças / hora

Dois eventos são disjuntos ou mutuamente exclusivos quando não tem elementos em comum. Isto é, A B = Φ

O comportamento conjunto de duas variáveis quantitativas pode ser observado por meio de um gráfico, denominado diagrama de dispersão.

Prof. Bruno Holanda - Semana Oĺımpica Nível 1. Teoria dos Grafos

elementos. Caso teremos: elementos. Também pode ocorrer o seguinte fato:. Falsa. Justificativa: Caso, elementos.

Notas de Cálculo Numérico

Um jogo de preencher casas

Ambos têm os algarismos 7854 seguidos, a potência de dez apenas moverá a vírgula, que não afeta a quantidade de algarismos significativos.

a) Suponha que na amostra de 20 declarações foram encontrados 15 com dados incorrectos. Construa um

Testes de Hipóteses para a Diferença Entre Duas Médias Populacionais

Resolução da Prova de Raciocínio Lógico do TCE/SP, aplicada em 06/12/2015.

Aula 10 Testes de hipóteses

Exercícios resolvidos sobre Função de probabilidade e densidade de probabilidade

DICAS PARA CÁLCULOS MAIS RÁPIDOS ARTIGO 06

Resoluções comentadas de Raciocínio Lógico e Estatística - SEPLAG APO

A presente seção apresenta e especifica as hipótese que se buscou testar com o experimento. A seção 5 vai detalhar o desenho do experimento.

Capítulo 8 - Testes de hipóteses. 8.1 Introdução

Aula 9 ESCALA GRÁFICA. Antônio Carlos Campos

Curvas em coordenadas polares

Programa Olímpico de Treinamento. Aula 9. Curso de Combinatória - Nível 2. Tabuleiros. Prof. Bruno Holanda

Variáveis aleatórias contínuas e distribuiçao Normal. Henrique Dantas Neder

Cotagem de elementos

Hipótese Estatística:

Figura 1: tela inicial do BlueControl COMO COLOCAR A SALA DE INFORMÁTICA EM FUNCIONAMENTO?

LISTA DE EXERCÍCIOS 3

PESQUISA EM INFORMÁTICA -ESTILOS DE PESQUISA EM COMPUTAÇÃO. Prof. Angelo Augusto Frozza, M.Sc.

Resolvendo problemas com logaritmos

o hemofílico. Meu filho também será?

Apresentação de Dados em Tabelas e Gráficos

CAP4: Controle Estatístico do Processo (CEP)

Aula 5 Distribuição amostral da média

Cotagem de dimensões básicas

Vejamos um exemplo. Vamos supor que queiramos montar uma tabela 3X2, ou seja de 3 colunas por 2 linhas, o código HTML para isso é :

CURSO ON-LINE PROFESSOR: VÍTOR MENEZES

cadeira Modelação dos Sistemas Biológicos Parte 1 - Biometria

SOCIEDADE BRASILEIRA DE MATEMÁTICA MESTRADO PROFISSIONAL EM REDE NACIONAL PROFMAT

ENSINO E APRENDIZAGEM DE CIÊNCIAS BIOLÓGICAS, COM A UTILIZAÇÃO DE JOGOS DIDÁTICOS: RELATO DE EXPERIÊNCIA.

Faculdade Sagrada Família

Resoluções comentadas de Raciocínio Lógico e Estatística SEFAZ - Analista em Finanças Públicas Prova realizada em 04/12/2011 pelo CEPERJ

O céu. Aquela semana tinha sido uma trabalheira!

MATRIZES ADIÇÃO E SUBTRAÇÃO DE MATRIZES

Papo com a Especialista


3.4 O Princípio da Equipartição de Energia e a Capacidade Calorífica Molar

Teste de Hipótese para uma Amostra Única

Roda Roda. Série Matemática na Escola. Objetivos 1. Introduzir o conceito de permutação circular; 2. Aplicar o conceito de permutação simples.

Padronização e Escores z. Transformação z Percentis

Métodos Quantitativos Prof. Ms. Osmar Pastore e Prof. Ms. Francisco Merlo. Funções Exponenciais e Logarítmicas Progressões Matemáticas

Implementando uma Classe e Criando Objetos a partir dela

Aula 6. Testes de Hipóteses Paramétricos (I) Métodos Estadísticos 2008 Universidade de Averio Profª Gladys Castillo Jordán. Teste de Hipóteses

PROBABILIDADE Prof. Adriano Mendonça Souza, Dr.

Gráficos estatísticos: histograma. Série Software ferramenta

QUANTIFICADORES. Existem frases declarativas que não há como decidir se são verdadeiras ou falsas. Por exemplo: (a) Ele é um campeão da Fórmula 1.

Exercícios Resolvidos sobre probabilidade total e Teorema de Bayes

Redação Dr. Maurício de Freitas Lima. Edição ACS - Assessoria de Comunicação Social Maria Isabel Marques - MTB

MÓDULO 4 DISTRIBUIÇÃO DE FREQÜÊNCIAS

MÓDULO 6 INTRODUÇÃO À PROBABILIDADE

Probabilidade - aula I

Calculando RPM. O s conjuntos formados por polias e correias

Capítulo 5: Aplicações da Derivada

REPRESENTAÇÃO DE DADOS EM SISTEMAS DE COMPUTAÇÃO AULA 03 Arquitetura de Computadores Gil Eduardo de Andrade

5 Considerações Finais e Recomendações

CURSO E COLÉGIO APOIO. Professor: Ronaldo Correa

RESOLUÇÃO DAS QUESTÕES DE RACIOCÍNIO LÓGICO-MATEMÁTICO

ANÁLISE DE VARIÂNCIA ANOVA. Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística - PPGEMQ / PPGEP - UFSM

Revisão: Noções básicas de estatística aplicada a avaliações de imóveis

Olá pessoal. Foram bem? Até que a prova não foi difícil! Vamos corrigir.

XVIII CONGRESSO DE PÓS-GRADUAÇÃO DA UFLA 19 a 23 de outubro de 2009

Fresando engrenagens cilíndricas com dentes retos

Atividade à Distância Avaliativa - Probabilidade. 1 Probabilidade - Operações e Propriedades

MATEMÁTICA FINANCEIRA BÁSICA

Transcrição:

Testes de Hipóteses Os problemas de inferência estatística tratados nas aulas anteriores podem ser enfocados de um ponto de vista um pouco diferente: ao invés de se construir intervalos de confiança para parâmetros de interesse, pode-se começar fazendo uma hipótese sobre um dado parâmetro de uma população e, então, usar testes estatísticos para verificar a margem de validade da hipótese. O exemplo a seguir ilustra esse método. Suponha que um médico tenha publicado um artigo afirmando que crianças de 8 anos de idade que comem muita salada de folhas verdes têm uma melhora no seu desempenho de leitura. Para testar esta afirmação vamos supor, inicialmente, que se saiba que os escores em um teste de leitura da população de crianças de 8 anos de idade (cada uma com sua dieta usual) sejam distribuídos normalmente com um escore médio de 40 pontos e com um desvio padrão de 10 pontos (veja abaixo). 1

Suponha agora que seja tomada uma amostra de 20 crianças de 8 anos de idade e que todas elas passem por um período em que suas refeições (almoço e jantar) tenham uma importante participação de saladas de folhas verdes. Elas continuam a comer os demais alimentos, necessários para seu desenvolvimento, mas a porcentagem de folhas verdes em sua dieta é fortemente aumentada durante o período do experimento. Como este é um exemplo fictício, não importa aqui a duração do período e nem qual a porcentagem de folhas verdes no total de calorias ingeridas. Após esse período as crianças são submetidas ao mesmo teste de leitura e a média dos seus escores é de x = 47 com um desvio padrão de s = 8. O problema agora passa a ser: é possível decidir, com base no resultado deste experimento, que comer muita salada de folhas verdes realmente aumenta o desempenho de leitura de crianças de 8 anos de idade? Para fazer isso, vamos formular o que se chama de hipótese nula, denominada por H 0. A hipótese nula para este problema é a seguinte: H 0 : Comer muita salada de folhas verdes não causa qualquer alteração no desempenho de leitura de crianças de 8 anos de idade. Se esta hipótese estiver correta, o conjunto de 20 crianças que passou pelo teste de ficar um período comendo muita salada de folhas verdes é apenas mais uma amostra (com n = 20) retirada da população normal de crianças de 8 anos de idade. 2

A hipótese contrária à hipótese nula é chamada de hipótese alternativa e é representada por H 1 : H 1 : Comer muita salada de folhas verdes aumenta o desempenho de leitura de crianças de 8 anos de idade. Se esta hipótese estiver correta, o conjunto de 20 crianças que passou pelo teste de ficar um período comendo muita salada de folhas verdes é, de fato, uma amostra (com n = 20) retirada de uma população diferente da primeira: a população de crianças de crianças de 8 anos de idade que têm o seu desempenho de leitura aumentado por comer muita salada de folhas verdes. As duas figuras abaixo ilustram o dois cenários possíveis: aquele caso a hipótese nula seja verdadeira e aquele caso a hipótese alternativa seja verdadeira. 3

Podemos sintetizar as duas hipóteses por: H 0 : µ = 40 pontos H 1 : µ > 40 pontos O procedimento usado em testes de hipóteses em estatística é considerar que a hipótese nula é verdadeira e confrontar as conseqüências disso em comparação com as evidências empíricas. Caso os resultados empíricos sejam muito pouco prováveis sob a hipótese nula, assume-se que é a hipótese nula que deve estar errada e aceita-se a hipótese alternativa como a mais provável para explicar as evidências empíricas. Caso H 0 seja verdadeira, o que se sabe sobre a população de crianças de 8 anos (que os seus escores são distribuídos normalmente com média igual a 40 pontos e desvio padrão igual a 10 pontos) implica que a distribuição amostral das médias dos escores de amostras de n = 20 crianças retiradas dessa população é normal, com média µ x = µ = 40 e σ = σ n = 10 20 = 2, 24. x A figura abaixo ilustra esta situação, mostrando o posicionamento da média dos escores da amostra de 20 crianças. 4

Segundo o método dos testes de hipóteses, a pergunta que se faz para testar a hipótese nula é a seguinte: Qual a probabilidade de se obter um valor de x mais distante da média µ = 40 do que x = 47? x Graficamente, a resposta a esta pergunta é dada pela área pintada no gráfico abaixo, chamada de valor p. Para se calcular o valor p, basta transformar a distribuição normal do exemplo para a distribuição normal padrão, obter o correspondente valor de z e calcular a área acima de z. 47 40 = 2,24 = 3,125. z. 5

Consultando uma tabela, vemos que a área à direita de z vale 0,0009. Portanto, o valor p é: p = 0,0009. Este resultado implica o seguinte: se o fato de as crianças comerem mais folhas verdes não causa qualquer alteração no seu desempenho de leitura, de maneira que a amostra de 20 crianças que comeram muitas folhas verdes possa ser considerada como uma amostra qualquer retirada da população normal de crianças, então, a probabilidade de que essa amostra tenha, ao acaso, um valor médio mais distante da média populacional do que 47 está distante de 40 é de 0,0009 (0,009%). Este é um valor muito baixo, o que indica que, ou se obteve uma amostra muito rara (algo difícil de se obter ao acaso), ou a hipótese nula é falsa e o escore médio das crianças é maior que 40. Face a estas duas possibilidades e ao valor extremamente baixo de p, decidese rejeitar a hipótese nula e se conclui que o escore médio no teste de leitura das crianças que comem muita salada de folhas verdes é maior que 40, ou seja, aceita-se a hipótese alternativa. É claro que é possível que se esteja errado e que o escore médio das crianças que comem muitas folhas verdes seja, de fato, igual a 40. Porém, devido ao baixíssimo valor p obtido a conclusão tomada parece ser a mais razoável. Suponhamos agora que, ao invés de um escore médio de 47 para amostra de 20 crianças, o escore médio fosse igual a 42. Este também é um valor maior que 40, mas não tanto. Este caso está ilustrado abaixo. 6

Realizando os mesmos cálculos que os feitos para o caso anterior, obtemos agora um valor p = 0,19, ou 19%. Neste segundo caso, como p = 0,19 não é um valor desprezível o que se deve fazer é não rejeitar a hipótese nula. Note que isto não implica que se está aceitando a hipótese nula; apenas que não se possui evidências empíricas para provar que ela é falsa. Neste caso, a não rejeição da hipótese nula é a conclusão mais razoável a ser tomada. Nos dois exemplos dados, foi bem fácil recusar a hipótese nula quando p = 0,0009 e foi bem fácil não recusá-la quando p = 0,19. Esta decisão não seria tão fácil se o valor p fosse alguma coisa intermediária, por exemplo, p = 0,09. É importante, então, definir um valor padrão de p para servir de corte entre rejeição ou não rejeição da hipótese nula. O valor de p mais comumente aceito em ciências sociais para servir de divisor entre rejeição e não rejeição de H 0 é p = 0,05 (5%). Este valor de 0,05 é designado pela letra grega α e é chamado de nível de significância. Pode-se escolher um outro valor para α, como α = 0,1 ou 0,01, mas o mais aceito é α = 0,05. 7

Para α = 0,05, tem-se 5% de chances de errar quando rejeita a hipótese nula, pois 5% das amostras de 20 crianças retiradas aleatoriamente da população de crianças normais terá escore médio mais distante de 40 quanto a média da amostra. Resumindo: Após testar uma hipótese nula usando-se um nível de significância α = 0,05 existem duas possibilidades: (1) rejeita-se a hipótese nula se o valor p for menor que 0,05; ou (2) não se rejeita a hipótese nula se o valor p for maior que 0,05. No primeiro caso, há 5% de chances de se estar errado. No segundo caso não se pode dizer que a hipótese nula é verdadeira, mas apenas que não se pode provar que ela é falsa. Portanto, o teste de hipóteses é uma técnica mais satisfatória para se recusar hipóteses do que para aceitá-las. Mas isto já poderia ser esperado, pois sempre é mais fácil provar que uma teoria é errada do que provar que ela é certa. Pode-se cometer dois tipos de erro quando se toma uma decisão sobre uma hipótese. Pode-se rejeitar a hipótese quando ela é, de fato, verdadeira (chamado de erro de tipo I), ou pode-se aceitar a hipótese quando ela é, de fato, falsa (chamado de erro de tipo II). Isto está esquematizado na tabela abaixo: Hipótese Verdadeira Hipótese Falsa Aceita-se a hipótese Ação correta Erro de tipo II Rejeita-se a hipótese Erro de tipo I Ação correta Para α = 0,05, a probabilidade de se cometer um erro de tipo I quando se rejeita uma hipótese nula é de 5%. 8

A probabilidade de se cometer um erro de tipo II quando se aceita uma hipótese nula é chamada de β. Ela é mais difícil de ser calculada e não será discutida aqui 1. Testes unilaterais e bilaterais No exemplo dado anteriormente, estávamos interessados em saber se o escore médio das crianças que comem muita salada de folhas verdes é maior que 40 pontos. O tipo de teste feito, que calculou apenas a área acima de 47, é chamado de teste unilateral. Há situações, no entanto, em que é mais apropriado fazer um teste do tipo chamado de bilateral. Por exemplo, vamos supor que se queira testar a hipótese de que comer muita salada de folhas verdes altera o desempenho de leitura de crianças, o que pode ser tanto uma melhora no desempenho como uma piora. Neste caso, a hipótese nula e a hipótese alternativa seriam: H 0 : µ = 40 H 1 : µ 40 Como agora existe a possibilidade de que comer muitas folhas verdes reduz o desempenho, além de poder aumentá-lo, o valor p é calculado como a probabilidade de que se obtenha um valor de x maior que 47 ou menor que 33 (que é 40 7). Ou seja, o valor p é a probabilidade de se obter um valor de x cujo módulo da sua separação em relação à média seja maior que a separação entre 47 e 40. 1 Veja, porém, o comentário no fim desta aula. 9

A figura abaixo ilustra o valor p para este caso. Note que, por simetria, o valor p é agora o dobro do anterior: p = 2x0,0009 = 0,0018. Como ele é menor do que α = 0,05, rejeitamos a hipótese nula e aceitamos que µ 40. O primeiro caso dado é um exemplo de teste unilateral direito (também se diz unicaudal), pois a área sob a curva usada para se calcular o valor p está à direita da média. Caso a área usada para se calcular o valor p estivesse à esquerda da média, o teste seria chamado de unilateral esquerdo. No caso acima, em que se usam as duas áreas, o teste é chamado de bilateral (também se diz bicaudal). 10

Comentário: A figura abaixo sintetiza, do ponto de vista estatístico, o problema de se tomar uma decisão sobre algo. Supondo que a distribuição amostral da média seja normal, a hipótese nula (H 0 ) nos dá um valor para a sua média ( µ x ). A partir deste valor médio e adotando-se um nível de significância, por exemplo, α = 0,05, pode-se determinar um valor de corte (um valor limite de x ) tal que a probabilidade de que um valor de x mais distante da média do que este valor de corte ocorra seja de 5% (para evitar um congestionamento de elementos no desenho, considerou-se aqui apenas o caso unilateral à direita). Porém, caso a hipótese nula seja falsa e a média verdadeira tenha um valor diferente (indicada na figura pelo centro da distribuição amostral normal associada a H 1 ), a manutenção de H 0 quando o valor de x ocorre antes do valor de corte causa um erro do tipo II cuja probabilidade é dada pela área indicada por β na figura. 11

Note que não é possível minimizar, ao mesmo tempo, as probabilidades dos dois tipos de erro. Se quisermos minimizar a probabilidade de se cometer um erro de tipo I, deslocando o valor de corte para a direita, aumenta-se a probabilidade de um erro de tipo II; se quisermos minimizar a probabilidade de um erro de tipo II, deslocando o valor de corte para a esquerda, aumenta-se a probabilidade de um erro de tipo I. 12