Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Documentos relacionados
Testes de Hipóteses. Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA

DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA)

6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA

6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA

Testes de hipóteses. Wagner H. Bonat Fernando P. Mayer Elias T. Krainski

Teste de Hipóteses Paramétricos

Testes de Hipótese para uma única Amostra - parte I

INFERÊNCIA ESTATÍSTICA. ESTIMAÇÃO PARA A PROPORÇÃO POPULACIONAL p

1 Teoria da Decisão Estatística

Testes de Hipóteses Paramétricos

TESTE DE HIPÓTESE. Introdução

Testes de Hipóteses Paramétricos

X ~ Binomial (n ; p) H: p = p 0 x A: p p 0 (ou A: p > p 0 ou A: p < p 0 ) { X k 1 } U { X k 2 } (ou { X k } ou { X k }) x RC não rejeitamos H

Teste de hipóteses para proporção populacional p

TESTES DE HIPÓTESES. Conceitos, Testes de 1 proporção, Testes de 1 média

Professora Ana Hermínia Andrade. Período

7 Teste de Hipóteses

1 Probabilidade - Modelos Probabilísticos

Estimação parâmetros e teste de hipóteses. Prof. Dr. Alberto Franke (48)

Testes de Hipóteses para. uma Única Amostra. Objetivos de Aprendizagem. 9.1 Teste de Hipóteses. UFMG-ICEx-EST-027/031 07/06/ :07

Universidade Federal de Pernambuco Departamento de Estatística Inferência Estatística 2 (ET593) Fases de uma Análise Estatística

Inferência para duas populações

AULA 05 Teste de Hipótese

PHD 5742 Estatística Aplicada ao Gerenciamento dos Recursos Hídricos. 6 a aula Testes de Hipóteses

Testes de Hipótese para uma única Amostra - parte II

Professora Ana Hermínia Andrade. Universidade Federal do Amazonas Faculdade de Estudos Sociais Departamento de Economia e Análise. Período 2017.

Inferência Estatistica

NOÇÕES DE TESTE DE HIPÓTESES (I) Teste de hipóteses para a proporção populacional

TESTES DE HIPÓTESES. HIPÓTESES: São suposições que fazemos para testar a fixação de decisões, que poderão ser verdadeiras ou não.

INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA. Prof. Anderson Rodrigo da Silva

TESTE DE HIPÓTESES NÍVEL DESCRITIVO

Aula 8 - Testes de hipóteses

Intervalos de Confiança

AULA 04 Teste de hipótese

NOÇÕES DE TESTE DE HIPÓTESES (I) Teste de hipóteses para a proporção populacional

Testes de Hipóteses: Média e proporção

TESTES DE HIPÓTESES Notas de aula. Prof.: Idemauro Antonio Rodrigues de Lara

Testes de Hipóteses. Professor: Josimar Vasconcelos Contato: ou

Estimação e Testes de Hipóteses

NOÇÕES DE TESTE DE HIPÓTESES (II)

Testes de Hipóteses II

Razão para rejeitar H 0

Introdução a Estatística

Probabilidade e Estatística

Probabilidade e Estatística. Estimação de Parâmetros Intervalo de Confiança

Métodos. Inferência. Estatística. Descritiva. Teste de. Estimação

Teste de Hipóteses. Enrico A. Colosimo/UFMG enricoc/ Depto. Estatística - ICEx - UFMG 1/24

TESTES DE HIPÓTESES. Lucas Santana da Cunha Universidade Estadual de Londrina

Inferência Estatística. Teoria da Estimação

(Hipótese alternativa unilateral)

Estatística Aplicada

Aula 5. Teste de Hipóteses II. Capítulo 12, Bussab&Morettin Estatística Básica 7ª Edição

Tiago Viana Flor de Santana

Enrico A. Colosimo Depto. Estatística UFMG

Unidade IV Inferência estatística

Cálculo das Probabilidades e Estatística I

Inferência Estatística Básica. Teste de Hipóteses: decidindo na presença de incerteza

TOMADA DE DECISÃO PARA UMA AMOSTRA. Estatística Aplicada à Engenharia 1

Inferência Estatística:

Introdução à probabilidade e estatística II

Distribuições Amostrais e Estimação Pontual de Parâmetros

Estatística e Modelos Probabilísticos - COE241

PROJETO E ANÁLISES DE EXPERIMENTOS (PAE) INTRODUÇÃO AOS MÉTODOS ESTATÍSTICOS EM ENGENHARIA

Análise de Aderência e de Associação

Testes de Hipótese PARA COMPUTAÇÃO

TESTE DE HIPÓTESES ELISETE AUBIN E MONICA SANDOVAL - IME

Testes de Hipótese para uma única Amostra - parte II

Conceitos Básicos Teste t Teste F. Teste de Hipóteses. Joel M. Corrêa da Rosa

Bioestatística e Computação I

A figura 5.1 ilustra a densidade da curva normal, que é simétrica em torno da média (µ).

Cap. 4 - Estimação por Intervalo

Testes de Hipóteses I

Teste de hipóteses Página 1 de 8. Teste de hipóteses

Teoria da Estimação. Fabricio Goecking Avelar. junho Universidade Federal de Alfenas - Instituto de Ciências Exatas

Capítulo 8 - Testes de hipóteses 3

3. Estimação pontual USP-ICMC-SME. USP-ICMC-SME () 3. Estimação pontual / 25

Distribuições derivadas da distribuição Normal. Distribuição Normal., x real.

A moeda é honesta ou é desequilibrada? Qual é a probabilidade de "cara"no lançamento de uma moeda?

Teste para a Média Populacional com Variância Conhecida

Probabilidade e Estatística

Definição. Os valores assumidos pelos estimadores denomina-se estimativas pontuais ou simplesmente estimativas.

Princípios de Bioestatística Teste de Hipóteses

Inferência estatística

Lista de Exercícios #8 Assunto: Teste de Hipóteses

Distribuições Amostrais e Estimação Pontual de Parâmetros

Prof. Lorí Viali, Dr. Mat2282 Análise Estatística Não Paramétrica

Estatística Aplicada II. } Revisão: Probabilidade } Propriedades da Média Amostral

Contabilometria Aula 6. Prof.: Patricia Maria Bortolon, D. Sc.

Probabilidade II. Departamento de Estatística. Universidade Federal da Paraíba

Introdução ao Planejamento e Análise Estatística de Experimentos 1º Semestre de 2013 Capítulo 3 Introdução à Probabilidade e à Inferência Estatística

AULA 11 - Normalidade e Inferência em Regressão Múltipla - Parte 1

Introdução à Bioestatística Turma Nutrição

Escola Superior de Agricultura Luiz de Queiroz Universidade de São Paulo. Teste de Hipóteses

Exercícios Resolvidos

3 2σ 2] = σ 2 C = 1 6

TESTES DE HIPÓTESES. O procedimento básico de um teste de hipóteses pode ser decomposto em quatro fases: i) Definição das hipóteses.

Transcrição:

Testes de Hipóteses Ricardo Ehlers ehlers@icmc.usp.br Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Introdução e notação Em geral, intervalos de confiança são a forma mais informativa de apresentar os achados principais de um estudo. Contudo, algumas vezes existe um particular interesse em verificar determinadas afirmações ou conjecturas. Por exemplo, podemos estar interessados em determinar se uma moeda é honesta, se certas quantidades são independentes, ou se populações distintas são similares do ponto de vista probabiĺıstico. Cada uma destas afirmações constitui uma hipótese que pode ser associada a um modelo, i.e. pode ser parametrizada. 1

Definição Chamamos de hipótese estatística qualquer afirmação que se faça sobre um parâmetro populacional desconhecido. A partir de uma amostra da população iremos estabelecer uma regra de decisão segundo a qual rejeitaremos ou aceitaremos a hipótese proposta. Esta regra de decisão é chamada de teste. Normalmente existe uma hipótese mais importante para o pesquisador que será denotada por H 0 e chamada hipótese nula. Qualquer outra hipótese diferente de H 0 será chamada de hipótese alternativa e denotada por H 1. 2

Exemplo. Seja um experimento que consiste em um teste do tipo certo-errado com 10 questões. O objetivo é testar se o aluno está advinhando. Denotando por p a probabilidade do aluno acertar cada questão a hipótese estatística de interesse pode ser formulada como H 0 : p = 1/2. Neste caso, a hipótese alternativa mais adequada é H 1 : p > 1/2 indicando que o aluno tem algum conhecimento sobre o assunto. Temos então 10 repetições do experimento com p constante A variável aleatória X = número de acertos em 10 questões tem distribuição binomial com parâmetros n = 10 e p desconhecido. 3

Resumindo, para X Binomial(10, p) deseja-se testar H 0 : p = 1/2 H 1 : p > 1/2 Note que quanto maior o valor de X maior é a evidência a favor de H 1 (e portanto contra H 0 ). 4

Suponha que adotamos a seguinte regra de decisão: o aluno não está advinhando se acertar 8 ou mais questões. Isto equivale a rejeitar H 0 se X 8 (região de rejeição ou região crítica) e aceitar H 0 se X < 8 (região de aceitação). Um aluno pode acertar 8 ou mais questões e estar advinhando, isto é podemos rejeitar H 0 quando ela é verdadeira. A probabilidade de que isto ocorra é, P(X 8 p = 1/2) = 10 k=8 ( ) 10 0,5 10 = 7 k 128 0,054. 5

Esta probabilidade é chamada nível de significância e será denotada por α. Note que o valor de α depende da regra de decisão, por exemplo se a região crítica for X 7 então α 0,171. No próximo exemplo veremos como usar o nível de significância para construir uma regra de decisão. 6

Exemplo. Um fornecedor garante que 90% de sua produção não apresenta defeito. Para testar esta afirmação selecionamos ao acaso 10 itens de um lote e contamos o número de defeituosos. Decidimos não comprar o lote se o número observado de não defeituosos for muito pequeno (mas quão pequeno?). Experimento: selecionar ao acaso 10 itens de um lote e contar o número de defeituosos. Regra de decisão: não comprar o lote se o número observado de não defeituosos for muito pequeno. 7

Definindo X = número de não defeituosos na amostra de 10 itens temos então uma distribuição binomial com parâmetros n = 10 e p desconhecido, e queremos testar H 0 : p = 0.9. Aqui p é a proporção de itens não defeituosos no lote e portanto a hipótese alternativa deve ser H 1 : p < 0.9. Ou seja queremos testar, H 0 : p = 0.9 H 1 : p < 0.9. 8

Suponha que decidimos manter α < 0.025 e a partir deste valor vamos estabelecer a nossa regra de decisão. Qual o maior valor de k tal que P(X k p = 0.9) < 0.025? P(X 5 p = 0.9) = P(X 6 p = 0.9) = P(X 7 p = 0.9) = 5 ( ) 10 0.9 k (1 0.9) 10 k = 0.001 k 6 ( ) 10 0.9 k (1 0.9) 10 k = 0.012 k 7 ( ) 10 0.9 k (1 0.9) 10 k = 0.069. k k=0 k=0 k=0 Portanto, devemos usar a região crítica X 6. Isto é, vamos rejeitar o lote se o número de itens defeituosos na amostra for maior do que 6. 9

Nestes dois exemplos os testes são chamados de unilaterais porque somente valores de um lado do espaço amostral foram utilizados para construir a região crítica. Podemos ter também testes bilaterais aonde os dois extremos do espaço amostral são usados como região crítica. A variável aleatória X é chamada estatística de teste, sua distribuição deve ser conhecida e ela deve depender do parâmetro que está sendo testado. 10

Probabilidades binomiais e regiões criticas dos 2 testes unilaterias. 0.00 0.15 0 2 4 6 8 10 0.0 0.2 0.4 0 2 4 6 8 10 11

Exemplo. Em cada caso determine as hipóteses a serem testadas. Uma empresa de transportes afirma que o intervalo entre onibus sucessivos é em média 15 minutos. A associação de usuários deseja testar esta afirmação. Um veterinário afirma que usando uma nova composição de rações consegue um ganho médio diário de 3 litros de leite por vaca. A associação de produtores acredita que o ganho não é tão grande e deseja testar esta afirmação. 12

Decisões e poder Ao tomar uma decisão a favor ou contra uma hipótese existem dois tipos de erros que podemos cometer: rejeitar H 0 quando de fato ela é verdadeira (erro tipo I), ou falhar em rejeitar H 0 quando de fato ela é falsa (erro tipo II). Frequentemente denota-se as probabilidades destes dois tipos de erro como α e β respectivamente, P(rejeitar H 0 H 0 é verdadeira) = α P(não rejeitarh 0 H 0 é falsa) = β O poder de um teste é a probabilidade de rejeitar a hipótese nula quando esta é de fato falsa, isto é 1 β. 13

Existe um balanço entre esses dois tipos de erros, no sentido de que ao tentar-se minimizar α, aumenta-se β. Isto é, não é possível minimizar estas duas probabilidades simultaneamente e na prática é costume fixar um valor (pequeno) para α. 14

Na tabela abaixo estão descritas as decisões que podemos tomar e os tipos de erro associados. Decisão Verdade Aceitar H 0 Rejeitar H 0 H 0 verdadeira Decisão correta Erro Tipo I (probabilidade 1 α) (probabilidade α) H 0 falsa Erro Tipo II Decisão correta (probabilidade β) (probabilidade 1 β) 15

Nível Descritivo (P-valor) A escolha do nível de significância α do teste é completamente arbitrária e deve ser feita antes do experimento ser realizado. Quando a distribuição da estatística de teste é discreta, como nos exemplos anteriores, o nível escolhido pode nem mesmo ser atingido. A decisão de aceitar ou rejeitar H 0 claramente depende desta escolha. Na prática, o valor escolhido é 0,05 ou 0,01 mas não há justificativa formal para estes valores em particular. 16

Um enfoque alternativo consiste em primeiro observar o valor da estatistica de teste e calcular a probabilidade de obter valores mais desfavoráveis a H 0 supondo que esta seja verdadeira. Esta quantidade é chamada nível descritivo ou P-valor. 17

Exemplo. No exemplo das questões, suponha que o número observado de questões certas foi X = 9. Então o p-valor será, ( ) ( ) 10 10 P(X 9 p = 1/2) = 0,5 10 + 0,5 10 = 0,0107 9 10 e rejeitaremos H 0 para todo nível de significância maior do que este valor. Por exemplo, rejeitaremos H 0 para α = 0,025 ou α = 0,05 e aceitaremos H 0 para α = 0,01. 18

Exemplo. No exemplo do itens defeituosos suponha que o número observado de não defeituosos foi X = 4. Neste caso o p-valor é dado por P(X 4 p = 0.9) = 0.000147 ou seja, rejeitaremos H 0 para praticamente todos os níveis de significância usuais. 19

O p-valor é a probabilidade de observar resultados tão extremos quanto os obtidos se a hipótese nula for verdadeira. Se o p-valor for grande ele fornece evidência de que H 0 é verdadeira. Um p-valor pequeno indica que existe evidência nos dados contra H 0 (já que ocorreu um resultado pouco provável). 20

Interpretações do p-valor P 0.10 Não existe evidência contra H 0 0.05 P < 0.10 Fraca evidência contra H 0 0.01 P < 0.05 Evidência significativa... 0.001 P < 0.01 Evidência altamente significativa... P < 0.001 Evidência extremamente significativa... 21

Teste para a média populacional Exemplo. Seja X a altura das pessoas em uma população e uma amostra, X 1,,X n N(θ,σ 2 ), σ 2 = 25, n = 9 Deseja-se testar, H 0 : θ = 170 H 1 : θ 170 Considere a regra de decisão: rejeitar H 0 se, X < c 1 ou X > c 2 22

Fixando α = 0.05, obtenha c 1 e c 2 tais que, P(X < c 1 ou X > c 2 θ = 170) = P(X < c 1 θ = 170)+P(X > c 2 θ = 170) = 0.05 Este é um exemplo de teste bilateral. Existe uma infinidade de valores que satisfazem esta condição. Na maioria dos experimentos envolvendo o modelo normal será conveniente tomar c 1 e c 2 simétricos em relação a E(X). 23

Como X N(θ,σ 2 /n), ( 3(X 170) P 5 ( 3(X 170) P 5 < 3(c ) 1 170) + 5 ) > 3(c 2 170) 5 = 0.05 Da tabela normal padrão: 3(c 1 170) 5 = 1.96 3(c 2 170) 5 c 1 = 166.73 c 1 = 173.27 = 1.96 24

Suponha que uma amostra foi observada e a média amostral x calculada. Se x < 166.73 ou x > 173.27 rejeita-se H 0 ao nivel de significância α = 0.05. 25

Exemplo. De experiências anteriores sabe-se que a resistência média ao desmoronamento de um tipo de tijolo é 200Kg com desvio padrão 10Kg. Um comprador suspeita que essa resistência média diminuiu (sem alterar o desvio padrão). Uma amostra aleatória de 100 tijolos foi selecionada e as resistências foram medidas para testar esta afirmação. Seja X uma variável aleatória representando a resistência ao desmoronamento e uma amostra aleatória X 1,...,X n tal que, E(X i ) = µ Var(X i ) = 100 n = 100. Deseja-se testar, H 0 : µ = 200 H 1 : µ < 200 26

Como n é grande podemos usar o teorema central do limite. A distribuição amostral aproximada de X é, e sob H 0 temos então que, X N(µ,σ 2 /n) X N(200,1). A regra de decisão consiste em rejeitar H 0 se X for pequena em relação a 200Kg. Fixando α = 0.05 temos que, P(X < c µ = 200) = P(X 200 < c 200) = 0.05 Da tabela da normal padrão obtemos que c 200 = 1.64 e portanto c = 198.36. 27

Exemplo. No exemplo anterior suponha que obteve-se uma amostra tal que x = 197.5. Então de acordo com os dados coletados deve-se concluir que a resistência média diminuiu (ao nivel de 0.05). Além disso, o p-valor pode ser calculado como, P(X < 197.5 µ = 200) = P(X 200 < 197.5 200) = P(Z < 2.5). Da tabela da normal padrão obtem-se que p-valor= 0.0062. 28

Suponha agora que temos uma amostra X 1,...,X n N(µ,σ 2 ) sendo µ e σ 2 ambos desconhecidos. Utilizando a variância amostral, S 2 = 1 n 1 n (X i X) 2 i=1 como estimador de σ 2 então a variável aleatória, T = X µ S/ n tem distribuição t-student com n 1 graus de liberdade. Esta é a estatística utilizada para testar as hipóteses sobre µ. 29

Funções de densidade da normal padrão e t-student com 4 graus de liberdade. f(x) 0.0 0.1 0.2 0.3 0.4 N(0,1) t Student 4 2 0 2 4 x 30

As probabilidades relativas à distribuição t são calculadas de forma aproximada e estão tabeladas (ver os livros texto). A distribuição t se aproxima da normal conforme aumentam os graus de liberdade. A tabela vai até 120 graus de liberdade e para valores maiores deve-se usar a tabela da normal. 31

Exemplo. Sejam X 1,...,X n N(µ,σ 2 ) com n = 12 e µ e σ 2 desconhecidos. Deseja-se testar, ao nivel de significância 0.05. H 0 : µ = 200 H 1 : µ 200 Na tabela t, para n 1 = 11 e p = 5% obtemos o valor t c = 2.201. Regra de decisão: rejeitar H 0 ao nivel α = 0.05 se, X 200 S/ n > 2.201, ou X 200 S/ n < 2.201 32

Exemplo. No exemplo anterior suponha que deseja-se testar agora, ao nivel de significância 0.01. H 0 : µ = 200 H 1 : µ < 200 Na tabela t, para n 1 = 11 e p = 2% obtemos o valor t c = 2.718. Regra de decisão: rejeitar H 0 ao nivel α = 0.01 se, X 200 S/ n < 2.718 33

Intervalo de confiança para a média Para o teste bilateral ao nivel de significância α, ( P t c < X ) µ S/ n < t c = 1 α. obtendo-se t c da distribuição t-student com n 1 graus de liberdade. Então, após observar a amostra e isolando µ segue que, x t c s n < µ < x +t c s n é um intervalo de 100(1 α)% para µ. 34

A Função Poder Definição A função poder associa a cada valor de θ a probabilidade π(θ) de rejeitar H 0. Assim, denotando por C a região crítica a função de poder é definida como, π(θ) = P(X C θ), θ Θ. 35

Exemplo. No exemplo do fornecedor a regra de decisão foi rejeitar H 0 se X 6 sendo X Binomial(10,p). A função poder é P(X 6 p) para 0 < p < 1, π(p) = P(X 6 p) = 6 k=0 ( ) 10 p k (1 p) 10 k. k 36

Função poder para o exemplo do fornecedor. π(p) 0.0 0.2 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.8 1.0 p 37

Note que se p > 0.8 o teste quase certamente aceitará H 0, indicando que o teste é adequado. Para valores 0.7 < p < 0.8 o teste ainda rejeita H 0 com probabilidade baixa. 38

Se X Binomial(20,p) a nova região critica seria X 14. π(p) 0.0 0.2 0.4 0.6 0.8 1.0 X 6 X 14 0.0 0.2 0.4 0.6 0.8 1.0 p 39

Teste para a variância no modelo Normal Sejam X 1,...,X n independentes tais que X i N(µ,σ 2 ), i = 1,...,n. Deseja-se testar, H 0 : σ 2 = σ 2 0 H 1 : σ 2 σ 2 0 Sabe-se que portanto Z N(0,1/n). Z i = X i µ σ N(0,1), 40

Teorema Sejam Z 1,...,Z n N(0,1) independentes. Então, Z e n i=1 (Z i Z) 2 são independentes, n i=1 (Z i Z) 2 tem distribuição qui-quadrado com n 1 graus de liberdade, Corolário n (Z i Z) 2 χ 2 n 1. i=1 Seja a variável aleatória, S 2 = 1 n 1 n i=1 (X i X) 2. Então, (n 1)S 2 σ 2 χ 2 n 1. 41

Estatistica de teste sob H 0, χ 2 = (n 1)S2 σ 2 0 χ 2 n 1. Regra de decisão: rejeitar H 0 se χ 2 (0,χ 2 1 ) ou χ2 > χ 2 2. Fixar α tal que, P(χ 2 < χ 2 1 ou χ 2 > χ 2 2 H 0 ) = α. Obter χ 2 1 e χ2 2 tais que, P(χ 2 < χ 2 1) = P(χ 2 > χ 2 2) = α/2. (ver as tabelas nos livros texto) 42

Exemplo. Sejam X 1,...,X n N(µ,σ 2 ) independentes com µ e σ 2 desconhecidos. Deseja-se testar, H 0 : σ 2 = 100 H 1 : σ 2 100 Para uma amostra de tamanho n = 16 e fixando α = 0.05 obtém-se, P(χ 2 < 6.262) = 0.025 e P(χ 2 > 27.488) = 0.025. Regra de decisão: rejeitar H 0 ao nivel de significância 0.05 se, 15S 2 100 < 6.262 ou 15S 2 100 > 27.488. 43

A construção de um intervalo de confiança para σ 2 é direta pois, ) P (χ 21 < (n 1)S2 σ 2 < χ 2 2 = γ = 1 α. Isolando σ 2, (n 1)S 2 χ 2 2 < σ 2 < (n 1)S2 χ 2 1 é o intervalo de 100(1 α)% de confiança para σ 2. 44

Comparando duas populações Sejam duas amostras aleatórias independentes X 11,...,X 1n1 e X 21,...,X 2n2 das distribuições N(θ 1,σ 2 1 ) e N(θ 2,σ 2 2 ) respectivamente. Suponha inicialmente que σ 2 1 = σ2 2 = σ2 sendo, S 2 1 = S 2 2 = 1 n 1 1 1 n 2 1 n 1 i=1 n 2 (X 1i X 1 ) 2 (X 2i X 2 ) 2 i=1 estimadores de σ 2. 45

Já vimos que, U = (n 1 1)S 2 1 σ 2 V = (n 2 1)S 2 2 σ 2 χ 2 n 1 1 χ 2 n 2 1 Definição A variável aleatória S 2 1 /S2 2 tem distribuição F com n 1 1 e n 2 1 graus de liberdade, S1 2 S2 2 = U/(n 1 1) V/(n 2 1) F(n 1 1,n 2 1). 46

Suponha que queremos testar, H 0 : σ 2 1 = σ 2 2 H 1 : σ 2 1 σ 2 2 O teste F rejeita H 0 se, S 2 1/S 2 2 < c 1 ou S 2 1/S 2 2 > c 2 sendo c 1 e c 2 obtidas como percentis da distribuição F com n 1 1 e n 2 1 graus de liberdade. 47

Intervalo para a razão de variâncias Se H 0 for falsa então, U = (n 1 1)S 2 1 σ 2 1 V = (n 2 1)S 2 2 σ 2 2 χ 2 n 1 1 χ 2 n 2 1 e assim, S1 2 σ2 2 S2 2 σ1 2 = U/(n 1 1) V/(n 2 1) F(n 1 1,n 2 1). 48

Fixando 1 α podemos obter constantes c 1 e c 2 tais que, ( P c 1 < S2 1 σ 2 ) 2 S2 2 σ1 2 < c 2 = 1 α e isolando a razão de variâncias, S2 2 S1 2 c 1 < σ2 2 σ 2 1 < S2 2 S1 2 c 2 é o intervalo de confiança de 100(1 α)% para σ 2 2 /σ2 1. 49

Função de densidade F(8,10). 0.6 0.4 f(x) 0.2 0.0 0 1 2 3 4 5 x 50

Comparando médias Deseja-se testar as hipóteses, H 0 : θ 1 = θ 2, σ 2 1 > 0,σ 2 2 > 0 H 1 : θ 1 θ 2, σ 2 1 > 0,σ 2 2 > 0 Se pudermos assumir que σ 2 1 = σ2 2 = σ2 a função de verossimilhança fica, p(x 1,x 2 θ 1,θ 2,σ 2 ) = p(x 1 θ 1,σ 2 )p(x 2 θ 2,σ 2 ) 51

Após algum algebrismo segue que a verossimilhança de (θ 1,θ 2,σ 2 ) é dada por, (2πσ 2 ) (n1+n2)/2 { exp 1 [ (n1 2σ 2 1)S1 2 +n 1 (θ 1 x 1 ) 2 +(n 2 1)S2 2 +n 2 (θ 2 x 2 ) 2] }. Quando θ 1 θ 2 os estimadores de máxima verossimilhança de θ 1, θ 2 e σ 2 são respectivamente X 1, X 2 e S 2 p = (n 1 1)S 2 1 +(n 2 1)S 2 2 n 1 +n 2 2 sendo S 2 1 e S2 2 as variâncias amostrais. 52

Segue então que, (n 1 +n 2 2)S 2 p σ 2 = (n 1 1)S 2 1 +(n 2 1)S 2 1 σ 2 χ 2 n 1 +n 2 2. Se as variâncias populacionais forem conhecidas então, ( )) X 1 X 2 N (θ 1 θ 2,σ 2 + 1n1 1n2 já que as médias amostrais são independentes. Sob H 0, X 1 X 2 σ 1/n 1 +1/n 2 N(0,1). 53

A estatistica de teste é dada por, X 1 X 2 T = σ 1/n 1 +1/n 2 S p σ = X 1 X 2 S p 1 n 1 + 1 n 2 que tem distribuição t-student com n 1 +n 2 2 graus de liberdade. 54

Intervalo para a diferença de médias Para construir um intervalo de 100(1 α)% para a diferença θ 1 θ 2, Obtenha o valor t α/2 na tabela da distribuição t com n 1 +n 2 2 graus de liberdade tal que,. P( t α/2 < T < t α/2 ) = 1 α Após observar as amostras o intervalo fica, (x 1 x 2 t α/2 s p 1n1 + 1n2 ; x 1 x 2 +t α/2 s p 1n1 + 1n2 ). 55

Exemplo. Com o objetivo de comparar as alturas médias em centímetros dos estudantes dos sexos masculino (X 1 ) e feminino (X 2 ) em uma universidade foram selecionadas duas amostras de tamanhos n 1 = 20 e n 2 = 17. As medidas amostrais obtidas foram x 1 = 178.85, s 1 = 7.734, x 2 = 164.09, s 2 = 9.750. A estimativa pontual para a diferença entre as médias é, x 1 x 2 = 178.85 164.09 = 14.76. O desvio padrão amostral combinado fica, s p = (19 7.734 2 +16 9.750 2 )/35 = 75.93 = 8.71. Finalmente o erro padrão pode é calculado como 8.71 1/20+1/17 = 2.87. 56

Fixando o nível de confiança em 0.95 obtemos na tabela t com 35 graus de liberdade que P( T > 2.03) = 0.05 Um intervalo de 95% para θ 1 θ 2 é dado por, [14.76 2.03 2.87;14.76+2.03 2.87] = [8.93;20.59]. Note que este resultado também implica em rejeitar a hipótese de igualdade entre as médias populacionais ao nível de significância 0.05. 57

Variâncias desiguais e desconhecidas A estatistica de teste é dada por, T = X 1 X 2 S1 2/n 1 +S2 2/n 2 que tem distribuição aproximada t-student com graus de liberdade, ν = sendo A = S 2 1 /n 1 e B = S 2 2 /n 2. (A+B) 2 A 2, n 1 1 + B2 n 2 1 Obs: Arredondar ν para o inteiro mais próximo. 58

Testes Qui-Quadrado Ao ajustar modelos teóricos a um conjunto de dados, a qualidade do ajuste pode ser verificada comparando-se as frequências teóricas (ou esperadas) com as frequências observadas. Mais formalmente, a aderência dos dados a um certo modelo teórico pode ser testada através da seguinte estatística, Q = k i=1 (o i e i ) 2 e i, sendo, o i : as frequências observadas e i : as frequências esperadas k o número de classes ou valores considerados. 59

As hipóteses a serem testadas são, H 0 : Os dados se ajustam bem ao modelo H 1 : O ajuste não é bom. Se o ajuste não for bom as frequências observadas e esperadas tenderão a ser muito diferentes e portanto valores grandes da estatística Q indicam evidência contra H 0. Portanto este teste é do tipo unilateral. 60

Pode-se mostrar que, se n for grande, Q tem distribuição aproximada qui-quadrado (χ 2 ) com k 1 m graus de liberdade sendo m o número de parâmetros estimados no modelo teórico. Uma condição de validade desta distribuição é que, e i 5, i = 1,...,k. 61

Exemplo. Em um determinada seção de um rio foram efetuadas 1000 medições de sua vazão (em m 3 /s), e obteve-se a distribuição apresentada na tabela abaixo. classes de vazão frequência observada 10-14 55 14-18 126 18-22 325 22-26 315 26-30 130 30-34 49 Podemos ajustar uma distribuição normal com parâmetros estimados pela média amostral e variância amostral respectivamente. Suponha que x = 21.9 e s = 4.71 e portanto se X representa as medições de vazão então X N(21.9,4.71 2 ) (esta é a distribuição ajustada). 62

Calculado as probabilidades de obter uma medição em cada uma das classes podemos construir a tabela com as frequências ajustadas. frequências classes de vazão Probabilidades das classes ajustada observada 10-14 0.041 41 55 14-18 0.157 157 126 18-22 0.305 305 325 22-26 0.300 300 315 26-30 0.150 150 130 30-34 0.038 38 49 63

Neste caso o valor da estatística de teste é dado por, Q = (41 55)2 + (157 126)2 41 157 (300 315) 2 + (150 130)2 300 150 + (305 325)2 305 + (38 49)2 38 + = 18.814. O número de classes é k = 6 e o número de parâmetros estimados é m = 2 (a média e a variância da distribuição normal) e portanto Q tem distribuição qui-quadrado com k 1 m = 3 graus de liberdade. 64

Nenhuma das classes apresenta frequência esperada menor do que 5 portanto esta distribuição é válida. Fixando o nível de significância α = 0.05 obtemos na tabela da distribuição χ 2 com 3 graus de liberdade que P(Q > 7.815) = 0.05. Como 18.814 > 7.815 há evidências para rejeitar H 0 ao nível de 5%. Da mesma tabela obtemos que P(Q > 16.266) = 0.001 e portanto o p-valor é menor do que 0.001. Ou seja, há evidência extremamente forte contra H 0. 65

Exemplo. A proporção θ de itens defeituosos em um grande lote é desconhecida e deseja-se testar as hipóteses, H 0 : θ = 0.1 H 1 : θ 0.1 com base em uma amostra aleatória de 100 itens dos quais 16 são defeituosos. Podemos usar o teste qui-quadrado com 2 categorias (defeituoso e não defeituoso) reformulando as hipóteses como, H 0 : θ 1 = 0.1 e θ 2 = 0.9 H 1 : H 0 é falsa sendo θ 1 e θ 2 as probabilidades de um item ser defeituoso ou não defeituoso respectivamente. 66

As frequências observadas e esperadas sob H 0 são, N 1 = 16,N 2 = 84, nθ 0 1 = 10, nθ 0 2 = 90 e portanto o valor observado da estatística de teste é, Q = (16 10)2 10 + (84 90)2 90 = 4. Usando uma tabela da distribuição qui-quadrado com 1 grau de liberdade obtém-se que 0.025 < p-valor < 0.05 e assim H 0 deve ser rejeitada ao nível de 5% e aceita ao nível de 2.5%. 67

Teste de Independência O teste χ 2 também pode ser aplicado no estudo da relação entre duas variaveis categóricas com p e k possíveis categorias. Neste caso queremos testar se as variáveis são independentes (hipótese nula). A estatística de teste é a mesma porém com número de graus de liberdade igual a (p 1)(k 1) 68

Exemplo. Considere por exemplo a tabela a seguir na qual estão apresentados os número de alunos matriculados nos colégios A e B, em relação à sua classe social. Classe social Colégio Alta Media Baixa Total A 20 40 40 100 B 50 40 30 120 Total 70 80 70 220 Se as variáveis Colégio e Classe social forem independentes espera-se que as frequências de alunos das 3 classes sejam as mesmas nos 2 colégios, i.e. 70/220, 80/220 e 70/220. 69

As frequências esperadas sob a hipótese de independência são então dadas por, Colégio A: 100 70 80 70 = 31.82 100 = 36.36 100 220 220 220 = 31.82 Colégio B: 120 70 80 70 = 38.18 120 = 43.64 120 220 220 220 = 38.18 Podemos construir a tabela de frequências esperadas. Classe social Colégio Alta Media Baixa A 31.82 36.36 31.82 B 38.18 43.64 38.18 70

Podemos agora avaliar a estatística de teste, Q = (20 31.82)2 31.82 (50 38.18) 2 38.18 + (40 36.36)2 36.36 + (40 43.64)2 43.64 + (40 31.82)2 31.82 + (30 38.18)2 38.18 + = 12.57. 71

Ao nível de significância 0.05 obtemos da tabela χ 2 com (p 1)(k 1) = 2 graus de liberdade que P(Q > 5.99) = 0.05 e como 12.57 > 5.99 a hipótese de independência é rejeitada. Para calcular o P-valor, note que a tabela qui-quadrado com 2 graus de liberdade nos fornece, P(Q > 12.429) = 0.002 Portanto podemos concluir que p-valor < 0.002. Ou seja, existe forte evidência contra a hipótese de independência entre as variáveis Colégio e Classe social. 72