6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA

Documentos relacionados
TESTES DE HIPÓTESES. HIPÓTESES: São suposições que fazemos para testar a fixação de decisões, que poderão ser verdadeiras ou não.

INFERÊNCIA ESTATÍSTICA. ESTIMAÇÃO PARA A PROPORÇÃO POPULACIONAL p

Teste de hipóteses para proporção populacional p

Professora Ana Hermínia Andrade. Período

Probabilidade e Estatística. Estimação de Parâmetros Intervalo de Confiança

NOÇÕES DE TESTE DE HIPÓTESES (II)

DE ESPECIALIZAÇÃO EM ESTATÍSTICA APLICADA)

Testes de Hipóteses Paramétricos

7 Teste de Hipóteses

Fernando de Pol Mayer

Testes de Hipóteses Paramétricos

Testes de Hipóteses. Professor: Josimar Vasconcelos Contato: ou

Testes de Hipótese para uma única Amostra - parte I

Estimação e Testes de Hipóteses

NOÇÕES DE TESTE DE HIPÓTESES (I) Teste de hipóteses para a proporção populacional

NOÇÕES DE TESTE DE HIPÓTESES (I) Teste de hipóteses para a proporção populacional

TESTES DE HIPÓTESES. Conceitos, Testes de 1 proporção, Testes de 1 média

Inferência Estatística. Teoria da Estimação

Bioestatística e Computação I

Nessa situação, a média dessa distribuição Normal (X ) é igual à média populacional, ou seja:

Exercícios Resolvidos

Testes de Hipóteses. Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística - PPGEMQ / PPGEP - UFSM

Definição. Os valores assumidos pelos estimadores denomina-se estimativas pontuais ou simplesmente estimativas.

Testes de Hipótese para uma única Amostra - parte II

Aula 6. Testes de Hipóteses Paramétricos (I)

Estimação parâmetros e teste de hipóteses. Prof. Dr. Alberto Franke (48)

Universidade Federal do Pará Instituto de Tecnologia. Estatística Aplicada I

Métodos Quantitativos

Teste de Hipóteses. Prof.: Joni Fusinato

1.1. Definições importantes

Cálculo das Probabilidades e Estatística I

mat.ufrgs..ufrgs.br br/~viali/ mat.ufrgs..ufrgs.br

Teste de Hipóteses. Enrico A. Colosimo/UFMG enricoc/ Depto. Estatística - ICEx - UFMG 1/24

Razão para rejeitar H 0

Estatística e Probabilidade

7. Testes de Hipóteses

TESTES DE HIPÓTESES. O procedimento básico de um teste de hipóteses pode ser decomposto em quatro fases: i) Definição das hipóteses.

Intervalos de Confiança - Amostras Pequenas

PODER DO TESTE. Poder do Teste e Tamanho de Amostra para Testes de Hipóteses

ICMS/PE 2014 Resolução da Prova de Estatística Professor Fábio Amorim. ICMS PE 2014: Resolução da prova de Estatística Prof.

Pedro Alberto Barbetta / Marcelo Menezes Reis / Antonio Cezar Bornia São Paulo: Atlas, 2004

Princípios de Bioestatística Teste de Hipóteses

Teste de Hipótese e Intervalo de Confiança

MAE Introdução à Probabilidade e Estatística II Resolução Lista 5

Lista de Exercícios 2 - Estatística II

Intervalos de Confiança

HEP-5800 BIOESTATÌSTICA

Amostragem e distribuições por amostragem

Introdução ao Planejamento e Análise Estatística de Experimentos 1º Semestre de 2013 Capítulo 3 Introdução à Probabilidade e à Inferência Estatística

Teste de hipóteses. Estatística Aplicada Larson Farber

Turma: Engenharia Data: 12/06/2012

Profa.: Patricia Maria Bortolon, D.Sc. Statistics for Managers Using Microsoft Excel, 5e 2008 Pearson Prentice-Hall, Inc. Chap 9-1

Testes de Hipóteses. Henrique Dantas Neder

Inferência Estatística

RESOLUÇÃO DAS QUESTÕES DE ESTATÍSTICA

PROVA DE ESTATÍSTICA e PROBABILIDADES SELEÇÃO - MESTRADO/UFMG /2012

Introdução à Inferência Estatística

Estatística Inferencial

1. Hipótese nula H0 é uma hipótese que contém uma afirmação de igualdade, tal como, = ou.

Capítulo 8 - Testes de hipóteses 3

a) 19% b) 20% c) Aproximadamente 13% d) 14% e) Qualquer número menor que 20%

Inferência Estatística Básica. Teste de Hipóteses para uma média populacional Cálculo do Valor p

Medidas de Dispersão ou variabilidade

Intervalos de Confiança

Poder do teste e Tamanho de Amostra

Exemplo 1: Sabemos que a média do nível sérico de colesterol para a população de homens de 20 a 74 anos é 211 mg/100ml.

Inferência Estatística:

Estatística. Guia de Estudos P1

Carlos Antonio Filho

UFPE - Universidade Federal de Pernambuco Curso: Economia Disciplina: Estatística Econômica Professor: Waldemar Araújo de S. Cruz Oliveira Júnior

Aula 8. Teste Binomial a uma proporção p

Estatística II. Intervalo de Confiança Lista de Exercícios

MOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

Teorema central do limite e es/mação da proporção populacional p

Soluções da Colectânea de Exercícios

Estimativas e Tamanhos de Amostras

Testes de Hipóteses para uma Única Amostra

Parte 8 Testes de hipóteses Comparação de dois grupos

Métodos Quantitativos em Medicina

Aula 12 - Questões Comentadas e Resolvidas

Teste de hipóteses para uma média populacional com variância conhecida e desconhecida

Inferência Estatística

Prof. Lorí Viali, Dr.

PROJETO E ANÁLISES DE EXPERIMENTOS (PAE) INTRODUÇÃO AOS MÉTODOS ESTATÍSTICOS EM ENGENHARIA

Introdução ao Planejamento e Análise Estatística de Experimentos 1º Semestre de 2013 Capítulo 3 Introdução à Probabilidade e à Inferência Estatística

AULA 07 Inferência a Partir de Duas Amostras

Resultados possíveis do nosso estudo

Nome: N o : Espaço reservado a classificações

TESTE t-student TESTE IGUALDADE DE VARIÂNCIAS

Instituto Tecnológico de Aeronáutica Divisão de Engenharia Mecânica-Aeronáutica. MOQ-13 Probabilidade e Estatística

Lecture 3a Testes de Hipótese

MB-210 Probabilidade e Estatística

i. f Y (y, θ) = 1/θ... 0 y θ 0... y < 0 ou y > θ Se a amostra selecionada foi ( ), qual será a estimativa para θ?

Exercício 4 Calcule média e o desvio padrão distribuição de frequências dada abaixo:

Aula 10 Estimação e Intervalo de Confiança

CAPÍTULO 4 CONCEITOS BÁSICOS DE ESTATÍSTICA E PROBABILIDADES

UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA MEAU- MESTRADO EM ENGENHARIA AMBIENTAL URBANA

ECONOMETRIA. Prof. Patricia Maria Bortolon, D. Sc.

Inferência Estatística: DEEST/UFOP Prof.: Spencer Barbosa da Silva

Controle Estatístico de Qualidade. Capítulos 1, 2 e 3 (montgomery)

Transcrição:

6. NOÇÕES DE INFERÊNCIA ESTATÍSTICA 214

Problemas de inferência Inferir significa fazer afirmações sobre algo desconhecido. A inferência estatística tem como objetivo fazer afirmações sobre uma característica de uma população a partir do conhecimento de dados de uma parte desta população (isto é, uma amostra de n observações). A população é representada por uma distribuição de probabilidade com parâmetro(s) cujo(s) valor(es) é (são) desconhecido(s). Fazemos inferências sobre o(s) parâmetro(s). 2

Problemas de inferência Se θ é um parâmetro da distribuição de uma v. a. X e X 1,...,X n é uma amostra desta distribuição, encontramos três problemas típicos: 1. Estimação pontual Apresentar um valor para θ, que é uma função da amostra X 1,...,X n ( cálculo de θ), chamada de estimador de θ. Espera-se que o estimador tenha boas propriedades: (i) em média esteja próximo de θ, (ii) o estimador se aproxima de θ quando n aumenta,...b 3

Problemas de inferência 2. Estimação intervalar Apresentar um intervalo de possíveis valores para θ, chamado de intervalo de confiança. Os limites do intervalo são funções da amostra X 1,...,X n (são aleatórios). A probabilidade de que o intervalo contenha θ deve ser alta.vv A amplitude do intervalo deve ser tão pequena quanto possível (intervalo mais preciso). 4

Problemas de inferência 3. Teste de hipóteses Uma hipótese estatística () é uma afirmação sobre o valor de θ. Pode ser verdadeira ou falsa. Se θ é a probabilidade de sucesso no modelo binomial, : θ ½, : θ ½ e : θ > ¾ são exemplos de hipóteses. Com base na amostra X 1,...,X n, formulamos uma regra de decisão que permita concluir pela rejeição ou não rejeição (aceitação) de. A decisão pode ser correta ou errada. 5

Estimação pontual método de substituição (a). Distribuição binomial. X ~ B(n, p). Vimos que E(X) np. n 1 Um estimador para p : X X i proporção amostral de sucessos. n (b). Distribuição de Poisson. X ~ Po(). Vimos que E(X). i 1 Um estimador para : X. (c). Distribuição exponencial. X ~ Ex(λ). Vimos que E(X) 1 / λ. 1 Um estimador para λ :. X (d). Distribuição normal. X ~ N(, σ 2 ). Vimos que E(X) e Var(X) σ 2. Um estimador para : X. Obs. Existem outros métodos de estimação. Um estimador para σ 2 : s 2 1 n 1 (e). Distribuição log-normal. X ~ LN(, σ 2 ) Y log(x) ~ N(, σ 2 ). Um estimador para : Y. Um estimador para σ 2 : s 2 Y 1 n 1 n i 1 n i 1 ( Y i ( X i X ) Y ) 2. 2. 6

Teste de hipóteses Exemplo. Uma indústria adquire de um certo fabricante pinos cuja resistência média à ruptura é especificada em 6 unid. (valor nominal da especificação). Em um determinado dia a indústria recebeu um grande lote de pinos e a equipe técnica da indústria deseja verificar se o lote atende às especificações. : O lote atende às especificações 1 : O lote não atende às especificações (ipótese nula). (ipótese alternativa). A v. a. X (resistência à ruptura) é tal que X ~ N (, 25). O problema pode ser resolvido testando as hipóteses : 6 e 1 : 6 (hipótese simples: um único valor) (hipótese composta: mais de um valor) 7

Teste de hipóteses Uma hipótese estatística é uma afirmação sobre o(s) parâmetro(s) da distribuição de probabilidade de uma característica (v. a. X) da população. Um teste de uma hipótese estatística é um procedimento ou regra de decisão que nos possibilita decidir por ou 1 com base na amostra X 1,...,X n. Exemplo. A equipe técnica da indústria decidiu retirar uma amostra aleatória de tamanho n 16 do lote recebido. A resistência de cada pino foi medida e foi calculada a resistência média X (estimador de ), que será utilizada para realizar o teste (estatística de teste). Podemos afirmar que X 25 ~ N,. 16 Obs. Se X 1, X 2,..., X n é uma amostra de uma distribuição N(, σ 2 ), então a média amostral tem distribuição N(, σ 2 /n). Para quais valores de X a equipe técnica deve rejeitar e portanto rejeitar o lote? 8

Região crítica (R c ) ou região de rejeição é o conjunto de valores assumidos pela estatística de teste para os quais a hipótese nula é rejeitada. Seu complementar é a região de aceitação (R a ). Exemplo. Se o lote está fora de especificação, isto é, se 1 : 6 for verdadeira, espera-se que a média amostral seja inferior ou superior a 6 unid. A equipe técnica decidiu adotar a seguinte regra: rejeitar se X for maior do que 62,5 unid. ou menor do que 57,5 unid. As duas regiões são R c { X > 62,5 ou X < 57,5} { } : região de rejeição de e R a 57,5 X 62,5 : região de aceitação de. 9

Procedimento (teste): Se Se x x R R c c,, rejeita -se não se rejeita (aceita -se) ;. 1

Tipos de erros Erro tipo I: rejeitar quando é verdadeira. Erro tipo II: não rejeitar (aceitar) quando é falsa. Exemplo. As hipóteses são : O lote atende às especificações; 1 : O lote não atende às especificações. Erro tipo I: rejeitar o lote sendo que ele está de acordo com as especificações. Erro tipo II: não rejeitar (aceitar) o lote sendo que ele não está de acordo com as especificações. Quadro resumo: Situação real e desconhecida Decisão o verdadeira o falsa Não rejeitar o Decisão correta Erro tipo II Rejeitar o Erro tipo I Decisão correta 11

Nível de significância e poder P(Erro tipo I) α (nível de significância). α P(Rejeitar ; verdadeira). P(Erro tipo II) β P(Não rejeitar ; P(Não rejeitar 1 verdadeira). ; falsa) 1 β P(Rejeitar ; é falsa) : poder do teste. Obs. Quanto maior o poder, melhor o teste. 12

Exemplo. As hipóteses são : 6 e 1 : 6. Logo, α P( X > 62,5 ou X < 57,5; : 6). Se for verdadeira, então X ~ N(6, 25/16). Calculamos o nível de significância: α P( X > 62,5; : 6) + P( X < 57,5; : 6) X 6 P > 25/16 P( Z > 2,) + 62,5 6 X 6 57,5 6 + P < 25/16 25/16 25 /16 P( Z < 2,),2275 +,2275,455. 13

Cálculo de α: 14

Cálculo de β: β P(Não rejeitar ; 1 verdadeira) P(57,5 X 62,5; 1 : Como exemplo de cálculo de β, selecionamos 1 : 63,5. Logo, 25 X ~ N 63,5; e 16 β P( 57,5 X 62,5; 1 : 63,5). 6). 15

Cálculo de β: Efetuando o cálculo obtemos β P( 57,5 X 62,5; 1 : 63,5) P( X 62,5; 63,5) P( X 57,5; 63,5) P( Z,8) P( Z 4,8),2119,,2119. Logo, se 63,5, o poder do teste é igual a 1,2119,7881. 16

Função poder 17

18 ipóteses bilateral e unilaterais Se as hipóteses nula e alternativa são, : ; : 1 em que é uma constante conhecida (valor de teste), o teste é chamado de bilateral. Podemos ter também as hipóteses, : ; : 1 < unilateral à esquerda. : ; : ou 1 > unilateral à direita Sugestão. Expressar em forma de igualdade.

Exemplo Um fabricante de um certo componente afirma que o tempo médio de vida dos componentes produzidos é de 1 horas. Engenheiros de produto têm interesse em verificar se uma modificação do processo de fabricação aumenta a duração dos componentes. ipóteses: 1 : : > 1 horas; 1 horas, sendo o tempo médio de duração dos componentes. 19

Procedimento básico de testes de hipóteses O procedimento de teste de hipóteses relativo ao parâmetro θ de uma população é decomposto em quatro passos: (i) Formulação das hipóteses: 1 : θ : θ < θ θ ; ou θ > θ ou θ θ. (ii) Identificação da estatística de teste e caracterização da sua distribuição (por exemplo, método de substituição, lâmina 6). (iii) Escolha do nível de significância do teste (α 5%, 1% e,5% são comuns) e obtenção da região crítica. (iv) Cálculo da estatística de teste e tomada de decisão ( deve ser rejeitada ou não?). 2

Teste de hipóteses para uma média populacional Considere uma amostra aleatória de tamanho n de uma população normal com média (desconhecida) e variância σ 2 (conhecida). Iniciamos pelo teste unilateral à esquerda: (i) 1 : : <. ; (ii) A estatística de teste é a média amostral X (estimador pontual de ). Se a distribuição da população é normal ou se amostra é grande (n 3, mesmo que a distribuição da população não seja normal) a 2 distribuição de X é N (, σ / n), aproximadamente. Se for verdadeira, então Z n ( X ) ~ N (,1). σ 21

22 (iii) Rejeitamos em favor de 1 se a média amostral X é pequena em relação. A região crítica é obtida selecionando um k tal que R c { X < k }, sendo que ) : ; ( < k X P α. Ou seja, sob α σ σ σ < < n k Z P n k n X P / / /. + < + n z X R n z k z n k c σ σ σ α α α (iv) Conclusão: se + < n z X R x c σ α, rejeita-se ; caso contrário não se rejeita. Obs. z α <. Teste de hipóteses para uma média populacional

Exemplo Um comprador de tijolos suspeita de uma diminuição na resistência. De experiências anteriores, sabe-se que a resistência média ao desmoronamento de tais tijolos é igual a 2 kg, com um desvio padrão de 1 kg. Uma amostra de 1 tijolos, escolhidos ao acaso, forneceu uma média de 195 kg. A um nível de significância de 5%, pode-se afirmar que a resistência média ao desmoronamento diminuiu? (i) As hipóteses de interesse são 1 : : < 2 kg; 2 kg. (ii) A estatística de teste é a média amostral X. Já que n 1 3, 1 tem-se que sob, X ~ N 2, 1, aproximadamente. (iii) A região crítica pode ser obtida selecionando k de maneira que R c { X < k }, sendo que P ( X < k; : ) α,5. Ou seja, sob, 23

Exemplo P X 1 / 2 1 k 1 / 2 1 P Z < k 2 1 α,5 k 2 1,64 k 198,36 R c { X < 198,36}. (iv) Do enunciado a média amostral vale 195. Logo, x 195 Rc { X < 198,36}. Rejeita-se a um nível de 5% de significância. Conclusão. De acordo com os dados coletados e adotando um nível de significância de 5%, concluímos que resistência média ao desmoronamento diminuiu. 24

Método alternativo Um método alternativo prático: trabalhar diretamente na escala Z. ( i) : contra 1 : <. (ii) Estatística de teste: Z n( X σ ) ~ N sob (,1), pelo menos aproximadamente. (iii) Região crítica para um nível de significância α escolhido: R c { Z < }. z α, rejeitase ; caso contrário, não se rejeita. (iv) Se z Rc { Z < z α } 25

Exemplo (i) : 2 contra 1 : < 2. (ii) Estatística de teste: Z n( X σ 2) ~ sob N(,1). (iii) Região crítica para um nível de significância α,5: R c { z < 1,64 }. (iv) Calculamos significância de 5%. 1(195 2) z 5 1 Rc. Rejeita-se a um nível de 26

Procedimento geral ipóteses: (ii) Estatística de teste: (a) Variância da população é conhecida: Z n( X σ ) ~ N sob (,1). (b) Variância da população é desconhecida (s é o desvio padrão amostral): T n( X ) Distribuição t de Student com ~ t( n 1). s n 1 graus de liberdade (g.l.). sob 27

Distribuições normal e t de Student 28

Procedimento geral (iii) Região crítica para um nível de significância α escolhido: 1 : < 1 : > 1 : ( R Z ) c ( R T ) c { Z < c} { T < c} { Z c} ( R Z ) c > { T c} ( R T ) c > { Z c} { T c} ( R Z ) c > ( R T ) c > (iv) Se Z R C ou T R C, rejeita-se o ; caso contrário, não se rejeita. Obs. Nas regiões críticas com Z e T o valor de c não é o mesmo. 29

Tabela da distribuição t de Student A tabela (Tábua III) contém os valores de t c (t c > ) tais que P( - t c T t c ) 1 p correspondentes a alguns valores de p e para alguns graus de liberdade. 3

Tabela da distribuição t de Student Exemplo. Se n 12, são 11 graus de liberdade. Se tivermos 1 :, escolhendo α 5%, temos p/2 α/2, ou seja, p 5%. Consultando a tábua III encontramos t c 2,21 e R c { T > 2,21}. Graus de liberdade p 9% 8%... 5%...,1% 1 2... 11 2,21... 12 Infinito 1,96 p 9% 8%... 5%...,1% Obs.. À medida que aumentam os graus de liberdade, a distribuição t se aproxima da normal (neste exemplo, t c 1,96 z c ). 31

Tabela da distribuição t de Student Exemplo. Se n 28, são 27 graus de liberdade. Se tivermos 1 : <, escolhendo α 1%, temos p/2 α, ou seja, p 2 α 2%. Consultando a tábua III encontramos t c 2,473 e R c {T < -2,473}. Graus de liberdade p 9% 8%... 2%...,1% 1 2... 27 2,473... 12 Infinito 2,326 p 9% 8%... 2%...,1% Obs. Neste exemplo, se tivéssemos 1 : >, a região crítica seria R c {T > 2,473}. 32

Exemplo Dados históricos coletados em uma linha de produção de um certo item indicam 115 kg como massa média. A fim de testar a hipótese de que a média de itens recentemente produzidos se manteve, retirou-se, ao acaso, uma amostra de 2 itens, obtendo-se média igual a 118 kg e desvio padrão 2 kg. Utilize α,5. (i) 1 As hipóteses de interesse são : : 115 kg; 115 kg. Aproximamos a distribuição da média dos 2 itens por uma distribuição normal com média e variância σ 2 / n. (ii) Estatística de teste: T n( X 115) ~ t( n S sob 1). 33

Exemplo (iii) Região crítica para um nível de significância α,5 e com n 1 19 g.l.: R c { T > 2,93}. (iv) Calculamos T 2(118 115), 67 2 Rc. Não se rejeita a um nível de de significância de 5%. A diferença não é significativa. Conclusão. De acordo com os dados coletados, a um nível de significância de 5% concluímos que a massa média dos itens produzidos se manteve. 34

Teste de hipóteses para uma proporção populacional O procedimento para testes de hipóteses sobre a proporção populacional (p) semelhante ao utilizado para testes sobre uma média populacional. Problema. Testar a hipótese que a proporção de sucessos de um ensaio de Bernoulli é igual a um valor especificado p. Isto é, testar um dos seguintes pares de hipóteses: 35

Teste de hipóteses para uma proporção populacional (ii) Estatística de teste: Z n( p p (1 p p ) ) ~ N sob (,1), aproximadamente, sendo que p Número de sucessos n i 1 n n X i :estimador pontual de p. é a proporção amostral de sucessos e X i 1, se o resultado for sucesso; X i, se o resultado for insucesso. 36

Exemplo Um estudo é realizado para determinar a presença de pequenas anomalias em chapas metálicas de uma certa dimensão. Segundo o fabricante, a proporção de chapas com anomalias é inferior a 25%. Foram inspecionadas 5 chapas escolhidas ao acaso e sete delas apresentaram algum tipo de anomalia. Estes dados justificam a afirmação do fabricante? Adote um nível de significância igual a,5. (i) 1 ipóteses : : : p p <,25;,25. (ii) Estatística de teste: Z 5( p,25(1,25),25) ~ sob N(,1), aproximadamente. 37

Exemplo (iii) Região crítica para um nível de significância α,5: R c { z < 1,64 }. (iv) Temos n 5. Calculamos, 14 Rejeita-se ao nível de 5% de significância. 7 5(,14,25) p e z 1, 796 Rc 5 25 (1,25) Conclusão. Adotando um nível de significância de 5% concluímos a partir dos dados que a proporção de chapas produzidas com anomalias é inferior a 25%.. 38