CAPÍTULO 6 - ESTIMAÇÃO E TESTES DE HIPÓTESES

Documentos relacionados
Cap. 4 - Estimação por Intervalo

Hipótese Estatística. Tipos de Hipóteses

Intervalos de Confiança

ESTIMAÇÃO DA PROPORÇÃO POPULACIONAL p

ESTATÍSTICA NÃO-PARAMÉTRICA

ESTIMAÇÃO DE PARÂMETROS

DISTRIBUIÇÃO AMOSTRAL E ESTIMAÇÃO PONTUAL INTRODUÇÃO ROTEIRO POPULAÇÃO E AMOSTRA. Estatística Aplicada à Engenharia

Distribuições de Estatísticas Amostrais e Teorema Central do Limite

Objetivo. Estimar a média de uma variável aleatória X, que representa uma característica de interesse de uma população, a partir de uma amostra.

Estatística. Estatística II - Administração. Prof. Dr. Marcelo Tavares. Distribuições de amostragem. Estatística Descritiva X Estatística Inferencial

1 Distribuições Amostrais

INFERÊNCIA. Fazer inferência (ou inferir) = tirar conclusões

Teste de Hipóteses Paramétricos

Amostras Aleatórias e Distribuições Amostrais. Probabilidade e Estatística: afinal, qual é a diferença?

Objetivo. Estimar a média µ de uma variável aleatória X, que representa uma característica de interesse de uma população, a partir de uma amostra.

MAE Introdução à Probabilidade e Estatística II Resolução Lista 2

Avaliação de Desempenho de Sistemas Discretos

Estimativa de Parâmetros

Lista de Exercícios #4 Assunto: Variáveis Aleatórias Contínuas

INTERVALOS DE CONFIANÇA

Virgílio A. F. Almeida DCC-UFMG 1/2005

Teorema do Limite Central, distribuição amostral, estimação por ponto e intervalo de confiança

Faculdade de Economia Universidade Nova de Lisboa ESTATÍSTICA. Exame Final 2ª Época 26 de Junho de Grupo I (3 valores)

CAPÍTULO 6 ESTIMATIVA DE PARÂMETROS PPGEP. Introdução. Introdução. Estimativa de Parâmetros UFRGS

MOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

d) A partir do item c) encontre um estimador não viciado para σ 2.

Objetivos. Os testes de hipóteses ser: Paramétricos e Não Paramétricos. Testes não-paramétricos. Testes paramétricos

6. Testes de Hipóteses Conceitos Gerais

O teste de McNemar. A tabela 2x2. Depois - Antes

Uma amostra aleatória simples de n elementos é selecionada a partir da população. Calcula-se o valor da média a partir da amostra

Pedro Alberto Barbetta / Marcelo Menezes Reis / Antonio Cezar Bornia São Paulo: Atlas, 2004

Capítulo 5- Introdução à Inferência estatística.

CONCEITOS BÁSICOS E PRINCÍPIOS DE ESTATÍSTICA

A Inferência Estatística é um conjunto de técnicas que objetiva estudar a população através de evidências fornecidas por uma amostra.

DETERMINANDO A SIGNIFICÂNCIA ESTATÍSTICA PARA AS DIFERENÇAS ENTRE MÉDIAS

Distribuição Amostral da Média: Exemplos

MAE Introdução à Probabilidade e Estatística II Resolução Lista 1

Mestrado Integrado em Engenharia Civil. Disciplina: TRANSPORTES. Sessão Prática 4: Amostragem

Exercícios de Intervalos de Confiança para media, variância e proporção

A finalidade de uma equação de regressão seria estimar valores de uma variável, com base em valores conhecidos da outra.

UNIVERSIDADE FEDERAL DO PARANÁ SETOR DE CIÊNCIAS EXATAS DEPTO. DE ESTATÍSTICA LISTA 4 PROBABILIDADE A (CE068) Prof. Benito Olivares Aguilera

EPR 007 Controle Estatístico de Qualidade

Revisando... Distribuição Amostral da Média

4. Inferência Estatística Estimadores Pontuais

Transcrição:

CAPÍTULO 6 - ESTIMAÇÃO E TESTES DE HIPÓTESES 6. INTRODUÇÃO INFERÊNCIA ESTATÍSTICA Estimação por poto por itervalo Testes de Hipóteses População X θ =? Amostra θ Iferêcia Estatística X, X,..., X 6. ESTIMAÇÃO Cosideremos uma amostra ( X, X,..., X ) de uma v.a. X que descreve uma característica de iteresse de uma população. Seja θ um parâmetro que desejamos estimar. Um estimador do parâmetro θ é qualquer fução das observações X, X,... X. Chamaremos de estimativa a cada particular valor assumido por um estimador. Por exemplo, seja X a altura das pessoas de uma determiada localidade e supoha que estejamos iteressados em estimar a altura média µ dessa população. Para tato uma amostra aleatória ( X, X,..., X 30 ) de 30 pessoas foi retirada e a sua altura média X foi de,67 m. Nesta situação, a média populacioal µ é o parâmetro a ser estimado, a média amostral X é o estimador utilizado e o valor da média,67 m é uma estimativa para µ. O problema da estimação é determiar uma fução dos valores amostrais (X, X,... X ) que seja próxima de θ, segudo algum critério. Existem vários métodos de obteção de estimadores, e para um mesmo parâmetro podemos ter mais de um estimador. Sedo assim, é ecessário estudar algumas propriedades que os distiguem us dos outros. 6.. PROPRIEDADES DOS ESTIMADORES

6 ESTATÍSTICA DEFINIÇÃO : Um estimador θ é dito um estimador ão-viesado ( ou ão-tedecioso) do parâmetro θ se : E ( $ θ ) = θ ou seja, se a média da sua distribuição amostral é igual a θ. Por exemplo: X= i= p $ = X X i é um estimador ão - viesado de é um estimador ão - viesado de p µ s = i= ( X -X ) i - é um estimador ão - viesado de σ DEFINIÇÃO : Se $ θ e $ θ são dois estimadores ão viesados de um mesmo parâmetro θ, e aida : V ( $ θ ) < V ( $ θ ), etão $θ é dito mais eficiete do que θ $. Por exemplo, cosideremos uma população ormal X, com parâmetros µ e σ. Queremos estimar a mediaa Md dessa população. Por ser uma distribuição simétrica, sabemos que µ = Md. Defiido como X a média e como md a mediaa da amostra, qual dos dois estimadores é o melhor para a mediaa populacioal? Marcia Oladoski Erbao Depto. de Iformática CEFET-PR

ESTATÍSTICA 7 Sabemos que X : N( µ, σ / ) e pode-se demostrar que a distribuição da πσ mediaa amostral tem uma distribuição próxima à md : N Md,. Os dois estimadores são ão-viesados, mas X é mais eficiete pois : V(X ) < V( Md ) Assim, para estimar-se a mediaa desta população, é preferível usar a média da amostra como estimador. OBSERVAÇÃO : Existem procedimetos ou métodos para se obter estimadores. Etre eles podemos citar o Método de Máxima Verossimilhaça, o Método dos Míimos quadrados, o Método dos Mometos e o Método de Bayes. 6.. ESTIMATIVA POR PONTO Uma estimativa por poto de algum parâmetro populacioal θ é um úico valor $θ calculado através de dados amostrais, para o qual temos alguma garatia de que este está perto do parâmetro θ a ser estimado. 6..3 ESTIMATIVA POR INTERVALO Uma estimativa por itervalo de um parâmetro θ é um itervalo da forma : $θ I < θ < $ θ S ode θ $ I e $θ S depedem do valor da estatística θ $ para uma particular amostra e também da distribuição amostral de θ $. 6..4 ESTIMATIVAS PARA A MÉDIA POPULACIONAL µ Uma estimativa potual para a média µ é dada pela estatística : X i i X = = Marcia Oladoski Erbao Depto. de Iformática CEFET-PR

8 ESTATÍSTICA Uma estimativa por itervalo para µ pode ser ecotrada cosiderado a distribuição amostral de X, ou seja : X : N µ, σ, para grade. Z = X- µ σ / Se fixarmos um valor α de probabilidade : α α / α / P (-z < Z < z α/ α/ P -z < X µ α <z σ/ ou aida, P X - z ) = α / α/ = α -z α/ σ < < X + z σ µ α α/ / = 0 α z α/ Podemos, etão dizer que existe -α de probabilidade de que o itervalo acima, chamado de INTERVALO DE CONFIANÇA para µ, coteha o valor verdadeiro do parâmetro µ. OBSERVAÇÕES : ( ) -α é chamado de ível de cofiaça do itervalo e α é o ível de sigificâcia. ( ) O itervalo de cofiaça acima é válido quado o tamaho da amostra é grade e o desvio padrão σ é cohecido. Quado ão cohecemos σ, que é o caso mais geral, substituímos este valor pelo desvio padrão s da amostra, desde que a amostra seja grade. ( 3 ) Se é pequeo e descohecemos σ, etão a estatística usada é : T= X- µ s/ T tem distribuição t de Studet com - graus de liberdade. Marcia Oladoski Erbao Depto. de Iformática CEFET-PR

ESTATÍSTICA 9 6..4. Erro e Tamaho da Amostra Se X é usada como uma estimativa de µ, podemos ter (-α ).00 % de cofiaça de que o erro e é meor do que : e < z α/ σ. e e X - z α/ σ X X + z α/ Se X é usada como uma estimativa de µ, podemos ter (-α ).00 % de cofiaça de que o erro é meor do que um valor especificado e quado o tamaho da amostra é : = z α/. σ e σ OBSERVAÇÃO : Quado ão se cohece σ, pode-se estimá-lo através de uma amostra piloto ou através do cohecimeto de σ uma situação semelhate. EXEMPLO Uma máquia eche pacotes de café com uma variâcia igual a 00 g. Ela estava regulada para echê-los com 500 g, em média. Agora, ela se desregulou e queremos saber qual a ova média µ. Uma amostra aleatória de 5 pacotes foi retirada e apresetou uma média igual a 485 g. ( a ) Uma estimativa potual para a média µ é dada pela média amostral : X = 485 g. ( b ) Vamos costruir um itervalo de cofiaça de 95 % ( I.C.) para µ : Marcia Oladoski Erbao Depto. de Iformática CEFET-PR

0 ESTATÍSTICA X = 485 g σ = 00 ( σ = 0) = 5 -α = 0,95 z α/ = z 0,05 =,96 0,05 α = 0,95 0,05 -Z0,05 0 Z0,05 Z -,96,96 P X - z σ < < X+z σ. µ α. = ( α).00% α/ / P( 48,08 < µ < 488,9 ) = 95%. Assim podemos ter 95 % de cofiaça de que o itervalo ( 48,08 ; 488,9) cotem o valor da média µ dos pesos dos pacotes que são echidos por esta máquia. Note que o valor 500g ão está o itervalo, idicado que, de fato, a máquia está desregulada. ( c ) Qual o erro máximo cometido a estimativa de µ este caso? Podemos ter 95% de cofiaça que a média amostral X = 485 difere da média populacioal µ por um valor meor que : e = z α/ σ 0 = 96,. = 39, g. 5 ( d ) Para que este erro seja dimiuído para g, qual deveria ser o tamaho da amostra ecessária para isto ocorrer com 95 % de cofiaça? = z α/. σ e =,96.0 = 96,04 Ou seja, se = 96 podemos ter 95 % de cofiaça que o erro a estimativa de µ seria meor do que g. Marcia Oladoski Erbao Depto. de Iformática CEFET-PR

ESTATÍSTICA 6..5 ESTIMATIVAS PARA A PROPORÇÃO Uma estimativa potual para p, uma proporção populacioal, é dada pela estatística : $p = x ode x é o úmero de elemetos a amostra que possuem uma determiada característica e é o tamaho da amostra. Uma estimativa por itervalo para p pode ser ecotrada através da distribuição amostral de, a proporção amostral. $p Sabemos que : $p : N p,, para grade Se fixarmos um valor α de probabilidade : α α / α / Z= p $ - p -z α/ 0 z α/ P(-z < Z < z α/ α/ P z < p-p $ α ou aida : ) = α < z / α/ P p$ - zα < p <p+z $ = α / α/ = α Marcia Oladoski Erbao Depto. de Iformática CEFET-PR

ESTATÍSTICA Como a situação mais comum é ão se cohecer o desvio padrão podemos estimá-lo por : por : $$., Assim, um itervalo de cofiaça de ( - α ).00% para o parâmetro p é dado P p$ - z $ $ < p <p+z $ $ $ = ( ). 00% α/ α/ α ode $p é a proporção amostral, é o tamaho da amostra, $q = - $p e zα/ é o valor da v.a. Z com área de α/ à direita. Podemos dizer, etão, que existe ( - α)00% de cofiaça que o itervalo acima cotem o valor real da proporção p. 6..5. Erro e Tamaho da Amostra Se $p é usado como uma estimativa de p, podemos estar ( - α )00% cofiates de que o erro e será tal que : e < z α/ $$ Se $p é usado como um estimativa de p, podemos estar ( - α )00% cofiates de que o erro será meor do que e quado o tamaho da amostra for : = z α /. $$ e Marcia Oladoski Erbao Depto. de Iformática CEFET-PR

ESTATÍSTICA 3 OBSERVAÇÃO : Como $p já é uma estatística ecotrada a partir da amostra e portato ão cohecida aida, a pior das hipóteses, poderíamos tomar $p = 0,5. Neste caso : / = z α 4e EXEMPLO Numa amostra aleatória de =500 famílias que possuem aparelho de TV uma cidade do Caadá, foi ecotrado que x = 340 possuem TV a cores. ( a ) Uma estimativa potual para a proporção de famílias ( que já possuem TV ) que tem TV a cores é dada por : $p = x =340 500 = 0,68 ( ou 68% ) ( b ) Um itervalo de cofiaça de 95% para a proporção real de famílias esta cidade que possuem TV a cores, dado que possuem TV é : $p = 0,68 = 500 z α/ = z 0,05 =,96 0,05 α = 0,95 0,05 -Z 0 Z 0,05 0,05 -,96,96 Z P p$ - z P 0,68-,96. $ $ < p < p+z $ 0,68.0,3 500 P(0,64 < p < 0,7) = 95% $ $ = ( ). 00% α/ α/ α < p < 0,68-,96. 0,68.0,3 500 = 95% Existe 95% de cofiaça de que o itervalo (0,64 ; 0,7) cotem o valor da proporção p das famílias que possuem TV a cores, dado que possuem TV, esta cidade. Marcia Oladoski Erbao Depto. de Iformática CEFET-PR

4 ESTATÍSTICA ( c ) O erro máximo cometido com 95% de cofiaça é : e = p$ - p = z α / $$ = 0,04 ( ou 4% ) ( d ) Qual deve ser o tamaho da amostra para estarmos 95% cofiates de que o erro ao estimarmos p seja meor do que 0,0? = =,96 z α/. $$. 06803,., e 0,0 = 090 ( e ) Se ão for utilizado p = 0,68 como uma estimativa de p, o tamaho da amostra em (d) seria : =,96 4.0,0 = 40. 6..6 ESTIMATIVAS PARA DIFERENÇAS 6..6. Estimativas para difereças etre duas médias Se tivermos duas populações com médias µ e µ e variâcias σ e σ, respectivamete, um estimador potual para a difereça etre µ e µ é dado pela estatística X - X, baseada em amostras idepedetes de cada uma das populações, com tamahos e, respectivamete. Uma estimativa por itervalo pode ser obtida para µ e µ, a partir da distribuição amostral de X - X. Sabemos que, para e suficietemete grades: X X N σ : µ µ, + σ Z = X X ( µ µ ) σ σ + Marcia Oladoski Erbao Depto. de Iformática CEFET-PR

ESTATÍSTICA 5 α α / α / -z α/ 0 z α/ P(z < z < z α/ α/ ) = α P -z < X X ( µ µ ) α/ σ σ + <z α/ = α P (?????) ver apostila Quado e são grades e descohecemos σ e σ, podemos substituir estas variâcias pelas variâcias amostrais s e s. EXEMPLO Um teste sobre esportes foi aplicado a 50 meias e 75 meios. As meias obtiveram média de 76,0 com um desvio padrão de 6, equato que os meios obtiveram média 8,0 com desvio padrão de 8. Ecotre um itervalo de cofiaça de 96% para a difereça µ - µ, ode µ é a média de todos os meios e µ é a média de todas as meias que poderiam fazer este teste. Pop. (meios) X amostra = 75 µ =? X = 8, s = 8 Pop. (meias) X amostra = 50 µ =? X = 76, s = 6 Marcia Oladoski Erbao Depto. de Iformática CEFET-PR

6 ESTATÍSTICA α = 004, α = 096, z = z =, 054 α/ 0,0 σ σ σ σ P X X zα/ + < µ µ < X X + zα/ + = α 6 6 P 8-76 -,054 8 + < µ µ < 8-76 +,054 8 + = 096, 75 50 75 50 P ( 3,4 < µ µ < 8,58 ) = 0,96 Existe 96% de cofiaça de que o itervalo costruído coteha a difereça etre as médias reais µ µ das otas de meios e meias. 6..6. Estimativas para Difereças etre Duas Proporções Cosidere duas amostras idepedetes selecioadas de duas populações biomiais com parâmetros p e p, respectivamete. Uma estimativa potual para a difereça etre duas proporções p - p é dada pela estatística $p - $p ode $p e $p são proporções amostrais. Uma estimativa por itervalo para a difereça etre as duas proporções é obtida através da distribuição amostral da difereça de duas proporções. Sabemos que : p$ p $ : N p p, + p$ -p$ -(p-p ) e Z = + P(-z < Z < z α/ α/ P -z α/ < P p$ - p$ ) = α p$ -p$ -(p -p ) + < z α/ zα + < p p < p$ -p$ + zα/ + / = α = α Marcia Oladoski Erbao Depto. de Iformática CEFET-PR

ESTATÍSTICA 7 O desvio padrão da distribuição amostral poderá ser estimado por $ $ $ $ +. EXEMPLO Sejam p e p as proporções reais de defeitos de um processo já existete e de um ovo processo, respectivamete. Uma amostra aleatória de cada processo foi retirada com = 500 e = 000, obtedo-se : p $ = X p $ = X = = 75 500 = 0,05 e 80 000 = 0,04 Uma estimativa potual para p - p, a difereça etre as duas proporções pesquisadas é $p - $p = 0,05-0,04 = 0,0. Um itervalo de cofiaça de 90% para p - p é dado por : P 0,0 -,65 0,05.0,95 004096,., + < p p < 0,0 +,65 0,05.0,95 004096,., + = 090, 500 000 500 000 P( - 0,007 < p p < 0,07 ) = 0,90 Existe 90 % de cofiaça de que o itervalo costruído cotem a difereça etre as duas proporções p - p de defeitos dos processos. Observe que o zero está este itervalo. Marcia Oladoski Erbao Depto. de Iformática CEFET-PR

8 ESTATÍSTICA 6.3 TESTES DE HIPÓTESES 6.3. INTRODUÇÃO Um importate tipo de problema em Iferêcia Estatística é determiar se uma amostra pode ter vido de uma população tedo uma distribuição parcial ou completamete especificada. Por exemplo, se sabemos que uma amostra veio de uma distribuição ormal, é razoável dizer que ela veio de uma distribuição com média µ 0? Ou, se duas amostras vieram de distribuições ormais, é razoável dizer que estas vieram de distribuições que têm médias iguais? Como estatísticas como estas são v.a s que têm suas próprias distribuições de probabilidade, afirmações sobre seus parâmetros devem ser feitas em termos de probabilidade. 6.3. HIPÓTESE ESTATÍSTICA Uma hipótese estatística é uma afirmação sobre a distribuição (ou parâmetros) de uma ou mais variáveis aleatórias. Uma hipótese estatística pode ser verdadeira ou ão. Por exemplo, supoha que X seja a média de uma amostra de tamaho retirada de uma distribuição N (µ, σ ), ode σ é cohecida e µ é descohecida. Supoha que se deseje verificar se é razoável que esta amostra teha vido de uma população N (µ 0, σ ) cosiderado a possibilidade de que esta poderia ter vido de alguma distribuição ormal N (µ, σ ), ode µ µ 0. Podemos abreviar esta questão dizedo que desejamos testar a hipótese estatística : H 0 : µ = µ 0 cotra a alterativa H : µ µ 0 usado a amostra de tamaho e a média X. H 0 é chamada de Hipótese Nula e H é chamada de Hipótese Alterativa. 6.3.3 ERROS DO TIPO I E TIPO II Em um teste de hipótese podem ocorrer dois tipos de erros : ERRO TIPO I : rejeitar H 0 quado H 0 é verdadeira. ERRO TIPO II :aceitar H 0 quado H 0 é falsa. Marcia Oladoski Erbao Depto. de Iformática CEFET-PR

ESTATÍSTICA 9 EXEMPLO (Meyer) Um fabricate vem produzido pios para serem utilizados sob determiadas codições de trabalho. Verificou-se que a duração de vida ( em horas) desses pios é N (00,9). Um ovo esquema de fabricação foi itroduzido com o objetivo de aumetar a duração de vida desses pios. Quer dizer, a expectativa é que a duração de vida X terá distribuição N ( µ, 9) ode µ > 00. ( Admita que a variâcia cotiua a mesma ). Deste modo, o fabricate e o comprador potecial desses pios estão iteressados em testar as seguites hipóteses : H 0 : µ = 00 H : µ > 00 ( estamos supodo que osso processo ão pode ser pior que o atigo ) ERRO TIPO I : Rejeitamos que a média seja 00 quado a realidade ão houve melhora a qualidade dos pios ( a realidade a média cotiua sedo 00). ERRO TIPO II : Aceitamos que a média é 00 ( o processo cotiua o mesmo ) quado a realidade a qualidade dos pios melhora ( a média é > 00). As probabilidades dos dois tipos de erros serão α e β, respectivamete. A probabilidade α do ERRO TIPO I é chamado de NÍVEL DE SIGNIFICÂNCIA. Estas probabilidades, codicioadas à realidade estão resumidas o quadro abaixo : Decisão Aceitar H 0 Rejeitar H 0 H 0 verdadeira Decisão Correta - α Erro Tipo I α Realidade H 0 falsa Erro Tipo II β Decisão Correta -β 6.3.4 TESTE DE HIPÓTESE Um teste de hipótese estatística é uma regra geral tal que, quado os valores de uma amostra são obtidos, leva à decisão de aceitar ou rejeitar a hipótese cosiderada. Marcia Oladoski Erbao Depto. de Iformática CEFET-PR

30 ESTATÍSTICA 6.3.5 REGIÃO CRÍTICA ( R.C. ) A faixa de valores da variável de teste que leva à rejeição de H 0 é deomiada região crítica do teste. A faixa restate é chamada de região de aceitação (R.A.). OBSERVAÇÕES : ( ) Os erros do tipo I e II estão relacioados. Um decréscimo a probabilidade de um geralmete resulta um acréscimo a probabilidade do outro. ( ) O tamaho da região crítica, e portato a probabilidade de cometer um erro do tipo I, pode sempre ser reduzida ajustado os valores críticos. ( 3 ) Um acréscimo o tamaho da amostra reduzirá α e β simultaeamete. ( 4 ) Se a hipótese ula é falsa, β atige o máximo quado o valor verdadeiro de um parâmetro está perto do valor hipotetizado. Quato maior a distâcia etre o valor verdadeiro e o valor hipotetizado, meor será β. 6.3.6 TESTE UNILATERAL E TESTE BILATERAL Um teste de uma hipótese estatística ode a hipótese alterativa H é uilateral como : H 0 : θ = θ 0 H : θ > θ 0 ou H 0 : θ = θ 0 H : θ < θ 0 são chamados de TESTES UNILATERAIS. A região crítica para a hipótese alterativa θ > θ 0 cai iteiramete a cauda direita da distribuição, equato que para a hipótese alterativa θ < θ 0 a região crítica cai à esquerda. R.A. R.A. α α α α z α θ -z α Um teste de hipótese ode a hipótese alterativa H é bilateral tal como : θ Marcia Oladoski Erbao Depto. de Iformática CEFET-PR

ESTATÍSTICA 3 H 0 : θ = θ 0 H : θ θ 0 É chamado de TESTE BILATERAL R.A. α α / α / -z α/ z α/ θ A costrução de teste de hipótese para um parâmetro populacioal pode ser colocada do seguite modo. Existe uma v.a. X em uma dada população. Tem-se uma hipótese sobre determiado parâmetro θ dessa população. O objetivo do teste de hipótese é dizer, através de uma estatística θ $ obtida de uma amostra, se a hipótese H 0 é aceitável ou ão. Operacioalmete, isto é coseguido através de uma região Caso o valor da estatística do teste perteça a esta região, rejeitamos H 0, caso cotrário, ão rejeitamos H 0. Esta região é costruída de modo que P( $θ / H0 é verdadeira) = α sedo α um valor fixado, geralmete 5%, % ou 0,%. 6.3.7 PASSOS PARA A CONSTRUÇÃO DE UM TESTE DE HIPÓTESE. Fixe qual a hipótese H 0 a ser testada e qual a hipótese alterativa H.. Use a teoria estatística e as iformações dispoíveis para decidir qual estatística ( estimador) será usada para julgar a hipótese H 0. 3. Fixe a probabilidade α de cometer o erro do tipo I, e use este valor para costruir a região Lembre que esta região é costruída para a estatística defiida o segudo passo, usado os valores hipotetizados por H 0. 4. Use as iformações forecidas pela amostra para ecotrar o valor da estatística que levará à decisão. 5. Se o valor da estatística observado a amostra pertece à região crítica (), rejeite H 0, caso cotrário, ão rejeite H 0. Marcia Oladoski Erbao Depto. de Iformática CEFET-PR

3 ESTATÍSTICA 6.3.8 O VALOR DE p Quado realizamos um teste estatístico e verificamos que o valor da estatística do teste cai a, dizemos que o resultado do teste é estatisticamete sigificate ( rejeitamos H 0 ). Por exemplo, se um teste para o qual o ível de sigificâcia especificado é α = 0,05 e o teste é bilateral, etão a fica defiida como o gráfico abaixo, cosiderado que a distribuição Normal seja idicada. 0,05 0,95 0,05 p -,96 0,96 Quado realizamos um teste através de um programa computacioal de Estatística ecotramos, além do valor da estatística calculado, o valor de p (ível p) que é a probabilidade de se cometer o erro do tipo I, associado ao valor calculado da estatística. No exemplo acima, p = 0,004 é a probabilidade de Z >,9. Como p < 0,05, este caso, dizemos que o resultado é sigificate e rejeitamos H 0. Tipicamete, em muitas Ciêcias, resultados que produzem p 0,05 são cosiderados estatisticamete sigificates, mas lembre que este ível de sigificâcia aida evolve uma probabilidade de erro razoavelmete grade ( 5%). Resultados que são sigificates ao ível de p 0,0 são estatisticamete sigificates e íveis de p 0,005 ou p 0,00 cosiderados altamete sigificates. Estas classificações são meramete arbitrárias e são coveções iformalmete baseadas em experiêcia de pesquisa de modo geral.,9 Z 6.3.9 TESTE SOBRE A MÉDIA DE UMA POPULAÇÃO COM VARIÂNCIA CONHECIDA Cosidere o problema de testar a hipótese de que a média µ de uma população com variâcia cohecida σ, é igual a um valor especificado µ 0 cotra a alterativa bilateral de que a média ão é igual a µ 0 :. H 0 : µ = µ 0. H : µ µ 0 Marcia Oladoski Erbao Depto. de Iformática CEFET-PR

ESTATÍSTICA 33 3. Uma estatística apropriada sobre a qual baseamos osso critério de decisão é a v.a. X. Já sabemos que X : N ( µ, σ / ) e que Z = X- µ. σ / 4. Se usamos o ível de sigificâcia α, é possível ecotrar dois valores críticos x e x tais que x < X < x defie a região de aceitação e as duas caudas da distribuição X > x e X > x costituem a região crítica A região crítica pode ser dada em termos de valores de Z fazedo : Z = x- µ 0 σ / 5. Portato, para um ível de sigificâcia α, a é defiida por : R.A. α α / α / x -z α/ z α/ x X Z 6. Da população, selecioamos uma amostra aleatória da tamaho e calculamos a média X e o valor de Z correspodete, sob H 0 verdadeira, isto é : Z = X µ 0 σ / 7. Se X da amostra ( ou Z calculado) cair a região crítica cocluímos que H 0 será rejeitada, ou seja, aceitamos que µ µ 0. OBSERVAÇÃO : O procedimeto de teste descrito acima é equivalete a ecotrar um itervalo de cofiaça de ( - α ).00% para µ e aceitar H 0 se µ 0 cair o itervalo. Se cair fora do itervalo, rejeitamos H 0 em favor da hipótese alterativa H. Marcia Oladoski Erbao Depto. de Iformática CEFET-PR

34 ESTATÍSTICA EXEMPLO Um fabricate de material esportivo desevolve uma ova liha de pesca sitética sobre a qual ele afirma que tem resistêcia média à ruptura de 8 Kg com um desvio padrão de 0,5 Kg. Teste a hipótese de que µ = 8 Kg, cotra a hipótese de que µ 8 Kg, se uma amostra de 50 lihas foi testada e apresetou uma média de resistêcia à ruptura de 7,8 Kg. Use um ível de 0,0 de sigificâcia. Solução : o ) H o : µ = 8 H : µ 8 o ) X : N( µ, σ / ). Se H 0 é verdadeira, X : N ( 8 ; 0,5 /50 ) 3 o ) Para α = 0,0 a será dada por Z < -,575 ou Z >,575 R.A. α 0,005 0,005 -,88 8 -,575 0,575 X Z 4 o ) X = 7,8 = 50 Z = X µ 0 = 7,8-8 σ / 05, / 50 = -,88 5 o ) Coclusão : Rejeitamos H 0 e cocluímos que a resistêcia média à ruptura ão é igual a 8 Kg. Esta média é meor do que 8 Kg. O valor de p este caso é de p = 0,0040 ou seja meor do que 0,005. 6.3.0 TESTE PARA PROPORÇÃO Temos uma população e temos como hipótese sobre a proporção p de elemetos portadores de uma característica. o ) H 0 : p = p 0 Marcia Oladoski Erbao Depto. de Iformática CEFET-PR

ESTATÍSTICA 35 O problema forece iformações sobre a alterativa, que pode ter uma das 3 formas : H : p p 0 ( bilateral ) H : p > p 0 ( uilateral à direita ) H : p < p 0 ( uilateral à esquerda ) o ) A estatística a ser usada é $p, a proporção da amostra. Sabemos que : $p : N p, 3 o ) Fixado um valor de α, devemos costruir a para p a suposição de que os parâmetros defiidos em H 0 sejam verdadeiros. Assim : p $ : N p, 0 $ Z = p-p 0 0 0 0 0 e α / α / -z α/ R.A. α p z 4 o ) Calculamos o valor $p da amostra e o correspodete valor de Z. α/ p Z 5 o ) Rejeitamos H 0 se o valor de Z calculado cair a, caso cotrário, aceitamos H 0. Marcia Oladoski Erbao Depto. de Iformática CEFET-PR

36 ESTATÍSTICA EXEMPLO Um caçador de faisão afirma que ele acerta 80% dos pássaros em que ele atira. Você cocorda com esta afirmação se um dia qualquer ele acerta 9 dos 5 pássaros em que ele atira? Use 0,05 como ível de sigificâcia. Solução : o ) H 0 : p = 0,8 H : p 0,8 o ) $p = N p, 5 3 o ) Para α = 0,05 a região crítica fica defiida por valores de Z tais que Z < -,96 ou Z >,96. Sob a hipótese ula H 0 : $p : N 0,8, 0,8.0, 5 R.A. 0,05 0,95 0,05 -,96 0,96 4 o ) Da amostra tiramos que : Z p $ = 9 5 e Z = p-p $ 0 0 0 = 9 5-0,8 0,8.0, 5 = -,94 5 o ) Não rejeitamos H 0 e cocluímos que ão há razão para duvidar da afirmação do caçador. 6.3. TESTE PARA DIFERENÇA ENTRE DUAS PROPORÇÕES É comum termos que testar a hipótese de que duas proporções p e p são iguais. O procedimeto de teste é o seguite : o ) H 0 : p = p ( ou p - p = 0) Marcia Oladoski Erbao Depto. de Iformática CEFET-PR

ESTATÍSTICA 37 H : p p ( bilateral ) ou H : p > p ( uilateral à direita ) ou H : p < p ( uilateral à esquerda ) o ) A estatística a ser usada é $p - $p. p$ - p $ : N p -p, 3 o ) Fixado α e sob H 0 : + Z = p$ -p$. $ $ + R.A. α α / α / -z α/ z α/ Z 4 o ) Calcule : p $ = x e p $ = x p $ = x + x + Z = p$ -p$. $ $ + EXEMPLO Uma votação será feita etre os residetes de uma cidade e a região rural ao redor desta cidade para determiar se um projeto químico deverá ser costruído. A costrução é detro dos limites da cidade e por esta razão muitos eleitores do campo setem que o projeto passará por causa da grade proporção dos eleitores da cidade, os quais são favoráveis. Para determiar se existe difereça sigificate a proporção de eleitores da cidade e do campo a favor do projeto, uma amostragem foi feita. Se 0 de 00 eleitores da cidade são a favor do projeto e 40 de 500 eleitores do campo são a favor, você cocordaria que a proporção de eleitores da cidade favoráveis ao projeto é Marcia Oladoski Erbao Depto. de Iformática CEFET-PR

38 ESTATÍSTICA maior do que a proporção de eleitores do campo favoráveis ao projeto? Use α = 0,05. Solução : o ) H 0 : p = p H : p > p (uilateral) o ) α = 0,05 Região Crítica : R.A. 0,975 0,05,96 Z 3 o ) Cálculos : p $ = x p $ = x p $ = x + x + Assim : Z = = 0 00 = 0,6 = 40 00 = 0,48 = 0,6-0,48 0 + 40 00 + 500 = 0,5 0,5.0,49. + 00 500 = 9, 4 o ) Coclusão : Rejeitamos H 0 ( p = p ) e cocordamos que a proporção de eleitores da cidade favoráveis ao projeto é maior de que a proporção de eleitores do campo favoráveis ao projeto. Marcia Oladoski Erbao Depto. de Iformática CEFET-PR

ESTATÍSTICA 39 6.3. TESTE PARA DIFERENÇAS ENTRE DUAS MÉDIAS ( Variâcias Cohecidas ) Se µ e µ são as médias de duas populações, podemos testar a hipótese de que elas sejam iguais. O procedimeto é o seguite : o ) H 0 : µ = µ (µ - µ = 0) H : µ µ ( bilateral ) ou H : µ > µ ( uilateral à direita ) ou H : µ < µ ( uilateral à esquerda ) o ) A estatística a ser usada é X - X. X - X = N µ - µ, 3 o ) Fixado α e sob H 0 : σ σ + Z = X-X σ σ + R.A. α α / α / -z α/ z α/ Z 4 o ) Calculamos as médias X e X e o valor de Z. 5 o ) Rejeitamos H 0 se o valor de Z calculado cair a, caso cotrário aceitamos H 0. Marcia Oladoski Erbao Depto. de Iformática CEFET-PR

40 ESTATÍSTICA EXEMPLO Um experimeto foi realizado para comparar o desgaste abrasivo de dois diferetes materiais lamiados. A variâcia da medida do desgaste (codificado) é cohecida como sedo 6 para o material e 5 para o material. No experimeto, 0 peças do material foram testadas, expodo cada peça a uma máquia e medido o desgaste e 30 peças do material foram testadas da mesma forma. Em cada caso, a profudidade do desgaste foi observada. A amostra do material deu uma média (codificada) de 85 uidades, equato que a amostra do material deu uma média de 8. Teste, ao ível de sigificâcia de 0,0, a hipótese de que os dois tipos de materiais apresetam a mesma média de desgaste abrasivo. o ) H 0 : µ = µ H : µ µ (uilateral) o ) α = 0,0 Região Crítica : Z < = -,96 e Z >,96. 3 o ) Cálculos : X = 85 e X = 8, = 0 e = 30, σ = 4 e σ = 5. Z = X-X σ σ + = (85 8) / (6/0 + 5/30) = 3,98 4 o ) Coclusão : Rejeitamos H 0 e cocluímos, ao ível de 0% de sigificâcia, que as médias de desgaste abrasivo ão é a mesma para os dois tipos de materiais. O material apreseta uma média sigificativamete maior de desgaste do que o material. Marcia Oladoski Erbao Depto. de Iformática CEFET-PR