Estatística stica para Metrologia Aula Môica Barros, D.Sc. Juho de 28 Muitos problemas práticos exigem que a gete decida aceitar ou rejeitar alguma afirmação a respeito de um parâmetro de iteresse. Esta afirmação é chamada de hipótese estatística e o procedimeto de tomada de decisão é um teste de hipóteses. Muitos problemas reais podem ser formulados aturalmete como testes de hipóteses. Existe uma coexão muito próxima etre Itervalos de Cofiaça e. 2 Objetivo geral Iferir sobre os parâmetros descohecidos de uma população usado uma amostra (de tamaho possivelmete reduzido). Testar hipóteses é um problema que evolve a tomada de uma decisão. Evetualmete, após recolhermos (ou processarmos) a iformação cotida uma amostra, devemos chegar a uma coclusão sobre parâmetros ão observáveis relacioados à população que gerou aquela amostra. Qual o teste ideal? É aquele que sempre toma a decisão correta. É claro que isso é uma abstração, e ão existe a realidade. Na prática... Procuraremos limitar a probabilidade de um certo tipo de erro, mas ão se pode descartálo totalmete. 3 4
O Teste de ipóteses é um procedimeto em que procuramos testar uma hipótese iicial cotra uma alterativa. A primeira hipótese (hipótese iicial) é deomiada hipótese ula e represetada por. A seguda hipótese é chamada hipótese alterativa e represetada por a ou. Em geral a hipótese alterativa represeta uma cojectura ova a ser testada, e a hipótese ula represeta a situação usual, o "status quo". A partir dos dados observados, como podemos decidir sobre qual hipótese (ula ou alterativa) deverá ser rejeitada? A rejeição da hipótese ula implica a aceitação da hipótese alterativa e vice-versa. Não é possível aceitar (ou rejeitar) ambas as hipóteses simultaeamete. 5 6 O que é um teste de hipóteses? É qualquer regra usada para os levar à decisão sobre qual hipótese devemos aceitar. Podemos criar um úmero ifiito de testes de hipóteses, o problema é idetificar quais são os bos testes, e tetar obter um "algoritmo" para criar bos testes em diversas situações. Aqui estaremos cocetrados em obter testes de hipóteses para a média de distribuições. Costrução de um Teste de ipóteses Teste se T(x), uma fução apropriada dos X i s da amostra, está uma região especificada R. Do cotrário, se T(x) ão está a região R, ão rejeitamos a hipótese ula. A região R é chamada de região de rejeição ou região crítica. 7 8
Erros do Tipo I e II A partir do que foi observado a amostra podemos tomar a decisão de aceitar ou rejeitar e esta decisão ão é ecessariamete correta, como mostra a tabela a seguir. Decisão tomada Aceitar () (Aceitar ) Estado da realidade é verdadeira DECISÃO CORRETA Erro do tipo I () ( é falsa) é verdadeira ( é falsa) Erro do tipo II (β) DECISÃO CORRETA Erros do Tipo I e II A eficiêcia do teste pode ser medida através das probabilidades dos erros de tipo I e II. Idealmete gostaríamos que a probabilidade de icorrermos em qualquer tipo de erro fosse zero, mas isto ão é possível. Para um tamaho de amostra fixo também ão é possível fixarmos ambos os erros de tipo I e II. 9 Erros do Tipo I e II = Probabilidade de erro do tipo I = Pr{ rejeitar é verdadeira } = Pr{ T(x) a região crítica é verdadeira } é chamado de tamaho do teste ou ível de sigificâcia do teste. β = Probabilidade de erro do tipo II β = Pr{ aceitar éfalsa } β = Pr{ T(x) fora da região crítica éfalsa } Potêcia de um Teste Potêcia do teste (ou poder do teste) - β = - Probabilidade de erro do tipo II - β = Pr{ rejeitar éfalsa } Ou seja, a potêcia do teste é a probabilidade de uma decisão correta! Idealmete, a potêcia de um teste seria sempre alta, mas isso ão é sempre verdade. 2
Fução Potêcia Defie-se a fução potêcia como: K(θ) ) = Pr{ rejeitar o valor do parâmetro é θ} O que é uma boa fução potêcia? Se θ está a região da hipótese ula, a fução potêcia deve ser pequea (pois ão queremos rejeitar quado ela é verdadeira). Ao cotrário, se θ estiver a região ode a hipótese alterativa é válida, gostaríamos que a fução potêcia fosse alta. Fução Característica de Operação (OCC) É defiida como: J(θ) = K(θ) = Pr{ aceitar o valor do parâmetro é θ } Note que, ambas K(θ) e J(θ) são probabilidades, e portato limitadas ao itervalo [,]. A OCC é muito utilizada em Cotrole de Qualidade, mas ão falaremos mais dela aqui este curso. 3 4 - ituição Supoha que temos uma amostra de tamaho 25 de uma Normal com variâcia cohecida e desejamos testar as seguites hipóteses: : μ = 2 : μ > 2 O que a ossa ituição os diz? A média amostral, X, é um bom estimador de μ, e portato deve trazer evidêcia sobre qual hipótese ( ou ) é verdadeira. Imagie que observamos X = 5. Dados os parâmetros ( = 25 e variâcia ), este parece um úmero bem exagerado, e etão deve ser falsa. Logo, a ossa ituição parece apotar para a seguite regra de decisão: - ituição Devemos rejeitar se X é grade. Ou seja, a região crítica tem a forma: R = { X k} A questão que surge agora é: como escolher a costate k? Uma possibilidade é arbitrar o máximo erro do tipo I, ou seja, a maior probabilidade de rejeitar quado é verdadeira. 5 6
- ituição Mas, esta probabilidade pode ser escrita em termos da fução potêcia. Supoha que FIXAMOS, a probabilidade do erro do tipo I, isto é: = { é Verdadeiro} = Por exemplo: Pr = Pr{ X k μ = 2} = Pr k 2 = Φ 2 k z (da N(,)) % 6.65 2.33 5% 5.29.64 % 4.56.28 X 2 / 25 k 2 / 25 = k a tabela ao lado é o valor a partir do qual rejeita-se a hipótese ula 7 - ituição Vamos ver a fução potêcia em cada um dos casos ateriores % 9% 8% 7% 6% 5% 4% 3% 2% % % Fuções Potêcia para Diversos Valores de Alfa 2. 2.5 3. 3.5 4. 4.5 5. 5.5 6. 6.5 7. 7.5 8. 8.5 9. 9.5..5..5 2. 2.5 k(mu) - alfa = % k(mu) - alfa = 5% k(mu) - alfa = % 8 - ituição Coclusões Se é muito pequeo (erro do tipo I muito pequeo, p.ex., %), a região de rejeição exige um valor de k muito grade para rejeitar a hipótese ula este caso, e a fução potêcia demora muito a crescer. À medida que passamos a aceitar erros do tipo I maiores (por ex, 5% ou %, a fução potêcia já começa a rejeitar a hipótese ula com mais facilidade, pois o valor de k dimiui. - ituição Coclusões A título de exemplo, se o valor de μ fosse 5 (e a hipótese ula decididamete falsa!), as probabilidades de rejeição usado as fuções potêcia do exemplo seriam 2.4%,44.8% e 58.7% respectivamete. 9 2
ui-caudais E agora, o que acotece se estedemos o osso teste de hipótese para: : μ 2 : μ > 2 A resposta é: basicamete ada! Por que? Cosidere a fução potêcia para valores de μ detro da hipótese ula estes valores estarão abaixo do especificado. O próximo gráfico mostra esta idéia para a fução potêcia com k = 5.29 (isto é, = 5%) 2 ui-caudais.% 95.% 9.% 85.% 8.% 75.% 7.% 65.% 6.% 55.% 5.% 45.% 4.% 35.% 3.% 25.% 2.% 5.%.% 5.%.% A partir deste poto a hipótese ula começa a ser falsa - logo, alfa = 5% é o MAIOR erro do tipo I cometido quado a hipótese ula é verdadeira Fução Potêcia com alfa = 5% 5. 4.5 4. 3.5 3. 2.5 2..5..5. 9.5 9. 8.5 8. 7.5 7. 6.5 6. 5.5 5. 4.5 4. 3.5 3. 2.5 2..5..5. -.5 -. -.5-2. -2.5-3. -3.5-4. mu 22 ui-caudais Geeralização Supoha que desejamos testar as seguites hipóteses: : μ μ : μ > μ O teste tem exatamete a forma descrita ates, em que a região de rejeição é: R = { X k} ui-caudais Como escolher k? Através do erro do tipo I (), previamete especificado, que leva às seguites receitas de bolo : se: X μ σ > z X > μ + z σ cohecido σ X μ > z s X > μ + z s σ descohecido e usado a hipótese de uma amostra grade, o que possibilita o uso da Normal 23 24
ui-caudais O ível de sigificâcia de um teste () é defiido como a maior probabilidade de rejeição de quado é verdadeira. Ou seja, o ível de sigificâcia é o maior erro do tipo I cometido pelo teste. No exemplo aterior, é apeas o valor da fução potêcia em μ = 2. ui-caudais Supoha que agora desejamos testar as seguites hipóteses: : μ μ : μ < μ Pelos mesmos argumetos que o teste aterior, faz setido rejeitar a hipótese ula quado a média amostral for pequea. O que é um valor pequeo? Vai depeder do ível de sigificâcia especificado para o teste, ou seja, do erro máximo do tipo I. 25 26 ui-caudais Receita de Bolo se: X σ X s μ μ < z X < μ. < z X z < μ z. σ s σ cohecido σ descohecido Estes testes são válidos para amostras Normais com variâcia cohecida ou para amostras ão ecessariamete Normais de tamaho GRANDE e σ descohecido. Note que estamos usado z, que é um poto obtido da tabela N(,). 27 ui-caudais Exemplo Uma empresa produz café em pó em embalages de kg. O gerete de produção deseja saber se as embalages realmete possuem em média kg do produto e decidiu realizar um teste. Ele retirou uma amostra de 5 embalages e obteve uma um peso médio de,985 kg de produto. Iformações ateriores a respeito da quatidade de produto por embalagem idicaram um desviopadrão de,75 kg. O gerete deseja saber, com um ível de sigificâcia de % se o coteúdo de cada embalagem é de, o míimo, kg. 28
Teste de ipóteses ui-caudais Teste de ipóteses ui-caudais Solução: As hipóteses ula e alterativa para o teste são: a : μ : μ < Para = %, o valor de z é (a partir da tabela ormal) de 2.33. A região de rejeição é: se X μ z σ.75. X - 2.33 5 =.975 Como a média m amostral (,985) ão é meor que.975, a hipótese ula ão pode ser rejeitada. Se σ ão fosse cohecido, deveríamos utilizar o desvio-padrão da amostra s. 29 A região crítica do teste aterior é: se X.975 A fução potêcia deste teste é etão: K( μ ) = ( a média é μ ) = = Pr ( X <.975 μ ) = Pr Z < = Φ Pr = Pr.975 μ 5 = Φ.75 ( 94.28(.975 μ )) X μ.975 μ 5 < 5 =.75.75.975 μ.975 μ 5 = Φ 5 =.75.75 3 Teste de ipóteses ui-caudais Valor de p ( p( p value ) Pela magitude dos úmeros evolvidos (tamaho da amostra grade e desvio padrão pequeo) é ituitivo perceber que qualquer pequea variação a média amostral levará a grades oscilações da fução potêcia, o que pode ser cofirmado o próximo gráfico. % 95% Fução Potêcia - Alfa = % Muitos softwares estatísticos calculam e exibem o p-value, que é a probabilidade de que a estatística de teste teha valor pelo meos tão extremo (muito grade ou muito pequeo) quato o valor ecotrado a amostra. 9% 85% 8% 75% 7% 65% 6% 55% O valor-p (p-value) idica o meor ível de sigificâcia que levaria à rejeição da hipótese ula. 5% 45% 4% 35% 3% 25% 2% 5% % 5% % Por exemplo, se o p-value é.4, a hipótese seria rejeitada com ível 5%, mas ão com ível %..9.9.92.93.94.95.96.97.98.99...2.3.4.5.6.7.8.9. 3 32
ui-caudais Uma outra forma para realizar o teste de hipótese é através do p value. A hipótese ula é rejeitada se essa probabilidade ( p value ) for meor que o ível de sigificâcia defiido para o teste se "p value" < Agora vamos desevolver um teste de hipótese bi-caudal, para uma amostra grade ( 3) e σ da população cohecido a : μ = μ : μ μ O ível de sigificâcia é tal que, se a hipótese ula for falsa, queremos ter uma probabilidade máxima m de aceitá-la, isto é,, queremos cometer uma probabilidade especificada de erro do tipo I. 33 34 Mas, ituitivamete, qual a cara da região crítica? Devemos rejeitar quado estivermos loge de μ, ou seja, quado o módulo da média amostral estiver muito distate de μ. Supoha iicialmete que a hipótese ula seja verdadeira. Para uma amostra grade, podemos cosiderar a distribuição da média amostral como praticamete Normal (pelo teorema cetral do limite). Agora, dado um ível de sigificâcia, devemos cosiderar dois valores de Z Um, abaixo do qual há uma probabilidade /2 da média de uma amostra estar localizada ( z /2 ) Outro, acima do qual há uma probabilidade /2 da média de uma amostra estar localizada (z /2 ) A regra de rejeição é: X μ se Z = < z / 2 ou Z > z σ / 2 35 36
Ou seja, em termos da média amostral, a região crítica pode ser descrita como: σ σ se X < μ z / 2 ou se X > μ + z / 2 Isto é, rejeita-se a hipótese ula se a média amostral estiver loge de μ. Note que, aalogamete ao teste ui-caudal, é o ível de sigificâcia do teste, isto é, o maior erro do tipo I. 37 Mas, como aqui rejeita-se a hipótese ula dos dois lados, o poto usado da Normal éz /2 e ão z (que era usado os testes ui- caudais), de tal forma que Pr(Z > z /2 ) = /2. Receita de Bolo potos percetuais da distribuição N(,) para testes bi-caudais Testes Bi-caudais z % 2.576 5%.96 %.645 38 Exemplo Um fabricate de autopeças utiliza esferas de aço a fabricação de rolametos. Essas esferas devem ter um diâmetro de 2 mm, caso cotrário os rolametos ão atigem as especificações exigidas. Uma amostra de 3 rolametos escolhidos ao acaso foreceu um diâmetro médio de,45 mm e um desvio-padrão de mm. Pode-se dizer que o diâmetro médio m dos rolametos utilizados é igual a 2 mm com um ível de sigificâcia de 5%? 39 Solução: este é um teste de hipótese bi-caudal, com =.5, ode: : μ = 2 : μ 2 a Para =,5, z /2 =,96 Para X =,45mm, temos: X μ.45 2 Z = = = 3. σ / / 3 E portato podemos rejeitar a hipótese ula. Note que rejeitar a hipótese ula para Z < -,96 é completamete equivalete à rejeitá-la para: X <2.96 3 4
A região crítica este exemplo é: se X < 2.96 ou se X > 2 3 Isto é, rejeitar se : X <.64 ou X > 2.36 A fução potêcia é, este caso (verifique!): +.96 3 % 95% 9% 85% 8% 75% 7% 65% Fução Potêcia - Teste bi-caudal K ( μ ) = Φ ( ) 2 μ.96 + Φ ( 2 μ ) +. 96 3 O gráfico desta fução potêcia é mostrado a próxima págia. Note que a potêcia (probabilidade de rejeitar a hipótese ula) cresce à medida que os afastamos de μ = 2 e, em μ = 2, o valor da fução potêcia é exatamete o erro do tipo I, estipulado em 5%. 3 6% 55% 5% 45% 4% 35% 3% 25% 2% 5% % 5% %...2.3.4.5.6.7.8.9...2.3.4.5.6.7.8.9 2. 2. 2.2 2.3 2.4 2.5 2.6 2.7 2.8 2.9 3. 4 42 Teste de hipótese amostra pequea Até o mometo, cosideramos o caso de uma amostra grade ( 3) Para < 3 existem as seguites possibilidades: A população é Normal e σ é cohecido: utilizamos o mesmo procedimeto que para o caso de 3, com σ cohecido (use a distribuição Normal) A população é ormalmete distribuída e σ ão é cohecido: utilizamos o mesmo procedimeto que para o caso de 3, utilizado s como estimador de σ e a distribuição t ao ivés da Normal A população ão é ormalmete distribuída: aumetamos o tamaho da amostra pois ão é possível usar uma aproximação Normal. 43 Teste de hipótese amostra pequea Exemplo Uma revista decidiu realizar uma pesquisa sobre a qualidade de serviço em grades aeroportos ao redor do mudo. O ível de serviço de um aeroporto é cosiderado superior se a ota obtida é igual ou superior a 7. Para o aeroporto de eathrow, em Lodres, foram etrevistadas 2 pessoas que atribuíram as seguites otas: 7, 8,, 8, 6, 9, 6, 7, 7, 8, 9, e 8. Determie, com um ível de sigificâcia de 5%, se o serviço do aeroporto de eathrow pode ser cosiderado superior. Supoha que a população é ormalmete distribuída. 44
Teste de hipótese amostra pequea Solução: As hipóteses ula e alterativa para o teste são: : μ < 7 a : μ 7 Com uma população ormal, < 3 e σ descohecido, utilizaremos s e a distribuição t com graus de liberdade para o teste. A média da amostra é 7,75 e s =,25 O valor de t para o teste é,796 A regra de rejeição é: x μ 7,75 7 Rejeita se t = > t t = = 2,4 > t =,796 s,25 2 Logo, existe evidêcia para rejeitar a hipótese ula! 45 Teste de hipótese amostra pequea Exemplo istoricamete, a comissão média paga por pessoas físicas para operações em bolsa de valores através de iteret uma corretora é R$5. Neste mês você fez uma pesquisa com 6 clietes da corretora e otou que a comissão média foi de R$ e o desvio padrão R$ 6. Com ível de sigificâcia %, há evidêcia para afirmar que a comissão este mês foi mais baixa que historicamete? E com ível de sigificâcia 5%? Supoha que os valores pagos são Normalmete distribuídos. 46 Teste de hipótese amostra pequea Desejamos testar as hipóteses: : μ = 5 : μ < 5 A região crítica tem a forma: rejeitar se a média amostral é pequea, e como o tamaho da amostra é pequeo devemos usar a distribuição t de Studet. s μ Ou seja : se X se X 5 -t se X 5 t t,, 5,. 6 (.5) 47. 6 Teste de hipótese amostra pequea Do Excel: Para o teste com ível 5% usamos t 5,.5 = INVT(.,5) =.753 Para o teste com ível % usamos t 5,. = INVT(.2,5) = 2.62 Região crítica a 5%: s μ Ou seja : se X se X 5 -t se X 5 t t,, 5,. 6 (.5) 48. 6