PROBABILIDADE E ESTATÍSTICA Profa. Dra. Yara de Souza Tadano yaratadano@utfpr.edu.br
Aula 8 11/2014 Distribuição Normal
Vamos apresentar distribuições de probabilidades para variáveis aleatórias contínuas. Para ilustrar a correspondência entre área e probabilidade, vamos aprender as Em seguida, as., que ocorrem frequentemente em aplicações reais e têm papel importante nos métodos de inferência estatística. Probabilidade e Estatística 3/41
Distribuição Normal Se uma variável aleatória contínua tem uma distribuição com um gráfico simétrico e em forma de sino, e que pode ser descrito pela equação a seguir, dizemos que ela tem Depende apenas de µ e σ y = e 1" x µ % $ ' 2# σ & σ 2π 2 Probabilidade e Estatística 4/41
Distribuição Normal Padrão A tem as seguintes propriedades: 1. Seu gráfico tem forma de sino; 2. Sua média é igual a 0 (µ = 0); 3. Seu desvio-padrão é igual a 1 (σ = 1). Probabilidade e Estatística 5/41
Distribuições Uniformes O foco será o estudo da Distribuição de Probabilidade Normal, porém iremos começar com a, que nos dará informações para compreender estas duas propriedades importantes: 1. A área sob o gráfico de uma distribuição de probabilidades é igual a 1; 2. Há uma correspondência entre área e probabilidade (ou frequência relativa), de modo que algumas propriedades podem ser encontradas pela identificação das áreas correspondentes. Probabilidade e Estatística 6/41
Distribuição Uniforme Uma variável aleatória contínua tem uma se seus valores se espalham uniformemente sobre a faixa de valores possíveis. O gráfico de uma Distribuição Uniforme resulta em uma forma retangular. Probabilidade e Estatística 7/41
EXEMPLO A companhia de Energia fornece eletricidade com níveis de voltagem que são uniformemente distribuídos entre 123 e 125 volts. Isto é, qualquer quantidade de voltagem entre 123 e 125 volts é possível, e todos os possíveis valores são equiprováveis. Se selecionamos aleatoriamente um dos níveis de voltagem e representarmos seu valor pela variável aleatória x, então x tem uma distribuição que tem um gráfico como: Probabilidade e Estatística 8/41
EXEMPLO Um gráfico de uma distribuição de probabilidade contínua, como este, é chamado de. Probabilidade e Estatística 9/41
EXEMPLO Dada a distribuição uniforme do nível de voltagem, ache a probabilidade de que um nível de voltagem selecionado aleatoriamente seja maior do que 124,5 volts. Probabilidade e Estatística 10/41
Curva de Densidade Uma curva de densidade deve satisfazer os seguintes requisitos: 1. A área sob a curva tem que ser igual a 1. 2. Cada ponto na curva tem que ter uma altura vertical maior ou igual a 0, ou seja, a curva não pode estar abaixo do eixo x. Probabilidade e Estatística 11/41
Área Probabilidade Como a área total sob a curva de densidade é igual a 1, existe uma correspondência entre e. No caso da Distribuição Uniforme, a área abaixo da curva, que é facilmente calculada por: Área = Base Altura, corresponderá à probabilidade referente a esta área. Probabilidade e Estatística 12/41
Área Probabilidade Como a curva de densidade de uma Distribuição Normal tem a forma de sino, é mais difícil acharmos a área, porém o princípio básico é o mesmo: Há uma correspondência entre e Probabilidade e Estatística 13/41
Distribuição Normal Padrão A distribuição normal padrão é uma distribuição de probabilidade normal com média µ = 0 e desvio-padrão σ = 1, e a área total sob a curva de densidade é 1. -3-2 -1 0 1 2 3 Escore z Probabilidade e Estatística 14/41
Distribuição Normal Padrão Não é fácil a determinação de áreas para a curva de densidade da distribuição normal padrão, então necessitamos de valores já calculados previamente e que constam na seguinte tabela: Probabilidade e Estatística 15/41
Distribuição Normal Padrão Ao usar a Tabela da distribuição normal padrão, temos que: 1. A tabela refere-se apenas à, que tem média 0 e desvio padrão 1; 2. A tabela é apresentada em duas páginas, uma para e a outra para ; 3. Cada valor no corpo da tabela é a até uma reta vertical sobre um valor específico do escore z; Probabilidade e Estatística 16/41
Distribuição Normal Padrão 4. Ao trabalhar com um gráfico, entre escores z e áreas. Escore z Distância na escala horizontal da distribuição normal padrão; refere-se à coluna à esquerda e à linha do topo da tabela. Área Região sob a curva; refere-se aos valores no corpo da tabela. Probabilidade e Estatística 17/41
Distribuição Normal Padrão z,00,01-3,4 0,0003 0,0003-3,3 0,0005 0,0005-3,2 0,0007 0,0007-3,1 0,0010 0,0009 Área Probabilidade e Estatística 18/41
EXEMPLO 1 Uma companhia de instrumentos científicos de precisão fabrica termômetros que devem informar temperaturas de 0 o C no ponto de congelamento da água. Testes em uma grande amostra desses instrumentos revelam que, no ponto de congelamento da água, alguns termômetros indicam temperaturas abaixo de 0 o C e alguns dão temperaturas acima de 0 o C. Suponha que a leitura média seja 0 o C e que o desvio-padrão das leituras seja 1,00 o C. Suponha, também, que as leituras sejam normalmente distribuídas. Se um termômetro é selecionado aleatoriamente, ache a probabilidade de que, no ponto de congelamento da água, a leitura seja menor que 1,27 o C. Probabilidade e Estatística 19/41
EXEMPLO 1 Gostaríamos de saber agora, qual a probabilidade de selecionarmos aleatoriamente um termômetro que apresente leitura (no ponto de congelamento da água) superior a -1,23 o C. Agora, determine a probabilidade de selecionarmos aleatoriamente um termômetro que apresente letirua (no ponto de congelamento da água) entre -2,00 o C e 1,50 o C. Probabilidade e Estatística 20/41
O último resultado do exemplo 1, pode ser generalizado como a seguinte regra: A área correspondente à região entre dois escores z específicos pode ser encontrada achando-se. Probabilidade e Estatística 21/41
Com uma distribuição de probabilidade contínua, tal como a distribuição normal, a probabilidade de se obter qualquer valor único exato é 0 (P(z=a) = 0). De modo que: P (a z b) = P (a < z < b) Então, a probabilidade de se obter um escore z no é igual à probabilidade de se obter um escore z. Probabilidade e Estatística 22/41
Escores z Áreas conhecidas Em muitos casos, temos que: Dada uma área (ou probabilidade), achar o escore z correspondente. Probabilidade e Estatística 23/41
Escores z Áreas conhecidas Procedimento para a determinação de um Escore z a partir de uma área conhecida. 1. Desenhe uma curva em forma de sino e identifique a região sob a curva que corresponde à probabilidade dada. Se a região não é uma região acumulada à esquerda, trabalhe com regiões conhecidas que sejam regiões acumuladas à esquerda. 2. Usando a área acumulada à esquerda, localize a probabilidade mais próxima no corpo da tabela da distribuição normal padrão e identifique o escore z correspondente. Probabilidade e Estatística 24/41
Escores z Áreas conhecidas Se um valor desejado de área o valor ; Se um valor está a tabela, selecione o ; na tabela, selecione entre dois valores da Para escores z, podemos usar como uma aproximação para a área acumulada à esquerda; Para escores z, podemos usar como uma aproximação para a área acumulada à esquerda. Probabilidade e Estatística 25/41
EXEMPLO 2 Use os mesmos termômetros do exemplo anterior, com leituras de temperatura no ponto de congelamento da água normalmente distribuídas, com média de 0 o C e desviopadrão de 1 o C. Ache a temperatura correspondente a P 95, o 95 o percentil. Isto é, ache a temperatura que separa os 95% inferiores dos 5% superiores. Ache, agora, as temperaturas separando os 2,5% inferiores e os 2,5% superiores. Probabilidade e Estatística 26/41
Valores Críticos Para uma distribuição normal, um valor crítico é um escore z na fronteira que separa os escores z que têm ocorrência provável daqueles que têm ocorrência improvável. Valores críticos comuns são z = -1,96 e z = 1,96. Os valores abaixo de 1,96 são improváveis de acontecer, pois ocorrem em apenas 2,5% dos dados, e os valores acima de z = 1,96 também são improváveis de acontecer, pois também ocorrem em apenas 2,5% das leituras. Probabilidade e Estatística 27/41
Valores Críticos Na expressão z α, faça α = 0,025 e ache o valor de z 0,025. A notação de z 0,025 é usada para representar o escore z com uma área de 0,025 à sua direita. Recorrendo à tabela da distribuição normal, podemos observar que z 0,025 = 1,96. Probabilidade e Estatística 28/41
Valores Críticos Para encontrar o valor de z α, usando a tabela de distribuição normal padrão, use o valor 1 α. Probabilidade e Estatística 29/41
Aplicações da distribuição normal É pouco comum encontrarmos situações que seguem uma distribuição normal padrão. As distribuições normais típicas envolvem médias diferentes de 0 e desvios-padrão diferentes de 1. Nestes casos, devemos ser capazes de encontrar probabilidades correspondentes a valores da variável x e, dado algum valor de probabilidade, devemos ser capazes de encontrar o valor correspondente da variável x. Probabilidade e Estatística 30/41
Aplicações da distribuição normal Para trabalhar com distribuições normais não padronizadas, simplesmente iremos padronizar os valores para usar os mesmo procedimentos aprendidos até aqui. Se convertermos valores para escores z padronizados usando a fórmula a seguir, os procedimentos usados serão os mesmos usados para a distribuição normal padrão. z = x µ σ Arredonde os escores z para 2 casas decimais Probabilidade e Estatística 31/41
Aplicações da distribuição normal Procedimento para achar áreas com uma distribuição normal não padronizada: 1. Esboce a curva normal, marque a média e os valores específicos de x e, então, sombreie a região que representa a probabilidade desejada; 2. Para cada valor relevante de x que representa um limite da região sombreada, converta o valor em seu escore z equivalente; 3. Consulte a tabela para achar a área da região sombreada. Probabilidade e Estatística 32/41
EXEMPLO 3 Uma porta típica de uma casa tem uma altura de 2 metros. Dado que as alturas de homens são normalmente distribuídas, com média de 1,725 m e desvio-padrão de 7 cm,. Ache a porcentagem de homens que passarão por uma portapadrão sem se curvar e sem bater a cabeça. Essa porcentagem é alta o bastante para que se continue a usar 2 metros como padrão de altura? Probabilidade e Estatística 33/41
EXEMPLO 3 O valor do escore z é 3,93, dando uma área de 0,9999. Conclui-se que a proporção de homens que podem passar pelas portas com altura-padrão de 2 m é 0,9999 ou 99,99%. Muitos poucos homens não poderão passar sem abaixarem ou baterem a cabeça. Essa porcentagem é alta o suficiente para justificar o suo de 2 m como altura-padrão para portas. Probabilidade e Estatística 34/41
EXEMPLO 4 Os pesos ao nascer nos Estados Unidos são distribuídos normalmente, com média de 3420 g e desvio-padrão de 495 g. O Hospital Geral de Newport exige tratamento especial para bebês que nasçam com menos de 2450 g (não usualmente leves) ou mais de 4390 g (não usualmente pesados). Qual é a porcentagem de bebês que não requerem tratamento especial por terem pesos ao nascer entre 2450 g e 4390g? Sob essas condições, muitos bebês precisam de cuidados especiais? Probabilidade e Estatística 35/41
EXEMPLO 4 Expressando o resultado em porcentagem, podemos concluir que 95% dos bebês não exigem cuidados especiais por terem pesos entre 2450 g e 4390 g. Segue que 5% dos bebês requerem tratamento especial por serem não usualmente leves ou pesados. A taxa de 5%, provavelmente, não é muito alta para hospitais típicos. Probabilidade e Estatística 36/41
Áreas conhecidas Não confunda escores z e áreas; Escolha o lado correto (direito/esquerdo) do gráfico; Um escore z tem que ser negativo sempre que se localizar na metade esquerda da distribuição normal; Áreas (ou probabilidades) são valores positivos ou nulos, mas NUNCA negativos. Probabilidade e Estatística 37/41
Áreas conhecidas Procedimento para achar valores a partir de áreas conhecidas 1. Esboce o gráfico da distribuição normal, introduza a probabilidade ou porcentagem dada na região apropriada do gráfico e identifique o(s) valor(es) x de interesse; 2. Use a Tabela para achar o escore z correspondente à área mais próxima e, em seguida, identifique o escore z correspondente; Probabilidade e Estatística 38/41
Áreas conhecidas 3. Usando a fórmula de conversão de valores para escore z, encontre o valor de x; z = x µ σ 4. Consulte o esboço da curva para verificar se a solução faz sentido no contexto do gráfico e no contexto do problema. Probabilidade e Estatística 39/41
EXEMPLO 5 No planejamento de um ambiente, um critério comum é que se ajuste a 95% da população. Qual a altura de uma porta se 95% dos homens devem passar por ela sem se abaixar e sem bater a cabeça? Isto é, ache o 95 º percentil das alturas dos homens, que são normalmente distribuídas, com média de 1,75m e desviopadrão de 0,07 m. Probabilidade e Estatística 40/41
EXEMPLO 5 O resultado é: x = 1,87 m. Isto significa que uma altura de porta de 1,87 permitiria que 95% dos homens passassem sem se curvar ou bater a cabeça. Assim, 5% dos homens não passariam por uma porta com altura de 1,87 m. Como muitos homens passam por portas com muita frequência, esta taxa de 5%, provavelmente, não seria prática. Probabilidade e Estatística 41/41
EXEMPLO 6 O Hospital Geral de Newport deseja redefinir os pesos ao nascer mínimo e máximo que exigem tratamento especial por serem não usualmente baixos ou altos. Depois de considerar fatores relevantes, um comitê recomenda um tratamento especial para os 3% inferiores e os 1% superiores dos pesos ao nascer. Ajude o comitê a identificar os pesos ao nascer que separam os 3% inferiores e os 1% superiores. Os pesos ao nascer, nos Estados Unidos, são normalmente distribuídos, com média de 3420 g e desvio-padrão de 495g. Probabilidade e Estatística 42/41
EXEMPLO 6 O Resultado nos indica que: O peso ao nascer de 2489 g (arredondado) separa os 3% inferiores dos pesos ao nascer, e 4573 (arredondado) separa o 1% superior dos pesos ao nascer. Agora, o hospital tem critérios bem definidos para determinar se um bebê recém-nascido deve receber tratamento especial relativo a um peso ao nascer não usualmente baixo ou alto. Probabilidade e Estatística 43/41