Distribuições de Probabilidade Departamento de Matemática Escola Superior de Tecnologia de Viseu (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 1 / 31 Introdução Introdução Já vimos como caracterizar a distribuição de probabilidades de uma variável aleatória. Vamos estudar alguns tipos particulares de distribuições de probabilidades usadas numa grande diversidade de aplicações estatísticas. Distribuições discretas: distribuição de Bernoulli distribuição Binomial distribuição de Poisson Distribuições contínuas: distribuição Normal distribuição Lognormal (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 2 / 31
Distribuições Discretas Distribuição de Bernoulli Prova de Bernoulli Prova de Bernoulli Uma experiência aleatória que tem apenas dois resultados possíveis: S = Sucesso F = Fracasso é uma prova de Bernoulli, onde p = P(S) e q = 1 p = P(F) (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 3 / 31 Distribuições Discretas Distribuição de Bernoulli Distribuição de Bernoulli Seja X a v.a. que assume dois valores: o valor 1 quando o resultado da prova de Bernoulli é sucesso eovalor 0 quando o resultado é fracasso. Então a função de probabilidade de X é dada por: x 0 1 f X (x) 1 p p ou por f X (x) = { p x (1 p) 1 x, x = 0, 1 0, c.c. Definição Uma v.a. discreta com função de probabilidade assim definida diz-se que tem distribuição de Bernoulli de parâmetro p (0 p 1) E(X) =p Var (X) =p(1 p) =pq (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 4 / 31
Distribuições Discretas Considere-se a experiência aleatória caracterizada pelo seguinte: realizam-se n provas de Bernoulli em idênticas condições; cada prova tem apenas dois resultados possíveis: sucesso ou fracasso ; as provas são independentes umas das outras, isto é, o resultado de cada prova não influencia os resultados das restantes; as probabilidades de sucesso, p, e de fracasso, q = 1 p, mantêm-se inalteradas de prova para prova. (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 5 / 31 Distribuições Discretas Definição Seja X on o de sucessos obtidos em n provas de Bernoulli. Então X tem distribuição Binomial de parâmetros n e p e a sua função de probabilidade é dada por: ( ) n p f X (x) = x x (1 p) n x, x = 0, 1, 2,..., n 0, c.c. Abreviadamente escreve-se: X B(n, p) E(X) =np Var (X) =np(1 p) =npq (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 6 / 31
Distribuições Discretas Exemplo OLuís joga o seguinte jogo: escolhe, ao acaso, um número de 1a6e em seguida lança 3 vezes um dado equilibrado com as faces numeradas de 1a6.Seonúmero escolhido pelo Luís sai x vezes (num total de 3 lançamentos) ele ganha x Euros. Em contrapartida, se onúmero escolhido pelo Luís nunca ocorre então ele perde 5 Euros. Determine o ganho médio do Luís ao jogar este jogo. Pretende-se calcular o valor esperado da v.a. Y Ganho do Luís (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 7 / 31 Distribuições Discretas Exemplo - cont. Considere-se também a v.a. X n o de vezes que ocorre o n o escolhido pelo Luís, em 3 lançamentos Cada lançamento é uma prova de Bernoulli onde o sucesso é: S saion o escolhido pelo Luís e a probabilidade de sucesso p = P(S) = 1 6 Então, X B(3, 1/6) (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 8 / 31
Exemplo - cont. Distribuições Discretas Para já vamos calcular a probabilidade de, em 3 lançamentos do dado, o n o escolhido pelo Luís ocorrer 2 vezes, i.e., P(X = 2). Sejam S i ocorre o n o escolhido pelo Luís no i ésimo lançamento F i não ocorre o n o escolhido pelo Luís no i ésimo lançamento De quantas maneiras pode ocorrer o acontecimento {X = 2}? i.e., num total de 3 lançamentos, de quantas maneiras se pode obter 2 vezeson o escolhido pelo Luís? ( 3 2 ) = 3 Então, P(X = 2) = P(SSF )+ P(SFS)+ P(FSS) S 1 S 2 F 3 SSF S 1 F 2 S 3 SFS F 1 S 2 S 3 FSS (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 9 / 31 Distribuições Discretas Exemplo - cont. Uma vez que os lançamentos são independentes, tem-se P(SSF) =P(S 1 S 2 F 3 )=P(S 1 )P(S 2 )P(F 3 )=p 2 (1 p) 1 = P(SFS) =P(S 1 F 2 S 3 )=P(S 1 )P(F 2 )P(S 3 )=p 2 (1 p) 1 = P(FSS) =P(F 1 S 2 S 3 )=P(F 1 )P(S 2 )P(S 3 )=p 2 (1 p) 1 = Logo, ( ) 2 1 5 6 6 ( ) 2 1 5 6 6 ( ) 2 1 5 6 6 P(X = 2) =P(SSF )+P(SFS)+P(FSS) =3 p 2 (1 p) 1 = 3 ( ) 2 1 5 6 6 ( ) 3 onde, 3 = éon 2 o de maneiras diferentes de se obterem 2 sucessos em 3 provas de Bernoulli e p 2 (1 p) é a probabilidade que corresponde a cada uma delas. (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 10 / 31
Exemplo - cont. Distribuições Discretas Determinemos agora a função de probabilidade da v.a. Y. P(Y = 5) =P(X = 0) = ( 3 0 ( 3 P(Y = 1) =P(X = 1) = 1 ( 3 P(Y = 2) =P(X = 2) = 2 ( 3 P(Y = 3) =P(X = 3) = 3 )( ) 0 1 6 ( ) 3 5 = 0.5787 6 )( ) 1 ( ) 2 1 5 = 0.3472 6 6 )( ) 2 ( ) 1 1 5 = 0.0694 6 6 )( ) 3 ( ) 0 1 5 = 0.0046 6 6 y 5 1 2 3 f Y (y) 0.5787 0.3472 0.0694 0.0046 E(Y )= 5 0.5787 + 1 0.3472 + 2 0.0694 + 3 0.0046 = 2.3937 (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 11 / 31 Distribuições Discretas A distribuição de Poisson é usada para tratar fenómenos aleatórios que envolvem a contagem de ocorrências num dado intervalo, geralmente de tempo ou de espaço. Exemplos n o de chamadas telefónicas recebidas por uma empresa numa hora; n o de nós existentes num metro de tecido de uma peça acabada de fabricar; n o de clientes que entra numa loja de conveniência no período de almoço; n o de acidentes que ocorrem na A25 numa semana; n o de peixes doentes num metro quadrado de área de uma baía poluída. (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 12 / 31
Distribuições Discretas Nem todos os fenómenos de contagem de ocorrências podem ser convenientemente modelados usando a distribuição de Poisson. No entanto, se: o número de ocorrências em determinado intervalo é independente do número de ocorrências noutro intervalo qualquer, não coincidente com o primeiro; a probabilidade de haver x ocorrências num intervalo de amplitude t, depende exclusivamente do n o x e da amplitude t. Isto é, considerando dois intervalos distintos mas com a mesma amplitude, são iguais as probabilidades de se registarem x ocorrências em cada um; a probabilidade de mais de uma ocorrência num intervalo suficientemente pequeno é aproximadamente igual zero, portanto desprezável; a probabilidade de haver exactamente uma ocorrência num intervalo suficientemente pequeno é aproximadamente proporcional ao tamanho do intervalo então, o número de ocorrências num intervalo qualquer de amplitude t, é uma variável aleatória X com distribuição de Poisson (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 13 / 31 Distribuições Discretas Se X tem distribuição de Poisson de parâmetro µ então a função de probabilidade de X é dada por { e µ µ x f X (x) = x!, x=0,1,2,... 0, outros valores Escreve-se abreviadamente X Po(µ) A média e a variância desta distribuição são iguais ao parâmetro µ: E(X) =µ e Var (X) =µ (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 14 / 31
Distribuições Discretas Sendo X n o de ocorrências num intervalo de amplitude t Se X tem distribuição de Poisson e se λ éonúmero médio de ocorrências por unidade, então µ = λt éonúmero médio de ocorrências num intervalo de amplitude t. Assim, f X (x) = e µ µ x x! = e λt (λt) x x!, x = 0, 1, 2, 3,... (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 15 / 31 Distribuições Discretas Exercício Suponhamos que os clientes entram num armazém àmédia de 60 por hora. Usando adequadamente a distribuição de Poisson: a) determine a probabilidade de que num intervalo de 5 minutos não entre ninguém no armazém; b) o intervalo de tempo tal que a probabilidade de que não entre ninguém no armazém durante o dito intervalo seja de 0.5. Sol: a)0.0067; b) Intervalo de aproximadamente 0.7 minutos. (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 16 / 31
Distribuições Discretas Relação entre a e a A relação entre as duas distribuições pode expressar-se através da expressão seguinte: lim B(n, p) n (np = λ) Poisson(λ) O interesse prático de aproximar uma distribuição Binomial por uma de Poisson resulta do cálculo da função de probabilidade ser mais simples no segundo caso. Tal aproximação só é razoável quando n for grande (n 20) esó tem interesse quando a distribuição Binomial for assimétrica (np < 7). Se a distribuição Binomial for simétrica (ou quase simétrica), é mais prático aproxima-la pela distribuição Normal. (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 17 / 31 Distribuições Contínuas Diz-se que uma variável aleatória X tem distribuição normal, se a sua função densidade de probabilidade for dada por: f X (x) = 1 σ (x µ) 2 2π e 2σ 2 onde µ e σ são os parâmetros da distribuição que obedecem a: σ>0 e <µ<+ Uma vez conhecidos estes parâmetros, a distribuição da v. a. X fica completamente definida e escreve-se X N(µ, σ 2 ) Tem-se E(X) =µ e Var (X) =σ 2 (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 18 / 31
Distribuições Contínuas Curva de Gauss O gráfico da função densidade de probabilidade de uma variável aleatória com distribuição N(µ, σ 2 ) é a famosa curva em forma de sino, também dita curva de Gauss ou curva normal, abaixo representada. Note que P(X <µ)=p(x >µ) (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 19 / 31 Distribuições Contínuas Características da Curva de Gauss A curva é simétrica relativamente à recta vertical que passa pelo ponto (µ, 0); A curva prolonga-se de a + e nunca toca no eixo das abcissas (este eixo é uma assimptota); A curva tem dois pontos de inflexão de abcissas: µ σ e µ + σ; Aos intervalos (µ σ, µ + σ), (µ 2σ, µ + 2σ) e (µ 3σ, µ + 3σ) correspondem, respectivamente, 68%, 95% e 99.7% da área total sob a curva da função densidade: P(µ σ<x <µ+ σ) =0.6827 P(µ 2σ <X <µ+ 2σ) =0.9545 P(µ 3σ <X <µ+ 3σ) =0.9973 (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 20 / 31
Distribuições Contínuas Curva de Gauss Distribuições normais com iguais desvios padrões mas com médias diferentes. (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 21 / 31 Distribuições Contínuas Curva de Gauss Distribuições normais com médias iguais mas com desvios padrões diferentes. (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 22 / 31
Normal Padronizada Distribuições Contínuas Uma variável aleatória com distribuição normal de média zero e desvio padrão igual a um é dita uma variável aleatória normal estandardizada, reduzida ou padronizada: Z N(0, 1) Estandardização da v. a. X N(µ, σ 2 ) (mudança de origem e de escala): Z = X µ N(0, 1) σ Exemplo Seja X N(2, 0.5 2 ). Calcule: P(X < 2.4) e P(1.8 < X < 2.5). Sol: P(X < 2.4) =0.7881 e P(1.8 < X < 2.5) =0.4967 (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 23 / 31 Distribuições Contínuas Teorema da Aditividade da Teorema Sejam X 1, X 2,..., X n variáveis aleatórias independentes, cada uma com distribuição normal de média µ i e variância σi 2 (i=1,...,n). Então a variável aleatória X = a 1 X 1 + a 2 X 2 +... + a n X n com a i R (i = 1,..., n), tem distribuição normal de média µ X = a 1 µ 1 + a 2 µ 2 +... + a n µ n e variância σx 2 = a2 1 σ2 1 + a2 2 σ2 2 +... + a2 nσn 2 (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 24 / 31
Distribuições Contínuas Teorema da Aditividade da Exemplo Suponha que o gestor de uma empresa desenvolve software por encomenda. Estudos recentes indicam que são 4 as fases principais da criação de um novo software. Os valores esperados (em dias) e o respectivo desvio-padrão são os indicados na tabela: Actividade Valor Esperado Desvio-Padrão Reunir com o cliente 5 1.6 Desenhar o sistema 8 3 Fazerocódigo 10 3.3 Testar o software 6 2.2 Admita que o tempo gasto naquelas fases segue uma distribuição normal. Se assinar um contrato com um cliente que estipule uma grande penalização no caso de não entregar o software num período máximo de 40 dias calcule a probabilidade de pagar essa penalização. Sol.: 0.0174 (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 25 / 31 Distribuições Contínuas Aproximação da à Normal Para n suficientemente grande, a distribuição binomial de parâmetros n e p pode aproximar-se à distribuição normal com a mesma média, np, e a mesma variância, npq. Isto é, sendo X uma v. a. com distribuição B(n, p) e n suficientemente grande, então, X E(X) = X np. N(0, 1) Var (X) npq Na prática fazemos esta aproximação quando n > 20 e tanto np como nq são superiores a 5. (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 26 / 31
Distribuições Contínuas Aproximação da à Normal Correcção de continuidade X B(n, p) e Y N(np, npq) P(X = k) = P(k 0.5 Y k + 0.5); P(X k) = P(Y > k 0.5); P(X > k) = P(Y > k + 0.5); P(a X b) = P(a 0.5 Y b + 0.5); P(a < X < b) = P(a + 0.5 Y b 0.5). (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 27 / 31 Distribuições Contínuas Aproximação da à Normal Exemplo Um avião pode acomodar 300 passageiros, 30 dos quais em 1 a classe e 270 em classe turismo. A companhia aérea reservou 30 lugares em 1 a classe e 300 em turismo. Sabendo que a probabilidade de não comparecimento de quem faz reserva é de 0.15, qual éa probabilidade de que todos os passageiros que comparecem sejam acomodados, se os lugares em 1 a classe puderem ser utilizados pelos passageiros de turismo? Sol.: 0.999 (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 28 / 31
Distribuições Contínuas Distribuição Lognormal Distribuição Lognormal Admita que X > 0 é uma variável aleatória contínua. Se X é uma variável aleatória cujo logaritmo é normalmente distribuído, isto é, Y = ln(x) N(µ, σ 2 ) então X tem uma distribuição lognormal e escreve-se X LN(µ X,σ 2 X ) A função densidade de probabilidade de X é dada pela expressão: ( ) f X (x) = 1 σ 1 2π x exp (ln(x) µ)2 2σ 2, 0 < x < +, <µ<+, σ>0 (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 29 / 31 Distribuições Contínuas Distribuição Lognormal Distribuição Lognormal Tem-se ainda que e ) µ X = E(X) =exp (µ + σ2 2 σ 2 X = Var (X) =exp (2 ( µ + σ 2)) exp (2µ + σ 2) A distribuição lognormal é assimétrica à direita sendo a sua moda e mediana dadas, respectivamente, por η X = exp(µ) e ξ X = exp (µ σ 2) (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 30 / 31
Distribuições Contínuas Distribuição Lognormal Distribuição Lognormal A sua função densidade de probabilidade de uma distribuição lognormal tem o seguinte aspecto: Se X LN(µ X,σX 2 ) prova-se que Y = ln(x) tem valor médio e variância dados por: ) ) µ Y = 1 2 ln ( µ 4 X σ 2 X + µ2 X e σ 2 Y = ln ( σ 2 X µ 2 X + 1 (DepMAT ESTV) Distribuições de Probabilidade 2007/2008 31 / 31