Variáveis Aleatórias Discretas

Variáveis Aleatórias Discretas Ricardo Ehlers ehlers@icmc.usp.br Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Introdução

Definição Uma variável aleatória é uma função definida num espaço amostral que assume valores reais. 1

Exemplo. Uma moeda é lançada 3 vezes. Sejam os eventos, C: resultado cara, K: resultado coroa, e as funções X : o número de caras e Y : o número de faces iguais. valores de X valores de Y CCC 3 3 CCK 2 2 CKC 2 2 KCC 2 2 KKC 1 2 KCK 1 2 CKK 1 2 KKK 0 3 2

Definição Uma variável aleatória discreta X assume valores x 1, x 2,... em um conjunto finito ou infinito enumerável. Neste caso, probabilidades são calculadas como somas, P(X A) = x i A P(X = x i ), para um conjunto A qualquer. Para distribuições discretas de probabilidade também é sempre possível mostrar que P(X = x i ) = 1. i=1 3

No exemplo anterior, assumindo que a moeda é honesta e os lançamentos são independentes todos os resultados do espaço amostral tem probabilidade 1/8. Por exemplo, P(CCK) = P(C)P(C)P(K) = 1 1 1 2 2 2 = 1 8. Distribuição de probabilidades da variável aleatória X, Valores de X Probabilidades 3 0.125 2 0.375 1 0.375 0 0.125 4

P(X = 3) = P(CCC) = 1 8 P(X = 2) = P(CCK) + P(CKC) + P(KCC) = 3 8 P(X = 1) = P(CKK) + P(KKC) + P(KCK) = 3 8 P(X = 0) = P(KKK) = 1 8 5

A partir da distribuição de X outras probabilidades podem ser calculadas, P(X 2) = P(X = 2) + P(X = 3) = 3 8 + 1 8 = 1 2 P(X 2) = P(X = 2) + P(X = 1) + P(X = 0) = 3 8 + 3 8 + 1 8 = 7 8 P(X < 2) = P(X = 1) + P(X = 0) = 3 8 + 1 8 = 4 8 6

Função de Distribuição

Função de Distribuição Definição O equivalente teórico ao conceito de frequências acumuladas é a função de distribuição acumulada ou simplesmente função de distribuição definida como, F (x) = P(X x) = x i x P(X = x i ), x R. 7

Exemplo. Uma moeda honesta é lançada 3 vezes de forma independente e X representa o número de caras. F (x) = 0, x < 0, 0.125, 0 x < 1, 0.5, 1 x < 2, 0.875, 2 x < 3, 1, x 3. 8

Representação gráfica. F(x) 0.0 0.2 0.4 0.6 0.8 1.0 2 1 0 1 2 3 4 5 x 9

Para uma variável aleatória discreta X que assume valores x 1, x 2,... F (x) = i:x i x P(X = x i ). 10

Exemplo. Seja a variável aleatória X tal que, F (x) = 0, x < 0, 0.5, 0 x < 1, 0.6, 1 x < 2, 0.85, 2 x < 3, 1, x 3. P(X = 0) = F (0) = 0.5, P(X = 1) = F (1) F (0) = 0.10, P(X = 2) = F (2) F (1) = 0.25, P(X = 3) = F (3) F (2) = 0.15, 11

F(x) 0.0 0.2 0.4 0.6 0.8 1.0 2 1 0 1 2 3 4 5 x 12

Principais Modelos Discretos

Principais Modelos Discretos Estudaremos alguns modelos teóricos que se adequam a uma série de problemas práticos. Estes modelos envolvem parâmetros cujo conhecimento é necessário para calcular probabilidades. Na maioria dos problemas reais os parâmetros serão desconhecidos e será preciso fazer algum tipo de inferência sobre eles. Por enquanto assumiremos que os parâmetros são conhecidos. Vamos nos concentrar nas principais características dos modelos apresentados. 13

A distribuição Uniforme Discreta Suponha um experimento com um número finito de possíveis resultados e cada um deles com a mesma probabilidade de ocorrer. Defina uma variável aleatória X cujos possíveis valores {x 1,..., x k } estão associados aos resultados deste experimento. Então, P(X = x i ) = 1, i = 1,..., k. k 14

A distribuição de Bernoulli Em muitos experimentos os possíveis resultados apresentam ou não uma determinada característica. Esta característica será muitas vezes determinada pelo pesquisador dependendo dos objetivos do experimento. Neste tipo de experimento estaremos interessados na ocorrência de um sucesso ou falha. É usual denotar a probabilidade de sucesso por p, P(sucesso) = p P(fracasso) = 1 p. 15

Podemos definir uma variável aleatória X como a variável indicadora de sucesso em um experimento binário, { 1, se ocorre sucesso X = 0, se ocorre fracasso e a probabilidade de X assumir cada um dos seus possíveis valores é { p P(X = x) = x (1 p) 1 x se x = 0, 1 0 caso contrário. Dizemos que X tem distribuição de Bernoulli com parâmetro p ou equivalentemente, X Bernoulli(p), 0 < p < 1. 16

A distribuição Binomial Suponha que n experimentos (ou ensaios) independentes, são executados, sendo n fixo. Cada experimento resulta num sucesso com probabilidade p ou numa falha com probabilidade 1 p. O experimento consiste na observação das variáveis aleatórias X 1,..., X n onde X i Bernoulli(p), i = 1,..., n. Frequentemente estaremos interessados no número total de sucessos obtidos, independente da ordem em que eles ocorrem. Por exemplo, uma moeda é lançada 10 vezes e o número total de caras é contado (aqui cara é um sucesso). 17

O número total de sucessos é, Y = n X i, i=1 cujos possíveis valores são 0, 1,..., n. Dizemos que Y é uma variável aleatória com distribuição binomial com parâmetros n e p, ou Y Binomial(n, p). 18

As probabilidades de cada um destes possíveis valores são dadas por ( ) n P(Y = k) = p k (1 p) n k, k = 0, 1,..., n (1) k sendo ( ) n = k n! k!(n k)! e m! = m i=1 i é o fatorial de m (define-se 0! = 1). 19

Probabilidades Binomiais com n = 5 p = 0.7 0 1 2 3 4 5 p = 0.9 0.6 0.5 0.4 0.3 0.2 0.1 0.6 0.5 0.4 0.3 0.2 0.1 0.0 p = 0.2 p = 0.5 0.0 0 1 2 3 4 5 20

Probabilidades Binomiais com n = 20 0 5 10 15 20 p = 0.7 p = 0.9 0.25 0.20 0.15 0.10 0.05 p = 0.2 p = 0.5 0.00 0.25 0.20 0.15 0.10 0.05 0.00 0 5 10 15 20 21

Probabilidades Binomiais com n = 100 0 20 40 60 80 100 p = 0.7 p = 0.9 0.10 0.05 p = 0.2 p = 0.5 0.00 0.10 0.05 0.00 0 20 40 60 80 100 22

Exemplo. Em uma linha de montagem estima-se que a proporção de itens defeituosos é aproximadamente 0.1. Assume-se que esta proporção é (aproximadamente) constante ao longo do processo, 20 itens são selecionados de forma independente, calcular a probabilidade de no máximo 2 itens defeituosos. 23

Definindo a variável aleatória Y : número de itens defeituosos podemos calcular P(no máximo 2 itens defeituosos) como, P(Y 2) = P(Y = 0) + P(Y = 1) + P(Y = 2) ( ) ( ) ( ) 20 20 20 = 0.1 0 0.9 20 + 0.1 1 0.9 19 + 0.1 2 0.9 18 0 1 2 = 0.1216 + 0.2702 + 0.2852 = 0.677. 24

Experimentos não binomiais Lançar um dado até que apareça o número 6. (Número de repetições não é fixo). Testar itens em um lote até encontrar 5 defeituosos. De um conjunto de 20 prontuários de pacientes dos quais 5 sofreram infarto sortear 3 sem reposição e contar quantos sofreram infarto. De um lote de itens manufaturados retirar 15 itens sem reposição e verificar quantos são defeituosos e não defeituosos. (Ensaios não são independentes). Calcular a probabilidade de ganhar na Mega-Sena (apostador escolhe 7 dezenas dentre 60). 25

Distribuição Geométrica Suponha que ensaios de Bernoulli são realizados de forma independente e com a mesma probabilidade de sucesso (p). Seja X o número de ensaios necessários antes de ocorrer primeiro sucesso. Por exemplo, Número de inspeções necessárias antes de encontrar-se um item defeituoso em um lote. Número de nascimentos antes de nascer um menino. 26

Dizemos que X tem distribuição Geométrica com parâmetro p, X Geometrica(p), 0 < p < 1. Se X = k os k primeiros ensaios resultam em fracasso (com probabilidade 1 p) e o último ensaio resulta em sucesso (com probabilidade p). Então, P(X = k) = p Verifique que k (1 p) = (1 p) k p, k = 0, 1, 2,... i=1 P(X = k) = k=0 (1 p) k p = 1 k=0 27

Probabilidades Geometricas 0 5 10 15 20 p = 0.7 p = 0.9 0.8 0.6 0.4 0.2 p = 0.2 p = 0.5 0.0 0.8 0.6 0.4 0.2 0.0 0 5 10 15 20 28

Exemplo. Um motorista vê uma vaga de estacionamento em uma rua. Há cinco carros na frente dele, e cada um deles tem probabilidade 0.2 de tomar a vaga. Qual a probabilidade de a vaga ser tomada pelo carro que está imediatamente a frente dele? Defina a variável aleatória X como o número de carros que passam pela vaga antes que ela seja tomada. Assume-se que cada motorista toma a vaga ou não de forma independente. Calcule a probabilidade, P(X = 4) = (0.8) 4 0.2 = 0.08192. 29

Falta de memória Se X é uma variável aleatória com distribuição Geométrica, P(X j + k X j) = P(X k). Esta é a única distribuição discreta com esta propriedade. Definição alternativa Seja Y o número de ensaios até ocorrer o primeiro sucesso. Então, Y = X + 1, e P(Y = j) = (1 p) j 1 p, j = 1, 2,... 30

Distribuição Binomial Negativa Seja X o número de ensaios de Bernoulli independentes antes de ocorrerem r sucessos. X tem distribuição binomial negativa com parâmetros r e p, denotando-se X BN(r, p). Sua função de probabilidade é dada por, ( ) r + k 1 P(X = k) = p r (1 p) k, k = 0, 1, 2,... k com r 1 e 0 < p < 1. 31

Probabilidades Binomiais negativas com r = 2. 0 5 10 15 20 p = 0.7 p = 0.9 0.8 0.6 0.4 0.2 0.8 p = 0.2 p = 0.5 0.0 0.6 0.4 0.2 0.0 0 5 10 15 20 x 32

Probabilidades Binomiais negativas com r = 6. 0 10 20 30 40 p = 0.7 p = 0.9 0.5 0.4 0.3 0.2 0.1 p = 0.2 p = 0.5 0.0 0.5 0.4 0.3 0.2 0.1 0.0 0 10 20 30 40 x 33

Distribuição de Poisson Usada para modelar o número de ocorrências de um certo fenômeno, durante um intervalo fixo de tempo ou região fixa do espaço. Exemplos, o número de chamadas recebidas por uma central telefônica por hora, o número de defeitos por unidade de comprimento de uma fita magnética, o número de nmetóides encontrados por unidade de superficie de solo, o número diário de novos casos de câncer de mama, etc. 34

Seja a variável aleatória X o número de ocorrências por intervalo fixo (de tempo ou espaço). Dizemos que X tem distribuição de Poisson com parâmetro λ, X Poisson(λ), λ > 0, com função de probabilidade, P(X = k) = λk e λ, k = 0, 1, 2,... k! 35

Probabilidades Poisson com λ {1, 2, 5, 15}. 0 5 10 15 20 25 30 lambda = 2 lambda = 5 0.3 0.2 0.1 lambda = 1 lambda = 15 0.0 0.3 0.2 0.1 0.0 0 5 10 15 20 25 30 x 36

A constante λ pode ser interpretada como o número esperado (ou número médio) de ocorrências por unidade de tempo ou espaço. Verifique que P(X = k) = 1. k=0 37

Exemplo. O número de partículas radioativas emitidas em cada intervalo de 5 segundos tem distribuição de Poisson e sabe-se que em média 2 partículas são emitidas por intervalo. Se forem observados 10 intervalos de tempo qual a probabilidade de que em cada um deles menos de 3 partículas sejam emitidas? 38

Defina a variável aleatória X como o número de partículas emitidas por intervalo sendo que o número médio de emissões é λ = 2. Portanto X tem distribuição de Poisson com parâmetro igual a 2 e queremos calcular P(X < 3), P(X < 3) = P(X = 0) + P(X = 1) + P(X = 2) = 20 e 2 + 21 e 2 + 22 e 2 0! 1! 2! = 0.1351 + 0.2707 + 0.2707 = 0.6767. Esta é a probabilidade de emissão de menos de 3 partículas em um intervalo de tempo. Portanto, para 10 intervalos a probabilidade será 0.6767 10 = 0.0201. 39

Exemplo. O número médio de gols em jogos de copa do mundo é aproximadamente 2.5 gols por jogo. Assumindo que o modelo de Poisson seja adequado e sendo X o número de gols em uma partida, k P(X = k) 0 0.082 1 0.205 2 0.257 3 0.213 4 0.133 5 0.067 6 0.028 7 0.010 8 0.003 40

Exemplo. Pacientes são admitidos em uma unidade de tratamento intensivo (UTI) e deseja-se modelar o número de dias que os pacientes permanecem na UTI. O modelo Poisson é adequado? A distribuição de Poisson não é adequada pois o número de dias não pode ser zero. Se X é o número de dias na UTI poderiamos usar uma distribuição de Poisson truncada em zero. Deseja-se calcular, P(X = k X > 0). 41

Distribuição Hipergeométrica Considere um experimento que resulta em ensaios de Bernoulli dependentes. Uma forma de induzir dependência consiste em amostrar sem reposição de uma população finita. Suponha que temos uma amostra e uma população tais que, População: tem M elementos do tipo I, N M do tipo II. Amostra: k elementos do tipo I, n k do tipo II. Suponha que itens são sorteados sem reposição. Seja a variável aleatória X o número de elementos do tipo I na amostra. 42

Dizemos que X tem distribuição hipergeométrica com função de probabilidade, P(X = k) = ( M )( N M ) k n k ( N n) k = 0, 1,..., min(m, n). 43

Probabilidades Hipergeometricas com N = 500 e n = 100. 0 20 40 60 80 M = 70 M = 80 0.15 0.10 0.05 0.15 M = 50 M = 60 0.00 0.10 0.05 0.00 0 20 40 60 80 x 44

Probabilidades Hipergeometricas com N = 500 e n = 300. 0 20 40 60 80 M = 70 M = 80 0.12 0.10 0.08 0.06 0.04 0.02 0.12 0.10 0.08 0.06 0.04 0.02 0.00 M = 50 M = 60 0.00 0 20 40 60 80 x 45

Probabilidades Hypergeometricas com N = 500 e n = 300. 0 50 100 M = 130 M = 140 0.08 0.06 0.04 0.02 M = 100 M = 120 0.00 0.08 0.06 0.04 0.02 0.00 0 50 100 x 46

Se n = 1 então k = 0 ou k = 1, ( M )( N M ) 1 0 P(X = 1) = ) = M N ( N 1 X Bernoulli(M/N) Se os itens forem sorteados com reposição, ( X Binomial n, M ). N 47

Exemplo. Um fabricante garante que produz 10% de itens defeituosos. De um lote com 100 itens serão selecionados 5 ao acaso, sem reposição. Qual a probabilidade de nenhum ser defeituoso? População: N = 100, M = 10 (itens defeituosos) Amostra: n = 5, k = 0 X : número de defeituosos na amostra. P(X = 0) = ( 10 )( 90 0 5 ( 100 5 ) ) 0.584 48

Medidas de Posição e Dispersão

Medidas de Posição para Variáveis Aleatórias Discretas Seja uma variável aleatória discreta X que assume valores x 1, x 2,... A esperança matemática denotada por E(X ) é dada por, E(X ) = x 1 P(X = x 1 )+x 2 P(X = x 2 )+ = x i P(X = x i ). i=1 49

A mediana de X é o valor Md que satisfaz às seguintes condições, P(X Md) 1/2 P(X Md) 1/2 Se as desigualdades são satisfeitas num certo intervalo a mediana será o ponto médio do intervalo. A moda (Mo) é o valor (ou valores) de X que tem maior probabilidade de ocorrência, P(X = Mo) = max{p 1, p 2,... } 50

Exemplo. Sejam as variáveis aleatórias X e Y com as distribuições de probabilidade abaixo. X P(X=x) Y P(Y=y) 3 1/8-3 4/9 2 3/8-1 1/9 1 3/8 0 2/9 0 1/8 2 2/9 51

Os valores esperados de X e Y são, E(X ) = 0 1/8 + 1 3/8 + 2 3/8 + 3 1/8 = 12/8 = 1.5 E(Y ) = 3 4/9 1 1/9 + 0 2/9 + 2 2/9 = 9/9 = 1 52

Transformações lineares No exemplo anterior seja Z = 5X 10 cuja distribuição é, Z P(Z=z) 5 1/8 0 3/8-5 3/8-10 1/8 E(Z) = 5 1/8 + 0 3/8 5 3/8 10 1/8 = 2.5 = 5E(X ) 10 53

Variância de uma variável aleatória discreta Definição. A variância de X é a média ponderada dos desvios quadráticos de seus valores em relação à sua média. Var(X ) = σ 2 X = (x i E(X )) 2 P(X = x i ) i=1 A variância é um valor esperado, Var(X ) = E(X E(X )) 2 = E(X 2 ) [E(X )] 2 = xi 2 P(X = x i ) [E(X )] 2 i=1 54

Para transformações lineares Z = ax + b valem as propriedades, E(Z) = ae(x ) + b Var(Z) = a 2 Var(X ) 55

Exemplo. Seja X com distribuição Bernoulli de parâmetro p. Então, E(X ) = p E(X 2 ) = p Var(X ) = p(1 p) 56

Exemplo. Seja X com distribuição Poisson de parâmetro λ. Então, E(X ) = k=0 k λk e λ k! = λe λ k 1=0 λ k 1 (k 1)! = λ Var(X ) = λ Portanto, E(X ) = Var(X ) = λ > 0. 57

Exemplo. Seja uma variável aleatória que representa o número de reservas por hora em uma agência online. Historicamente a agencia tem recebido aproximadamente 15 reservas por hora em média com desvio padrão igual a 2.5. O modelo Poisson não é adequado pois este assume que E(X ) = Var(X ). 58

Exemplo. Seja X com distribuição Poisson truncada em zero e parâmetro λ. Então, P(X = k X > 0) = = = 1 P(X > 0) λ k e λ k! 1 1 P(X = 0) 1 λ k e λ 1 e λ k! λ k e λ k! E(X ) = λ 1 e λ Var(X ) = E(X )(1 + λ E(X )) 59

Exemplo. Seja X com distribuição Binomial de parâmetros n e p. Então, E(X ) = np Var(X ) = np(1 p) 60

Exemplo. Seja X com distribuição Geométrica de parâmetro p. Então, E(X ) = 1 p p Var(X ) = 1 p p 2 61

Exemplo. Seja X com distribuição Binomial Negativa e parâmetros r e p. Então, E(X ) = r 1 p p Var(X ) = r 1 p p 2 62