Introdução à probabilidade e estatística I

Introdução à probabilidade e estatística I Variáveis Aleatórias Prof. Alexandre G Patriota Sala: 298A Email: patriota@ime.usp.br Site: www.ime.usp.br/ patriota

Probabilidade Daqui por diante utilizaremos a seguinte definição de probabilidade. Seja (Ω, A, P) um espaço de probabilidade. Então, 1. P( ) = 0, P(Ω) = 1 2. Se A 1, A 2,... A são conjuntos (mensuráveis tais que a união também é mensurável) disjuntos então ( ) P A i = P(A i ) i 1 i 1

Funções do espaço amostral Seja (Ω, A, P) um espaço de probabilidade e X : Ω R uma função real. A fim de introduzir os conceitos, considere que Ω é enumerável e A = 2 Ω (o conjunto das partes de Ω) Sejam A A e B R, então definimos X (A) = {X (ω) R : ω A} e X 1 (B) = {ω Ω : X (ω) B}. O conjunto de valores que X pode assumir (conjunto imagem) é definido por X = X (Ω).

Exemplos Seja Ω um conjunto de pessoas, então para cada ω Ω, temos as seguintes funções: 1. X (ω) = peso do indivíduo ω 2. Y (ω) = número de filhos de ω 3. W (ω) = salário do indivíduo ω

Variável aleatória Seja (Ω, A, P) um modelo de probabilidade e X : Ω R uma função real de Ω. A função X será uma variável aleatória sempre que existir uma medida de probabilidade para o evento X 1( (, a] ) para todo a R. Lembre que: X 1 (A) = {ω Ω : X (ω) A}. e que P : A [0, 1], portanto verificar se existe uma probabilidade para um evento X 1 (A) é equivalente a verificar se X 1 (A) A.

Probabilidade para a Variável aleatória Seja B um subconjunto dos reais, denotaremos a probabilidade de X B por P X (X B) P(X 1 (B)) = P({ω Ω : X (ω) B}) sempre que existir tal probabilidade (ou seja, sempre B for mensurável). quando B = {b} denotaremos por P X (X = b) P(X 1 ({b})) = P({ω Ω : X (ω) = b}). Quando não houver conflitos de notação utilizaremos P X P

Exemplo 1 Seja Ω = {(c, c), (c, k), (k, c), (k, k)} com P({ω}) = 1 4 para ω Ω (ou seja, todos os elementos de A = 2 Ω tem probabilidades bem definidas). Definimos X (ω) = 1 se ω {(c, c), (c, k)} e zero caso contrário. Quais os possíveis valores que X pode assumir? A função X é uma variável aleatória?

Verificando se X é uma v.a. Para os conjuntos da forma A = (, a] temos que: 1. se a < 0, 2. se 0 a < 1 então X 1 (A) = e P(X 1 (A)) = 0. X 1 (A) = {(k, c), (k, k)} e P(X 1 (A)) = 1/2. 3. se a 1 então X 1 (A) = Ω e P(X 1 (A)) = 1. Portanto: X é de fato uma variável aleatória e note que P(X = 0) = 1 2 e P(X = 1) = 1 2.

Exemplo 2 Seja Ω = {(c, c), (c, k), (k, c), (k, k)} com P({ω}) = 1 4 para ω Ω (ou seja, todos os elementos de A = 2 Ω tem probabilidades bem definidas). Definimos Y (ω) = número de caras de ω. Quais os valores possíveis para Y? Y é uma variável aleatória?

Verificando se Y é uma v.a. Para os conjuntos da forma A = (, a] temos que: 1. se a < 0, então Y 1 (A) = e P(Y 1 (A)) = 0. 2. se 0 a < 1, então Y 1 (A) = {(k, k)} e P(Y 1 (A)) = 1/4. 3. se 1 a < 2, então Y 1 (A) = {(c, k), (k, c), (k, k)} e P(Y 1 (A)) = 3/4. 4. se a 2 então Y 1 (A) = Ω e P(Y 1 (A)) = 1. Portanto Y é uma variável aleatória

Suporte de uma variável aleatória Seja (Ω, A, P) um espaço de probabilidade e X uma variável aleatória. Definimos o suporte de uma variável aleatória X como o menor conjunto S X R tal que P(X S X ) = 1.

Tipos de variáveis aleatórias Variáveis aleatórias discretas: Uma variável aleatória X : Ω R cujo suporte S X é um conjunto enumerável é dita ser discreta (ex: S X = {0, 1}, S X = {1, 2, 3}). Variáveis aleatórias contínuas: Uma variável aleatória X : Ω R cujo suporte S X é um conjunto não-enumerável é dita ser contínua (ex: S X = (0, 1), S X = (3, 5), S X = (0, ), S X = R).

Exemplos Seja Ω um conjunto de pessoas, então para cada ω Ω, temos as seguintes funções: Variáveis contínuas: X (ω) = peso do indivíduo ω W (ω) = salário do indivíduo ω M(ω) = tempo de vida do indivíduo ω Variáveis discretas: Y (ω) = número de filhos de ω Z(ω) = número de irmãos de ω K(ω) = número de empregos de ω

Variáveis aleatórias discretas Seja (Ω, A, P) um espaço de probabilide e X uma variável aleatória. Se S X é enumerável então podemos escrevê-lo da seguinte forma S X = {x 1, x 2,...} tal que P(X = k) > 0 se k S X, Note também que: P(X = k) = 0 se k S X Observe que {x 1 }, {x 2 },... formam uma partição de S X.

Variáveis aleatórias discretas Como {x 1 }, {x 2 },... formam uma partição de S X, temos que: P(X = x i ) = 1 i=1 A probabilidade de X B com B S X é calculada por P(X B) = k B P(X = k) O conjunto S X e a medida de probabilidade P nos dão toda a informação sobre a variável X. Podemos, neste caso, esquecer do espaço original (Ω, A, P) e trabalhar apenas com S X e P.

Esperança Seja X uma variável aleatória discreta com suporte S X e medida de probabilidade P. A Esperança matemática de X é definida por E(X ) = k S X kp(x = k) Seja g uma função real, a Esperança matemática de g(x ) é definida por E(g(X )) = k S X g(k)p(x = k) A esperança matemática nos informa o valor central dos valores de X utilizando a ponderação de suas respectivas probabildiades.

Esperança - Propriedades Seja X uma v.a. discreta com suporte S X e função de probabilidade P. Se a R é uma constante, então E(a) = a; Se a R é uma constante, então E(aX ) = ae(x ); Se a, b R são constantes, então E(aX + b) = ae(x ) + b; Prove as propriedades acima. Calcule a esperança matemática para alguns dos exemplos estudados em sala.

Variância Seja X uma v.a. discreta com suporte S X e função de probabilidade P. A variância de X é definida por VAR(X ) = k S X [k E(X )] 2 P(X = k) A variância nos informa o grau de variabilidade de X.

Variância - Propriedades Seja X uma v.a. discreta com função de probabilidade P. Se a R é uma constante, então Var(a) = 0; Se a R é uma constante, então Var(aX ) = a 2 Var(X ); Se a, b R são constantes, então Var(aX + b) = a 2 Var(X ); Var(X ) = E(X 2 ) [E(X )] 2. Prove as propriedades acima. Calcule a variância para os exemplos estudados em sala.

Função de distribuição acumulada Seja X uma v.a. discreta com suporte S X e função de probabilidade P. A distribuição acumulada de X é definida por F (t) = P(X t) para t R. Calcule a função de distribuição para todos os exemplos dados em sala. Observe que: se F é uma função de distribuição acumulada então F é não decrescente e: lim F (x) = 0, lim x F (x) = 1. x + Além disso: P(X = x) = F (x + ) F (x ), em que F (x + ) = lim y x + F (y) e F (x ) = lim y x F (y)

Exemplo Considere X uma variável discreta com suporte S X = {1, 2, 3} e P(X = i) = p i para i = 1, 2, 3. Seja B = {2, 3}. Considere p 1 = p 2 = p 3 = 1 3 pontos abaixo e depois faça para o caso geral os Calcule P(X B), Calcule E(X ) e E( X ), Calcule VAR(X ), Calcule a função de distribuição acumulada F (t) para todo t R.

Representação em tabelas Seja X uma variável aleatória, S X = {x 1, x 2,..., x n } seu suporte com medida de probabilidade defrinida por P(X = x i ) = p i para i = 1, 2,..., n. Um representação para a distribuição de probabilidades de X pode ser X x 1 x 2... x n P p 1 p 2... p n

Principais variáveis aleatórias discretas Variável Uniforme Variável de Bernoulli Variável Binomial Variável geométrica Variável de Poisson Variável hipergeométrica

Variável Uniforme Seja X uma variável aleatória discreta com suporte S X = {x 1,..., x n }. Dizemos que X é uma variável uniforme quando P(X = k) = 1 n para todo o k S X sempre que n <. Exemplo: seja X uma v.a. discreta com S X = {1, 2, 3, 4} e P(X = 1) = P(X = 2) = P(X = 3) = P(X = 4) = 1 4 Calcule a esperança, variância e função distribuição acumulada. Ver exemplo da Mega-Sena.

Variável de Bernoulli Suponha que um experimento cujo resultado pode ser classificado como sucesso ou fracasso é executado (experimento de Bernoulli). Seja X = 1 se o resultado for sucesso e X = 0 se for fracasso. Dizemos que X é uma variável aleatória de Bernoulli e sua função de probabilidade é definida por P(X = 1) = p, P(X = 0) = 1 p e P(X {0, 1}) = 0 em que p (0, 1) é um valor fixo e conhecido. Mostre que E(X ) = p, VAR(X ) = p(1 p) e calcule F (t) para todo o t R. Utilizaremos a notação X B(p) para denotar que X é uma variável de Bernoulli.

Variável de Bernoulli Note que a variável de Bernoulli é discreta pois o suporte S X = {0, 1} é enumerável. O experimento lançar uma moeda e verificar se a face voltada para cima é cara é um experimento de Bernoulli. A variável X, tal que X = 1 se o lado voltado para cima for cara e X = 0 caso contrário, é uma variável aleatória de Bernoulli. Ver exemplo da Mega-Sena: defina X = 1 se o número apostado na megasena é o número sorteado e zero caso contrário. Qual a esperança e variância de X?

Variável Binomial Suponha que n experimentos independentes de Bernoulli são executados (probabilidade de sucesso igual a p). Seja X o número de sucessos que ocorrem nos n experimentos, então X é dita ser uma variável aleatória binomial. Notação: X Bin(n, p). Pode-se mostrar que sua função de probabilidade é dada por ( ) n P(X = k) = p k (1 p) n k k para k = 0, 1, 2,..., n e P(X = k) = 0 para k {0, 1, 2,..., n}. O suporte é S X = {0, 1, 2,..., n}.

Variável Binomial Seja X Bin(n, p). Mostre que a esperança é E(X ) = np e a variância é VAR(X) = np(1 p). Calcule a função distribuição acumulada. Dica: use o binômio de Newton (a + b) n = n i=0 ( n i ) a i b n i. Derive em relação a a.

Variável Binomial Exemplo Um gerente de banco autorizou um empréstimo para 10 pessoas cujos perfis indicam que a probabilidade de pagar o empréstimo é 95% para cada uma. Assuma que os pagamentos ocorrem de maneira independente. Defina X como o número de pessoas que efetuará o pagamento. Calcule as probabilidades P(X = k) para k = 0, 1, 2,..., 10 e a esperança de X. Suponha que o empréstimo para cada pessoa foi de 10 mil reais e os juros na data do vencimento é de 2%. Assuma que os caloteiros não retornarão o pagamento em nenhuma data futura e desconsidere a inflação do período. Qual o lucro esperado que o gerente proporcionou ao banco? Qual o valor mínimo dos juros para que o lucro esperado seja positivo? Qual deveria ser a probabilidade mínima de pagar o empréstimo para que o Lucro seja positivo (usando um juros de 2%)?

Variável Geométrica Considere ensaios de Bernoulli. Seja X o número de ensaios de Bernoulli s até que ocorra o primeiro sucesso. Dizemos que X tem distribuição geométrica. Notação X Geo(p). Pode-se mostrar que as probabilidades são dadas por P(X = k) = p(1 p) k 1 para k = 1, 2,... e P(X = k) = 0 caso contrário. O suporte então é dado por S X = {1, 2, 3,...}. Mostre que E(X ) = 1 (1 p) p, VAR(X ) = p 2 o t R. e calcule F (t) para todo

Variável Geométrica Exemplo Seja X o número de ligações recebidas por uma central telefônica até que ocorra a primeira reclamação. Assuma que a probabilidade de ocorrer uma ligação com reclamação é p = 0,1. Calcule: O número esperado de ligações até receber a primeira reclamação. A probabilidade de que a primeira reclamação ocorra após a quinta ligação.

Variável de Poisson Seja X o número de eventos que ocorreram de um certo tipo que ocorreram num intervalo de tempo (ou superfície ou volume) utilizamos a distribuição de Poisson. Dizemos que X tem distribuição de Poisson quando P(X = k) = e λ λ k k! para k = 0, 1, 2,... e P(X = k) = 0 caso contrário. O suporte é dado por S X = {0, 1, 2,...} Aqui, λ é a taxa média de ocorrência do evento no intervalo de tempo (ou superfície ou volume) especificado. Notação X Pois(λ).

Variável de Poisson Seja X Pois(λ). Mostre que E(X ) = λ, VAR(X ) = λ e calcule a função acumulada F (t) para todo o t R Note que: O evento X = k significa que o evento de interesse ocorreu k vezes no intervalo de tempo (ou superfície ou volume) especificado. Assume-se que a probabilidade de ocorrer o evento de interesse mais de uma vez num intervalo muito pequeno é desprezível.

Exemplo Poisson Estamos interessados em estudar a variável X : o número de falhas de um computador numa semana de operação (contínua). Assuma que X Pois(λ) Considere que a taxa média de falhas por dia é de 0,5 falhas. Calcule: A probabilidade de ocorrer mais de 3 falhas em uma semana de operação. A média. A variância.

Variável Hipergeométrica Suponha que estamos interessados em estudar dois atributos A e B de uma população com N elementos, sendo r com o atributo A e N r com o atributo B. Retiramos uma amostra de n elementos da população. A variável hipergeométrica é o número de elementos que contém o atributo A. Temos que P(X = k) = ( r N r ) k)( n k ( N n) para max(0, n N + r) k min(r, n). Pode-se mostrar que E(X ) = np, VAR(X ) = np(1 p) N n N 1 em que p = r N.

Exemplo Hipergeométrica Bussab e Morretin, Estatística Básica. Em problemas de controle de qualidade, lotes com N itens são examinados. O número de itens com defeito (atributo A), r, é desconhecido. Colhemos uma amostra de n itens e determinamos k. Somente para ilustrar, suponha que num lote de N = 100 peças, r = 10 sejam defeituosas. Escolhendo n = 5 peças sem reposição. Calcule: a probabilidade de não se obter peças defeituosas, a probabilidade de obter exatamente 3 peças defeituosas, a probabilidade de obter pelo menos duas peças defeituosas a esperança matemática a variância a função de distribuição acumulada

Principais distribuições discretas Fonte: Bussab, W.O. e Morettin, P.A. (2012). Estatística Básica.