Estatística (MAD231) Turma: IGA Período: 2017/2 Aula #03 de Probabilidade: 04/10/2017 1
Variáveis Aleatórias Considere um experimento cujo espaço amostral é Ω. Ω contém todos os resultados possíveis: e pode ser um conjunto cujos elementos não são números. Por exemplo, considere o lançamento de uma moeda duas vezes consecutivas. Nesse caso, Ω = {(ca, ca), (ca, co), (co, ca), (co, co)} cujos elementos são pares contendo as entradas ca para cara e co para coroa. De modo bastante informal, uma variável aleatória é uma característica numérica do resultado de um experimento. No caso desse exemplo, podemos definir a variável alaetória X como o número de caras obtidas. 2
Observe que nesse caso, X = 0, se ocorrer {(co, co)} 1, se ocorrer {(ca, co), (co, ca)} 2, se ocorrer {(ca, ca)} Dizemos que o campo de definição da variável aleatória X é o conjunto R X = {0, 1, 2} que representa os valores que X pode assumir. Suponha agora que estejamos interessados em observar o tempo de vida de uma lâmpada. Observe que antes de realizar o experimento não é possível dizer qual será a resposta. É fácil ver que um espaço amostral para esse experimento é Ω = {ω R ω 0}. Nesse caso o espaço amostral é um conjunto numérico de tal forma que podemos definir a variável aleatória como o tempo de vida da lâmpada. 3
Dizemos que uma variável aleatória é discreta se seu campo de definição for um conjunto finito ou enumerável (resultante de uma contagem, mas pode ser infinito). No caso dos exemplos anteriores, a variável número de caras é discreta e a variável tempo de vida da lâmpada não é discreta. A seguir apresentaremos modelos Probabiĺısticos para variáveis aleatórias discretas: função de probabilidade, função de distribuição e suas caracterizações. 4
Função de probabilidade: associa a cada valor possível da variável aleatória discreta sua respectiva probabilidade. Se R X é o campo de definição da v.a. discreta X podemos representar sua função de probabilidade da seguinte forma p(x) = { P (X = x) }{{} prob. da v.a. X assumir o valor x, x R X 0, caso contrário P (X = x) = 0 quando x R X, ou seja, quando x é um valor fora do campo de definição de X, a respectiva probabilidade é nula. Quando x R X, p(x) > 0 tal que a função de probabilidade assume sempre valores nãonegativos, isto é, p(x) 0, para todo x. Além disso, decorre dos axiomas da probabilidade que p(x) = 1. x R X 5
Observação: qualquer função p(x) satistazendo essas duas propriedades: P1: p(x) 0 para todo x e P2: x R X p(x) = 1 é função de probabilidade para alguma v.a. discreta X com campo de definição R X. Função de distribuição (ou função de distribuição acumulada) É definida da seguinte forma F (x) = P (X x), x R No caso das variáveis aleatórias discretas, o gráfico da função de distribuição é uma função do tipo escada, não decrescente. Veja um e- xemplo a seguir. 6
É possível deduzir a partir desse gráfico que R X = {0, 1} e que P (X = 0) = 0, 8 e P (X = 1) = 0, 2. Por que? 7
A função de probabilidade pode ser interpretada como um modelo teórico para uma determinada variável em estudo. Como no caso de distribuições de frequências empíricas (amostras) também podemos querer caracterizar as distribuições de probabilidade por meio de medidas-resumo. O valor esperado (média) de uma variável aleatória discreta com função de probabilidade p(x) é definido por E[X] = x p(x). x R X Assim como no caso de dados amostrais, o valor esperado representa o centro de massa da função de probabilidade. Considere o exemplo de lançar uma moeda duas vezes consecutivas. Vimos que o campo de definição da variável definida como número de caras obtidas é {0, 1, 2}. 8
Usando o diagrama de árvore é fácil obter a função de probabilidade. x p(x) 0 1/4 1 1/2 2 1/4 soma 1 9
Assim, nesse exemplo, o valor esperado do número de caras é E[X] = 0 1 4 + 1 1 2 + 2 1 4 = 1 Que interpretação deve ser dada a esse resultado? Podemos dizer que vamos observar uma cara ao realizarmos esse experimento? Na verdade o valor esperado representa uma medida a longo prazo: se repetirmos este experimento lançar a moeda duas vezes seguidas muitas vezes e irmos registrando o número de caras em cada repetição, a média do número de caras obtidas ao longo das repetições, se aproximará de 1, quanto maior for o número de repetições. (Lei dos Grandes Números). 10
Vimos que além de caracterizar uma distribuição de frequências usando medidas de tendência central, também usamos medidas de dispersão. Para uma variável aleatória discreta com função de probabilidade p(x), também faz sentido usar a variância para caracterizar a dispersão de seus valores possíveis em torno do seu valor esperado. V ar(x) = x R X (x E[X]) 2 p(x) = x R x x 2 p(x) (E[X]) 2 A variância é uma medida não-negativa e, quando ela é zero, significa que não há variabilidade. No caso de uma variável aleatória, a variância zero significa que P (X = E[X]) = 1. No exemplo do número de caras ao lançar uma moeda duas vezes, tem-se V ar(x) = 1 2. 11
Existem infinitos modelos para representar comportamentos de variáveis aleatórias discretas. Alguns aparecem mais frequentemente e por isso são tratados de forma especial, tais como os modelos binomial, geométrico, Poisson, etc. Vamos tratar em particular do modelo binomial, um dos mais comuns. Um Ensaio de Bernoulli é um experimento para o qual há apenas dois resultados possíveis que convencionamos chamar de sucesso ou fracasso. Aqui sucesso não precisa significar algo bom, pode representar por exemplo, peça com defeito. O modelo binomial ocorre quando repetimos independentemente um número fixado de vezes, digamos n vezes, um Ensaio de Bernoulli, cuja probabilidade de sucesso é p, 0 < p < 1. 12
Nesse contexto definimos a variável aleatória binomial como sendo o número de sucessos em n ensaios de Bernoulli cuja probabilidade de sucesso é p, 0 < p < 1. Exemplos de situações que levam ao modelo binomial (n, p): número de caras obtidas ao lançar uma moeda 10 vezes consecutivas; número de faces 6 ao lançar cinco dados balanceados; número de peças defeituosas ao observar uma amostra aleatória de 25 peças produzidas pela mesma máquina; número de alunos que fazem aniversário no primeiro trimestre ao observar uma amostra aleatória de 10 alunos de uma turma. 13
Modelo Binomial Notação: X binomial(n, p) Campo de definição: R X = {0, 1, 2,..., n} Função de Probabilidade: ( ) n p p(x) = x x (1 p) n x, x R X 0, caso contrário ( n x ) = n! x!(n x)! n! = n(n 1)...3.2.1, 0! = 1 Valor esperado: E[X] = np Variância: V ar(x) = np(1 p) 14
Exemplo 1: Das variáveis descritas a seguir, assinale quais são binomiais, e para essas apresente os respectivos campo de definição, valor esperado e variância. Quando julgar que a variável não é binomial, aponte as razões de sua conclusão. 1. De uma urna com 10 bolas brancas e 20 pretas, vamos extrair, com reposição, cinco bolas. X é o número de bolas brancas nas cinco extrações. 2. Refaça o problema anterior, mas dessa vez as extrações são sem reposição. 3. Temos cinco urnas com bolas pretas e brancas e vamos extrair uma bola de cada urna. X é o número de bolas brancas obtidas no final. 4. Vamos realizar uma pesquisa em 10 cidades brasileiras, escolhendo ao acaso um habitante de cada uma delas e classificando-o como pró ou contra um certo projeto do governo federal. X é o número de pessoas contra o projeto. 5. Numa Indústria existem 100 máquinas que fabricam uma peça. Cada peça é classificada como boa ou defeituosa. Escolhemos ao acaso um instante de tempo e verificamos uma peça de cada uma das máquinas. X é o número de peças defeituosas ao final da verificação. 15
O modelo binomial no R. O R dispõe das funções que representam os principais modelos probabiĺısticos. No caso do modelo binomial temos as funções: 1. dbinom(x, size }{{}, prob, }{{} n p Def ault {}}{ log = F ALSE) retorna a probabilidade P (X = x), quando X binomial(n, p). Se log = T RUE a função retornará o logarítmo natural de P (X = x). Exemplo: > dbinom(4,10,1/4) [1] 0.145998 significa que se X binomial(10, 1/4), então P (X = 4) = 0, 145998 0, 146. 16
2. pbinom(x, size, prob, lower.tail = TRUE, log.p = FALSE) retorna a função de distribuição, ou seja, fornece F (x) = P (X x) se X binomial(n, p) e se lower.tail = T RUE (default). Se lower.tail = F ALSE, retorna P (X > x). Por exemplo, > pbinom(4,10,1/4) [1] 0.9218731 significa que P (X 4) 0, 9219 se X binom(10, 1/4) 17
3. rbinom(n, size, prob) gera n observações com distribuição binomial(size,prob). Por exemplo, > rbinom(8,10,1/4) [1] 6 1 2 2 2 4 2 3 (resultado de um simulação de oito observações de uma binomial(10,1/4)) Observação: Podemos usar a função rbinom para simular o lançamento de uma moeda honesta um grande número de vezes. Por exemplo, a função rbinom(1000, 1, 1/2) retornará uma sequência de mil 0 s e 1 s, 0 representando coroa e 1 representando cara. A soma, sum(rbinom(1000, 1, 1/2)) retornará a informação do total de 1 s (caras) em 1000, tal que esse total dividido por 1000 representará uma estimativa da probabilidade de obter cara. 18
Exemplo 3: Simulação do lançamento de uma moeda 1000, 5000 e 10000 vezes usando o R. > set.seed(123434547) (semente de geração dos números aleatórios) > sum(rbinom(1000,1,1/2))/1000 [1] 0.52 (probabilidade estimada) > sum(rbinom(5000,1,1/2))/5000 [1] 0.5172 (probabilidade estimada) > sum(rbinom(10000,1,1/2))/10000 [1] 0.5034 (probabilidade estimada) 19
Exercícios recomendados do capítulo 6: 1, 2, 7, 13, 14, 21, 26, 27, 28, 29, 31, 32, 33, 35. 20
21