Parte 4 Variáveis aleatórias
Uma variável aleatória associa um valor numérico a cada resultado de um fenômeno ou experimento aleatório; Assim como estudado anteriormente, uma variável aleatória pode ser classificada, de acordo com sua escala, em discreta ou contínua. o Dizemos que uma variável aleatória é discreta caso ela assuma resultados num conjunto enumerável de valores (em geral está associada a algum tipo de contagem). 2
Exemplo 4.1 - Variáveis aleatórias discretas: Número de internações de pacientes no último ano; Número de sintomas relatados por pacientes em suas primeiras consultas; Número de leitos de UTI de um hospital ocupados por dia (de um total de 10 leitos, por exemplo); Número de caras obtidas em 100 lançamentos de uma moeda. 3
o Dizemos que uma variável aleatória é contínua caso ela assuma resultados num conjunto não enumerável de valores (em geral está associada a algum tipo de medida). Exemplo 4.2 - Variáveis aleatórias contínuas: Tempo até a cura de pacientes diagnosticados com uma específica doença; Quociente de inteligência de crianças de certa localidade; Índice de massa corporal de indivíduos com determinado distúrbio alimentar. 4
Variáveis aleatórias são representadas por letras maiúsculas (em geral as últimas do alfabeto, como X, Y, Z. Representamos pelas correspondentes letras minúsculas valores que essa variável pode assumir. Já estudamos diferentes formas de atribuir probabilidades aos resultados de um fenômeno ou experimento aleatório e a eventos de interesse (usando frequências, assumindo que os resultados individuais são equiprováveis, usando subjetividade...); 5
Assim como é possível atribuir probabilidades a resultados de um experimento, podemos associar probabilidades aos valores de alguma variável aleatória de interesse. Para variáveis aleatórias discretas, associamos a cada um de seus possíveis valores uma probabilidade de ocorrência. A função que associa uma probabilidade a cada valor de uma variável aleatória discreta é chamada de função de probabilidade. 6
Exemplo 4.4- Uma população de 1.000 crianças foi analisada num estudo para determinar a efetividade de uma vacina contra um tipo de alergia. No estudo, as crianças recebiam uma dose de vacina e, após um mês, passavam por um novo teste. Caso ainda tivessem alguma reação alérgica, recebiam outra dose da vacina. Ao final de cinco doses, todas as crianças foram consideradas imunizadas. Os resultados completos estão na tabela a seguir: Doses 1 2 3 4 5 Frequência 245 288 256 145 66 7
Seja X a variável aleatória correspondente ao número de doses da vacina até que a criança seja imunizada. Com base nas frequências apresentadas, determine (e interprete o que está sendo pedido): a) ( X = 3) P ; b) Apresenta a função de probabilidades; c) ( X < 3) P ; d) P ( X > 3) e) ( X 3) P ; f) ( 1 < X 3) P. 8
Exemplo 4.5- Suponha que de acordo com as características genéticas de um casal, a probabilidade deles gerarem um filho com uma específica anomalia seja 0,25 (25%). Considere ainda que as condições de diferentes filhos desse casal, quanto à presença (ou ausência) da anomalia sejam independentes. Escreva a função de probabilidades para a variável aleatória X : número de filhos com anomalia caso este casal venha a ter: a) 1 filho; b) 2 filhos; c) 3 filhos; d) n filhos. Este exemplo permite introduzir um importante modelo probabilístico para variáveis aleatórias discretas, o modelo (ou distribuição de probabilidades) binomial. 9
O modelo probabilístico binomial Considere n observações independentes de um fenômeno (ou experimento) aleatório, cada uma delas contendo apenas dois resultados possíveis (classificados, genericamente, por sucesso ou fracasso ). Suponha, adicionalmente, que em cada uma dessas observações se tenha uma mesma probabilidade de sucesso, a qual denotaremos por p (a probabilidade de fracasso fica denotada por 1 p); 10
Seja X a variável de contagem correspondente ao número de sucessos observados nas n realizações do fenômeno. A função de probabilidade de X fica dada por: P n x x n x ( X = x) = p ( 1 p), x = 0,1,2,..., n, onde n x = x! n! ( n x)!, sendo n = 1 2 3... ( n 1) n!. 11
n=5,p=0,10 n=5,p=0,50 n=5,p=0,90 0 1 2 3 4 5 0 1 2 3 4 5 0 1 2 3 4 5 x x 12 P(X=x) 0.0 0.2 0.4 0.6 P(X=x) 0.0 0.2 0.4 0.6 P(X=x) 0.0 0.2 0.4 0.6 x n=10,p=0,10 n=10,p=0,50 n=10,p=0,90 0 2 4 6 8 10 0 2 4 6 8 10 0 2 4 6 8 10 x x P(X=x) 0.0 0.1 0.2 0.3 0.4 P(X=x) 0.0 0.1 0.2 0.3 0.4 P(X=x) 0.0 0.1 0.2 0.3 0.4 x Figura 4.1 Gráficos da distribuição binomial para diferentes valores de n e p.
Exemplo 4.6- Algumas possíveis aplicações do modelo binomial: Número de lançamentos de um dado que resultam na face 6, considerando 20 lançamentos de um dado balanceado ( n = 20 ; p = 1/ 6); Número de filhos do sexo masculino em casais com três filhos, considerando probabilidade 0,5 de ter um filho do sexo masculino e independência entre os sexos de diferentes crianças ( n = 3 ; p = 0, 5); Número de peças defeituosas em lotes de dez peças produzidas por uma industria que produz 1% de suas peças defeituosas ( n = 10 ; p = 0, 01). 13
Exemplo 4.7- Discuta a validade do modelo binomial nos seguintes casos: Dos alunos de uma grande universidade, sorteamos 5 e contamos quantos se declaram usuários de droga; Escolhemos 20 lâmpadas ao acaso na prateleira de um supermercado, sendo 10 de uma fábrica e 10 de outra. Contamos o número total de defeituosas; 14
Quinze automóveis 0km de uma mesma marca e tipo são submetidos a um teste antipoluição e contamos o número deles que passaram no teste; Um motorista é submetido a um teste em que deve estacionar seu veículo num pequeno espaço ( fazer baliza ). Em 10 tentativas, contamos o número de tentativas em que o motorista estacionou corretamente. 15
Exemplo 4.8 O escore de um teste internacional de proficiência na língua inglesa varia de 0 a 700 pontos, com mais pontos indicando um melhor desempenho. Informações, coletadas durante vários anos, permitem estabelecer o seguinte modelo para o desempenho do teste: Pontos 0-200 200-300 300-400 400-500 500-600 600-700 Probabilidade 0,06 0,15 0,16 0,25 0,28 0,10 Várias universidades americanas exigem um escore mínimo de 600 pontos para aceitar candidatos de países de língua não inglesa. De um grande grupo de estudantes brasileiros que prestaram o último exame, 16
escolhemos ao acaso 8. Qual seria a probabilidade de no máximo dois atenderem ao requisito máximo mencionado? Assim como estudado anteriormente na análise descritiva de amostras, as variáveis aleatórias também podem ser caracterizadas por alguns parâmetros numéricos, como média (à qual é comum se referir como valor esperado da variável aleatória, denotada por µ ), variância 2 (denotada por σ ) e desvio padrão (denotado por σ ). 17
No caso da distribuição binomial, a média e o desvio padrão da variável podem ser calculadas pelas seguintes expressões: µ = n p; σ = n p ( 1 p). Exemplo 4.9 Retorne ao exemplo anterior e calcule a média (e o desvio padrão) da variável sob estudo. 18
Exemplo 4.10 Suponha X uma variável aleatória que segue o modelo binomial com n = 10. Vamos considerar três valores distintos para p : p 1 = 0,1; p 2 = 0, 5 e p 3 = 0, 9. a) Para qual dos valores de p você acredita que o número esperado de sucessos seja maior? Agora, faça as contas e verifique; b) Para qual dos valores de p você acredita que a variância do número de sucessos seja maior? Agora, faça as contas e verifique. 19