Variáveis Aleatórias Um conceito importante em Probabilidades e Estatística é o de Variável Aleatória. Variável Aleatória Seja (Ω, A) um espaço de acontecimentos. À função X : Ω IR chamamos variável aleatória. Nota As variáveis aleatórias (v.a.) podem ser discretas ou contínuas, e são usualmente representadas por letras maiúsculas do fim do alfabeto (X, Y, Z,... ).
Variáveis Aleatórias Exemplo (3.1) Nos últimos anos muitos novos medicamentos têm sido introduzidos no mercado para controlar a hipertensão. Suponha que um médico concorda em prescrever um novo medicamento para esta condição aos primeiros quatro novos pacientes hipertensos que encontrar na sua prática cĺınica, durante um período experimental, antes de se decidir definitivamente pelo seu uso. Se X representar o número de pacientes (de entre os quatro) que vêem a sua hipertensão controlada com o novo medicamento, então X é uma v.a. discreta que assume os valores 0, 1, 2, 3 e 4.
Variáveis Aleatórias Para o exemplo anterior admitamos que k 0 1 2 3 4 P(X = k) 0.008 0.076 0.265 0.411 0.240 Ao conjunto dos valores P(X = k) para uma v.a. discreta X chamamos função massa de probabilidade. Propriedades da função massa de probabilidade, ou simplesmente função de probabilidade. P(X = k) 0; k P(X = k) = 1.
Variáveis Aleatórias Exemplo (3.2) O tempo de sobrevida, em meses, de um paciente que acaba de se submeter a um transplante de coração é uma v.a. contínua que assume valores no intervalo real [0, + [.
Variáveis Aleatórias A associada a uma v.a. contínua temos uma função densidade de probabilidade. Propriedades da função densidade de probabilidade f (x) 0, x IR; A área delimitada pela função densidade f e pelo eixo das abcissas é 1. Nota Se X é uma v.a. contínua, então P(X = k) = 0.
Variáveis Aleatórias Função de Distribuição Associada a qualquer variável aleatória X (discreta ou contínua) temos a função de distribuição (cumulativa) definida da forma F (t) = P(X t), t IR. Nota A função de distribuição determina univocamente a distribuição de uma variável aleatória.
Variáveis Aleatórias No caso contínuo, P(a < X b) representa a área delimitada pela função densidade f, o eixo das abcissas e as rectas x = a e x = b. Interpretação geométrica da probabilidade no caso contínuo a b x
Variáveis Aleatórias Assim sendo, P(a < X b) = P(a X b) = P(a X < b) = P(a < X < b).
Variáveis Aleatórias Exercício (3.1) A otite média, doença do ouvido médio, é uma das principais razões que leva crianças com menos de dois anos ao pediatra. Seja X o número de episódios de otite que uma criança com menos de dois anos tem e suponha que k 0 1 2 3 4 5 6 P(X = k) 0.129 0.264 0.271 0.185 0.095 0.039 0.017 a) Qual a probabilidade de uma criança ter 3 otites no máximo? b) Qual a probabilidade de uma criança ter mais de 4 episódios de otite? c) Qual a probabilidade de uma criança ter mais de uma mas não mais de três otites?
Variáveis Aleatórias Distribuição do número de otites probabilidade 0.05 0.10 0.15 0.20 0.25 0 1 2 3 4 5 6 nº de otites
Variáveis Aleatórias A maioria das variáveis aleatórias tem: um comportamento médio indicado pelo seu valor médio (ou valor esperado) e usualmente representado por µ; uma dispersão em torno do seu valor médio. A medida de variabilidade mais largamente usada é a variância (desvio padrão) usualmente representada por σ 2 (σ).
Variáveis Aleatórias Valor Médio O valor médio de uma v.a. discreta X, caso exista, é dado por µ = k kp(x = k). Nota O valor médio de uma v.a. contínua X, caso exista, corresponde à área delimitada pela função x.f e pelo eixo das abcissas.
Variáveis Aleatórias Variância A variância de uma v.a. discreta X com valor médio µ, caso exista, é dado por σ 2 = (k µ) 2 P(X = k). k Nota À raíz quadrada da variância chamamos desvio padrão (σ).
Variáveis Aleatórias Nota A variância, σ 2, também pode ser calculada da forma σ 2 = E(X 2 ) µ 2. Exercício (3.2) Determine o número médio de otites que uma criança tem nos seus primeiros dois anos de vida, assim como o desvio padrão.
Modelo Binomial Exemplo (3.3) Um dos testes laboratoriais mais pedido num exame médico de rotina é a contagem de células sanguíneas. Os dois aspectos principais no que refere a contagem de células sanguíneas são: (i) a contagem do número de glóbulos brancos e (ii) a diferenciação dos glóbulos brancos, nomeadamente em neutrófilos, linfócitos, monócitos, eosinófilos e basófilos. Quer a contagem de glóbulos brancos quer a diferenciação são extensivamente usadas para fazer diagnósticos médicos. Seja X a v.a. que conta o número de neutrófilos encontrados em 10 glóbulos brancos. Qual a probabilidade de 7 destas células serem neutrófilos se a probabilidade de uma célula ser deste tipo é 0.6?
Modelo Binomial Pretende-se P(X = 7) = ( ) 10 0.6 7 0.4 3 = 0.215. 7 A experiência aleatória anterior é uma experiência binomial porque: A experiência consiste em n provas idênticas; O resultado de cada prova ou é sucesso ou insucesso; A probabilidade de sucesso p mantém-se constante de prova para prova; As provas são independentes.
Modelo Binomial Modelo Binomial Uma v.a. X tem distribuição Binominal com parâmetros n e p, e representa-se por X Binomial(n, p), se estiver função massa de probabilidade ( ) n P(X = k) = p k (1 p) n k, k = 0, 1,..., n. k
Modelo Binomial Gráficos das funções massa de probabilidade das variáveis binomiais com n = 8 e p = 0.2, 0.4, 0.5, 0.8 Binomial(8,0.2) Binomial(8,0.4) 0.00 0.10 0.20 0.30 0.00 0.05 0.10 0.15 0.20 0.25 0 2 4 6 8 0 2 4 6 8
Modelo Binomial Binomial(8,0.5) Binomial(8,0.8) 0.00 0.05 0.10 0.15 0.20 0.25 0.00 0.10 0.20 0.30 0 2 4 6 8 0 2 4 6 8
Modelo Binomial Valor Médio e Variância da Distribuição Binomial Se X Binomial(n, p), então µ = np e σ 2 = np(1 p). Por exemplo, o número esperado de neutrófilos em 100 glóbulos brancos é µ = 100 0.6 = 60 com desvio padrão de σ = 100 0.6 0.4 4.9.
Modelo Binomial Exercício (3.3) A probabilidade de recuperação de uma determinada doença é 0.4. Seleccionadas aleatoriamente 15 pessoas com a referida doença, qual a probabilidade de sobreviverem: a) exactamente 5 pessoas; b) pelo menos 10 pessoas; c) entre 3 a 5 pessoas (inclusive).
Modelo Binomial Exercício (3.4) Um investigador repara que crianças de 3 lares em 20 cujos pais têm bronquite crónica desenvolveram no seu primeiro ano de vida a condição. A diferença registada é real ou deve-se ao acaso, se admitirmos que a incidência nacional é de 5% para o primeiro ano de vida de crianças com ambos os pais afectados?
Modelo de Poisson Quando o número de provas numa experiência binomial é elevado e a probabilidade de sucesso pequena, a distribuição binomial pode ser aproximada pela distribuição de Poisson. Modelo de Poisson Uma v.a. X tem distribuição de Poisson com parâmetro λ (λ > 0), e representa-se por X Poisson(λ), se tiver função massa de probabilidade P(X = k) = λk e λ, k = 0, 1, 2,.... k!
Modelo de Poisson Gráficos das funções massa de probabilidade das variáveis de Poisson com λ = 3, 10 Poisson(3) Poisson(10) 0.00 0.05 0.10 0.15 0.20 0.00 0.02 0.04 0.06 0.08 0.10 0.12 0 2 4 6 8 10 12 14 0 5 10 15 20
Modelo de Poisson Nota O modelo de Poisson adapta-se a muitas situações de contagem sob regularidade. Por exemplo, é usado para modelar: o n o de plaquetas num determinado volume de sangue; o n o de automóveis que param num posto de abastecimento num determinado período de tempo; o n o de astros visíveis num determinado volume do céu; o n o de gralhas em cada página de um livro, etc.
Modelo de Poisson Exercício (3.5) Suponha que X representa agora o número de eosinófilos encontrados em 1000 glóbulos brancos. Qual a probabilidade de haver mais de 10 eosinófilos, se a probabilidade de um glóbulo branco ser deste tipo é de 0.01?
Modelo de Poisson Dado que X Binomial(1000, 0.01), P(X > 10) = 1 P(X 10) 10 ( ) 1000 = 1 0.01 k 0.99 1000 k (= 0.417). k k=0 Aproximando a distribuição de Poisson com valor médio µ = λ = np = 1000 0.01 = 10 vem P(X > 10) = 1 P(X 10) 1 0.583 = 0.417.
Modelo de Poisson Valor Médio e Variância da Distribuição de Poisson Se X Poisson(λ), então µ = λ e σ 2 = λ.
Modelo de Poisson Exercício (3.6) Muitos investigadores suspeitam que os trabalhadores da indústria de fabricação de pneus têm uma elevada incidência de cancro. Suponha que o número esperado de mortes por cancro da bexiga para a população dos trabalhadores de uma fábrica durante o período de 1 de Janeiro de 1964 a 31 de Dezembro de 1983, com base nas taxas de mortalidade nacional, é de 1.8. Se se registaram nesse período de 20 anos 6 mortes por cancro da bexiga, pode considerar que o fenómeno é pouco comum?
Modelo de Poisson Aditividade do Modelo de Poisson A soma de variáveis aleatórias independentes com distribuição de Poisson tem distribuição de Poisson; ou seja, se X i Poisson(λ i ), i = 1, 2,..., n, são variáveis aleatórias independentes, então Y = X 1 + X 2 + + X n Poisson(λ 1 + λ 2 + + λ n ).
Modelo de Poisson Exercício (3.7) Suponha que o número mensal de mortes por septicemia no hospital dos Anjinhos é bem modelado por uma distribuição de Poisson com valor médio 0.1. Qual a probabilidade de num ano se verificar mais de três mortes por septicemia?
Modelo Normal Existem distribuições que pela sua importância merecem especial destaque. De entre as distribuições contínuas destacamos a distribuição Normal (ou gaussiana) pelo papel que desempenha na Inferência Estatística Clássica. Modelo Normal Uma v.a. X tem distribuição Normal com parâmetros µ e σ, e representa-se por X N(µ, σ), se tiver função densidade f (x) = 1 σ 2π e 1 2( x µ σ ) 2, x IR.
Modelo Normal Gráfico da função densidade de uma variável N(µ, σ) Μ Σ Μ Μ Σ Nota O gráfico tem a forma em sino, é simétrica em torno x = µ e possui pontos de inflexão em x = µ σ e x = µ + σ.
Modelo Normal Nota Como consequência da simetria da distribuição Normal em torno de µ, temos P(X µ x) = P(X µ + x). Nota Para µ = 0 e σ = 1 obtemos a chamada distribuição Normal padrão cuja variável é usualmente representada pela letra Z (Z N(0, 1)).
Modelo Normal A função de distribuição da Normal padrão é usualmente representada por Φ e está tabelada. Assim, se Z N(0, 1), Φ(z) = P(Z z). Estandartização da Normal Se X N(µ, σ), então Z = X µ σ N(0, 1).
Modelo Normal Exercício (3.8) Suponha que o QI de uma pessoa adulta segue uma distribuição normal com valor médio 100 e desvio padrão 15. Um indivíduo que tenha um QI superior a 115 possui um QI elevado. Qual a percentagem da população com um QI elevado?
Modelo Normal Exercício (3.9) Mostre que se X N(µ, σ), então a) P(µ σ X µ + σ) = 0.6826; b) P(µ 2σ X µ + 2σ) = 0.9545; c) P(µ 3σ X µ + 3σ) = 0.9973.
Modelo Normal Quantil de Probabilidade da Normal Seja Z N(0, 1). O valor z α (0 < α < 1) tal que P(Z z α ) = α representa o quantil de probabilidade α da Normal padrão. Exemplo (3.4) O quantil de probabilidade 0.975 da Normal padrão é z 0.975 = 1.96 e o quantil de probabilidade 0.95 é z 0.95 = 1.645.
Modelo Normal Muitas distribuições podem ser aproximadas pelo modelo Normal (Teorema Limite Central). Para o efeito, basta conhecermos o seu valor médio e desvio padrão. Assim, se uma v.a. X tem valor médio µ e desvio padrão σ, então Z = X µ σ N(0, 1). Nota A aproximação será tanto melhor quanto mais simétrica for a distribuição da variável aleatória.
Modelo Normal Exercício (3.10) Suponha que X Binomial(8, 0.4). Calcule o valor exacto de P(X 5) e o valor aproximado usando a distribuição Normal.