Noções de Probabilidade Joel M. Corrêa da Rosa 2011 A estatística descritiva é ferramenta indispensável para extrair informação em um conjunto de dados. Entretanto, a tomada de decisões está fortemente vinculada ao uso da estatística inferencial que, por sua vez, ampara-se no Cálculo de Probabilidades. As técnicas de Estatística Inferencial podem ser classificadas em : técnicas de estimação e testes de hipóteses. Antes de investigar estas técnicas é indispensável conhecer conceitos básicos no Cálculo de Probabilidades. Este texto procura apresentar de forma breve e objetiva os conceitos básicos que integram as principais noções de probabilidades. Experimento Aleatório O experimento aleatório é aquele que quando realizado, mesmo de modo controlado, não há como predizer o seu resultado. Se o experimento não é aleatório, este é dito ser determinístico. Existe ainda uma terceira categoria de experimentos chamados de caóticos. A maioria dos experimentos científicos se encaixam na categoria dos experimentos aleatórios e são raros os exemplos de experimentos não-aleatórios(determinísticos). Espaço Amostral O espaço amostral é o conjunto de todos os possíveis resulados de um experimento aleatório. Usualmente este conjunto é denotado por Ω. Como não é possível determinar o resultado do experimento aleatório, estudá-lo por meio de probabilidades implica em primeiramente construir o seu espaço amostral. 1
Os espaços amostrais são de três tipos : Finitos Infinitos Enumeráveis Infinitos Não-Enumeráveis Alguns espaços amostrais vinculados a experimentos aleatórios são apresentados a seguir. Exemplo 1 Arremessa-se uma moeda honesta e observa-se a face voltada para cima. O espaço amostral neste caso é finito e obtido por Ω = {cara,coroa}. No próximo exemplo apresentamos um experimento aleatório cujo espaço amostral é infinito, porém enumerável. Exemplo 2 Um experimento aleatório é realizado por consecutivos arremessos de uma moeda honesta e registro do número de lançamentos até a obtenção da primeira cara. Os resultados possíveis deste experimento são: Ω = {1, 2, 3, 4,...} Para completar os exemplos dos espaços amostrais e seus respectivos tipos, vamos verificar uma situação em que o espaço amostral é infinito e não-enumerável. Exemplo 3 Um experimento consiste em registrar o retorno percentual diário do investimento em uma carteira de ações.o espaço amostral é formado por um intervalo contínuo de valores que, por conveniência, assumiremos estar entre duas quantidades desconhecidas M% e M%,ou seja, Ω = ( M, M).Uma forma abstrata de caracterizar este espaço amostral é definí-lo como:ω = (, ). Eventos Os eventos são subconjuntos do espaço amostral sobre os quais desejamos calcular probabilidades. Em geral, vamos nos referir aos eventos por letras maiúsculas do alfabeto: A, B, C, D,.... Dois eventos especiais são: e Ω. O primeiro é conjunto vazio e o segundo é o próprio espaço amostral. Veja os exemplos abaixo: 2
Experimento 1: Lançar uma moeda e observar a face superior Espaço amostral: S = {cara,coroa} Evento A = {cara} Evento B = {coroa} Experimento 2: Lançar um dado e observar a face superior Espaço amostral: S = {cara,coroa} Evento A = {números pares} = {2, 4, 6} Evento B = {números impares} = {1, 3, 5} Experimento 3: Observar o índice mensal de inflação Espaço amostral: S = ( 200%, +200%) Evento A = {deflação} = ( 200%, 0) Evento B = {inflação} = (0, 200%) Probabilidade Probabilidade é uma função que associa números reais no intervalo [0, 1] aos eventos de um experimento aleatório. Esta medida quantifica a chance da ocorrência de um evento de interesse. Vamos nos referir a esta medida por P (.), sendo P (A) a medida de probabilidade do evento A. A sua construção baseia-se nos 3 axiomas : 1. P (A) 0 2. P (Ω) = 1 3. P (A 1 A 2 ) = P (A 1 ) + P (A 2 )se A 1 A 2 = Probabilidade é o principal instrumento da Teoria de Inferência Estatística que é utilizada para a tomada de decisões. Regra da Adição de Probabilidades A regra de adição de probabilidades determina o cálculo da probabilidade da união de eventos. Quando houver interseção esta probabilidade é calculada da seguinte forma: P (A B) = P (A) + P (B) P (A B). 3
Quando a interseção é vazia, temos por consequência que P (A B) = 0 e os eventos A e B são ditos serem mutuamente exclusivos. Pode-se dizer que os eventos mutuamente exclusivos são aqueles que não podem ocorrer simultâneamente. A ocorrência de um deles determina a nãoocorrência do outro. Probabilidade Condicional Uma informação sobre o experimento aleatório pode alterar a configuração do espaço amostral e, consequentemente, o cálculo da probabilidade de um evento. Esta probabilidade, calculada com uma informação sobre a ocorrência de um evento, é chamada de probabilidade condicional. Exemplo 4 Um experimento consiste em lançar um dado honesto e equilibrado e observar o número de pontos na face superior. Uma pessoa lança o dado e informa que o resultado é um número ímpar de pontos. Qual a probabilidade de ter ocorrido 5 pontos na face superior? Veja que neste caso já existe o conhecimento da ocorrência do evento B = {Número Ímpar}. Isto modifica o espaço amostral, ou seja, o conjunto de possíveis resultados do experimento está restrito a {1, 3, 5}. A probabilidade condicional é definida da seguinte maneira: P (A B) = P (A B) P (B) para P (B) > 0 A probabilidade acima é lida como probabilidade de A dado a ocorrência de B. Regra da Multiplicação de Probabilidades A regra da multiplicação de probabilidades descreve o cálculo de probabilidades para uma interseção de eventos. Esta regra é obtida simplesmente re-escrevendo a fórmula que possibilita o cálculo de probabilidades condicionais. P (A B) = P (A B)P (B) Note que a igualdade abaixo também é verdadeira. 4
P (A B) = P (B A)P (A) Quando os eventos são independentes, a probabilidade de interseção é simplesmente determinada pelo produto das probabilidades. P (A B) = P (A)P (B)se A e B são independentes. Uma outra forma de expressar independência entre eventos é colocá-la em termos da probabilidade condiconal. P (A B) = P (A) se A e B são independentes Teorema da Probabilidade Total Seja A 1, A 2,..., A n uma partição do espaço amostral Ω. Então, segundo o Teorema da Probabilidade Total: P (B) = n P (B A i ) i=1 Este resultado é útil para calcular a probabilidade de um evento quando conhecemos a probabilidade dele ocorrer conjuntamente com outro. De outro modo o resultado pode ser escrito como: P (B) = n P (A i )P (B A i ) i=1 Exemplo 5 Em uma agência bancária, 10% dos clientes são classificados como VIP, 30% dos clientes são preferenciais e 60% são correntistas. A inadimplência no grupo dos VIPs é igual a 10%, no grupo dos preferenciais é 20% e dentre os correntistas é de 30%. Qual a chance de, ao sortear um cliente, ele ser inadimplente. Considere os eventos: I : cliente inadimplente V P : cliente VIP P F : ciente Preferencial 5
CR : cliente Correntista pelo Teorema da Probabilidade Total P (I) = P (V P ).P (I V P ) + P (P F )P (I P F ) + P (CR)P (I CR) = Teorema de Bayes P (I) = 0, 1 0, 1 + 0, 3 0, 3 + 0, 6 0, 3 = 0, 28 Como consequência da definição de probabilidade condicional e pelo Teorema da probabilidade total, surge uma importante resultado do cálculo de probabilidades que é o Teorema de Bayes. P (A i B) = P (B A i )P (A i ) n j=1 P (A j).p (B A j ) B; Como um caso particular do Teorema de Bayes, sejam dois eventos A e P (A B) = P (B A)P (A) P (B) Na última expressão podemos ver que a razão entre as probabilidades condicionais é igual a razão entre as probabilidades incondicionais. Exemplo 6 Retira-se, consecutivamente, duas cartas de um baralho. Qual a probabilidade da primeira carta ser ás, sabendo que a segunda é ás? Sejam os eventos: A 1 : primeira carta é um ás A 2 : segunda carta é um ás 4 A probabilidade da primeira carta ser ás é :. Pelo Teorema da Probabilidade Total, podemos encontrar P (A 2 ), da seguinte forma: 52 P (A 2 ) = P (A 2 A 1 ) + P (A 2 A 1 ) = P (A 1 )P (A 2 A 1 ) + P (A 1 )P (A 2 A 1 ) = 6
4 3 52 51 + 48 4 52 51 = 4 52 Conhecendo as probabilidades calculadas acima, podemos encontrar P (A 1 A 2 ), Utilizando o Teorema de Bayes, P (A 1 A 2 ) = P (A 2 A 1 )P (A 1 ) P (A 2 ) = 3 4 51 52 4 52 = 3 51 Exemplo 7 Considere uma doença que é prevalente em 5 % da população exposta. Um teste para o diagnóstico desta doença acerta 95% dos casos quando as pessoas realmente estão doentes. Esta probabilidade de acerto condicional ao conhecimento do estado do indivíduo é chamada de sensibilidade. Por outro lado, o teste acerta 90% dos casos quando os indivíduos não estão doentes e esta probabilidade é chamada de especificidade. Diante destes fatos, a realização de um teste diagnóstico é um experimento aleatório cujos os eventos de interesse são: D + : pessoa doente D : pessoa saudável T + : teste positivo T : negativo o espaço amostral neste caso é formado pelos elementos: Ω = {(D + T + ), (D T ), (D + T ), (D T + )} Embora não conheçamos de antemão as probabilidades dos eventos que forma o espaço amostral, podemos encontrá-las a partir das probabilidades descritas no enunciado. P (D + ) = 0, 05 P (D ) = 0, 95 P (T + D + ) = 0, 95 P (T D ) = 0, 90 7
Pela regra da multiplicação, P (D + T + ) = P (D + )P (T + D + ) = 0, 05 0, 95 = 0, 0475 P (D + T ) = P (D + )P (T D + ) = 0, 05 0, 05 = 0, 0025 P (D T + ) = P (D )P (T + D ) = 0, 95 0, 1 = 0, 095 P (D T ) = P (D )P (T D ) = 0, 95 0, 90 = 0, 855 Pelo Teorema da Probabilidade Total: P (T + ) = P (D + T + ) + P (D + T + ) = 0, 0475 + 0, 095 = 0, 1425 P (T ) = P (D + T ) + P (D T ) = 0, 0025 + 0, 8575 Pelo Teorema de Bayes, podemos achar P (D + T + ), que é chamado de valor preditivo positivo. P (D + T + ) = P (T + D + )P (D + ) P (T + ) pelo mesmo raciocínio podemos encontrar P (D T ) que é o valor preditivo negativo. 8