BIOESTATISTICA Unidade IV - Probabilidades 0
PROBABILIDADE E DISTRIBUIÇÃO DE FREQUÊNCIAS COMO ESTIMATIVA DA PROBABILIDADE Noções de Probabilidade Após realizar a descrição dos eventos utilizando gráficos, tabelas, calculado média, desvio padrão, fazendo correlações e regressões, o pesquisador deseja fazer inferências, ou seja, extrapolar seus resultados para a população. Para tanto, é necessário entender probabilidade, uma vez que as inferências são expressas em probabilidade daquela conclusão ser falsa ou verdadeira. Probabilidade aleatória Para entender a probabilidade de um evento aleatório, precisamos definir: S Espaço amostral: É o conjunto de todos os elementos possíveis. EVENTO É qualquer subconjunto de S (Notação A, B, C...) (phi) - Conjunto vazio, ou seja, representa um evento impossível. Definimos então probabilidade de um evento A como a razão entre o número de elementos de A e o número de elementos do espaço amostral (S). Representa-se como a formula abaixo: Vamos considerar o seguinte exemplo: Um pesquisador deseja saber qual a probabilidade de, ao lançar um dado, deste cair com a face 3 voltada para cima. 1
Analisando este pueril exemplo, porém muito ilustrativo, temos: Um dado tem 6 faces; Cada vez que um dado é lançado, somente uma face fica voltada para cima; Então temos as seguintes possibilidades: Portanto, das 6 possibilidades, somente uma satisfaz a condição CAIR FACE 3. Em termos de probabilidade, temos o seguinte: O espaço amostral (S) é: S:{1, 2, 3, 4, 5, 6} O evento (A) CAIR FACE 3 é: A: {3} A probabilidade do evento A (CAIR FACE 3) é dado pela expressão: 1 único elemento do evento A {3} resolvendo a equação: P(A) = 0,1667 ou 16,67% 6 elementos do espaço amostra S {1;2;3;4;5;6} 2
São propriedades da probabilidade: 1. A probabilidade de qualquer evento é um valor entre 0 e 1: 0 P 1; se apresentado na forma de porcentagem: 0% P 100%. 2. A probabilidade de um evento vazio é sempre iguala zero: P( ) = 0. Voltando ao nosso exemplo anterior, se o pesquisador perguntasse: Qual a probabilidade de ao jogar um dado, CAIR A FACE 7? Como um dado não possui esta face, o evento A é vazio ou A:{ }. Pela fórmula, zero divido por qualquer número continua sendo zero. 3. A probabilidade de ocorre um evento igual ao espaço amostra é 1: P(S) = 1. No nosso exemplo, se o pesquisador perguntasse: Qual a probabilidade de ao jogar um dado, CAIR UMA FACE ENTRE 1 E 6? Vejam que o evento A se satisfaz com qualquer uma das faces do dado, ou seja A:{1;2;3;4;5;6} que equivale ou espaço amostral. Pela fórmula, teremos uma probabilidade dada pela razão entre A, ou seja 6 e S que também é ö que resulta no valor 1 ou 100%. Probabilidade condicional Chamamos de probabilidade condicional a probabilidade de ocorrer determinado evento quando este depende de uma dada condição. A probabilidade de ocorrer o evento A sob a condição de ter ocorrido o evento B, representa-se então: P(A B) que se lê: probabilidade de A dado B. De volta ao nosso exemplo dos dados, pense na seguinte pergunta: - Qual a probabilidade de, ao se lançar um dado, ocorrer face 6, sabendo antecipadamente que a face que ocorreu é par? Em termos da estatística a pergunta deveria ser construída assim: Qual a probabilidade de ocorrer o evento A dado que ocorreu o evento B? Se escreve da seguinte maneira: P(A B). A fórmula para a resolução de uma probabilidade condicional é: Onde se lê: A probabilidade de A dado B é a razão (divisão) entre o número de elementos da intersecção entre A e B e o número de elementos de B. 3
Entendendo a fórmula: Evento A: face 6, já sabemos que o dado tem somente 1 face com o número 6. Evento B: face par, o dado possui as seguintes faces com números pares: {2; 4; 6}, ou seja 3 faces com números pares. A intersecção entre os Eventos A e B é a quantidade de elementos que existem nos dois conjuntos: A e B. Figura 1 : Evento A e Evento B Figura 2: Intersecção entre os eventos A e B 4
Sabemos que: A=1 elemento; B= 3 elementos; P (A B) = 1 elemento, então temos: Eventos independentes Dizemos que dois eventos são independentes quando a probabilidade de um ocorrer um dos eventos não é modificada pela ocorrência do outro evento. Vamos pensar nesta situação: Um jogador joga moeda e dado, ele deseja saber: Qual a probabilidade de ocorrer cara na moeda sabendo que no jogo do dado caiu a face 5? Devemos raciocinar: O resultado do jogo da moeda interfere no resultado do jogo do dado? Uma moeda tem duas faces, uma chamada cara (C) e outra de coroa (K), por sua vez o dado, como já vimos, tem 6 faces. Visualizem: Antes do jogo de moedas, qual o espaço amostra do jogo de dados? É o seguinte: S={1; 2; 3; 4; 5; 6} A moeda foi lançada: Cara Caiu a face Cara, como fica o espaço amostral do jogo de dado após o jogo da moeda?é o seguinte: S={1; 2; 3; 4; 5; 6} 5
Ou seja, não muda. Portanto, dizemos que o evento Cair 5 no jogo de dados é independente do evento Cair cara no jogo de moeda. Dizemos então que a probabilidade de A dado B é igual a probabilidade de A e representamos da seguinte maneira: P(A B) = P(A) Teorema do produto Este teorema diz que se A e B são eventos independentes, a probabilidade de ocorrer A e B é dada pela probabilidade de ocorrer A multiplicada pela de ocorrer B. P(A e B) = P(A) x P(B). Exemplo: Qual a probabilidade de ocorrer cara jogando uma moeda duas vezes? Possibilidades: Tentativa 1º. Lançamento 2º. Lançamento 1 2 3 4 C C K K C K C K Figura 3: probabilidades em um jogo duplo de moedas. Veja que a probabilidade de cair cara (C) no primeiro lançamento é de ½ e de 6
cair coroa (K) no 2º. Lançamento é de ½ e de cair em dois lançamentos Cara (C) e Cara (C) é de ¼. Então, aplicando a formula temos: P(C e C) = ½ x ½ = ¼ Teorema da soma Quando A e B são eventos que não podem ocorrer ao mesmo tempo, a probabilidade de ocorrer A ou B é dada pela seguinte expressão: P(A ou B) = P(A) + P(B) Se uma urna possui duas bolas brancas, uma azul e uma vermelha e retira-se uma ao acaso. Qual a probabilidade de sair uma colorida? Figura 4: urna com bolas coloridas. A condição só é satisfeita se for sorteada a bola vermelha ou a azul. Veja duas bolas das quatro existentes satisfazem então a condição. A probabilidade de ser retirada a bola azul é de ¼ e de ser retirada a bola vermelha é também de ¼, portanto a expressão fica: P(azul ou vermelha) = ¼ + ¼ = ½ 7
Distribuição Normal ou de Gauss As freqüências obtidas das medidas biológicas, das medidas de produtos fabricados em série e dos erros de medidas dão origem a gráficos semelhantes ao apresentado abaixo. Estas distribuições de freqüência aproximam-se da distribuição normal como mostra a figura abaixo. Figura 5 Distribuição de medidas do tórax de soldados escoceses A distribuição Normal tem as seguintes características: A variável aleatória pode assumir qualquer valor; O gráfico da distribuição é uma curva em forma de sino, simétrica em torno da média populacional representada pela letra grega ; A área total da curva representa uma freqüência de 100% da população. A área representa a probabilidade da variável assumir qualquer valor. Os parâmetros são: (média populacional) e a 2 (variância populacional). Cada população apresentará uma média e uma variância que vai gerar uma curva normal diferente e característica daquela população. Na figura acima, se quisermos saber a probabilidade de um soldado daquela população ter medida de tórax entre 38 e 39 polegadas, basta calcular a área da curva desta parcela da população. Para isto é necessário cálculos complexos, pois a figura é uma 8
curva e não uma reta. Distribuição normal reduzida O cálculo de probabilidades de populações com distribuição do tipo normal é complexo para ser utilizado rotineiramente. Para facilitar este tipo de calculo, foi feita o tabelamento de todas as possíveis probabilidades de uma única curva normal que recebeu o nome de Curva Normal Reduzida. Esta curva possui as seguintes características: É uma distribuição com média 0 e variância 1. A variável aleatória representada pela distribuição normal reduzida é a z. Na distribuição normal reduzida os valores de probabilidade de 0 até z estão dispostos em tabelas. Exemplo. A probabilidade de ocorrer valores entre 0 e 1,5 corresponde a área pintada: Se formos procurar na tabela a probabilidade entre 0 e 1,5 obtemos o valor de 0,4332 ou 43,32%. Na tabela devemos procurar a linha que contenha a primeira unidade e o decimal 1,5 e a coluna com o centésimo e o milésimo: 0,00. No cruzamento da linha e com a coluna selecionada obtemos então o valor 0,4332 que em porcentagem fica 43,32%. Observe que a tabela apresenta somente a parte positiva da curva, porém, como a curva é simétrica, a probabilidade do lado positivo é idêntica a do lado negativo. 9
Cálculo de probabilidade com qualquer variável com distribuição normal Vejamos o seguinte exemplo: A quantidade de colesterol em 100 ml de plasma tem distribuição normal com média 220mg e desvio padrão de 20mg conforme a ilustração abaixo: =200 Pergunta-se: Qual a probabilidade de um indivíduo apresentar valores de colesterol entre 200 e 225 mg. 200 225 10
Se X é uma variável com distribuição normal de média e desvio padrão então podemos transformar a variável X e Z pela seguinte expressão: Substituindo os valores: Para X = 225 temos: Z = (225-200)/20 = 1,25 Para X = 200 temos: Z = (200-200)/20 = 0 Na distribuição normal reduzida então: 0 1,25 Z O que significa dizer que a probabilidade entre 200mg e 225mg é a mesma probabilidade de Z assumir valores entre 0 e z=1,25, que segunda a tabela vamos buscar a linha 1,2 e a coluna 0,05 onde obtemos o valor: 0,3944 ou 39,44%. 11
Figura 6 Tábua da distribuição das probabilidades em uma curva normal reduzida, valores entre 0 e z P(0 - z). 12
13 www.cruzeirodosul.edu.br Campus Liberdade Rua Galvão Bueno, 868 01506-000 São Paulo SP Brasil Tel: (55 11) 3385-3000