Distribuições Estatísticas Para darmos sequência ao estudo da estatística, será necessário conhecer um pouco mais sobre as distribuições mais utilizadas, como distribuição normal, distribuição Gama, distribuição T de Student. Sendo assim, elas eram consideradas sob diversos aspectos, como denição, aplicações e principais propriedades. 1 O que é uma Distribuição? Para responder a essa pergunta, será necessário percorrer um longo caminho, que passará pela denição de variáveis aleatórias, distribuições de probabilidades discretas, média, variância e desvio padrão e valor esperado. Após isso, será considerada nalmente a distribuição normal, o que é uma distribuição continua das mais importantes na estatística. Então vejamos essas denições. A referência bibliográca mais importante nesse capítulo é encontrada em Larson et al. (2004), que servirá como fundamentação desse texto. 1.1 Variáveis Aleatórias Primeiramente, considere o tema variáveis aleatórias. Conforme já foi visto na aula 2, uma variável aleatória é uma função que associa elementos de um espaço amostral a valores numéricos (Wikipédia, 2015). Talvez o exemplo recorrente de variável aleatória é resultado do lançamento de um dado honesto, que certamente irá assumir os valores naturais compreendidos entre 1 e 6, inclusive; o que corresponde a um único dentre os valores do espaço amostral desse exemplo: S = {1, 2, 3, 4, 5, 6}. Outro exemplo bastante utilizado é a função que conta o número de resultados cara no lançamento de 3 moedas. O espaço amostral está exibido na Figura, também chamada de árvore, ferramenta bastante usada na contagem de elementos. A Variável aleatória "número de caras" poderá então assumir os valores 0, 1, 2 e 3, mas esse resultado não pode ser determinado a priori, por depender de fatores aleatórios. 1.2 Variáveis Aleatórias Contínuas e Variáveis Aleatórias Discretas. Há dois tipos de variáveis aleatórias: as discretas e as contínuas. Conforme já foi denido previamente, variáveis discretas são aquelas que cujos conjuntos são enumeráveis. A grosso modo os elementos desses conjuntos podem ser listados. Como exemplo podemos citar o número de ligações com vendedor faz ao longo de um dia: isso pode ser 0, 1, 2, 3, e assim por diante, mas sempre é possível listar tais números. 1
Figura 1.1: Espaço amostral do lançamento de três moedas, sendo C a face correspondente a cara, e c a coroa. Uma variável aleatória contínua não pode ser enumerada. Um exemplo é o conjunto de todas as alturas dos seres humanos vivos hoje na Terra: o resultado pode ser qualquer valor entre, digamos, 50 centímetros a dois metros e meio, mas não se Pode listar todos os elementos desse conjunto. Exemplo 1. Decida se essa variável aleatória continua ou discreta: (a) Número de atendimentos realizados pelo call center de uma empresa telefônica. (b) volume em litros vendidos por um posto de gasolina ao longo de um mês. Solução: qualquer que seja o número de atendimentos realizados, eles sempre podem ser enumerados, desde 0 até um número nito deles. Mas como se pode contar número de elementos de tal conjunto ele é discreto. Já o volume de combustível vendido por um posto de gasolina pode assumir qualquer valor entre 0 e o total colocado à venda pela empresa, mais tais elementos nunca podem ser listados, como foi possível no caso anterior. Logo, essa é uma variável aleatória continua. Objetivo das aulas era concentrado no estudo de variáveis aleatórias discretas; sendo que as variáveis aleatórias contínuas serão objeto da próxima aula. 1.3 Distribuições de Probabilidade Discretas A cada valor de variável aleatória discreta pode se associar uma probabilidade. Para ver isso, considere novamente o exemplo do número de caras do lançamento de 3 moedas. A contagem do número de caras do espaço amostral está ilustrada na Figura 1.2. 2
Figura 1.2: Contagem do número de caras do lançamento de três moedas. Tabela 1: Distribuição de probabilidades do aparecimento de n caras no lançamento de 3 moedas honestas. n 0 1 2 3 p (n) 1 3 3 1 Perceba então que o total de resultados possíveis é. Para determinar a probabilidade de que um certo número de faces apareça, basta contar tal quantidade e dividir pelo total. Então, se essa contagem for denominada f (n) (a letra f foi escolhida por ser a inicial de frequência, ou seja, f (n) denota a frequência do resultado n), sendo n = 0, 1, 2, ou 3, segue que e f (3) = 1; f (2) = 3; f (1) = 3; f (0) = 1. Daí, as probabilidades são: p (3) = 1, p (2) = 3, p (1) = 3 e p (0) = 1. A Tabela tal resume esses dados. 3
Pode-se vericar que cada uma dessas probabilidades é um número entre 0 e 1. Isso é uma das características fundamentais das distribuições de probabilidade. A outra característica pode ser vericada nesse exemplo: a soma das probabilidades deve ser igual a unidade: n p (i) = p (0) + p (1) + p (2) + p (3) i=0 = 1 + 3 + 3 + 1 = 1 + 3 + 3 + 1 = = 1. Isso signica que tal função deve descrever as probabilidades de todos os resultados possíveis, ou de outra forma, que a probabilidade de que qualquer um dos resultados apareça é certa, 1 = 100%. De forma geral, essas propriedades se expressam na forma das equações e n p (i) = 1 i=1 0 p (i) 1 i. Tais funções de distribuições costumam ser representadas em grácos chamados de histogramas, que são grácos compostos por retângulos de base unitária centrados em torno do valor assumido pela variável aleatória e cuja altura é a probabilidade desse valor. Na Figura 1.3, ilustração o histograma referente a um exemplo do número de caras do lançamento de três moedas honestas.. Exemplo 2. Construindo e representando uma distribuição de probabilidade discreta por meio de um gráco. Um psicólogo Industrial aplicou um teste de inventário de personalidade para identicar características passivo-agressiva em 150 colaboradores. Os indivíduos receberam uma pontuação de 1 a 5, sendo 1 extremamente passivo e 5 extremamente agressivo. Uma pontuação 3 indicavam a neutralidade. Os resultados estão indicados na Tabela 2. Construa uma distribuição de probabilidade para a variável aleatória X. Depois represente gra- camente distribuição usando um histograma. Solução. Divida a frequência de cada pontuação pelo número total de indivíduos para encontrar a probabilidade de cada valor da variável aleatória:p (1) = 24 33 150 = 0.16, p (2) = 150 = 0.22, p (3) = 42 30 21 150 = 0.2, p (4) = 150 = 0.20 e p (5) = 150 = 0.14. A distribuição de probabilidade está representada na Tabela 3 O histograma está representado na Figura 1.4. Veja que os retângulos tem bases unitárias em torno do valor da variável aleatória cujas alturas correspondentes são as próprias probabilidades desses valores. 4
Histogram of a Density 0.0 0.1 0.2 0.3 0 1 2 3 a Figura 1.3: Histograma do exemplo do lançamento de três moedas honestas. Tabela 2: Características passivo-agressivas. Escore x Frequência f (x) 1 24 2 33 3 42 4 30 5 21 5
Tabela 3: Distribuição de probabilidade da pesquisa do inventário de personalidade. x 1 2 3 4 5 p (x) 0.16 0.22 0.2 0.20 0.14 Histogram of a Density 0.00 0.05 0.10 0.15 0.20 0.25 1 2 3 4 5 a Figura 1.4: Histograma do exemplo do invetário de personalidade. 6
2 Distribuições Binomiais Esse tipo de distribuição é muito provavelmente a mais importante das distribuições discretas. Essas distribuições se aplicam eventos binomiais, que são eventos com os seguintes atributos: 1. O experimento é repetido um número xo de tentativas e cada tentativa é independente das demais. 2. Apenas dois resultados possíveis de interesse que pode ser classicados como sucesso ou fracasso. 3. A probabilidade de sucesso ou fracasso é a mesma para cada tentativa. 4. A variável aleatória x contabiliza o número de tentativas com sucesso. Anotação utilizada para descrever os parâmetros de seus experimentos é a seguinte: n denota o número de experimentos; p = P (S) é a probabilidade de sucesso de uma única tentativa; q = P (F ) é a probabilidade de fracasso em uma única tentativa. Percebam que, como a soma de todas essas probabilidades deve ser unitária, há uma relação entre p e q: p + q = 1 q = 1 p. X é a variável aleatória que conta o número de sucessos nas n tentativas. Logo, os valores que X pode assumir são {0, 1, 2,..., n}. Exemplo 3. Desse desse experimento é binomial ou não. Caso ele seja, Especi- que os valores de n, p e q; e liste todos os valores possíveis da variável aleatória X. Caso ele não seja, explique o porquê. 1. Um dado procedimento cirúrgico tem 5 por cento de chances de sucesso. O médico realiza o procedimento em oito pacientes. A variável aleatória representa o número de cirurgias com sucesso. 2. Uma jarra contém 5 bolinhas de gude vermelhas 9 azuis e 6 verdes. Você escolhe três bolinhas aleatoriamente sem reposição. A variável aleatória representa o número de bolinhas vermelhas. No caso 1, há de fato um experimento binomial. Isso porque, a cada experimento, a probabilidade de sucesso é a mesma; em outras palavras esses experimentos são todos independentes. A variável aleatória obviamente está determinando o número de sucessos em uma dada seqüência de experimentos, e há apenas dois resultados possíveis, sucesso e fracasso, meu número de experimentos é xo. p =.5, q = 1 0.5 = 0.25, n =, e X é o número de sucessos dentre as n cirurgias. Já no caso 2, o experimento não pode ser considerado binomial porque não há reposição das bolinhas na jarra. Sendo assim a probabilidade de sucesso em cada uma das experiência diferente. Isso já é incompatível com os parâmetros que usamos para decidir se o experimento binomial. 7
Referências Larson, Ron, Farber, Betsy, & traducão técnica Patarra, Cyro;. 2004. Estatística aplicada. Prentice Hall. Wikipédia. 2015. Variável aleatória Wikipédia, a enciclopédia livre. [Online; accessed 22-setembro-2015].