VARIÁVEIS ALEATÓRIAS

VARIÁVEIS ALEATÓRIAS Dada uma experiência aleatória Ei e um conjunto de resultados associado a essa experiência, define-se variável aleatória como uma regra bem definida (ou seja, como uma função) que faz corresponder a cada acontecimento do espaço de resultados um número real (X). As variáveis aleatórias podem ser discretas ou contínuas. Experiência aleatória: lançamento de uma moeda Ω = {F, C} (resultados associados ao lançamento) F Ω C 0 R À experiência aleatória associamos uma variável aleatória (X). X nº de faces ocorrido Se: C X = 0 F X = X C 0 F A partir daqui torna-se possível calcular probabilidades, não com base nos próprios acontecimentos, mas sim nas suas imagens valores assumidos pela variável aleatória. Isto porque qualquer valor de uma variável aleatória é um acontecimento. Logo, tem uma probabilidade associada. Raul Laureano 26

Esquema do processo de construção do Modelo de Probabilidade Experiência aleatória Listagem de todos os resultados Espaço de resultados Atribuição de um valor a cada resultado Variável aleatória f(x) Determinação da probabilidade de cada valor de X X Aplicação: Considerando a experiência aleatória controlo de qualidade extraem-se, de um vasto lote, três peças aleatoriamente e classifica-se cada uma das peças em defeituosa (D) ou não defeituosa (N). O espaço de resultados é: Ω = {( N, N, N );( N, N, D );( N, D, N );( N, D, D );( D, N, N );( D, N, D );( D, D, N );( D, D, D )} Definindo, por exemplo, a variável aleatória: X número de peças defeituosas entre as três peças inspeccionadas. A variável aleatória (V.A.) X tem como domínio Ω e como contradomínio { 0,, 2, 3}. Temos, portanto, uma variável aleatória unidimensional e discreta (o seu contradomínio é um conjunto discreto, isto é, finito ou infinito numerável). Raul Laureano 27

Considerando que 5 em cada 00 peças inspeccionadas são defeituosas, podemos calcular as probabilidades: P X = 0, P X =, P X = 2 e P X = 3. Ω R Probabilidade N N N 0 0,857375 (,, ) ( N, N, D ) ( N, D, N ) 0,35375 ( D, N, N ) ( D, D, N ) ( D, N, D ) 2 0,00725 ( N, D, D ) X ( D, D, D ) 3 0,00025 Cálculo da probabilidade condicional recorrendo à árvore de resultados: N 0,95 x 0,95 x 0,95 = 0,857375 (0,95) N D (0,95) (0,05) 0,95 x 0,95 x 0,05 = 0,04525 N D (0,95) 0,95 x 0,05 x 0,95 = 0,04525 N (0,05) (0,95) D (0,05) 0,95 x 0,05 x 0,05 = 0,002375 N 0,05 x 0,95 x 0,95 = 0,04525 (0,95) D (0,05) N D (0,95) (0,05) 0,05 x 0,95 x 0,05 = 0,002375 N D (0,95) 0,05 x 0,05 x 0,95 = 0,002375 (0,05) D (0,05) 0,05 x 0,05 x 0,05 = 0,00025 Raul Laureano 28

Assim, P X P X P X P X = 0 = 0, 857375 probabilidade da V.A. X assumir o valor = = 0, 35375 = 2 = 0, 00725 = 3 = 0, 00025 zero (probabilidade de ter zero defeituosas) A função de probabilidade da V.A. discreta X, que assume valores x x x, é representada por ( ), 2,..., n,... f x : P X = x se x = x j f ( x ) = j =, 2,..., n,... 0 se x x j ou na forma tabular x x x 2... x n ( ) P X = x P X = x 2... P X = x n f x A função de probabilidade tem, pois, domínio R e conjunto de chegada 0, e satisfaz as seguintes propriedades: f ( x ) 0 sendo uma V.A. discreta finita n ( j ) n f x = P X = x = j= j= j sendo uma V.A. discreta infinita f ( x j ) P X x = = j será uma série convergente de soma j= j= Raul Laureano 29

Pode-se definir uma outra função função de distribuição variável aleatória como: de uma ( ) F x = P X x A função distribuição tem, pois, domínio R e conjunto de chegada 0, e satisfaz as seguintes propriedades: F ( x ) 0, x R F corresponde a uma probabilidade F ( x ) F ( x ), x, x2 com x2 > x F é monótona não decrescente 2 lim ( ) = 0 x F x lim ( ) = x F x P x X x F ( x ) F ( x ) < 2 = 2,, 2 com 2 > x x x x Frequentemente a função distribuição é também designada por função de probabilidade acumulada. Raul Laureano 30

No exemplo das peças defeituosas tem-se: ( ) F 0 = P X 0 = P X = 0 = 0, 857375 ( ) F = P X = P X = 0 + P X = = 0, 99275 ( ) F 2 = P X 2 = P X + P X = 2 = 0, 999875 ( ) F 3 = P X 3 = ou ( ) F x = 0 x < 0 0, 857375 0 x < 0, 999875 x < 2 x 3 Representações gráficas das funções de probabilidade e de distribuição de V.A. discretas: Função de probabilidade: Y = f ( x ) Função de distribuição: y = F ( x ) f(x) 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0, F(x) 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0, 0 2 3 x 0 2 3 x Raul Laureano 3

Nas variáveis aleatórias contínuas X assume um número infinito de valores pelo que não faz sentido falar da função de probabilidade a probabilidade de um ponto é sempre nula. Então surge a função densidade de probabilidade (f.d.p.) de X, que tem subjacente as probabilidades não nulas de intervalos ou, então, a taxa instantânea de variação da probabilidade, definida por: b P a x b f ( x ) dx a < = o integral 2 da f.d.p. entre os valores a e b permite determinar P a < x b 3 Note-se que a f.d.p., f ( x ), corresponde, por analogia, ao polígono de frequências relativas (de uma variável contínua) quando o número de observações e o número de classes aumentam (e, portanto, diminui a amplitude das classes). Desta forma, no limite, o polígono transforma-se numa curva cuja equação define a f.d.p.. 2 O integral é representado pelo símbolo e corresponde a uma função matemática que define a área entre dois pontos de uma função. Como referem Maroco e Bisbo (2003), o integral é equivalente ao somatório para as variáveis discretas e, por abuso, pode interpretar-se como sendo a soma de todos os valores da função num determinado intervalo. 3 P[ a x b] = P[ a < x < b] + P[ x = a] + P[ x = b] = P[ a < x < b] = P[ a x < b]. Raul Laureano 32

A f.d.p. verifica as propriedades: f ( x ) 0 não negatividade o integral em todo o domínio é f ( x ) dx = A função densidade de probabilidade (f.d.p.) corresponde à derivada da função distribuição - F ( x ), isto é, ( ) f x ( ) df x =, se a função de distribuição for derivável. dx A função de distribuição de uma V.A. contínua corresponde a: x F ( x ) = P X x f ( u) du = 4 E verifica as seguintes propriedades: É uma função contínua Se x < y, então F ( x ) F ( y ), função crescente (em sentido lato) F ( ) = lim F ( x ) = 0 x F ( ) = lim F ( x ) = x b P a < x b = F b F a f x dx = a ( ) ( ) ( ) 4 Como no integral o limite superior da integração é x, considera-se uma variável de integração diferente de x, neste caso a variável u. Raul Laureano 33

Representações gráficas das funções densidade de probabilidade e de distribuição de V.A. contínuas: Função de distribuição: y = F ( x ) F(b) F(a) Função densidade de probabilidade: Y = f ( x ) b P a < x b = F b F a f ( x ) dx = a Cálculo da probabilidade: ( ) ( ) Recorrendo a Recorrendo a F( x ) f ( x ) Raul Laureano 34

PARÂMETROS DAS VARIÁVEIS ALEATÓRIAS Para se caracterizar, de uma forma reduzida, uma variável aleatória (distribuição associada à população, definida pelas funções de distribuição e de probabilidade, se discreta, e densidade de probabilidade, se contínua) pode-se recorrer a algumas medidas (parâmetros). Assim, as funções associadas às variáveis aleatórias podem ser consideradas como representações de populações, ou sejam, evidenciam a forma como os elementos de uma população de distribuem. De outra forma, pode-se considerar que a função de probabilidade (ou a função densidade de probabilidade) constitui um modelo para a representação da distribuição dos elementos da população. Os parâmetros 5 mais comuns são: Valor esperado (ou esperança matemática ou média); Variância (ou variância esperada) e desvio-padrão; E quando se tem duas variáveis aleatórias, para analisar a relação entre elas recorre-se às medidas de associação: o Covariância; o Coeficiente de correlação linear. 5 Recorde-se que as distribuições de frequências podem ser caracterizadas por estatísticas (números que calculados com base em amostras sintetizam a configuração das distribuições e que variam de amostra para amostra). No caso das variáveis aleatórias recorre-se a um conjunto de números (parâmetros, que são fixos) para caracterizar as distribuições associadas às populações. Podem-se calcular outros parâmetros, como sejam, a mediana e a moda. Verifica-se a existência de uma correspondência entre as designações das estatísticas e dos parâmetros, podendo, em algumas situações, acrescentar-se à designação, no caso das estatísticas, as palavras amostral ou da amostra, e, no caso dos parâmetros, as palavras populacional ou da população. Raul Laureano 35

VALOR ESPERADO DE X é um parâmetro de localização, representa- -se por E X (ou por µ x ou por µ) e, quando existe, define-se por: Se X é uma V.A. discreta E n X = x i. f ( x i ) i= + Se X é uma V.A. contínua E X x. f ( x) dx = VARIÂNCIA DE X é um parâmetro de dispersão, representa-se por VAR X (ou por 2 σ x ou por σ 2 ). A variância corresponde à média do quadrado dos desvios em relação ao valor esperado: ( ) 2 VAR X = E ( X µ ) 2 = E X 2 E X e define-se por: Se X é uma V.A. discreta VAR X = ( x i ) 2. µ f ( x i ) n i= Se X é uma V.A. contínua = ( µ ). ( ) VAR X x f x dx + 2 Note-se que E X2 é dado por: Se X é uma V.A. discreta E X 2 x 2. f ( x ) n = i= 2 2 = +. Se X é uma V.A. contínua ( ) E X x f x dx i i DESVIO-PADRÃO DE X é um parâmetro de dispersão, representa-se por σ (ou por σ x ). O desvio-padrão corresponde à raiz quadrada positiva da variância, isto é, σ = + VAR X. Raul Laureano 36

Propriedades do valor esperado ( k, a e b são constantes e X ey são duas variáveis aleatórias - V.A.): E k = k - o valor esperado de uma constante k é a própria constante; E kx = k. E X - o valor esperado do produto de uma constante por uma V.A. é igual ao produto da constante pelo valor esperado da V.A.; E ax + b = a. E X + b - o valor esperado do produto de uma constante por uma V.A. mais uma constante é igual ao produto da constante pelo valor esperado da V.A. mais a outra constante (transformação linear); E X ± Y = E X ± E Y - o valor esperado da soma algébrica de duas V.A. é igual à soma algébrica dos respectivos valores esperados; E X. Y = E X. E Y - se X ey forem independentes, o valor esperado do produto de duas V.A. é igual ao produto dos respectivos valores esperados. Se X e Y não forem independentes ( ) E X. Y = E X. E Y + cov X, Y. E g ( x ) = i + - ( ) f ( x ) g x i ( ) ( ) g x i f x dx se X discreta se X contínua - valor esperado de uma função de X Raul Laureano 37

Propriedades da variância ( k, a e b são constantes e X ey são duas V.A.): VAR X 0 ; Se VAR X = 0 então P X = E X = ; VAR k 0 = ; VAR kx k 2. VAR X = ; VAR ax ± b = a 2. VAR X ; VAR X Y VAR X VAR Y 2. cov ( X, Y ) ± = + ± - Se X ey forem independentes, então cov ( X, Y ) = 0 (o recíproco não é verdadeiro); Note-se que: Se X é uma V.A. de média µ e variância 2 σ então a V.A. W = X µ σ tem parâmetros: E W 0 = e VAR W =. Operando com as propriedades do valor esperado verifica-se que a variância ( VAR X ) ( ) 2 2 2 VAR X = E ( X µ ) ou VAR X = E X E X. 2 2 2 ( ) 2.. ( ) E X E X = E X X E X + E X = ( ) 2 2 2 2 ( ) 2. ( ) = E X 2 + E E X 2. E X. E X = = E X + E X E X = 2 = E X em que: X variável; ( E X ) 2 E X quadrado; E ( X E X ) 2 média; ( X E X ) desvio; ( X E X ) 2 média do desvio quadrado e [ ] 2 X = desvio k 2 E Xi.P(Xi). i= Raul Laureano 38

COVARIÂNCIA é uma medida de distribuição conjunta de X e Y, em termos dos desvios face às respectivas médias. A covariância descreve a relação linear entre duas variáveis e é dada por: ( ) ( ) ( ) cov X, Y = E X E X. Y E Y = E XY E X. E Y COEFICIENTE DE CORRELAÇÃO LINEAR descreve a relação linear entre duas variáveis e tem a vantagem, em relação à covariância, de ser independente da unidade de medida em que as variáveis estão expressas. ρ = XY VAR X ( X Y ) cov,. VAR Y Verifica-se que ρ. O coeficiente de correlação indica o sentido da relação linear, relação directa ou positiva (sinal +) ou inversa ou negativa (sinal -), e a intensidade, quanto mais perto do (relação perfeita), em valor absoluto, for o coeficiente mais forte é a relação e quanto mais perto do 0 (ausência de relação) mais fraca é a relação entre as duas variáveis. Raul Laureano 39

APLICAÇÃO: Suponha que temos uma experiência aleatória que consiste no lançamento sucessivo de duas moedas (não viciadas). Pretende-se saber qual o número esperado de faces que irá ocorrer. Passos a dar: º) Definir o espaço de resultados Experiência aleatória lançamento sucessivo de 2 moedas Ω = {(F,F); (F,C); (C,F); (C,C)} 2º) Definir a variável aleatória X número de faces ocorrido Se tivermos o resultado: (F,F) X = 2 (F,C) ou (C,F) X = (C,C) X = 0 3º) Determinar a probabilidade de cada valor de X. Ou seja, constrói-se um quadro em que a cada valor de X se faz corresponder a sua probabilidade de ocorrência. A este quadro chama-se quadro de distribuição de probabilidade de X, ou função de probabilidade de X, que se representa por P ( xi ) ou ( i ) condições: P x, xi ( ) 0 i n i= P(x ) = i f x e deve satisfazer duas Raul Laureano 40

Então, a função de probabilidade P ( xi ) é: x i P ( x i ) 0 ¼ 2/4 = ½ 2 ¼ Facilmente se vê que P ( xi ) satisfaz as duas condições: P x para i = 0,, 2 ; ( ) 0 i 2 i= 0 P( x ) i = + 2 + = 4 4 4 4º) Finalmente, pode calcular-se o valor esperado de X, ou seja, o número de faces que, em média, se espera que ocorra. O valor esperado de uma variável aleatória é uma medida que, de forma sintética, dá informação relevante sobre o seu comportamento. O valor esperado de uma variável aleatória X, que se representa por E X, define-se como a média dos valores assumidos por X ponderados pela respectiva probabilidade. n = i i com ( i ) 0 E X x.p(x ) i= P x, xi n i= P(x ) = i Raul Laureano 4

Calcule-se o número esperado de faces a ocorrer (valor esperado): x i ( i ) P x x i.p(x i ) 0 ¼ 0 ½ ½ 2 ¼ ½ 2 E X = x 0 2 i.p(x i ) = + + = 4 2 4 i= 0 Assim, em termos médios, espera-se que no lançamento sucessivo de duas moedas ocorra uma face. 5º) Para além do valor esperado, podemos também calcular, como medida sintetizadora e auxiliar, a variância esperada (média do quadrado dos desvios em relação ao valor esperado). ( ) 2 VAR X = E X E X X i P( X i ) Xi. P( X i ) Xi 2. P( X i ) 0 /4 0 0 /2 /2 /2 2 /4 /2 3/2 então, 2 ( ) 2 3 2 VAR X E X = E X = 2 = 2 Raul Laureano 42

VALOR ESPERADO: Outros exemplos O conceito de valor esperado tem a sua origem nos jogos do acaso. Exemplo : No lançamento de um dado, não viciado, recebe-se um euro se sair número par, perdem-se dois euros se sair ou 3 e ganham-se três euros se ocorrer o 5. A questão que se levanta é a de saber se vale a pena participar num jogo com estas condições. De outro modo, quanto é que se pode ganhar? Sabe-se que o espaço de resultados da experiência aleatória é: Ω = {, 2, 3, 4, 5, 6} A probabilidade de cada resultado individual, sendo o dado não viciado será P [W i ] = /6 Ganha-se 2 se ocorrer 4 6 3 se ocorrer 5 Perde-se 2 se ocorrer 3 A questão para a qual se pretende obter resposta é de saber, em termos médios quanto se espera ganhar? Para obter a resposta basta fazer a média ponderada dos valores a perder ou receber. O coeficiente de ponderação é dado pela probabilidade de ocorrência de cada um desses valores. Representando o ganho por G, tem-se: P [G = ] = 3/6 P [G = 3] = /6 P [G = -2] = 2/6 Então, o valor esperado do ganho que se representa por E [G] virá: E [G] =. /2 + 3. /6 + (-2). /3 = 0,3(3) euros Raul Laureano 43

Note-se que este valor não é uma quantia que efectivamente se receba, mas indica se o jogo é ou não favorável ao jogador. Se o valor esperado do ganho fosse negativo o jogador concluiria que em termos médios perdia mais do que se ganhava. Para participar no jogo, o jogador geralmente entra com uma certa quantia. Representando por E a entrada, diz-se que o jogo é equitativo, isto é, que não favorece nenhuma das partes se: E [E] = E [G] isto é, E [L] = 0 (i.e. o valor esperado do lucro), sendo L = G - E Exemplo 2: Suponha que entra numa livraria para comprar um livro que custa 36 euros. Tem na carteira quatro notas de 0 euros e uma de 50 euros. O livreiro propõe-lhe o pagamento com uma nota tirada ao acaso da carteira. Quem poderia ficar favorecido? porque o livro custa 36 euros E [G] = 36 porque o comprador tem cinco notas, quatro de 0 e uma de 50 euros E 0 50 Probabilidade 4/5 /5 E [E] = 0 4 5 + 50 5 = 8 euros então, o jogo não é equitativo e favorece o comprador E [E] E [E] (8 36) E [E] < E [G] (8 < 36) Raul Laureano 44

DISTRIBUIÇÕES TEÓRICAS MAIS IMPORTANTES Existem alguns modelos probabilísticos (distribuições teóricas) que são correntemente adaptáveis a um vasto conjunto de fenómenos aleatórios que ocorrem no dia-a-dia. As distribuições empíricas (ou distribuições de frequências) de variáveis, discretas ou contínuas, com que se deparam frequentemente os investigadores nos estudos empíricos, podem ser, muitas vezes, representadas por distribuições teóricas que se ajustam ao comportamento dessas variáveis aleatórias. Deste modo, também as distribuições teóricas se dividem em distribuições discretas e em distribuições contínuas. As principais distribuições discretas são: Distribuição uniforme; Distribuição de Bernoulli; Distribuição binomial; Distribuição multinomial; Distribuição binomial negativa; Distribuição geométrica ou de Pascal; Distribuição hipergeométrica; Distribuição de Poisson. As principais distribuições contínuas são: Distribuição uniforme; Distribuição normal e normal padrão (ou estandardizada); Distribuição exponencial; Distribuição Gama. Uma vez que são correntemente utilizados e para evitar o contínuo recurso às funções de probabilidade, no caso das distribuições discretas, e às funções densidade de probabilidade, nas distribuições contínuas, ou, ainda, às funções de distribuição foram elaboradas tabelas estatísticas tabelas probabilísticas (disponíveis em quase todos os livros de estatística) de forma a facilitar os cálculos das probabilidades (sem ter, portanto, que recorrer-se directamente às referidas funções). Raul Laureano 45

DISTRIBUIÇÕES TEÓRICAS DE VARIÁVEIS ALEATÓRIAS DISCRETAS DISTRIBUIÇÃO DE BERNOULLI Prova de Bernoulli Admita-se uma experiência aleatória com apenas dois resultados: A sucesso, com P A = p A insucesso, com P A p q = = Este tipo de experiência aleatória designa-se por prova de Bernoulli Sucessão de provas de Bernoulli: processo caracterizado por repetidas provas nas seguintes condições:. Em cada prova só existem dois resultados possíveis (e mutuamente exclusivos): sucesso e insucesso; 2. A probabilidade de sucesso, p, mantém-se constante de prova para prova. A probabilidade de insucesso designa-se por q = p; 3. As provas são independentes, ou seja, os resultados obtidos numa certa prova ou sequência de provas não influenciam os resultados das provas subsequentes. Raul Laureano 46

Distribuição de Bernoulli Tem-se uma única prova de Bernoulli e define-se X com apenas dois valores: 0 se insucesso e se sucesso. E tem-se que P X = = p e P X = 0 = q = p. Então, a V.A. X segue uma distribuição de Bernoulli se a sua função de probabilidade for dada por: ( ) x ( ) x f x = p p, x = 0, E, consequentemente, a função de distribuição ser dada por: ( ) 0 x < 0 F x = p = q 0 x < x E o valor esperado e a variância, são dados por: E X = p VAR X p p p. q = = ( ) Diz-se que X, nestas condições, segue uma distribuição de Bernoulli de parâmetro p e escreve-se X Bern( p ). Note-se que 0 p. Raul Laureano 47

Exemplo : X = número de 6 no lançamento de um dado perfeito, ganhando-se se sair 6. Assim, X representa o número de vitórias obtidas num lançamento do dado. X Bern( p = ) 6 f ( ). 6 6 6 = = ( ) F = E X = VAR X 5 5 6 = 6 6 = 36 Exemplo 2: Considerando o lançamento aleatório de um dado 0 vezes e uma vitória se sair um número superior 4. Assim, a probabilidade de sucesso é probabilidade de insucesso é p = 2 = e, consequentemente, a 6 3 q = p = = 2. 3 3 Está-se, pois, na presença de um processo de Bernoulli em que a prova se repete 0 vezes, cada prova tem dois resultados possíveis (sucesso e insucesso), a probabilidade de sucesso é igual em todas as provas e o resultado de uma prova não vai afectar o resultado da prova seguinte (os lançamentos são independentes). Raul Laureano 48

DISTRIBUIÇÕES TEÓRICAS DE VARIÁVEIS ALEATÓRIAS CONTÍNUAS DISTRIBUIÇÃO UNIFORME Uma variável aleatória contínua segue uma distribuição uniforme quando a sua função densidade de probabilidade é constante em todo o intervalo a, b e nula fora desse intervalo. Assim, a função densidade de probabilidade é dada por: ( ) f x = b a 0 se a x b se x < a ou x > b E a sua função de distribuição por: x 0 se x < a F x a ( x ) = f ( u) du = se a x b b a se x > b O valor esperado e a variância, são dados por: E X = a + b 2 VAR X = ( b a ) 2 Diz-se que a V.A. X, nestas condições, segue uma distribuição uniforme em a, b e escreve-se X U ( a, b). 2 Raul Laureano 49

Representações gráficas de X U ( a, b) : Função densidade de probabilidade f ( x ) b a 0 a b x Função de distribuição F ( x ) 0 a b x Exemplo (adaptado de Guimarães e Cabral, 997, p.95): Considere que o atraso (expresso em minutos) nas chegadas à estação de uma cidade, dos comboios directos provenientes de outra cidade, segue U 0, 2. uma distribuição ( ) Qual a probabilidade de ocorrer um atraso compreendido entre os 5 e os 0 minutos? 0 0 5 0 0 5 5 P 5 x 0 = F ( 0) F ( 5) = = = = 0, 46 2 0 2 0 2 2 2 ( ). 0 5 5 P 5 x 0 = = = 0, 46 2 0 2 Em média, qual o atraso que se espera que ocorra na chegada à estação? 0 + 2 2 µ = E X = = = 6 minutos 2 2 Raul Laureano 50

DISTRIBUIÇÃO NORMAL Existe uma grande variedade de fenómenos na vida real que obedecem a uma distribuição normal ou que se aproximam de forma significativa da distribuição normal. Assim, esta distribuição assume especial relevância quando se está na presença variáveis aleatórias contínuas, isto é, que podem assumir um conjunto infinito não numerável de valores. Realce-se que a importância desta distribuição ainda é mais acrescida pois, mediante a verificação de certas condições, certas distribuições de variáveis aleatórias discretas, tais como a distribuição binomial e a de Poisson, podem ser aproximadas à distribuição normal. Diz-se que uma V.A. X segue uma distribuição normal 6 se a sua função densidade de probabilidade for dada por 7 : 2 x µ 2 f ( x ). e σ =, x ] ; + [ 2 2πσ representando µ (miu) a média ( < µ < + ) e σ (sigma) o desvio- -padrão ( σ > 0 ). E, consequentemente, se a função de distribuição for dada por 8 : 2 t µ F ( x ) e σ = dt 2 2 πσ x 6 Também designada por distribuição Gaussiana (ou de Gauss), em homenagem ao matemático alemão Carl Gauss. 7 Recorde-se que e corresponde ao número de Napier e que e = 2, 78288.... Por sua vez, o π (pi) tem o valor de π = 3, 459265.... 8 A função de distribuição não é integrável analiticamente, ou seja, não é possível determinar explicitamente a sua primitiva, pelo que não se obtém uma expressão algébrica para os valores desta função, sendo estes calculados por via numérica. Raul Laureano 5

O valor esperado e a variância são dados por: E X = µ VAR X 2 = σ Diz-se que a V.A. X, nestas condições, segue uma distribuição normal de parâmetros caracterizadores µ e σ e escreve-se X n( ; ) µ σ. Representações gráficas de X n(, ) µ σ : Função densidade de probabilidade (curva normal) f ( x ) Fonte: Adaptado de Guimarães e Cabral (997, p.99) x Função de distribuição F ( x ) x Fonte: Adaptado de Guimarães e Cabral (997, p.99) Raul Laureano 52

Propriedades e características: É uma das distribuições mais utilizadas; A função densidade de probabilidade tem forma de sino e é unimodal (um só máximo, correspondendo a x = µ ); A função densidade de probabilidade é simétrica em torno da sua média. Assim, a média é igual à mediana e igual à moda ( µ = Me = Mo); A função densidade de probabilidade tem pontos de inflexão para x = µ ± σ e aproxima-se assimptoticamente do eixo das abcissas, ou seja, lim f ( x ) 0 x ± = ; Raul Laureano 53

Quaisquer que sejam os parâmetros (µ e σ ) da distribuição normal verifica-se que existe uma proporção de observações constante (área definida pela f.d.p.) entre a média e ± k desvios-padrão. Para os intervalos µ ± σ, µ ± 2σ e µ ± 3σ tem-se: 68,3% µ 95,5% µ 99,7% Fonte: Adaptado de Ramos (2004) µ A distribuição normal é adequada para caracterizar muitos fenómenos físicos (pesos, ) e descreve bem a distribuição dos erros de medição, para além de muitas outras aplicações em que é utilizada. Raul Laureano 54

Qualquer transformação linear de uma V.A. com distribuição normal resulta numa variável também com distribuição normal: Se X n( x; ; ) µ σ então 9 2 2 X ' n( x' = ax + b; µ ' = aµ + b; σ ' = a σ ) em que a e b são constantes e a 0 ; Aditividade da distribuição normal: Tendo k V.A. independentes Xi ( i, 2, 3,..., k ) =, em que X ( ; ) i n µ i σi então a variável T k = ai Xi segue uma distribuição i = k k k normal: T = ; 2. 2 ai Xi n aiµ i a σ i i i = i = i = Deste modo, conclui-se que: k ; i= o Sk = X + X2 +... + Xk = Xi n( k. µ ; σ. k ) o 2 2 2 2 ; 2 X + X n µ + µ σ + σ e 2 2 2 2 ; 2 X X n µ µ σ + σ ; k Xi o com X = i= k se tem X n µ ; σ. k 9 E ax + b = a E X + b e Recorde-se as propriedades do valor esperado e da variância: [ ]. [ ] [ ] 2. [ ] VAR ax + b = a VAR X. Raul Laureano 55

Cálculo das probabilidades de uma V.A. com distribuição normal Uma vez que os parâmetros da distribuição normal, quer a média, quer o desvio-padrão, podem assumir uma infinidade de valores não numeráveis, torna-se impossível apresentar tabelas estatísticas para cada combinação dos dois parâmetros. Assim, recorre-se à chamada distribuição normal padrão (ou normal reduzida, ou normal standard) para calcular as probabilidades de uma variável aleatória X. Assim, se X ( µ ; σ ) então a variável Z = X µ σ (obtida a partir de X, quaisquer que sejam os seus parâmetros) tem distribuição normal de parâmetros 0 e, respectivamente, para a média e para o desvio-padrão. Z X µ = n σ ( 0; ) A variável aleatória contínua Z designa-se por variável estandardizada, reduzida ou normal-padrão. Apenas a função de distribuição ( ) F z = P Z z da distribuição normal- -padrão se encontra tabelada 0 e, usualmente, apenas para valores positivos de Z, com 0 z 3, 49, sendo que as probabilidades para os valores negativos de Z são calculadas tendo em conta a simetria da distribuição normal. 0 Para a distribuição normal-padrão tem-se que f ( z ) =. e 2π 2 t z F ( Z ) =. e 2 dt. É usual representar a função densidade de probabilidade por φ (phi 2π minúsculo) e a função de distribuição por Ф (phi maiúsculo). 2 z 2 e Raul Laureano 56

O Excel disponibiliza as funções NORMDIST e NORMSDIST, para o cálculo das probabilidades, respectivamente, de uma variável com distribuição normal e de uma com distribuição normal-padrão: =NORMDIST(x - nº para o qual se pretende a distribuição; µ média da distribuição; σ desvio-padrão da distribuição; tipo de função). O argumento tipo de função deverá ser um valor lógico, 0 para f ( x ) e, por exemplo, para F ( x ). =NORMSDIST(z - nº para o qual se pretende a distribuição). Só calcula a função de distribuição. Paralelamente, o Excel disponibiliza as funções NORMINV e NORMSINV que permitem determinar o valor para o qual se tem a distribuição, conhecida a respectiva probabilidade acumulada, respectivamente, de uma variável com distribuição normal e de uma com distribuição normal-padrão: =NORMINV(F probabilidade acumulada; µ média da distribuição; σ desvio- -padrão da distribuição) =NORMSINV(F probabilidade acumulada) Então, vejam-se os seguintes exemplos de cálculo de probabilidades: Se X n( 5; 3) tem-se: 8 X 5 8 5 P X = P = P Z = 0, 843 3 3 Note-se que o valor de Z = significa que 8 se encontra desvio-padrão acima da média (8 = 3 + 5)! z 0,00 0,0 0,02 0,0 0,5000 0,5040 0,5080 0, 0,5398 0,5438 0,5478 0,2 0,5793 0,5832 0,587 0,3 0,679 0,627 0,6255 0,4 0,6554 0,659 0,6628 0,5 0,695 0,6950 0,6985 0,6 0,7257 0,729 0,7324 0,7 0,7580 0,76 0,7642 0,8 0,788 0,790 0,7939 0,9 0,859 0,886 0,822,0 0,843 0,8438 0,846, 0,8643 0,8665 0,8686,2 0,8849 0,8869 0,8888,3 0,9032 0,9049 0,9066 Raul Laureano 57

Se X n( 00; 35) tem-se: 00 X 00 00 00 P X < = P < = P Z < 0 = 0, 5 35 35 30 30 00 P X P Z P Z 2 P Z 2 < = < = 0, 9772 0, 0228 35 < = < = = P X 50 P X 50 P Z 50 00 > = = = 35 = P Z, 4286 = P Z, 43 = 0, 9236 = 0, 0764 60 40 60 00 40 00 P X P Z P, 4 Z, 4 < < = < < = 35 35 < < = ( P Z ) ( ) = P Z <, 4 <, 4 = 0, 8729 0, 8729 = 0, 7458 80 80 00 P X P Z P Z 0, 57 P Z 0, 57 = = 0, 757 35 = = Raul Laureano 58

Recorde-se: P Z z = P Z < z ; P Z z = P Z z ; P Z z = P Z z ; P Z z + P Z z = ; P Z z = P Z z ; P Z z = P Z z ; µ σ µ µ σ + µ P µ σ < X < µ + σ = P < Z < = P < Z < 0, 68 σ σ P µ 2σ < X < µ + 2σ = P 2 < Z < 2 0, 95 ; P µ 3σ < X < µ + 3σ = P 3 < Z < 3 0, 99 ; P[ Z z] P[ Z z] P[ Z z] P[ Z z] < = 0, 3336 > = 0, 3336 < = 0, 3336 < = 0, 6664 pelo que consultando a tabela se obtém z : z = 0, 43 z = 0, 43; P[ Z < z] = 0, 988. Pela tabela obtém-se z = 2, 26 ; P[ Z z] P[ Z z] P[ Z z] > = 0, 484 < = 0, 484 < = 0, 56 pelo que consultando a tabela se obtém z = 0, 04. Raul Laureano 59

BIBLIOGRAFIA CONSULTADA Guimarães, Rui e Cabral, José (997) Estatística, Edição Revista, McGraw-Hill. Maroco, João e Bispo, Regina (2003) Estatística aplicada às ciências sociais e humanas, Manuais Universitários, Climepsi Editores. Murteira, Bento, Ribeiro, Carlos, Silva, João e Pimenta, Carlos (2002) Introdução à Estatística, McGraw-Hill. Pedrosa, António e Gama, Sílvio (2004) Introdução Computacional à Probabilidade e Estatística, Porto Editora. Pinto, J. Carlos e Curto, J. (999) Estatística para Economia e Gestão Instrumentos de Apoio à Tomada de Decisão, Edições Sílabo. Ramos, Madalena (2004) Acetatos sobre Probabilidades e Distribuição Normal para apoio às cadeiras de Estatística, ISCTE, não publicado. Reis. Elizabeth, Melo, Paulo, Andrade, Rosa e Calapez, Teresa (200) Estatística Aplicada, Vol., 4ª Edição Revista, Edições Sílabo. Reis. Elizabeth, Melo, Paulo, Andrade, Rosa e Calapez, Teresa (2003) Exercícios de Estatística Aplicada, Vol., Edições Sílabo. Raul Laureano 60

TABELAS ESTATÍSTICAS DISTRIBUIÇÃO NORMAL PADRÃO (OU REDUZIDA OU STANDARD) (Função de distribuição) 2 t z X n( µ = 0; σ = ) F ( Z ) = P[ Z z] =. e 2 dt 2π z 0,00 0,0 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 0,0 0,5000 0,5040 0,5080 0,520 0,560 0,599 0,5239 0,5279 0,539 0,5359 0, 0,5398 0,5438 0,5478 0,557 0,5557 0,5596 0,5636 0,5675 0,574 0,5753 0,2 0,5793 0,5832 0,587 0,590 0,5948 0,5987 0,6026 0,6064 0,603 0,64 0,3 0,679 0,627 0,6255 0,6293 0,633 0,6368 0,6406 0,6443 0,6480 0,657 0,4 0,6554 0,659 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879 0,5 0,695 0,6950 0,6985 0,709 0,7054 0,7088 0,723 0,757 0,790 0,7224 0,6 0,7257 0,729 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,757 0,7549 0,7 0,7580 0,76 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852 0,8 0,788 0,790 0,7939 0,7967 0,7995 0,8023 0,805 0,8078 0,806 0,833 0,9 0,859 0,886 0,822 0,8238 0,8264 0,8289 0,835 0,8340 0,8365 0,8389,0 0,843 0,8438 0,846 0,8485 0,8508 0,853 0,8554 0,8577 0,8599 0,862, 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,880 0,8830,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,905,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,95 0,93 0,947 0,962 0,977,4 0,992 0,9207 0,9222 0,9236 0,925 0,9265 0,9279 0,9292 0,9306 0,939,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,948 0,9429 0,944,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,955 0,9525 0,9535 0,9545,7 0,9554 0,9564 0,9573 0,9582 0,959 0,9599 0,9608 0,966 0,9625 0,9633,8 0,964 0,9649 0,9656 0,9664 0,967 0,9678 0,9686 0,9693 0,9699 0,9706,9 0,973 0,979 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,976 0,9767 2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,982 0,987 2, 0,982 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857 2,2 0,986 0,9864 0,9868 0,987 0,9875 0,9878 0,988 0,9884 0,9887 0,9890 2,3 0,9893 0,9896 0,9898 0,990 0,9904 0,9906 0,9909 0,99 0,993 0,996 2,4 0,998 0,9920 0,9922 0,9925 0,9927 0,9929 0,993 0,9932 0,9934 0,9936 2,5 0,9938 0,9940 0,994 0,9943 0,9945 0,9946 0,9948 0,9949 0,995 0,9952 2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,996 0,9962 0,9963 0,9964 2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,997 0,9972 0,9973 0,9974 2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,998 2,9 0,998 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986 3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990 3, 0,9990 0,999 0,999 0,999 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993 3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995 3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997 3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998 z F(z) 2 [ - F(z) ],282,645,960 2,326 2,576 3,090 3,29 3,89 4,47 0,90 0,95 0,975 0,99 0,995 0,999 0,9995 0,99995 0,999995 0,20 0,0 0,05 0,02 0,0 0,002 0,00 0,000 0,0000 Raul Laureano 6