Estatística Computacional Geração de Variáveis Aleatórias Contínuas 6 Prof. Lorí Viali, Dr. viali@mat.ufrgs.br http://www.mat.ufrgs.br/~viali/ Normal Log-Normal Gama Erlang Beta Weibull Student (t) Qui-Quadrado (χ ) Snedcor (F) A Normal A Normal A distribuição foi introduzida por De Moivre em um artigo de 733. O seu resultado foi estendido por Laplace no seu livro Teoria Analítica das Probabilidades de 8. Abraham DE MOIVRE (667-754) Laplace utilizou a normal na análise de erros de experimentos. O método dos mínimos quadrados foi introduzido por Legendre em 85. Pierre- Simon, Marquis de LAPLACE (749-87) Adrien Marie LEGENDRE (75-833)
Ele foi justificado por Gauss, supondo uma distribuição normal dos erros, em 89 que alegou que já utilizava o método desde 794. Hoje ela é também conhecida como distribuição de Gauss-Moivre-Laplace. Carl Friedrich GAUSS (777-855) f (x).e π. σ x µ. σ Uma variável aleatória X tem uma distribuição normal se sua fdp for do tipo:, x R com - < µ < e σ > Parâmetros A distribuição Normal apresenta dois parâmetros. Uma de localização µ e outro de forma σ >. Neste caso os parâmetros representam a média e a variabilidade do modelo. Exemplos N(; ),8 N(;,5) N(; ),6 N(; ),4,, -6-5 -4-3 - - 3 4 5 6 Cálculo de Probabilidades Solução P(X x) x.e π. σ u µ. σ du? A normal não é integrável através do TFC, isto é, não existe F(x) tal que F (x) f(x). Utilizar integração numérica. Como não é possível fazer isto com todas as curvas, escolheu-se uma para ser tabelada (integrada numericamente).
Forma Padrão A curva escolhida é a N(, ), isto é, com µ e σ. Se X é uma N(µ, σ), então: Z X µ σ Será uma N(; ). A fdp da variável Z é dada por: ϕ(z) z.e π., z R uma vez que µ e σ. A Distribuição N(, ),4,3,,, -4, -3, -, -,,,, 3, 4, Tabelas O que é tabelado é a FDA da variável Z, isto é: P(Z z) z -.e π z - ϕ(u)du u. du Φ(z) A FDA da N(; ),,9,8,7,6,5 Φ(z),4,3, z,, -4, -3, -, -,,,, 3, 4, Valor Esperado A expectância ou valor esperado da Distribuição Beta é dada por: µ E(X) µ 3
A Variância A Variância da Distribuição Normal é dada por: V(X) σ Considerando uma N(µ; σ), determinar: () A moda; () A mediana; (3) A assimetria; (4) A curtose; (5) O coeficiente de variação. Solução Geração µ o µ µ e γ γ 3 µ γ σ Existem muitos métodos para se gerar valores de uma variável normal. Aqui será apresentado o método denominado de Convolução. A geração de valores da normal, por convolução é dado por: k k Ui i N(,) k Fazendo k, tem-se: N(,) Ui 6 i Gerar valores de uma N(, ). Representar os resultados graficamente e calcular todas as principais medidas. 4
Uma variável pode ser modelada A Log-Normal através de uma log-normal se ela for um produto de vários pequenos fatores independentes. Um exemplo típico é o retorno de longo prazo em ações que pode ser considerado como o produto das taxas diárias de retorno. A expressão da fdp da Log- Normal é dada por: f (x) Ou f (x) Forma Geral exp σx π ( ln x µ ) σ lnx exp µ π x σ σ se x, σ > se x, σ > Parâmetros O modelo apresenta um parâmetro de localização µ e um de escala σ. Exemplos A FDA,,8,6,4,, LN(; /8) LN(, /4) LN(; /) LN(; ) LN(; 3/) LN(; ),8,6,4,, -,,,4,8,,6,,4,8 A FD de Distribuição Log-Normal é: ln(x) µ F (x) G sex, σ > σ Onde G é a FD da N(µ; σ) 5
Exemplos Valor Esperado,,9,8,7,6,5,4,3,, R(,5) R() R(,5) R(), x,, 3, 4, 5, 6, 7, 8, 9,, A expectância ou valor esperado da Distribuição da Log-Normal é dada por: µ E(X) exp( µ + σ / ) A Variância da Distribuição Log- Normal é dada por: σ A Variância V(X) exp(µ + ) exp(µ + σ σ ) Considerando uma LN(µ, σ), determinar: () A moda; () A mediana; (3) A assimetria; (4) A curtose; (5) O coeficiente de variação Solução µ e exp( µ ) µ o exp( µ σ ) γ exp( ) exp( σ + σ ) ) γ exp( 4 ) exp(3 ) 3exp( σ + σ σ ) 3 γ exp( σ ) 6
A geração de valores dessa distribuição é feita através do método da convolução: LN( µ, σ ) exp( µ ) exp σ Ui 6 i Gerar valores de uma LN(,). Representar os resultados graficamente e calcular todas as principais medidas. A Gama Para se definir a Distribuição Gama é necessário definir inicialmente a Função Gama. Γ( n) n x x e dx para n > A função Gama é recursiva, isto é: Γ(n) (n - )Γ(n - ) Se n é um inteiro positivo, então: G(n) (n )! E uma vez que : Γ( ) e x dx A função gama é uma generalização do Fatorial. 7
Verificar, ainda, que: Γ π Uma vez definida a Função Gama, pode-se definir, então, a Distribuição Gama: f (x) λ r r x e Γ(r) λx se x > c.c. Parâmetros Onde os parâmetros r > e λ > são denominados de parâmetro de forma (r) e parâmetro de escala (λ). Se r for inteiro então a distribuição Gama é denominada de distribuição de Erlang. Notação: G(λ; r) Intervalo: x Agner Krarup Erlang (878 99) Gama - Exponencial Existe uma relação bastante próxima entre a Gama e a Exponencial. Se r, a distribuição gama se reduz a uma exponencial. Exemplos Se uma variável aleatória X é a soma de r variáveis independentes e exponencialmente distribuídas cada uma com parâmetro λ, então X tem uma densidade Gama com parâmetros r e λ., G(; ) G(; ) G(; 3),8,6,4,,,, 4, 6, 8,,, 8
A FDA,5,4 G(; ) G(3; ) G(5; ) A função F(x) é dada por:,3,, F(x) r r- -λu λ u e - x du Γ(r) se x se x >,,, 4, 6, 8,,, Se r é um inteiro positivo a FDA pode ser integrada por partes fornecendo: r k F(x) λ x e (λx) /k! se x > k que é a soma dos termos de uma Poisson com média λx. Assim a FDA da Poisson pode ser usada para avaliar a Gama. Exemplos,,8 G(; ) G(3; ) G(5; ),6,4,,,, 4, 6, 8,,, O Valor Esperado A Variância A expectância ou valor esperado de uma Distribuição Gama é dada por: A Variância da Distribuição Gama é dada por: µ E(X) r λ V(X) r σ λ 9
Solução Seja X uma G(λ; r). Determinar:. A moda. A mediana 3. A assimetria 4. A curtose 5. O coeficiente de variação µ e? γ r γ r r µ o λ γ 6 r Geração A geração dos valores de uma G(λ, r), com r inteiro, isto é, uma E(λ, r) é feita por meio de: E( λ,r) ln( λ r U i i ) Gerar valores de uma G(; ). Apresentar os resultados de forma tabular e gráfica, calculando todas as principais medidas. A Weibull A Distribuição de Weibull (95) é aplicável a uma série de fenômenos (velocidade de ventos), sendo uma das principais áreas os tempos de falha de componentes elétricos e mecânicos. Ernest Hjalmar Waloddi WEIBULL (887-979)
A função densidade de probabilidade de Weibull é dada por: β β β x γ x γ exp γ δ se x f (x) δ δ c.c. β β β x x exp δ f (x) δ δ se x c.c. Parâmetros Os parâmetros são γ (- < γ < ) o de locação, δ > o de escala e β > o de forma. Quando γ e β, a Weibull se reduz a uma exponencial de parâmetro λ /δ. Notação: W(γ; δ; ou W(δ;.,6,4, Exemplos W(,,) W(,,) W(,3,) W(,4,),,8,6,4,,,,4,8,,6,,4,8 3, 3,6 4, A FDA A função F(x) é dada pela seguinte expressão relativamente simples: β - exp x-γ - se x γ F(x) δ se x < γ β x - exp - F(x) δ se x se x < Exemplos Valor Esperado,,9,8,7,6,5,4,3,, W(,,) W(,,) W(,3,) W(,4,),,,4,8,,6,,4,8 3, 3,6 4, A expectância ou valor esperado de uma Distribuição de Weibull é dada por: µ E(X) γ + δγ + β
A Variância A Variância da Distribuição de Weibull é dada por: σ V(X) δ Γ + Γ + β β Seja X uma W(δ;. Determinar:. A moda. A mediana 3. A assimetria 4. A curtose 5. O coeficiente de variação Solução Geração µ δ[ln()] e / β / β δ - µ o β se β < 3 3 Γ( + 3/ 3µ µ γ δ σ 3 σ 4 3 4 β Γ( + 3/ α) 4γ µ 6 σ µ σ µ γ 3 4 σ A geração dos valores de uma W(; δ;, isto é, uma Weibull com parâmetro de localização nulo é: / β W(; δ, δ[ ln(u)] Gerar valores de uma G(, ; ). Apresentar os resultados de forma tabular e gráfica, calculando todas as principais medidas. A Beta
A distribuição Beta apresenta normalmente duas expressões. Uma denominada de fórmula geral e outra de forma padrão. A forma padrão definida no em [; ] é mais utilizada. A expressão geral da fdp Beta é dada por: Onde: Forma Geral α (x-a) (b-x) f (x) B( α, (b a ) c.c. β- α+β+ α B( α, x (-x) se a x b e α, β > β- dx A função Beta foi introduzida pela primeira vez por Euler. B( α, x α (-x) β- dx B( α, B( β, α) B( α,) / α Γ( α) Γ( B( α, Γ( α + Leonhard Euler (77-783) Forma Padrão A função densidade de probabilidade da Beta padrão é dada por: α β- x (-x) se x e α, β > f (x) B( α, c.c. α β- Γ( α). Γ( B( α, x (-x) dx Γ( α + Aplicações Os parâmetros α > e β > são os de forma. Os valores a e b representam os extremos da distribuição. No formato padrão a e b. Para a descrição de tempos para completar tarefas no planejamento e projeto de sistemas. Usada extensivamente em PERT/CPM. 3
Exemplos,7,4,,8 B(; ) B(; ) B(;) B(; ) B(: ),5 B(5; ),,9,6,3,,,,,3,4,5,6,7,8,9,,7,4,,8 B(; ) B(; ) B(; ) B(; ) B(3; ),5 B(; 3),,9,6,3,,,,,3,4,5,6,7,8,9, A FDA Determinar a representação gráfica da B(,5;,5). F(x) Onde B x (α, é a função Beta Incompleta. Essa função substitui a integral definida da Beta por uma indefinida. x t α (-t) B( α, β- dt Bx ( α, B( α, I x ( α, Assim B x (α, é dada por: α Bx ( α, t (-t) B( α, x x α (-x) β- Enquanto que B(α, é dada por: β- dt Γ( α). Γ( dx Γ( α + A função I x (α, é denominada de Beta incompleta regularizada. O Valor Esperado A expectância ou valor esperado da Distribuição Beta é dada por: µ E(X) α α + β 4
A Variância A Variância da Distribuição da Beta é dada por: σ αβ V(X) ( α + β + ) ( α+ Considerando uma B(α;, determinar: () A moda; () A mediana; (3) A assimetria; (4) A curtose; (5) O coeficiente de variação. Solução µ µ µ µ o o o o α α + β e Amodal se se α > e β > α < e β < α < e β α e β > α e β < α > e β se α β γ γ γ β α( α+β+ ) ( β α) α + β + ( α + β + ) αβ 3( α + β + )[ αβ( α + β 6) + αβ( α + β + )( α + β + 3) ( α+ ] Geração A geração de uma distribuição Beta de parâmetros α a e β b, inteiros é dada por: G(, a) ~ ln( U ) G(, b) i ~ ln( U ) B(a, b) ~ a i G(, a) G(, a) + G(, b) b j j Gerar valores de uma B(; ). Apresentar os resultados de forma tabular e gráfica, calculando todas as principais medidas. 5
A Qui-Quadrado Uma variável aleatória X tem uma distribuição Qui-Quadrado se sua fdp for do tipo: υ x υ f ( x ) e υ Γ x se se x x > Solução Determinar a representação gráfica, em um mesmo diagrama, das seguintes distribuições:,6,4 Q() Q() Q(3) Q(4) Q(5) χ, χ, χ 3, χ 4 e χ 5,,,,, 3, 4, 5, 6, 7, 8, Tabelas A FDA O que é tabelado é a função inversa (percentis), em relação a área à direita (unilateral) de cada curva (uma para cada linha), ou a soma das caudas (bilateral), isto é, a tabela retorna um valor t tal que P(T t) α (unilateral) ou P( T t) α. Não existe uma expressão analítica para F(x) genérica. Ela é avaliada numericamente. 6
Valor Esperado A Variância A expectância ou valor esperado da A Variância da Distribuição da Distribuição Qui-Quadrado é dado por: Qui-Quadrado é dada por: µ E(X) υ. σ V(X) υ. Tabelas O que é tabelado é a função inversa, em relação a área à direita de cada curva (uma para cada linha), isto é, dado um valor de área na cauda direita (α), a tabela retorna um valor x tal que P(χ x) α. Considerando uma χ (ν), determinar: () A moda; () A mediana; (3) A assimetria; (4) A curtose; (5) O coeficiente de variação. µ o ν se ν > µ e ν γ γ Solução 8 ν ν / 3 γ ν Geração A geração de valores de uma Qui- Quadrado com ν gl é divido em dois casos: ν par (primeiro algoritmo) e ν ímpar (segundo algoritmo) χ χ ν ν r ~ ln( i r ~ ln( i U U ), r ν/ i ) + i Z, r ( ν )/ 7
χ 3 Gerar valores de uma. Apresentar os resultados de forma tabular e gráfica, calculando todas as principais medidas. A t (Student) A origem da distribuição t foi um artigo, publicado em 98, por Gosset, químico da cervejaria Guinness de Dublin. Ele não pode publicar o artigo em seu nome daí o pseudônimo. William Sealey Gosset (876-937) Sir Ronald Aylmer Fisher (89-96) A distribuição t, e o teste t, se tornaram bem conhecidos por meio do trabalho de Fisher, que foi quem a nomeou de distribuição de Student. Ela surge sempre que se tenha que estimar o desvio padrão a partir de dados amostrais. Uma variável aleatória X tem uma distribuição t ou de Student se sua fdp for do tipo: f (x) υ + Γ υ+ υ. x πυ Γ + υ ν > Determinar a representação gráfica, em um mesmo diagrama, das seguintes distribuições: t(), t(3), t(), t(5) e Z. 8
Solução Tabelas,4,3 t() t(3) t() t(5) N(: ) O que é tabelado é a função inversa (percentis), em relação a área à direita (unilateral) de cada curva (uma para, cada linha), ou a soma das caudas, (bilateral), isto é, a tabela retorna um, -6-5 -4-3 - - 3 4 5 6 valor t tal que P(T t) α (unilateral) ou P( T t) α. A FDA Valor Esperado Não existe uma expressão A expectância ou valor esperado analítica para F(x) genérica. Ela é da Distribuição t é dado por: avaliada numericamente. µ E(x). A Variância A Variância da Distribuição da t é dada por: Considerando uma t(ν), determinar: () A moda; () A mediana; Var(X) υ υ- (3) A assimetria; (4) A curtose; (5) O coeficiente de variação. 9
Solução µ o µ e γ 3ν 6 γ ν > 4 ν 4 Geração A geração dos valores de uma distribuição t é feito através do quociente de uma normal e uma Qui- Quadrado. t n ~ Z χ n n Onde Z é a normal padrão. Gerar valores de uma t(3). Apresentar os resultados de forma tabular e gráfica, calculando todas as principais medidas. Representar o modelo graficamente. A F (Snedecor) Uma variável aleatória X tem uma distribuição F ou de Snedecor se sua fdp for do tipo: m n m m+ n Γ m n x f(x) m n Γ Γ ( n+ mx) m+ n se x > sex Caracterização Expectância ou Valor esperado n E (X), n > n Variância Var(X) n (m n - ) m(n- )(n- 4) + m é o grau de liberdade do numerador e n do denominador.
Exemplos F(, 3) - F(, 5) - F(5, ) - F(, ),,8,6,4,, 3 6 9 5 Tabelas O que é tabelado é a percentil 95% ou 99% - área à direita de cada curva (uma para cada par de valores numerador, denominador) igual a 5% e %, isto é, x tal que P[F(m, n) x] 5% ou P[F(m, n) x] %. Geração A geração de uma F(m, n) é feita por meio da sua relação com a distribuição Qui-Quadrado. F(m, n) m Zi m i ~ n Zi n i χ m m χ n n m n n χ m χ Gerar valores de uma F(3; ). Apresentar os resultados de forma tabular e gráfica, calculando todas as principais medidas. Distribuições Empíricas Contínuas Seja X uma VAC com valores: x, x,..., x n, agrupada em k classes. Sejam [a ; a );...[a k- ; a k ) os intervalos. Seja ainda g(x i ) a probabilidade empírica da classe i k.
Assim um algoritmo para gerar uma VAC com uma distribuição empírica, agrupada em classes, é: (i) Gerar U; (ii) Se G(x i- ) U < G(x i ) então: X a i- + (a i a i- ).U Exercicio x i g(x i ) [-6; -4),5 [-4; -),5 [-; ),5 [; ),5 [; 4), [4; 6), [6, 8), Gerar 5 valores de uma VAC de acordo com a distribuição empírica fornecida ao lado.