FAMÍLIA EXPONENCIAL DE DISTRIBUIÇÕES

FAMÍLIA EXPONENCIAL DE DISTRIBUIÇÕES 1

Os modelos lineares generalizados, propostos originalmente em Nelder e Wedderburn (1972), configuram etensões dos modelos lineares clássicos e permitem analisar a relação funcional entre um conjunto de variáveis independentes e uma variável dependente com distribuição pertencente à família eponencial de distribuições. 2

Uma variável aleatória Y tem distribuição pertencente à família eponencial uni-paramétrica se sua função (densidade) de probabilidade puder ser epressa na forma: f Y ( y θ ) = h( y) ep{ η( θ ) t ( y) b( θ )} ;, (1) sendo θ um parâmetro escalar e h ( ) ( ), t( ), b( ),η são funções reais conhecidas. Diversas distribuições conhecidas podem ser epressas conforme (1), sendo, portanto, pertencentes à família eponencial uni-paramétrica: binomial, Poisson, eponencial, geométrica, normal, gama e normal inversa, dentre outras (as três últimas com a suposição de que um dos parâmetros é conhecido). 3

A família eponencial multi-paramétrica é uma generalização da versão uni-paramétrica, caracterizada por uma função (densidade) de probabilidade da forma: sendo θ um vetor de parâmetros e h( ) ( ), t ( ) b( ) f Y k ; = η i i, i= 1 ( y θ) h( y) ep ( θ) t ( y) b( θ),η funções reais conhecidas i i, Diversas distribuições conhecidas são pertencentes à família eponencial multi-paramétrica, dentre elas: Normal, gama, beta, Weibull e multinomial. 4

A forma canônica da família eponencial é definida a partir de (1), quando η ( θ ) e ( y) tipo identidade, produzindo: f Y ( y θ ) = h( y) ep{ θ y b( θ )} t são funções do ;, (2) configurando um sub-conjunto da família apresentada em (1). Para um modelo linear generalizado, admite-se a família eponencial uni-paramétrica, na forma canônica, com a introdução de um parâmetro φ > 0, associado à dispersão da distribuição: ( θ ) yθ b f ( ; θ ) = ep + c( y, φ) Y y, (3) φ em que θ e φ são parâmetros escalares, denominados parâmetro canônico e parâmetro de dispersão, respectivamente, enquanto b ( ) e ( ) c são funções reais conhecidas. 5

A introdução de φ, conforme descrito em (3), permite contemplar algumas distribuições biparamétricas pertencentes à família eponencial. Dentre as distribuições uni-paramétricas pertencentes à família de distribuição apresentada em (3) podemos destacar a distribuição binomial (com n conhecido) e a distribuição de Poisson; Já entre as distribuições bi-paramétricas podemos destacar a distribuição normal, a gama, a binomial negativa e a normal inversa. Modelos lineares generalizados para as distribuições relacionadas nos dois tópicos anteriores serão apresentados. Diversas etensões dos MLG s (inclusive para outras distribuições) estão disponíveis. 6

Nota 1 A epressão apresentada em (3) pode ser apresentada numa forma mais geral substituindo φ por a ( φ ), sendo ( ) a uma função real conhecida. A título de ilustração, pode-se ter: φ a ( φ ) =, ω em que ω desempenha o papel de um peso associado a cada observação. Eercício 1 - Cada eemplo apresentado na sequência refere-se a uma distribuição que pode ser epressa conforme (3). Fica como eercício identificar os parâmetros canônicos e de dispersão (θ e φ), além das funções b ( ) e ( ) c. Nota 2 Recomendo bastante cuidado quanto à diferença entre parametrizações e notações n as referências bibliográficas sugeridas. 7

Eemplo 1 Seja Y uma variável aleatória que representa a proporção de sucessos em n ensaios de Bernoulli com mesma probabilidade (π ), ou seja: X n Y =, tal que X ~ Binomial( n,π ) Neste caso, verifica-se facilmente que Y é uma variável aleatória discreta, com sua massa de probabilidades sobre o conjunto { 0,1 n,2 n,..., ( n 1) n,1}, com E ( Y ) = µ = π, Var( Y ) π ( π ) n de probabilidades: = 1 e função f n ny ny n ny ( y; n, µ ) = µ ( 1 µ ), y = 0,1 n, 2 n,, ( n 1) n, 1 ; n N ; 0 < µ < 1. Y K Nota A distribuição binomial é uma distribuição de probabilidades discreta, usada habitualmente para modelar a contagem de sucessos em n realizações independentes e igualmente prováveis de um eperimento (fenômeno) com dois desfechos possíveis, ou com um número maior de resultados, classificados em duas categorias. 8

n=5,π=0150 n=5,π=0,50 n=5,π=0,90 P(X=) 0.0 0.2 0.4 0.6 P(X=) 0.0 0.2 0.4 0.6 P(X=) 0.0 0.2 0.4 0.6 0 1 2 3 4 5 0 1 2 3 4 5 0 1 2 3 4 5 n=10,π=0,10 n=10,π=0,50 n=10,π=0,90 P(X=) 0.0 0.1 0.2 0.3 0.4 P(X=) 0.0 0.1 0.2 0.3 0.4 P(X=) 0.0 0.1 0.2 0.3 0.4 0 2 4 6 8 10 0 2 4 6 8 10 0 2 4 6 8 10 Figura 1 Gráficos das funções de probabilidades para a distribuição binomial, considerando diferentes valores para n e π. 9

Eemplo 2 Seja Y uma variável aleatória com distribuição de Poisson de parâmetro µ. f Y e µ y µ y! ( y; µ ) =, y = 0,1,2,...; µ > 0. Nota A distribuição de Poisson é uma distribuição de probabilidades discreta, usada com frequência para modelar a contagem de ocorrências de determinado evento em unidades de tempo ou espaço. 10

µ=1 µ=5 µ=10 P(X=) 0.00 0.08 0.16 0.24 0.32 0.40 P(X=) 0.00 0.08 0.16 0.24 0.32 0.40 P(X=) 0.00 0.08 0.16 0.24 0.32 0.40 0 5 10 15 20 0 5 10 15 20 0 5 10 15 20 Figura 2 Gráficos das funções de probabilidades para a distribuição Poisson, considerando diferentes valores para µ. 11

2 Eemplo 3 Seja Y uma variável aleatória com distribuição Normal de parâmetros µ e σ : f Y 2 1 1 2 ( y; µ, σ ) = ep ( y µ ), σ > 0. 2 2πσ 2 2σ Nota A distribuição Normal é uma distribuição de probabilidades contínua que fundamenta a teoria de modelos lineares. Dentre suas principais propriedades, destacam-se sua simetria, seu suporte no conjunto dos reais e o fato de locação e dispersão serem determinadas por parâmetros distintos. 12

f X () 0.0 0.1 0.2 0.3 0.4 µ=-3, σ 2 =1 µ=0, σ 2 =1 µ=3, σ 2 =1-6 -4-2 0 2 4 6 (a) f X () 0.0 0.1 0.2 0.3 0.4 µ=0, σ 2 =1 µ=0, σ 2 =4 µ=0, σ 2 =9-6 -4-2 0 2 4 6 Figura 3 Gráficos das funções densidade de probabilidades para a distribuição Normal, 2 considerando diferentes valores para µ e σ. (b) 13

Eemplo 4 Seja Y uma variável aleatória com distribuição Gama de média µ e parâmetro de forma ν: ν ν µ yν ν 1 1 f Y ( y; µ, ν ) = y ep, y > 0, µ > 0, ν > 0, sendo Γ( ) =, > 0 Γ( ν ) µ t t e dt 0. Nota Talvez você se lembre da distribuição Gama sob outras parametrizações. Uma usual é a seguinte: f β α 1 βy ; = y e, y > 0, α > 0, β > 0. Γ ( y α, β ) α ( α ) Repare a identidade das duas distribuições se tomarmos µ = α β e ν = α. Nota A distribuição Gama é uma distribuição de probabilidades contínua, com suporte no conjunto dos reais positivos, que serve para a modelagem probabilística de diversas variáveis aleatórias com distribuição assimétrica. 14

1.2 1.0 µ=1, ν=2 µ=1, ν=1 µ=1, ν=0,5 0.6 µ=1, ν=2 µ=2, ν=2 µ=4, ν=2 0.8 0.4 f X () 0.6 f X () 0.4 0.2 0.2 0.0 0.0 0 1 2 3 4 5 0 2 4 6 8 10 Figura 4 Gráficos das funções densidade de probabilidades para a distribuição Gama, considerando diferentes valores para µ e ν. 15

Eemplo 5 Seja Y uma variável aleatória com distribuição Normal Inversa de média µ e parâmetro de forma λ, denotada por Y ~ NI ( µ, λ ), com função densidade de probabilidade dada por: f Y ( y, φ) ( y µ ) 1 2 2 λ λ µ = ep, y > 0, µ > 0. 3 2πy 2µ y ; 2 Nota A distribuição Normal Inversa é uma distribuição de probabilidades contínua, com suporte no conjunto dos reais positivos, que também serve para a modelagem probabilística de variáveis aleatórias com distribuição assimétrica. Apresenta algumas propriedades distintas com relação à distribuição Gama, como o fato de sua variância aumentar a uma taa mais rápida conforme sua média. Além disso, sua assimetria aumenta com o valor de µ e diminui com o aumento de λ. 16

2.0 µ=1, λ=1 µ=1, λ=0,5 µ=0,5, λ=1 µ=2, λ=0,5 µ=0,5, λ=2 1.5 f X () 1.0 0.5 0.0 0 1 2 3 4 5 Figura 4 Gráficos das funções densidade de probabilidades para a distribuição Normal Inversa, considerando diferentes valores para µ e λ. 17

Eemplo 6 Seja Y uma variável aleatória com distribuição binomial negativa de parâmetros µ e k, denotada por Y BN (, k ) ~ µ, com função de probabilidade dada por: f Y ( y, k ) ( k + y) y µ k ( k) y! ( µ + k) k Γ ; µ =, y = 0,1,2,...; k > 0; µ > 0. k + y Γ Nota A distribuição Binomial Negativa é uma distribuição de probabilidades discreta que é usualmente aplicada à modelagem de variáveis referentes a contagens. É uma alternativa à distribuição de Poisson quando a variância da distribuição aumenta mais rapidamente conforme aumenta a média. 18

k=2;µ=2 k=2;µ=5 k=2;µ=10 0.3 0.3 0.3 P(X=) 0.2 0.1 P(X=) 0.2 0.1 P(X=) 0.2 0.1 0.0 0.0 0.0 0 10 20 30 40 50 0 4 8 12 16 20 0 4 8 12 16 20 k=2;µ=5 k=5;µ=5 k=10;µ=5 0.3 0.3 0.3 P(X=) 0.2 0.1 P(X=) 0.2 0.1 P(X=) 0.2 0.1 0.0 0.0 0.0 0 10 20 30 40 50 0 4 8 12 16 20 0 4 8 12 16 20 Figura 6 Gráficos da distribuição de probabilidades Binomial Negativa. 19

Algumas propriedades da família eponencial de distribuições Considere uma variável aleatória cuja função (densidade) de probabilidades pode ser epressa na forma: ( θ ) θ y b f ( ; θ, φ ) = ep + c( y; φ) Y y. φ Decorrem as seguintes propriedades: A função geradora de momentos de Y é dada por: M Y ( t θ ; φ ) ( φ t + θ ) b( θ ) b ; = ep ; φ 20

A média e a variância de Y são dadas, respectivamente, por: d b ( ) ( θ ) Y = µ = = b ( θ ); ( Y ) E d θ 2 ( θ ) ( θ ) d b dµ Var = φ = φb' '( θ ) = φ 2 d θ dθ. Nota - Repare que a variância de Y é fatorada em dois componentes: o primeiro corresponde a um parâmetro de dispersão ( φ ), enquanto o segundo representa a dependência da variância com relação à média da distribuição ( µ ) dµ V =, ao qual chamamos função de variância. dθ A distribuição de Y é univocamente determinada pela função de variância (ou seja, cada função de variância é única para uma particular distribuição). 21

Para uma amostra aleatória 1, Y2 Yn de f Y ( y;θ,φ) Y,...,. A distribuição conjunta fica dada por: f Y n ( y; θ, φ) = fy ( yi; θ, φ) i= 1 θ i = ep n = 1 y i = nb φ n i= 1 ( θ ) θ y ep ep n i i= 1 b φ c ( θ ) + c ( y ; φ ), i ( y ; φ ) i = que, pelo teorema da fatoração de Neyman-Fisher, indica a eistência de uma estatística suficiente n para θ ( i = yi 1 ), se φ for conhecido. Como consequência, dois conjuntos de dados produzindo igual valor para a estatística suficiente produzirão inferências idênticas baseadas na verossimilhança (trataremos disso mais adiante). Eercício 2 Para cada distribuição dos eemplos 1-6, determine a média, a variância e a função de variância. Avalie a forma como a variância está relacionada à média da distribuição com base em V ( µ ). 22