FAMÍLIA EXPONENCIAL DE DISTRIBUIÇÕES

Documentos relacionados
MODELOS DE REGRESSÃO PARA DADOS CONTÍNUOS ASSIMÉTRICOS

Modelos Lineares Generalizados

ALGUNS MODELOS DE VARIÁVEIS ALEATÓRIAS UNIDIMENSIONAIS. Prof.: Idemauro Antonio Rodrigues de Lara

MOQ 13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

A Importância da Estatística na Pesquisa Científica e na Tomada de Decisão

Modelos discretos e contínuos

Distribuições de Probabilidades

Probabilidade e variáveis aleatórias (revisão)

Cap. 6 Variáveis aleatórias contínuas

Cap. 6 Variáveis aleatórias contínuas

5. PRINCIPAIS MODELOS CONTÍNUOS

CE062c - GAMLSS. Silva, J.P; Taconeli, C.A. 09 de outubro, Silva, J.P; Taconeli, C.A. CE062c - GAMLSS 09 de outubro, / 42

A distribuição Weibull Exponencial de Zografos

Regressão de Poisson e parentes próximos

5. PRINCIPAIS MODELOS CONTÍNUOS

MOQ 13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

Um conceito importante em Probabilidades e Estatística é o de

5. PRINCIPAIS MODELOS CONTÍNUOS

Sumário. CAPÍTULO 1 Conceitos preliminares 1. CAPÍTULO 2 Descrição de dados: análise monovariada 47

Teoria das Filas aplicadas a Sistemas Computacionais. Aula 08

Distribuições de Probabilidade Contínuas 1/19

IND 1115 Inferência Estatística Aula 6

Modelos básicos de distribuição de probabilidade

Capítulo 2. Variáveis Aleatórias e Distribuições

PRINCIPAIS MODELOS CONTÍNUOS

INFERÊNCIA EM MODELOS LINEARES GENERALIZADOS ANÁLISE DE DEVIANCE

6- Probabilidade e amostras: A distribuição das médias amostrais

Capítulo 4 - Variáveis aleatórias e distribuições contínuas

CE219 - Controle Estatístico de Qualidade

Teoria das Filas aplicadas a Sistemas Computacionais. Aula 09

Métodos Estatísticos

PRINCIPAIS DISTRIBUIÇÕES DE PROBABILIDADES

CE085 - Estatística Inferencial. derivadas. Prof. Wagner Hugo Bonat. 5 de setembro de Curso de Bacharelado em Estatatística

Professora Ana Hermínia Andrade. Período

Quantis residuais. Luziane Franciscon Acadêmica de Estatística Universidade Federal do Paraná

Distribuições de Probabilidade Discretas

Mais sobre Modelos Continuos

Probabilidade e Estatística. stica. Prof. Dr. Narciso Gonçalves da Silva pessoal.utfpr.edu.

A figura 5.1 ilustra a densidade da curva normal, que é simétrica em torno da média (µ).

Distribuições Contínuas. Estatística. 7 - Distribuição de Probabilidade de Variáveis Aleatórias Contínuas UNESP FEG DPD

4. PRINCIPAIS MODELOS DISCRETOS

Modelos Probabilísticos Teóricos Discretos e Contínuos. Bernoulli, Binomial, Poisson, Uniforme, Exponencial, Normal

4 Modelos Lineares Generalizados

TESTES DE HIPÓTESES Notas de aula. Prof.: Idemauro Antonio Rodrigues de Lara

Cap. 8 Distribuições contínuas e modelo normal

Sistemas Reparáveis - Processo de Contagem

Inferência Bayesiana - Aula 1 -

Inferência Bayesiana

SUMÁRIO. 1 Lista de Modelos Probabilísticos Modelos Discretos Modelos Contínuos... 3

TESTES DE HIPÓTESES E INTERVALOS DE CONFIANÇA EM MODELOS LINEARES GENERALIZADOS

Modelo de regressão estável aplicado a econometria

Modelos Lineares Generalizados - Estimação em Modelos Lineares Generalizados

Prof. Lorí Viali, Dr.

Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência

Modelos Lineares Generalizados - Modelos log-lineares para tabelas de contingência

MOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

Probabilidade II. Departamento de Estatística. Universidade Federal da Paraíba

Modelos Lineares Generalizados - Componentes do Modelo

Técnicas computacionais em probabilidade e estatística II

Probabilidade e Estatística

1 z 1 1 z 2. Z =. 1 z n

1 Probabilidade - Modelos Probabilísticos

Modelos de Distribuição PARA COMPUTAÇÃO

ALGUMAS DISTRIBUIÇÕES CONTÍNUAS DE PROBABILIDADE

CONHECIMENTOS ESPECÍFICOS

Avaliação e Desempenho Aula 5

4. Distribuições de probabilidade e

Exame 2ª Época I (20%)

4. PRINCIPAIS MODELOS DISCRETOS

Probabilidade II. Departamento de Estatística. Universidade Federal da Paraíba

Exemplos Equações de Estimação Generalizadas

Estatística Descritiva e Exploratória

Sumário. 2 Índice Remissivo 11

MLG. 16 de outubro de Curso de Modelos Lineares Generalizado - DEST/UFMG Marcos Oliveira Prates. Marcos Oliveira Prates

rio de Guerra Eletrônica EENEM 2008 Estatística stica e Probabilidade Aleatórias nuas

Ricardo Ehlers Departamento de Matemática Aplicada e Estatística Universidade de São Paulo

Tratamento Estatístico de dados em Física Experimental

Distribuição Gama Inversa: conceitos e propriedades

Coleta e Modelagem dos Dados de Entrada

Processos de Poisson

Fundamentos de Estatística

Bioestatística e Computação I

Escola Superior de Agricultura Luiz de Queiroz Universidade de São Paulo. Variáveis Aleatórias Contínuas

Distribuições de Probabilidade

Probabilidade. 1 Distribuição de Bernoulli 2 Distribuição Binomial 3 Multinomial 4 Distribuição de Poisson. Renata Souza

Tiago Viana Flor de Santana

Coleta e Modelagem dos Dados de Entrada

Capítulo 3: Elementos de Estatística e Probabilidades aplicados à Hidrologia

Teorema do Limite Central

5. PRINCIPAIS MODELOS CONTÍNUOS

Cálculo das Probabilidades e Estatística I

Probabilidade e Modelos Probabilísticos

3 Dados e metodologia

LEEC Probabilidades e Estatística 1 a Chamada 13/06/2005. Parte Prática C (C) M 1% 9% 10% (M) 4% 86% 90% 5% 95% 100%

2. Distribuições amostrais

UMa das abordagens mais úteis para modelagem de sistemas é a caracterização de eventos

2.2 A variável aleatória

Escola Superior de Agricultura Luiz de Queiroz Universidade de São Paulo. Variáveis Aleatórias Discretas

P.62, Exerc. 1.3: Trocar as posições de tipo AB e tipo O.

4. PRINCIPAIS MODELOS DISCRETOS

Transcrição:

FAMÍLIA EXPONENCIAL DE DISTRIBUIÇÕES 1

Os modelos lineares generalizados, propostos originalmente em Nelder e Wedderburn (1972), configuram etensões dos modelos lineares clássicos e permitem analisar a relação funcional entre um conjunto de variáveis independentes e uma variável dependente com distribuição pertencente à família eponencial de distribuições. 2

Uma variável aleatória Y tem distribuição pertencente à família eponencial uni-paramétrica se sua função (densidade) de probabilidade puder ser epressa na forma: f Y ( y θ ) = h( y) ep{ η( θ ) t ( y) b( θ )} ;, (1) sendo θ um parâmetro escalar e h ( ) ( ), t( ), b( ),η são funções reais conhecidas. Diversas distribuições conhecidas podem ser epressas conforme (1), sendo, portanto, pertencentes à família eponencial uni-paramétrica: binomial, Poisson, eponencial, geométrica, normal, gama e normal inversa, dentre outras (as três últimas com a suposição de que um dos parâmetros é conhecido). 3

A família eponencial multi-paramétrica é uma generalização da versão uni-paramétrica, caracterizada por uma função (densidade) de probabilidade da forma: sendo θ um vetor de parâmetros e h( ) ( ), t ( ) b( ) f Y k ; = η i i, i= 1 ( y θ) h( y) ep ( θ) t ( y) b( θ),η funções reais conhecidas i i, Diversas distribuições conhecidas são pertencentes à família eponencial multi-paramétrica, dentre elas: Normal, gama, beta, Weibull e multinomial. 4

A forma canônica da família eponencial é definida a partir de (1), quando η ( θ ) e ( y) tipo identidade, produzindo: f Y ( y θ ) = h( y) ep{ θ y b( θ )} t são funções do ;, (2) configurando um sub-conjunto da família apresentada em (1). Para um modelo linear generalizado, admite-se a família eponencial uni-paramétrica, na forma canônica, com a introdução de um parâmetro φ > 0, associado à dispersão da distribuição: ( θ ) yθ b f ( ; θ ) = ep + c( y, φ) Y y, (3) φ em que θ e φ são parâmetros escalares, denominados parâmetro canônico e parâmetro de dispersão, respectivamente, enquanto b ( ) e ( ) c são funções reais conhecidas. 5

A introdução de φ, conforme descrito em (3), permite contemplar algumas distribuições biparamétricas pertencentes à família eponencial. Dentre as distribuições uni-paramétricas pertencentes à família de distribuição apresentada em (3) podemos destacar a distribuição binomial (com n conhecido) e a distribuição de Poisson; Já entre as distribuições bi-paramétricas podemos destacar a distribuição normal, a gama, a binomial negativa e a normal inversa. Modelos lineares generalizados para as distribuições relacionadas nos dois tópicos anteriores serão apresentados. Diversas etensões dos MLG s (inclusive para outras distribuições) estão disponíveis. 6

Nota 1 A epressão apresentada em (3) pode ser apresentada numa forma mais geral substituindo φ por a ( φ ), sendo ( ) a uma função real conhecida. A título de ilustração, pode-se ter: φ a ( φ ) =, ω em que ω desempenha o papel de um peso associado a cada observação. Eercício 1 - Cada eemplo apresentado na sequência refere-se a uma distribuição que pode ser epressa conforme (3). Fica como eercício identificar os parâmetros canônicos e de dispersão (θ e φ), além das funções b ( ) e ( ) c. Nota 2 Recomendo bastante cuidado quanto à diferença entre parametrizações e notações n as referências bibliográficas sugeridas. 7

Eemplo 1 Seja Y uma variável aleatória que representa a proporção de sucessos em n ensaios de Bernoulli com mesma probabilidade (π ), ou seja: X n Y =, tal que X ~ Binomial( n,π ) Neste caso, verifica-se facilmente que Y é uma variável aleatória discreta, com sua massa de probabilidades sobre o conjunto { 0,1 n,2 n,..., ( n 1) n,1}, com E ( Y ) = µ = π, Var( Y ) π ( π ) n de probabilidades: = 1 e função f n ny ny n ny ( y; n, µ ) = µ ( 1 µ ), y = 0,1 n, 2 n,, ( n 1) n, 1 ; n N ; 0 < µ < 1. Y K Nota A distribuição binomial é uma distribuição de probabilidades discreta, usada habitualmente para modelar a contagem de sucessos em n realizações independentes e igualmente prováveis de um eperimento (fenômeno) com dois desfechos possíveis, ou com um número maior de resultados, classificados em duas categorias. 8

n=5,π=0150 n=5,π=0,50 n=5,π=0,90 P(X=) 0.0 0.2 0.4 0.6 P(X=) 0.0 0.2 0.4 0.6 P(X=) 0.0 0.2 0.4 0.6 0 1 2 3 4 5 0 1 2 3 4 5 0 1 2 3 4 5 n=10,π=0,10 n=10,π=0,50 n=10,π=0,90 P(X=) 0.0 0.1 0.2 0.3 0.4 P(X=) 0.0 0.1 0.2 0.3 0.4 P(X=) 0.0 0.1 0.2 0.3 0.4 0 2 4 6 8 10 0 2 4 6 8 10 0 2 4 6 8 10 Figura 1 Gráficos das funções de probabilidades para a distribuição binomial, considerando diferentes valores para n e π. 9

Eemplo 2 Seja Y uma variável aleatória com distribuição de Poisson de parâmetro µ. f Y e µ y µ y! ( y; µ ) =, y = 0,1,2,...; µ > 0. Nota A distribuição de Poisson é uma distribuição de probabilidades discreta, usada com frequência para modelar a contagem de ocorrências de determinado evento em unidades de tempo ou espaço. 10

µ=1 µ=5 µ=10 P(X=) 0.00 0.08 0.16 0.24 0.32 0.40 P(X=) 0.00 0.08 0.16 0.24 0.32 0.40 P(X=) 0.00 0.08 0.16 0.24 0.32 0.40 0 5 10 15 20 0 5 10 15 20 0 5 10 15 20 Figura 2 Gráficos das funções de probabilidades para a distribuição Poisson, considerando diferentes valores para µ. 11

2 Eemplo 3 Seja Y uma variável aleatória com distribuição Normal de parâmetros µ e σ : f Y 2 1 1 2 ( y; µ, σ ) = ep ( y µ ), σ > 0. 2 2πσ 2 2σ Nota A distribuição Normal é uma distribuição de probabilidades contínua que fundamenta a teoria de modelos lineares. Dentre suas principais propriedades, destacam-se sua simetria, seu suporte no conjunto dos reais e o fato de locação e dispersão serem determinadas por parâmetros distintos. 12

f X () 0.0 0.1 0.2 0.3 0.4 µ=-3, σ 2 =1 µ=0, σ 2 =1 µ=3, σ 2 =1-6 -4-2 0 2 4 6 (a) f X () 0.0 0.1 0.2 0.3 0.4 µ=0, σ 2 =1 µ=0, σ 2 =4 µ=0, σ 2 =9-6 -4-2 0 2 4 6 Figura 3 Gráficos das funções densidade de probabilidades para a distribuição Normal, 2 considerando diferentes valores para µ e σ. (b) 13

Eemplo 4 Seja Y uma variável aleatória com distribuição Gama de média µ e parâmetro de forma ν: ν ν µ yν ν 1 1 f Y ( y; µ, ν ) = y ep, y > 0, µ > 0, ν > 0, sendo Γ( ) =, > 0 Γ( ν ) µ t t e dt 0. Nota Talvez você se lembre da distribuição Gama sob outras parametrizações. Uma usual é a seguinte: f β α 1 βy ; = y e, y > 0, α > 0, β > 0. Γ ( y α, β ) α ( α ) Repare a identidade das duas distribuições se tomarmos µ = α β e ν = α. Nota A distribuição Gama é uma distribuição de probabilidades contínua, com suporte no conjunto dos reais positivos, que serve para a modelagem probabilística de diversas variáveis aleatórias com distribuição assimétrica. 14

1.2 1.0 µ=1, ν=2 µ=1, ν=1 µ=1, ν=0,5 0.6 µ=1, ν=2 µ=2, ν=2 µ=4, ν=2 0.8 0.4 f X () 0.6 f X () 0.4 0.2 0.2 0.0 0.0 0 1 2 3 4 5 0 2 4 6 8 10 Figura 4 Gráficos das funções densidade de probabilidades para a distribuição Gama, considerando diferentes valores para µ e ν. 15

Eemplo 5 Seja Y uma variável aleatória com distribuição Normal Inversa de média µ e parâmetro de forma λ, denotada por Y ~ NI ( µ, λ ), com função densidade de probabilidade dada por: f Y ( y, φ) ( y µ ) 1 2 2 λ λ µ = ep, y > 0, µ > 0. 3 2πy 2µ y ; 2 Nota A distribuição Normal Inversa é uma distribuição de probabilidades contínua, com suporte no conjunto dos reais positivos, que também serve para a modelagem probabilística de variáveis aleatórias com distribuição assimétrica. Apresenta algumas propriedades distintas com relação à distribuição Gama, como o fato de sua variância aumentar a uma taa mais rápida conforme sua média. Além disso, sua assimetria aumenta com o valor de µ e diminui com o aumento de λ. 16

2.0 µ=1, λ=1 µ=1, λ=0,5 µ=0,5, λ=1 µ=2, λ=0,5 µ=0,5, λ=2 1.5 f X () 1.0 0.5 0.0 0 1 2 3 4 5 Figura 4 Gráficos das funções densidade de probabilidades para a distribuição Normal Inversa, considerando diferentes valores para µ e λ. 17

Eemplo 6 Seja Y uma variável aleatória com distribuição binomial negativa de parâmetros µ e k, denotada por Y BN (, k ) ~ µ, com função de probabilidade dada por: f Y ( y, k ) ( k + y) y µ k ( k) y! ( µ + k) k Γ ; µ =, y = 0,1,2,...; k > 0; µ > 0. k + y Γ Nota A distribuição Binomial Negativa é uma distribuição de probabilidades discreta que é usualmente aplicada à modelagem de variáveis referentes a contagens. É uma alternativa à distribuição de Poisson quando a variância da distribuição aumenta mais rapidamente conforme aumenta a média. 18

k=2;µ=2 k=2;µ=5 k=2;µ=10 0.3 0.3 0.3 P(X=) 0.2 0.1 P(X=) 0.2 0.1 P(X=) 0.2 0.1 0.0 0.0 0.0 0 10 20 30 40 50 0 4 8 12 16 20 0 4 8 12 16 20 k=2;µ=5 k=5;µ=5 k=10;µ=5 0.3 0.3 0.3 P(X=) 0.2 0.1 P(X=) 0.2 0.1 P(X=) 0.2 0.1 0.0 0.0 0.0 0 10 20 30 40 50 0 4 8 12 16 20 0 4 8 12 16 20 Figura 6 Gráficos da distribuição de probabilidades Binomial Negativa. 19

Algumas propriedades da família eponencial de distribuições Considere uma variável aleatória cuja função (densidade) de probabilidades pode ser epressa na forma: ( θ ) θ y b f ( ; θ, φ ) = ep + c( y; φ) Y y. φ Decorrem as seguintes propriedades: A função geradora de momentos de Y é dada por: M Y ( t θ ; φ ) ( φ t + θ ) b( θ ) b ; = ep ; φ 20

A média e a variância de Y são dadas, respectivamente, por: d b ( ) ( θ ) Y = µ = = b ( θ ); ( Y ) E d θ 2 ( θ ) ( θ ) d b dµ Var = φ = φb' '( θ ) = φ 2 d θ dθ. Nota - Repare que a variância de Y é fatorada em dois componentes: o primeiro corresponde a um parâmetro de dispersão ( φ ), enquanto o segundo representa a dependência da variância com relação à média da distribuição ( µ ) dµ V =, ao qual chamamos função de variância. dθ A distribuição de Y é univocamente determinada pela função de variância (ou seja, cada função de variância é única para uma particular distribuição). 21

Para uma amostra aleatória 1, Y2 Yn de f Y ( y;θ,φ) Y,...,. A distribuição conjunta fica dada por: f Y n ( y; θ, φ) = fy ( yi; θ, φ) i= 1 θ i = ep n = 1 y i = nb φ n i= 1 ( θ ) θ y ep ep n i i= 1 b φ c ( θ ) + c ( y ; φ ), i ( y ; φ ) i = que, pelo teorema da fatoração de Neyman-Fisher, indica a eistência de uma estatística suficiente n para θ ( i = yi 1 ), se φ for conhecido. Como consequência, dois conjuntos de dados produzindo igual valor para a estatística suficiente produzirão inferências idênticas baseadas na verossimilhança (trataremos disso mais adiante). Eercício 2 Para cada distribuição dos eemplos 1-6, determine a média, a variância e a função de variância. Avalie a forma como a variância está relacionada à média da distribuição com base em V ( µ ). 22