Tema Tendências em Matemática Aplicada e Computacional, 15, N. 1 (2014), 59-71

Documentos relacionados
4 DEFINIÇÃO DA GEOMETRIA, MALHA E PARÂMETROS DA SIMULAÇÃO

Segmentação multiresolução: uma abordagem paralela para segmentação de imagens de alta resolução em arquiteturas de múltiplos núcleos

Um Método para o Cálculo da Inversa de Matrizes Simétricas e Positivas Definidas em Bloco

Modelagem Matemática e Simulação Computacional da Dinâmica de um Robô SCARA

Detecção de Infração em faixa de pedestres sem semáforos utilizando visão computacional e redes neurais

Análise univariada e Multivariada no mapeamento genético da pressão arterial

Um dos conceitos mais utilizados em Matemática

Distribuições Amostrais e Estimação Pontual de Parâmetros

Princípios de Modelagem Matemática Aula 10

EXPERIÊNCIA NUMÉRICA NA MAXIMIZAÇÃO DA PRODUÇÃO E RECEITA AGRÍCOLA DO MELOEIRO E DA ALFACE AMERICANA

Plantas e mapas. Na Aula 17, aprendemos o conceito de semelhança

As combinações. combinatória que envolviam o princípio multiplicativo e as permutações.

Amostragem e distribuições por amostragem

ANÁLISE NUMÉRICA DA REDUÇÃO SONORA PROPORCIONADA POR UM DISPOSITIVO DE PROTEÇÃO JUNTO DA FACHADA DE UM EDIFÍCIO

Funções Geradoras de Variáveis Aleatórias. Simulação Discreta de Sistemas - Prof. Paulo Freitas - UFSC/CTC/INE

CIRCUITOS MAGNÉTICOS LINEARES E NÃO LINEARES

10. CARGAS ACIDENTAIS E MÓVEIS; LINHAS DE INFLUÊNCIA

ENTECA 2003 IV ENCONTRO TECNOLÓGICO DA ENGENHARIA CIVIL E ARQUITETURA

Quem Trabalha Muito e Quem Trabalha Pouco no Brasil? *1

8.5 Cálculo de indutância e densidade de energia magnética

Vetor de Variáveis Aleatórias

Um modelo estocástico para o fluxo de caixa de um plano de previdência de um indivíduo 15

6. Amostragem e estimação pontual

Algoritmos de conformação de feixe em banda dupla para aplicação em bloqueio de RF

DETECÇÃO DE RASTROS DE DUST DEVILS EM IMAGENS DA SUPERFÍCIE DE MARTE

Análise de Dados e Simulação

Calculando áreas. Após terem sido furadas, qual delas possui maior área?

Você já percebeu que os gráficos são cada vez. Relatórios de empresas Análises governamentais Relatórios de pesquisas Balanços financeiros

1E207 - MACROECONOMIA II

ANÁLISE DE CONGLOMERADOS DE ACIDENTES DE TRÂNSITO UTILIZANDO GOOGLE MAPS E ESTATÍSTICA ESPACIAL

CPV O Cursinho que Mais Aprova na GV

Edital 04/2016 Programa de Pós-Graduação em Engenharia Ambiental Processo Seletivo de Doutorado 2016 Instruções

Andréa Maria Pedrosa Valli

Análise de clusters usando classes latentes

Introdução à Inferência Estatística

Modelo de regressão estável aplicado a econometria

Fernando de Pol Mayer

4 Modelos Lineares Generalizados

Modelos Lineares Generalizados - Métodos de Estimação

PROCESSOS DE CARGA E DESCARGA DE UNIDADES FLUTUANTES DE PRODUÇÃO ARMAZENAMENTO E TRANSFERÊNCIA DE PETRÓLEO. Ricardo Saldanha da Gama da Câmara e Souza

A Metodologia de Box & Jenkins

Prof. Adriano Mendonça Souza, Dr. Departamento de Estatística PPGEMQ / PPGEP - UFSM

Exercícios de programação

Método dos Deslocamentos

Intervalos de Confiança

Resumos do IX Congresso Brasileiro de Agroecologia Belém/PA a

MOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

Simulação de Sistemas

Catarina Marques. Estatística II Licenciatura em Gestão. Conceitos: População, Unidade Estatística e Amostra

MODELAÇÃO DA PROPAGAÇÃO DE ONDAS SÍSMICAS ATRAVÉS DO MÉTODO DOS ELEMENTOS DE FRONTEIRA

Modelos de Regressão Linear Simples - Análise de Resíduos

EAE36AM - ESTATÍSTICA APLICADA A EXPERIMENTOS

Técnicas de Parametrizações na Solução de Sistemas de Equações Não Lineares do Fluxo de Carga Continuado

Distribuição Amostral e Estimação Pontual de Parâmetros

Métodos Não Paramétricos

Na figura abaixo, a balança está em equilíbrio e as três melancias têm o mesmo peso. Nessas condições, qual é o peso (em kg) de cada melancia?

Avaliação Monte Carlo do teste para comparação de duas matrizes de covariâncias normais na presença de correlação

UMA ABORDAGEM ANALÍTICA PARA DETECÇÃO DE PONTOS LIMITES E DE BIFURCAÇÃO

Análise teórica Fluidodinâmica e transferência de calor na solução aquosa

Você já participou da reforma ou da construção de um imóvel?

Conceitos básicos, probabilidade, distribuição normal e uso de tabelas padronizadas

Inferência Estatística: DEEST/UFOP Prof.: Spencer Barbosa da Silva

UNIVERSIDADE EDUARDO MONDLANE Faculdade de Engenharia. Transmissão de calor. 3º ano

Simulação Monte Carlo

Uma estatística é uma característica da amostra. Ou seja, se

Emerson Marcos Furtado

Prática X PÊNDULO SIMPLES

Fernando Nogueira Simulação 1

XXVII Olimpíada Brasileira de Matemática GABARITO Segunda Fase

3 Estática das estruturas planas

INTRODUÇÃO À INFERÊNCIA ESTATÍSTICA

Comparação do desempenho de diferentes níveis aleatórios na metodologia PORT

5 Tudo que sobe, desce

Forecasting e ti O i Otim Oti ização de ã d Carteiras com Matlab AULA 3

Noções de Simulação. Ciências Contábeis - FEA - Noturno. 2 o Semestre MAE0219 (IME-USP) Noções de Simulação 2 o Semestre / 23

EMPREGO DA ALGAROBA (Prosopolis juliflora) NA PRODUÇÃO DE CHAPAS DE PARTÍCULAS HOMOGÊNEAS

26 de dezembro de 2007

Avaliação do desempenho de estimadores dos parâmetros da distribuição Pareto corrigidos por Bootstrap

Modelos Lineares Distribuições de Probabilidades Distribuição Normal Teorema Central do Limite. Professora Ariane Ferreira

MODELO MATEMÁTICO DETERMINÍSTICO PARA A PREVISÃO DA TRANSIÇÃO COLUNAR-EQUIAXIAL NA SOLIDIFICAÇÃO BIDIMENSIONAL 1

Redes Complexas Aula 7

A função f(x) = x é a função modular, cujo gráfico. A função g(x) = 1 - x é a função f(x) transformada.

Aula 10 Sistemas Não-lineares e o Método de Newton.

Métodos Quantitativos para Ciência da Computação Experimental

Testes de Hipóteses Paramétricos

Banco de Dados I Introdução. Prof. Dr. Joel da Silva

Disciplina: Processamento Estatístico de Sinais (ENGA83) - Aula 02 / Processos Aleatórios

Princípios de Estatística

O círculo e o número p

Continualizações das Distribuições Geométrica e Poisson

Modelagem e Avaliação de Desempenho. Pós Graduação em Engenharia Elétrica - PPGEE Prof. Carlos Marcelo Pedroso 2016

4 Análises de probabilidade de ruptura de fundações

3 Estimação e Compensação de movimento na codificação de vídeo

COMPARAÇÃO DE MODELOS MISTOS VISANDO À ESTIMAÇÃO DO COEFICIENTE DE HERDABILIDADE PARA DADOS DE PROPORÇÕES

Estimação e Testes de Hipóteses

2 Metodologia. Simulação de defeitos pontuais em um sólido de Lennard-Jones

Parábola. Sumário Parábola com vértice V = (x o, y o ) e reta focal. paralela ao eixo OX... 7

Inferência em Modelos Lineares Assimétricos

Inferência Estatística: Conceitos Básicos II

Universidade Federal de Viçosa Departamento de Estatística

Transcrição:

Tema Tendências em Matemática Apicada e Computaciona, 5, N. (204, 59-7 204 Sociedade Brasieira de Matemática Apicada e Computaciona www.scieo.br/tema doi: 0.5540/tema.204.05.59 Estimação dos Parâmetros da Mistura de Duas Componentes GEV via Agoritmo EM* C.E.G. OTINIANO** e E.C.M. TEIXEIRA Recebido em 9 juho, 203 / Aceito em 26 março, 204 RESUMO. Modeos probabiísticos de misturas finitas de densidades cujas componentes são as densidades da distribuição de Vaor Extrema Generaizado tem uma ampa apicabiidade em diversas áreas como finanças e hidroogia. Neste trabaho, os estimadores dos parâmetros da mistura de duas componentes GEV são obtidos via o agoritmo EM. Apresentamos também iustrações numéricas do comportamento dos estimadores obtidos através de simuação, bem como uma apicação a dados reias. Paavras-chave: GEV, mistura finita 2, agoritmo EM 3. INTRODUÇÃO Dadas as funções de densidade de probabiidade (f.d.p. d-dimensionais f,..., f k de uma famíia de densidades F ={f (x; θ, x R d, θ }, onde éoespaço paramétrico dessa famíia. Uma mistura finita de f,..., f k F é uma f.d.p. h = p f + + p k f k, k p j =, (. j= onde os números p,..., p k são chamados de pesos da mistura e f,..., f k chamadas de componentes da mistura. Devido a sua definição, as misturas finitas de distribuições ou de densidades de probabiidade são frequentemente utiizadas para modear dados de popuações heterogêneas. Tais misturas permitem construir modeos probabiísticos de uma ampa variedade de fenômenos, em por exempo, engenharia, economia e hidroogia, entre outros. Teoria e apicações de misturas podem ser encontradas em Titterington et a. (985, McLachan & Basford (998, e McLachan & Pee (2000. *Pesquisa parciamente financiada por CAPES/PROCAD. **Autor correspondente: Cira Etheowada Guevara Otiniano Departamento de Estatística, Universidade de Brasíia, 7090-900 Brasíia, DF, Brasi. E-mai: cira@unb.br

60 ESTIMAÇÃO DOS PARÂMETROS DA MISTURA DE DUAS COMPONENTES GEV VIA ALGORITMO EM Neste trabaho abordamos a estimação do modeo (. quando d = ek = 2, onde as componentes da mistura são densidades da distribuição de Vaor Extrema Generaizado univariadas. A distribuição de Vaor Extrema Generaizado do ingês generaized extreme vaue (GEV distribution, G γ,éadistribuição imite de máximos (ou mínimos normaizados de sequências de variáveis aeatórias (v.a. s independentes e identicamente distribuídas (i.i.d.. Isto é, seja {X n } ta sequência. Se existirem sequências de números reais {c n }, c n > 0e{d n } tais que ( im P max{x, X 2,...,X n } d n x = G γ (x, n então a distribuição GEV introduzida por Jenkinson (955 é definida por { } exp + γ ] G γ (x; σ, μ = σ (x μ γ, γ = 0 ( exp exp x μ ], γ = 0, σ c n onde γ, μ R e σ>0são parâmetros de forma (índice cauda, ocação e escaa, respectivamente. Aqui + γ σ (x μ 0. A correspondente f.d.p. de G γ,édadapor } + γ ] σ (x μ γ exp { + γ ] σ (x μ γ, γ = 0 g(x; γ,σ,μ = σ σ exp ( x μ σ exp exp ( x μ σ ], γ = 0. Estas distribuições são utiizadas em hidroogia para anaisar a frequência de fuídos e em finanças para cacuar o vaor em risco (VaR de retornos, perdas ou ganhos extremos. Escaante-Sandova (2007 utiizou misturas de duas componentes GEV para avaiar dados sobre a frequência de fuídosde riosde uma região do Noroeste do México. Neste caso, os parâmetros foram estimados por máxima verossimihança utiizando vários métodos computacionais intensivos e as estimativas obtidas por esse procedimento, para vários casos, não convergiram. Outro trabaho que envove mistura de distribuições com aguma componente GEV é o de Kou et a. (202, no qua, com o objetivo de descrever características da veocidade de ventos, os autores apresentam modeos de mistura de duas densidades cujas componentes são Weibu e GEV, Weibu e ognorma, e GEV e ognorma. Neste caso, a estimação também foi feita por máxima verossimihança. Em gera, o métodode máxima verossimihança, o agoritmoem, e os métodos bayesianos são os métodos aternativos de estimação dos parâmetros de misturas finitas de distribuições. Com o objetivo de apresentar um método de estimação aternativo ao de Escaante-Sandova (2007, dos parâmetros de misturas de duas componentes GEV, neste trabaho descrevemos as expressões a serem cacuadas utiizando o agoritmo EM e mostramos o resutado das estimativas para aguns experimentos. Uma apicação com dados reais também é adicionada. (.2 (.3 Tend. Mat. Ap. Comput., 5, N. (204

OTINIANO e TEIXEIRA 6 Este trabaho esta organizado em cinco seções. Na Seção 2, apresentamos os principaisresutados deste trabaho, expressões que devem ser cacuadas para estimar os parâmetros da mistura de duas componentes GEV via agoritmo EM. Na seção 3, mostramos os resutados das estimações obtidas para agumas simuações. Já na seção 4, uma apicação da estimação de um modeo de mistura para dados reais é apresentada. Por fim, nas Seções 5 e 6 fazemos os agradecimentos e citamos as referência bibiográficas, respectivamente. 2 ESTIMAÇÃO VIA ALGORITMO EM O agoritmo EM do ingês Estimation Maximization é um agoritmo cássico da estatística usado para determinar estimativas de parâmetros em modeos de mistura, em modeos com dados fatantes, e em modeos em que a estimação dos parâmetros por máxima verossimihança apresenta probemas. O ivro McLachan & Pee (2000 é uma boa referência para esse assunto. Nesta seção utiizamosoagoritmoem para obteras estimativas demisturas deduas componentes GEV. Seja X uma v.a. com f.d.p. h(x, mistura de duas componentes, definida em (., e dada por h(x; = p g (x; θ + p 2 g 2 (x; θ 2, p + p 2 =, (2. onde = (p,θ,θ 2 com θ = (γ,σ,μ, =, 2eg (.; θ é uma componente de uma das famíias { G γ + := g(γ,σ,μ= + γ ] { σ σ (x μ γ exp + γ ] } } σ (x μ γ,γ>0, G γ := { g(γ,σ,μ= + γ ] { σ σ (x μ γ exp + γ ] } } σ (x μ γ,γ<0, G 0 := {g(0,σ,μ= σ ( exp x μ σ ( exp exp x μ σ ]}. Nesta seção, usamos o Agoritmo EM para obter estimativas de, baseado nos vaores x, x 2,...,x N de uma amostra aeatoria de tamanho N da v.a. X. Uma breve descrição do agoritmo EM, é a seguinte. Se assumirmos que X é observado e gerado por aguma distribuição paramétrica f (x;, chamamos X ({x,...,x N } de dados incompetos. Estes dados são competados com Y ({y,...,y N }, então Z = (X, Y são os dados competos cuja densidade conjunta é f (z; = f (x, y; = f (y/x, f (x;. Com esta nova densidade, defini-se a função de verossimihança dos dados competos L( /z = L( /x, y = f (X, Y ;. O agoritmo EM aterna o Passo E (da esperança, onde obtem-se Q(, (k = En( f (X, Y/ / X, (k ], Tend. Mat. Ap. Comput., 5, N. (204

62 ESTIMAÇÃO DOS PARÂMETROS DA MISTURA DE DUAS COMPONENTES GEV VIA ALGORITMO EM com o Passo M (da maximização, onde se cacua (k+ ao maximizar Q(, (k. No caso de mistura, f (x; = h(x; dada em (2. e Q é dada pea expressão Q(, (k = = i= og(p g (x i ; θ (k g(/x i, (k. Em síntese, na (k + -ésima iteração do passo-e, a atuaização da estimativa de p,é dada por onde, p (k+ = N g(/x i,θ (k = p(k = i= g(/x i,θ (k, (2.2 g (x i ; θ (k g (x i ; θ (k, =, 2, (2.3 ena(k + -ésima iteração do passo-m, a atuaização das estimativas de θ (k+, =, 2são obtidas resovendo as equações g(/x i,θ (k i= θ (k og(g (x i ; θ (k = 0. (2.4 Na estimação de do modeo (2., como cada componente da mistura g (.; θ deve ser de uma das famíias, G γ +, G γ, G 0,há seis possíveis casos para apicar. Os três primeiros casos descritos a seguir correspondem a mistura de componentes da mesma famíia e os outros três casos seguintes correspondem a mistura de componentes das diferentes famíias. Caso. (Mistura de componentes em G 0 As componentes g (.; θ e g 2 (.; θ 2 no modeo (2. são da famíia G 0, onde θ = (σ,μ, =, 2, e = (p,θ,θ 2. No passo-e, as atuaizações de p k+ são obtidas conforme (2.2. As atuaizações de σ (k+, =, 2são obtidas ao resover, utiizando o método de Newton-Raphson, a seguinte equação: i= g(/x i,θ (k { (σ (k + x i μ (k (σ (k x (k i μ 2 (σ (k exp 2 Para as atuaizações de μ (k+, =, 2usamosafórmua fechada μ (k+ = σ (k og i= i= g(/x i,θ (k x i μ (k σ (k g(/x i,θ (k exp( x i /σ (k ]} = 0. (2.5. (2.6 Tend. Mat. Ap. Comput., 5, N. (204

OTINIANO e TEIXEIRA 63 Caso 2. (Mistura de componentes em G +. As componentes g (.; θ e g 2 (.; θ 2 no modeo (2. são da famíia G +, onde θ = (γ,σ,μ, =, 2, e = (p,θ,θ 2. Quando μ σ = μ 2 σ 2, no passo-e, as atuaizações de p k+ são obtidas conforme (2.2 e (2.3. Porém, quando μ σ <μ 2 σ 2, as atuaizações de p k+ são obtidas de (2.2, onde (2.3 é substituido por e g(/x i,θ (k = g(2/x i,θ (k = g (x; θ (k g (x; θ (k = =, x i μ 2 σ 2, μ σ x i <μ 2 σ 2 2 g 2(x; θ (k 2, x i μ 2 σ 2 g (x; θ (k 0, μ σ x i <μ 2 σ 2. No passo-m, as atuaizações de γ (k+, σ (k+,eμ (k+, =, 2são obtidas ao resover as equações i= g(/x i,θ (k (γ (k 2 og i= g(/x i,θ (k (x i μ (k + γ (k + γ (k + γ (k σ (k + γ (k σ (k + γ (k σ (k (x i μ (k σ (k (x i μ (k (x i μ (k ] ] (k /γ ] (x i μ (k (2.7 (2.8 = 0, (2.9 ] (k /γ = 0, (2.0 e i= g(/x i,θ (k + γ (k σ (k + γ (k (x i μ (k + γ (k σ (k ] (x i μ (k ] (k /γ = 0, (2. respectivamente. Tend. Mat. Ap. Comput., 5, N. (204

64 ESTIMAÇÃO DOS PARÂMETROS DA MISTURA DE DUAS COMPONENTES GEV VIA ALGORITMO EM Caso 3. (Mistura de componentes em G. As componentes g (.; θ e g 2 (.; θ 2 no modeo (2. são da famíia G, onde θ = (γ,σ,μ, =, 2, e = (p,θ,θ 2. Quando μ σ = μ 2 σ 2, no passo-e, as atuaizações de p k+ são obtidas conforme (2.2 e (2.3. Porém, quando μ σ <μ 2 σ 2, em vez de (2.3 utiizamos e g(/x i,θ (k = g(2/x i,θ (k = = g (x; θ (k, x i μ σ g (x; θ (k =, μ σ < x i μ 2 σ 2 2 g 2(x; θ (k 2, x i μ σ g (x; θ (k 0, μ σ < x i μ 2 σ 2. (2.2 (2.3 No passo-m, as atuaizações de γ (k+, σ (k+,eμ (k+, =, 2são obtidas ao resover as equações (2.9, (2.0, e (2., respectivamente. Caso 4. (Mistura de componentes em G + G0. As componentes no modeo (2. são g (x; θ G + e g 2 (x; θ 2 G 0, onde θ = (,σ,μ,eθ = (σ 2,μ 2 =, 2. Então = (p,,σ,μ,σ 2,μ 2. No passo-e, as atuaizações de p k+ são obtidas conforme (2.2, onde e g(/x i,θ (k = g(2/x i,θ (k = g (x; θ (k, x i μ σ g (x; θ (k = = 0, x i <μ σ 2 g 2(x; θ (k 2, x i μ σ g (x; θ (k, x i <μ σ. (2.4 (2.5 No passo-m, as atuaizações de γ (k+, σ (k+,eμ (k+ são obtidas ao resover as equações (2.9, (2.0, e (2., respectivamente. Para as atuaizações de σ (k+ 2 e μ (k+ 2 utiizamos (2.5 e (2.6, respectivamente. Tend. Mat. Ap. Comput., 5, N. (204

OTINIANO e TEIXEIRA 65 Caso 5. (Mistura de componentes em G G0. As componentes no modeo (2. são g (x; θ G e g 2 (x; θ 2 G 0, onde θ = (,σ,μ,eθ = (σ 2,μ 2 =, 2. Então = (p,,σ,μ,σ 2,μ 2. No passo-e, as atuaizações de p k+ são obtidas conforme (2.2, onde e g(/x i,θ (k = g(2/x i,θ (k = g (x; θ (k, x i μ σ g (x; θ (k = = 0, x i >μ σ 2 g 2(x; θ (k 2, x i μ σ g (x; θ (k, x i >μ σ. (2.6 (2.7 No passo-m, as atuaizações de γ (k+, σ (k+, μ (k+ σ (k+ 2,eμ (k+ 2 são obtidas como no Caso 4. Caso 6. (Mistura de componentes em G G+. Neste caso, g (x; θ G + e g 2 (x; θ 2 G onde θ = (γ,σ,μ, =, 2and = (p,,σ,μ,,σ 2,μ 2. Consideramos os dois possíveis sub casos: Quando μ σ <μ 2 σ 2 e g(/x i,θ (k = g(2/x i,θ (k = g (x; θ (k, μ σ x i μ 2 σ 2 g (x; θ (k = = 0, x i <μ σ, x i >μ 2 σ 2 2 g 2(x; θ (k 2, μ σ x i μ 2 σ 2 g (x; θ (k, x i <μ σ 0, x i >μ 2 σ 2. (2.8 (2.9 Tend. Mat. Ap. Comput., 5, N. (204

66 ESTIMAÇÃO DOS PARÂMETROS DA MISTURA DE DUAS COMPONENTES GEV VIA ALGORITMO EM E quando μ σ μ 2 σ 2 g(/x i,θ (k =, x i >μ σ 0, c.c. (2.20 and g(2/x i,θ (k, x i μ 2 σ 2 = 0, c.c.. (2.2 Neste caso as atuaizações de p k+,são obtidas conforme γ (k+, σ (k+,eμ (k+, =, 2são obtidas ao resover as equações (2.2, (2.9, (2.0, e (2., respectivamente. 3 SIMULAÇÃO Nesta seção, testamos via simuação as estimativas de do modeo (2. para a mistura de componetes de diferentes famíias, o que corresponde trabahar com os casos (4-(6, pois os casos (-(3 tratam de componentes da mesma famíiaquesão mais facimente cacuados. Para isto, seguimos o seguinte procedimento:. Geramos amostras aeatórias de tamanho n = 00 para cada escoha do vetor. 2. A amostra aeatória da variáve aeatória X cuja densidade é a mistura (2.é gerada como segue: (a Gerar duas variáveis uniformes u eu2. (b Se u < p,então usamos u 2 para gerar um vaor x da v.a. X de (2., onde x = G (u 2 e G é a distribuição acumuada g. (c Se u p,então usamos u 2 para gerar um vaor x da v.a. X, onde x = G 2 (u 2 e G 2 é a distribuição acumuada g 2. 3. Cacuamos iterativamente os estimadores de utiizando as expressões de g(/x i,θ (k, =, 2 mostradas nos casos (4-(6. 4. A regra de parada que utiizamos no Agoritmo EM éog(l (k+ ] og(l (k ]< n0 5. 5. Obtemos estimativas de utiizando 00 amostras de tamanho 00, então cacuamos a média e o erro quadrático médio de por Monte Caro. Tais resutados são mostrados nas Tabeas 2 e 3. Definimos vários experimentos, vaores de, para testar o comportamento dos estimadores do agoritmo EM. Esses experimentos mostrados na Tabea foram escohidos de ta maneira a contempar os casos (4-(6. Tend. Mat. Ap. Comput., 5, N. (204

OTINIANO e TEIXEIRA 67 Os experimentos 4,i, 5,i, 6,ia,e 6,ib, i =, 2, 3, correspondem aos casos (4, (5, e (6, respectivamente. Nas Figuras -4, comparamos a densidades de uma amostra h(x; com a densidade h(x; ˆ, onde os vaores de ˆ são as médias de ˆ, mostradas na Tabea 2. Por essas figuras podemos concuir que o agoritmo EM teve um bom desempenho, pois a densidade h(x; ˆ teve um bom ajuste, em quase todos os experimentos exceto no caso 6,2b. Os resutados do erro quadrático médio das estimativas são mostrados na Tabea 3, os quais confirmam que os resutados da Tabea são bons estimadores dos parâmetros em anáise. Novamente apenas o caso 6,2b não foi muito bom. Tabea : Experimentos. p σ σ 2 μ μ 2 4, 0.4 0 2 0 4,2 0.4 0.5 0 0.5 3 2 4,3 0.6 2 0 2 0 5, 0.5 0.5 0 2 0 5,2 0.3 0.5 0 0.5 2.5 2 0 5,3 0.4 0.4 0 0.5 2.5 3 6,a 0. 0.5 0.5 6,2a 0.8 2 0.5 3 0 6,3a 0.4 0.5 3 0 6,b 0.8 2 0.5 3 7 6,2b 0. 0.5 0.5 6,3b 0.4 0.5 0.5 0.5 0.5 4 Tabea 2: Média de ˆ. ˆ n ˆp ˆ ˆ ˆσ ˆσ 2 ˆμ ˆμ 2 ˆ 4, 00 0.3993.0779 0.9979.9997 0.5626 32 ˆ 4,2 00 0.3992 0.9209 0.4962 2.9999.5485 2.0073 ˆ 4,3 00 0.5996 2.0006.9647 0.9992 0.8902 46 ˆ 5, 00 0.4926 0.565.033 0.9993 2.005 0.037 ˆ 5,2 00 0.2986 0.535 0.4936 2.4999.9978 0.04 ˆ 5,3 00 0.3926 0.5293 0.4995 2.4999 0.999 3.0634 ˆ 6,a 00 0.0974.3900 0.5449 0.955.0775.3823 0.9976 ˆ 6,2a 00 0.2993 2.0003 0.5370 2.9750.0706 0.539 2 ˆ 6,3a 00 0.3993.0955 0.5325 0.9980 4.67 0.5645 06 ˆ 6,b 00 0.8053 2.0008 0.5842 2.9542.000 6.8273 0.9994 ˆ 6,2b 00 0.4958 0.9584 0.5475 0.9869.0342 3.9027 0.9986 ˆ 6,3b 00 0.3963 0.9900 0.549 0.4930 0.4993 3.4549.0027 Tend. Mat. Ap. Comput., 5, N. (204

68 ESTIMAÇÃO DOS PARÂMETROS DA MISTURA DE DUAS COMPONENTES GEV VIA ALGORITMO EM Tabea 3: Erro quadrático médio de ˆ. ˆ n ˆp ˆ ˆ ˆσ ˆσ 2 ˆμ ˆμ 2 ˆ 4, 00 06 0.0468 00 00 0.933 0.0455 ˆ 4,2 00 2 0.2394 0 00 0.3037 0.0886 ˆ 4,3 00 09 00 23 00 0.027 3 ˆ 5, 00 7 66 5 00 00 70 ˆ 5,2 00 3 00 00 00 0.067 ˆ 5,3 00 3 89 00 00 00 0.0643 ˆ 6,a 00 04 0.3536 93 0.097 98 0.675 00 ˆ 6,2a 00 7 00 0.020 49 0.0449 0.040 00 ˆ 6,3a 00 08 0.0460 32 00 0 0.99 00 ˆ 6,b 00 7 00 0.020 49 0.0449 0.040 00 ˆ 6,2b 00 25 27 60 0.046 0.035.24 00 ˆ 6,3b 00 23 0.2966 44 2 00 0.3004 00 0.35 0.4 0.30 0.5 0.3 0.4 0.5 0.0 0.2 0. 0.3 0.2 0. 0.0 0.0 5 0 5 0 5 0 5 20 5 0 5 0 5 0 5 20 5 0 5 0 5 0 5 20 Figura : Gráfico das densidades h(x; (curva contínua e h(x; ˆ (curva pontihada para 4,, 4,2 and 4,3, de esquerda para direita. 0.30 0.35 0.4 0.5 0.30 0.5 0.3 0.2 0.0 0.0 0. 0.0 0 5 0 5 0 0 5 0 5 0 0 5 0 5 0 Figura 2: Gráfico das densidades h(x; (curva contínua e h(x; ˆ (curva pontihada para 5,, 5,2 e 5,3. Tend. Mat. Ap. Comput., 5, N. (204

OTINIANO e TEIXEIRA 69 0.4 0.35 0.30 0.3 0.2 0.30 0.5 0.5 0. 0.0 0.0 0.0 0 5 0 5 0 0 5 0 5 0 5 0 5 0 5 0 5 20 Figura 3: Gráfico das densidadesh(x; (curva contínua e h(x; ˆ (curva pontihada para 6,a, 6,2a e 6,3a. 0.5 0.35 0.30 0.5 0.4 0.3 0.0 0.5 0.0 0.2 0. 0.0 5 0 5 0 5 0 5 20 20 0 0 0 20 5 0 5 0 5 0 5 Figura 4: Gráfico das densidadesh(x; (curva contínua e h(x; ˆ (curva pontihada para 6,b, 6,2b e 6,3b. 4 APLICAÇÃO Para demonstrar a apicabiidade da mistura (2., ajustamos o ogaritmo do consumo per capita de petróeo em 35 países no ano de 200. Os dados foram obtidos no endereço http:// data.wordbank.org/indicator/eg.use.pcap.kg.oe. Para esses dados, os vaores dos parâmetros estimados do modeo (2., peo agoritmo EM, foram p = 0.5, σ = 0.555666, σ 2 = 0.59857, μ = 6.44, μ 2 = 8.235. O que indica a mistura de duas componentes da famíia G 0. Na Figura 5 mostra-se a densidade ajustada aos dados. O QQ-Pot da Figura 6, mostra que o ajustamento da mistura de duas distribuições com densidade Gumbe é adequado. 5 CONCLUSÕES Neste artigo, os estimadores dos parâmetros do modeo (2. são dados em seis possíveis casos, usando o AgoritmoEM. O método de estimação é testado com doze experimentos. Apenas para um desses experimentos o erro quadrático médio não foi suficientemente pequeno. Isso pode ter Tend. Mat. Ap. Comput., 5, N. (204

70 ESTIMAÇÃO DOS PARÂMETROS DA MISTURA DE DUAS COMPONENTES GEV VIA ALGORITMO EM Figura 5: Histograma e função densidade de probabiidade ajustada aos dados de petróeo para mistura de duas componentes Gumbe com ˆ = (0.506, 0.523, 0.5954, 6.4758, 8.206. Figura 6: QQ-Pot dados de petróeo para mistura de duas componentes Gumbe com com ˆ = (0.506, 0.523, 0.5954, 6.4758, 8.206. ocorrido peo fato dos parâmetros de ocação estarem muito distantes. Finamente, utiizamos dados reais para mostrar uma apicação do agoritmo EM. Não fizemos comparação de nossas estimativas com as de por exempo Atienza-Sandova (2007, pois os agoritmos por ees utiizados demandam um custo computaciona intensivo. O tempo computaciona para o cácuo de nossas estimativas foi inferior a um minuto. AGRADECIMENTOS Agradecemos aos revisores deste artigo por seus vaiosos comentários para mehorar a primeira versão. Agradecemos também as agências de fomento à pesquisa CAPES/PROCAD e DPP/UnB peo financiamento parcia para este trabaho. Tend. Mat. Ap. Comput., 5, N. (204

OTINIANO e TEIXEIRA 7 ABSTRACT. Probabiistic modes of finite mixtures with components Generaized Extrema Vaue (GEV distributions are widey appied in diverse areas such as finance and hydroogy. In this work, the estimators of the parameters of the GEV mixture of two components are obtained via the EM agorithm. We aso present numerica exampes of the behavior of the estimates obtained through of simuation, we as an appication to rea data. Keywords: GEV, finite mixture, EM agorithm. REFERÊNCIAS ] C. Escaante-Sandova. A Mixed distribution with EV and GEV components for anayzing heterogeneous sampes.ingeniería Investigación y Tecnoogía 8, 3 (2007, 23 33. 2] R. Kou, S.R. Rayapudi, S. Narasimham & K.M. Pakkurthi. Mixture probabiity distribution functions to mode wind speed distributions. Internationa Journa of Energy and Environmenta Engineering, (202, 0. 3] G.J. McLachan & K.E. Basford. Mixture modes. Marce Dekker, NewYork, (988. 4] G.J. McLachan & D. Pee. Finite mixture modes. Wiey, New York, (2000. 5] D.M. Titterington, A.M.F. Smith & U.E. Makov. Statistica anaysis of finite mixture distributions. Wiey, NewYork, (985. Tend. Mat. Ap. Comput., 5, N. (204