Estrutura de covariância espacial multivariada não separável

Tamanho: px
Começar a partir da página:

Download "Estrutura de covariância espacial multivariada não separável"

Transcrição

1 Estrutura de covariância espacial multivariada não separável Rafael Santos Erbisti Universidade Federal do Rio de Janeiro Instituto de Matemática Departamento de Métodos Estatísticos 2015

2 Estrutura de covariância espacial multivariada não separável Rafael Santos Erbisti Dissertação de Mestrado submetida ao Programa de Pós-Graduação em Estatística do Instituto de Matemática da Universidade Federal do Rio de Janeiro - UFRJ, como parte dos requisitos necessários à obtenção do título de Mestre em Estatística. Aprovada por: Thaís Cristina Oliveira da Fonseca DME/IM - UFRJ - Orientadora. Mariane Branco Alves DME/IM - UFRJ - Coorientadora. Alexandra Mello Schmidt DME/IM - UFRJ. Juliano Junqueira Assunção Dpto. Economia - PUC Rio. Rio de Janeiro, RJ - Brasil 2015 ii

3 CIP - Catalogação na Publicação E65e Erbisti, Rafael Santos Estrutura de covariância espacial multivariada não separável / Rafael Santos Erbisti. -- Rio de Janeiro, f. Orientadora: Thaís Cristina Oliveira da Fonseca. Coorientadora: Mariane Branco Alves. Dissertação (mestrado) - Universidade Federal do Rio de Janeiro, Instituto de Matemática, Programa de Pós-Graduação em Estatística, geoestatística. 2. funções de covariância cruzada. 3. funções de covariância espacial multivariada não separáveis. 4. dimensões latentes. 5. inferência bayesiana. I. Fonseca, Thaís Cristina Oliveira da, orient. II. Alves, Mariane Branco, coorient. III. Título. Elaborado pelo Sistema de Geração Automática da UFRJ com os dados fornecidos pelo(a) autor(a). iii

4 Aos meus pais, pela educação, exemplo e incentivo que sempre deram. iv

5 Agradecimentos A todos que contribuíram para a realização deste trabalho, fica expresso aqui minha gratidão, especialmente: As minhas orientadoras, Thais Fonseca e Mariane Alves, pela disponibilidade e dedicação. Agradeço por poder trabalhar com tão excelentes profissionais. O conhecimento e experiência transmitidos por vocês foram essenciais para meu desenvolvimento. Aos meus pais, Renzo Erbisti e Bellanir Erbisti, por sempre acreditarem e me apoiarem em todos os momentos. Sem vocês nada disso seria possível. A minha irmã, Juliana Erbisti, pelo companheirismo e amizade de toda a vida. A Paloma Rocha, por me apoiar em todos os momentos, me ajudando no que fosse preciso, sempre com muito amor, carinho e paciência. Agradeço aos amigos Caroline Ponce, Juliana Freitas e Luiz Fernando Costa, que me acompanharam durante esses dois anos de mestrado. Dividimos experiências, preocupações e madrugas em claro, mas também dividimos alegrias, muitas risadas e bons momentos, principalmente às terças-feiras, quando, depois de horas de estudo, pedíamos pizza para aliviar o estresse. A Paulo Tafner e Carolina Botelho, por todo apoio e colaboração. A professora Alexandra Schmidt, pelo apoio e incentivo que recebi desde a conversa que tivemos ao final do processo seletivo do mestrado. Agradeço a todos os professores do programa de pós-graduação em Estatística da UFRJ que, de alguma forma, contribuíram para a minha formação. v

6 Resumo A aplicação de modelos espaciais tem crescido substancialmente em diversas áreas, como, por exemplo, nas ciências ambientais, ciências climáticas e agricultura. O objetivo deste trabalho é introduzir uma nova classe de funções de covariância não separável para dados espaciais multivariados. Com isso, precisamos especificar uma função de covariância cruzada válida, que define a dependência entre componentes do vetor resposta entre as localizações. Entretanto, sabemos que funções de covariância cruzada não são simples de serem especificadas. A função de covariância não separável proposta é baseada na combinação convexa de funções de covariância separáveis e em dimensões latentes que representam as componentes. A partir de algumas proposições foi observado que a estrutura de covariância encontrada é válida e flexível. Além disso, utilizamos aproximações de matrizes de covariância cheia a partir do produto de Kronecker de duas matrizes separáveis de menor dimensão. Essas aproximações foram aplicadas apenas na função de verossimilhança para que a interpretação do modelo não fosse desconsiderada. Analisamos o caso mais simples do modelo proposto e encontramos resultados bastante satisfatórios. Vimos também que há a necessidade de estudar outras especificações da função proposta. Palavras-Chaves: geoestatística, modelos espaciais multivariados, funções de covariância cruzada, funções de covariância espacial multivariada não separáveis, dimensões latentes, inferência bayesiana. vi

7 Abstract Spatial models have been increasingly applied in several areas, such as environmental science, climate science and agriculture. This work aimed to introduce a new class of nonseparable covariance functions for multivariate spatial data. Therefore, we have to specify a valid cross-covariance function, which defines the dependency of the response vector components between the locations. However, we know that cross-covariance functions are not easily specified. In this work, we propose a nonseparable covariance function that is based on the convex combination of separable covariance functions and on the latent dimensions that represent the components. Based on some propositions, it was observed that this covariance structure is valid and flexible. Moreover, we use approximations of full-covariance matrices from the Kronecker product of two separable matrices of minor dimensions. These approximations have been applied only to the likelihood function in order to not disregard the interpretation of the model. We analyzed the simplest case of the proposed model and satisfactory results were obtained. Furthermore, we observed that it is necessary to study other specifications of the proposed function. Keywords: geostatistics, multivariate spatial models, cross covariance functions, nonseparable multivariate spatial covariance, functions, latent dimensions, bayesian inference. vii

8 Sumário 1 Introdução 1 2 Modelos para análise geoestatística Introdução Modelo univariado Modelo multivariado Modelos separáveis Limitações dos modelos separáveis Algumas propostas de modelos multivariados Modelo proposto Introdução Representação por mistura Introdução Representação por mistura proposta Estrutura de covariância não separável Função proposta Reparametrização Alguns modelos Conclusões Procedimento de inferência Introdução viii

9 4.2 Inferência Bayesiana Especificações Previsão Aproximações separáveis Introdução Solução do problema PPKCC Erro de aproximação Comportamento do erro de aproximação Utilizando a aproximação separável Exemplos simulados Introdução Simulação Simulação Comentários Conclusões e trabalhos futuros 49 ix

10 Lista de Tabelas 5.1 Resumo das distribuições a posteriori de cada modelo Resumo da distribuição a posteriori x

11 Lista de Figuras 5.1 Erro de Aproximação por Separabilidade variando o valor do parâmetro de separabilidade α 0. Linha vermelha avalia o erro utilizando duas componentes (p = 2) e a linha preta com três componentes (p = 3). (a) Mesmos alcances espaciais. (b) Alcances espaciais diferentes para cada componente Resumo das observações simuladas: (a) localizações. (b) matriz de covariância. (c) histograma da componente 1. (d) histograma da componente Curvas de contorno da função de verossimilhança. (1) curvas em preto: estrutura de covariância não separável. (2) curvas em vermelho: estrutura de covariância aproximada Curvas a posteriori e curva a priori. (1) curva vermelha: posteriori estrutura aproximada. (2) curva preta: posteriori estrutura não separável. (3) curva azul tracejada: priori Previsões e erro quadrático médio (EQM). (1) pontos vermelhos: valores observados. (2) pontos pretos: valores preditos Cadeias da distribuição a posteriori. (1) linha azul: valor verdadeiro Histograma da distribuição a posteriori. (1) linha vermelha: verdadeiro valor Funções de covariância: mediana a posteriori (linha azul cheia), intervalo de credibilidade de 95% (linha azul tracejada), função do modelo original (linha verde cheia) Cadeias da distribuição a posteriori. (1) linha azul: valor verdadeiro xi

12 6.5 Funções de covariância: mediana a posteriori (linha azul cheia), intervalo de credibilidade de 95% (linha azul tracejada), função do modelo original (linha verde cheia) xii

13 Capítulo 1 Introdução A estatística espacial é a área da estatística que estuda métodos para a coleta, descrição, visualização, modelagem e análise de dados que possuem coordenadas geográficas, ou seja, é a área na qual se considera a importância do arranjo espacial na análise ou interpretação dos resultados. De fato, na avaliação de certos tipos de fenômenos a utilização da dimensão espacial pode trazer resultados mais realistas do que quando a ignoramos. Por exemplo, ao tratarmos dados sobre preços de imóveis na cidade do Rio de Janeiro fica clara a importância de considerar informações sobre localizações geográficas na modelagem, já que muitos fatores espaciais podem influenciar o preço de um imóvel, tais como proximidade de regiões de favela, tipos de transportes públicos no entorno etc. Os diferentes tipos de dados espaciais são geralmente classificados de acordo com sua natureza. De maneira geral, podemos dizer que a estatística espacial pode ser dividida em três grandes áreas: processos pontuais, dados de área e geoestatística (Cressie, 1993). Neste trabalho iremos nos concentrar em dados georreferenciados, que segundo Schmidt e Sansó (2006), são obtidos a partir de localizações fixas ao longo de uma região de interesse, possivelmente em diferentes instantes do tempo. Ao analisar observações desse tipo, espera-se que medidas feitas em localizações próximas entre si sejam altamente correlacionadas, enquanto que para localizações separadas por grandes distâncias, ocorra um comportamento mais independente. Como exemplo, podemos considerar a temperatura medida nas estações meteorológicas de Copacabana, Ipanema e Bangu. É razoável pensar que haja um comportamento semelhante entre as temperaturas de Copacabana e 1

14 Ipanema, porém, as temperaturas de Copacabana e Bangu tendem a ser independentes, devido à distância entre essas duas regiões. Com isso, é natural pensar que o principal interesse na modelagem de dados georreferenciados é especificar uma função que capte essa dependência espacial. Neste contexto, a função que desempenha esse papel é a função de covariância. A utilização de funções de covariância estacionárias e isotrópicas é bastante comum. Segundo Schmidt e Sansó (2006) estacionariedade exige que as funções de média e covariância sejam invariantes sob translações e isotropia corresponde a uma simetria radial onde a dependência entre localizações é determinada, simplesmente, pela distância entre elas. A aplicação de modelos espaciais tem crescido substancialmente em diversas áreas. Frequentemente, as observações são multivariadas, isto é, há um vetor de respostas em diversas localizações ao longo do espaço. Em outras palavras, dada a localização, é possível obter informações sobre diferentes componentes, por exemplo, estações de monitoramento do ar podem medir níveis de diversos poluentes, tais como ozônio, monóxido de carbono, óxidos de nitrogênio, material particulado etc. A literatura sobre abordagens capazes de modelar dados espaciais multivariados é extensa. Banerjee et al. (2004) apresentam alguns métodos de modelagem para dados dessa natureza. Um deles está baseado na ideia de separabilidade. De fato, o uso de modelos separáveis é conveniente, pois a matriz de covariância pode ser expressa como um produto de Kronecker de matrizes menores vindas da dimensão espacial e do vetor de respostas e, assim, determinantes e inversas são facilmente obtidos, fornecendo considerável ganho computacional. Entretanto, essa abordagem possui algumas desvantagens que serão discutidas neste trabalho. Outro método bastante conhecido é o modelo de coregionalização linear (MCL), que permite modelar dados multivariados utilizando alcances diferentes e estrutura de covariância não separável. Este modelo e suas generalizações estão descritos e muito bem definidos em Banerjee et al. (2004). Apanasovich e Genton (2010) apresentam uma classe geral de modelos flexíveis e computacionalmente viáveis. Um dos objetivos do artigo é representar o vetor de com- 2

15 ponentes a partir de dimensões latentes (pontos) no espaço k-dimensional, 1 k p, p sendo o número de componentes. O objetivo deste trabalho é introduzir uma classe de modelos de covariância não separável para dados multivariados espaciais baseada na ideia de Fonseca e Steel (2011) e também na representação do vetor de componentes apresentada por Apanasovich e Genton (2010). A partir de algumas proposições é possível observar que a estrutura de covariância encontrada é válida e flexível. Ademais, a matriz de covariância não necessariamente será simétrica. Este trabalho está organizado em sete capítulos, incluindo este. O segundo capítulo especifica os modelos univariado e multivariado com estrutura separável. Além disso, faz uma breve revisão sobre as princiais características dos modelos de coregionalização linear e da proposta de Apanasovich e Genton (2010). O capítulo 3 introduz uma nova classe de modelos de covariância não separável baseado na ideia de Fonseca e Steel (2011) e na definição de dimensões latentes proposta por Apanasovich e Genton (2010). O quarto capítulo apresenta o procedimento de inferência feito na estimação do modelo proposto. O capítulo 5 mostra como encontrar aproximações separáveis para a matriz de covariância cheia com estrutura não separável. O penúltimo capítulo apresenta simulações que analisam o desempenho do modelo proposto em captar e gerar estruturas separáveis. Por fim, o capítulo 7 apresenta as conclusões e trabalhos futuros desta pesquisa. 3

16 Capítulo 2 Modelos para análise geoestatística 2.1 Introdução Segundo Cressie (1993), os dados geoestatísticos podem ser considerados uma realização de um processo estocástico {Y (s) : s D}, onde D é um subconjunto de R d com volume d-dimensional positivo. Em outras palavras, o índice espacial s varia continuamente ao longo da região D. Geralmente d = 2 (latitude e longitude) ou d = 3 (por exemplo, latitude, longitude e altitude). A principal discussão sobre a análise de dados espaciais se refere ao modo de se fazer inferência sobre o processo espacial Y (s) e, posteriormente, prever em localizações novas ou não medidas (Banerjee et al., 2004). Antes de definir os modelos utilizados para tratar dados geoestatísticos, apresentaremos os conceitos de estacionaridade e isotropia descritos em Banerjee et al. (2004). Assim, assuma que o processo espacial tenha média µ(s) = E[Y (s)] e que a variância de Y (s) exista para todo s D. Portanto, o processo é dito fracamente estacionário se a média é constante para toda localização s D (isto é, µ(s) = µ) e se Cov(Y (s), Y (s )) = C(s s ), para todo s, s D. Note que essa última condição implica que a covariância entre quaisquer duas localizações s e s pode ser resumida a partir de uma função de covariância que depende apenas da distância entre s e s. Baseado em Schmidt e Sansó (2006), a isotropia é uma restrição mais forte, pois corresponde a uma simetria radial onde a função que define a dependência entre localizações é determinada 4

17 pela distância entre elas. Em outras palavras, C(s, s ) = C( s s ), onde s s denota a distância euclidiana entre s e s. Observe que quando um processo é estacionário e isotrópico, sua variância é constante e os elementos da matriz de covariância podem ser escritos como a multiplicação de σ 2 (variância) e uma função de correlação válida (isto é, positiva definida) que depende da distância euclidiana das localizações e de um vetor paramétrico. É de se esperar que a função de correlação seja monótona não-crescente e que exista algum parâmetro que controle seu decaimento, já que é ela a responsável pela suavidade do processo. Há diversas funções de correlação válidas existentes na literatura. Aqui, vamos listar duas delas: 1. Família exponencial potência { ( ) } θ2 h ρ(h; Θ) = exp θ 1 (2.1) onde h é a distância euclidiana entre dois pontos no espaço, θ 2 (0, 2]. Quando θ 2 = 2 temos um caso particular da função de correlação gaussiana. Quando θ 2 = 1 obtemos a função de correlação exponencial. 2. Família cauchy ( ( ) ) θ3 θ2 h ρ(h; Θ) = 1 + (2.2) θ 1 onde h é a distância euclidiana entre dois pontos no espaço, θ 1 > 0, θ 2 (0, 2] e θ 3 > 0. Frequentemente, Y (s) segue um processo gaussiano e com isso, precisamos especificar apenas o primeiro e o segundo momentos da distribuição. Neste trabalho, todos os processos espaciais analisados são gaussianos. Antes de começarmos a apresentar os modelos geoestatísticos é importante definir o conceito de alcances espaciais. Para tratar disso, voltaremos ao exemplo citado no capítulo 1. Vimos que é natural assumir que as temperaturas medidas nas estações meteorológicas de Copacabana e Ipanema tendem a ter uma maior correlação do que as temperaturas de Copacabana e Bangu, pois os dois primeiros bairros são vizinhos e 5

18 estão localizados próximos ao mar e também porque há uma grande distância geográfica entre Bangu e a Zona Sul, sendo Bangu um bairro afastado da orla da cidade. Assim, é razoável pensar que a correlação diminui conforme a distância aumenta, porém, como saber qual é o valor da distância na qual a correlação cai para valores desprezíveis? O alcance espacial é justamente o valor dessa distância. Nas próximas seções são apresentados alguns métodos para análise de dados geoestatísticos. 2.2 Modelo univariado Esta seção introduz a análise de processos espaciais a partir do caso mais simples, isto é, processos que analisam a dependência espacial de apenas uma componente. Para isso, considere o processo espacial {Y (s) : s D}, onde D R d. Normalmente, em geoestatística, dadas as observações do processo de interesse em n localizações, Y = [Y (s 1 ), Y (s 2 ),..., Y (s n )] T, assume-se que Y µ, Σ N n (µ, Σ) onde µ é um vetor de dimensão n representando a média do processo e Σ é uma matriz n n que representa a estrutura de covariância. A partir disso, podemos descrever o processo Y(.) através do modelo Y = Xβ + ε (2.3) onde X representa a matriz das variáveis explicativas, β é o vetor de parâmetros das regressoras e ε é o erro aleatório tal que ε N n (0, Σ). Sabe-se que cada elemento da matriz de covariância depende somente da variância do processo e de uma função de correlação espacial válida. Considerando um processo estacionário de segunda ordem (fracamente estacionário), temos que Cov[Y (s), Y (s )] = C(s s ) = C(h), s, s D depende apenas das distâncias entre as localizações s e s, h = s - s. Portanto, a matriz de covariância será dada por Σ = σ 2 ρ(h, Φ) 6

19 onde σ 2 é a variância do processo e ρ(., Φ) é uma função de correlação válida. Observe que Φ é o vetor paramétrico que descreve a função de correlação. 2.3 Modelo multivariado Quando se faz inferência com base em dados multivariados, como por exemplo, diferentes fatores climáticos mensurados em estações meteorológicas, o objetivo principal é identificar a dependência entre as variáveis medidas em todas as localizações. Para isso, denotaremos Y(s) como o vetor de variáveis aleatórias na localização s, de dimensão p 1, ou seja, Y = [Y(s 1 ), Y(s 2 ),..., Y(s n )] T, onde Y i (s) representa a i-ésima variável, i = 1, 2,..., p, na localização s D. Deste modo, se Y é dito um processo gaussiano, para defini-lo, precisamos determinar apenas dois objetos de análise: a função de média e as funções de covariância cruzada (Apanasovich et al., 2012). A função de covariância cruzada válida irá definir a dependência entre as componentes do vetor resposta. Entretanto, sabe-se que funções de covariância cruzada não são simples de serem especificadas, pois para qualquer número de localizações e qualquer escolha dessas localizações, a matriz de covariância resultante deve ser positiva definida (Gelfand e Banerjee, 2010). De acordo com Banerjee et al. (2004), o objeto crucial é a covariância cruzada C(s, s ) Cov(Y(s), Y(s )), que é uma matriz de dimensão p p e não necessariamente simétrica (isto é, Cov(Y i (s), Y j (s )) não precisa ser igual a Cov(Y j (s), Y i (s ))). De acordo com Wackernagel (1995), as funções de covariância cruzada C ij (h), do conjunto de p variáveis aleatórias Y i (s), podem ser definidas da seguinte maneira: Se E[Y i (s)] = m i, s D; i = 1, 2,..., p então, a estrutura de covariância cruzada é definida como E[(Y i (s) m i )(Y j (s + h) m j )] = C ij (h), s, s + h D; i, j = 1, 2,..., p onde a média de cada variável Y i (s), em cada localização do domínio, é igual à constante m i. 7

20 2.3.1 Modelos separáveis Para modelar dados dessa natureza podemos utilizar uma forma bem simples, baseada na ideia de separabilidade. Para definir a estrutura de covariância de modo separável vamos considerar {Y(s) : s D R 2 ; Y R p } sendo um campo aleatório multivariado. Por exemplo, Y(s) pode ser formado pelas componentes (Temperatura, Umidade)(s). A função de covariância cruzada para duas componentes i e j do vetor Y, entre duas localizações quaisquer s e s, pode ser descrita por C ij (s, s ) = a ij ρ(s, s ) (2.4) onde A = {a ij } é uma matriz positiva definida p p e ρ(s, s ) é uma função de correlação válida. Como Y é formado por um empilhamento das observações nas n localizações, a matriz de covariância resultante é Σ = R A (2.5) onde R ij = ρ(s i, s j ) e denota o produto de Kronecker. Note que Σ será positiva definida desde que R e A também sejam. A utilização de modelos espaciais com estrutura separável é bastante comum. A justificativa é simples. A matriz de covariância cheia Σ, de dimensão np np, pode ser escrita a partir do produto de Kronecker de duas matrizes de menor dimensões (p p e n n). A partir das propriedades do produto de Kronecker, é possível calcular a inversa e o determinante de Σ da seguinte maneira: Σ 1 = R 1 A 1 Σ = R p A n De fato, é mais conveniente em termos computacionais utilizar a estrutura definida na equação 2.4, porém, este tipo de modelagem possui algumas limitações Limitações dos modelos separáveis Banerjee et al. (2004) apresentam algumas limitações associadas ao modelo separável. Segundo os autores, a estrutura de covariância será simétrica, ou seja, Cov(Y i (s), Y j (s )) = 8

21 Cov(Y j (s), Y i (s )) para todo i, j, s e s. Além disso, se ρ for estacionário, a correlação generalizada é dada por Cov(Y i (s), Y j (s + h)) Cov(Yi (s), Y i (s + h))cov(y j (s), Y j (s + h)) = a ij aii a jj independente de s e h. A última restrição citada pelos autores é que se a correlação espacial ρ for isotrópica e estritamente decrescente, então o alcance espacial será idêntico para cada componente de Y(s). Essa última limitação apresentada pode ser entendida de outra maneira. Considere os processos espaciais univariados {Y (s) : s D} e {X(s) : s D}, onde D R 2, conforme definido na seção 2.2. Logo, são obtidos os seguintes vetores Y = [Y (s 1 ), Y (s 2 ),..., Y (s n )] T e X = [X(s 1 ), X(s 2 ),..., X(s n )] T. Sabe-se que é possível representar a relação linear espacial abaixo para qualquer ponto no domínio E[Y X] = β 0 + β 1 X (2.6) Para garantir a relação definida em (2.6), considere o vetor empilhado (X, Y) T, de dimensão 2n 1, com distribuição Normal Multivariada e estrutura de covariância separável, como definido em 2.4, isto é, X Y N 2n (µ, Σ), Σ = A R Dada esta distribuição, note que X N n (µ x, a 11 R) e Y N n (µ y, a 22 R). Assim, a partir das propriedades da distribuição normal multivariada, é possível observar que Y X N n (µ, Σ ), onde µ = µ y + (a 12 R)(a 11 R) 1 (X µ x ) = µ y + a 12 a 11 RR 1 (X µ x ) = µ y + a 12 a 11 (X µ x ) = µ y a 12 a 11 µ x + a 12 a 11 X 9

22 e Σ = a 22 R (a 12 R)(a 11 R) 1 (a 12 R) = a 22 R a2 12 a 11 RR 1 R = a 22 R a2 12 R a ( 11 ) = a 22 a2 12 R a 11 Portanto, a distribuição de Y X pode ser escrita da seguinte maneira: Y X N n (β 0 + β 1 X, σ 2 R), onde β 0 = µ y a 12 a 11 µ x β 1 = a 12 a 11 σ 2 = a 22 a2 12 a 11 Entretanto, fazendo a análise de maneira contrária, ou seja, se partirmos do ponto em que definimos X N n (µ x, a 11 R) e Y X N n (β 0 + β 1 X, σ 2 S), onde S é uma matriz qualquer que determina a dependência espacial, teremos que a estrutura de covariância de Y será Cov[Y i, Y j ] = σ 2 S ij + β 2 1a 11 R ij = a 22 S ij a2 12 a 11 S ij + a2 12 a 11 R ij (2.7) Neste caso, é fácil observar que para obtermos o caso separável devemos fazer uma restrição quanto à estrutura de S. De fato, a equação 2.7 será igual a a 22 R, isto é, equivalente ao caso separável se, e somente se, S = R, ou seja, se a dependência espacial de Y X for a mesma de X Algumas propostas de modelos multivariados Nesta seção, serão apresentadas, de maneira resumida, algumas abordagens utilizadas no procedimento de estimação de processos espaciais multivariados. Iremos descrever duas propostas já exitentes na literatura com o objetivo de analisar suas principais características para, posteriormente, relacioná-las com as propriedades do modelo proposto neste trabalho. 10

23 Inicialmente, descreveremos os modelos de coregionalização especificados em Banerjee et al. (2004). O modelo mais simples de coregionalização linear (MCL) 1 é da forma Y(s) = Aw(s), onde A é uma matriz p p e as componentes de w(s), w j (s), j = 1, 2,..., p, são processos espaciais independentes e identicamente distribuídos. Assim, se os processos w j (s) têm média igual a zero, são estacionários com variância igual a um e cov(w j (s), w j (s )) = ρ(s s ), então E(Y(s)) = 0 e a matriz de covariância cruzada associada a Y(s) é dada por Σ Y(s),Y(s ) C(s s ) = ρ(s s )AA T É possível observar que se fizermos AA T = T obtemos a especificação da estrutura de covariância separável, conforme equação 2.4. Ainda baseado em Banerjee et al. (2004), podemos descrever um MCL mais geral se novamente especificarmos Y(s) = Aw(s), porém, desta vez, considerando os processos w j (s) independentes mas não identicamente distribuídos. Portanto, sejam w j (s) processos com média µ j, variância 1 e função de correlação estacionária ρ j (h). Então, temos que E[Y(s)] = Aµ, onde µ = {µ 1,..., µ p } T, e a matriz de covariância cruzada obtida agora é Σ Y(s),Y(s ) C(s s ) = p ρ j (s s )T j onde T j = a j a T j, com a j sendo a j-ésima coluna de A. Segundo os autores, uma observação importante a ser feita é que essa combinação linear produz processos estacionários. Por fim, utilizando funções de correlação monótonas e isotrópicas, será possível obter um alcance para cada componente do processo. Portanto, essa abordagem permite modelar as componentes utilizando diferentes alcances 2, diferentemente do modelo separável apresentado na seção Vale ressaltar que existem outras especificações do modelo de coregionalização que acomodam estruturas de covariância não estacionárias 3. A segunda abordagem que será apresentada é a descrita por Apanasovich e Genton (2010). Os autores propõem uma metodologia baseada em dimensões latentes e modelos 1 Chamado de especificação intrínseca. 2 Detalhes mais precisos podem ser vistos em Banerjee et al. (2004). 3 Ver Banerjee et al. (2004). j=1 11

24 de covariância já existentes na literatura. O objetivo é desenvolver uma classe de funções de covariância cruzada que sejam interpretáveis e viáveis computacionalmente. A ideia principal de Apanasovich e Genton é representar o vetor de componentes como pontos num espaço k-dimensional, para um inteiro 1 k p, ou seja, fazer com que a i-ésima componente possa ser representada como ξ i = {ξ i1,..., ξ ik } T. Já sabemos que se assumirmos que Y é gaussiano, precisamos apenas descrever as funções de média e de covariância. Portanto, estamos interessados na caracterização de Cov[Y i (s), Y j (s )] = C ij (s, s ). Assim, Apanasovich e Genton garantem que, baseado nas dimensões latentes, a matriz de covariância Σ ij = C{(s, ξ i ), (s, ξ j )} é positiva definida, pois suas entradas são obtidas a partir de uma covariância válida. De fato, segundo os autores, para qualquer s, s existe C s,s (.) tal que C ij (s, s ) = C s,s (ξ i, ξ j ) para algum ξ i, ξ j R k. É importante lembrar que ao invés de especificarmos os ξ i s, podemos tratá-los como parâmetros. Além disso, há a possibilidade de trabalhar apenas com a distância entre as componentes do vetor, δ ij = ξ i ξ j. Segundo Apanasovich e Genton, essa ideia de modelagem é semelhante à escala multidimensional (Cox e Cox, 2000) com distâncias latentes δ ij s, onde para localizações fixas s e s, grandes δ ij s são convertidos para correlações cruzadas pequenas entre as i-ésima e j-ésima componentes do vetor. Em uma das simulações, os autores comparam o desempenho do modelo proposto por eles com o MCL. Para mostrar a flexibilidade extra que o modelo deles permite, eles ajustam o modelo proposto e o MCL, quando, na verdade, a estrutura gerada é do modelo proposto. Nessa simulação, geram amostras de um processo espacial bidimensional gaussiano, com média zero e especificação da covariância Cov[Y i (s), Y j (s )] a 2 11exp( α 1 h ) (i = j = 1) a 2 21exp( α 1 h ) + a 2 22exp( α 2 h ) (i = j = 2) C ij ( h ) = C( h, δ ij ) = { } a 11 a 21 δ exp α 1 h (i j) (δ ) β 2 onde h = s s. Observe que o MCL é um caso especial da especificação acima quando δ 12 = β = 0. A partir dos resultados da simulação os autores afirmam que o modelo de 12

25 coregionalização não é suficientemente flexível para fornecer estimativas sem viés para os alcances. Além dessa simulação os autores utilizam outras especificações para mostrar a flexibilidade do modelo proposto. Apanasovich e Genton (2010) também avaliam a escolha do valor de k a partir de simulações. Segundo eles, valores pequenos de k, como por exemplo, k = 1 ou k = 2, são geralmente suficientes 4. Além disso, esses modelos possuem extensões que acomodam a falta de simetria. Uma possível fraqueza dessa abordagem é que se o número de variáveis p for grande, então o número inteiro 1 k p de dimensões latentes poderia tornar-se grande demais. De fato, a ideia de dimensões latentes apresentada em Apanasovich e Genton (2010) será aplicada ao modelo proposto no capítulo 3. Vale ressaltar que para as estimações do modelo proposto realizadas neste trabalho utilizamos k = 1. 4 Ver Apanasovich e Genton (2010). 13

26 Capítulo 3 Modelo proposto 3.1 Introdução O objetivo deste capítulo é apresentar uma classe de funções de covariância multivariada não separáveis a partir da ideia de misturas apresentada por Fonseca e Steel (2011). Também iremos introduzir a ideia de dimensões latentes para representar o vetor de componentes, como proposto em Apanasovich e Genton (2010). Fonseca e Steel (2011) consideram funções de covariância espaço-temporais. Neste trabalho, a função proposta é avaliada no espaço multivariado, sem considerar o tempo. Algumas características importantes serão analisadas. A classe de funções gerada é válida, flexível e permite diferentes especificações. Além disso, será visto que é possível obter alcances espaciais distintos para diferentes componentes, o que não ocorre nos modelos separáveis. 3.2 Representação por mistura Introdução Fonseca e Steel (2011) apresentaram uma classe geral de modelos espaço-temporais não separáveis baseada em misturas de funções de covariância separáveis. Segundo os autores, a formulação de mistura pode gerar uma grande variedade de modelos de co- 14

27 variância não separável válidos. Para definir o modelo proposto em Fonseca e Steel (2011), suponha que (s, t) D T, D R d, T R, sejam coordenadas espaço-tempo que variam continuamente em D T e defina o processo espaço-temporal {Z(s, t) : s D, t T }, onde Z(s, t) = Z 1 (s)z 2 (t), (s, t) D T, {Z 1 (s) : s D} é um processo aleatório puramente espacial com função de covariância C 1 (s) e {Z 2 (t) : t T } é um processo aleatório puramente temporal com função de covariância C 2 (t). Sendo Z 1 (s) e Z 2 (t) não correlacionados. A representação por mistura da função de covariância de Z(s, t) é definida por Fonseca e Steel (2011) da seguinte maneira: Seja (U, V ) um vetor aleatório bivariado não negativo com distribuição G(u, v) e independente de {Z 1 (s) : s D} e {Z 2 (t) : t T }, então a função de covariância correspondente a Z(s, t) é uma combinação convexa de funções de covariância separáveis. Esta função é válida e geralmente não separável, e é dada por C(s, t) = C(s; u)c(t; v)g(u, v)dudv (3.1) A ideia proposta neste trabalho é modificar a equação 3.1 para o caso espacial multivariado. Neste momento, o interesse não está em avaliar o tempo e sim, as componentes. A subseção seguinte apresenta esta nova função de covariância baseada na equação Representação por mistura proposta Nesta subseção, iremos considerar a mesma representação apresentada pelos autores e descrita na equação 3.1, porém, avaliada no espaço multivariado. Para isso, seja um vetor aleatório bivariado não negativo (U, V ) com distribuição G(u, v) e independente do processo Y(s). De maneira similar ao artigo de Fonseca e Steel (2011), temos que a função de covariância correspondente a Y(s) é uma combinação convexa de funções de covariância separáveis. Esta função é válida e, geralmente, não separável e é dada por C ij (s, ξ) = C(s; u)c ij (ξ; v)g(u, v)dudv (3.2) onde ξ representa a dimensão latente proposta no artigo de Apanasovich e Genton (2010) e apresentada na seção e s a localização no espaço. É fácil observar que a função 15

28 (3.2) é definida por funções de covariância válidas e pelo vetor aleatório (U, V ) com distribuição conjunta G(u, v). Segundo Fonseca e Steel (2011), o passo fundamental na definição da classe de funções está na representação da dependência entre U e V, pois é isso que irá gerar a interação entre o espaço e as componentes. Vamos definir os variogramas γ 1 (s) γ 1 e γ 2 (ξ) γ 2 como funções contínuas de s R d e ξ R p, respectivamente. A partir da especificação acima, uma maneira de resolver a integral em (3.2) de forma fechada e garantir que a estrutura de covariância gerada seja positiva definida é definindo C(s; u) = exp{ γ 1 u} e C(ξ; v) = exp{ γ 2 v}. Com isso, obtemos a seguinte proposição. Proposição Considere um vetor aleatório bivariado não negativo (U, V ) com função geradora de momentos conjunta M(.,.). Se os variogramas γ 1 (s) γ 1 e γ 2 (ξ) γ 2 são funções contínuas de s R d e ξ R p, respectivamente, e C(s; u) = exp{ γ 1 u} e C(ξ; v) = exp{ γ 2 v}, então, a partir da função (3.2) segue C ij (s, ξ) = M( γ 1, γ 2 ) (3.3) que é uma função de covariância válida. Majumdar e Gelfand (2007) utilizam integração de Monte Carlo para resolver uma integral similar a (3.2), o que seria inviável em aplicações com muitas observações. Apanasovich et al. (2012) consideram uma versão multivariada da Matérn, apresentando um modelo flexível que permite diferentes comportamentos para diferentes componentes. De fato, o modelo em (3.2) também tem essas características e que serão apresentadas mais adiante. A seguir, definiremos a representação do vetor (U, V ) de maneira semelhante à definida por Fonseca e Steel (2011). Essa especificação leva a funções não separáveis e que possuem propriedades bastante úteis Estrutura de covariância não separável A partir da Proposição é possível construir uma estrutura de covariância não separável, basta definir a distribuição do vetor bivariado não negativo (U, V ). Assim, 16

29 considere a seguinte proposição. Proposição Considere as variáveis aleatórias não negativas e independentes X 0, X 1 e X 2, com respectivas funções geradoras de momentos M 0, M 1 e M 2. Defina U e V da seguinte maneira: U = X 0 + X 1 e V = X 0 + X 2. Se C(s; u) = exp{ γ 1 u} e C(ξ; v) = exp{ γ 2 v}, como na Proposição 3.2.1, então a função de covariância resultante a partir de (3.2) é C ij (s, ξ) = M 0 ( γ 1 γ 2 )M 1 ( γ 1 )M 2 ( γ 2 ) (3.4) Observe que se U e V forem não correlacionados, isto é, U = X 1 e V = X 2, então o caso separável é obtido, pois a função de covariância será representada como C ij (s, ξ) = M 1 ( γ 1 )M 2 ( γ 2 ). Observe que essa especificação é semelhante à da equação 2.4, pois a estrutura é gerada a partir de uma função que depende apenas das componentes, M 2 ( γ 2 ), e outra que depende apenas das localizações, M 1 ( γ 1 ). A classe gerada na Proposição permite diferentes representações paramétricas, de acordo com as distribuições de X 0, X 1 e X 2. Note que precisamos apenas atribuir distribuições univariadas não negativas para essas variáveis para especificar a função de covariância cruzada. Como consequência da construção, qualquer correlação entre U e V diferente de zero será positiva. Ao analisar a função gerada pela Proposição 3.2.2, observou-se que C ij (0) = 1, ou seja, a função C ij (s, ξ) é, na verdade, uma função de correlação cruzada válida. Para transformar essa função de correlação numa função de covariância, definimos, conforme Majumdar e Gelfand (2007), ρ ij (s, ξ) = C ij (s, ξ) [C ii (0)C jj (0)] 1/2 (3.5) Note que temos que ρ ii (0) = 1. Considere D cov como uma matriz diagonal com entradas [D cov ] ii = C ii (0). Se R ij (s, ξ) = Dcov 1/2 C ij (s, ξ)dcov 1/2, então R ij (s, ξ) será uma função de correlação cruzada válida. De fato, definindo D 1/2 σ = diag(σ 1,..., σ p ), σ i > 0, pode-se obter uma função de covariância cruzada válida, que será dada pela matriz C σ = D 1/2 σ R ij (s, ξ)d 1/2 σ. Observe que a equação 3.5 é a própria definição de correlação que conhecemos. Como a estrutura encontrada trata-se de uma função de correlação cruzada válida, basta fazermos 17

30 a conta inversa para encontrar a função de covariância cruzada válida. possível modificar a Proposição e definirmos a Proposição Com isso, é Proposição Considere as variáveis aleatórias não negativas e independentes X 0, X 1 e X 2, com respectivas funções geradoras de momentos M 0, M 1 e M 2. Defina U e V da seguinte maneira: U = X 0 + X 1 e V = X 0 + X 2. Se C(s; u) = σ i exp{ γ 1 u} e C(ξ; v) = σ j exp{ γ 2 v}, então a função de covariância resultante a partir de (3.2) é C ij (s, ξ) = σ i σ j M 0 ( γ 1 γ 2 )M 1 ( γ 1 )M 2 ( γ 2 ) (3.6) que é uma função de covariância válida Função proposta Nesta seção, será apresentada uma função de covariância gerada a partir da Proposição Para isso, vamos considerar que as variáveias X 0, X 1 e X 2 seguem distribuições Gama. A partir do Teorema obtemos classes de função de covariância Cauchy tanto para as componentes quanto para o espaço. Teorema Considere X i Gama(α i, λ i ), i = 0, 1 e 2, então, a partir da Proposição 3.2.3, a função de covariância cruzada é ( C ij (s, ξ) = σ i σ j 1 + γ ) α0 ( 1 + γ γ ) α1 ( γ ) α2 2 (3.7) λ 0 λ 1 λ 2 onde σ i > 0, i = 1,..., p, α k > 0 e λ k > 0, k = 0, 1, 2. Para a construção da função de covariância, definimos o variograma γ 1 como a função de distância entre as localizações e o variograma γ 2 como a função de distância entre as dimensões latentes de cada componente. De fato, γ 1 = s s = h e γ 2 = ξ i ξ j = δ ij Reparametrização Com a parametrização proposta na equação 3.7 é difícil interpretar alguns parâmetros. Além disso, esperamos encontrar uma função que permita alcances espaciais diferentes para cada componente e, de fato, isso não está ocorrendo. Como a dependência de U 18

31 e V é governada pela variável X 0, também seria importante definir algum parâmetro responsável pelo comportamento da correlação entre essas variáveis, pois já foi visto que se U e V forem não correlacionados, o caso separável é obtido. Para isso, a ideia inicial foi fixar os parâmetros λ i, i = 0, 1 e 2, em 1. Além disso, introduzimos um parâmetro extra no variograma das localizações. Tal parâmetro pode variar de acordo com a componente i, j analisada, isto é, tomamos γ 1 = s s b ij = h b ij. Feito isso, o modelo geral com todos os possíveis parâmetros é dado por C ij (s, ξ) = σ i σ j ( 1 + δ ij + h b ij ) α0 (1 + h b ij ) α1 (1 + δ ij ) α 2 (3.8) onde σ i é o desvio da componente i, b ij s são interpretados como alcances espaciais e os α l, l = 1 e 2, podem ser interpretados como parâmetros de suavização da função. Um parâmetro que deve ser estudado com maior atenção é α 0. Como já mencionado, é importante encontrar alguma medidade de separabilidade entre o espaço e as componentes. Assim como em Fonseca e Steel (2011), escolhemos a correlação entre as variáveis U e V como tal medida. De fato, vimos que se U e V forem não correlacionados, chegamos ao caso separável. Portanto, Cov(U, V ) ρ = ρ(u, V ) = V ar(u)v ar(v ) Cov(X 0 + X 1, X 0 + X 2 ) = V ar(x0 + X 1 )V ar(x 0 + X 2 ) V ar(x 0 ) = [V ar(x0 ) + V ar(x 1 )][V ar(x 0 ) + V ar(x 2 )] α 0 = (α0 + α 1 )(α 0 + α 2 ) Observe que pela construção de U e V, 0 ρ 1. Além disso, ρ = 0 indica separabilidade, já que neste caso U = X 1 e V = X 2. Portanto, é possível observar que α 0 é o parâmetro responsável pelo grau de separabilidade do modelo. É fácil visualizar que se α 0 = 0, então, ρ = 0. Neste caso onde α 0 = 0, a equação 3.8 pode ser escrita da seguinte maneira C ij (s, ξ) = σ i σ j (1 + h ) α1 (1 + δ ij ) α 2 (3.9) b ij 19

32 Um detalhe importante que deve ser observado é que mesmo que α 0 seja zero, só será possível obter o modelo separável se os alcances espaciais b ij forem todos iguais, ou seja, se b ij = φ, i, j = 1, 2,..., p. Neste caso, é possível observar que as funções de correlação do modelo pertencem à família Cauchy. Caso os alcances espaciais não sejam iguais, a equação 3.9 estará apenas especificada de maneira semelhente ao caso separável, porém, o modelo gerado será não separável. Outro característica importante refere-se ao fato do α 0 ser um parâmetro que assume apenas valores positivos. Portanto, ele não poderá ser igual a zero, mas sabemos que ele pode assumir valores muito pequenos e próximos de Alguns modelos A partir dessa construção da função proposta na equação 3.8, há dois modelos menos gerais que pretendemos estudar neste trabalho. Modelo 1 (MNS-01) Este modelo é menos geral que o proposto na equação 3.8 e, além disso, não permite que as componentes tenham alcances espaciais diferentes. Aqui, fixamos α 1 = α 2 = 1. A função de covariância resultante é ( C ij (s, ξ) = σ i σ j 1 + δ ij + h ) α0 ( 1 + h 1 (1 + δ ij ) φ φ) 1 (3.10) Para este modelo temos que se α 0 = 0, então o caso separável é obtido. Além disso, a função de correlação pertence à classe Cauchy. Neste caso, podemos interpretar os parâmetros da seguinte maneira: σ i corresponde ao desvio da componente i, i = 1, 2,..., p; δ ij mede a distância latente entre as componentes i e j, i, j = 1, 2,..., p; φ representa o alcance espacial das componentes; e α 0 pode ser interpretado como o parâmetro de seperabilidade. Assim, analisando os possíveis casos, temos os seguintes resultados se h = 0 e i = j: C ii (0, 0) = σ 2 i se h = 0 e i j: C ij (0, ξ) = σ i σ j (1 + δ ij ) (α 0+1) 20

33 se h 0 e i = j: C ii (s, 0) = σ 2 i ( ) 1 + h (α0 +1) φ se h 0 e i j: C ij (s, ξ) = σ i σ j (1 + δ ij + h φ ) α0 ( ) h φ (1 + δij ) 1 Modelo 2 (MNS-02) Este modelo também é menos geral que o proposto na equação 3.8, porém, permite que as componentes tenham alcances espaciais diferentes. Aqui, também fixamos α 1 = α 2 = 1. A função de covariância resultante é C ij (s, ξ) = σ i σ j ( 1 + δ ij + h b ij ) α0 (1 + h b ij ) 1 (1 + δ ij ) 1 (3.11) Para este modelo temos que se α 0 = 0, então o caso separável não é obtido. Lembre que uma das propriedades do modelo separável apresentada na seção referia-se ao fato de que os alcances espaciais de cada componente deveriam ser iguais. Aqui, apesar de obtermos uma especificação semelhante à do modelo separável, os alcances espaciais podem ser diferentes e, com isso, não conseguimos obter um modelo separável. Portanto, podemos interpretar os parâmetros b ij da seguinte forma: b ii representa o alcance espacial da componente i, i = 1, 2,..., p, e b ij pode ser entendido como o alcance cruzado entre as componentes i e j, i, j = 1, 2,..., p. Com isso, os possíveis casos são apresentados a seguir se h = 0 e i = j: C ii (0, 0) = σ 2 i se h = 0 e i j: C ij (0, ξ) = σ i σ j (1 + δ ij ) (α 0+1) se h 0 e i = j: C ii (s, 0) = σ 2 i ( 1 + h b ii ) (α0 +1) se h 0 e i j: C ij (s, ξ) = σ i σ j (1 + δ ij + h b ij ) α0 ( 1 + h b ij ) 1 (1 + δij ) 1 21

34 3.2.5 Conclusões Este capítulo apresentou uma classe geral de funções de covariância multivariada não separáveis. Vimos que a partir de determinadas especificações é possivel encontrar um modelo com estrutura separável. Assim como em Fonseca e Steel (2011) esses modelos são bastante flexíveis, pois podem ser especificados de diversas maneiras. Para isso, basta assumir diferentes distribuições não negativas para as variáveis X 0, X 1 e X 2. No modelo especificado na seção 3.2.4, observamos que podemos medir o grau de separabilidade a partir de um único parâmetro. Além disso, o modelo permite trabalhar com alcances espaciais diferentes para componentes distintas, uma propriedade bastante importante. 22

35 Capítulo 4 Procedimento de inferência 4.1 Introdução Quando fazemos inferência sobre qualquer conjunto de dados, de fato, estamos interessados em obter informações referentes às quantidades não observadas e desconhecidas. Neste capítulo, vamos apresentar uma breve revisão do procedimento de inferência utilizado na implementação da estrutura de covariância proposta no capítulo 3. Para tanto, considere o vetor de observações y = (y 1,..., y p ) obtido em cada uma das n localizações s D. Como já mencionado anteriormente, dados geoestatísticos são obtidos a partir de processos contínuos ao longo do espaço. Se o processo for gaussiano, então a função de verossimilhança poderá ser escrita da seguinte maneira: { } l(y; θ) = (2π) np 1 2 Σ 1/2 exp 2 (y µ)t Σ 1 (y µ) (4.1) onde y é o vetor contendo as np observações, µ = Xβ é o vetor de médias, Σ é a estrutura de covariância de dimensão np np que define a dependência das p componentes entre si em todas as n localizações, e θ é vetor paramétrico. Neste caso, a estrutura de covariância é definida pela função proposta na equação 3.8. Assim, podemos definir o vetor paramétrico θ que contém as quantidades desconhecidas que precisaremos estimar. Portanto, θ = (σ, δ, α, b, β), onde σ = (σ 1,..., σ p ), δ é o vetor formado pelas componentes latentes δ ij, i j, i, j = 1,..., p, α = (α 0, α 1, α 2 ), b é o vetor formado pelos alcances espaciais b ij, i, j = 1,..., p, e β = (β 10,..., β p0, β 11,..., β p1,..., 23

36 β 1q,..., β pq ), sendo q o número de covariáveis incluindo intercepto. 4.2 Inferência Bayesiana Esta seção apresenta de maneira resumida o procedimento utilizado na estimação dos parâmetros do modelo proposto. Detalhes mais específicos sobre inferência bayesiana podem ser vistos em Migon e Gamerman (1999) e DeGroot e Schervish (2011). Quando trabalhamos sob o enfoque bayesiano, sabemos que a informação dos dados com respeito ao vetor paramétrico θ, traduzida pela função de verossimilhança, é combinada com a informação a priori, especificada através de uma distribuição com densidade p(θ). O resultado obtido a partir dessa combinação é conhecido como distribuição a posteriori, p(θ y). De fato, é razoável pensar que após observar os valores de y, a quantidade de informação a respeito de θ aumenta. O teorema de Bayes define a regra de atualização utilizada para quantificar este aumento de informação e é defindo da seguinte forma: p(θ y) = p(y θ)p(θ), p(y) onde p(y θ) é a função de verossimilhança, p(θ) é a densidade a priori e p(y) = p(y θ)p(θ)dθ pode ser considerada como uma constante em relação ao θ Especificações Dada a equação 4.1, para que o modelo bayesiano fique completo, precisamos especificar a distribuição a priori p(θ). Assumindo independência a priori entre os parâmetros, temos que p(θ) = p(σ)p(δ)p(α)p(b)p(β) ( p ) ( p 1 ) ( p 2 ) ( p ) p = p(σ i ) p(δ ij ) p(α k ) p(b ij ) p(β) i=1 i=1 j=i+1 k=0 i=1 j=1 As distribuições a priori escolhidas para cada um dos parâmetros foram: σ i Ga(c i, d i ), i = 1,..., p, δ ij Ga(f ij, g ij ), i j, i, j = 1,..., p, α k Ga(r k, s k ), k = 0, 1, 2, 24

37 b ij Ga(u ij med(d s ), u ij ), i, j = 1,..., p, med(d s ) sendo a mediana das distâncias espaciais, β N pq (λ, Λ). Para encontrar as distribuições a posteriori dos parâmetros desconhecidos utilizamos simulações estocásticas de Monte Carlo via Cadeias de Markov (MCMC). Detalhes sobre métodos MCMC podem ser encontrados em Gamerman e Lopes (2006). Apenas a distribuição condicional completa de β apresentou forma analítica fechada, portanto, para este parâmetro foi possível gerar amostras da posteriori utilizando amostrador de Gibbs. Assim, considere a função de verossimilhança descrita na equação 4.1, onde µ = Xβ. Seja θ o vetor paramétrico excluindo o vetor β. Se a distribuição a priori for β N pq (λ, Λ), então a distribuição condicional completa de β é β y, θ N pq (λ, Λ ) onde Λ = [ X T Σ 1 X + Λ 1] 1 e λ = Λ [ X T Σ 1 y + Λ 1 λ ]. Para os outros parâmetros do modelo, θ, não foi possível encontrar distribuições condicionais completas com forma fechada, com isso, utilizamos passos de Metropolis- Hastings Previsão Para fazer previsão de observações em determinadas localizações, considere y u como o vetor de observações não medidas em s u localizações pertencentes à região D. Note que essas localizações não precisam, necessariamente, ser as mesmas localizações utilizadas na estimação do modelo. A predição de y u é baseada na distribuição preditiva p(y u y o ), onde y o é o vetor dos valores observados. Então, temos a seguinte relação p(y u y o ) = p(y u, θ y o )dθ = p(y u y o, θ)p(θ y o )dθ (4.2) Como estamos trabalhando com um modelo gaussiano, sabemos, por hipótese, que (y o, y u θ) tem distribuição normal multivariada. Com isso, fica fácil encontrar a distribuição de (y u y o, θ), basta utilizar as propriedades já conhecidas da distribuição normal 25

Desalinhamento de Variáveis em Dados Espacialmente Referenciados

Desalinhamento de Variáveis em Dados Espacialmente Referenciados Dissertação de mestrado Desalinhamento de Variáveis em Dados Espacialmente Referenciados Autor: Estrela Sumário 1 Introdução 5 2 Revisão de Geoestatística 8 2.1 Dados Espacialmente Referenciados...................

Leia mais

Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação

Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Francisco A. Rodrigues Departamento de Matemática Aplicada e Estatística - SME Objetivo Dada M classes ω 1, ω 2,..., ω M e um

Leia mais

Ralph S. Silva

Ralph S. Silva ANÁLISE ESTATÍSTICA MULTIVARIADA Ralph S Silva http://wwwimufrjbr/ralph/multivariadahtml Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Revisão:

Leia mais

ESTATÍSTICA COMPUTACIONAL

ESTATÍSTICA COMPUTACIONAL ESTATÍSTICA COMPUTACIONAL Ralph dos Santos Silva Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Inferência com dimensão variável Modelos com

Leia mais

p(x) Note que 1/p(x), que não depende de θ, funciona como uma constante normalizadora

p(x) Note que 1/p(x), que não depende de θ, funciona como uma constante normalizadora Capítulo 1 Introdução A informação que se tem sobre uma quantidade de interesse θ é fundamental na Estatística. O verdadeiro valor de θ é desconhecido e a idéia é tentar reduzir este desconhecimento. Além

Leia mais

2 Núcleos: suas propriedades e classificações

2 Núcleos: suas propriedades e classificações 2 Núcleos: suas propriedades e classificações O objetivo desse capítulo é o de apresentar as funções núcleos (7), suas propriedades (10) e suas classificações (3). 2.1 Núcleos no espaço de Hilbert Um espaço

Leia mais

Econometria em Finanças e Atuária

Econometria em Finanças e Atuária Ralph S. Silva http://www.im.ufrj.br/ralph/especializacao.html Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Maio-Junho/2013 Modelos condicionalmente

Leia mais

Introdução Variograma Modelos básicos de correlação espacial Modelação Interpolação espacial & Simulação. Geoestatística.

Introdução Variograma Modelos básicos de correlação espacial Modelação Interpolação espacial & Simulação. Geoestatística. Geoestatística Susana Barbosa Mestrado em Ciências Geofísicas 2012-2013 Geoestatística conjunto de técnicas matemáticas e numéricas para caracterizar fenómenos espaciais contínuos tendo em conta a correlação

Leia mais

Tópicos de Estatística Espacial Geoestatística

Tópicos de Estatística Espacial Geoestatística Tópicos de Estatística Espacial Geoestatística Anderson Castro Soares de Oliveira Geoestatística A geoestatística é uma análise espacial que considera que a variável em estudo se distribui continuamente

Leia mais

Inferência Estatistica

Inferência Estatistica Inferência Estatistica Ricardo Ehlers ehlers@icmc.usp.br Departamento de Matemática Aplicada e Estatística Universidade de São Paulo Modelos e Inferência Um modelo é uma simplificação da realidade (e alguns

Leia mais

Novembro/2018. Ajuste Automático ao Histórico em Simulação de Reservatórios

Novembro/2018. Ajuste Automático ao Histórico em Simulação de Reservatórios Ajuste Automático ao Histórico Simulação de Reservatórios Flavio Dickstein Paulo Goldfeld Renan V. Pinto IM/UFRJ IM/UFRJ LabMAPetro/UFRJ Novembro/2018 Simulação sob incerteza (i) O reservatório é inacessível

Leia mais

Definição. Os valores assumidos pelos estimadores denomina-se estimativas pontuais ou simplesmente estimativas.

Definição. Os valores assumidos pelos estimadores denomina-se estimativas pontuais ou simplesmente estimativas. 1. Inferência Estatística Inferência Estatística é o uso da informção (ou experiência ou história) para a redução da incerteza sobre o objeto em estudo. A informação pode ou não ser proveniente de um experimento

Leia mais

CC-226 Aula 07 - Estimação de Parâmetros

CC-226 Aula 07 - Estimação de Parâmetros CC-226 Aula 07 - Estimação de Parâmetros Carlos Henrique Q. Forster - Instituto Tecnológico de Aeronáutica 2008 Estimação de Parâmetros Para construir o classificador bayesiano, assumimos as distribuições

Leia mais

Alguns Aspectos Espaciais da Modelagem de Observações Provenientes das Áreas de SaúdeedoMeioAmbiente

Alguns Aspectos Espaciais da Modelagem de Observações Provenientes das Áreas de SaúdeedoMeioAmbiente Alguns Aspectos Espaciais da Modelagem de Observações Provenientes das Áreas de SaúdeedoMeioAmbiente Alexandra Mello Schmidt DME - IM - UFRJ Homepage: www.dme.ufrj.br/ alex Seminário Qualidade do Ar e

Leia mais

Gibbs Sampler para ANOVA e Misturas

Gibbs Sampler para ANOVA e Misturas Gibbs Sampler para ANOVA e Misturas Renato Assunção - DCC, UFMG Outubro de 014 1 Modelo ANOVA: componentes de variância Suponha que temos K grupos ou classes. Em cada grupo, temos um certo número de dados

Leia mais

Influencia de Distribuições a priori na Analise Bayesiana em dados de contagem

Influencia de Distribuições a priori na Analise Bayesiana em dados de contagem Influencia de Distribuições a priori na Analise Bayesiana em dados de contagem Olinda Fátima dos Santos 1 Carla Regina Guimarães Brighenti 1 1-Introdução A utilização de informação a priori em inferência

Leia mais

Ajuste do modelo de regressão linear: Inferência Bayesiana, aspectos computacionais e seleção de variáveis.

Ajuste do modelo de regressão linear: Inferência Bayesiana, aspectos computacionais e seleção de variáveis. Ajuste do modelo de regressão linear: Inferência Bayesiana, aspectos computacionais e seleção de variáveis. João Daniel Nunes Duarte a, Vinícius Diniz Mayrink b a Estudante de Graduação, e-mail: joaodaniel@ufmg.br

Leia mais

ESTATÍSTICA COMPUTACIONAL

ESTATÍSTICA COMPUTACIONAL ESTATÍSTICA COMPUTACIONAL Ralph dos Santos Silva Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Motivação Por exemplo, queremos analisar a série

Leia mais

IND 1115 Inferência Estatística Aula 6

IND 1115 Inferência Estatística Aula 6 Conteúdo IND 5 Inferência Estatística Aula 6 Setembro de 004 A distribuição Lognormal A distribuição Beta e sua relação com a Uniforme(0,) Mônica Barros mbarros.com mbarros.com A distribuição Lognormal

Leia mais

Análise de Dados Longitudinais Aula

Análise de Dados Longitudinais Aula 1/35 Análise de Dados Longitudinais Aula 08.08.2018 José Luiz Padilha da Silva - UFPR www.docs.ufpr.br/ jlpadilha 2/35 Sumário 1 Revisão para dados transversais 2 Como analisar dados longitudinais 3 Perspectiva

Leia mais

A análise de séries temporais é uma área da estatística dedicada ao estudo de dados orientados no tempo (MONTGOMERY, 2004).

A análise de séries temporais é uma área da estatística dedicada ao estudo de dados orientados no tempo (MONTGOMERY, 2004). 3 Séries temporais A análise de séries temporais é uma área da estatística dedicada ao estudo de dados orientados no tempo (MONTGOMERY, 2004). 3.1. Princípios fundamentais Conforme Box et al. (1994), uma

Leia mais

Aula 2 Uma breve revisão sobre modelos lineares

Aula 2 Uma breve revisão sobre modelos lineares Aula Uma breve revisão sobre modelos lineares Processo de ajuste de um modelo de regressão O ajuste de modelos de regressão tem como principais objetivos descrever relações entre variáveis, estimar e testar

Leia mais

Inferência Bayesiana

Inferência Bayesiana Inferência Bayesiana Joaquim Neto joaquim.neto@ufjf.edu.br www.ufjf.br/joaquim_neto Departamento de Estatística - ICE Universidade Federal de Juiz de Fora (UFJF) Versão 3.0 Joaquim Neto (UFJF) ICE - UFJF

Leia mais

Metodologia de inversão

Metodologia de inversão 6 Metodologia de inversão Nesta tese, a transformação de velocidades em pressão de poros é encarada como um problema de inversão. Pela natureza do problema, essa transformação apresenta caráter não único

Leia mais

Modelos espaço-temporais com caudas pesadas e assimétricos

Modelos espaço-temporais com caudas pesadas e assimétricos Modelos espaço-temporais com caudas pesadas e assimétricos Renata Souza Bueno Universidade Federal do Rio de Janeiro Instituto de Matemática Departamento de Métodos Estatísticos 2016 Modelos espaço-temporais

Leia mais

Modelos de Regressão Linear Simples - parte I

Modelos de Regressão Linear Simples - parte I Modelos de Regressão Linear Simples - parte I Erica Castilho Rodrigues 19 de Agosto de 2014 Introdução 3 Objetivos Ao final deste capítulo você deve ser capaz de: Usar modelos de regressão para construir

Leia mais

Redes Neurais. A Rede RBF. Redes RBF: Função de Base Radial. Prof. Paulo Martins Engel. Regressão não paramétrica. Redes RBF: Radial-Basis Functions

Redes Neurais. A Rede RBF. Redes RBF: Função de Base Radial. Prof. Paulo Martins Engel. Regressão não paramétrica. Redes RBF: Radial-Basis Functions Redes RBF: Função de Base Radial Redes Neurais A Rede RBF O LP é baseado em unidades que calculam uma função não-linear do produto escalar do vetor de entrada e um vetor de peso. A rede RBF pertence a

Leia mais

Um modelo estocástico para o fluxo de caixa de um plano de previdência de um indivíduo 15

Um modelo estocástico para o fluxo de caixa de um plano de previdência de um indivíduo 15 2 Simulação estocástica A simulação computacional consiste em empregar técnicas matemáticas em computadores com o propósito de gerar ensaios que tentam reproduzir de maneira análoga um processo ou operação

Leia mais

AULA 7 - Inferência em MQO: ICs e Testes de

AULA 7 - Inferência em MQO: ICs e Testes de AULA 7 - Inferência em MQO: ICs e Testes de Hipóteses Susan Schommer Econometria I - IE/UFRJ Nosso primeiro objetivo aqui é relembrar a diferença entre estimação de ponto vs estimação de intervalo. Vamos

Leia mais

Avaliação Monte Carlo do teste para comparação de duas matrizes de covariâncias normais na presença de correlação

Avaliação Monte Carlo do teste para comparação de duas matrizes de covariâncias normais na presença de correlação Avaliação Monte Carlo do teste para comparação de duas matrizes de covariâncias normais na presença de correlação Vanessa Siqueira Peres da Silva 1 2 Daniel Furtado Ferreira 1 1 Introdução É comum em determinadas

Leia mais

Técnicas computacionais em probabilidade e estatística II

Técnicas computacionais em probabilidade e estatística II Técnicas computacionais em probabilidade e estatística II Universidade de São Paulo Instituto de Matemática e Estatística http:www.ime.usp.br/ mbranco AULA 1: Problemas Computacionais em Inferência Estatística.

Leia mais

CC-226 Aula 05 - Teoria da Decisão Bayesiana

CC-226 Aula 05 - Teoria da Decisão Bayesiana CC-226 Aula 05 - Teoria da Decisão Bayesiana Carlos Henrique Q. Forster - Instituto Tecnológico de Aeronáutica 2008 Classificador Bayesiano Considerando M classes C 1... C M. N observações x j. L atributos

Leia mais

Coeficiente de determinação R 2 no modelo de regressão linear normal

Coeficiente de determinação R 2 no modelo de regressão linear normal Coeficiente de determinação R 2 no modelo de regressão linear normal Fernando Lucambio Departamento de Estatística Universidade Federal do Paraná Curitiba/PR, 81531 990, Brasil email: lucambio@ufpr.br

Leia mais

Séries Temporais e Modelos Dinâmicos. Econometria. Marcelo C. Medeiros. Aula 9

Séries Temporais e Modelos Dinâmicos. Econometria. Marcelo C. Medeiros. Aula 9 em Econometria Departamento de Economia Pontifícia Universidade Católica do Rio de Janeiro Aula 9 Data Mining Equação básica: Amostras finitas + muitos modelos = modelo equivocado. Lovell (1983, Review

Leia mais

Modelo fatorial espacial dinâmico para dados pertencentes à família exponencial

Modelo fatorial espacial dinâmico para dados pertencentes à família exponencial Modelo fatorial espacial dinâmico para dados pertencentes à família exponencial Esther Salazar esalazar@dme.ufrj.br Departamento de Métodos Estatísticos Universidade Federal do Rio de Janeiro 18 o SINAPE

Leia mais

Modelos de Regressão Linear Simples parte I

Modelos de Regressão Linear Simples parte I Modelos de Regressão Linear Simples parte I Erica Castilho Rodrigues 27 de Setembro de 2017 1 2 Objetivos Ao final deste capítulo você deve ser capaz de: Usar modelos de regressão para construir modelos

Leia mais

Econometria IV Modelos Lineares de Séries Temporais. Fernando Chague

Econometria IV Modelos Lineares de Séries Temporais. Fernando Chague Econometria IV Modelos Lineares de Séries Temporais Fernando Chague 2016 Estacionariedade Estacionariedade Inferência estatística em séries temporais requer alguma forma de estacionariedade dos dados Intuição:

Leia mais

AGA Análise de Dados em Astronomia I 7. Modelagem dos Dados com Máxima Verossimilhança: Modelos Lineares

AGA Análise de Dados em Astronomia I 7. Modelagem dos Dados com Máxima Verossimilhança: Modelos Lineares 1 / 0 AGA 0505- Análise de Dados em Astronomia I 7. Modelagem dos Dados com Máxima Verossimilhança: Modelos Lineares Laerte Sodré Jr. 1o. semestre, 018 modelos modelagem dos dados dado um conjunto de dados,

Leia mais

Introdução à Probabilidade e à Estatística II

Introdução à Probabilidade e à Estatística II Introdução à Probabilidade e à Estatística II Introdução à Inferência Estatística Capítulo 10, Estatística Básica (Bussab&Morettin, 7a Edição) Lígia Henriques-Rodrigues MAE0229 1º semestre 2018 1 / 36

Leia mais

AGA Análise de Dados em Astronomia I 8. Inferência Bayesiana e MCMC

AGA Análise de Dados em Astronomia I 8. Inferência Bayesiana e MCMC 1 / 1 AGA 0505- Análise de Dados em Astronomia I 8. Inferência Bayesiana e MCMC Laerte Sodré Jr. 1o. semestre, 2018 2 / 1 Inferência Bayesiana inferência bayesiana consideremos um conjunto de dados D que

Leia mais

Econometria. Econometria: Paradigma. Porque usar econometria? Porque usar econometria?

Econometria. Econometria: Paradigma. Porque usar econometria? Porque usar econometria? Econometria: Paradigma Econometria 1. O Paradigma da Econometria 19/8 Fundamentos teóricos Microeconometria e macroeconometria Modelagem comportamental: otimização, oferta de trabalho, equações de demanda,

Leia mais

Fundação Oswaldo Cruz Escola Nacional de Saúde Pública Departamento de Epidemiologia. Estatística espacial. Áreas

Fundação Oswaldo Cruz Escola Nacional de Saúde Pública Departamento de Epidemiologia. Estatística espacial. Áreas Fundação Oswaldo Cruz Escola Nacional de Saúde Pública Departamento de Epidemiologia Estatística espacial Áreas Áreas Na análise de áreas o atributo estudado é em geral resultando de uma contagem ou um

Leia mais

Distribuições Amostrais e Estimação Pontual de Parâmetros

Distribuições Amostrais e Estimação Pontual de Parâmetros Distribuições Amostrais e Estimação Pontual de Parâmetros - parte I 2012/02 1 Introdução 2 3 4 5 Objetivos Ao final deste capítulo você deve ser capaz de: Entender estimação de parâmetros de uma distribuição

Leia mais

Séries Temporais e Modelos Dinâmicos. Econometria. Marcelo C. Medeiros. Aula 12

Séries Temporais e Modelos Dinâmicos. Econometria. Marcelo C. Medeiros. Aula 12 em Econometria Departamento de Economia Pontifícia Universidade Católica do Rio de Janeiro Aula 12 Regressão com Variáveis Não-Estacionárias Considere três processos estocásticos definidos pelas seguintes

Leia mais

ESTATÍSTICA COMPUTACIONAL

ESTATÍSTICA COMPUTACIONAL ESTATÍSTICA COMPUTACIONAL Ralph dos Santos Silva Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Introdução Solução de equações não lineares

Leia mais

Seja (X,Y) uma v.a. bidimensional contínua ou discreta. Define-se valor esperado condicionado de X para um dado Y igual a y da seguinte forma:

Seja (X,Y) uma v.a. bidimensional contínua ou discreta. Define-se valor esperado condicionado de X para um dado Y igual a y da seguinte forma: 46 VALOR ESPERADO CONDICIONADO Seja (X,Y) uma v.a. bidimensional contínua ou discreta. Define-se valor esperado condicionado de X para um dado Y igual a y da seguinte forma: Variável contínua E + ( X Y

Leia mais

Modelos Espaço-Temporais

Modelos Espaço-Temporais p. Modelos Espaço-Temporais para Dados de Área Marco A. R. Ferreira (marco@im.ufrj.br) Universidade Federal do Rio de Janeiro http://www.dme.ufrj.br/marco Colaboração com Juan C. Vivar-Rojas p. Organização

Leia mais

Modelos Lineares Generalizados - Estimação em Modelos Lineares Generalizados

Modelos Lineares Generalizados - Estimação em Modelos Lineares Generalizados Modelos Lineares Generalizados - Estimação em Modelos Lineares Generalizados Erica Castilho Rodrigues 23 de Maio de 207 Introdução 2 3 Vimos como encontrar o EMV usando algoritmos numéricos. Duas possibilidades:

Leia mais

ESTATÍSTICA COMPUTACIONAL

ESTATÍSTICA COMPUTACIONAL ESTATÍSTICA COMPUTACIONAL Ralph dos Santos Silva Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Escolha de modelos Até aqui assumimos que z

Leia mais

Inferência para CS Tópico 10 - Princípios de Estimação Pontual

Inferência para CS Tópico 10 - Princípios de Estimação Pontual Inferência para CS Tópico 10 - Princípios de Estimação Pontual Renato Martins Assunção DCC - UFMG 2013 Renato Martins Assunção (DCC - UFMG) Inferência para CS Tópico 10 - Princípios de Estimação Pontual

Leia mais

IND 1115 Inferência Estatística Aula 7

IND 1115 Inferência Estatística Aula 7 Conteúdo IND 1115 Inferência Estatística Aula 7 Setembro 2004 Por que a revisão de probabilidades até agora? A importância da distribuição Normal O Mônica Barros mbarros.com 1 mbarros.com 2 Por que uma

Leia mais

Técnicas computacionais em probabilidade e estatística II

Técnicas computacionais em probabilidade e estatística II Técnicas computacionais em probabilidade e estatística II Universidade de São Paulo Instituto de Matemática e Estatística http:www.ime.usp.br/ mbranco Métodos de Monte Carlo baseados em Cadeias de Markov:

Leia mais

Análise de variância para experimentos com dependência espacial entre parcelas: abordagem autoregressiva e Geoestatística

Análise de variância para experimentos com dependência espacial entre parcelas: abordagem autoregressiva e Geoestatística Análise de variância para experimentos com dependência espacial entre parcelas: abordagem autoregressiva e Geoestatística Diogo Francisco Rossoni (DES/UEM) Cristina Henriques Nogueira (DEX/UFLA) Renato

Leia mais

Econometria em Finanças e Atuária

Econometria em Finanças e Atuária Ralph S. Silva http://www.im.ufrj.br/ralph/especializacao.html Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Maio-Junho/2013 Motivação Motivação Por

Leia mais

ESTATÍSTICA COMPUTACIONAL

ESTATÍSTICA COMPUTACIONAL ESTATÍSTICA COMPUTACIONAL Ralph dos Santos Silva Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Se a integração analítica não é possível ou

Leia mais

Métodos Quantitativos para Avaliação de Políticas Públicas

Métodos Quantitativos para Avaliação de Políticas Públicas ACH3657 Métodos Quantitativos para Avaliação de Políticas Públicas Aula 11 Análise de Resíduos Alexandre Ribeiro Leichsenring alexandre.leichsenring@usp.br Alexandre Leichsenring ACH3657 Aula 11 1 / 26

Leia mais

Modelos Lineares Generalizados - Componentes do Modelo

Modelos Lineares Generalizados - Componentes do Modelo Modelos Lineares Generalizados - Componentes do Modelo Erica Castilho Rodrigues 01 de Abril de 2014 3 Vejamos agora quais as componentes de um Modelo Linear Generalizado. Temos um conjunto de variáveis

Leia mais

UTILIZAÇÃO DE GEOESTATÍSTICA PARA O ESTUDO DO ATRIBUTO COBRE NO SOLO. Gabriel Tambarussi Avancini 1 RESUMO

UTILIZAÇÃO DE GEOESTATÍSTICA PARA O ESTUDO DO ATRIBUTO COBRE NO SOLO. Gabriel Tambarussi Avancini 1 RESUMO UTILIZAÇÃO DE GEOESTATÍSTICA PARA O ESTUDO DO ATRIBUTO COBRE NO SOLO Gabriel Tambarussi Avancini 1 RESUMO Este trabalho teve como objetivo estudar a espacialização do atributo cobre, Cu, do solo utilizando

Leia mais

Modelos para Séries Temporais Aula 1. Morettin e Toloi, 2006, Capítulo 2 Morettin, 2011, Capítulo 2 Bueno, 2011, Capítulo 2

Modelos para Séries Temporais Aula 1. Morettin e Toloi, 2006, Capítulo 2 Morettin, 2011, Capítulo 2 Bueno, 2011, Capítulo 2 Modelos para Séries Temporais Aula 1 Morettin e Toloi, 2006, Capítulo 2 Morettin, 2011, Capítulo 2 Bueno, 2011, Capítulo 2 Modelos para Séries Temporais Os modelos utilizados para descrever séries temporais

Leia mais

)XQGDPHQWRVGHSUREDELOLGDGHHHVWDWtVWLFD

)XQGDPHQWRVGHSUREDELOLGDGHHHVWDWtVWLFD )XQGDPHQWRVGHUREDELOLGDGHHHVWDWtVWLFD,QWURGXomR A história da estatística pode ser dividida em três fases. De acordo com PEANHA (00), a estatística inicialmente não mantinha nenhuma relação com a probabilidade,

Leia mais

Modelos com Coeficientes Dinâmicos Variando no Espaço para Dados da Família Exponencial

Modelos com Coeficientes Dinâmicos Variando no Espaço para Dados da Família Exponencial Modelos com Coeficientes Dinâmicos Variando no Espaço para Dados da Família Exponencial por Nícia Custódio Hansen DME - IM - UFRJ 2009 Modelos com Coeficientes Dinâmicos Variando no Espaço para Dados da

Leia mais

Inferência Bayesiana Exata para Processos de Cox Level-Set

Inferência Bayesiana Exata para Processos de Cox Level-Set Inferência Bayesiana Exata para Processos de Cox Level-Set Bárbara da Costa Campos Dias 1 Flávio Bambirra Gonçalves 2 Resumo Este trabalho propõe uma metodologia de inferência exata para processos de Cox

Leia mais

INTRODUÇÃO À ESTATÍSTICA ESPACIAL. Prof. Anderson Rodrigo da Silva

INTRODUÇÃO À ESTATÍSTICA ESPACIAL. Prof. Anderson Rodrigo da Silva INTRODUÇÃO À ESTATÍSTICA ESPACIAL Prof. Anderson Rodrigo da Silva anderson.silva@ifgoiano.edu.br Métodos Índices de agregação Métodos de quantificação da dependência especial Correlograma Variograma Métodos

Leia mais

Estatísticas Inferenciais Distribuições Amostrais. Estatística

Estatísticas Inferenciais Distribuições Amostrais. Estatística Estatística Na descrição dos conjuntos de dados x 1,..., x n, não foi feita menção ao conceito de população. Estatísticas inferenciais: preocupadas com a fonte dos dados e em tentar fazer generalizações

Leia mais

Minera c ao de Dados Aula 6: Finaliza c ao de Regress ao e Classifica c ao Rafael Izbicki 1 / 33

Minera c ao de Dados Aula 6: Finaliza c ao de Regress ao e Classifica c ao Rafael Izbicki 1 / 33 Mineração de Dados Aula 6: Finalização de Regressão e Classificação Rafael Izbicki 1 / 33 Como fazer um IC para o risco estimado? Vamos assumir que ( X 1, Ỹ1),..., ( X s, Ỹs) são elementos de um conjunto

Leia mais

Geração de cenários de energia renovável correlacionados com hidrologia: uma abordagem bayesiana multivariada.

Geração de cenários de energia renovável correlacionados com hidrologia: uma abordagem bayesiana multivariada. Geração de cenários de energia renovável correlacionados com hidrologia: uma abordagem bayesiana multivariada [alessandro@psr-inc.com] Conteúdo Introdução Estimação não paramétrica (Kernel density) Transformação

Leia mais

CONHECIMENTOS ESPECÍFICOS

CONHECIMENTOS ESPECÍFICOS CONHECIMENTOS ESPECÍFICOS 2003 2004 2005 2006 2007 2008 2009 2010 X 39,0 39,5 39,5 39,0 39,5 41,5 42,0 42,0 Y 46,5 65,5 86,0 100,0 121,0 150,5 174,0 203,0 A tabela acima mostra as quantidades, em milhões

Leia mais

SUMÁRIOS DE VARIÁVEIS ALEATÓRIAS CONTINUAS

SUMÁRIOS DE VARIÁVEIS ALEATÓRIAS CONTINUAS 4 SUMÁRIOS DE VARIÁVEIS ALEATÓRIAS CONTINUAS Em muitos problemas de probabilidade que requerem o uso de variáveis aleatórias, uma completa especificação da função de densidade de probabilidade ou não está

Leia mais

ANÁLISE DE SÉRIES TEMPORAIS

ANÁLISE DE SÉRIES TEMPORAIS ANÁLISE DE SÉRIES TEMPORAIS Ralph S. Silva http://www.im.ufrj.br/ralph/seriestemporais.html Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Estimação

Leia mais

Referência Banco de dados FioCruz Doc LAB1_GEO.doc. Autor Eduardo C. G. Camargo Versão 1.0 Data DEZ / Revisão Versão Data

Referência Banco de dados FioCruz Doc LAB1_GEO.doc. Autor Eduardo C. G. Camargo Versão 1.0 Data DEZ / Revisão Versão Data Ministério da Ciência e Tecnologia Instituto Nacional de Pesquisas Espaciais Análise Espacial de Dados Geográficos Laboratório Módulo: Geoestatística Linear Referência Banco de dados FioCruz Doc LAB_GEO.doc

Leia mais

Variáveis bidimensionais

Variáveis bidimensionais Wagner H. Bonat Fernando P. Mayer Elias T. Krainski Universidade Federal do Paraná Departamento de Estatística Laboratório de Estatística e Geoinformação 19/04/2018 WB, FM, EK ( LEG/DEST/UFPR ) Variáveis

Leia mais

Técnicas Multivariadas em Saúde. Vetores Aleatórios. Métodos Multivariados em Saúde Roteiro. Definições Principais. Vetores aleatórios:

Técnicas Multivariadas em Saúde. Vetores Aleatórios. Métodos Multivariados em Saúde Roteiro. Definições Principais. Vetores aleatórios: Roteiro Técnicas Multivariadas em Saúde Lupércio França Bessegato Dep. Estatística/UFJF 1. Introdução 2. Distribuições de Probabilidade Multivariadas 3. Representação de Dados Multivariados 4. Testes de

Leia mais

Métodos Não Paramétricos

Métodos Não Paramétricos Universidade Federal do Paraná Departamento de Informática Reconhecimento de Padrões Métodos não Paramétricos Luiz Eduardo S. Oliveira, Ph.D. http://lesoliveira.net Métodos Não Paramétricos Introduzir

Leia mais

Planejamento Amostral Ótimo em Geoestatística sob Efeito de Amostragem Preferencial

Planejamento Amostral Ótimo em Geoestatística sob Efeito de Amostragem Preferencial Planejamento Amostral Ótimo em Geoestatística sob Efeito de Amostragem Preferencial Tese de Doutorado por Gustavo da Silva Ferreira Departamento de Métodos Estatísticos Instituto de Matemática Universidade

Leia mais

Cálculo das Probabilidades e Estatística I

Cálculo das Probabilidades e Estatística I Cálculo das Probabilidades e Estatística I Prof a. Juliana Freitas Pires Departamento de Estatística Universidade Federal da Paraíba - UFPB juliana@de.ufpb.br Distribuição Normal Motivação: Distribuição

Leia mais

3 3. Variáveis Aleatórias

3 3. Variáveis Aleatórias ÍNDICE 3. VARIÁVEIS ALEATÓRIAS...49 3.. VARIÁVEIS ALEATÓRIAS UNIDIMENSIONAIS...49 3.2. VARIÁVEIS DISCRETAS FUNÇÃO DE PROBABILIDADE E FUNÇÃO DISTRIBUIÇÃO DE PROBABILIDADE...50 3.2.. Função de probabilidade...50

Leia mais

Introdução à Teoria de Resposta ao Item

Introdução à Teoria de Resposta ao Item Caio L. N. Azevedo, IMECC/Unicamp Dani Gamerman, DME/UFRJ I CONBRATRI, Florianópolis 9 de dezembro de 2009 Parte II Parte 2: Implementação computacional. Análise de dados 1. Modelo de 3 parâmetros via

Leia mais

Aprendizado por Instâncias Janelas de Parzen & Knn

Aprendizado por Instâncias Janelas de Parzen & Knn Universidade Federal do Paraná (UFPR) Especialização em Engenharia Industrial 4.0 Aprendizado por Instâncias Janelas de Parzen & Knn David Menotti www.inf.ufpr.br/menotti/ci171-182 Hoje Aprendizado por

Leia mais

Inferência para CS Modelos univariados contínuos

Inferência para CS Modelos univariados contínuos Inferência para CS Modelos univariados contínuos Renato Martins Assunção DCC - UFMG 2014 Renato Martins Assunção (DCC - UFMG) Inferência para CS Modelos univariados contínuos 2014 1 / 42 V.A. Contínua

Leia mais

AULA 9 - MQO em regressão múltipla: Propriedades Estatísticas (Valor Esperado)

AULA 9 - MQO em regressão múltipla: Propriedades Estatísticas (Valor Esperado) AULA 9 - MQO em regressão múltipla: Propriedades Estatísticas (Valor Esperado) Susan Schommer Econometria I - IE/UFRJ Valor esperado dos estimadores MQO Nesta aula derivamos o valor esperado dos estimadores

Leia mais

Introdução a Inferência Bayesiana

Introdução a Inferência Bayesiana Introdução a Inferência Bayesiana Helio S. Migon IM and COPPE - UFRJ migon@im.ufrj.br 2006 Conteúdo 1. Conceitos Básicos da Inferência 2. Distribuição a Priori 3. Sumariazação 4. Inferência Preditiva 1

Leia mais

Análise de Regressão Linear Simples e

Análise de Regressão Linear Simples e Análise de Regressão Linear Simples e Múltipla Carla Henriques Departamento de Matemática Escola Superior de Tecnologia de Viseu Introdução A análise de regressão estuda o relacionamento entre uma variável

Leia mais

Cap. 8 - Intervalos Estatísticos para uma Única Amostra

Cap. 8 - Intervalos Estatísticos para uma Única Amostra Intervalos Estatísticos para ESQUEMA DO CAPÍTULO 8.1 INTRODUÇÃO 8.2 INTERVALO DE CONFIANÇA PARA A MÉDIA DE UMA DISTRIBUIÇÃO NORMAL, VARIÂNCIA CONHECIDA 8.3 INTERVALO DE CONFIANÇA PARA A MÉDIA DE UMA DISTRIBUIÇÃO

Leia mais

PROCESSOS ESTOCÁSTICOS. O resultado de muitas experiências aleatórias é função do tempo ou de uma (ou mais) coordenada espacial.

PROCESSOS ESTOCÁSTICOS. O resultado de muitas experiências aleatórias é função do tempo ou de uma (ou mais) coordenada espacial. 37 PROCESSOS ESTOCÁSTICOS O resultado de muitas experiências aleatórias é função do tempo ou de uma (ou mais) coordenada espacial. Ex: i) O valor da temperatura média diária ou semanal numa cidade. O acontecimento

Leia mais

COMPARAÇÃO ENTRE MODELOS GEOESTATÍSTICOS UNIVARIADO E BIVARIADO NA ESTIMAÇÃO DA CAPTURA POR UNIDADE DE ESFORÇO: UM ESTUDO DE SIMULAÇÃO

COMPARAÇÃO ENTRE MODELOS GEOESTATÍSTICOS UNIVARIADO E BIVARIADO NA ESTIMAÇÃO DA CAPTURA POR UNIDADE DE ESFORÇO: UM ESTUDO DE SIMULAÇÃO COMPARAÇÃO ENTRE MODELOS GEOESTATÍSTICOS UNIVARIADO E BIVARIADO NA ESTIMAÇÃO DA CAPTURA POR UNIDADE DE ESFORÇO: UM ESTUDO DE SIMULAÇÃO Júlio César Pereira,3, Alexandra Mello Schmidt, Roseli Aparecida Leandro

Leia mais

Distribuição Normal. Prof. Eduardo Bezerra. (CEFET/RJ) - BCC - Inferência Estatística. 25 de agosto de 2017

Distribuição Normal. Prof. Eduardo Bezerra. (CEFET/RJ) - BCC - Inferência Estatística. 25 de agosto de 2017 padrão - padronização Distribuição Normal Prof. Eduardo Bezerra (CEFET/RJ) - BCC - Inferência Estatística 25 de agosto de 2017 Eduardo Bezerra (CEFET/RJ) Distribuição Normal Março/2017 1 / 32 Roteiro Distribuições

Leia mais

Modelagem Conjunta de Média e Variância: Uma Aplicação ao Problema de Estimação em Pequenos Domínios

Modelagem Conjunta de Média e Variância: Uma Aplicação ao Problema de Estimação em Pequenos Domínios Modelagem Conjunta de Média e Variância: Uma Aplicação ao Problema de Estimação em Pequenos Domínios por Joaquim Henriques Vianna Neto DME - IM - UFRJ 2007 Modelagem Conjunta de Média e Variância: Uma

Leia mais

Econometria em Finanças e Atuária

Econometria em Finanças e Atuária Ralph S. Silva http://www.im.ufrj.br/ralph/especializacao.html Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Maio-Junho/2013 Posição financeira Uma

Leia mais

MAE Introdução à Probabilidade e Estatística II Resolução Lista 5

MAE Introdução à Probabilidade e Estatística II Resolução Lista 5 MAE 229 - Introdução à Probabilidade e Estatística II Resolução Lista 5 Professor: Pedro Morettin e Profa. Chang Chian Exercício 1 (a) De uma forma geral, o desvio padrão é usado para medir a dispersão

Leia mais

Modelos para dados de contagem espacial com sobredispersão

Modelos para dados de contagem espacial com sobredispersão Modelos para dados de contagem espacial com sobredispersão Luiz Fernando Lima Costa Universidade Federal do Rio de Janeiro Instituto de Matemática Departamento de Métodos Estatísticos 2015 Modelos para

Leia mais

CONHECIMENTOS ESPECÍFICOS

CONHECIMENTOS ESPECÍFICOS CONHECIMENTOS ESPECÍFICOS A distribuição dos tempos de permanência dos estudantes nos cursos de graduação de certa universidade é uma distribuição normal com média igual a 6 anos e desvio padrão igual

Leia mais

Vetor de Variáveis Aleatórias

Vetor de Variáveis Aleatórias Vetor de Variáveis Aleatórias Luis Henrique Assumpção Lolis 25 de junho de 2013 Luis Henrique Assumpção Lolis Vetor de Variáveis Aleatórias 1 Conteúdo 1 Vetor de Variáveis Aleatórias 2 Função de Várias

Leia mais

Modelagem de Processos Espaciais e

Modelagem de Processos Espaciais e Modelagem de Processos Espaciais e Espaço-Temporais Alexandra M. Schmidt Instituto de Matemática - UFRJ www.dme.ufrj.br/ alex Outlines Parte I Parte I Processos Estocásticos e Aplicações IMPA - Abril de

Leia mais

Fundação Oswaldo Cruz Escola Nacional de Saúde Pública Departamento de Epidemiologia. Estatística espacial. Padrão Pontual

Fundação Oswaldo Cruz Escola Nacional de Saúde Pública Departamento de Epidemiologia. Estatística espacial. Padrão Pontual Fundação Oswaldo Cruz Escola Nacional de Saúde Pública Departamento de Epidemiologia Estatística espacial Padrão Pontual Padrão de Pontos A análise de padrão de pontos, é o tipo mais simples de análise

Leia mais

7 Conclusões e desenvolvimentos futuros

7 Conclusões e desenvolvimentos futuros 7 Conclusões e desenvolvimentos futuros 7.1 Conclusões Este trabalho apresentou novas soluções para a determinação da posição de terminais de comunicações móveis com base em medidas de ToA. Nos métodos

Leia mais

Aula 1. Wilson Correa. June 27, 2017

Aula 1. Wilson Correa. June 27, 2017 Aula 1 Definições Básicas Wilson Correa June 27, 2017 Série de Tempo Definição Uma série de tempo é qualquer conjunto de observações ordenadas no tempo. Podem ser: Discretas. Ex: Valores Diários de Poluição,

Leia mais

Redução de Dimensão para Modelos Espaciais não Gaussianos

Redução de Dimensão para Modelos Espaciais não Gaussianos Redução de Dimensão para Modelos Espaciais não Gaussianos por Mariana del Pilar Lizarazo Osorio Universidade Federal do Rio de Janeiro Instituto de Matemática Departamento de Métodos Estatísticos 2013

Leia mais

Métodos Computacionais para inferência estatística

Métodos Computacionais para inferência estatística Métodos Computacionais para inferência estatística Wagner Hugo Bonat LEG: Laboratório de Estatística e Geoinformação Universidade Federal do Paraná 30 de julho de 2012 Bonat et. al (LEG/UFPR) MCIE 30 de

Leia mais