Modelos espaço-temporais com caudas pesadas e assimétricos

Tamanho: px
Começar a partir da página:

Download "Modelos espaço-temporais com caudas pesadas e assimétricos"

Transcrição

1 Modelos espaço-temporais com caudas pesadas e assimétricos Renata Souza Bueno Universidade Federal do Rio de Janeiro Instituto de Matemática Departamento de Métodos Estatísticos 2016

2 Modelos espaço-temporais com caudas pesadas e assimétricos Renata Souza Bueno Tese de Doutorado submetida ao Programa de Pós-Graduação em Estatística do Instituto de Matemática da Universidade Federal do Rio de Janeiro, UFRJ, como parte dos requisitos necessários à obtenção do grau de Doutor em Estatística. Orientadoras: Alexandra M. Schmidt e Thais C. O. da Fonseca Rio de Janeiro, RJ - Brasil 2016 ii

3 Modelos espaço-temporais com caudas pesadas e assimétricos Renata Souza Bueno Tese de Doutorado submetida ao Programa de Pós-Graduação em Estatística do Instituto de Matemática da Universidade Federal do Rio de Janeiro, UFRJ, como parte dos requisitos necessários à obtenção do grau de Doutor em Estatística. Aprovada por: Prof a. Alexandra M. Schmidt, PhD, UFRJ (Presidente) Prof a. Thais C. O. Fonseca, PhD, UFRJ Prof. Helio dos Santos Migon, PhD, UFRJ Prof. Dani Gamerman, PhD, UFRJ Prof a. Rosangela H. Loschi, PhD, UFMG Prof. Reinaldo B. Arellano-Vale, PhD, PUC-Chile Rio de Janeiro, RJ - Brasil 2016 iii

4 iv À minha estrela guia, Dona Stella.

5 Quanto mais eu estudo e tento chegar a algum lugar, mais o universo se dilata, mais consciente eu me torno de tudo que não sei e nem vou saber.... Victoria Saramago v

6 Agradecimentos Primeiramente, agradeço a Deus por ter me dado saúde, uma família maravilhosa e força para seguir em frente. Agradeço à mulher mais importante da minha vida! Minha mãe, Dona Stella. Minha grande incentivadora em tudo e em especial nos estudos. Foi minha grande companheira em vida e sou muito grata pela oportunidade de ter convivido com ela. Ao meu pai, agradeço por todo o carinho e apoio durante minha trajetória. Agradeço também todas as conversas e idas oportunas ao cinema. À minha vó Edna por toda inspiração que ela me causa e por ser um exemplo de pessoa para mim. Por todo amor, dedicação e força que ela me dá. Ao meu irmão, agradeço pelo amor e carinho depositados em mim e por ter me dado meu maior presente, minha sobrinha Manuela. À Manu agradeço o sorriso e a alegria sempre que me vê e todo amor que uma pessoinha tão pequena pode proporcionar a essa tia mais que babona. Agradeço a todos da minha família pelo carinho, incentivo e pela união em todos os momentos. Ao Nuno agradeço por todo amor, carinho e apoio que ele me dá, com ele tudo fica mais fácil. Obrigada pela parceria, pela paciência e por todo conforto que tem me dado. Aos meus professores, da graduação e da pós-graduação, agradeço pelos ensinamentos, pela dedicação e por toda ajuda na minha formação. Em especial, agradeço às minhas orientadoras Alexandra e Thais pelo privilégio de poder trabalhar com elas. À Thais, agradeço toda ajuda, incentivo durante o doutorado e pela oportunidade de compartilhar seus conhecimentos comigo. À Alexandra, que foi minha professora desde a graduação, agradeço pelas conversas, ajuda, incentivo e por conviver com uma referência de profissional para mim. Aos meus amigos do DME agradeço pelas experiências e conhecimentos compartilhados. Em especial, agradeço à panela (Camilinha, Lari, Dance e Jonhh) por terem vi

7 me acolhido, por toda ajuda durante essa etapa e pela amizade construída. Agradeço à Patty, Mari, Josi e Jony por todo carinho e ajuda. Aos meus colegas de trabalho na ENCE, agradeço pela convivência alegre de todos os dias, pelas conversas construtivas, pelo incentivo e pelas discussões interessantes sobre o trabalho. Agradeço a todos que foram meus alunos pelas experiências trocadas em sala de aula e pelo aprendizado adquirido com eles. Agradeço a todos os meus amigos pela paciência que tiveram durante esta etapa, por entenderem à minha ausência quando foi necessário. Em especial, agradeço à minha best Luana pelo companheirismo em todos os nossos 18 anos de amizade e pela alegria de me dar mais uma afilhada, a tão aguardada Luísa. À minha amiga Vanessa, agradeço pelo carinho e força de sempre. Ao bonde da estatística, Fabi, Carol e Ju pela amizade verdadeira e por todos os momentos divididos juntas. À Jones pela amizade, por sempre me entender e pela companhia divertida. Agradeço por todo mundo que torceu e acompanhou essa etapa tão importante na minha vida. Obrigada pelo carinho e confiança! Agradeço aos professores Helio Migon, Dani Gamerman, Rosangela Loschi e Reinaldo Arellano-Vale por aceitarem participar desta banca. Finalmente agradeço à CAPES pelo apoio financeiro. vii

8 Resumo Diversos fenômenos referenciados no espaço e no tempo são frequentemente estudados em diferentes áreas da ciência. Com isso, o desenvolvimento de modelos que descrevem os processos espaço-temporais se tornam extremamente relevantes. Tais processos tem como objetivos, entender o comportamento do fenômeno sob estudo e realizar previsões para tempos futuros ou para localizações não observadas. Usualmente, os modelos utilizados para descrever estes processos são baseados em processos Gaussianos. No entanto, distribuições de dados reais apresentam frequentemente desvios nas suposições de normalidade, como a presença de assimetria ou caudas mais pesadas. O objetivo deste trabalho é propor modelos que possam acomodar estes desvios. Duas abordagens são propostas. A primeira utiliza um processo não Gaussiano definido como uma mistura de escala para acomodar caudas mais pesadas. Nesta mistura é usada uma variável latente para modelar a variância do fenômeno de interesse. A ideia é incorporar nesta variável, o uso de covariáveis espacialmente referenciadas tornando o processo mais flexível, em que a curtose varia conforme a localização. Um estudo com dados contaminados e uma aplicação em dados de temperatura máxima em uma região da Espanha são realizados nesta abordagem. A segunda abordagem leva em consideração a assimetria da distribuição dos dados. Baseado em um processo espacial marginal assimétrico, cuja distribuição em cada localização é uma normal assimétrica, é proposto um processo que utiliza ao invés da distribuição half normal, na definição da normal assimétrica, uma distribuição log-normal. Esta proposta define uma nova classe de processos espaciais e espaço-temporais que apresenta maior flexibilidade quanto à assimetria e curtose. São realizados um exercício com dados artificiais e uma aplicação à temperatura máxima mensal na região sul e sudeste do Brasil. O procedimento de inferência é feito sob o enfoque bayesiano. Palavras-Chave: Modelagem espaço-temporal; curtose; assimetria; inferência bayesiana; processos não Gaussianos. viii

9 Abstract Several phenomena referenced in space and time are often studied in different areas of science. Thus, the development of models that describe spatio-temporal processes become extremely relevant. Such processes aims to understand the behavior of phenomenon under study and make predictions for future times or unobserved locations. Usually, the models used to describe these processes are based on Gaussian processes. However, real data distributions often exhibit deviations from the assumptions of normality, as the presence of skewness or heavy tails. The objective of this work is to propose models that can accommodate these deviations. Two approaches are proposed. The first uses a non- Gaussian process defined as a scale mixture to accommodate heavier tails. In this mixture is used a latent variable to model the variance of the phenomenon of interest. The idea is incorporate in this variable, the use of spatial covariates making the process more flexible with the kurtosis varying by location. A study of contaminated data and an application in maximum temperature data in a region of Spain are made in this approach. The second approach takes into account the skewness of data distribution. Based on a skewed marginal spatial process, whose distribution in each location is a skew-normal, a process is proposed which uses log-normal distribution instead of the half-normal distribution, in definition of skew-normal. The proposal defines a new class of spatial and spatiotemporal processes which presents more flexibility to skewness and kurtosis. It is conducted an exercise with artificial data and an application to the monthly maximum temperature in the area south and southeast of Brazil. The inference procedure is done under the Bayesian approach. Keywords: Spatio-temporal modelling; kurtosis; skewness; bayesian inference; non-gaussian processes. ix

10 Sumário 1 Introdução 1 2 Modelagem Espaço-Temporal Modelagem Espacial Geoestatística Processos não Gaussianos Modelagem Temporal Modelos lineares dinâmicos Modelagem Espaço-Temporal Tempo discreto Tempo contínuo Modelagem da curtose em modelos espaço-temporais Motivação Modelo proposto Propriedades do modelo proposto Modelagem da curtose Procedimento de Inferência Critérios de comparação de modelos Estudo com dados contaminados Aplicação a dados reais Conclusões x

11 4 Modelagem da assimetria em processos espaciais Revisão de Literatura Distribuição normal assimétrica Modelo espacial com distribuição marginal normal assimétrica Modelo proposto Caso univariado - Mistura normal-log-normal Caso multivariado - Processo normal-log-normal espacial Procedimento de Inferência Distribuições a priori para os parâmetros do modelo proposto Análise de dados gerados artificialmente Exemplo com réplicas independentes Conclusões Modelagem da assimetria em modelos espaço-temporais Modelo normal-log-normal espaço-temporal Propriedades do modelo normal-log-normal espaço-temporal Procedimento de Inferência Distribuições a priori Previsão Estudo com dados gerados artificialmente Aplicação a dados de temperatura máxima Conclusões Conclusões e Trabalhos Futuros 150 A Modelo espaço-temporal 153 B Modelo espacial assimétrico 162 C Processo espaço-temporal assimétrico 171 xi

12 Lista de Tabelas 3.1 Curtose do processo para diferentes valores de β 0 considerando β 1 = Calibragem do Fator de Bayes na escala logarítmica segundo Kass e Raftery (1995) Valores dos parâmetros fixados para a geração dos dados artificiais Soma das amplitudes dos intervalos de credibilidade a posteriori de 95% da variância condicional do processo Critérios para comparação quanto ao ajuste dos modelos Critérios para comparação dos modelos quanto a previsão Critérios para comparação quanto ao ajuste dos modelos Critérios para comparação dos modelos quanto a previsão Coeficiente de assimetria das distribuições assimétricas Curtose das distribuições assimétricas Valores dos parâmetros fixados para a geração dos dados artificiais Valores dos parâmetros fixados para a geração dos dados artificiais usando o modelo espaço-temporal assimétrico Valores dos parâmetros fixados relacionados a assimetria para a criação de diferentes cenários Sumário a posteriori dos parâmetros para os modelos ajustados Critérios para comparação quanto ao ajuste dos modelos Critérios para comparação quanto à previsão para localização não medidas dos modelos Critérios para comparação quanto à previsão 3 passos a frente dos modelos.149 xii

13 Lista de Figuras 3.1 Diagrama de dispersão para os dados de temperatura máxima em que o tamanho dos círculos é proporcional ao valor da variância amostral em cada localização Diagrama de dispersão entre a altitude e a variância empírica da temperatura máxima em uma região da Espanha em julho de Grade de valores de uma covariável fictícia representada pelos quadrados e os círculos representam as correlações de cada ponto com o ponto representado com asterisco em branco Grade de valores de uma covariável fictícia representada pelos quadrados e os círculos representam as correlações de cada ponto com o ponto representado com asterisco em preto Grade de valores de uma covariável fictícia representada pelas cores e os círculos representam as curtoses em cada localização. β 1 foi considerado positivo (painéis (a) e (b)) e negativo (painéis (c) e (d)) Tabela com medidas-resumo da distribuição a priori para β 0 e o gráfico de sua função de densidade Tabela com os quantis da distribuição a priori para a curtose e o gráfico de seu histograma, quando β 1 = Histogramas da distribuição a priori para a curtose assumindo diferentes distribuições a priori para o parâmetro β 1 e para a covariável x 1 e β 0 NT (0, 3) Distribuições a priori marginal para β 1 e para a curtose considerando diferentes valores para l kurt. Na segunda coluna os painéis enfatizam as caudas das respectivas distribuições. 39 xiii

14 3.10 Gráfico de dispersão no espaço dos pontos usados para a geração das observações. Os círculos cheios representam os pontos usados para o ajuste do modelo. Os quadrados representam os pontos usados para a realização da previsão. O ponto destacado com asterisco é o ponto referência para a contaminação dos dados. Os números representam uma identificação de cada localização Gráfico de dispersão no espaço dos pontos de cada localização em que o tamanho do círculo é inversamente proporcional a distância com o ponto de referência (em asterisco) Gráficos do intervalo de credibilidade (95%) e da mediana a posteriori das funções de correlação (onde t = 1) dos quatro modelos e do processo gerador dos dados, antes da contaminação. A linha pontilhada é a função de correlação verdadeira Gráficos das densidades a priori e a posteriori referentes aos parâmetros β 0 e β 1 dos modelos PNG.X (I) e PNG.X (D) Gráficos dos intervalos de credibilidade a posteriori de 95%, em que os círculos representam a mediana a posteriori da variância condicional do processo Gráfico dos intervalos de credibilidade a posteriori de 95%, em que os círculos representam a mediana a posteriori da curtose dos modelos PNG.X (I) e modelo PNG.X (D) [Painéis à esquerda]. O primeiro intervalo representa o do modelo PNG. Nos painéis à direita estão os gráficos das medianas a posteriori da curtose distribuídas ao longo da região geográfica Gráfico dos intervalos de credibilidade de 95% para as previsões dos locais 1 e 2 em todos os trinta instantes de tempo. Os valores verdadeiros estão simbolizados através dos asteriscos Gráfico dos intervalos de credibilidade de 95% para as previsões dos locais 3 e 4 em todos os trinta instantes de tempo. Os valores verdadeiros estão simbolizados através dos asteriscos Gráfico dos intervalos de credibilidade de 95% para as previsões dos locais 5 e 6 em todos os trinta instantes de tempo. Os valores verdadeiros estão simbolizados através dos asteriscos Critério de comparação de modelos quanto a previsão (CRPS) referentes aos locais de 1 a 6 para cada tempo xiv

15 3.20 Localizações das estações monitoradoras de temperatura. Os círculos cheios representam as localizações usadas para previsão Sumários dos dados referentes a temperatura máxima do País Basco no período de julho de (a) Variância empírica distribuída no espaço (tamanho do círculo proporcional à variância) e (b) altitude padronizada interpolada no espaço Gráficos das densidades a priori e a posteriori do parâmetro σ 2 sob os quatro modelos ajustados Gráficos das densidades a priori e a posteriori dos parâmetros δ 0, δ 1, δ 2, δ 3, δ 4 e δ 5 para os quatro modelos ajustados Gráficos das densidades a priori e a posteriori dos parâmetros a 1, a 2, α 1 e α 2 para os quatro modelos ajustados Gráficos das densidades a priori e a posteriori referentes aos parâmetros β 0 e β 1 dos modelos PNG.X Gráficos dos intervalos de credibilidade a posteriori de 95% para a variância condicional dos modelos PNG, PNG.X (I) e PNG.X (D). Os círculos representam a mediana a posteriori Gráfico do intervalo de credibilidade a posteriori de 95%, em que os círculos representam a mediana a posteriori da curtose dos modelos PNG.X (I) e PNG.X (D). O primeiro intervalo representa o do modelo PNG Mapa das medianas a posteriori da curtose interpolada dos modelos PNG.X (I) e PNG.X (D) Gráfico dos intervalos de credibilidade de 95% para as previsões dos locais 1 e 2 em todos os 31 tempos. Os valores verdadeiros estão simbolizados através dos asteriscos Gráfico dos intervalos de credibilidade de 95% para a previsão do local 3 em todos os 31 tempos. Os valores verdadeiros estão simbolizados através dos asteriscos Critério de comparação de modelos quanto a previsão (CRPS) referentes ao local 1, 2 e 3 para cada instante de tempo xv

16 4.1 Gráficos das funções de densidade de probabilidade das variáveis que seguem uma distribuição normal assimétrica e normal-log-normal, variando o parâmetro de forma. A distribuição normal serviu como base de comparação. Os parâmetros de posição e escala foram fixados em µ = 0 e σ = Histogramas da distribuição a priori para o parâmetro τ, em que σ2 2 GI(2; 0, 8) e σ 1 N(0, C σ1 ). Foram considerados diferentes valores para C σ Gráfico das localizações no espaço dos dados gerados artificialmente Gráficos dos traços das cadeias e das densidades a priori e a posteriori dos parâmetros β 0 e β Gráficos dos traços das cadeias e das densidades a priori e a posteriori dos parâmetros σ 1 e σ Gráficos dos traços das cadeias e das densidades a priori e a posteriori dos parâmetros a 1 e a Gráficos dos traços das cadeias a posteriori dos parâmetros β 0, β 1 eσ 1 com 1 réplica e 30 réplicas Gráficos dos traços das cadeias a posteriori dos parâmetros σ2, 2 a 1 e a 2 com 1 réplica e 30 réplicas Gráficos dos comportamentos do coeficiente de assimetria do modelo normal-log-normal espaço-temporal para diferentes valores dos parâmetros σ 1, σ0 2 e σ Gráficos dos comportamentos da curtose do modelo normal-log-normal espaço-temporal para diferentes valores dos parâmetros σ 1, σ0 2 e σ Gráfico das localizações no espaço dos dados gerados artificialmente Gráficos dos intervalos de credibilidade a posteriori HPD de 95% a posteriori e a priori do parâmetro a 1 para os dois modelos ajustados, o modelo que estima os W s (M.W) e o que usa fator de desconto (M.FD). Os intervalos são para diferentes cenários. A linha horizontal tracejada representa o valor verdadeiro do parâmetro xvi

17 5.5 Gráficos dos intervalos de credibilidade a posteriori HPD de 95% a posteriori do parâmetro a 2 para os dois modelos ajustados, M.W e M.FD, e para os quatro cenários criados. A linha horizontal tracejada representa o valor verdadeiro do parâmetro Gráficos dos intervalos de credibilidade a posteriori HPD de 95% a posteriori dos parâmetros σ0 2 e σ2 2 para os quatro cenários nos dois modelos ajustados, M.W e M.FD. A linha horizontal tracejada representa o valor verdadeiro do parâmetro Gráficos dos intervalos de credibilidade a posteriori HPD de 95% a posteriori dos parâmetros W 1 e W 2 nos quatro cenários para o modelo ajustado M.W. A linha horizontal tracejada representa o valor verdadeiro do parâmetro Gráficos dos intervalos de credibilidade a posteriori HPD de 95% dos parâmetros µ σ1 e C σ1 para os diferentes cenários e para os dois modelos ajustados, M.W e M FD. O asterisco representa o valor verdadeiro do parâmetro Gráficos dos intervalos de credibilidade a posteriori de 95% e a mediana a posteriori da evolução no tempo dos estados do modelo para os diferentes cenários de assimetria e para os dois modelos ajustados Gráficos dos intervalos de credibilidade a posteriori de 95% do parâmetro σ 1 que está relacionado com a assimetria para os cenários 1 e 2. Os intervalos são referentes ao ajuste do modelo M.W e os asteriscos representam os valores verdadeiros Gráficos dos intervalos de credibilidade a posteriori de 95% do parâmetro σ 1 que está relacionado com a assimetria para os cenários 3 e 4. Os intervalos são referentes ao ajuste do modelo M.W. Os asteriscos representam os valores verdadeiros no painel (a) e no painel (b) o valor verdadeiro é representado pela linha horizontal tracejada Gráficos dos intervalos a posteriori preditivos de 95% de credibilidade para 6 localizações ao longo dos 60 instantes de tempo para o cenário 1. Intervalos referentes ao modelo M.W Gráficos dos intervalos a posteriori preditivos de 95% de credibilidade para 2 localizações ao longo dos 60 instantes de tempo para os cenários 2, 3 e 4. Intervalos referentes ao modelo M.W Gráfico dos intervalos de previsão de 95% de credibilidade para 5 instantes futuros dos modelos M.W e M.FD para os quatro diferentes cenários xvii

18 5.15 Gráficos das interpolações espaciais do modelo M.W para o instante de tempo 60 no cenário 1. O painel (a) e (b) representam, respectivamente, a média e o desvio padrão da distribuição preditiva a posteriori Gráficos das interpolações espaciais do modelo M.W para o instante de tempo 60 no cenário 2. O painel (a) e (b) representam, respectivamente, a média e o desvio padrão da distribuição preditiva a posteriori Gráficos das interpolações espaciais do modelo M.W para o instante de tempo 60 no cenário 3. O painel (a) e (b) representam, respectivamente, a média e o desvio padrão da distribuição preditiva a posteriori Gráficos das interpolações espaciais do modelo M.W para o instante de tempo 60 no cenário 4. O painel (a) e (b) representam, respectivamente, a média e o desvio padrão da distribuição preditiva a posteriori Mapa da região em estudo onde os círculos cheios são as estações monitoradoras usadas no ajuste do modelo e os asteriscos são as estações que foram retiradas para a previsão Gráfico das séries temporais da temperatura máxima mensal em cada estação monitoradora Box-plot da temperatura máxima mensal para cada instante de tempo usado na análise Box-plot da temperatura máxima mensal para cada estação monitoradora Gráfico das séries temporais da umidade média mensal em cada estação monitoradora Gráficos dos intervalos de credibilidade a posteriori de 95% dos valores ajustados pelo modelo NLN em 4 estações monitoradoras em que o círculo cheio representa o valor verdadeiro e a linha cheia a mediana a posteriori Gráficos das distribuições a priori e a posteriori dos parâmetros µ σ1 e C σ1 referente ao modelo NLN Gráficos dos intervalos de credibilidade a posteriori de 95% do parâmetro σ 1 do modelo NLN. A linha tracejada no zero representa uma referência de presença de simetria nos dados Gráficos dos intervalos de credibilidade a posteriori de 95% para os estados do modelo NLN. A linha tracejada representa a mediana a posteriori xviii

19 5.28 Gráfico dos intervalos a posteriori de 95% de credibilidade da distribuição preditiva para 2 estações não medidas referentes aos três modelos ajustados Gráficos do intervalos de credibilidade a posteriori de 95% da distribuição preditiva para 3 meses a frente em 6 estações. Os resultados são referentes aos três modelos ajustados A.1 Gráficos das cadeias a posteriori dos parâmetros do modelo PNG.X (I) e das variâncias de três localizações. Em parênteses são apresentados os valores da estatística ˆR A.2 Gráficos das cadeias a posteriori dos parâmetros do modelo PNG.X (I) e das variâncias de três localizações C.1 Gráficos das cadeias a posteriori dos parâmetros do modelo normal-log-normal no cenário 1. Em parênteses são apresentados os valores da estatística ˆR C.2 Gráficos das cadeias a posteriori dos parâmetros de forma de 9 localizações do modelo normal-log-normal no cenário 1. Em parênteses são apresentados os valores da estatística ˆR C.3 Gráficos das cadeias a posteriori dos parâmetros do modelo normal-log-normal no cenário 2. Em parênteses são apresentados os valores da estatística ˆR C.4 Gráficos das cadeias a posteriori dos parâmetros de forma de 9 localizações do modelo normal-log-normal no cenário 2. Em parênteses são apresentados os valores da estatística ˆR C.5 Gráficos das cadeias a posteriori dos parâmetros do modelo normal-log-normal no cenário 3. Em parênteses são apresentados os valores da estatística ˆR C.6 Gráficos das cadeias a posteriori dos parâmetros de forma de 9 localizações do modelo normal-log-normal no cenário 3. Em parênteses são apresentados os valores da estatística ˆR C.7 Gráficos das cadeias a posteriori dos parâmetros do modelo normal-log-normal no cenário 4. Em parênteses são apresentados os valores da estatística ˆR C.8 Gráficos das cadeias a posteriori dos parâmetros do modelo normal-log-normal para a aplicação aos dados reais xix

20 Capítulo 1 Introdução O foco deste trabalho está na modelagem de dados referenciados no espaço e no tempo. Em particular, assume-se que a estrutura espacial das observações segue a estrutura da geoestatística. A geoestatística é uma subárea da estatística espacial, onde as observações são consideradas uma realização parcial de um processo estocástico indexado pela localização que varia continuamente no espaço. Este processo é chamado de processo espacial. É natural pensar em uma extensão deste processo para o tempo, em que são analisados distintos instantes de tempo em um dado intervalo. A variação do tempo neste processo pode acontecer tanto de forma contínua quanto discreta. Tais processos são chamados processos espaço-temporais. O desenvolvimento de métodos para a análise de processos espaço-temporais vem aumentando consideravelmente devido aos avanços computacionais. Os modelos que descrevem estes processos incorporam as dependências espaciais e temporais entre as observações com o objetivo de entender o comportamento do processo sob estudo e realizar previsões para tempos futuros ou para localizações não observadas. Existem inúmeras aplicações práticas destes processos. Por exemplo, é interesse entender o comportamento de fenômenos climáticos, bem como prever a ocorrência dos mesmos. Com isto, torna-se fundamental entender a dinâmica espacial e temporal de tais fenômenos. O mesmo ocorre em estudos do efeito da poluição atmosférica, estudos ambientais, entre outros. Usualmente, os modelos utilizados para descrever processos espaço-temporais são ba- 1

21 seados em processos Gaussianos que apresentam a vantagem de estarem completamente especificados se a função de média e a função de covariância forem especificadas. No entanto, distribuições de dados reais apresentam frequentemente desvios nas suposições de normalidade. Tais desvios podem ser a presença de caudas mais pesadas ou um comportamento assimétrico. Sob essa perspectiva, o objetivo principal deste trabalho é propor modelos que possam acomodar estes desvios que as distribuições dos dados possam apresentar. Duas abordagens são propostas, uma para acomodar distribuições de dados com caudas mais pesadas e a outra para acomodar distribuições de dados com assimetria e com caudas mais pesadas ambas no contexto dos processos espaço-temporais. A primeira abordagem que é usada para acomodar caudas mais pesadas inspira-se na ideia apresentada por Palacios e Steel (2006) e estendida por Fonseca e Steel (2011) em que é definido um processo não Gaussiano como uma mistura de escala. Nesta mistura é usada uma variável latente que modela a variância do processo de interesse. Tal variável permite que exista uma heterocedasticidade espacial e que o processo tenha uma cauda mais pesada que a do processo Gaussiano. Podendo assim, acomodar possíveis valores discrepantes. A ideia a ser desenvolvida aqui é incorporar, na variável latente que modela a variância do processo, possíveis covariáveis espacialmente referenciadas. Espera-se que o uso destas covariáveis ajude a trazer informação sobre a variância do processo e sobre o comportamento dos dados em estudo. A abordagem proposta permite que a curtose do processo, medida responsável pela cauda da distribuição resultante, possa variar conforme a localização. Este fato faz com que o modelo seja mais flexível, podendo assumir distribuições com diferentes comportamentos em cada localização. Acredita-se que com o uso destas covariáveis a previsão para localizações não medidas possa ser melhorada, no sentido em que a incerteza associada a previsão seja menor. Neste contexto, o processo espaçotemporal que é proposto considera o tempo contínuo assim como é feito em Fonseca e Steel (2011). Um estudo com dados contaminados é feito com a finalidade de avaliar o comportamento do modelo proposto em relação à ajuste e a previsão. Tal estudo é relevante para 2

22 avaliar se o modelo proposto consegue recuperar o comportamento dos dados e realizar previsões que incorporem o efeito da contaminação. Para realizar a contaminação do dados, a ideia usada é supor um ponto como fonte de contaminação, por exemplo uma fonte de poluição do ar, e a contaminação é feita considerando uma função da distância entre cada ponto da amostra para a fonte contaminadora. De forma que quanto menor é a distância, maior é a contaminação. O exercício é feito ajustando o modelo que é proposto neste trabalho e modelos que são casos particulares dele. Para o modelo proposto, a covariável usada para modelar a variância do processo é a distância euclidiana entre cada localização e a fonte de contaminação. Uma aplicação do modelo é feita em dados referentes a temperatura máxima diária observada em 70 localizações do País Basco, Espanha no período do mês de julho do ano de Nesta aplicação também são ajustados casos particulares do modelo proposto e é feita uma comparação entre estes modelos considerando o ajuste e a previsão. A segunda abordagem proposta neste trabalho leva, principalmente, em consideração a assimetria da distribuição dos dados em processos espaciais e espaço-temporais. Zhang e El-Shaarawi (2010) definem um processo espacial marginal assimétrico cuja distribuição marginal para cada localização segue uma distribuição normal assimétrica definida por Azzalini (1985). Henze (1986) mostrou que a distribuição normal assimétrica pode ser escrita em função da soma de duas variáveis aleatórias, em que uma variável segue uma distribuição normal e a outra uma distribuição normal truncada. A proposta deste trabalho consiste em substituir a distribuição normal truncada para uma das componentes da soma, descrita por Henze (1986), por uma distribuição Lognormal. Esta proposta define uma nova classe de processos espaciais e espaço-temporais assimétricos, em que os processos apresentam maior flexibilidade quanto ao comportamento da assimetria e, consequentemente, quanto ao comportamento da curtose. No contexto dos processos espaciais, é definido um parâmetro responsável pela forma da distribuição marginal em cada localização. Este parâmetro influencia tanto a assimetria quanto a curtose do processo e é fixo ao longo do espaço. A ideia é estendida para a classe de modelos espaço-temporais incorporando o tempo como discreto. Sendo assim, considera-se que as observações são dadas por intervalos regulares ao longo do tempo. 3

23 A modelagem do tempo é feita usando a ideia da classe dos modelo dinâmicos proposta por Harrison e Stevens (1976) e muito discutida em West e Harrison (1997). Com o uso dos modelos dinâmicos, estruturas como sazonalidade, tendência e nível podem ser incorporadas na modelagem. No processo espaço-temporal, permite-se que o parâmetro responsável pela forma da distribuição varie ao longo do espaço, podendo assumir diferentes comportamentos assimétricos e de caudas pesadas em cada localização. Um exercício com dados gerados artificialmente é realizado considerando 4 diferentes cenários de comportamento em relação à assimetria do processo. O intuito do exercício é avaliar tanto o ajuste quanto a previsão que é realizada pelo modelo proposto. São discutidas previsões com relação a tempo futuro e interpolações espaciais. O modelo proposto também é aplicado a um conjunto de dados reais referente a temperatura máxima mensal na região sul e sudeste do Brasil. São usadas 58 localizações ao longo de 5 anos, no período de março de 2007 a abril de Para efeitos de comparação, ajusta-se também um modelo Gaussiano, para os dados na escala original e uma transformação dos dados. As abordagens são comparadas em relação ao ajuste e a previsão. O procedimento de inferência em ambos os modelos é feito sob o enfoque bayesiano. É desenvolvido e implementado um algoritmo de simulação de Monte Carlo via cadeias de Markov para obter amostras da distribuição a posteriori dos parâmetros e da distribuição preditiva. Em ambas abordagens é explorada a estrutura Gaussiana do processo condicional às variáveis latentes para a aproximação da distribuição preditiva. A tese está dividida da seguinte maneira. No Capítulo 2 é feita uma revisão dos conceitos da modelagem de processos espaciais, em particular, a área da geoestatística. Também é feita uma revisão sobre os processos temporais em que discute-se o modelo linear dinâmico e suas principais características. A seguir, são introduzidos os principais conceitos sobre a modelagem dos processos espaço-temporais onde são revisadas duas abordagens em que uma considera o tempo como discreto e a outra como contínuo. No Capítulo 3 é proposto o modelo para acomodar as caudas mais pesadas em processos espaço-temporais. Neste capítulo, a formulação do modelo proposto é descrita em conjunto com suas propriedades. É detalhado o procedimento de inferência bem como os critérios de comparação de modelos usados neste trabalho. Um estudo com dados conta- 4

24 minados é realizado a fim de verificar o comportamento do modelo proposto e também é feita uma aplicação do modelo aos dados de temperatura em uma região da Espanha. No final do capítulo são discutidas as principais conclusões desta proposta. O Capítulo 4 propõe um modelo para processos espaciais que possuem comportamento assimétrico. É feita uma revisão de literatura da modelagem assimétrica no contexto da geoestatística. Em seguida, descreve-se a formulação do modelo proposto e o procedimento de inferência. Um estudo com dados gerados artificialmente é realizado para verificar o ajuste do modelo, sendo feito o mesmo exercício com réplicas independentes. São apontadas, no fim do capítulo, as principais conclusões. No Capítulo 5 é feita uma extensão do processo assimétrico, apresentado anteriormente, para o contexto espaço-temporal. São discutidas as propriedades deste modelo, o procedimento de inferência e as diferentes abordagens para realizar previsões no modelo proposto. Um exercício com dados gerados artificialmente em diferentes cenários de assimetria é realizado, bem como um ajuste do modelo a um conjunto de dados referente a temperatura máxima mensal nas regiões sul e sudeste do Brasil. Por fim, no Capítulo 6 é realizada uma conclusão geral sobre a tese e são discutidos possíveis trabalhos futuros. 5

25 Capítulo 2 Modelagem Espaço-Temporal Diversas áreas da ciência apresentam fenômenos que são indexados no espaço e no tempo e tais índices podem ser de extrema importância para a análise destes dados. Com isso, surge a necessidade de entender e modelar estes fenômenos incorporando a informação da localização e do tempo em sua análise. Por exemplo, em estudos de poluição do ar, há interesse não só na natureza espacial da superfície do poluente, mas também no comportamento desta superfície ao longo do tempo. É usual que medições de variáveis de interesse sejam coletadas em diferente locais de monitoramento ao longo de diversos instantes de tempo. A modelagem espaço-temporal tem o intuito de modelar fenômenos em que tanto o espaço, quanto o tempo são informações essenciais para o entendimento dos dados. Neste capítulo é feita uma revisão de conceitos da modelagem espaço-temporal. Na primeira seção é discutida a modelagem de processos espaciais, em particular, na área da geoestatística que trata de processos que variam continuamente no espaço. O processo Gaussiano é apresentado nesta seção e uma alternativa mais flexível a este processo também é apresentada, que são os processos não Gaussianos. Na segunda seção discutese a modelagem de processos temporais onde é definido o modelo linear dinâmico e suas principais características. Na terceira seção é apresentada possíveis generalizações dos processos discutidos nas seções anteriores para o caso de um processo espaço-temporal. São discutidas duas abordagens em que uma considera o tempo como discreto e a outra como contínuo. 6

26 2.1 Modelagem Espacial Fênomenos em que a localização geográfica influi no seu comportamento são bastante frequentes em diversas áreas de estudo como epidemiologia, demografia, meteorologia e estudos de violência, entre outros. Questões como: a distribuição dos casos de doença formam algum padrão no espaço? Como prever a precipitação de chuva numa dada localização? São recorrentes e de grande interesse para uma população. A estatística espacial é o conjunto de métodos de análise de fenômenos em que a localização geográfica é usada explicitamente na análise. A incorporação da localização na modelagem tem como objetivo descrever ou explicar o comportamento destes fenômenos de forma mais realista. Os dados portanto, representam uma amostra do processo de interesse, a partir dos quais se busca fazer inferência sobre o comportamento do processo. Segundo Cressie (1993) e Banerjee et al. (2004), os conjuntos de dados espaciais podem ser classificados em três grupos: Padrões de pontos: Os pontos localizados no espaço em geral não estão associados a valores, mas apenas à ocorrência dos eventos considerados. Exemplos: localização de crimes, ocorrências de doença. Neste tipo de dado, a posição dos pontos é dita aleatória e um dos principais interesses é determinar se os pontos observados exibem algum padrão sistemático. Busca-se detectar a existência de padrão de conglomerados espaciais. Dados de área: Neste caso, a localização dos dados está associada a áreas delimitadas decorrentes de uma partição do espaço. Isto ocorre com muita frequência quando são analisados eventos agregados por municípios, bairros ou setores censitários, onde não se dispõe da localização exata dos eventos, mas de um valor por área. Exemplo: número de óbitos por município. Geoestatística: Supõe que existe uma superfície contínua subjacente ao processo de interesse. Dados são observados nesta superfície em um número finito de localizações. Exemplos: medidas de chuva ou temperatura em postos meteorológicos, concentração de poluentes observada em estações de monitoramento. 7

27 Este trabalho irá considerar a modelagem de dados de geoestatística. A seguir, serão discutidos mais detalhes desta área da estatística espacial. Características e propriedades da modelagem na geoestatística serão apresentadas. Para maiores informações e detalhes veja Cressie (1993) e Banerjee et al. (2004) Geoestatística A Geoestatística é uma área da estatística espacial em que os dados são constituídos de um número finito de medições relacionadas a um fenômeno subjacente espacialmente contínuo. Por exemplo, considere um conjunto de medidas de um determinado poluente coletadas em uma hora em estações meteorológicas de uma certa cidade. O fenômeno subjacente é dado pelo conjunto de medidas do poluente em toda a área da cidade. Considera-se que o fênomeno subjacente é uma realização de um processo estocástico no espaço e a amostra é formada por medições feitas em alguns pontos da superfície. Na geoestatística, o processo estocástico no espaço é definido por {Z(s) : s D} em que D é um subconjunto do R p com volume p-dimensional positivo (Cressie, 1993), ou seja, s varia continuamente ao longo da região D e representa as localizações espaciais. Especificada a região D, o processo será denotado somente por Z( ). Na prática, o que se observa é uma realização parcial deste processo. Um dos objetivos da análise de dados espaciais é a identificação das variações de primeira ordem ou de grande escala, e as variações de segunda ordem ou pequena escala. A variação de primeira ordem é definida pela média do processo espacial, E[Z(s)], também chamada de tendência do processo. A variação de segunda ordem é representada pelas dependências entre as diferentes localizações, isto é, Cov[Z(s 1 ), Z(s 2 )] para s 1, s 2 D. Conceitos como estacionariedade e isotropia estão diretamente ligados a especificação destas variações. Assuma que a média, E[Z(s)], e a variância, V ar[z(s)] = Cov[Z(s), Z(s)], do processo existam para todo s. Existem três diferentes tipos de estacionariedade, que são definidas a seguir. Definição 1 (Processo estritamente estacionário): Um processo Z(s) é estritamente es- 8

28 tacionário se para todo n {1, 2,... }, todo conjunto finito de pontos {s 1, s 2,..., s n } D e qualquer h R p, a distribuição de (Z(s 1 ),..., Z(s n )) é a mesma de (Z(s 1 + h),..., Z(s n + h)). A estacionariedade estrita significa que as respectivas distribuições finito dimensionais são invariantes à translação. Definição 2 (Processo estacionário de segunda ordem (ou fracamente estaciónário): Um processo Z(s) é estacionário de segunda ordem se E[Z(s)] = µ, ou seja, a média é constante, e Cov[Z(s), Z(s + h)] = C(h) para todo h R p e s, s + h D. A função de covariância, C( ), só depende do vetor de separação h. Esta função também é chamada de covariograma. Estacionariedade estrita implica em estacionariedade de segunda ordem, mas a recíproca não é necessariamente verdadeira. Definição 3 (Processo intrinsecamente estacionário): Um processo Z(s) é intrinsecamente estacionário se E[Z(s + h) Z(s)] = 0 e V ar[z(s + h) Z(s)] = 2γ(h), para todo s, s + h D. A quantidade 2γ(h) é conhecida como variograma e possui um papel importante na geoestatística pois descreve a estrutura de covariância, ou seja, a dependência espacial. A quantidade γ(h) é conhecida como semivariograma. Algumas propriedades do semivariograma são: γ( h) = γ(h); γ(0) = 0; Se lim h 0 γ(h) = c 0 0, então c 0 é chamado de efeito pepita. O efeito pepita representa uma variação de microescala ou erro de medida. O variograma de um processo intrinsecamente estacionário pode ser escrito como: 2γ(h) = 2C(0) 2C(h). Se C(h) 0 quando h, então 2γ(h) 2C(0) em que C(0) é conhecido como patamar do variograma. Existe também, outro parâmetro de dependência espacial 9

29 conhecido como alcance. Ele representa a distância a partir da qual a correlação espacial é próxima de zero. Além da estacionariedade, uma importante propriedade dos processos espaciais é a isotropia. Um processo estacionário é isotrópico se Cov[Z(s), Z(s + h)] = C( h ), isto é, a covariância depende apenas da distância entre as localizações onde h representa a distância euclidiana entre os vetores s e s + h. Com isso, a função de covariância é invariante à rotações. Caso contrário, o processo é chamado de anisotrópico. Processos intrinsecamente estacionários e isotrópicos são chamados de homogêneos (Smith, 1996). Se uma dessas condições não se aplica, o processo é heterogêneo. Através da função de covariância pode ser definida a função de correlação, ou correlograma, do processo espacial. Se C(0) > 0, então a função de correlação é definida por: ρ(h) = C(h) C(0) ordem. e C(0) = V ar[z(s)] se Z(s) é um processo estacionário de segunda Quando um processo é homogêneo, sua variância é constante ao longo de D, isto é V ar[z(s)] = σ 2 para todo s D. Portanto, a função de covariância de Z(s) pode ser escrita como Cov[Z(s 1 ), Z(s 2 )] = C(s 1, s 2 ) = σ 2 ρ( s 1 s 2 ; θ), s 1, s 2 D, onde ρ( ; θ) é uma função de correlação positiva definida e depende de um vetor paramétrico θ. Seja s 1 s 2 a distância euclidiana entre s 1 e s 2. Este é um dos grandes atrativos para os processos homogêneos, pois dada a função ρ( ; θ), a estrutura de covariância do processo pode ser modelada apenas através dos parâmetros σ 2 e θ. Em geral, na modelagem de dados geoestatísticos, assume-se que o processo espacial de interesse Z( ) segue um Processo Gaussiano, que é definido a seguir. Definição 4 (Processo Gaussiano): Um vetor aleatório Z( ) segue um Processo Gaussiano (PG) com média µ( ) e função de covariância C(, ) denotado por Z P G(µ, C), se para qualquer conjunto finito de pontos {s 1,..., s n } D, e qualquer n = 1, 2,..., a distribuição conjunta de (Z(s 1 ),..., Z(s n )) é uma distribuição normal multivariada com parâmetros dados por E[Z(s i )] = µ(s i ) e Cov[Z(s i ), Z(s j )] = C(s i, s j ). 10

30 Em outras palavras, um processo é Gaussiano se qualquer distribuição finito dimensional for normal multivariada. Como a distribuição normal multivariada é completamente determinada por seu vetor de média e por sua matriz de covariância, tudo o que é necessário saber para especificar completamente um Processo Gaussiano é sua média e sua função de covariância. A especificação da função de covariância é de extrema importância pois, em processos Gaussianos, sua suavidade está diretamente relacionada à diferenciabilidade da sua estrutura de covariância. Algumas das principais classes de funções de covariância usadas na literatura são: 1 - Família exponencial potência: A função de covariância é dada por { ( ) κ } h C(h) = σ 2 exp, a em que h é a distância euclidiana entre dois pontos quaisquer em D. σ 2 > 0 é a variância do processo, a > 0 é o parâmetro de escala e κ (0, 2]. Quando κ = 1 obtem-se o caso particular da função de covariância exponencial e κ = 2 corresponde à função exponencial potência quadrática. Esta família de funções tem uma expressão paramétrica simples e é fácil de ser interpretada. No entanto, note que quando h a covariância nunca alcança zero. Portanto, o alcance não pode ser obtido exatamente. Nesta situação, a ideia do alcance efetivo é usada, isto é, o alcance é definido pelo h no qual a correlação é aproximadamente 0,05. No caso da função de correlação exponencial h 3a é o alcance efetivo. Esta classe é frequentemente usada em aplicações, embora sua forma simples implique em propriedades teóricas muito restritivas, que não são realistas na prática. Na classe de funções exponencial potência quadrática, a função de covariância é infinitamente diferenciável tornando os processos muito suaves, que pode ser uma hipótese pouco realista para problemas ambientais. 2 - Família Matérn: A função de covariância é dada por C(h) = σ κ 1 Γ(κ) ( h λ 11 ) κ ( ) h K κ, λ

31 em que h é a distância euclidiana, σ 2 > 0 é a variância do processo, λ > 0 é o parâmetro de escala, que indica o quão rápido a correlação decai com h, κ > 0 é o parâmetro de forma, controla a suavidade do processo espacial. Quanto maior o valor de κ mais suave será o processo. A função Γ( ) é a função gama e K κ ( ) é a função modificada de Bessel do terceiro tipo de ordem κ. Esta classe é interessante por abranger diferentes comportamentos do processo e pela interpretação dos parâmetros. A função de correlação exponencial é obtida quando κ = 1/2. E quando κ obtém-se a função de correlação exponencial potência quadrática. O uso desta classe é de especial interesse nos casos em que o pesquisador acredita que os dados poderão informar sobre o parâmetro κ, pois assim não será necessário fixar a suavidade antes de observar os dados. 3 - Família Cauchy A função de covariância é dada por C(h) = σ 2 {1 + ( ) κ } α/κ h λ em que h é a distância euclidiana, σ 2 > 0 é a variância do processo, λ > 0 é o parâmetro de escala, responsável pelo decaimento da função, α > 0 é o parâmetro responsável pela dependência de longo alcance, κ (0, 2] é o parâmetro de forma. Esta classe é bastante flexível, pois permite a modelagem de dependência de longo alcance e também correlações com defasagens curtas e intermediárias. Se α (0, 1), então o processo é dito ter memória longa. Mais informações sobre esta classe pode ser vista em Gneiting (2000) e Gneiting e Schlather (2004). Na geoestatística, os dados observados são considerados uma realização parcial de um processo estocástico que varia continuamente no espaço. Usualmente, assume-se que este processo é um processo Gaussiano e esta suposição facilita a previsão de dados para localizações não medidas devido as propriedades de partição da distribuição normal multivariada. No entanto, frequentemente distribuições de dados reais apresentam desvios quanto a suposição de normalidade tais como caudas mais pesadas ou comportamento assimétrico. Neste cenário, processos Gaussianos podem não ser apropriados para explicar o comportamento do processo de interesse. 12

Tópicos de Estatística Espacial Geoestatística

Tópicos de Estatística Espacial Geoestatística Tópicos de Estatística Espacial Geoestatística Anderson Castro Soares de Oliveira Geoestatística A geoestatística é uma análise espacial que considera que a variável em estudo se distribui continuamente

Leia mais

Análise e Previsão de Séries Temporais Aula 1: Introdução às séries temporais. Eraylson Galdino

Análise e Previsão de Séries Temporais Aula 1: Introdução às séries temporais. Eraylson Galdino Análise e Previsão de Séries Temporais Aula 1: Introdução às séries temporais egs@cin.ufpe.br Agenda Séries Temporais: Definições Exemplos Modelos simples com média zero: Ruído I.I.D Processo Binário Random

Leia mais

Métodos Quantitativos para Avaliação de Políticas Públicas

Métodos Quantitativos para Avaliação de Políticas Públicas ACH3657 Métodos Quantitativos para Avaliação de Políticas Públicas Aula 11 Análise de Resíduos Alexandre Ribeiro Leichsenring alexandre.leichsenring@usp.br Alexandre Leichsenring ACH3657 Aula 11 1 / 26

Leia mais

INTRODUÇÃO À ESTATÍSTICA ESPACIAL. Prof. Anderson Rodrigo da Silva

INTRODUÇÃO À ESTATÍSTICA ESPACIAL. Prof. Anderson Rodrigo da Silva INTRODUÇÃO À ESTATÍSTICA ESPACIAL Prof. Anderson Rodrigo da Silva anderson.silva@ifgoiano.edu.br Métodos Índices de agregação Métodos de quantificação da dependência especial Correlograma Variograma Métodos

Leia mais

Alguns Aspectos Espaciais da Modelagem de Observações Provenientes das Áreas de SaúdeedoMeioAmbiente

Alguns Aspectos Espaciais da Modelagem de Observações Provenientes das Áreas de SaúdeedoMeioAmbiente Alguns Aspectos Espaciais da Modelagem de Observações Provenientes das Áreas de SaúdeedoMeioAmbiente Alexandra Mello Schmidt DME - IM - UFRJ Homepage: www.dme.ufrj.br/ alex Seminário Qualidade do Ar e

Leia mais

Introdução Variograma Modelos básicos de correlação espacial Modelação Interpolação espacial & Simulação. Geoestatística.

Introdução Variograma Modelos básicos de correlação espacial Modelação Interpolação espacial & Simulação. Geoestatística. Geoestatística Susana Barbosa Mestrado em Ciências Geofísicas 2012-2013 Geoestatística conjunto de técnicas matemáticas e numéricas para caracterizar fenómenos espaciais contínuos tendo em conta a correlação

Leia mais

Redução de Dimensão para Modelos Espaciais não Gaussianos

Redução de Dimensão para Modelos Espaciais não Gaussianos Redução de Dimensão para Modelos Espaciais não Gaussianos por Mariana del Pilar Lizarazo Osorio Universidade Federal do Rio de Janeiro Instituto de Matemática Departamento de Métodos Estatísticos 2013

Leia mais

Análise de Sensibilidade em Modelo Gaussiano Assimétrico Espacialmente Referenciado

Análise de Sensibilidade em Modelo Gaussiano Assimétrico Espacialmente Referenciado UNIVERSIDADE FEDERAL DO RIO DE JANEIRO INSTITUTO DE MATEMÁTICA RAQUEL VAZ GUEDES PEREIRA Análise de Sensibilidade em Modelo Gaussiano Assimétrico Espacialmente Referenciado Prof a. Alexandra Mello Schmidt,

Leia mais

Inferência Bayesiana Exata para Processos de Cox Level-Set

Inferência Bayesiana Exata para Processos de Cox Level-Set Inferência Bayesiana Exata para Processos de Cox Level-Set Bárbara da Costa Campos Dias 1 Flávio Bambirra Gonçalves 2 Resumo Este trabalho propõe uma metodologia de inferência exata para processos de Cox

Leia mais

MAE 5882 aula 02. O log-retorno de período k (agregação temporal dos retornos)

MAE 5882 aula 02. O log-retorno de período k (agregação temporal dos retornos) Agregação de Retornos MAE 5882 aula 02 O log-retorno de período k (agregação temporal dos retornos) Agregação cross-section (transversal), para diversos ativos de uma carteira de investimentos, c: Suponha

Leia mais

CONHECIMENTOS ESPECÍFICOS

CONHECIMENTOS ESPECÍFICOS CONHECIMENTOS ESPECÍFICOS 2003 2004 2005 2006 2007 2008 2009 2010 X 39,0 39,5 39,5 39,0 39,5 41,5 42,0 42,0 Y 46,5 65,5 86,0 100,0 121,0 150,5 174,0 203,0 A tabela acima mostra as quantidades, em milhões

Leia mais

CONHECIMENTOS ESPECÍFICOS

CONHECIMENTOS ESPECÍFICOS fonte de graus de soma de quadrado variação liberdade quadrados médio teste F regressão 1 1,4 1,4 46,2 resíduo 28 0,8 0,03 total 2,2 A tabela de análise de variância (ANOVA) ilustrada acima resulta de

Leia mais

)XQGDPHQWRVGHSUREDELOLGDGHHHVWDWtVWLFD

)XQGDPHQWRVGHSUREDELOLGDGHHHVWDWtVWLFD )XQGDPHQWRVGHUREDELOLGDGHHHVWDWtVWLFD,QWURGXomR A história da estatística pode ser dividida em três fases. De acordo com PEANHA (00), a estatística inicialmente não mantinha nenhuma relação com a probabilidade,

Leia mais

Fundação Oswaldo Cruz Escola Nacional de Saúde Pública Departamento de Epidemiologia. Estatística espacial. Áreas

Fundação Oswaldo Cruz Escola Nacional de Saúde Pública Departamento de Epidemiologia. Estatística espacial. Áreas Fundação Oswaldo Cruz Escola Nacional de Saúde Pública Departamento de Epidemiologia Estatística espacial Áreas Áreas Na análise de áreas o atributo estudado é em geral resultando de uma contagem ou um

Leia mais

Econometria em Finanças e Atuária

Econometria em Finanças e Atuária Ralph S. Silva http://www.im.ufrj.br/ralph/especializacao.html Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Maio-Junho/2013 Modelos condicionalmente

Leia mais

Sumário. CAPÍTULO 1 Conceitos preliminares 1. CAPÍTULO 2 Descrição de dados: análise monovariada 47

Sumário. CAPÍTULO 1 Conceitos preliminares 1. CAPÍTULO 2 Descrição de dados: análise monovariada 47 CAPÍTULO 1 Conceitos preliminares 1 Introdução........................................................1 O que é estatística?.................................................. 4 Papel dos microcomputadores.........................................

Leia mais

Análise de séries temporais. Prof. Thaís C O Fonseca DME - UFRJ

Análise de séries temporais. Prof. Thaís C O Fonseca DME - UFRJ Análise de séries temporais Prof. Thaís C O Fonseca DME - UFRJ Conteúdo do curso Parte 1: Problemas e objetivos, conceitos básicos, processos estocásticos, estacionariedade, autocorrelação e correlação

Leia mais

Referência Banco de dados FioCruz Doc LAB1_GEO.doc. Autor Eduardo C. G. Camargo Versão 1.0 Data DEZ / Revisão Versão Data

Referência Banco de dados FioCruz Doc LAB1_GEO.doc. Autor Eduardo C. G. Camargo Versão 1.0 Data DEZ / Revisão Versão Data Ministério da Ciência e Tecnologia Instituto Nacional de Pesquisas Espaciais Análise Espacial de Dados Geográficos Laboratório Módulo: Geoestatística Linear Referência Banco de dados FioCruz Doc LAB_GEO.doc

Leia mais

Um modelo com erros assimétricos para dados contábeis

Um modelo com erros assimétricos para dados contábeis Um modelo com erros assimétricos para dados contábeis Matheus Bertolo Guerrero 1 Maria Luiza Maes 1 Gilvania de Sousa Gomes 2 Daniela Pereira de Silva Gomes 2 José Waldemar da Silva 1 1 Introdução A Demonstração

Leia mais

Apontamentos de Introdução às Probabilidades e à Estatística

Apontamentos de Introdução às Probabilidades e à Estatística i Índice 1. Introdução 1 1.1. Enquadramento e objectivos 2 1.2. Organização 5 1.3. Noções base da Estatística 7 1.3.1. Distinção entre população e amostra 8 1.3.2. Amostragem 10 1.3.3. Unidade estatística

Leia mais

Exercícios de programação

Exercícios de programação Exercícios de programação Estes exercícios serão propostos durante as aulas sobre o Mathematica. Caso você use outra linguagem para os exercícios e problemas do curso de estatística, resolva estes problemas,

Leia mais

Aula 2 Uma breve revisão sobre modelos lineares

Aula 2 Uma breve revisão sobre modelos lineares Aula Uma breve revisão sobre modelos lineares Processo de ajuste de um modelo de regressão O ajuste de modelos de regressão tem como principais objetivos descrever relações entre variáveis, estimar e testar

Leia mais

MAE 5882 aula 02. O log-retorno de período k (agregação temporal dos retornos)

MAE 5882 aula 02. O log-retorno de período k (agregação temporal dos retornos) Agregação de Retornos MAE 5882 aula 02 O log-retorno de período k (agregação temporal dos retornos) Agregação cross-section (transversal), para diversos ativos de uma carteira de investimentos, c: Suponha

Leia mais

Modelos Espaço-Temporais

Modelos Espaço-Temporais p. Modelos Espaço-Temporais para Dados de Área Marco A. R. Ferreira (marco@im.ufrj.br) Universidade Federal do Rio de Janeiro http://www.dme.ufrj.br/marco Colaboração com Juan C. Vivar-Rojas p. Organização

Leia mais

Econometria IV Modelos Lineares de Séries Temporais. Fernando Chague

Econometria IV Modelos Lineares de Séries Temporais. Fernando Chague Econometria IV Modelos Lineares de Séries Temporais Fernando Chague 2016 Estacionariedade Estacionariedade Inferência estatística em séries temporais requer alguma forma de estacionariedade dos dados Intuição:

Leia mais

IND 1115 Inferência Estatística Aula 6

IND 1115 Inferência Estatística Aula 6 Conteúdo IND 5 Inferência Estatística Aula 6 Setembro de 004 A distribuição Lognormal A distribuição Beta e sua relação com a Uniforme(0,) Mônica Barros mbarros.com mbarros.com A distribuição Lognormal

Leia mais

Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação

Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Universidade de São Paulo Instituto de Ciências Matemáticas e de Computação Francisco A. Rodrigues Departamento de Matemática Aplicada e Estatística - SME Objetivo Dada M classes ω 1, ω 2,..., ω M e um

Leia mais

RELATÓRIO DO LABORATÓRIO 5 GEO-ESTATÍSTICA

RELATÓRIO DO LABORATÓRIO 5 GEO-ESTATÍSTICA RELATÓRIO DO LABORATÓRIO 5 GEO-ESTATÍSTICA Igor Ogashawara Relatório apresentado do Laboratório 5 na disciplina de Geoprocessamento (SER 300). INPE São José dos Campos 2012 1. RESUMO O laboratório 5 teve

Leia mais

Laboratório Nº 5. A geoestatística permite descrever a continuidade espacial, a qual é uma característica

Laboratório Nº 5. A geoestatística permite descrever a continuidade espacial, a qual é uma característica Laboratório Nº 5 INTRODUÇAO A geoestatística permite descrever a continuidade espacial, a qual é uma característica essencial de muitos fenómenos naturais. Modelos inferenciais para este objetivo vêm sendo

Leia mais

Modelos para Séries Temporais Aula 1. Morettin e Toloi, 2006, Capítulo 2 Morettin, 2011, Capítulo 2 Bueno, 2011, Capítulo 2

Modelos para Séries Temporais Aula 1. Morettin e Toloi, 2006, Capítulo 2 Morettin, 2011, Capítulo 2 Bueno, 2011, Capítulo 2 Modelos para Séries Temporais Aula 1 Morettin e Toloi, 2006, Capítulo 2 Morettin, 2011, Capítulo 2 Bueno, 2011, Capítulo 2 Modelos para Séries Temporais Os modelos utilizados para descrever séries temporais

Leia mais

Técnicas computacionais em probabilidade e estatística II

Técnicas computacionais em probabilidade e estatística II Técnicas computacionais em probabilidade e estatística II Universidade de São Paulo Instituto de Matemática e Estatística http:www.ime.usp.br/ mbranco AULA 1: Problemas Computacionais em Inferência Estatística.

Leia mais

ANÁLISE VARIOGRÁFICA. A Geoestatística é baseada nos seguintes conceitos: Funções aleatórias. Variável regionalizada.

ANÁLISE VARIOGRÁFICA. A Geoestatística é baseada nos seguintes conceitos: Funções aleatórias. Variável regionalizada. ANÁLISE VARIOGRÁFICA A Geoestatística é baseada nos seguintes conceitos: Funções aleatórias Variável regionalizada Estacionariedade 1 2 No espaço (2D) ocorrem infinitos valores de uma variável. Por amostragem

Leia mais

Modelos espaço-temporais assimétricos para dados contínuos e categóricos

Modelos espaço-temporais assimétricos para dados contínuos e categóricos Modelos espaço-temporais assimétricos para dados contínuos e categóricos TESE DE DOUTORADO por Patrícia Lusié Velozo da Costa Universidade Federal do Rio de Janeiro Instituto de Matemática Departamento

Leia mais

3 Dados e metodologia

3 Dados e metodologia 3 Dados e metodologia 3.1 Apresentação de Dados Para a realização dessa pesquisa foram utilizados os dados da série histórica dos preços da soja (em grão) do Estado do Paraná, obtidos da base de dados

Leia mais

Processos Hidrológicos CST 318 / SER 456. Tema 9 -Métodos estatísticos aplicados à hidrologia ANO 2016

Processos Hidrológicos CST 318 / SER 456. Tema 9 -Métodos estatísticos aplicados à hidrologia ANO 2016 Processos Hidrológicos CST 318 / SER 456 Tema 9 -Métodos estatísticos aplicados à hidrologia ANO 2016 Camilo Daleles Rennó Laura De Simone Borma http://www.dpi.inpe.br/~camilo/prochidr/ Caracterização

Leia mais

MOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel

MOQ-13 PROBABILIDADE E ESTATÍSTICA. Professor: Rodrigo A. Scarpel MOQ-13 PROBABILIDADE E ESTATÍSTICA Professor: Rodrigo A. Scarpel rodrigo@ita.br www.mec.ita.br/~rodrigo Programa do curso: Semanas 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 e 16 Introdução à probabilidade (eventos,

Leia mais

Metodologia de inversão

Metodologia de inversão 6 Metodologia de inversão Nesta tese, a transformação de velocidades em pressão de poros é encarada como um problema de inversão. Pela natureza do problema, essa transformação apresenta caráter não único

Leia mais

Modelos de Regressão Linear Simples - Análise de Resíduos

Modelos de Regressão Linear Simples - Análise de Resíduos 1 Modelos de Regressão Linear Simples - Análise de Resíduos Erica Castilho Rodrigues 27 de Setembro de 2016 2 3 O modelo de regressão linear é dado por 3 O modelo de regressão linear é dado por Y i = β

Leia mais

Autor Eduardo C. G. Camargo Versão 1.0 Data DEZ / 2000

Autor Eduardo C. G. Camargo Versão 1.0 Data DEZ / 2000 Ministério da Ciência e Tecnologia Instituto Nacional de Pesquisas Espaciais Análise Espacial de Dados Geográficos Laboratório Módulo: Geoestatística Linear Referência Banco de dados São Carlos Doc LAB_Geo.doc

Leia mais

ANÁLISE DE DADOS AMBIENTAIS DO ESTADO DO PIAUÍ UTILIZANDO A DISTRIBUIÇÃO DE PARETO GENERALIZADA (GPD)

ANÁLISE DE DADOS AMBIENTAIS DO ESTADO DO PIAUÍ UTILIZANDO A DISTRIBUIÇÃO DE PARETO GENERALIZADA (GPD) ANÁLISE DE DADOS AMBIENTAIS DO ESTADO DO PIAUÍ UTILIZANDO A DISTRIBUIÇÃO DE PARETO GENERALIZADA (GPD) Stênio R. Lima (bolsista do ICV-UFPI), Fernando F. Nascimento (orientador, Dept. de Estatística - UFPI)

Leia mais

Coleta e Modelagem dos Dados de Entrada

Coleta e Modelagem dos Dados de Entrada Slide 1 Módulo 02 Coleta e Modelagem dos Dados de Entrada Prof. Afonso C. Medina Prof. Leonardo Chwif Três Etapas Coleta Tratamento Inferência Coleta dos Dados 1. Escolha adequada da variável de estudo

Leia mais

Modelos de Regressão Linear Simples - Análise de Resíduos

Modelos de Regressão Linear Simples - Análise de Resíduos Modelos de Regressão Linear Simples - Análise de Resíduos Erica Castilho Rodrigues 1 de Setembro de 2014 3 O modelo de regressão linear é dado por Y i = β 0 + β 1 x i + ɛ i onde ɛ i iid N(0,σ 2 ). O erro

Leia mais

Prof. Dr. Engenharia Ambiental, UNESP

Prof. Dr. Engenharia Ambiental, UNESP INTRODUÇÃO A ESTATÍSTICA ESPACIAL Análise Exploratória dos Dados Estatística Descritiva Univariada Roberto Wagner Lourenço Roberto Wagner Lourenço Prof. Dr. Engenharia Ambiental, UNESP Estrutura da Apresentação

Leia mais

Coleta e Modelagem dos Dados de Entrada

Coleta e Modelagem dos Dados de Entrada Coleta e Modelagem dos Dados de Entrada Capítulo 2 Páginas 24-52 Este material é disponibilizado para uso exclusivo de docentes que adotam o livro Modelagem e Simulação de Eventos Discretos em suas disciplinas.

Leia mais

A análise de séries temporais é uma área da estatística dedicada ao estudo de dados orientados no tempo (MONTGOMERY, 2004).

A análise de séries temporais é uma área da estatística dedicada ao estudo de dados orientados no tempo (MONTGOMERY, 2004). 3 Séries temporais A análise de séries temporais é uma área da estatística dedicada ao estudo de dados orientados no tempo (MONTGOMERY, 2004). 3.1. Princípios fundamentais Conforme Box et al. (1994), uma

Leia mais

2 Núcleos: suas propriedades e classificações

2 Núcleos: suas propriedades e classificações 2 Núcleos: suas propriedades e classificações O objetivo desse capítulo é o de apresentar as funções núcleos (7), suas propriedades (10) e suas classificações (3). 2.1 Núcleos no espaço de Hilbert Um espaço

Leia mais

ESTATÍSTICA COMPUTACIONAL

ESTATÍSTICA COMPUTACIONAL ESTATÍSTICA COMPUTACIONAL Ralph dos Santos Silva Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Motivação Por exemplo, queremos analisar a série

Leia mais

Capítulo 3: Elementos de Estatística e Probabilidades aplicados à Hidrologia

Capítulo 3: Elementos de Estatística e Probabilidades aplicados à Hidrologia Departamento de Engenharia Civil Prof. Dr. Doalcey Antunes Ramos Capítulo 3: Elementos de Estatística e Probabilidades aplicados à Hidrologia 3.1 - Objetivos Séries de variáveis hidrológicas como precipitações,

Leia mais

Inferência Estatistica

Inferência Estatistica Inferência Estatistica Ricardo Ehlers ehlers@icmc.usp.br Departamento de Matemática Aplicada e Estatística Universidade de São Paulo Modelos e Inferência Um modelo é uma simplificação da realidade (e alguns

Leia mais

Modelos ARCH e GARCH Aula 8. Morettin e Toloi, 2006, Capítulo 1 e 14 Morettin, 2011, Capítulo 1 e 5 Bueno, 2011, Capítulo 8

Modelos ARCH e GARCH Aula 8. Morettin e Toloi, 2006, Capítulo 1 e 14 Morettin, 2011, Capítulo 1 e 5 Bueno, 2011, Capítulo 8 Modelos ARCH e GARCH Aula 8 Morettin e Toloi, 2006, Capítulo 1 e 14 Morettin, 2011, Capítulo 1 e 5 Bueno, 2011, Capítulo 8 Motivação Pesquisadores que se dedicam a prever séries temporais, tais como preços

Leia mais

Ralph S. Silva

Ralph S. Silva ANÁLISE ESTATÍSTICA MULTIVARIADA Ralph S Silva http://wwwimufrjbr/ralph/multivariadahtml Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Revisão:

Leia mais

Bondade do ajuste, análise de resíduos bayesiana em modelos espaciais

Bondade do ajuste, análise de resíduos bayesiana em modelos espaciais Universidade Federal do Rio de Janeiro Departamento de Métodos Estatísticos Curso de Pós-graduação em Estatística Viviana das Graças Ribeiro Lobo Bondade do ajuste, análise de resíduos bayesiana em modelos

Leia mais

AULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012

AULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012 1 AULA 09 Regressão Ernesto F. L. Amaral 17 de setembro de 2012 Faculdade de Filosofia e Ciências Humanas (FAFICH) Universidade Federal de Minas Gerais (UFMG) Fonte: Triola, Mario F. 2008. Introdução à

Leia mais

SUMÁRIOS DE VARIÁVEIS ALEATÓRIAS CONTINUAS

SUMÁRIOS DE VARIÁVEIS ALEATÓRIAS CONTINUAS 4 SUMÁRIOS DE VARIÁVEIS ALEATÓRIAS CONTINUAS Em muitos problemas de probabilidade que requerem o uso de variáveis aleatórias, uma completa especificação da função de densidade de probabilidade ou não está

Leia mais

à Análise de Padrões

à Análise de Padrões CC-226 Introdução à Análise de Padrões Prof. Carlos Henrique Q. Forster Variáveis, Estatísticas sticas e Distribuições de Probabilidades Tópicos de hoje Definições Alguns estimadores estatísticos Distribuições

Leia mais

ESTATÍSTICA COMPUTACIONAL

ESTATÍSTICA COMPUTACIONAL ESTATÍSTICA COMPUTACIONAL Ralph dos Santos Silva Departamento de Métodos Estatísticos Instituto de Matemática Universidade Federal do Rio de Janeiro Sumário Escolha de modelos Até aqui assumimos que z

Leia mais

Desalinhamento de Variáveis em Dados Espacialmente Referenciados

Desalinhamento de Variáveis em Dados Espacialmente Referenciados Dissertação de mestrado Desalinhamento de Variáveis em Dados Espacialmente Referenciados Autor: Estrela Sumário 1 Introdução 5 2 Revisão de Geoestatística 8 2.1 Dados Espacialmente Referenciados...................

Leia mais

CONHECIMENTOS ESPECÍFICOS

CONHECIMENTOS ESPECÍFICOS CONHECIMENTOS ESPECÍFICOS X 0 1 2 3 4 5 frequência absoluta 80 47 30 20 6 1 Um levantamento foi realizado para se avaliar, por município, a quantidade X de obras que estão sob suspeita de irregularidade.

Leia mais

VERIFICAÇÃO DOS RECURSOS NECESSÁRIOS. Capítulo 1 VARIÁVEIS E AMOSTRAS 1

VERIFICAÇÃO DOS RECURSOS NECESSÁRIOS. Capítulo 1 VARIÁVEIS E AMOSTRAS 1 PREFÁCIO VERIFICAÇÃO DOS RECURSOS NECESSÁRIOS xiii DO EXCEL... xv Capítulo 1 VARIÁVEIS E AMOSTRAS 1 VARIÁ VEIS 4 NÚMERO DE VARIÁVEIS 5 CLASSIFICAÇÃO DAS VARIÁVEIS 6 ESCALA DE MEDIÇÃO DAS VARIÁVEIS 7 POPULAÇÃO

Leia mais

Estrutura de covariância espacial multivariada não separável

Estrutura de covariância espacial multivariada não separável Estrutura de covariância espacial multivariada não separável Rafael Santos Erbisti Universidade Federal do Rio de Janeiro Instituto de Matemática Departamento de Métodos Estatísticos 2015 Estrutura de

Leia mais

CONHECIMENTOS ESPECÍFICOS

CONHECIMENTOS ESPECÍFICOS CESPE/UnB FUB/03 fa 5 4 3 CONHECIMENTOS ESPECÍFICOS 60 As distribuições B e C possuem os mesmos valores para os quartis Q e Q, e o quartil superior em B corresponde ao quartil central (Q ) da distribuição

Leia mais

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27

1 Que é Estatística?, 1. 2 Séries Estatísticas, 9. 3 Medidas Descritivas, 27 Prefácio, xiii 1 Que é Estatística?, 1 1.1 Introdução, 1 1.2 Desenvolvimento da estatística, 1 1.2.1 Estatística descritiva, 2 1.2.2 Estatística inferencial, 2 1.3 Sobre os softwares estatísticos, 2 1.4

Leia mais

INSTITUTO NACIONAL DE PESQUISAS ESPACIAIS. Divisão de Sensoriamento Remoto. Geoprocessamento. Relatório do Laboratório 5: Geoestatistica Linear

INSTITUTO NACIONAL DE PESQUISAS ESPACIAIS. Divisão de Sensoriamento Remoto. Geoprocessamento. Relatório do Laboratório 5: Geoestatistica Linear INSTITUTO NACIONAL DE PESQUISAS ESPACIAIS Divisão de Sensoriamento Remoto Geoprocessamento Relatório do Laboratório 5: Geoestatistica Linear Fátima Lorena Benítez Ramírez Professores Responsáveis: Dr.

Leia mais

SUMÁRIO. 1.1 Introdução, Conceitos Fundamentais, 2

SUMÁRIO. 1.1 Introdução, Conceitos Fundamentais, 2 SUMÁRIO 1 CONCEITOS BÁSICOS, 1 1.1 Introdução, 1 1.2 Conceitos Fundamentais, 2 1.2.1 Objetivo, 2 1.2.2 População e amostra, 2 1.3 Processos estatísticos de abordagem, 2 1.4 Dados estatísticos, 3 1.5 Estatística

Leia mais

Gibbs Sampler para ANOVA e Misturas

Gibbs Sampler para ANOVA e Misturas Gibbs Sampler para ANOVA e Misturas Renato Assunção - DCC, UFMG Outubro de 014 1 Modelo ANOVA: componentes de variância Suponha que temos K grupos ou classes. Em cada grupo, temos um certo número de dados

Leia mais

Técnicas Multivariadas em Saúde. Vetores Aleatórios. Métodos Multivariados em Saúde Roteiro. Definições Principais. Vetores aleatórios:

Técnicas Multivariadas em Saúde. Vetores Aleatórios. Métodos Multivariados em Saúde Roteiro. Definições Principais. Vetores aleatórios: Roteiro Técnicas Multivariadas em Saúde Lupércio França Bessegato Dep. Estatística/UFJF 1. Introdução 2. Distribuições de Probabilidade Multivariadas 3. Representação de Dados Multivariados 4. Testes de

Leia mais

SUMÁRIO. Prefácio, Espaço amostrai, Definição de probabilidade, Probabilidades finitas dos espaços amostrais fin itos, 20

SUMÁRIO. Prefácio, Espaço amostrai, Definição de probabilidade, Probabilidades finitas dos espaços amostrais fin itos, 20 SUMÁRIO Prefácio, 1 3 1 CÁLCULO DAS PROBABILIDADES, 15 1.1 Introdução, 15 1.2 Caracterização de um experimento aleatório, 15 1.3 Espaço amostrai, 16 1.4 Evento, 17 1.5 Eventos mutuamente exclusivos, 17

Leia mais

LABORATÓRIO 5 ANÁLISE ESPACIAL DE DADOS GEOGRÁFICOS

LABORATÓRIO 5 ANÁLISE ESPACIAL DE DADOS GEOGRÁFICOS LABORATÓRIO 5 ANÁLISE ESPACIAL DE DADOS GEOGRÁFICOS João Bosco Coura dos Reis Registro nº: 130.362 Exercícios para avaliação parcial na disciplina de Introdução ao Geoprocessamento (SER-300) do Curso de

Leia mais

RESOLUÇÃO Nº 01/2016

RESOLUÇÃO Nº 01/2016 Legislações Complementares: Resolução Nº 02/2016 Colegiado DEst Resolução Nº 03/2016 Colegiado DEst Resolução Nº 01/2017 Colegiado DEst RESOLUÇÃO Nº 01/2016 O Departamento de Estatística, tendo em vista

Leia mais

Séries Temporais e Modelos Dinâmicos. Econometria. Marcelo C. Medeiros. Aula 9

Séries Temporais e Modelos Dinâmicos. Econometria. Marcelo C. Medeiros. Aula 9 em Econometria Departamento de Economia Pontifícia Universidade Católica do Rio de Janeiro Aula 9 Data Mining Equação básica: Amostras finitas + muitos modelos = modelo equivocado. Lovell (1983, Review

Leia mais

Análise Bayesiana de Dados - Aplicações 1 -

Análise Bayesiana de Dados - Aplicações 1 - Análise Bayesiana de Dados - Aplicações 1 - Márcia D Elia Branco Universidade de São Paulo Instituto de Matemática e Estatística www.ime.usp.br/ mbranco - sala 295-A - Aplicações da IB : Pressão sistólica

Leia mais

ARTIGO 2. KRIGAGEM E INVERSO DO QUADRADO DA DISTÂNCIA PARA INTERPOLAÇÃO DOS PARÂMETROS DA EQUAÇÃO DE CHUVAS INTENSAS

ARTIGO 2. KRIGAGEM E INVERSO DO QUADRADO DA DISTÂNCIA PARA INTERPOLAÇÃO DOS PARÂMETROS DA EQUAÇÃO DE CHUVAS INTENSAS ARTIGO 2. KRIGAGEM E INVERSO DO QUADRADO DA DISTÂNCIA PARA INTERPOLAÇÃO DOS PARÂMETROS DA EQUAÇÃO DE CHUVAS INTENSAS Análise conceitual de dados 1. Estrutura de dados: Xi: coordenadas das 140 estações

Leia mais

Modelagem de dados espaciais

Modelagem de dados espaciais VI Simpósio da Sociedade Brasileira de Engenharia de Avaliações Modelagem de dados espaciais José Luiz Portugal UFPE joseluiz.portugal@gmail.com Objetivos Contextualizar modelos de dados espaciais Compreender

Leia mais

Nivelamento: conceitos básicos sobre geoestatística. Dr. Diego Silva Siqueira Colaborador no Grupo de Pesquisa CSME

Nivelamento: conceitos básicos sobre geoestatística. Dr. Diego Silva Siqueira Colaborador no Grupo de Pesquisa CSME Nivelamento: conceitos básicos sobre geoestatística Dr. Diego Silva Siqueira Colaborador no Grupo de Pesquisa CSME Panorama atual: conhecimento da variabilidade Tecnologia de sementes OK Insumos OK Engenharia

Leia mais

AGA Análise de Dados em Astronomia I. 1. Introdução

AGA Análise de Dados em Astronomia I. 1. Introdução 1 / 22 1. Introdução AGA 0505 - Análise de Dados em Astronomia I 1. Introdução Laerte Sodré Jr. 1o. semestre, 2019 2 / 22 introdução aula de hoje: Introdução 1 objetivo 2 o que é ciência 3 dados 4 o que

Leia mais

MATRIZ DE REFERÊNCIA-Ensino Médio Componente Curricular: Matemática

MATRIZ DE REFERÊNCIA-Ensino Médio Componente Curricular: Matemática MATRIZ DE REFERÊNCIA-Ensino Médio Componente Curricular: Matemática Conteúdos I - Conjuntos:. Representação e relação de pertinência;. Tipos de conjuntos;. Subconjuntos;. Inclusão;. Operações com conjuntos;.

Leia mais

MÉTODO MEAN SHIFT PARA DETECÇÃO DE OUTLIERS EM MODELOS NORMAIS ASSIMÉTRICOS

MÉTODO MEAN SHIFT PARA DETECÇÃO DE OUTLIERS EM MODELOS NORMAIS ASSIMÉTRICOS UNIVERSIDADE FEDERAL DE JUIZ DE FORA INSTITUTO DE CIÊNCIAS EXATAS DEPARTAMENTO DE ESTATÍSTICA MÉTODO MEAN SHIFT PARA DETECÇÃO DE OUTLIERS EM MODELOS NORMAIS ASSIMÉTRICOS Thalita do Bem Mattos Clécio da

Leia mais

Avaliação de Desempenho

Avaliação de Desempenho Avaliação de Desempenho Aula passada Métricas, Técnicas, Erros Aula de hoje Conceitos importantes de probabilidade Como fazer a análise de desempenho? Modelos Matemáticos Modelos de Simulação Como fazer

Leia mais

Tópicos Especiais em Qualidade

Tópicos Especiais em Qualidade Tópicos Especiais em Qualidade Processos estocásticos, Distribuições de probabilidade e Ajustamento de dados Qualquer sistema real opera sempre em ambientes onde a incerteza impera, principalmente quando

Leia mais

Inferências bayesianas com probabilidade

Inferências bayesianas com probabilidade Inferências bayesianas com probabilidade Qual é a relação entre inferência bayesiana e as distribuições probabiĺısticas recém descritas? Essa conexão é feita ao se estimar parâmetros da distribuição probabiĺıstica

Leia mais

Técnicas Computacionais em Probabilidade e Estatística I. Aula I

Técnicas Computacionais em Probabilidade e Estatística I. Aula I Técnicas Computacionais em Probabilidade e Estatística I Aula I Chang Chiann MAE 5704- IME/USP 1º Sem/2008 1 Análise de Um conjunto de dados objetivo: tratamento de um conjunto de dados. uma amostra de

Leia mais

Interpolação. Interpolação. Padrões de amostragem. Autocorrelação. Padrões de amostragem. Padrões de amostragem

Interpolação. Interpolação. Padrões de amostragem. Autocorrelação. Padrões de amostragem. Padrões de amostragem Sistemas de Informação Geográfica II Interpolação 1. Interpolação Autocorrelação Padrões de amostragem Validação de resultados Interpolação Predição do valor de atributos em pontos não-amostrados Tempo

Leia mais

Revisão de distribuições de probabilidades contínuas (Capítulo 6 Levine)

Revisão de distribuições de probabilidades contínuas (Capítulo 6 Levine) Revisão de distribuições de probabilidades contínuas (Capítulo 6 Levine) Statistics for Managers Using Microsoft Excel, 5e 2008 Pearson Prentice-Hall, Inc. Chap 6-1 Objetivos: Neste capítulo, você aprenderá:

Leia mais

O uso de técnicas geoestatísticas na espacialização da argila do solo

O uso de técnicas geoestatísticas na espacialização da argila do solo O uso de técnicas geoestatísticas na espacialização da argila do solo Elisângela Aparecida de Oliveira 1 Tiago Egídio Barreto 2 Ricardo Ribeiro Rodrigues 3 1 Introdução O termo estatística espacial é utilizado

Leia mais

7 CONCLUSÕES E SUGESTÕES PARA TRABALHOS FUTUROS

7 CONCLUSÕES E SUGESTÕES PARA TRABALHOS FUTUROS 7 CONCLUSÕES E SUGESTÕES PARA TRABALHOS FUTUROS 7.1. Conclusões Neste trabalho foi estudado o problema da dinâmica da atenuação aplicado a dados resultantes de 28 anos-sítio, sendo 7 de enlaces via satélite

Leia mais

Notas de Aula. Estatística Elementar. by Mario F. Triola. Tradução: Denis Santos

Notas de Aula. Estatística Elementar. by Mario F. Triola. Tradução: Denis Santos Notas de Aula Estatística Elementar 10ª Edição by Mario F. Triola Tradução: Denis Santos Slide 1 Capítulo 3 Estatísticas para Descrição, Exploração e Comparação de Dados 3-1 Visão Geral 3-2 Medidas de

Leia mais

3 3. Variáveis Aleatórias

3 3. Variáveis Aleatórias ÍNDICE 3. VARIÁVEIS ALEATÓRIAS...49 3.. VARIÁVEIS ALEATÓRIAS UNIDIMENSIONAIS...49 3.2. VARIÁVEIS DISCRETAS FUNÇÃO DE PROBABILIDADE E FUNÇÃO DISTRIBUIÇÃO DE PROBABILIDADE...50 3.2.. Função de probabilidade...50

Leia mais

Distribuições Contínuas de Probabilidade

Distribuições Contínuas de Probabilidade Distribuições Contínuas de Probabilidade Uma variável aleatória contínua é uma função definida sobre o espaço amostral, que associa valores em um intervalo de números reais. Exemplos: Espessura de um item

Leia mais

1 Introdução aos Métodos Estatísticos para Geografia 1

1 Introdução aos Métodos Estatísticos para Geografia 1 1 Introdução aos Métodos Estatísticos para Geografia 1 1.1 Introdução 1 1.2 O método científico 2 1.3 Abordagens exploratória e confirmatória na geografia 4 1.4 Probabilidade e estatística 4 1.4.1 Probabilidade

Leia mais

Mais sobre Modelos Continuos

Mais sobre Modelos Continuos Mais sobre Modelos Continuos Ricardo Ehlers ehlers@icmc.usp.br Departamento de Matemática Aplicada e Estatística Universidade de São Paulo 1 / 41 Transformação Linear da Uniforme Seja X uma variável aleatória

Leia mais

Modelo de regressão estável aplicado a econometria

Modelo de regressão estável aplicado a econometria Modelo de regressão estável aplicado a econometria financeira Fernando Lucambio Departamento de Estatística Universidade Federal do Paraná Curitiba/PR, 81531 990, Brasil email: lucambio@ufpr.br 1 Objetivos

Leia mais

CE062c - GAMLSS. Silva, J.P; Taconeli, C.A. 09 de outubro, Silva, J.P; Taconeli, C.A. CE062c - GAMLSS 09 de outubro, / 42

CE062c - GAMLSS. Silva, J.P; Taconeli, C.A. 09 de outubro, Silva, J.P; Taconeli, C.A. CE062c - GAMLSS 09 de outubro, / 42 CE062c - GAMLSS Silva, J.P; Taconeli, C.A. 09 de outubro, 2018 Silva, J.P; Taconeli, C.A. CE062c - GAMLSS 09 de outubro, 2018 1 / 42 Por que GAMLSS? Silva, J.P; Taconeli, C.A. CE062c - GAMLSS 09 de outubro,

Leia mais

'HVFULomRH$QiOLVH([SORUDWyULDGRV'DGRV

'HVFULomRH$QiOLVH([SORUDWyULDGRV'DGRV 69 'HVFULomRH$QiOLVH([SORUDWyULDGRV'DGRV O presente capítulo objetiva entender o comportamento das séries de retorno financeiras para as carteiras de investimento elaboradas no capítulo anterior. Tal análise

Leia mais

Conceito de Estatística

Conceito de Estatística Conceito de Estatística Estatística Técnicas destinadas ao estudo quantitativo de fenômenos coletivos, observáveis. Unidade Estatística um fenômeno individual é uma unidade no conjunto que irá constituir

Leia mais

Capítulo 3 Estatísticas para Descrição, Exploração e Comparação de Dados. Seção 3-1 Visão Geral. Visão Geral. Estatísticas Descritivas

Capítulo 3 Estatísticas para Descrição, Exploração e Comparação de Dados. Seção 3-1 Visão Geral. Visão Geral. Estatísticas Descritivas Capítulo 3 Estatísticas para Descrição, Exploração e Comparação de Dados 3-1 Visão Geral 3-2 Medidas de Centro 3-3 Medidas de Dispersão 3-4 Medidas de Forma da Distribuição 3-5 Análise Exploratória de

Leia mais

Funções Geradoras de Variáveis Aleatórias. Simulação Discreta de Sistemas - Prof. Paulo Freitas - UFSC/CTC/INE

Funções Geradoras de Variáveis Aleatórias. Simulação Discreta de Sistemas - Prof. Paulo Freitas - UFSC/CTC/INE Funções Geradoras de Variáveis Aleatórias 1 Funções Geradoras de Variáveis Aleatórias Nos programas de simulação existe um GNA e inúmeras outras funções matemáticas descritas como Funções Geradoras de

Leia mais

Modelação de grandes incêndios em Portugal

Modelação de grandes incêndios em Portugal Modelação de grandes incêndios em Portugal Alexandra Ramos FEP e CMUP, Universidade do Porto, aramos@fep.up.pt Palavras chave: teoria de valores extremos bivariados, modelos para a dependência assintótica

Leia mais