Regressão simbólica sobre séries temporais de dados meteorológicos utilizando programação genética

Documentos relacionados
CONCURSO PETROBRAS DRAFT. Sistemas Instrumentados de Segurança (SIS) Questões Resolvidas. Produzido por Exatas Concursos

Figura 5.1.Modelo não linear de um neurônio j da camada k+1. Fonte: HAYKIN, 2001

UTILIZANDO O HISTOGRAMA COMO UMA FERRAMENTA ESTATÍSTICA DE ANÁLISE DA PRODUÇÃO DE ÁGUA TRATADA DE GOIÂNIA

Nota Técnica 113/2007 SRD/SRE/ANEEL Metodologia para Projeção de Investimentos para o Cálculo do Fator X Contribuição da Audiência Publica 052/2007


Prof. Msc. Fernando Oliveira Boechat

ESTRUTURA DE GERENCIAMENTO DO RISCO OPERACIONAL DO BANCO COOPERATIVO SICREDI E EMPRESAS CONTROLADAS

PESQUISA OPERACIONAL -INTRODUÇÃO. Prof. Angelo Augusto Frozza, M.Sc.

Análise de regressão linear simples. Departamento de Matemática Escola Superior de Tecnologia de Viseu

UNIVERSIDADE FEDERAL DA PARAÍBA UFPB CENTRO DE CIÊNCIAS AGRÁRIAS - CCA Departamento de Solos e Engenharia Rural - DSER. Aula 02

Cartelas de Aplicação de Superior Qualidade e Consistência Melhoram os Resultados de Testes de Controle de Qualidade.

Equações Diferenciais

CURSO PARA GESTÃO DE PROCESSOS MÓDULO I - MAPEAMENTO E MELHORIA DE PROCESSOS DO MP-PR. 3ª Oficina 10ª Reunião Análise e Melhoria de Processos

Histórico. Controle Estatístico de Processo

ANÁLISE DA EFICIÊNCIA DA RECUPERAÇÃO DE UMA ÁREA DEGRADADA POR EFLUENTE INDUSTRIAL

INDÍCE. Capítulo 1.- Introdução 2. Capítulo 2.-Normas técnicas 3. Capítulo 3.-Normas de Procedimento do SIRCA/suínos Funções do IFAP 5

Divulgação de Dados Meteorológicos das Estações da Grande Florianópolis

AGRUPAMENTO DE ESCOLAS DR. VIEIRA DE CARVALHO

Datas Importantes 2013/01

UML: Diagrama de Casos de Uso, Diagrama de Classes

Objetivos. Teoria de Filas. Teoria de Filas

PROJETO: CONSOLIDAÇÃO DA MODELAGEM PREVISÃO NUMÉRICA DO TEMPO NO INSTITUTO NACIONAL DE METEOROLOGIA (INMET) BRA/OMM/011/001 TERMO DE REFERÊNCIA

Chaves. Chaves. O modelo relacional implementa dois conhecidos conceitos de chaves, como veremos a seguir:

QUANDO este projeto deve ser realizado e QUANTO este projeto deverá custar?

GESTÃO DE RISCO OPERACIONAL

MODELAGEM E SIMULAÇÃO

Usos de Imagens de Satélite, Estimativa Quantitativa de Precipitação e Previsão de Precipitação a Curto Prazo pela Agência de Meteorologia do Japão

Sumário. Deadlock. Definição. Recursos. M. Sc. Luiz Alberto

Engenharia de Software III

Processos de gerenciamento de riscos. Planejamento Identificação Análise Resposta Monitoramento

RESPONSÁVEL PELA APRESENTAÇÃO ORAL: Lourival Rodrigues dos Santos

QUALIDADE DE SOFTWARE

Lei nº 7653 DE 24/07/2014

4- PROJETO DE BANCO DE DADOS

Avaliação do Pessoal Não Docente SIADAP

3 Estratégia para o enriquecimento de informações

UNIVERSIDADE FEDERAL DE LAVRAS PRÓ-REITORIA DE PLANEJAMENTO E GESTÃO Diretoria de Gestão da Tecnologia da Informação

4 Avaliação Econômica

PROJETO DE UMA TURBINA HIDRÁULICA PORTÁTIL 1

O ENSINO DE CÁLCULO NUMÉRICO: UMA EXPERIÊNCIA COM ALUNOS DO CURSO DE CIÊNCIA DA COMPUTAÇÃO

Faculdade Sagrada Família

Componentes Básicos de um escritório para SIG

Universidade Federal do Paraná

CONHECIMENTOS ESPECÍFICOS

Programação Matemática - Otimização Linear

Classificação de Pesos Padrão PARTE 2. Carlos Alexandre Brero de Campos Instituto de Pesos e Medidas do Estado do Paraná

Avaliação de Desempenho de Sistemas

Modelagem de Circuitos Digitais

Respostas da terceira lista de exercícios de química. Prof a. Marcia M. Meier

Qualidade e Comportamento do Produto em Pós-venda

Atuadores: Atuadores: Atuadores:

III-123 DIAGNÓSTICO AMBIENTAL EM ATERROS DE RESÍDUOS SÓLIDOS A PARTIR DE ESTUDOS DE REFERÊNCIA

AVALIAÇÃO DE DESEMPENHO

Linha de Pesquisa: GESTÃO E TECNOLOGIA DE PRODUÇÃO DA CONSTRUÇÃO

MEDIDORES

Anexo 19 PLANO DE GESTÃO DO PROJECTO

Abordagem simples aos modos de falha com recurso a um software de organização e gestão da manutenção

ODEBRECHT AMBIENTAL. Limpeza Mecanizada de Tanques

Trabalho resgatado da época do Sinac. Título: Desenvolvimento de Recursos Humanos para a Comercialização Hortigranjeiro Autor: Equipe do CDRH


REGULAMENTO PARA A GESTÃO DE CARREIRAS DO PESSOAL NÃO DOCENTE CONTRATADO NO ÂMBITO DO CÓDIGO DO TRABALHO DA UNIVERSIDADE DO. Capítulo I.

UNIVERSIDADE DE MOGI DAS CRUZES Centro de Ciências Exatas e Tecnológicas

Ajuste de Curvas. Ajuste de Curvas

Guia de utilização da notação BPMN

1 Introdução simulação numérica termoacumulação

Solicitadores. Agentes de Execução. Abril

MODELOS PROBABILÍSTICOS MAIS COMUNS VARIÁVEIS ALEATÓRIAS DISCRETAS

CONCURSO PÚBLICO ANALISTA DE SISTEMA ÊNFASE GOVERNANÇA DE TI ANALISTA DE GESTÃO RESPOSTAS ESPERADAS PRELIMINARES

Processos de Gerenciamento de Projetos. Planejamento e Controle de Projetos 5 TADS FSR. Processos

3 Transdutores de temperatura

Aula 5 - Classificação

GESTÃO DOS PROCESSOS DE INTERRUPÇÃO E RESTABELECIMENTO DO FORNECIMENTO A CLIENTES FINAIS

Energia. Fontes e formas de energia

O GERENTE E A EQUIPE DE PROJETOS O Gerente de Projeto. Gestão Pública - 2º Ano Desenvolvimento de Projetos Prof. Rafael Roesler Aula 5

Análise de Regressão Linear Simples e Múltipla

2005 IAC MINISTÉRIO DA DEFESA COMANDO DA AERONÁUTICA DEPARTAMENTO DE AVIAÇÃO CIVIL

MODELAGEM DE SISTEMAS

Métodos normalizados para medição de resistência de aterramento Jobson Modena e Hélio Sueta *

Plano de Gerenciamento de Riscos

AULAS 03 E 04 A linguagem dos projetos

Exercícios de Gestão de Operações IV

Controlo Estatístico de Processos Industriais

Universidade Federal de São João Del Rei - UFSJ

Gerenciamento de Projetos Modulo II Clico de Vida e Organização

Áreas de Conhecimento de Gerenciamento de Projetos

Anexo 2 8 Padrão de Sistema de Envio do Banco de Dados Brutos via SGP e Consulta ao Geoexplo - R00

MINISTÉRIO DA EDUCAÇÃO DEPARTAMENTO DO ENSINO SECUNDÁRIO MATEMÁTICA B 12º ANO

Reabilitar. Porquê? Como? Para quê? Para quem? Aveiro, 13 de Julho de 2011 João Azevedo DECivil - IST

Análise de componentes independentes aplicada à avaliação de imagens radiográficas de sementes

ESTUDO DE INSTALAÇÃO FOTOVOLTAICAS ISOLADAS E CONECTADAS À REDE ELÉTRICA. Pontifícia Universidade Católica do Rio Grande do Sul.

Introdução sobre o Tempo Real

Uma nova abordagem para o calculo do Capital Regulatório Operacional via Cópula de Frank

ESTRUTURA DE GERENCIAMENTO DO RISCO OPERACIONAL

LISTA DE EXERCÍCIOS 3

Transcrição:

Regressão simbólica sobre séries temporais de dados meteorológicos utilizando programação genética Programa de Pós-Graduação em Computação Aplicada Departamento de Informática Universidade Tecnológica Federal do Paraná Roberto Santos - roberto@simepar.br Heitor Lopes - hslopes@utfpr.edu.br 24 de outubro de 2012 Roberto Santos - roberto@simepar.brheitor Lopes Regressão - hslopes@utfpr.edu.br simbólica sobre séries () temporais de dados meteorológicos 24 de outubroutilizando de 2012 programação 1 / 16

Introdução Contexto Este trabalho apresenta um método para modelagem e preenchimento de falhas em séries temporais. O método é baseado em programação genética, uma técnica de computação evolucionária e são utilizados os dados de temperatura média da estação meteorológica de Palotina/PR. Roberto Santos - roberto@simepar.brheitor Lopes Regressão - hslopes@utfpr.edu.br simbólica sobre séries () temporais de dados meteorológicos 24 de outubroutilizando de 2012 programação 2 / 16

Dados meteorológicos WMO (2006) Os seres humanos vivem em um ambiente cercado pela atmosfera. Desta forma, todas as mudanças e fenômenos que ocorrem na atmosfera e no ambiente onde vive-se afetam direta ou indiretamente os seres humanos. Ser capaz de minimizar os efeitos negativos destes fenômenos e usar os resultados de forma benéfica para os seres humanos é uma das motivações para observar a atmosfera e o meio ambiente. Estação meteorológica automática É formada por um conjunto de sensores responsáveis por observar as mudanças e fenômenos da atmosfera, armazenando e enviando estes dados periodicamente. Os sensores mais comuns registram dados de temperatura, pressão, radiação solar, direção/velocidade do vento e precipitação acumulada. Roberto Santos - roberto@simepar.brheitor Lopes Regressão - hslopes@utfpr.edu.br simbólica sobre séries () temporais de dados meteorológicos 24 de outubroutilizando de 2012 programação 3 / 16

Problema Ausência de dados Por diversas razões é comum a ausência de dados em séries temporais de dados meteorológicos. Estas ausências estão associadas à: Falha no sensor Falha na transmissão do dado Reprovação do dado por um sistema de controle de qualidade Implicações Diversos modelos utilizados na agricultura (balanço hídrico) utilizam os dados meteorológicos sequencialmente e a ausência de dados impede que o modelo seja executado. Roberto Santos - roberto@simepar.brheitor Lopes Regressão - hslopes@utfpr.edu.br simbólica sobre séries () temporais de dados meteorológicos 24 de outubroutilizando de 2012 programação 4 / 16

Regressão simbólica A regressão simbólica consiste em induzir expressões matemáticas a partir de dados de um sistema matemático através da manipulação de expressões. O sistema matemático é descrito por dados de entrada e saída, que consistem em valores de uma função desconhecida f, tal que f : R n R, ou seja, casos de fitness geralmente têm um formato: x 1, x 2,..., x n, y onde x 1 a x n representam as variáveis independentes no sistema e y, a variável dependente. Entrada Saída...... -3.9-2.9972-3.6-2.8780-3.5-2.8184-3.4-2.7487...... Roberto Santos - roberto@simepar.brheitor Lopes Regressão - hslopes@utfpr.edu.br simbólica sobre séries () temporais de dados meteorológicos 24 de outubroutilizando de 2012 programação 5 / 16

Regressão simbólica Roberto Santos - roberto@simepar.brheitor Lopes Regressão - hslopes@utfpr.edu.br simbólica sobre séries () temporais de dados meteorológicos 24 de outubroutilizando de 2012 programação 6 / 16

Programação genética (PG) Os fundamentos da PG surgiram a partir da tese de doutorado de John Koza (1972), orientada por John Holland A PG é um descendente direto do AG Baseia-se no conceito de construção de programas para resolver problemas Programas = funções + terminais O espaço de busca de todos os programas possíveis é infinito e intratável Roberto Santos - roberto@simepar.brheitor Lopes Regressão - hslopes@utfpr.edu.br simbólica sobre séries () temporais de dados meteorológicos 24 de outubroutilizando de 2012 programação 7 / 16

Programação genética (PG) Roberto Santos - roberto@simepar.brheitor Lopes Regressão - hslopes@utfpr.edu.br simbólica sobre séries () temporais de dados meteorológicos 24 de outubroutilizando de 2012 programação 8 / 16

Passos preparatórios para PG 1 Conjunto de terminais 2 Conjunto de funções 3 Casos de fitness 4 Medidas de fitness 5 Parâmetros de controle e variáveis qualitativas 6 Critério de parada 7 Especificação do resultado Roberto Santos - roberto@simepar.brheitor Lopes Regressão - hslopes@utfpr.edu.br simbólica sobre séries () temporais de dados meteorológicos 24 de outubroutilizando de 2012 programação 9 / 16

Tratamento dos dados - Casos de fitness Estação meteorológica de Palotina/PR Variável: temperatura média Período: jul/1997 a mar/2011 Agrupamento dos dados em períodos de 10 dias (decêndios) 449 casos de fitness Roberto Santos - roberto@simepar.brheitor Lopes Regressão - hslopes@utfpr.edu.br simbólica sobre séries () temporais de dados meteorológicos 24 de outubro de utilizando 2012 programação 10 / 16

Definição dos parâmetros Funções: +,,, /, seno, sigmoide, sinc Terminais: [0, 1], 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, π, x, x 1, x 2, x 3 Medida de fitness: f = n i=1 x i y i Geração da população inicial: ramped half-and-half Seleção: torneio de tamanho 7 Número de populações: 1 Tamanho da população: 50.000 Operadores genéticos: reprodução e recombinação Profundidade da árvore: 10 Probabilidade de recombinação: 0,9 Probabilidade de reprodução: 0.1 Critério de parada: 100 + 1 Roberto Santos - roberto@simepar.brheitor Lopes Regressão - hslopes@utfpr.edu.br simbólica sobre séries () temporais de dados meteorológicos 24 de outubro de utilizando 2012 programação 11 / 16

Resultados preliminares Representação S (* π (+ (+ (+ (- x x3) (sigm (sinc (+ (* x 0.056) (* π 0.971))))) (- x x3)) (sigm (* (* (+ (+ π (+ π π)) (+ (* (* x 0.056) 0.056) (* (- x x3) 0.971))) (sigm (* 0.537) (sinc (* 0.054 x))))) (sinc (- (sigm (+ (- x x3) (- x x3))) (+ (+ π π) (* x 0.056)))))))) Coeficiente de Pearson (R) n i=1 R = (x i x)(y i ȳ) n i=1 (x i x) 2, [ 1, +1] (1) (y i ȳ) 2 R = 0.83 (2) Roberto Santos - roberto@simepar.brheitor Lopes Regressão - hslopes@utfpr.edu.br simbólica sobre séries () temporais de dados meteorológicos 24 de outubro de utilizando 2012 programação 12 / 16

Resultados preliminares Dados observados x Modelo PG Roberto Santos - roberto@simepar.brheitor Lopes Regressão - hslopes@utfpr.edu.br simbólica sobre séries () temporais de dados meteorológicos 24 de outubro de utilizando 2012 programação 13 / 16

Resultados preliminares Fitness cru Roberto Santos - roberto@simepar.brheitor Lopes Regressão - hslopes@utfpr.edu.br simbólica sobre séries () temporais de dados meteorológicos 24 de outubro de utilizando 2012 programação 14 / 16

Conclusões Pontos observados Comportamento aproximado da realidade Facilidade de uso do método (ecj) Necessidade de limitar a profundidade da árvore da solução Necessidade de identificar as funções adequadas ao fenômeno físico associado Próximos passos Comparar os resultados utilizando Programação de Expressão Genética Utilizar somente dados aprovados no controle de qualidade Utilizar períodos menores (1 ano) e/ou a média de cada decêndio Roberto Santos - roberto@simepar.brheitor Lopes Regressão - hslopes@utfpr.edu.br simbólica sobre séries () temporais de dados meteorológicos 24 de outubro de utilizando 2012 programação 15 / 16

Conclusões Agradecimentos Os autores agradecem ao SIMEPAR pelo fornecimento dos dados utilizados neste trabalho. Roberto Santos - roberto@simepar.brheitor Lopes Regressão - hslopes@utfpr.edu.br simbólica sobre séries () temporais de dados meteorológicos 24 de outubro de utilizando 2012 programação 16 / 16