CONSTRUÇÃO DE INTERVALOS DE PREDIÇÃO PARA REDES NEURAIS VIA REGRESSÃO MULTIV EM SÉRIES HETEROCEDÁSTICAS

Documentos relacionados
Análise Multivariada Aplicada à Contabilidade

Modelagem do preço da soja utilizando a metodologia de análise de séries temporais 1

PREVISÃO DE PREÇO DO QUILO DO CAFÉ ARÁBICA: UMA APLICAÇÃO DOS MODELOS ARIMA E GARCH

Ralph S. Silva

Aula 2 Uma breve revisão sobre modelos lineares

3 Modelos Comparativos: Teoria e Metodologia

Modelo de Regressão Múltipla

Modelagem do comportamento da variação do índice IBOVESPA através da metodologia de séries temporais

Disciplina de Modelos Lineares Professora Ariane Ferreira

Variável dependente Variável independente Coeficiente de regressão Relação causa-efeito

Disciplina de Modelos Lineares

4 Modelos de Regressão Dinâmica

A Metodologia de Box & Jenkins

Econometria em Finanças e Atuária

i j i i Y X X X i j i i i

4 APLICAÇÕES À SÉRIE TEMPORAL DE CONSUMO RESIDENCIAL MENSAL DE ENERGIA ELÉTRICA

Regressão linear múltipla

Análise de previsão da inflação no período pós-plano Real

Coeficiente de determinação R 2 no modelo de regressão linear normal

Predição do preço médio anual do frango por intermédio de regressão linear

Correlação e Regressão

i j i i Y X X X i j 1 i 2 i i

Modelagem para previsão/estimação: uma aplicação Neuro-Fuzzy

9 Correlação e Regressão. 9-1 Aspectos Gerais 9-2 Correlação 9-3 Regressão 9-4 Intervalos de Variação e Predição 9-5 Regressão Múltipla

3 Redes Neurais Artificiais

PREVISÃO. Prever o que irá. acontecer. boas decisões com impacto no futuro. Informação disponível. -quantitativa: dados.

ESTATÍSTICA COMPUTACIONAL

Utilizando a função auto.arima em modelos de séries temporais

Modelos de Regressão Linear Simples - parte III

Modelos ARCH e GARCH Aula 8. Morettin e Toloi, 2006, Capítulo 1 e 14 Morettin, 2011, Capítulo 1 e 5 Bueno, 2011, Capítulo 8

Econometria. Econometria MQO MQO. Resíduos. Resíduos MQO. 1. Exemplo da técnica MQO. 2. Hipóteses do Modelo de RLM. 3.

Multicolinariedade e Autocorrelação

Comparação entre intervalos de confiança calculados com métodos bootstrap e intervalos assintóticos

Análise do volume útil do reservatório de Furnas via modelos de séries temporais

CÁLCULO DO EQUILIBRIO DE TROCA-IÔNICA DO SISTEMA Na + -Pb 2+ -Cu 2+ USANDO REDES NEURAIS ARTIFICIAIS.

Análise de Séries Temporais. Modelos estacionários Processos puramente aleatórios, AR(p), MA(q) ARIMA(p,q)

Análise de Regressão Linear Simples e

Aplicação da metodologia Box & Jenkins para previsão de vendas de emulsificante

Análise de Regressão

UNIVERSIDADE FEDERAL DE OURO PRETO PRÓ REITORIA DE GRADUAÇÃO. Código: EST011 Departamento: Unidade: DEPARTAMENTO DE ESTATÍSTICA

Modelos de Regressão Linear Simples - parte II

Aula 22/10/2018 José Luiz Padilha 22 de outubro de 2018

Análise comparativa entre métodos estatístico e rede neural aplicados em séries temporais

Econometria Semestre

Metodologia de Box-Jenkins. Metodologia de Box-Jenkins. Metodologia de Box-Jenkins

Markov Switching Models. Profa. Airlane Alencar. Depto de Estatística - IME-USP. lane. Ref: Kim e Nelson (1999) e Hamilton (1990)

Análise de Regressão Linear Múltipla III

UM MODELO NEURAL PARA A PREVISÃO DA DEMANDA DE ENERGIA ELÉTRICA NA CIDADE DE FRANCA

Análise de variância para experimentos com dependência espacial entre parcelas: abordagem autoregressiva e Geoestatística

Prova de Estatística

Universidade Federal do Paraná (UFPR) Bacharelado em Informática Biomédica. Regressão. David Menotti.

Econometria. Econometria ( ) O modelo de regressão linear múltipla. O modelo de regressão linear múltipla. Aula 2-26/8/2010

Econometria. Regressão Linear Simples Lista de Exercícios

Combinação Geométrica de Métodos Preditivos; Aplicação à Previsão de Consumo Residencial Mensal de Energia Elétrica

Fundamentos de Inteligência Artificial [5COP099]

Um Estudo do Comportamento dos Gráficos de Controle Construídos Via Metodologia de Geoestatística

Capacitação em R e RStudio PROJETO DE EXTENSÃO. Software R: capacitação em análise estatística de dados utilizando um software livre.

Comparando equações de regressão em dados de saúde

Ações de bancos e risco sistêmico

5 PREVISÃO DE SÉRIES TEMPORAIS DE VAZÃO DE DRENOS DA BARRAGEM DE FUNIL

Mais Informações sobre Itens do Relatório

Exercícios Selecionados de Econometria para Concursos Públicos

Uso de séries temporais na análise da temperatura média mensal da cidade de Mossoró, RN

( ) Estimação do valor em risco (VaR) de uma carteira de ativos através de método bayesiano. α, é definido como:

AULAS 14 E 15 Modelo de regressão simples

FICHA DE DISCIPLINA/PROGRAMA

Redes Neurais: Uma Aplicação na Previsão de Vendas

2 Modelos Não Lineares

UNIVERSIDADE FEDERAL DA FRONTEIRA SUL Campus CERRO LARGO. PROJETO DE EXTENSÃO Software R: de dados utilizando um software livre.

3 INTERVALOS DE CONFIANÇA

Avaliação Monte Carlo do teste para comparação de duas matrizes de covariâncias normais na presença de correlação

AULAS 14 E 15 Modelo de regressão simples

Matriz de Variância e Covariância e o Teorema de Gauss-Markov

PARTE 1 ANÁLISE DE REGRESSÃO COM DADOS DE CORTE TRANSVERSAL CAPÍTULO 2 O MODELO DE REGRESSÃO SIMPLES

Regression and Clinical prediction models

Modelos de Regressão Linear Simples - Análise de Resíduos

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves

Notas de Aulas Econometria I ** Eduardo P. Ribeiro, 2010 PARTE II

2. Séries Temporais Definição

Identificação de modelos de séries temporais heterocedásticos

Regressão Linear - Parte I

Modelos de Regressão Linear Simples - Análise de Resíduos

TÉCNICAS EXPERIMENTAIS APLICADAS EM CIÊNCIA DO SOLO

Referências Bibliográcas

Estatística - Análise de Regressão Linear Simples. Professor José Alberto - (11) sosestatistica.com.br

Exemplos Regressão Dados Binários

Séries Temporais e Modelos Dinâmicos. Econometria. Marcelo C. Medeiros. Aula 9

AULA 10 - MQO em regressão múltipla: Propriedades Estatísticas (Variância)

Aula 7 Métodos Quantitativos Avançados

Ajuste do modelo de regressão linear: Inferência Bayesiana, aspectos computacionais e seleção de variáveis.

AULA 09 Regressão. Ernesto F. L. Amaral. 17 de setembro de 2012

Capítulo 9 - Regressão Linear Simples (RLS): Notas breves

REGRESSÃO LINEAR Parte I. Flávia F. Feitosa

Introdução. São duas técnicas estreitamente relacionadas, que visa estimar uma relação que possa existir entre duas variáveis na população.

Neste capítulo apresentam-se os modelos STVAR-Tree, o principal da dissertação, além dos modelos competidores PAR(p) e Neuro-Fuzzy.

TREND STRIPS E NÍVEIS DE RUÍDO ADICIONADOS A UM MAPA SENOIDAL

Prof. Lorí Viali, Dr.

Análise de Regressão Prof. MSc. Danilo Scorzoni Ré FMU Estatística Aplicada

Transcrição:

recebido em /7 - aprovado em 9/7 CONSTRUÇÃO DE INTERVALOS DE PREDIÇÃO PARA REDES NEURAIS VIA REGRESSÃO MULTIV TIVARIADA E SUA APLICAÇÃO EM SÉRIES HETEROCEDÁSAS CONSTRUCTION OF PREDICTION INTERVALS FOR NEURAL NETWORKS VIA MULTIVARIATE REGRESSION AND THEIR APPLICATION TO HETEROCEDAS SERIES Doutorando da Faculdade de Economia, Administração e Contabilidade da USP Professor do Instituto Presbiteriano Mackenzie mauriao@uspbr Professora Doutora da Faculdade de Economia, Administração e Contabilidade da USP amontini@uspbr Doutorando da Faculdade de Economia, Administração e Contabilidade da USP Professor do Instituto Presbiteriano Mackenzie dreedbergmann@yahoocombr Resumo O objetivo deste trabalho é apresentar a teoria para construção de intervalos de predição (IP) e de confiança (IC) para redes neurais artificiais (RNA) alimentadas adiante de múltiplas camadas feedforward baseada em regressão multivariada Essa técnica foi aplicada em um conjunto de séries temporais univariadas ARIMA-GARCH construídas por simulação e em uma série de preço da saca da soja O desempenho das topologias de RNA é comparado por meio do coeficiente de desigualdade de Theil, do e pela quantidade de valores que ficam fora do IP e do IC As redes neurais têm sido utilizadas com freqüência na análise de séries temporais e a utilização de intervalos de predição e confiança pode ser considerada uma ferramenta adicional para avaliar o desempenho das RNA Abstract This work presents the theory to construct prediction (PI) and confidence intervals (CI) for feedforward artificial neural networks (ANN) based on multivariate regression This technique was applied to a set of ARIMA- GARCH time series built by simulation and to a soybean price series The ANN topologies performance is compared using the Theil inequality coefficient (), root mean square error () and the quantities of values outside the PI and CI Neural networks have been intensively applied to time series analysis and the use of prediction and confidence intervals can be considered an additional tool to evaluate ANN performance Palavras-chave: Redes Neurais Artificiais Intervalos de Confiança Intervalos de Predição Séries Temporais Key-words: Artificial Neural Networks Confidence Intervals Prediction Intervals Time Series FACEF PESQUISA - v - n3-7 7

CONSTRUÇÃO DE INTERVALOS DE PREDIÇÃO PARA REDES NEURAIS VIA REGRESSÃO MULTIVARIADA E SUA APLICAÇÃO EM SÉRIES HETEROCEDÁSAS Introdução Quando as redes neurais artificiais (RNA) são usadas em problemas de predição, é desejável que sejam construídos intervalos de predição e de confiança para os valores preditos Os métodos de estimação desses intervalos dependem da topologia de RNA que é utilizada e esses métodos são válidos sob certas suposições Para modelar qualquer série econométrica é importante avaliar a qualidade do modelo construído Isso é bastante estudado em problemas que utilizam a estrutura da teoria da regressão linear, levando a resultados bem estabelecidos e métodos comumente utilizados para construir intervalos de confiança (IC) e predição (IP) para regressão, mais recentemente, esses resultados têm sido estendidos para modelos não lineares Este artigo apresenta um método de construção de IC e IP baseado em regressão multivariada para RNA alimentadas adiante Essa abordagem é construída a partir do método dos mínimos quadrados que aplica a expansão de Taylor em modelos não lineares Os intervalos são construídos para as previsões de séries temporais ARIMA-GARCH geradas por simulação e para a série real de preço da saca de 6 Kg da soja Hwang e Ding (997) construíram intervalos de confiança e de predição para redes neurais de múltiplas camadas alimentadas adiante e aplicaram a metodologia em séries temporais simuladas Rivals e Personnaz () apresentam resultados teóricos sobre a construção de intervalos de confiança para regressão não-linear baseados na estimação de mínimos quadrados utilizando expansão de Taylor Outros métodos para a construção de intervalos de confiança baseados em regressão não-linear foram propostos por De Vaux et al (998) Métodos propostos para construção de intervalos de predição e confiança para redes neurais, podem ser encontrados por exemplo em Chryssolouris et al (996), Dybowski () e Castellano et al (3) Muitas destas técnicas são dependentes da arquitetura específica de rede neural que é utilizada Por esse motivo, tais técnicas não se aplicam aos diversos tipos de RNA com diferentes topologias e conexões Referencial teórico Uma rede alimentada adiante tem todos os sinais indo em uma direção, dos neurônios de entrada para os neurônios de saída As redes neurais alimentadas adiante de múltiplas camadas também são chamadas de multilayer feedforward neural networks (MLFN) Uma conexão entre dois neurônios tem um valor numérico (peso) representando a influência do neurônio de entrada sobre o neurônio de saída Um caso especial desse tipo de rede, com apenas uma camada oculta e uma saída, é mostrado na Figura Usando a Figura como exemplo, os sinais de entrada x,x,,x y são linearmente combinados com os vários pesos resultando em vários sinais de entrada para a segunda camada Esses sinais de entrada são, então, passados através de uma função de ativação para produzir os sinais de saída dos neurônios da segunda camada A função de ativação, utilizada neste trabalho, é a função logística: f (x) = +e -x Tendo uma função de ativação, a saída total da rede, dada a entrada x=(x,x,,x y ) t, é dada por: k y w (x) = w + w i f (w' li x+w li ) i= () em que w li = (w li, w li,,w lid ) e os pesos, ou parâmetros não conhecidos, são representados pela matriz W = (w,w k,w,,w lk, w,, w k ), sendo que o negrito indica notação matricial e o sobrescrito denota a transposta (HWANG e DING,997) 7 FACEF PESQUISA - v - n3-7

Figura - Rede neural alimentada adiante de três camadas x x x 3 y x 4 x 5 x r Neste trabalho assume-se um modelo estatístico que relaciona y e y w (x) da seguinte forma: y = y w (x)+ε, () em que os x' i s são independentes dos erros ε i ' s e que (x i,ε i ) são iid (independentes e identicamente distribuídos) Suponha-se que ε satisfaz as seguintes condições: E[ε]=; Cov[ε]=E[εε ]=σ Dada uma série de tamanho n, a rede é treinada com os vetores (y,x ),(y n-k,x n-k ) Esses vetores são usados para determinar o estimador W dos pesos W Essa rede é usada para predizer a saída futura de uma nova entrada x n+ por y = y w (x n+ ) Assume-se que para todo i n, (y i,x i ) satisfaz () e (), ou seja y i = y w (x )+ε, y é uma variável i i n+ aleatória não observável que é o objetivo da predição O objetivo é construir intervalos de predição para y n+ e intervalos de confiança para y(x n+ ), que é a esperança condicionada de y n+ dado x n+ Teoria de intervalo de predição O problema de estimação dos parâmetros da equação () utilizando a função objetivo de mínimos quadrados pode também ser formulado como um problema de regressão não-linear Os métodos que fornecem intervalos de predição assintóticos para regressão não-linear podem, em teoria, ser aplicados diretamente às redes neurais Nessa seção, fazemos uma revisão dessa teoria (SEBER e WILD, 989, NETER et al, 996, JOHNSON e WICHERN, ) Considere o modelo de regressão não-linear definido por: y = f(x,w)+ε (3) sendo w um vetor de parâmetros e ε Ν (,σ Ι) No caso da rede neural, f é dada pelo lado direito da equação () A equação (3) pode ser reescrita como: y = x w + ε (n x) (n x (r+)) ((r+)x) (n x) (4) O vetor de parâmetros (w) é estimado por meio da minimização da soma dos resíduos ao quadrado dada por: SQR= (y-y)'(y-y), em que y é o vetor de valores preditos Na vizinhança dos valores dos parâmetros, que denotaremos por w*, a função f pode ser aproximada por uma série de Taylor: FACEF PESQUISA - v - n3-7 73

CONSTRUÇÃO DE INTERVALOS DE PREDIÇÃO PARA REDES NEURAIS VIA REGRESSÃO MULTIVARIADA E SUA APLICAÇÃO EM SÉRIES HETEROCEDÁSAS y = f (w*)+ J (w-w*), sendo que J é a matriz cuja i-ésima entrada é f (x i ) / w j, avaliada no vetor de parâmetros w*, e x é a i-ésima linha de X, i correspondendo ao i-ésimo conjunto de dados Pode-se aproximar a soma dos resíduos ao quadrado por: SQR (y-f (w*)+jw*-jw) '(y-f (w*)+jw*-jw) (5) SQR [(y-f (w*)+jw*)-jw]' [(y-f (w*)+jw*)-jw] = [k'k-j'w'(y-f (w*)+jw*)+ w'j'jw] (6) em que k = y-f (w*)+jw*)= ε*+jw*] Para se obter uma estimativa de mínimos quadrados dos parâmetros, ou seja w, pode-se igualar a zero a derivada de SQR com relação a w A soma quadrada dos resíduos também pode ser escrita como: A derivada da expressão (6) com relação a dada por: SQR w = J'Jw-J' (y-f (w*+jw*) Igualando a expressão (7) a zero, tem-se que: w = (J'J) - J' (y-f (w*+jw*) Var = [w] = σ (J'J) - w é (7) (8) A variância assintótica de pode ser obtida pelo teorema de Gauss-Markov que resulta em: w (9) O estimador assintóticamente não-viesado de σ é dado por: s = SQR () (n-r-) Dados os parâmetros estimados w e um novo conjunto de observações x, pode-se aproximar o valor predito de f (x,w) em x, por meio da expansão de Taylor, por: y = f (x,w) f (x,w*) +J' (w-w*) () em que J é um vetor cuja i-ésima entrada é f (x,w)/ w i A expressão () pode ser aproximada por: y f (x,w*) +J' [(J'J) - J'(ε*+Jw*)-w*] = f (x,w*) +J [(J J) - J ε*+w*-w*] =f (x,w*) +J (J J) - J ε* () A variância de aproximada por y condicionada a x pode ser Var [ y x ]=Var [ f (x,w*) +J (J'J) - J'ε*], como a variância de f (x,w*) é igual a zero pelo fato de que os estados x e w* são conhecidos, e como se assumiu que o vetor de erros é não correlacionado com nenhum dos outros vetores de parâmetros, conclui-se que a variância condicionada pode ser aproximada por: Var [ y x ]=σ J' (J'J) - J (3) Tem-se que, n é o número de valores que correspondem às variáveis preditas e r é o número de parâmetros Como y denota o valor de uma resposta quando a variável preditora tem os valores x = [,x,,x r ], de acordo com o modelo da equação (4), o valor esperado de y é: E [ y x ] = w + w x ++ w r x r = x w Para o modelo de regressão da equação (4), x' w é o estimador não-viesado de E [ y x ] com variância mínima dada por Var [ y x ]=σ J' (J'J) - J Quando os erros ε são normalmente distribuídos, o intervalo com (-α)% de confiança (IC) para E [ y x ] = x w é dado por (JOHNSON e WICHERN,, p 374): x' w ± t n-r- s [J' (J'J) - J ] (4) em que t n-r- é o (-α)-ésimo percentil da distribuição t de Student com n-r- graus de liberdade A predição de uma nova observação, tal como y, em x = [,x,,x r ], é mais incerta que estimar o valor esperado de y 74 FACEF PESQUISA - v - n3-7

Quando os erros ε têm uma distribuição normal, um intervalo de predição (IP) de (-α)% para y é dado por (JOHNSON e WICHERN,, p 375): x' w ± t n-r- s [+J' (J'J) - J ] (5) em que t n-r- é o (-α)-ésimo percentil da distribuição t de Student com n-r- graus de liberdade Modelo AR-GARCH Os modelos auto-regressivos com heterocedasticidade condicional generalizado GARCH foram proposto por Bollerslev (986) Esses modelos são muito utilizados para a modelagem da volatilidade de séries temporais, ou seja, eles são utilizados quando a volatilidade da série não é constante (MORETTIN, 4, HAMILTON, 994, ENDERS, 3) Uma série temporal segue um modelo AR([])- GARCH(,) quando puder ser escrita na forma: y t = + y t- +v t, v = t σ η (6) t t sendo que σ = α + α v + β σ, e a variável t t- t- aleatória η possui média e variância t 3 Resultados A teoria para a construção de intervalos de confiança e predição, apresentada neste artigo, foi aplicada a séries temporais AR([])-GARCH(,) geradas por simulação Foram geradas, utilizando o programa Mathematica versão 5, cinco séries com observações e cinco com observações, ver Figura Figura - Séries AR([])-GARCH(,) geradas por simulação FACEF PESQUISA - v - n3-7 75

CONSTRUÇÃO DE INTERVALOS DE PREDIÇÃO PARA REDES NEURAIS VIA REGRESSÃO MULTIVARIADA E SUA APLICAÇÃO EM SÉRIES HETEROCEDÁSAS Pode-se verificar, a partir das funções de autocorrelação parcial (FACP) das séries simuladas, ver Figura 3, que a auto-correlação parcial de cada uma dessas séries é truncada no lag um, caracterizando modelos auto-regressivos de primeira ordem (AR()) Figura 3 Funções de auto-correlação parcial das séries geradas por simulação Os parâmetros estimados das séries temporais AR([])-GARCH(,) geradas por simulação, dados pela equação 6, são apresentados na Tabela Tabela Parâmetros estimados das séries AR([])-GARCH(,) geradas Série Série Série Série3 Série4 Série5 Série6 Série7 Série8 Série9 Série Tamanho da série,,83,353,76,444,89,668,,54,84 α,77,,478,34,333,978,768,753,8,55 α,83,38,8,8,43,86,333,75,5,34 β,69,95,478,564,77,35,45,8,479,338 76 FACEF PESQUISA - v - n3-7

A metodologia para a construção dos IC e IP apresentada foi aplicada a série do preço da saca de 6 quilos de soja, de 8/9/98 a /9/6 Essas séries com e observações, respectivamente, serão denominadas por soja- e soja- Estas séries foram obtidas do CEPEA - Centro de Estudos Avançados em Economia Aplicada da ESALQ A Figura 4 apresenta as séries e as respectivas séries originais com uma diferença de ordem As séries originais da soja não são estacionárias, pois a média é afetada pelo tempo Aplicam-se o teste de Dickey-Fuller às duas séries e verifica-se que há evidência de que as séries são não estacionárias (p-value =,8 para a série soja- e p-value=,34 para a série soja-) Nota-se que as séries com a primeira diferença são heterocedásticas, ver Figura 4 Figura 4 - Séries soja- e soja- e as respectivas séries com a primeira diferença As funções de auto-correlação parcial dessas duas séries estão apresentadas na Figura 5 Para a série do preço da soja, com a primeira diferença, com 999 observações, ajustam-se um AR(8) incompleto GARCH(,) dado por: y t =,363y t-,639y t-8 + v t Para a série do preço da soja, com a primeira diferença, com 999 observações, ajusta-se um AR(8) incompleto GARCH(,) dado por: y t =,7855y t- +,5553y t-4 +,45338y t-8 + v t σ =,5 +,6364v +,87473σ t t- t- σ =,9 +,8936v +,9799σ t t- t- FACEF PESQUISA - v - n3-7 77

CONSTRUÇÃO DE INTERVALOS DE PREDIÇÃO PARA REDES NEURAIS VIA REGRESSÃO MULTIVARIADA E SUA APLICAÇÃO EM SÉRIES HETEROCEDÁSAS Figura 5 Funções de auto-correlação das séries do preço da soja com uma diferença para a série soja- e soja- observações 3 Construção de intervalos de confiança e de predição para uma RNA utilizada para predizer uma série temporal econométrica Neste trabalho, está-se restrito ao uso de uma rede alimentada adiante com uma única camada oculta, totalmente conectada, algoritmo de minimização de Levenberg-Marquardt e a rede apresenta uma saída As redes neurais são modelos não-lineares que podem ser treinadas para mapear valores passados e futuros de séries temporais No caso da predição de séries heterocedásticas, presentes em grande parte dos modelos econométricos, os modelos utilizando RNAs tornam-se uma ferramenta importante e cada vez mais aplicada (KHIRIPET, ) As séries temporais, utilizadas neste trabalho, apresentam tamanhos e, no caso da série com observações utilizam-se 9 valores para treinamento e para série com observações foram usadas 9 observações para treinamento Os valores restantes são utilizados para predição e construção do IP e IC Procedendo dessa forma, pode-se testar algumas configurações de RNA Para realizar a predição, utilizam-se, como configuração de partida, as seguintes topologias de rede RNA: 5--, 5--, 5-3-, 5-4-, 5-5- e 5-8- Para cada topologia de RNA, mostram-se as respectivas quantidades de valores que ficaram fora do intervalo de confiança (), fora do intervalo de predição (), coeficiente de desigualdade de Theil () e o de cada uma delas Os resultados foram obtidos após a fase de treinamento com um número máximo de 5 épocas Após a obtenção dos valores preditos, são construídos os intervalos de confiança e predição, com 95% de confiança, utilizando-se a metodologia apresentada na seção Na Tabela, têm-se os resultados obtidos pelas várias topologias de RNA para todas as séries temporais simuladas Verifica-se que, para todas as séries, os intervalos de predição estão de acordo com o esperado para o nível de significância adotado Note-se que para as séries 4, 5 e 7 que possuem os maiores parâmetros estimados associados à estacionariedade na média ( ) ou à volatilidade (β ), ver Tabela, as topologias de rede que apresentaram os menores foram 5-- e 5- - A série que apresenta o maior parâmetro estimado associado à volatilidade e o menor parâmetro estimado associado a estacionariedade na média teve como rede de menor a topologia 5-5- As demais séries tiveram os menores para as topologias 5-5-, 5-8-, 5-3- e 5-4- 78 FACEF PESQUISA - v - n3-7

Tabela- Estatísticas para diferentes topologias de RNA para as séries simuladas Serie_ Tamanho Serie_ Tamanho RNA 5-- RNA 5-- RNA 5-3- RNA 5-4- RNA 5-5- RNA 5-8- 39 38 34 9 7,3879,399675,33459,386736,56966,55647,833,47,8776,44897,7886,7844 RNA 5-- RNA 5-- RNA 5-3- RNA 5-4- RNA 5-5- RNA 5-8- 6 6 5 49 47 45 3,7854,73386,68438,54345,485354,5384,68,9599,94348,897,75668,86 Serie_3 Tamanho Serie_4 Tamanho RNA 5-- 59,5663,8656 RNA 5-- 4,788,5333 RNA 5--,47986,853 RNA 5-- 4,7567,5368 RNA 5-3- 55,485,8778 RNA 5-3- 4,68,5954 RNA 5-4- 5,4994,8948 RNA 5-4- 44,9987,669 RNA 5-5-,4339,754 RNA 5-5- 43,9966,549347 RNA 5-8- 5,373,68996 RNA 5-8- 36,9355,55937 Serie_5 Tamanho Serie_6 Tamanho RNA 5-- 49,37,634 RNA 5--,435,894 RNA 5-- 49,35,38 RNA 5--,886,884 RNA 5-3- 47,37365,488 RNA 5-3-,79,84 RNA 5-4- 46,5669 3,5455 RNA 5-4-,549549,567 RNA 5-5- 46,3348,364 RNA 5-5-,548,943 RNA 5-8- 47,347,4853 RNA 5-8-,55938,3 Serie_7 Tamanho Serie_8 Tamanho RNA 5--,9784,6467 RNA 5--,566,543 RNA 5--,934,948 RNA 5--,5596,985 RNA 5-3-,97,59 RNA 5-3-,5599,7786 RNA 5-4- 9,45945,896 RNA 5-4-,563687,499 RNA 5-5- 6,435,947 RNA 5-5-,536,99 RNA 5-8-,8734,3443 RNA 5-8-,54995,783 Serie_9 Tamanho Serie_ Tamanho RNA 5-- 3,366,99 RNA 5-- 49,33,766997 RNA 5-- 8 3,35499,63 RNA 5-- 5,338,7747 RNA 5-3-,67687,47 RNA 5-3- 5,3956,76453 RNA 5-4-,3468,534 RNA 5-4- 5,339,73679 RNA 5-5- 5,34559,78 RNA 5-5- 46,3437,768 RNA 5-8- 3,934,68 RNA 5-8- 5,37,77397 FACEF PESQUISA - v - n3-7 79

CONSTRUÇÃO DE INTERVALOS DE PREDIÇÃO PARA REDES NEURAIS VIA REGRESSÃO MULTIVARIADA E SUA APLICAÇÃO EM SÉRIES HETEROCEDÁSAS Como exemplo, apresentamos na Figura 6 os intervalos com 95 % de confiança para as séries, 3, 8 e 9 geradas por simulação As linhas tracejadas indicam os limites superiores e inferiores associados ao intervalo de confiança e a linha contínua representa os valores preditos pela RNA Figura 6 Intervalos de confiança para as séries, 3, 8 e 9 geradas por simulação Na Figura 7, apresentam-se os intervalos de predição relacionados às séries, 3, 8 e 9 apresentadas na Tabela Figura 7 Intervalos de predição para as séries, 3, 8 e 9 geradas por simulação 8 FACEF PESQUISA - v - n3-7

A Tabela 3 apresenta as estatísticas,, e obtidas por meio da previsão dos últimos valores da série da soja com observações Tabela 3 - Estatísticas para diferentes topologias de RNA para a série do preço da soja (n = ) RNA 5-- 44,53679,99 RNA 5-- 46,569,998 RNA 5-3- 4,4997,8794 RNA 5-4- 35,5654,84784 RNA 5-5- 37,49677,837 RNA 5-8- 43,5338,9789 Com os resultados obtidos para a série do preço da soja de tamanho, verifica-se que à medida que se aumenta a quantidade de neurônios na camada intermediária até a topologia 5-5-, ocorre uma melhora da predição da rede, visto que o e o decaem gradativamente Note-se que a RNA 5-4- foi a topologia que apresentou a menor quantidade de valores fora do intervalo de confiança () e que todas as topologias tiveram valores fora do intervalo de predição () Considerando as observações da série do preço da soja, obtêm-se os resultados apresentados na Tabela 4 Tabela 4 - Estatísticas para diferentes topologias de RNA para a série do preço da soja (n = ) RNA 5-- 43,5648,8595 RNA 5-- 43,5398,89386 RNA 5-3- 45,5477,8338 RNA 5-4- 44,533,89688 RNA 5-5- 3,49997,86 RNA 5-8- 54,537,99795 Dos resultados acima, podem-se verificar que, da mesma forma que a série com observações, a rede alimentada adiante com três camadas 5-5-, também foi a topologia que apresentou os melhores resultados Nesse caso, o, o e o decaem gradativamente A Figura 8 apresenta os intervalos de confiança e de predição com 95 % de confiança para as séries do preço da soja com e observações FACEF PESQUISA - v - n3-7 8

CONSTRUÇÃO DE INTERVALOS DE PREDIÇÃO PARA REDES NEURAIS VIA REGRESSÃO MULTIVARIADA E SUA APLICAÇÃO EM SÉRIES HETEROCEDÁSAS Figura 8 Intervalos de confiança e de predição para a série do preço da soja Neste trabalho, focou-se a previsão de um passo à frente O principal motivo para isso é que as previsões de um passo à frente são mais utilizadas na prática, uma vez que se pode recalibrar o modelo e gerar novas previsões à medida que novos dados se tornam disponíveis Além disso, para muitos modelos, os erros das previsões de um passo à frente são independentes uns dos outros Conseqüentemente, previsões de um passo são melhores para discriminar entre modelos concorrentes Uma comparação simples de performance de métodos e modelos pode ser obtida simplesmente comparando o MSE (erro quadrático médio) ou o dessas previsões (KAJITANI et al, 3) A construção dos intervalos de predição e de confiança é uma adicional para avaliar a adequação do modelo construído Estender o seu uso para redes neurais é uma maneira de incorporar novas técnicas de avaliar diferentes topologias Para obtenção dos resultados, foi utilizado um computador Pentium IV, 8 GB de HD e 64 MB de RAM A rede 5-8-, utilizada na série de tamanho, apresentou o maior tempo de processamento de 8 segundos 4 Conclusão Neste artigo, foi apresentada a metodologia para construção de intervalos de predição e de confiança para redes neurais de múltiplas camadas alimentadas adiante totalmente conectadas por meio da técnica de regressão multivariada A metodologia foi aplicada às séries AR-GARCH simuladas e à série real do preço da saca da soja de 6 Kg Os métodos de estimação dos intervalos de predição e confiança são válidos sob certas suposições que podem não ser satisfeitas na prática Para a série do preço da soja, a rede neural alimentada adiante com três camadas 5-5- foi a topologia que apresentou os melhores resultados Com relação às séries simuladas, obtiveram-se as seguintes topologias : 5--, 5--, 5-3-,5-4-, 5-5- e 5-8- O método, apresentado neste trabalho, pode ser estendido para aplicações de RNAs com mais de uma camada intermediária, mais de uma saída e diferentes formas de entrada 8 FACEF PESQUISA - v - n3-7

Referências BOLLERSLEV, T Generalised Autoregressive Conditional Heterocedasticity, Journal of Econometrics, n 3, p 37-37, 986 CASTELLANO, G, FANELLI AM e MENCAR, C Deriving prediction intervals for neurofuzzy networks, CILAB Computational Intelligence Laboratory Mathematical and Computer Modelling: An International Journal, Kastoria, Grécia, v4, p 79-76, 3 CHRYSSOLOURIS, G, LEE, M, RAMSEY, A Confidence interval prediction for neural network models, IEEE Trans Neural Networks n7 v, pag 9-3, 996 DE VAUX, R D, SCHUMI, J, SCHWEINSBERG, J; UNGAR, L H Prediction Intervals for Neural Networks via Nonlinear Regression, Technometrics, v 4, n 4, nov 998 KHIRIPET, N, An Architecture for Intelligent Time Series Prediction with Causal Information, Tese - Georgia: Georgia Institute of Technology, Atlanta, MORETTIN, P A; TOLOI, C M C Análise de Séries Temporais, São Paulo, Edgard Blucher, p36-396, 4 NETER J, KUTNER, M H, NACHTSHEIM, C J E WASSERMAN, W Applied Linear Regression Models, Chicago, Irwin, 996 ed 3 RIVALS, I E PERSONNAZ, L Construction of confidence intervals for neural networks base don least square estimation, Neural Networks, v 3, p 463-484, SEBER, G A; WILD, C J Nonlinear Regression, New York: Wiley, 989 DYBOWSKI, S R Confidence intervals and prediction intervals for feed-forward neural networks, DYBOWSKI, S R (Org) In: Clinical Applications of Artificial Neural Networks, ed, Cambridge University Press, p 98-36, ENDERS, W Applied econometric time series, Hoboken, Wiley, p 38-84, 3 HAMILTON, J D Time series analysis, Princeton: Princeton University Press, 994 HWANG, J T G E DING, A A Prediction Intervals for Artificial Neural Networks, Journal of the American Statistical Association, v 9, p 748-7, 997 JOHNSON, R A E WICHERN, D W Applied Multivariate Statistical Analisys, 4 ed, New Jersey, Prentice Hall, p 374-375 KAJITANI, Y, KEITH, W H, MCLEOD, I Forecasting Nonlinear Time Series with Feed- Forward Neural Networks: A Case Study of Canadian Lynx Data, Journal of Forecasting, n 4, p 5-7, 3 FACEF PESQUISA - v - n3-7 83