Controle de processos da indústria de petróleo e gás utilizando técnicas de inteligência artificial



Documentos relacionados
Figura 5.1.Modelo não linear de um neurônio j da camada k+1. Fonte: HAYKIN, 2001

Do neurônio biológico ao neurônio das redes neurais artificiais

Complemento II Noções Introdutória em Redes Neurais

Redes Neurais. Profa. Flavia Cristina Bernardini

OBJETIVOS: CARGA HORÁRIA MÍNIMA CRONOGRAMA:

MLP (Multi Layer Perceptron)

Matlab - Neural Networw Toolbox. Ana Lívia Soares Silva de Almeida

TriNMPC. Controlador Preditivo Multivariável Linear e Não-linear BENEFÍCIOS: APLICAÇÕES: CARACTERÍSTICAS:

Redes Neurais. A IA clássica segue o paradigma da computação simbólica

Instrumentação na Indústria Química. Prof. Gerônimo

UNIVERSIDADE FEDERAL DE SANTA CATARINA

Gerenciamento de Projetos Modulo II Ciclo de Vida e Organização do Projeto

Funções de Posicionamento para Controle de Eixos

Aula 2 RNA Arquiteturas e Treinamento

Análise e Desenvolvimento de Sistemas ADS Programação Orientada a Obejeto POO 3º Semestre AULA 03 - INTRODUÇÃO À PROGRAMAÇÃO ORIENTADA A OBJETO (POO)

INSTRUMENTAÇÃO E CONTROLE DE PROCESSOS SISTEMAS DE CONTROLE. Na maior parte das aplicações, um sistema de controle e composto de:

Sistemas de Informação I

Caracterização temporal de circuitos: análise de transientes e regime permanente. Condições iniciais e finais e resolução de exercícios.

Extração de Requisitos

PÓS GRADUAÇÃO EM CIÊNCIAS DE FLORESTAS TROPICAIS-PG-CFT INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA-INPA. 09/abril de 2014

PROCESSO DE DESENVOLVIMENTO DE SOFTWARE. Modelos de Processo de Desenvolvimento de Software

QFD: Quality Function Deployment QFD: CASA DA QUALIDADE - PASSO A PASSO

Aprendizagem de Máquina

Capítulo 3. Avaliação de Desempenho. 3.1 Definição de Desempenho

Controle II. Estudo e sintonia de controladores industriais

IW10. Rev.: 02. Especificações Técnicas

Organização e Arquitetura de Computadores I

GERENCIAMENTO DO CONHECIMENTO NA EMPRESA DIGITAL

1 Descrição do Trabalho

Armazenamento de energia

Redes Neurais Construtivas. Germano Crispim Vasconcelos Centro de Informática - UFPE

Instalações Máquinas Equipamentos Pessoal de produção

Gestão do Conhecimento A Chave para o Sucesso Empresarial. José Renato Sátiro Santiago Jr.

Na medida em que se cria um produto, o sistema de software, que será usado e mantido, nos aproximamos da engenharia.

SERVIÇO DE ANÁLISE DE REDES DE TELECOMUNICAÇÕES APLICABILIDADE PARA CALL-CENTERS VISÃO DA EMPRESA

Processos de gerenciamento de projetos em um projeto

2. Representação Numérica

UNIVERSIDADE FEDERAL DO PARANÁ UFPR Bacharelado em Ciência da Computação

ENGENHARIA DE SOFTWARE I

Universidade Paulista

Prof. JUBRAN. Aula 1 - Conceitos Básicos de Sistemas de Informação

Ajuste dos Parâmetros de um Controlador PI em uma Coluna de Destilação Binária

FACULDADE DE ENGENHARIA DE COMPUTAÇÃO. PROJETO FINAL I e II PLANO DE TRABALHO <NOME DO TRABALHO> <Nome do Aluno> <Nome do Orientador>

Projetos. Universidade Federal do Espírito Santo - UFES. Mestrado em Informática 2004/1. O Projeto. 1. Introdução. 2.

)HUUDPHQWDV &RPSXWDFLRQDLV SDUD 6LPXODomR

15 Computador, projeto e manufatura

Gestão da Qualidade Políticas. Elementos chaves da Qualidade 19/04/2009

CAPÍTULO 3 - TIPOS DE DADOS E IDENTIFICADORES

Seção 2/E Monitoramento, Avaliação e Aprendizagem

Geração, Transmissão e Distribuição de Energia Elétrica

INSTRUMENTAÇÃO INDUSTRIAL - DEFINIÇÕES

Ivan Guilhon Mitoso Rocha. As grandezas fundamentais que serão adotadas por nós daqui em frente:

4 Arquitetura básica de um analisador de elementos de redes

Megôhmetro Digital de 12kV

AS LEIS DE NEWTON PROFESSOR ANDERSON VIEIRA

Engenharia de Sistemas Computacionais

CHECK - LIST - ISO 9001:2000

Introdução a Química Analítica. Professora Mirian Maya Sakuno

UNIVERSIDADE FEDERAL DE SANTA MARIA COLÉGIO TÉCNICO INDUSTRIAL DE SANTA MARIA Curso de Eletrotécnica

IBM1018 Física Básica II FFCLRP USP Prof. Antônio Roque Aula 6. O trabalho feito pela força para deslocar o corpo de a para b é dado por: = =

3 Metodologia de Previsão de Padrões de Falha

APLICAÇÕES DA DERIVADA

Diretrizes para determinação de intervalos de comprovação para equipamentos de medição.

Programa de Pós-Graduação em Comunicação e Cultura Contemporâneas. Grupo de Pesquisa em Interação, Tecnologias Digitais e Sociedade - GITS

Banco de Dados Aula 1 Introdução a Banco de Dados Introdução Sistema Gerenciador de Banco de Dados

LEI DE OHM. Professor João Luiz Cesarino Ferreira. Conceitos fundamentais

Artigo Lean Seis Sigma e Benchmarking

Modelos Pioneiros de Aprendizado

Modelo Cascata ou Clássico

6 Construção de Cenários

Módulo 4. Construindo uma solução OLAP

Sociedade da Informação

MRP II. Planejamento e Controle da Produção 3 professor Muris Lage Junior

ADM041 / EPR806 Sistemas de Informação

Multiplexador. Permitem que vários equipamentos compartilhem um único canal de comunicação

2. Função Produção/Operação/Valor Adicionado

PESQUISA OPERACIONAL: UMA ABORDAGEM À PROGRAMAÇÃO LINEAR. Rodolfo Cavalcante Pinheiro 1,3 Cleber Giugioli Carrasco 2,3 *

Disciplina: Introdução à Informática Profª Érica Barcelos

Sistemas de Informação I

QUALIDADE DA INFORMAÇÃO QUALIDADE DA INFORMAÇÃO CONHECIMENTO

Hardware (Nível 0) Organização. Interface de Máquina (IM) Interface Interna de Microprogramação (IIMP)

Faculdade de Engenharia Optimização. Prof. Doutor Engº Jorge Nhambiu

6. Geometria, Primitivas e Transformações 3D

7.Conclusão e Trabalhos Futuros

Feature-Driven Development

Arquitetura de Rede de Computadores

TRABALHOS TÉCNICOS Coordenação de Documentação e Informação INOVAÇÃO E GERENCIAMENTO DE PROCESSOS: UMA ANÁLISE BASEADA NA GESTÃO DO CONHECIMENTO

BC-0005 Bases Computacionais da Ciência. Modelagem e simulação

Roteiro. Arquitetura. Tipos de Arquitetura. Questionário. Centralizado Descentralizado Hibrido

Redes Neurais Artificiais na Engenharia Nuclear 2 Aula-1 Ano: 2005

CAP. I ERROS EM CÁLCULO NUMÉRICO

Automação, Controle e Otimização em Sistemas de Produção de Petróleo

Sistemas de Informação

Abordagem de Processo: conceitos e diretrizes para sua implementação

5. Resultados e Análises

Sitec Power Soluções em Energia ENERGIA REATIVA E FATOR DE POTÊNCIA

ALESSANDRO RODRIGO FRANCO FERNANDO MARTINS RAFAEL ALMEIDA DE OLIVEIRA

Pós-Graduação em Gerenciamento de Projetos práticas do PMI

Transcrição:

UNIVERSIDADE FEDERAL DE SANTA CATARINA CURSO DE GRADUAÇÃO EM ENGENHARIA QUÍMICA Controle de processos da indústria de petróleo e gás utilizando técnicas de inteligência artificial Larissa Scherer Severo Florianópolis, Agosto de 2004

LARISSA SCHERER SEVERO MONOGRAFIA DE INICIAÇÃO CIENTÍFICA CONTROLE DE PROCESSOS DA INDÚSTRIA DE PETRÓLEO E GÁS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA ARTIFICIAL Orientador: Prof. Ricardo A. F. Machado, Dr. Sc. FLORIANÓPOLIS 2004 1

CONTROLE DE PROCESSOS DA INDÚSTRIA DE PETRÓLEO E GÁS UTILIZANDO TÉCNICAS DE INTELIGÊNCIA ARTIFICIAL Monografia submetida ao Programa PRH-ANP/MCT N o 34 para avaliação de final de curso. Larissa Scherer Severo Aluna de Graduação Ricardo Antônio Francisco Machado Professor, Dr. Sc. Orientador Reinaldo Marcolla Aluno de Pós-graduação Co-orientador 2

SUMÁRIO LISTA DE FIGURAS...4 RESUMO...6 INTRODUÇÃO...8 1.2 CONTROLE DE PROCESSOS NA INDÚSTRIA PETROQUÍMICA...11 1.3 APRESENTAÇÃO DO TRABALHO...13 REVISÃO BIBLIOGRÁFICA...14 2.1 INTRODUÇÃO...14 2.2 REDES NEURAIS ARTIFICIAIS...14 2.2.1 - Benefícios das redes neurais...16 2.2.2 - Cérebro Humano...20 2.2.3 - Modelos de um Neurônio...22 2.2.4 - Tipos de Função de Ativação...26 2.2.5 - Arquitetura da Rede...29 2.2.6 - Inteligência Artificial e Redes Neurais...34 2.2.7 - O Aprendizado da Rede...34 2.2.8 - Algoritmo de Retropropagação de Erro...37 2.3 - MODELAGEM DE PROCESSOS QUÍMICOS UTILIZANDO CONHECIMENTO PRÉVIO DE REDES NEURAIS...38 2.4 CONSIDERAÇÕES FINAIS...41 METODOLOGIA...42 3.1 - UNIDADES EXPERIMENTAIS...42 3.2 - PROCEDIMENTO EXPERIMENTAL...46 RESULTADOS E DISCUSSÕES...53 4.1 RESULTADOS DO TREINAMENTO DA REDE NEURAL...53 4.2 RESULTADOS DO CONTROLE EM MALHA FECHADA...56 CONCLUSÕES...61 REFERÊNCIAS BIBLIOGRÁFICAS...63 3

LISTA DE FIGURAS FIGURA 1.01: ILUSTRAÇÃO DAS GERAÇÕES EXISTENTES NA INDÚSTRIA PETROQUÍMICA....9 FIGURA 1.02: PROCESSAMENTO MENSAL DE PETRÓLEO NAS REFINARIAS DO BRASIL...10 FIGURA 2.01: REPRESENTAÇÃO EM DIAGRAMA EM BLOCOS DO SISTEMA NERVOSO...20 FIGURA 2.02: ORGANIZAÇÃO ESTRUTURAL DOS NÍVEIS DO CÉREBRO...22 FIGURA 2.03: MODELO NÃO-LINEAR DE UM NEURÔNIO....23 FIGURA 2.04: TRANSFORMAÇÃO AFIM PRODUZIDA PELA PRESENÇA DE UM BIAS....25 FIGURA 2.05: OUTRO MODELO NÃO-LINEAR DE UM NEURÔNIO....26 FIGURA 2.06: FUNÇÃO DE TRANSFERÊNCIA SIGMÓIDE....27 FIGURA 2.07: FUNÇÃO DE TRANSFERÊNCIA TANGENTE HIPERBÓLICA....28 FIGURA 2.08: FUNÇÃO DE TRANSFERÊNCIA GAUSSIANA...29 FIGURA 2.09: REDE ALIMENTADA ADIANTE OU ACÍCLICA COM UMA ÚNICA CAMADA DE NEURÔNIO...31 FIGURA 2.10: REDE ALIMENTADA ADIANTE OU ACÍCLICA TOTALMENTE CONECTADA COM UMA CAMADA OCULTA E UMA CAMADA DE SAÍDA....32 FIGURA 2.11: REDE RECORRENTE SEM LAÇOS DE AUTO-REALIMENTAÇÃO E SEM NEURÔNIOS OCULTOS.33 FIGURA 2.12: PREVISÃO DA TEMPERATURA APÓS UM INTERVALO DE TEMPO ΔT...35 FIGURA 2.13: FLUXO DE INFORMAÇÕES PARA O AJUSTE DOS PESOS APÓS CADA PADRÃO....36 FIGURA 3.01: ESQUEMA DA UNIDADE PILOTO DE POLIMERIZAÇÃO [MAZZUCCO, 2003]...43 FIGURA 3.02: DETALHES DO REATOR DE POLIMERIZAÇÃO.[MAZZUCCO, 2003]...44 FIGURA 3.03 : TELA PRINCIPAL DO SOFTWARE DE AQUISIÇÃO DE DADOS E CONTROLE (MALHA FECHADA)....46 FIGURA 3.04: FLUXOGRAMA DO PROCEDIMENTO EXPERIMENTAL...47 FIGURA 3.05: PERTURBAÇÕES APLICADAS NAS VÁLVULAS DE CONTROLE PARA O LEVANTAMENTO DE DADOS PARA ETAPA DE TREINAMENTO...48 FIGURA 3.06: RESPOSTA DA TEMPERATURA DO REATOR PARA AS PERTURBAÇÕES APLICADAS NA FIGURA 3.05....48 FIGURA 3.07: PERTURBAÇÕES APLICADAS NAS VÁLVULAS DE CONTROLE PARA O LEVANTAMENTO DE DADOS PARA ETAPA DE VALIDAÇÃO...49 FIGURA 3.08: RESPOSTA DA TEMPERATURA DO REATOR PARA AS PERTURBAÇÕES APLICADAS NA FIGURA 3.07....50 4

FIGURA 3.09: MENU GERADO PELO PROGRAMA MATLAB PARA CONFIGURAÇÃO DA REDE NEURAL...51 FIGURA 4.01: RESULTADO DO TREINAMENTO PARA 6 NEURÔNIOS NA CAMADA ESCONDIDA E 50.000 ÉPOCAS...53 FIGURA 4.02/4.03: RESULTADO DO TREINAMENTO PARA 6 NEURÔNIOS NA CAMADA ESCONDIDA E 100.000 ÉPOCAS...54 FIGURA 4.04: RESULTADO DA VALIDAÇÃO DA REDE...55 FIGURA 4.05: TOPOLOGIA DA REDE...56 FIGURA 4.06: SOFWARE EM OPERAÇÃO. MUDANÇA DE SETPOINT DE 30 PARA 50 O C....57 FIGURA 4.07: MUDANÇA DE SETPOINT DE 50 PARA 70 O C...58 FIGURA 4.08: RESPOSTA DAS VARIÁVEIS CONTROLADA E MANIPULADA, MANTIDO UM SETPOINT DE 70 O C...59 FIGURA 4.09: PERTURBAÇÃO DE CARGA EM DESTAQUE....60 5

RESUMO A maioria dos processos químicos é caracterizada por não linearidades, tempo morto muito elevado, processo restritivos e condições de operação em constante mudança. Unidades petroquímicas estão repletas destes processos: colunas de destilação em refinarias, reatores, torres de extração e absorção, etc. O preço do petróleo está associado ao valor que se pode agregar a ele sendo função da densidade e ponto de ebulição. Processos sob rigoroso controle, mantendo os produtos dentro das especificações desejadas, é de extremo interesse para esse segmento. Controladores clássicos a parâmetros constantes, nestes casos, apresentam desempenho limitado e, para transpor essas dificuldades a engenharia de processos tem se beneficiado de estratégias de controle avançadas, como, por exemplo, controle preditivo baseado em modelo (MPC). Sistemas inteligentes são extremamente atraentes para problemas complexos de controle, pois esses são capazes de aproximar as relações dinâmicas entre as variáveis de causa e efeito. Estratégias utilizando técnicas combinadas de inteligência artificial são avanços que ainda possuem grande potencial de exploração. Este trabalho consiste na implementação e avaliação de desempenho de uma estratégia de controle baseado no conhecimento prévio do modelo, para isso utiliza-se uma rede neural treinada como modelo empírico do processo. Este documento reflete apenas uma parcela do trabalho desenvolvido no Programa PRH34 e consiste do cumprimento da última relativa a formação de Engenheiro Químico especialista em Petróleo e Gás. 6

Ensaios experimentais foram conduzidos em escala piloto de laboratório, objetivando controle de temperatura de um reator. O modelo empírico foi representado por uma rede neural feedforward, com treinamento off-line. Os resultados demonstram que a estratégia apresenta desempenho satisfatório para mudanças entre set points e perturbações de carga, mantendo a variável controlada na referência desejada. 7

INTRODUÇÃO 1.1 - A indústria petroquímica: conceituação Petróleo e gás natural são normalmente percebidos pelo grande público como sendo essencialmente fontes primárias de combustíveis, seja para uso em meios de transporte na forma de gasolina, diesel ou mesmo gás, seja para geração de energia para uso industrial por combustão em fornos e caldeiras. Todavia, nem todos têm presente que é também do processamento inicial desses mesmos recursos naturais que provêm às matérias-primas básicas de um dos pilares do sistema industrial moderno, a indústria petroquímica. Partindo geralmente ou da nafta, que é uma fração líquida do refino do petróleo, ou do próprio gás natural tratado, os sofisticados processos petroquímicos são capazes de quebrar, recombinar e transformar as moléculas originais dos hidrocarbonetos presentes no petróleo ou no gás, gerando, em grande escala, uma diversidade de produtos, os quais, por sua vez, irão constituir a base química dos mais diferentes segmentos da indústria em geral. Atualmente, é possível identificar produtos de origem petroquímica na quase totalidade dos itens industriais consumidos pela população tais como embalagens e utilidades domésticas de plástico, tecidos, calçados, alimentos, brinquedos, materiais de limpeza, pneus, tintas, eletroeletrônicos, materiais descartáveis e muitos outros. Tipicamente, podem ser distinguidos três estágios, ou gerações, industriais na cadeia da atividade petroquímica, como pode-se observar na Figura 1.01: (1) indústrias de 1 a geração, que fornecem os produtos petroquímicos básicos, tais como eteno, propeno, butadieno, etc; (2) indústrias de 2 a geração, que transformam os petroquímicos básicos nos 8

chamados petroquímicos finais, como polietileno (PE), polipropileno (PP), polivinilcloreto (PVC), poliésteres, óxido de etileno etc.; (3) indústrias de 3 a geração, onde produtos finais são quimicamente modificados ou conformados em produtos de consumo. A indústria do plástico é o setor que movimenta a maior quantidade de produtos fabricados com materiais petroquímicos. FIGURA 1.01: ILUSTRAÇÃO DAS GERAÇÕES EXISTENTES NA INDÚSTRIA PETROQUÍMICA. Em geral, a competitividade da indústria petroquímica está criticamente associada a fatores como grau de verticalização empresarial, grandes economias de escala, disponibilidade e garantia de fornecimento de matéria-prima, altos investimentos em tecnologia e logística de distribuição de produtos. Tais fatores fazem com que o segmento petroquímico seja um campo onde jogam apenas empresas de grande porte, as mais importantes com elevado grau de internacionalização das atividades. A manutenção da competitividade exige que as modernas indústrias petroquímicas estejam em freqüente modernização para corresponder às exigências mercadológicas de produção com menor custo e elevada qualidade. Hoje, no Brasil, temos três pólos petroquímicos: - O Pólo Petroquímico de São Paulo está localizado nas cidades de Santo André e Cubatão, no estado de São Paulo. A Petroquímica União (São Paulo) 9

iniciou suas operações em 1972, tem a capacidade de produção instalada de 500 mil toneladas por ano de eteno e tem quarenta indústrias de segunda geração. - O Pólo Petroquímico de Camaçari está localizado em Camaçari, na Bahia. A COPENE (Companhia Petroquímica do Nordeste) iniciou suas operações em 1978, tem a capacidade de produção instalada de 1,2 milhão de toneladas por ano de eteno e tem 423 indústrias de segunda geração. - O Pólo Petroquímico do Sul está localizado na cidade de Triunfo, no Rio Grande do Sul. A COPESUL (Companhia Petroquímica do Sul) iniciou suas operações em 1982, tem a capacidade de produção instalada de 1,135 milhão de toneladas por ano de eteno e tem oito indústrias de segunda geração. m 3 10.000.000 9.000.000 8.000.000 7.000.000 6.000.000 5.000.000 4.000.000 3.000.000 2.000.000 1.000.000 0 2000 2001 2002 2003 2004 Janeiro Fevereiro Março Abril Maio Junho Julho Agosto Setembro Outubro Novembro Dezembro Ano FIGURA 1.02: PROCESSAMENTO MENSAL DE PETRÓLEO NAS REFINARIAS DO BRASIL. Fonte: Agênica Nacional de Petróleo. 10

Na Figura 1.02 consta dados da Agência Nacional de Petróleo referente ao processamento de petróleo nas Refinarias Brasileiras entre o período de janeiro de 2000 a março de 2004. 1.2 Controle de Processos na Indústria Petroquímica O preço do petróleo está associado ao valor que pode agregar a ele sendo função da densidade e ponto de ebulição. Processos sob rigoroso controle, mantendo os produtos dentro das especificações desejadas, são de extremo interesse para esse segmento. Unidades petroquímicas abrangem processos físico-químicos de transformação que apresentam fortes não-linearidades, além de múltiplos estados de equilíbrio. Ainda, para processos contínuos, alguns destes estados de equilíbrio são instáveis em malha aberta. Mesmo assim, grande parte dos estudos realizados em controle de processos de aplicações industriais são tipicamente feitos por controladores lineares baseados em modelos linearizados, ou ainda em controladores clássicos, como o PID. Contudo, sabe-se que teorias de controle linear são válidas somente para as vizinhanças de um ponto operacional e, para sistemas com fortes nãolinearidades, como é o caso da maioria dos processos químicos, a fronteira de aplicação do modelo linear em torno de um ponto torna-se muito pequena, ou seja, métodos baseados em controle linear podem não apresentar bons resultados (CANCELIER et al., 2004). O sistema de controle baseado em modelos tem demonstrado ser bastante eficiente em processos químicos, especialmente em processos com fortes interações entre entrada e saída, tempo morto elevados, além de restrições físicas em suas variáveis (GARCÍA et al., 1989). Por exemplo, reatores de polimerização onde a temperatura possui grande influência sobre 11

a cinética de reação e distribuição dos pesos moleculares do polímero, ou seja, possui efeito direto sobre suas propriedades, portanto, esta é uma variável que se deseja controlar. Para o propósito da aplicação de estratégias de controle, os modelos matemáticos de processos podem ser apresentados em diferentes formatos, contanto que possam se utilizados para prover previsões úteis, significantes e fidedignas do comportamento do processo. É bem estabelecido já que modelos fenomenológicos normalmente fornecem uma descrição mais precisa do processo, especialmente para extrapolações e que modelos empíricos são de mais fácil obtenção e manipulação durante aplicações on line em tempo real, principalmente quando a obtenção de dados experimentais é facilitada (VIEIRA et al., 2003). Por esta razão, algumas aplicações exigem uma otimização/adaptação do modelo desenvolvido e eventualmente o uso de estruturas híbridas, que levam em consideração o conhecimento empírico mais o conhecimento fenomenológico, podem sem consideradas. De forma a superar as dificuldades no desenvolvimento de modelos mecanísticos, modelos empíricos baseados em redes neurais estão sendo utilizados, tanto para fins de modelagem e otimização de processos, quanto para a construção de estratégias de controle (CANCELIER et al., 2004). Principalmente quando o sistema tratado possui fortes não linearidades, as redes neurais tem encontrado grande aplicação para sua identificação e modelagem. O único inconveniente para a aplicação de redes neurais é a necessidade de grande número de dados experimentais para o seu treinamento. Quando se possui limitado número de pontos experimentais, geralmente o treinamento convencional tende levar ao sobretreinamento, o que faz com que a rede tenha pouca capacidade de. 12

1.3 Apresentação do trabalho Conforme supracitado, a necessidade de sistemas de controle complexos e a grande interação existente entre os processos encontrados em uma refinaria ou unidades petroquímicas, motiva o desenvolvimento do presente trabalho. Para facilidade de apresentação, este documento está dividido em introdução, uma revisão bibliográfica cuja finalidade é apresentar as propostas de aplicação de estratégias de controle baseados em modelos neurais, a metodologia da análise experimental, os resultados encontrados e as conclusões pertinentes. A metodologia foi estabelecida de modo a simular um operação de uma estratégia de controle baseado em modelo, representado neste trabalho por um rede neural, em um sistema de aquecimento/resfriamento de um tanque típicos da indústria petroquímica: um reator operando sob regime de batelada. 13

REVISÃO BIBLIOGRÁFICA 2.1 Introdução Neste capítulo descreve-se uma revisão sobre redes neurais, abrangendo conceituação, propriedades e aplicações industriais. Ainda, sobre algoritmos de treinamento. Objetiva-se detalhar a proposta de controle a ser trabalhada nos capítulos subseqüentes e argumentar seu pretexto. 2.2 Redes Neurais Artificiais O trabalho em redes neurais artificiais, usualmente denominadas redes neurais, tem sido motivado desde o começo pelo reconhecimento de que o cérebro humano processa informações de uma forma inteiramente diferente do computador digital convencional. O cérebro é um computador (sistema de processamento de informação) altamente complexo, não-linear e paralelo (HAYKIN,1999). Ele tem a capacidade de organizar seus constituintes estruturais, conhecidos como neurônios, de forma a realizar certos processamentos (p. ex., reconhecimento de padrões, percepção e controle motor) muito mais rapidamente que o mais rápido computador digital hoje existente. Um neurônio em desenvolvimento é sinônimo de um cérebro plástico: a plasticidade permite que o sistema nervoso em desenvolvimento se adapte ao meio ambiente. Assim como a plasticidade parece ser essencial para o funcionamento dos neurônios como unidades de processamento de informação do cérebro humano, também ela o é com relação às redes neurais construídas com neurônios artificiais. Na sua forma mais geral uma rede 14

neural é uma máquina que é projetada para modelar a maneira como o cérebro realiza uma tarefa particular ou função de interesse. HAYKIN, 1999, fornece a seguinte definição de rede neural: Uma rede neural é um processador maciça e paralelamente distribuído constituído de unidades de processamento simples, que têm a propensão natural para armazenar conhecimento experimental e torná-lo disponível para o uso. A Rede neural se assemelha ao cérebro em dois aspectos: i. O conhecimento é adquirido pela rede a partir de seu ambiente através de um processo de aprendizagem. ii. Forças de conexão entre neurônios, conhecidas como pesos sinápticos, são utilizados para armazenar o conhecimento adquirido. O procedimento utilizado para realizar o processo de aprendizagem é chamado de algoritmo de aprendizagem, cuja função é modificar os pesos sinápticos da rede de uma forma ordenada para alcançar um objetivo de projeto desejado. Geralmente objetiva a minimização de uma função de erro quadrático. A modificação dos pesos sinápticos é o método tradicional para o projeto de redes neurais. Esta abordagem é bastante próxima da teoria dos filtros adaptativos lineares, que já está bem estabelecida e foi aplicada com sucesso em diversas áreas (WIDROW e STEARNS, 1985; HAYKIN,1996). Entretanto, é possível também para uma rede neural modificar sua própria topologia, o que é motivado pelo fato de os neurônios no cérebro humano poderem morrer e que novas conexões sinápticas possam crescer. 15

2.2.1 - Benefícios das redes neurais É evidente que uma rede neural extrai seu poder computacional através, primeiro, de sua estrutura maciçamente paralelamente distribuída e, segundo, de sua habilidade de aprender e, portanto de generalizar. A generalização se refere ao fato de a rede neural produzir saídas adequadas para entradas que não estavam presentes durante o treinamento (aprendizagem). Estas duas capacidades de processamento de informação tornam possível para as redes neurais resolver problemas complexos que são atualmente intratáveis. Na prática, contudo, as redes neurais não podem fornecer uma solução trabalhando individualmente. Em vez disso, elas precisam ser integradas em uma abordagem consistente de engenharia de sistemas. Especificamente, um problema complexo de interesse é decomposto em um número de tarefas relativamente simples, e atribui-se a redes neurais um subconjunto de tarefas que coincidem com as suas capacidades inerentes. O uso de redes neurais oferece as seguintes propriedades úteis: 1. Não-linearidade. Um neurônio artificial pode ser linear ou não-linear. Uma rede neural, constituída por conexões de neurônios não-lineares é ela mesma não-linear. Além disso, a não linearidade é de um tipo especial, no sentido de ela ser distribuída por toda a rede. A não-linearidade é uma propriedade muito importante, particularmente se o mecanismo físico responsável pela geração do sinal de entrada for inerentemente não-linear; 2. Mapeamento de entrada-saída. Apresenta-se para a rede um exemplo escolhido ao acaso do conjunto, e os pesos sinápticos (parâmetros livres) da rede são modificados para minimizar a diferença entre a resposta desejada e a resposta real da rede, produzida pelo sinal de entrada, de acordo com um critério estatístico apropriado. O treinamento da rede é repetido para muitos 16

exemplos do conjunto até que a rede alcance um estado estável onde não haja mais modificações significativas nos pesos sinápticos.(o treinamento e aprendizado da rede é tratado seção 2.2.7); 3. Adaptabilidade. As redes neurais têm uma capacidade inata de adaptar sues pesos sinápticos a modificação do meio ambiente. Em particular, uma rede neural treinada para operar em um ambiente específico pode ser facilmente retreinada para lidar com pequenas modificações nas condições operativas do ambiente. Além disso, quando está operando em um ambiente não-estacionário (i.e., onde as estatísticas mudam com o tempo), uma rede neural pode ser projetada para modificar seus pesos sinápticos em tempo real. A arquitetura natural de uma rede neural para classificação de padrões, processamento de sinais e aplicações de controle, aliada à capacidade de adaptação da rede, a torna uma ferramenta muito útil para classificação adaptativa de padrões, processamento adaptativo de sinais e controle adaptativo. Como regra geral, pode-se dizer que quanto mais adaptativo se fizer um sistema, assegurando-se de que o sistema se mantenha estável, mais robusto tenderá a ser o seu desempenho quando o sistema for exigido a operar em um ambiente não-estacionário. Contudo, deve ser enfatizado, que adaptabilidade nem sempre resulta em robustez; na verdade pode resultar no contrário. Um sistema adaptativo com constantes de tempo pequenas, por exemplo, pode se modificar rapidamente e assim tender a responder a perturbações não legítimas, causando uma drástica degradação no desempenho do sistema. Para aproveitar todos os benefícios da adaptabilidade, as constantes de tempo principais do sistema devem ser grandes o suficiente para que o sistema ignore perturbações espúrias, mas ainda assim serem suficientemente pequenas para responder a mudanças significativas no ambiente; 17

4. Resposta a evidências. No contexto de classificação de padrões, uma rede neural pode ser projetada para fornecer informação não somente sobre qual padrão particular selecionar, mas também sobre a confiança ou crença na decisão tomada. Esta última informação pode ser utilizada para rejeitar padrões ambíguos, caso eles estejam presentes, e com isso melhorar o desempenho de classificação da rede; 5. Informação contextual. O conhecimento é representado pela própria estrutura e estado de ativação de uma rede neural. Cada neurônio de rede é potencialmente afetado pela atividade de todos os outros neurônios da rede. Conseqüentemente, a informação contextual é tratada naturalmente pela rede neural; 6. Tolerância a falhas. Uma rede neural, implementada na forma física (em hardware), tem o potencial de ser inerentemente tolerante a falhas, ou capaz de realizar computação robusta, no sentido de que seu desempenho se degrada suavemente sob condições de operação adversas. Se um neurônio ou suas conexões é danificado, por exemplo, a recuperação de um padrão armazenado é prejudicada em qualidade. Contudo, devido à natureza distribuída da informação armazenada na rede, o dano deve ser extenso para que a resposta global da rede seja degradada seriamente. Assim, a princípio, uma rede neural exibe uma degradação suave do desempenho em vez de apresentar uma falha catastrófica; 7. Implementação em VLSI. A natureza maciçamente paralela de uma rede neural a faz ser potencialmente rápida na computação de certas tarefas. Esta mesma característica torna uma rede neural adequada para 18

implementação utilizando tecnologia de integração em escala muito ampla. Uma virtude benéfica particular da tecnologia VLSI (very-large-scaleintegration) é que ela fornece um meio de captar comportamentos realmente complexos de uma forma altamente hierárquica; 8. Uniformidade de análise e projeto. Basicamente, as redes neurais desfrutam de universalidade de como processadores de informação. Dizemos isso no sentido de que a mesma notação é utilizada em todos os domínios envolvendo a aplicação de redes neurais. Esta característica se manifesta de diferentes modos: Os neurônios de uma forma ou de outra representam um ingrediente comum a todas as redes neurais; Esta uniformidade torna possível compartilhar teorias e algoritmos de aprendizagem em aplicações diferentes de redes neurais; Redes modulares podem ser construídas através de uma integração homogênea de módulos; 9. Analogia Neurobiológica. O projeto de uma rede neural é motivado pela analogia com o cérebro, que é uma prova viva de que o processamento paralelo tolerante a falhas é não somente possível fisicamente, mas também rápido e poderoso. Os neurobiólogos olham para as redes neurais (artificiais) como uma ferramenta de pesquisa para a interpretação de fenômenos neurobiológicos. Por outro lado, os engenheiros olham para a neurobiologia procurando novas idéias para resolver problemas mais complexos do que aqueles baseados em técnicas convencionais de projeto por conexões fixas. 19

2.2.2 - Cérebro Humano O sistema nervoso pode ser visto como um sistema de três estágios, como mostrado no diagrama em blocos na Figura 2.1. O centro do sistema é o cérebro, representado pela rede neural (nervosa), que recebe continuamente informação, percebe-a e toma decisões apropriadas. Dois conjuntos de setas são mostrados na Figura 2.1. Aquelas que apontam da esquerda para a direita indicam a transmissão para frente do sinal portador de informação no sistema. Os receptores convertem estímulos do corpo humano ou do ambiente externo em impulsos elétricos que transmitem informação para a rede neural (cérebro). Os atuadores convertem impulsos elétricos gerados pela rede neural em respostas discerníveis como saídas do sistema. Estímulo Receptores Rede neural Atuadores Resposta FIGURA 2.01: REPRESENTAÇÃO EM DIAGRAMA EM BLOCOS DO SISTEMA NERVOSO. As sinapses são unidades estruturais e funcionais elementares que medeiam as interações entre os neurônios. A maioria dos neurônios codifica suas saídas como uma série de pulsos breves de tensão. Estes pulsos, usualmente conhecidos como potenciais de ação ou impulsos, originam-se no corpo celular de neurônios, e então se propagam através dos neurônios individuais a velocidade e amplitude constantes. As razões para o uso de 20

potenciais de ação para a comunicação entre neurônios se baseiam na física dos axônios. O axônio de um neurônio é muito longo e fino e é caracterizado por uma alta resistência elétrica e uma capacitância muito grande. Estes dois elementos estão distribuídos ao longo do axônio. O axônio pode assim ser modelado como uma linha de transmissão RC, daí o uso comum da equação de linha como termologia para descrever a propagação do sinal ao longo do axônio. No cérebro há organizações anatômicas tanto em pequena escala e em grande escala, e funções diferentes ocorrem nos níveis mais baixos e nos mais altos. A Figura 2.02 mostra uma hierarquia de níveis entrelaçados de organização, emergente do extenso trabalho sobre a análise de regiões localizadas no cérebro. As sinapses representam o nível mais fundamental, dependente de moléculas e íons para sua ação. Nos níveis seguintes, temos os microcircuito neural se refere a um agrupamento de sinapses organizadas em padrões de conectividade para produzir uma operação funcional de interesse. É importante reconhecer que os níveis estruturais de organização descritos aqui são uma característica única do cérebro. Eles não são encontrados em lugar algum em um computador digital, e não estamos próximos de recriá-los com redes neurais artificiais. Apesar disso, HAYKIN, 2001, diz estarmos avançando gradualmente no caminho de uma hierarquia de níveis computacionais similar àquela descrita na Figura 2.02. Os neurônios artificiais que utilizamos para construir nossas redes neurais são realmente primitivos em comparação com aqueles encontrados no cérebro. 21

Sistema Nervoso Central Circuitos Inter-regionais Circuitos Locais Neurônios Árvores Dendritais Microcircuitos Neurais Sinapses Moléculas FIGURA 2.02: ORGANIZAÇÃO ESTRUTURAL DOS NÍVEIS DO CÉREBRO. Fonte: HYAKIN, 2001. 2.2.3 - Modelos de um Neurônio Um neurônio é uma unidade de processamento de informação que é fundamental para a operação de uma rede neural. O diagrama de blocos da Figura 2.03 mostra o modelo de um neurônio, que forma a base para o 22

projeto de redes neurais (artificiais). Aqui só se identificam três elementos básicos do modelo neuronal: FIGURA 2.03: MODELO NÃO-LINEAR DE UM NEURÔNIO. 1. Um conjunto de sinapses ou elos de conexão, cada uma caracterizada por um peso ou força própria.especificamente, um sinal x j na entrada da sinapse j conectada ao neurônio k é multiplicado pelo peso sináptico. É importante notar a maneira como são escritos os índices do peso sináptico w kj. O primeiro índice se refere ao neurônio em questão e o segundo se refere ao terminal de entrada da sinapse à qual o peso se refere. Ao contrário de uma sinapse do cérebro, o peso sináptico de um neurônio artificial pode estar em um intervalo que valores negativos bem como positivos. 2. Um somador para somar os sinais de entrada, ponderados pelas respectivas sinapses do neurônio; as operações descritas aqui constituem um combinador linear. 3. Uma função de ativação para restringir a amplitude da saída de um neurônio. A função de ativação é também referida como função 23

restritiva já que restringe (limita) o intervalo permissível de amplitude do sinal de saída a um valor finito (Seção 2.2.4 detalhada melhor as funções de ativação mais utilizadas). Tipicamente, o intervalo normalizado da amplitude da saída de um neurônio é escrito como o intervalo unitário fechado [0,1] ou alternativamente [-1,1]. O modelo neuronal da Figura 2.3 inclui também um bias aplicado externamente, representado por b k. O bias b k tem o efeito de aumentar ou diminuir a entrada líquida da função de ativação, dependendo se ele é positivo ou negativo, respectivamente. Em termos matemáticos, podemos descrever um neurônio k escrevendo o seguinte par de equações temos (2.1 e 2.2): u k = m j= 1 w kj x j (2.1) y = ϕ u + b ) (2.2) k ( k k onde: x 1,x 2,...x m são os sinais de entrada; w k1,w k2,...w km são os pesos sinápticos do neurônio k; u k é a saída do combinador linear devido aos sinais de entrada; b k é o bias; φ é a função de ativação; e y k é o sinal de saída do neurônio. O uso de bias b k tem o efeito de aplicar uma transformação afim à saída u k do computador linear no modelo da Figura 2.3 como mostrado pela Equação (2.3): v = u + b (2.3) k k k Em particular, dependendo se o bias b k é positivo ou negativo, a relação entre o campo local induzido ou potencial de ativação, v k, do neurônio k e a saída do combinador linear u k é modificada na forma ilustrada da 24

Figura 2.4. Note que como resultado desta transformação afim, o gráfico de v k em função de u k não passa mais pela origem. FIGURA 2.04: TRANSFORMAÇÃO AFIM PRODUZIDA PELA PRESENÇA DE UM BIAS. Note que v k = b k em u k = 0. O bias b k é um parâmetro externo do neurônio artificial k. Podemos considerar a sua presença como na Equação (2.2). Equivalentemente, podemos formular a combinação das Equações (2.1) até (2.3) como segue: v k = m j= 0 w kj x j (2.4) y k = ϕ v ) (2.5) ( k Na Equação. (2.4) adiciona-se uma nova sinapse. A sua entrada é escrita pela Equação (2.6), enquanto seu peso, pela Equação (2.7). x 0 = +1 (2.6) w k 0 = b k (2.7) 25

Podemos, portanto, reformular o modelo do neurônio k como na Figura 2.04. Nesta figura, o efeito do bias é levado em conta de duas maneiras: (1) adicionando-se um novo sinal de entrada fixo em + 1 e (2) adicionando-se um novo peso sináptico igual ao bias b k. Embora os modelos da Figuras 2.03 e 2.05 sejam diferentes na aparência, eles são matematicamente equivalentes. FIGURA 2.05: OUTRO MODELO NÃO-LINEAR DE UM NEURÔNIO. 2.2.4 - Tipos de Função de Ativação A capacidade de processamento de um neurônio está ligada ao modo como as informações são processadas. Um neurônio j em uma camada l recebe um estímulo, X l,j, e gera uma saída Y l,j. O estímulo recebido pelo neurônio j é a reunião de todas as saídas dos neurônios na camada l-1. Esta reunião é, normalmente, representada pela soma das saídas (Y) dos i neurônios na camada l-1. Finalmente, o neurônio j processa o sinal X l,j, através da função de ativação (também denominada função de transferência) e sua saída é enviada a todos os neurônios na camada l+1. 26

A escolha da função de ativação deve obedecer aos requisitos de continuidade, diferenciabilidade e monotonicidade. Algumas das funções de ativação mais utilizadas são listadas a seguir. a) Função Sigmoidal: Cuja derivada é descrita pela equação 2.9: 1 Y = f ( x) = (2.8) 1+ EXP( X ) dy df ( x) = = f ( x) ( 1 f ( x) ) = Y ( 1 Y ) (2.9) dx dx A Figura 2.06 mostra como a função sigmoidal responde a um estímulo x. 1 f(x) 0.5-0 + -6-4 -2 0 2 4 6 x FIGURA 2.06: FUNÇÃO DE TRANSFERÊNCIA SIGMÓIDE. A função sigmoidal é limitada entre zero e um, apresentando poucas variações quando seu valor se aproxima de um ou zero. Para evitar esta saturação, normalmente, o intervalo de trabalho é limitado entre 0,2 e 0,8. b). Função Tangente Hiperbólica, equação 2.10: 27

1 EXP( X ) f ( x) = tanh( x) = (2.10) 1+ EXP( X ) Cuja derivada é descrita pela equação 2.11: df ( x) = 1 ( f ( x) ) 2 (2.11) dx A função tangente hiperbólica possui propriedades semelhantes a sigmoidal, contudo seus limites são [ 1,1] ao invés de [0,1]. Na Figura 2.07, a seguir, a função tangente hiperbólica é apresentada. 1 f(x) 0.5-0 + -3-1 1 3-0.5-1 x FIGURA 2.07: FUNÇÃO DE TRANSFERÊNCIA TANGENTE HIPERBÓLICA. c) Função Gaussiana, representada pela equação 2.12: 2 f ( x) = EXP( X ) (2.12) Cuja derivada é descrita pela equação 2.13: 28

df ( x) = 2xf ( x) (2.13) dx A função Gaussiana é uma função de base radial limitada no intervalo [0,1]. O valor da f(x) (Figura 2.08) diminui à medida que x se distancia, tanto com valores positivos como negativos, a partir da origem do sistema Cartesiano. Podem ser formadas variações destas funções, ou novas funções, mantendo-se as restrições necessárias para as funções de ativação, contudo as funções listadas são as mais utilizadas, das quais a função sigmoidal é a que possui maior número de implementações de sucesso. 1 f(x) 0.5-0 + -3-1 1 3 x FIGURA 2.08: FUNÇÃO DE TRANSFERÊNCIA GAUSSIANA. 2.2.5 - Arquitetura da Rede Dentro das propriedades das redes neurais, um fator importantíssimo a ser considerado é a definição de seu tamanho. O tamanho é tecnicamente denominado arquitetura ou topologia. A arquitetura de uma rede compreende o número de camadas de neurônios, a função de ativação utilizada e a disposição das conexões entre os neurônios em cada camada e 29

entre as camadas. A capacidade de armazenamento de informações de uma rede depende da arquitetura utilizada (HAYKIN, 2001): a) Camada de Entrada: responsável apenas por receber os padrões e transferi-los para a segunda camada, não é realizado processamento. Os neurônios desta camada, por apenas distribuir informações, são denominados neurônios inativos. Em uma rede neural artificial alimentada adiante, exceto os neurônios na camada de entrada, todos os demais são ativos. b) Camada(s) intermediária(s): responsáveis por processar as informações da camada anterior. Cada neurônio na segunda camada recebe as saídas da primeira camada multiplicadas pelos pesos, procede a somatória e em seguida o valor obtido é passado pela função de ativação. O resultado obtido é então passado à camada seguinte. c) Camada de Saída: na camada de saída são realizados os últimos processamentos e os resultados finais são obtidos. Em geral podemos identificar três classes de arquiteturas de rede de fundamentalmente diferentes: a) Redes Alimentadas Adiante com Camada Única Em uma rede neural em camadas, os neurônios estão organizados na forma de camadas. Na forma mais simples de uma rede em camadas, temos uma camada de entrada de nós de fonte (fornecem sinais de entrada) que se projeta sobre uma camada de saída de neurônios (nós computacional), mas não vice-versa. Em outras palavras, esta rede é estritamente do tipo alimentada adiante ou acíclica (em inglês, feedforward). Ela é ilustrada na Figura 2.9 para o caso de quatro nós tanto na camada de entrada como na de saída. Esta rede é chamada de rede de camada única, sendo que a 30

designação camada única se refere à camada de saída de nós computacionais (neurônios). Não contamos a camada de entrada de nós de fonte, porque lá não é realizada qualquer computação. FIGURA 2.09: REDE ALIMENTADA ADIANTE OU ACÍCLICA COM UMA ÚNICA CAMADA DE NEURÔNIO. b) Redes Alimentadas Diretamente com Múltiplas Camadas A segunda classe de uma rede neural alimentada adiante se distingue pela presença de uma ou mais camadas ocultas, cujos nós computacionais são chamados correspondentemente de neurônios ocultos ou unidades ocultas. A função dos neurônios ocultos é intervir entre a entrada externa e a saída da rede de maneira útil. Adicionando-se uma ou mais camadas ocultas, torna-se a rede capaz de extrair estatísticas de ordem elevada. Em um sentido bastante livre, a rede adquire uma perspectiva global apesar da sua conectividade local, devido ao conjunto extra de conexões sinápticas e da dimensão extra de interações neurais. A habilidade dos neurônios ocultos 31

extraírem estatísticas de ordem elevada é particularmente valiosa quando o tamanho da camada de entrada FIGURA 2.10: REDE ALIMENTADA ADIANTE OU ACÍCLICA TOTALMENTE CONECTADA COM UMA CAMADA OCULTA E UMA CAMADA DE SAÍDA. Os nós de fonte da camada de entrada da rede fornecem os respectivos elementos do padrão de ativação (vetor de entrada), que constituem os sinais de entrada aplicados aos neurônios (nós computacionais) na segunda camada (i.e., a primeira camada oculta). Os sinais de saída da segunda camada são utilizados como entradas para a terceira camada, e assim por diante para o resto da rede. Tipicamente, os neurônios em cada camada da rede têm como suas entradas apenas os sinais de saída da camada precedente. O conjunto de sinais de saída dos neurônios da camada de saída (final) da rede constitui a resposta global da rede para o padrão de ativação 32

fornecido pelos nós de fonte da camada de entrada (primeira). A Figura 2.10 mostra uma arquitetura de rede neural de múltiplas camadas. c) Redes Recorrentes Uma rede neural recorrente se distingue de uma rede neural alimentada adiante por ter pelo menos um laço de realimentação. Uma rede recorrente pode consistir, por exemplo, de uma única camada de neurônios com cada neurônio alimentando seu sinal de saída de volta para as entradas de todos os outros neurônios, como ilustrado na Figura 2.11. Na estrutura representada nesta figura, não há laços de auto-alimentação na rede; autoalimentada para a sua própria entrada. FIGURA 2.11: REDE RECORRENTE SEM LAÇOS DE AUTO-REALIMENTAÇÃO E SEM NEURÔNIOS OCULTOS. 33

2.2.6 - Inteligência Artificial e Redes Neurais O objetivo da inteligência artificial (IA) é o desenvolvimento de paradigmas ou algoritmos que requeiram máquinas para realizar tarefas cognitivas, para as quais os humanos são altamente melhores. Um sistema de IA deve ser capaz de três coisas: (1) armazenar conhecimento, (2) aplicar o conhecimento armazenado para resolver problemas e (3) adquirir novo conhecimento através da experiência. Um sistema IA tem três componentes fundamentais: representação, raciocínio e apredizagem: a) Representação. Provavelmente, a característica mais distintiva da IA seja o uso difundido de uma linguagem de estruturas simbólicas para representar tanto o conhecimento genérico sobre um domínio do problema de interesse como o conhecimento específico sobre a solução do problema; b) Raciocínio. Na sua forma mais básica, raciocínio é a habilidade de resolver problemas; c) Aprendizagem. No modelo de aprendizagem de máquina, o ambiente fornece alguma informação para um elemento de aprendizagem. Este utiliza, então, esta informação para aperfeiçoar a base de conhecimento, e finalmente o elemento de desempenho utiliza a base de conhecimento para executar a sua tarefa. 2.2.7 - O Aprendizado da Rede O aprendizado da rede caracteriza o método como os pesos (W L ) são ajustados para que um determinado grupo de entradas seja mapeado no grupo de saídas desejado. A idéia que circunda o chamado aprendizado, para esta classe de redes, é a idéia de associação. Por exemplo, um indivíduo 34

aquecendo um frasco com água tenta prever a temperatura em intervalos regulares de tempo. Este mesmo indivíduo, imagina que exista uma relação linear entre a temperatura e o tempo de aquecimento d água, e portanto prevê o valor futuro da temperatura a partir de um valor passado. Então o indivíduo começa o experimento e anota dados do Valor Previsto e Temperatura Correta nos devidos intervalos de tempo. Vamos considerar que este indivíduo tem interesse nas temperaturas entre 10 e 100 C. Ao final do processo o indivíduo observa os valores reais de temperatura e corrige seu modo de pensar baseado no erro entre o valor previsto e o correto. A correção dos pesos da rede é equivalente a corrigir o modo de pensar desta. A Figura 2.12 mostra uma rede feedforward com três camadas para realizar a tarefa à que o indivíduo mencionado se propôs. T t L 1 W 1... W 2 L 3 T t+δt FIGURA 2.12: PREVISÃO DA TEMPERATURA APÓS UM INTERVALO DE TEMPO ΔT. Para facilitar a compreensão, apenas três camadas de neurônios são mostradas nas Figuras 2.12 e 2.13. O aumento no número de camadas não aumenta a complexidade do algoritmo, visto que o processo de correção dos 35

pesos é idêntico para cada camada. A base para correção dos pesos é o erro entre a saída da rede e a saída desejada (valor correto). O método mais adotado na solução de problemas com rede neurai artificial feedforward FANN em engenharia química, tanto para a identificação/modelagem quanto para controle de processos é o algoritmo retropropagação de erro (backpropagation), que pelo uso extensivo dá nome a uma arquitetura própria, embora possua algumas limitações. Como principais vantagens do método pode-se citar sua fácil implementação e dedução, apresentando um paralelismo inerente às redes neurais, além de produzir bons resultados em diversas aplicações. Em contrapartida, esta metodologia tem sérios problemas de convergência por mínimos locais, é lenta no período de treinamento e possui uma certa dificuldade em se estabelecer o número de neurônios que cada camada intermediária de uma FANN deve conter. Entrada, Camada L 1 Pesos W 1 Novos Pesos Corrigir W 1 Camada L 2 Pesos W 2 Novos Pesos Corrigir W 2 Camada L 3 Saída Saída desejada Erro FIGURA 2.13: FLUXO DE INFORMAÇÕES PARA O AJUSTE DOS PESOS APÓS CADA PADRÃO. 36

2.2.8 - Algoritmo de Retropropagação de Erro As redes neurais de múltiplas camadas alimentadas adiante (feedforward network), consistem de um conjunto de unidades sensoriais (nós de fonte) que representam a camada de entrada, uma ou mais camadas ocultas de nós computacionais e uma camada de saída, como supracitado na seção 2.2.5. O sinal de entrada se propaga para frente através da rede, camada por camada.estas redes neurais são também chamadas de perceptrons de múltiplas camadas (MLP, multilayer perceptron). Os perceptrons de múltiplas camadas têm sido aplicados com sucesso para resolver diversos problemas difíceis, através do seu treinamento de forma supervisionada com um algoritmo muito conhecido como algoritmo de retropropagação de erro (error backpropagation). Este algoritmo é baseado na regra de aprendizagem por correção de erro. Como tal pode ser visto como uma generalização de um algoritmo de filtragem adaptativa igualmente conhecido: o onipresente algoritmo de mínimo quadrado médio (LMS) para o caso especial de um único neurônio linear. Basicamente, a aprendizagem por retropropagação de erro consiste de dois passos através das diferentes camadas da rede: um passo para frente, a propagação, e um passo para trás, a retropropagação. No passo para frente, um padrão de atividade (vetor de entrada) é aplicado aos nós sensoriais de rede e seu efeito se propaga através da rede, camada por camada. Finalmente, um conjunto de saídas é produzido como a resposta real da rede. Durante o passo de propagação, os pesos sinápticos da rede são todos fixos. Durante o passo para trás, por outro lado, os pesos sinápticos são todos ajustados de acordo com uma regra de correção de erro. Especificamente, a resposta real da rede é subtraída de uma resposta desejada (alvo) para produzir um sinal de erro. Este sinal de erro é então propagado para trás através da rede, contra a direção das conexões 37

sinápticas vindo daí o nome de retropropagação de erro. Os pesos sinápticos são ajustados para fazer com que a resposta real de rede se mova para mais perto da resposta desejada, em um sentido estatístico. O algoritmo de retropropagação de erro é também referido na literatura como algoritmo de retropropagação (backpropagation). O processo de aprendizagem realizado como algoritmo é chamado de aprendizagem por retropropagação. 2.3 - Modelagem de Processos Químicos utilizando conhecimento prévio de Redes Neurais Não linearidades, tempo morto e parâmetros que variam com o tempo são fatores que caracterizam a maioria dos processos químicos. Aliado a essas dificuldades intrínsecas ao processo tem-se, ainda, a exigência mercadológica de produção com menor custo e elevada qualidade. Esses fatores têm contribuído para que as indústrias optem por estratégias de controle preditivo e adaptativo, pois controladores clássicos a parâmetros constantes, nestes casos, apresentam desempenho limitado. Em grande parte dos processos industriais o uso dos procedimentos padrões de projeto de controladores preditivos apresentam dificuldades, pois dependem da modelagem matemática do processo que, em muitos casos, não é simples ou apresenta problemas na incorporação de informações disponíveis, a partir do conhecimento de especialistas. Nestes casos, técnicas de identificação baseadas em redes neurais têm sido aplicadas. Por causa da habilidade de aproximar funções complexas, as redes neurais artificiais (ANNs) têm sido explorada como modelo de processos químicos (THOMPSON, 1994). A vantagem principal de modelos de redes neurais é que elas podem ser sintetizadas sem conhecimento detalhado do 38

processo em questão. Apenas após apresentação das informações, a rede neural se comporta conforme especificação do processo em particular. Esta propriedade é comum a uma grande classe de modelos de forma funcional flexíveis, conhecidos como modelos não-paramétricos que incluem ANNs e série de Fourier, por exemplo. Porém, a grande dificuldade da utilização de uma ANN é a necessidade de um conjunto relativamente grande de dados de entrada/saída do processo para seu treinamento e que nem sempre estão disponíveis ou passíveis de obtenção. Neste trabalho, como modelo empírico para processo de reação em batelada, utilizou-se uma rede neural feedforward (FANN). Este tipo de rede está entre as mais estudadas em processos de engenharia, principalmente por ser de fácil compreensão e implementação computacional, com uma simples definição matemática e com grande capacidade para aplicações em identificação/modelagem e controle de processos. Considerando especificamente a aplicação da FANN para a modelagem/identificação empírica de sistemas, o número de neurônios da camada de entrada da rede depende do número de variáveis relevantes para representar o processo. O número de neurônios da camada de saída depende do número de variáveis que se deseja avaliar, que correspondem, na maioria das vezes, nas saídas processo que devem ser determinadas. Para o processo que se deseja modelar, reator em batelada sob agitação constante, a função que representa a rede pode ser descrita pela Equação 2.14: y ( k 1) = f [ y( k), y( k 1 ); U ( k d ) U ( k d )] + (2.14) 1 1, 2 2 onde f é a função que considera todos os processamentos da rede. U 1 (k-d 1 ) e U 2 (k-d 2 ) são, respectivamente, as entradas 1 e 2 do processo, com d 1 e d 2 sendo o tempo morto em relação a cada variável de entrada. y(k) e y(k-1) são, 39

respectivamente, as saídas do processo nos instantes k e k-1, de um sistema MISO (Multiple Input / Single Output). No sistema reator batelada estudado, a variável de saída de interesse é a temperatura de reação, y, sendo esta controlada pela manipulação das aberturas das válvulas de controle de vazão de vapor, U 1, e de controle de descarte de água quente da camisa e alimentação de água fria, U 2. Ainda, o sistema está sujeito às restrições descritas pelas Equações 2.15 e 2.16. 1volt U 1volt U 1 2 5volts 5volts (2.15) Temperatur a Mínima y Temperatura Máxima (2.16) Quando a abertura das válvulas for selecionada em 1 volt, significa que esta se encontra completamente fechada e 5 volts indicam 100% de abertura para as válvulas de controle de vazão. As restrições na temperatura obedecem aos limites físicos do sistema. Considerando que este não é dotado de sistema de refrigeração, a menor temperatura que se consegue é o equilíbrio com a temperatura ambiente, sendo a maior o ponto de ebulição da água, meio contínuo utilizado na polimerização em suspensão do estireno. 40

2.4 Considerações finais Levando-se em consideração as dificuldades existentes na obtenção de modelos que descrevam adequadamente o processo em todas as suas possíveis faixas de operação, este trabalho apresenta aplicações de uma rede neural. Como modelo empírico para o controle de temperatura de um reator de mistura em regime de batelada. 41

METODOLOGIA 3.1 - Unidades Experimentais Os experimentos foram desenvolvidos junto ao Laboratório de Controle de Processos do Departamento de Engenharia Química e Engenharia de Alimentos da Universidade Federal de Santa Catariana (EQA/CTC/UFSC). A implementação de um sistema de controle de temperatura foi realizada em um sistema piloto com um reator de aço, ilustrado na Figura 3.1. Essa unidade de reação é constituída, basicamente, de um reator encamisado em aço inox 316L, marca Suprilab Ltda, com capacidade de 5 litros e pressão máxima de 15 kg f /cm 2, provido de um sistema de agitação com acionamento por software, com um motor trifásico marca Eberle com saída reduzida em 1:5, um controlador de freqüência da marca Siemens e um agitador do tipo turbina dupla, centrada, que se estende até a base do reator. As trocas térmicas necessárias ao reator são realizadas por um trocador de calor a placas com correntes cruzadas, marca Alfa Laval, uma bomba centrífuga de ¼ cv, marca Schneider, modelo 02.01, além de duas válvulas pneumáticas do tipo igual porcentagem ar-abre/falha-fecha, da marca Badge Meter Inc, que são responsáveis pela dosagem das correntes quente e fria. Também faz parte do sistema um termopar do tipo J da marca Ecil em conjunto com um amplificador/transmissor, além de um reservatório de nitrogênio gasoso. A Figura 3.01 mostra o esquema da planta piloto utilizada para as reações de polimerização em suspensão do estireno e estudo/aplicação da estratégia de controle desenvolvida. Maiores detalhes sobre o reator podem ser observados na Figura 3.02. 42