RECONCILIAÇÃO ROBUSTA DE DADOS COM SELEÇÃO DE MODELO SIMULTÂNEA APLICADA AO CÁLCULO DA POTÊNCIA TÉRMICA DE UM REATOR NUCLEAR TIPO PWR.

Tamanho: px
Começar a partir da página:

Download "RECONCILIAÇÃO ROBUSTA DE DADOS COM SELEÇÃO DE MODELO SIMULTÂNEA APLICADA AO CÁLCULO DA POTÊNCIA TÉRMICA DE UM REATOR NUCLEAR TIPO PWR."

Transcrição

1 RECONCILIAÇÃO ROBUSTA DE DADOS COM SELEÇÃO DE MODELO SIMULTÂNEA APLICADA AO CÁLCULO DA POTÊNCIA TÉRMICA DE UM REATOR NUCLEAR TIPO PWR. Eduardo Damank Valdetaro da Slva Tese de Doutorado apresentada ao Programa de Pós-graduação em Engenhara Nuclear, COPPE, da Unversdade Federal do Ro de Janero, como parte dos requstos necessáros à obtenção do título de Doutor em Engenhara Nuclear. Orentador: Roberto Schrru Ro de Janero Março de 2012

2 RECONCILIAÇÃO ROBUSTA DE DADOS COM SELEÇÃO DE MODELO SIMULTÂNEA APLICADA AO CÁLCULO DA POTÊNCIA TÉRMICA DE UM REATOR NUCLEAR TIPO PWR. Eduardo Damank Valdetaro da Slva TESE SUBMETIDA AO CORPO DOCENTE DO INSTITUTO ALBERTO LUIZ COIMBRA DE PÓS-GRADUAÇÃO E PESQUISA DE ENGENHARIA (COPPE) DA UNIVERSIDADE FEDERAL DO RIO DE JANEIRO COMO PARTE DOS REQUISITOS NECESSÁRIOS PARA A OBTENÇÃO DO GRAU DE DOUTOR EM CIÊNCIAS EM ENGENHARIA NUCLEAR. Examnada por: Prof. Roberto Schrru, D.Sc. Prof. Eduardo Gomes Dutra do Carmo, D. Sc. Prof. Enrque Lus Lma, D.Sc. Prof. Hermes Alves Flho, D.Sc. Dr. Sérgo de Queróz Bogado Lete, Ph.D. RIO DE JANEIRO, RJ BRASIL MARÇO DE 2012

3 Slva, Eduardo Damank Valdetaro Reconclação Robusta de Dados com Seleção de Modelo Smultânea Aplcada ao Cálculo da Potênca Térmca de um Reator Nuclear Tpo PWR/ Eduardo Damank Valdetaro da Slva. Ro de Janero: UFRJ/COPPE, XIII, 99 p.: l.; 29,7 cm. Orentador: Roberto Schrru Tese (doutorado) UFRJ/ COPPE/ Programa de Engenhara Nuclear, Referencas Bblográfcas: p Reconclação de Dados. 2. Erros Grosseros 3. Seleção de Modelo 4. Enxame de Partícula (PSO). 5. Crtéro de Informação de Akake (AIC). 6. Crtéro de Informação de Akake Robusto (AICR). I. Schrru, Roberto. II. Unversdade Federal do Ro de Janero, COPPE, Programa de Engenhara Nuclear. III. Ttulo.

4 DEDICATORIAS À mnha esposa Mônca, aos meus flhos Júla e Gabrel. v

5 AGRADECIMENTOS Aos amgos Antôno Carlos Alves Lobo, Sergo Ayala e José Carlos Vanna da Rocha pela amzade e pelo nteresse, apoo e ncentvo demonstrados. À Ioná Maghal de Olvera e Andressa dos Santos Ncolau, colegas e alunas de doutorado do Programa de Engenhara Nuclear pelo apoo e ncentvo. Aos engenheros Edson Prado Azola, Marcelo Sampao e Déco Brandes, funconáros da Eletrobras Eletronuclear, pelo ncentvo e mportantes comentáros sobre o desempenho térmco e balanço de massa e energa em usnas nucleares e seus aspectos prátcos. Ao Superntendente da Usna de Angra 2, Físco Antôno Carlos Mazzaro, pelo ncentvo, nteresse e apoo para a realzação desta tese de doutorado e à Gerênca de Operação de Angra 2, na atual gestão, ao Eng. Fabano de Almeda Portugal e na gestão anteror, ao Eng. Anselmo Luz Barbosa de Carvalho e ao Eng. Rcardo Lus Perera dos Santos. A todos os amgos, funconáros e professores do Programa de Engenhara Nuclear, partcularmente do Laboratóro de Montoração de Processos (LMP/COPPE/PEN) pela atenção, apoo e ncentvos recebdos. Aos funconáros de todas as bblotecas da UFRJ, partcularmente aos funconáros da bbloteca do Centro de Tecnologa, pelo apoo na busca de bblografas necessáras ao desenvolvmento desta tese. A todos os funconáros da UFRJ e das nsttuções que mantém a nfra-estrutura que propca ao aluno a busca de trabalhos e artgos em peródcos em meo eletrônco, pos sem essa possbldade, o desenvolvmento deste trabalho talvez não fosse possível devdo à dstânca entre a COPPE/UFRJ e o meu local de trabalho. Ao meu orentador Prof. Roberto Schrru pelo profssonalsmo, apoo, ncentvo e amzade. Por fm, à mnha famíla, Mônca mnha esposa e aos meus flhos Júla e Gabrel pelo carnho e apoo demonstrado, pela pacênca e tempo dedcado para que eu pudesse realzar esse trabalho. Um agradecmento especal á mnha mãe, Neyde Damank, que entre dversos ensnamentos, me mostrou que a maor rqueza que temos é o conhecmento. v

6 Resumo da Tese apresentada à COPPE/UFRJ como parte dos requstos necessáros para a obtenção do grau de Doutor em Cêncas (D.Sc.) RECONCILIAÇÃO ROBUSTA DE DADOS COM SELEÇÃO DE MODELO SIMULTÂNEA APLICADA AO CÁLCULO DA POTÊNCIA TÉRMICA DE UM REATOR NUCLEAR TIPO PWR. Eduardo Damank Valdetaro da Slva Março / 2012 Orentador: Roberto Schrru Programa: Engenhara Nuclear Neste trabalho é desenvolvdo um método para a Reconclação de Dados e Identfcação de Erros Grosseros baseado na aplcação de estatístca robusta, utlzando especfcamente o estmador de três partes de Hampel e com a capacdade de realzar smultaneamente a seleção de modelo de probabldade, que corresponde à etapa de ajuste das constantes do estmador robusto. O método proposto utlza o algortmo PSO, na sua forma padrão, e pode ser aplcado na montoração on-lne", pos usa uma janela de tempo móvel de tamanho determnado. O prncípo básco do método é fundamentado na mnmzação do Crtéro de Informação de Akake Robusto (AICR), que é própro para uso com estmadores robustos. O desenvolvmento teórco ndcou a aplcabldade do método e o mesmo fo testado por meo de smulação em um processo usado em dversos trabalhos com modelos benchmark e em caso um exemplo obtdo na norma VDI-2048 que fornece dretrzes para aplcação do método clássco de reconclação de dados em plantas com geração nuclear. Uma aplcação prátca com dados reas da Usna Nuclear de Angra 2 é apresentada e corresponde ao cálculo da potênca térmca de um reator nuclear tpo PWR. Os resultados smulados e expermentas observados corroboram a proposta do método aqu desenvolvdo e possuem desempenhos efetvos. v

7 Abstract of Thess presented to COPPE/UFRJ as a partal fulfllment of the requrements for the degree of Doctor of Scence (D.Sc.) SIMULTANEOUS ROBUST DATA RECONCILIATION AND MODEL SELECTION APPLIED TO A PWR NUCLEAR REACTOR POWER CALCULATION. Eduardo Damank Valdetaro da Slva March / 2012 Advsor: Roberto Schrru Department: Nuclear Engneerng In ths work, a method for Robust Data Reconclaton and Gross Error Identfcaton based on Robust Statstcs s developed. The Hampel s three part estmator s used and the method proposed heren s able to smultaneously select a model among a famly of possble estmators of the same type, whch correspond to automatcally adjust the estmator constants. The presented procedure s based on the drect mnmzaton of the Robust Akake Crtera (AICR), whch s the exact counterpart of the Akake Informaton Crtera when usng Robust Estmators. The standard PSO algorthm s used as a global optmzer and can be used n On-Lne montorng, due to a movng wndow strategy. The method s tested n a benchmark smulated process used by several authors and n an example from VDI-2048 standard, whch gve drecton for data reconclaton mplementaton n NPPs. Fnally, the proposed procedure s tested n a smplfed mass balance wth real data from Angra 2 NPP and the results shows that the method s effectve. v

8 SUMÁRIO Capítulo 1 Introdução Motvação e Objetvo Estrutura Capítulo 2 - Cálculo da Potênca Térmca do Reator Introdução Controle de Carga e Determnação da Potênca Térmca do Reator Cálculo do Balanço de Massa Capítulo 3 Reconclação de Dados e Identfcação de Erros Grosseros Introdução Reconclação de Dados Clássca Determnação da matrz de covarânca verdadera Intervalo de Confança Aplcação da Reconclação de Dados Clássca Identfcação de Erros Grosseros Cálculo do Vetor de Correção e da Matrz de Covarânca dos Valores Corrgdos Fundamentos e Consderações sobre outros Métodos de Reconclação de Dados e Identfcação de Erros Grosseros Capítulo 4 Estatístca Robusta e Estmadores Robustos Introdução Estatístca Robusta e Estmadores Robustos Estmador Robusto Redescendente de Três Partes de Hampel Dferentes Crtéros para Identfcação de Erros Grosseros Ajuste do Estmador Redescendente de Hampel v

9 4.6 Consderações sobre os Estmadores Robustos e o Método de Ajuste das Constantes do Estmador Redescendente de Hampel Algortmo de Otmzação por Enxame de Partículas Capítulo 5 Reconclação Robusta de Dados com Seleção de Modelo de Probabldade Smultânea Introdução Crtéro de Informação de Akake Robusto Método smultâneo para Reconclação Robusta de Dados, Identfcação de Erros Grosseros e Seleção de Modelo baseado no Crtéro de Informação de Akake Robusto (AICR) Consderações sobre o Método de Reconclação Robusta de Dados com Seleção de Modelo Smultânea (RDSMS) Capítulo 6 Resultados Introdução Exemplo Não lnear (PAI e FISHER, 1988) Exemplo de Cálculo da Potênca do Reator baseado na norma VDI Consderações sobre o Cálculo da Potênca Térmca do Reator Cálculo da Potênca Térmca do Reator com Dados Reas obtdos na Usna Nuclear de Angra Balanço de Massa Smplfcado da Usna de Angra Capítulo 7 Conclusões Introdução Conclusões Geras Sugestões para Trabalhos Futuros x

10 Capítulo 08 Referêncas Bblográfcas x

11 NOMENCLATURA Símbolos Descrção P t Potênca Térmca do Reator [MWt] P Rt Potênca Térmca do Reator Reconclada [MWt] Q GV Carga térmca do GV [MWt] m ag Vazão Total de Água de Almentação Prncpal [Kg/s] h s Entalpa do fludo na saída do GV [Btu/Kg.s] h e Entalpa do fludo na entrada do GV [Btu/Kg.s] m GV1 Vazão de vapor do Gerador de Vapor 1 [Kg/s] m GV2 Vazão de vapor do Gerador de Vapor 2 [Kg/s] m ag1 Vazão de água de almentação 1 [Kg/s] m ag2 Vazão de água de almentação 2 [Kg/s] m v Vazão total de vapor [Kg/s] m c Vazão de Condensado [Kg/s] m A7 Vazão da extração A7 [Kg/s] m A6 Vazão da extração A6 [Kg/s] m A5 Vazão da extração A5 [Kg/s] m HPC vazão de retorno de condensado de alta pressão [Kg/s] m a Vazão de vapor da turbna de alta para a de baxa [Kg/s] M x Vetor de varáves meddas x p u h g S X x n m p X Vetor de varáves estmadas Conjunto de parâmetros do problema Conjunto das varáves não meddas Conjunto de restrções de gualdades, Conjunto de restrções de desgualdade Matrz de covarânca estmada I-ésma varável medda Número de varáves meddas Número de amostras de uma determnada varável medda Fator ndcatvo da probabldade do ntervalo de confança Desvo padrão da varável x x

12 Sv υ x ~ Vetor de Correção ou de desvos Matrz de covarânca do erro Vetor de correção Vetor de meddas corrgdo ou reconclado. x Valor esperado da varável. h Tamanho da janela de tempo em amostras Sensbldade a erros grosseros Sensbldade em relação a desvos da medda Ponto de rejeção ponto de ruptura do estmador a, b e c Constantes de ajuste do estmador de três partes de Hampel n o P P g w c 1 c 2 X e X opt Número de erros grosseros Vetor ndcando a melhor posção ndvdual (PSO) Vetor ndcando a melhor posção global (PSO) Fator de nérca do PSO Constante que ajusta o peso relatvo a componente do ndvíduo no PSO Constante que ajusta o peso relatvo a componente do grupo no PSO Componente relatva ao ruído aleatóro Componente relatva ao Erro Grossero Vetor ndcando valores exatos da solução Vetor ndcando valores calculados pelo método RDSMS x

13 Sglas AE AIC AICR EA EG ES GA GV HTPRE IEG IF LSE MAD mga MLE MLR MS NPP PSO PWR RD RDC RDSMS RRD SQP VA WLS Descrção (Descrção Orgnal) Análse Exploratóra Crtéro de Informação de Akake (Akake Informaton Crtera) Crtéro de Informação de Akake Robusto (Robust Akake Informaton Crtera) Erros Aleatóros Erros Grosseros Erros Sstemátcos Algortmo Genétco (Genetc Algorthm) Gerador de Vapor (Steam Generator) Estmador Redescendente de Três Partes de Hampel (Hampel s Three Part Redescendent Estmator) Identfcação de Erros Grosseros Função de Influênca (Influence Functon) Estmador de Mínmos Quadrados (Least Square Estmator) Desvo Absoluto da Medana (Medan Absolute Devaton) Algortmo Genétcos modfcado (Genetc Algorthm) Estmador de Máxma Verossmlhança (Maxmum Lkelhood Estmator) Retfcação por Máxma Verossmlhança (Maxmum Lkelhood Rectfcaton) Seleção de Modelo de Probabldade (Model Selecton) Usna Nuclear (Nuclear Power Plant) Algortmo de Enxame de Partículas (Partcle Swarm Algorthm) Reator à Água Pressurzada (Pressurzed Water Reactor) Reconclação de Dados Método de Reconclação de Dados Clássco Reconclação Robusta de Dados com Seleção de Modelo Smultânea Reconclação Robusta de Dados Programação Quadrátca Sucessva (Sucessve Quadratc Program) Varável Aleatóra Mínmos Quadrados Ponderados (Weghted Least Square) x

14 CAPÍTULO 1: INTRODUÇÃO 1.1 Motvação e Objetvo A utlzação da técnca de reconclação de dados (RD) e de Identfcação de Erros Grosseros (IEG) na ndústra químca e petroquímca é consderada como um ponto mportante na otmzação e montoração de processos. A mesma contnua em desenvolvmento desde que a técnca fo apresentada por KUEHN e DAVIDSON (1961), os quas são consderados como os precursores da aplcação do método de RD (MORAD et al., 2005). A aplcação da técnca de Reconclação de Dados permte reduzr a margem de erro na medção das varáves e parâmetros do processo, o que melhora a vsualzação do comportamento da planta e com uma medção mas precsa permte uma melhor tomada de decsão (PRATA, 2009). Em Usnas Nucleares o nteresse pela técnca de RD tem aumentado devdo à necessdade de se manter o balanço de massa e energa sob rgoroso controle e acompanhamento. O balanço de massa e de energa é um conjunto de equações elaborado a partr das les que regem os fenômenos físcos e químcos e descrevem o comportamento processo e o seu controle e acompanhamento permte obter dversos benefícos, como por exemplo, a melhora na tomada de decsão e a realzação de uma operação mas segura. Além desses benefícos podemos ctar o retorno fnancero dreto ou ndreto, que advém com o aumento da precsão da medda e dmnução da ncerteza na medção do estado da planta proporconada pelos métodos de Reconclação de Dados e Identfcação de Erros Grosseros. Na área nuclear, trabalhos de GRAUF et al. (2000), STREIT et al. (2005), JANSKY (2006, 2007), AZOLA et al. (2009) e VALDETARO e SCHIRRU (2011a, 1

15 2011b) ndcam que as técncas de RD e IEG aplcadas à ndústra nuclear podem trazer resultados concretos e de nteresse prátco. Notadamente, a determnação da potênca térmca do reator em uma Usna Nuclear de Potênca (NPP) é um assunto de mportânca e utlza os balanços de massa e de energa da planta. Seu cálculo é baseado na medção de vazão, cujas varáves meddas possuem erros de medção nerentes à nstrumentação utlzada e podem chegar a város níves percentuas (ANDRADE et al., 2002). Devdo a condções determnadas pelo órgão regulador, uma Usna Nuclear só pode operar dentro de lmtes pré-estabelecdos, que no caso da potênca térmca do reator, é de 100% com uma faxa de 2% de tolerânca. A operação dentro desses lmtes deve-se ao fato que no projeto da planta, fo feta uma análse do resframento de emergênca do núcleo do reator dentro dos lmtes menconados (STREIT et al., 2005). Dessa forma, a utlzação da técnca de reconclação de dados e a dentfcação de erros grosseros parecem ndcar um camnho, onde a dmnução da ncerteza ou aumento na exatdão e na precsão da medda permtrá uma margem maor e segura para a operação da usna com um nível de potênca maor e dentro dos patamares de segurança exgdos (STREIT et al., 2005). Durante a montoração da planta, as varáves de processo podem ser corrompdas por erros aleatóros (EA) ou erros grosseros (EG), também denomnados Erros Sstemátcos (ES). Essas ncertezas na medda podem afetar a operação segura do processo, bem como, mpedr o fechamento dos balanços de massa e energa ou afetar a qualdade dos dados utlzados por outras plantas, além de afetar o cálculo de desempenho do sstema (SODERSTROM et al., 2000). As meddas contamnadas por erros grosseros ou erros sstemátcos que não satsfazem as restrções do processo necesstam ser reconcladas, ou seja, os erros grosseros devem ser elmnados ou substtuídos e os valores meddos devem então ser corrgdos a fm de satsfazer as restrções relatvas ao processo de forma a mnmzar o erro quadrátco (TJOA e BIEGLER, 1991). A técnca de Reconclação de Dados e Estmação de Parâmetros é a técnca que realza esses ajustes e permte que se utlzem os valores reconclados como dados ou parâmetros do processo. 2

16 A técnca padrão ou clássca de Reconclação de Dados basea-se na determnação de vetor de correção para as meddas de processo a partr da mnmzação do erro quadrátco, sujeto as restrções das equações do processo. Nesse caso, pressupõe-se que as varáves estão contamnadas com um ruído que possu uma dstrbução de probabldade conhecda (p. ex., dstrbução Normal). A partr da estmatva da matrz de covarânca das varáves meddas do processo e de sua méda, pode-se estmar o vetor de correção para as meddas do processo. Após a aplcação dessa correção, os valores reconclados são então determnados. A Identfcação de Erros Grosseros (IEG) é feta por meo de testes estatístcos (TJOA e BIEGLER, 1991) e no método clássco é comum utlzar a matrz de covarânca do erro e testes de ch-quadrado para determnar um patamar que dentfque medções errôneas, as quas devem ser elmnadas antes de se aplcar a técnca de RD (VDI-2048, 2000), o que torna o processo de reconclação de dados um procedmento teratvo (TJOA e BIEGLER, 1991). Na formulação clássca do problema da reconclação de dados, quando a medda do erro possu função de dstrbução Normal, com méda nula e varânca conhecda, a função objetvo corresponde ao estmador de Máxma Verossmlhança (MLE) das meddas do processo (ARORA e BIEGLER, 2001). Os valores das meddas do processo podem estar contamnados por erros aleatóros ou possvelmente por erros sstemátcos ou erros grosseros. Erros aleatóros (EA) são aqueles que se manfestam como uma nfluênca ncontrolável e não tendencosa ou méda nula (VDI-2048, 2000). Erros Grosseros (EG) ou sstemátcos (ES) refletem tpcamente no processo como um desvo na medda ou uma perturbação no processo, que pode atngr uma ou mas varáves afetando negatvamente os valores reconclados (ARORA e BIEGLER, 2001; SODERSTROM et al., 2000; MEI et al., 2007). A complexdade do problema da Reconclação de Dados aumenta à medda que erros grosseros ou sstemátcos estão presentes na medda provenente do processo e causam uma estmação ncorreta do estado da planta (ARORA e BIEGLER, 2001). 3

17 Essa nfluênca adversa devdo à presença de erros grosseros acaba afetando o Estmador de Máxma Verossmlhança (MLE) devdo a sua falta de robustez, que no caso da RD clássca é o estmador de Mínmos Quadrados Ponderados (WLS). A robustez de um estmador está relaconada com a capacdade de um estmador em ldar com pequenos desvos do modelo probablístco real e seus desdobramentos e conseqüêncas e proporconar estmatvas estáves e confáves. No caso da RD clássca, a falta de robustez do estmador está relaconada com a possbldade de que apenas um erro grossero possa causar um desvo sgnfcatvo, desde que a magntude desse desvo seja grande o sufcente. Uma forma de ldar com esse problema é a utlzação de outros tpos de estmadores, que são mas aproprados para ldar com erros grosseros (ROUSSEEUW e LEROY, 1987). Devdo à ausênca de robustez de alguns estmadores a remoção préva de erros grosseros é uma parte fundamental no processo de reconclação de dados. A presença de erros aleatóros ou mesmo sstemátcos nas meddas do processo fazem com que não seja possível fechar os balanços de massa e de energa, os quas são representados por uma sére de equações ou nequações de restrções que descrevem as relações fundamentas do processo, como as relações de equlíbro do sstema (OZYURT e PIKE, 2004). Dessa forma, as técncas de reconclação de dados e Identfcação de Erros grosseros devem ser aplcadas a fm de remover esses erros, e que as meddas corrgdas ou valores reconclados, que satsfazem as restrções de processo, possam ser usadas na modelagem de parâmetros do processo. Extensos estudos já foram e tem sdo realzados com o ntuto de elmnar ou mtgar a nfluênca de erros aleatóros e prncpalmente erros grosseros. Métodos baseados em multplcadores de Lagrange ou Multplcadores de Lagrange combnados com matrz de projeção aplcados à reconclação de dados em estado permanente foram desenvolvdos, como os apresentados em CROWE et al. (1983) e SERTH e HEENAN (1986). PAI e FISHER (1988) propõem o uso do método de Broyden a fm de evtar repetdas vezes o calculo do Jacobano. TJOA e BIEGLER (1991) utlzaram programação quadrátca adaptada para aprovetar a estrutura da função objetvo, uma 4

18 função dstrbução bvarada. O erro grossero fo detectado por meo de testes estatístcos baseado na função de dstrbução combnada, o que permtu elmnar o processo teratvo de remoção de erros grosseros e em seguda aplcar o método de reconclação de dados (TJOA e BIEGLER, 1991; OZYURT e PIKE, 2004). Outras técncas para a realzação da reconclação de dados smultaneamente com a dentfcação de erros grosseros foram propostas como o método apresentado por YAMAMURA et al. (1988) para a detecção de erros grosseros baseado no Crtéro de Informação de Akake (AIC) e em uma estrutura com base em Mínmos Quadrados. O método de Branch and Bound fo utlzado para resolução do problema. A estratéga pode ser automatzada como sugerdo por SODERSTROM et al. (2000) usando programação ntera-msta (ARORA e BIEGLER, 2001). A técnca ctada acma mnmza uma função objetvo modfcada e adcona novas restrções de forma a consderar a detecção de erros grosseros mplícta na estratéga de reconclação de dados. Dada a natureza combnatóra do método, a sua performance ou desempenho é melhor quando o número de varáves é pequeno SODERSTROM et al. (2000). Em paralelo com dversos outros métodos, JOHNSTON e KRAMER (1995) ntroduzram uma nova abordagem para a reconclação de dados e dentfcação de erros grosseros denomnada Maxmum Lkelhood Rectfcaton ou Retfcação por Máxma Verossmlhança (MLR), a qual é baseada nos trabalhos prévos de HUBER (1981) e HAMPEL (1974) relaconados com Estmação Robusta, Regressão Robusta e Função de Influênca (IF). A abordagem proposta tem a vantagem de não dvdr as meddas em dferentes classes como alguns dos métodos prevamente apresentados e elmnou também a característca combnatóra de outros métodos, além de não necesstar qualquer procedmento teratvo para a detecção e elmnação de erros grosseros, corrgndo-os smultaneamente com o processo de reconclação de dados (JOHNSTON e KRAMER, 1995). Dversos outros métodos baseados em Estatístca Robusta foram posterormente desenvolvdos, ALBUQUERQUE e BIEGLER (1996) usam como função objetvo a função Far (Far Functon), um estmador robusto, que de acordo com suas propredades matemátcas pode reduzr os efetos causados por Erros Grosseros. A 5

19 presença de erros sstemátcos ou grosseros é determnada por meo de Análse Exploratóra (AE), que utlza, por exemplo, medanas, box plots, quarts e outros. Uma vez que a presença de erro grossero fo determnada, a sua confrmação pode ser obtda elmnando-se a medda e resolvendo o problema utlzando Mínmos Quadrados. ARORA e BIEGLER (2001) compararam o estmador robusto de três partes de Hampel com o M-estmador, a função Far, e concluram que o prmero é mas robusto e possu um ponto de corte que permte a aplcação do método smultaneamente com a reconclação de dados, dspensando anda o uso de Análse Exploratóra (ARORA e BIEGLER, 2001). De forma a ajustar as constantes do estmador redescendente de três partes de Hampel (HTPRE), um método de dos passos fo desenvolvdo. Esse ajuste procura ajustar o modelo de probabldade aos dados adqurdos do processo e é baseado na mnmzação do Crtéro de Informação de Akake (AIC). Apesar da efcênca do Estmador Redescendente apresentado em ARORA e BIEGLER (2001), um mportante aspecto é o ajuste das constantes dos estmadores robustos, especalmente os Estmadores Redescendentes, onde as constantes do modelo de probabldade devem ser ajustadas aos dados estatístcos a fm de que o mesmo estme o estado da planta de forma correta e balanceada (HAMPEL et al., 1986). O ajuste das constantes do estmador ou seleção de modelo (MS) pode ser feta de dversas formas, mas o prncípo é mnmzar o M-estmador, que é função do erro, a dferença entre o valor meddo e o valor estmado, em relação às constantes do M- estmador. Os M-estmadores em geral são obtdos usando o prncípo da Máxma Verossmlhança (Maxmum Lkelhood) e é da aplcação desse prncípo que advém a letra M de M-estmadores. Métodos baseados na estatístca robusta têm a vantagem de dmnur a nfluênca do erro grossero, sem a necessdade de utlzar os recursos da análse exploratóra (AE). Por outro lado, quando a função objetvo é um estmador robusto, a mesma pode ser não lnear e não convexa, o que traz a segunte dfculdade: a solução obtda com o algortmo de otmzação pode ser um mínmo local, dessa forma, pode ser necessáro recorrer a um método de otmzação global (ARORA e BIEGLER, 2001). 6

20 Assm, é possível vsualzar que métodos de otmzação baseados na teora evoluconára, como Algortmos Genétcos (GA), podem ser um camnho promssor quando aplcados à Reconclação Robusta de Dados (RRD) e Identfcação de Erros Grosseros devdo a suas característcas smples, que é o uso apenas de equações algébrcas e a ausênca do cálculo do Jacobano, como nos métodos precursores. Podemos ctar alguns exemplos extraídos da lteratura do uso do GA: MOROS et al. (1996) usaram o GA para gerar parâmetros ncas para um modelo cnétco de um processo catalítco e WONGRAT et al. (2005) aplcaram com sucesso um algortmo genétco modfcado (mga) proposto por WASANAPRADIT (2000) e aplcado à Reconclação de Dados Não Lnear. WONGRAT et al. (2005) assocaram a robustez dos M-estmadores e a relatva smplcdade do algortmo genétco (GA) e propuseram um algortmo genétco modfcado (mga). Esse algortmo apresentou bom desempenho e utlzou o Estmador Redescendente de Três Partes de Hampel (HTPRE). O ajuste das constantes do estmador redescendente fo realzado em dos passos dstntos, cujo procedmento fo mnmzar o Crtéro de Informação de Akake, de forma semelhante ao que fo apresentado em ARORA e BIEGLER (2001). Apesar da efetva aplcação de um algortmo evoluconáro (mga) à solução do problema de Reconclação de Dados e Identfcação de Erros Grosseros e da ausênca de cálculos complexos, o método pode levar um tempo longo nas smulações. Na perspectva de dmnur o tempo de cálculo, VALDETARO e SCHIRRU (2009) propuseram o uso do algortmo por enxame de partículas (PSO) em substtução ao algortmo genétco e utlzaram também o Estmador Redescendente de Três Partes de Hampel, onde o ajuste das constantes do estmador fo realzado de forma semelhante ao apresentado em WONGRAT et al. (2005) e ARORA e BIEGLER (2001). O ajuste fo realzado em dos passos. O prmero para ajustar o estmador robusto e o outro passo para soluconar o problema de reconclação de dados smultaneamente com a Identfcação de Erros Grosseros. Em VALDETARO e SCHIRRU (2009), os resultados também foram efetvos, ndcando um processamento mas rápdo do que o algortmo genétco modfcado e o foco desse trabalho fo desenvolver um método para posterormente aplcá-lo ao cálculo 7

21 da potênca térmca de um reator nuclear. Os resultados obtdos foram semelhantes aos exemplos propostos em WONGRAT et al. (2005) e PAI e FISHER (1988). No mesmo período, PRATA (2009) apresentou em sua tese de doutorado o uso do algortmo baseado em enxame de partículas (PSO) aplcado a reconclação de dados robusta e dnâmca utlzando o estmador de Welsch e em PRATA et al. (2009) a aplcação do PSO na reconclação de dados robusta e dnâmca, com função objetvo quadrátca, no senso de mínmos quadrados, em um reator ndustral de produção de polpropleno. Os resultados mostraram que o método é confável e efetvo, mesmo num cenáro de montoração on-lne e de tempo real. No trabalho de VALDETARO e SCHIRRU (2009), apesar do bom desempenho obtdo com o estmador redescendente de três partes de Hampel (HTPRE) na aplcação do método de reconclação de dados e Identfcação de Erros Grosseros em conjunto com o algortmo de enxame de partículas (PSO), o ajuste das constantes do estmador redescendente fo feta em dos passos dstntos e em separado do processo de reconclação de dados. Esse processo em separado e com duas fases consome muto tempo e é necessára a realzação de duas etapas de mnmzação para o correto ajuste do estmador e cálculo da RD e IEG. Por outro lado, verfcamos que o uso de um crtéro de nformação podera vr a ser um meo efetvo para a escolha de um modelo que se ajustasse a um conjunto de dados (HAMPEL et al., 1986), vsto que a prmera etapa ndcada acma é a de ajuste das constantes do estmador e baseada no Crtéro de Informação de Akake. Entretanto, o crtéro de nformação de Akake não é própro para o uso com estmadores robustos e as outras formas de ajustes das constantes de estmadores robustos que não utlzam crtéros de nformação, normalmente, fazem uso de smulação e do Método de Monte Carlo para obter os valores dessas constantes e das efcêncas relatvas dos estmadores robustos (OZYURT e PIKE, 2004). Em alguns estmadores (p. ex., função Far) o ajuste se dá pela efcênca assntótca, mas são aproxmações pouco precsas (OZYURT e PIKE, 2004), o que em ambos os casos pode não ser efcente. Assm, neste trabalho, o objetvo fo desenvolver um novo método que smultaneamente realzasse a Reconclação de Dados, a Identfcação de Erros Grosseros e a Seleção do Modelo, ou seja, o ajuste das constantes do estmador 8

22 robusto. O método proposto de Reconclação Robusta de Dados com Seleção de Modelo Smultânea (RDSMS) é baseado na mnmzação do Crtéro de Informação de Akake Robusto (AICR), o qual fo proposto por RONCHETTI (1985, 1997a) e é própro para uso com M-estmadores. O uso do AICR permte elmnar as etapas em separado de ajuste das constantes do estmador robusto como apresentado em métodos predecessores e permte fazer a sntona do estmador robusto baseado em um crtéro dreto. O método smultâneo para RD, IEG e MS utlza o estmador de três partes de Hampel na parte relatva ao ajuste do Crtéro de Informação de Akake Robusto na função objetvo com modfcações para ldar com os lmtes de valdade do estmador e o algortmo de enxame de partículas (Partcle Swarm Optmzaton ou PSO) para atuar como algortmo de otmzação global. O método fo aplcado a três exemplos, dos smulados e outro com dados reas de processo. Dos dos exemplos foram retrados da lteratura (VDI-2048, 2000; WONGRAT et al, 2005) e o tercero exemplo corresponde à aplcação do cálculo da potênca térmca do reator da Usna Nuclear de Angra Estrutura Esse trabalho está organzado de acordo com os tópcos apresentados a segur: Capítulo 2: Nesse capítulo será apresentado um sstema smplfcado do crcuto secundáro de uma usna nuclear do tpo PWR cujo modelo fo extraído da norma VDI-2048 (2000). O objetvo é fornecer uma vsão geral, embora smplfcada, sobre o cálculo da potênca térmca de um reator nuclear típco e serão apresentadas as equações necessáras para a realzação de um balanço de massa da planta a fm de se determnar a vazão de água de almentação corrgda e conseqüentemente a potênca térmca do reator. Aqu é ressaltada a mportânca de se ter os balanços de massa e energa sob estrto controle e exemplfcado os efetos da aplcação do método de Reconclação de Dados. 9

23 Capítulo 3: Será apresentado o problema da Reconclação de Dados e de Identfcação de Erros Grosseros com uma revsão bblográfca básca com o ntuto de apresentar os prncpas métodos de reconclação de dados e embasar a formulação do ajuste automátco proposto nessa tese. Consta desse capítulo a apresentação da solução clássca do problema de RD e IEG em regme estaconáro e a mportânca na determnação da matrz de covarânca do processo e do problema de otmzação envolvdo na RD. Capítulo 4: Nesse capítulo será apresentada uma vsão sucnta sobre estatístca robusta, em especal sobre os estmadores. Em seguda será apresentado o estmador robusto de três partes de Hampel na resolução do problema de Reconclação de Dados. Na tercera parte, será apresentado o método de ajuste do estmador de três partes de Hampel, baseado Crtéro de Informação de Akake. Na últma seção será apresentado o método de otmzação por Enxame de Partículas (PSO), que devdo as suas característcas é utlzado como um otmzador global e aplcado aos exemplos deste trabalho. Capítulo 5: Nesse capítulo será apresentado o método para Reconclação Robusta de Dados e Seleção de Modelo Smultânea (RDSMS) com utlzação do algortmo de otmzação por Enxame de Partículas (PSO). Capítulo 6: Nesse capítulo serão apresentados os resultados obtdos Capítulo 7: Nesse capítulo serão apresentadas as conclusões fnas e as consderações sobre a contrbução orgnal proposta neste trabalho e sugestões para trabalhos futuros. 10

24 CAPÍTULO 2: Cálculo da Potênca Térmca do Reator Introdução O objetvo deste capítulo é apresentar o método de cálculo da potênca térmca de um reator nuclear de uma usna do tpo PWR, como por exemplo, a Usna Nuclear de Angra 2. O método apresentado para o cálculo da potênca térmca do reator contém smplfcações, mas representa a forma de cálculo utlzada em um cenáro real. Será apresentada também uma vsão sucnta do controle de carga e da utlzação da técnca de Reconclação de Dados, que pode ser um nstrumento efcente para o cálculo da potênca térmca de um reator (P t ), permtndo uma maor exatdão no cálculo dessa medda. Ao se aplcar a técnca de RD, obtêm-se uma maor exatdão no cálculo da potênca térmca do reator (P t ), dessa forma, pode-se operar o reator dentro de parâmetros de segurança mas estrtos. Caso o valor da Potênca Térmca Reconclada (P Rt ) esteja abaxo da potênca nomnal da usna (100%), pode-se elevar a mesma até alcançar o lmte de operação permtdo e então se benefcar dessa margem de segurança maor, nclusve com retorno fnancero provenente de uma maor geração de energa (STREIT et al., 2005). Como o cálculo da P t depende dretamente do cálculo da vazão de água de almentação, na seção 2.3 serão apresentadas as equações de balanço de massa de um crcuto secundáro smplfcado de uma usna nuclear do tpo PWR, o qual fo baseado na norma VDI-2048 (2000) e será utlzado como base nos problemas-teste deste trabalho. 11

25 2.2 Controle de Carga e Determnação da Potênca Térmca do Reator As usnas nucleares do tpo PWR possuem dos crcutos báscos, representados sucntamente na fgura 2.1, que são o crcuto prmáro, por onde passa o flúdo refrgerante do reator e que crcula pela parte nterna dos tubos em U localzados dentro dos Geradores de Vapor (GV) (fgura 2.1, lnha em negrto) e o crcuto secundáro ou crcuto água-vapor, que flu pelo lado do casco do GV (fgura 2.1, lnha contínua) - (AZOLA et al., 2009). O crcuto tercáro ou fonte fra fo omtdo por efeto de smplfcação. Fgura 2.1: Dagrama Smplfcado de uma usna nuclear tpo PWR (crcuto prmáro e secundáro) Uma malha de controle de potênca elétrca é utlzada para o controle de carga da planta. A potênca medda é comparada com um valor lmte e o ajuste necessáro é aplcado ao elemento fnal de controle, que são as válvulas de controle de vazão de vapor que almentam o estágo de alta pressão da turbna a vapor (AZOLA et al., 2009). 12

26 A potênca térmca do reator não deve ultrapasar 100% da carga nomnal e caso a potênca térmca ultrapasse 102%, sstemas de lmtação e proteção do reator atuam, mpedndo a ultrapassagem desse lmte, que é defndo pela análse de segurança do reator. O cálculo da potênca térmca do reator pode ser obtdo determnando-se a carga térmca do Gerador de Vapor ( Q vazão de água de almentação prncpal ( m GV ), a qual é dretamente proporconal ao valor da ag ), deduzndo-se desse valor as cargas térmcas relatvas ao crcuto prmáro (AZOLA et al., 2009), as quas não sofrem varações sgnfcatvas, podendo ser consderadas contantes. O cálculo da P t está ndcado na equação abaxo. (2.1) A carga térmca do Gerador de Vapor ( Q ) é calculada pela equação 2.2 apresentada abaxo, GV hs he mag Q. GV (2.2) onde h s é a entalpa do fludo na saída do Gerador de Vapor (GV), h e é a entalpa do fludo na entrada do GV. O valor da entalpa do fludo depende da temperatura e pressão do meo, ou seja, na entrada e na saída do GV, que em condções estáves ou em regme permanente pode-se assumr que são constantes. Como os processos de medção de pressão e temperatura possuem boa precsão e a pressão e temperatura são constantes, pode-se assumr que a medda da entalpa também é constante e conhecda com boa precsão. Assm, a propagação de erro no cálculo da carga térmca do GV depende da medção da vazão de água de almentação. Entretanto, o processo de medção de vazão possu uma ncerteza sgnfcatva, sendo que, a precsão, dependendo do método de 13

27 medda, pode varar de 0,5% a 2% e em alguns casos pode chegar a 5%. de erro (ANDRADE et al., 2002). Em valores típcos para uma usna nuclear do tpo PWR com 4 loops, (1350MWe) a ncerteza na medda da carga térmca consderando os 4 GVs é cerca de 47 MWtérmcos (~15 MWelétrcos), suponho uma ncerteza de 1,5% na medda de vazão de água de almentação. Convém ressaltar que as cargas térmcas relatvas ao crcuto prmáro se mantém dentro de certos valores com muto pequenas varações, tendo pouca nfluênca na propagação de erro na medda da potênca térmca do reator. Por consegunte, conclu-se que devdo à ncerteza de medção de vazão de água de almentação, há uma ncerteza sgnfcatva dretamente proporconal a vazão de água de almentação, que se propaga no cálculo da potênca térmca do reator (P t ). Através da realzação de balanços de massa e energa utlzando dversas equações redundantes e medções é possível obter valores mas exatos da vazão de água de almentação, com sso melhorando a precsão na determnação da Potênca Térmca do Reator. Entretanto, o fechamento dos balanços de massa e energa é dfícl e nem sempre é possível, devdo a dversas ncertezas no processo de modelagem e medção. Para contornar esse problema, pode-se utlzar a técnca de Reconclação de Dados (RD) para realzar esse fechamento. A técnca de Reconclação de Dados clássca consste bascamente em mnmzar o erro quadrátco, sujeto às restrções do processo. Uma vez aplcada essa técnca, os valores reconclados ou valores corrgdos são mas exatos e com uma varânca determnada. Dessa forma, após a reconclação de dados, os valores corrgdos são aplcados ao cálculo do balanço de massa. Convém observar na equação (2.2) que o valor da vazão de água de almentação fo corrgdo a fm de satsfazer as restrções do processo e, assm, o mesmo corresponde a um valor mas exato e com uma varânca pré-determnada. Como os valores das entalpas de entrada e de saída de cada GV são consderados constantes e 14

28 meddos com muta exatdão, consderamos o valor da carga térmca do GV como o produto de um valor constante por uma varável aleatóra, m ag, que é mas exata e conseqüentemente o valor calculado da carga térmca também será mas exato. Assm, ao se utlzar o valor da vazão de água de almentação reconclado na equação (2.2), o resultado será uma melhor determnação do cálculo da potênca térmca do reator (P t ). Para efeto de smplfcação, neste trabalho não será consderado o balanço de energa, a menos quando explctamente ndcado, e como as cargas térmcas relatvas ao crcuto prmáro não tem varação consderável no cálculo da potênca térmca do reator, as mesmas serão consderadas constantes e a potênca térmca do reator (P t ) será equvalente à carga térmca do GV a menos de uma constante. Dessa forma, quanto mas exato o cálculo da carga térmca do GV, mas exato será o calculo da potênca térmca do reator. Na próxma seção será apresentado um exemplo smplfcado, mas realsta, do balanço de massa do crcuto secundáro de uma usna nuclear típca do tpo PWR, o qual servrá de base para a aplcação do método desenvolvdo nesse trabalho que é a Reconclação Robusta de Dados e Seleção de Modelo Smultânea (RDSMS) no cálculo da potênca térmca do reator. 2.3 Cálculo do Balanço de Massa A fgura 2.2 abaxo mostra o dagrama smplfcado do crcuto secundáro de uma planta tpo PWR com apenas 2 GVs baseado na norma VDI 2048 (2000) e que ndca os pontos de medção e as possíves perdas na tubulação. As varáves meddas são a vazão de vapor do gerador de vapor 1 (m GV1 ), a vazão de vapor do gerador de vapor 2 (m GV2 ), a vazão de água de almentação 1 (m ag1 ), a vazão de água de almentação 2 (m ag2 ), a vazão total de vapor (m v ), a vazão de condensado (m c ), a vazão das extrações A7, A6 e A5 (m A7 m A6, m A5 ), a vazão de retorno de condensado de alta pressão (m HPC ) e a vazão de vapor da turbna de alta para a turbna de baxa (m T ). 15

29 A vazão de vapor no ponto de entrada da turbna de alta pode ser determnada de três dferentes formas (VDI-2048, 2000): M1 = m GV1 + m GV2 0,2.m v (2.3) M2 = m ag1 + m ag2 0,6.m v (2.4) M3 = m c + m A7 + m A6 + m A5 + 0,4.m v (2.5) Fgura 2.2: Dagrama Smplfcado do Crcuto Secundáro de uma Usna Nuclear tpo PWR 16

30 A equação (2.3) ndca a vazão de vapor que chega à turbna de alta pressão descontadas as perdas localzadas nas lnhas de vapor (20%). A equação (2.4) ndca a vazão de vapor que deve ser equvalente à vazão de água de almentação total descontada as perdas nos GVs e lnhas de vapor (40%+20%). A equação (2.5) ndca a vazão de vapor que deve ser equvalente à vazão de condensado consderando as perdas pelas extrações e as perdas na turbna. Uma vez determnadas as equações relatvas à vazão de vapor na entrada da turbna de alta é necessáro estabelecer uma relação entre as meddas que rá fornecer o balanço de massa do sstema, ou equações auxlares ou restrções do processo a fm de serem utlzadas no processo de reconclação de dados, as quas estão ndcadas abaxo: M1 M2 = 0 (2.6) M2 M3 = 0 (2.7) m A7 +m A6 +m A5 m HPC = 0 (2.8) As equações (2.6) e (2.7) representam a vazão de vapor na entrada da turbna de alta, dessa forma os seus valores devem ser guas. A equação (2.8) ndca que a vazão que entra no tanque de água de almentação pela lnha de retorno deve ser gual à soma da vazão de cada extração. Uma vez determnadas as restrções do processo pode-se então exemplfcar numercamente o balanço de massa antes e depos da reconclação, utlzando como base o exemplo da norma VDI-2048 (2000). Ao aplcar os valores típcos de cada varável, essas equações apresentam resultados contradtóros, apesar de equvalentes e nesse caso o método de reconclação de dados precsa ser aplcado VDI-2048 (2000). Abaxo estão exemplfcados os resultados utlzando os valores típcos ndcados na norma VDI-2048 (2000), os valores de M1, M2 e M3 são contradtóros: 17

31 M1 = 91,804 ± 1,232 (2.9a) M2 = 88,579 ± 0,895 (2.9b) M3 = 88,687 ± 0,875 (2.9c) Esses valores são contradtóros, vsto que numercamente são dferentes (M1M2=M3), enquanto deveram ser guas a menos de um ntervalo de confança, pos representam a mesma medda. Pode-se notar que ao utlzar os valores ndcados na equação (2.9), o balanço de massa ndcado nas equações (2.6) e (2.7) não fecha, ou seja, as equações não se gualam. Após a aplcação do método de reconclação de dados, os valores obtdos conforme ndcado na norma VDI-2048 (2000) correspondem ao valor médo da varável somado a um valor que ndca o ntervalo de confança e estes estão ndcados abaxo. M1 = 88,714 ± 0,613 (2.10a) M2 = 88,714 ± 0,613 (2.10b) M3 = 88,714 ± 0,613 (2.10c) Os valores acma estão lvres de contradção, vsto que os balanços de massa agora satsfazem as equações (2.6) à (2.8). Dessa forma temos maor confabldade na medda, podendo fazer o cálculo da potênca do reator com dados mas precsos. Para efetuar o cálculo da potênca térmca do reator utlzam-se então os valores da vazão de água de almentação reconclados e aplcam-se na equação (2.2). 18

32 O exemplo numérco apresentado permte vsualzar a possbldade real de melhora no cálculo da potênca térmca do reator utlzando a técnca de reconclação de dados, mas não apresenta o método em s. Portanto, no próxmo capítulo será apresentado o método clássco de reconclação de dados, que servrá de base para o desenvolvmento das novas técncas apresentadas neste trabalho. 19

33 CAPÍTULO 3: Reconclação de Dados e Identfcação de Erros Grosseros Introdução Neste capítulo será apresentada a formulação geral do problema da Reconclação de Dados e Identfcação de Erros Grosseros, abordando anda a metodologa ndcada na norma VDI-2048 (2000), aqu denomnada como o método Clássco de Reconclação de Dados (RDC). Ao fnal do capítulo serão fetas consderações sobre outros métodos para Reconclação de Dados e Identfcação de Erros Grosseros, que servram de base para o desenvolvmento das novas técncas desenvolvdas neste trabalho. A formulação geral do problema da Reconclação de Dados é defnda como um problema de mnmzação com restrções da segunte forma, mn ( x x, u, p M, x) h ( x, u, p) 0 g( x, u, p) 0 x u p LI LI LI x x u u p p LS LS LS, (3.1) onde, é a função objetvo, a qual depende da dferença entre as varáves meddas M x e os valores estmados das varáves x, p é o conjunto de parâmetros do problema, u é o conjunto das varáves não meddas, h é o conjunto de restrções de gualdades, g é o conjunto de restrções de desgualdade e LI e LS ndcam os lmtes nferores e superores das varáves. Dversos métodos de RD assumem que a dstrbução de probabldade do erro é do tpo Normal com méda zero e dspersão conhecda. Assm, a função objetvo adqure a segunte forma: 20

34 ( x M T 1 M x). V.( x x), (3.2) onde V é a matrz de covarânca. Normalmente a matrz de covarânca não é conhecda e deve ser estmada a partr de dados do processo. Consderando o prncípo de máxma verossmlhança para a dstrbução Normal, um problema equvalente é mnmzar a função objetvo a segur, sujeto às restrções dadas pela equação (3.1). ( x M T 1 M )..( x ) (3.3) onde, Σ é a verdadera matrz de covarânca e é a verdadera méda relatva às meddas M x. Ao comparar as equações (3.2) e (3.3) pode-se observar que o problema de RD é equvalente a determnar a varável x, que pela equação (3.3) é a méda dos valores meddos, a qual por sua vez depende da estmatva da matrz de covarânca do processo Σ (FELDMAN, 2007). Nota-se que quando os dados estão corrompdos por erros grosseros, um desvo é ntroduzdo na estmatva da matrz de covarânca e no valor médo μ, o que afeta desfavoravelmente o processo de reconclação de dados. Portanto, um passo mportante para evtar erros nos dados reconclados, os quas dependem da estmatva da matrz de covarânca ( Σ ) é a préva remoção do erro grossero ao aplcar a técnca de reconclação de dados. Σ 3.2 Reconclação de Dados Clássca (RDC) Nesta seção será apresentado o método de reconclação de dados baseado na norma alemã VDI-2048 (2000). A técnca padrão de RD basea-se na determnação de vetor de correção para as meddas de processo a partr da mnmzação do erro quadrátco, o qual está sujeto às 21

35 restrções das equações do processo. Nesse caso, pressupõe-se que as varáves estão contamnadas com um ruído que possu uma dstrbução de probabldade conhecda (p. ex., dstrbução Normal). A Identfcação de Erros Grosseros (IEG) utlza a matrz de covarânca do erro e testes de ch-quadrado para determnar um patamar que dentfque medções errôneas, as quas devem ser elmnadas antes de se aplcar a RD. Deve-se observar que a prmera etapa do processo de reconclação de dados é a aqusção dos valores meddos e esses valores são consderados contamnados com um ruído aleatóro e eventualmente com erros grosseros, os quas por sua vez podem ter uma parte do EG com magntude ou nfluênca conhecda e outra parte com magntude ou nfluênca desconhecda (VDI-2048, 2000). Os erros grosseros cuja magntude é conhecda podem ter sua nfluênca descontada ou abatda prevamente à aplcação da RD. Entretanto, ao EG cuja nfluênca é desconhecda não se pode aplcar uma compensação antes da aplcação da RD. Assm, os EGs não determnados devem ser consderados como Erros Aleatóros (EA) durante o processo de RD. Dessa forma os erros aleatóros e a parte desconhecda dos erros sstemátcos pelo menos dentro de certos lmtes são consderados com uma Varável Aleatóra com função de dstrbução contínua (VDI-2048, 2000) Cada varável do processo x é consderada uma varável aleatóra e, portanto pode-se consderar o conjunto das n varáves meddas como um vetor x de varáves aleatóras de dmensão n como ndcada abaxo. x x x 1 2 x n (3.4) Observando a equação (3.4) podemos representar grafcamente o problema da RD conforme ndcado na equação (3.1) da segunte forma: 22

36 meddas x vetor de desvos v Vetor méda μ Fgura 3.1: Representação gráfca da técnca de RD clássca. O objetvo da técnca de RD é mnmzar o vetor de desvos (v) sujeto a restrção das equações do processo. Para uma varável aleatóra x temos que a varânca (σ 2 x) é a medda da ncerteza assocada a essa VA. Dado que x é um vetor de varáves aleatóras, a medda da ncerteza do conjunto total das meddas é dada pela matrz de covarânca (Σ X ). Notase que os valores verdaderos das varâncas e covarâncas não são conhecdos e precsam ser estmados Estmação da matrz de covarânca verdadera A estmatva da matrz de covarânca verdadera Σ X, relatva aos valores meddos de x apresentado na equação (3.4), é consttuída pelos valores estmados das varâncas e covarâncas, chamadas amostras, S X S S 2 X1,1 X n,1 S S 2 X1, n 2 X n, n, (3.5) 23

37 sendo que a matrz de covarânca estmada S X deve ser uma matrz smétrca e postva defnda. Quando as meddas de cada componente do processo são randômcas de um cclo a outro, pode-se estmar a varânca e a covarânca de cada varável por meo do estmador de máxma verossmlhança. Dado a exstênca de m amostras das varáves x e x k, os valores esperados estmados destas varáves são dados por, x 1 m x j m j 1 (3.6a) x 1 m k x kj m j 1 (3.6b) A estmatva da varânca da varável x ndcado por 2 S X, também obtda por meo do estmador de máxma verossmlhança utlzando dretamente as meddas do processo é dada pela expressão abaxo. S 1 1 m 2 2 X, ( xj x ) m m 1 j1 (3.7) A estmatva da covarânca entre duas varáves x e x k, ndcado por 2 S X,k pode ser obtda pela expressão apresentada na equação (3.8) S 1 1 m m 1 m 2 X, k ( xj x )( xk xk j1 ) (3.8) 24

38 Em alguns casos não é possível realzar a estmatva da covarânca entre varáves devdo à presença de nfluêncas que não podem ser meddas, assm as covarâncas devem ser estmadas utlzando duas propredades. Prmero, caso duas varáves do vetor X não sejam correlaconadas, ou seja, não exste dependênca estocástca entre as varáves x e x k os valores da covarânca entre x e x k ( S Xk nulos. ) são Segundo, caso alguma varável possua correlação com outra, pode-se estmar emprcamente o valor da correlação entre duas varáves por meo do coefcente de correlação que é defndo como: Cov( x, xk ) ( x, xk ) (3.9) Var( x ). Var( x ) k O coefcente empírco pode ser obtdo a partr das característcas das varáves e do processo consderando a nfluênca observada ou calculada de uma varável em outra e pode envolver a experênca e conhecmento de pessoas experentes no processo para determna-lo. Dessa forma, a covarânca entre as varáves x e x k pode ser calculada utlzando o coefcente de correlação empírco ( r, ) e o valor do desvo padrão de cada varável, como ndcado pela expressão abaxo (VDI-2048, 2000): X k S r. S. S X, k X, k X X k (3.10) Intervalo de Confança A partr da premssa que os dados do processo estão contamnados com um ruído que possu uma dstrbução Normal com méda zero e varânca conhecda, podese aplcar o conceto de ntervalo de confança para o conjunto de dados. Supondo que 25

39 desejamos estabelecer um ntervalo de confança para o valor verdadero μ da medda x com uma probabldade p, obtemos a segunte expressão: P x x. p p. (3.11) x p x A expressão acma ndca que o valor verdadero μ se stua com uma probabldade p dentro do ntervalo x. x. (3.12) p x p x Usualmente utlza-se o ntervalo de confança com 95% de probabldade, que é bem aceto em aplcações ndustras. A partr de cálculos estatístcos o ntervalo de confança para a probabldade de 95% é dado por x 1,96. x 1,96. (3.13) x x Na prátca pode-se utlzar o ntervalo de confança ao nvés da medda da ncerteza dada pela varânca da medda. A partr do ntervalo de confança a varânca pode então ser estmada como a segur (VDI-2048, 2000), 2 S x Vx 1,96 2 (3.14) onde V x é o valor do ntervalo de confança. 26

40 3.2.3 Aplcação da Reconclação de Dados Clássca O problema da RD fo formulado de acordo com a equação (3.1) e para efeto de demonstração o método será apresentado utlzando apenas a restrção de gualdade, conforme formulado na norma VDI-2048 (2000). Seja o vetor de varáves aleatóras X T e υ o vetor de correção ou erro para medda de X T. Sabendo que h1 ( x). h( x).. h ( x) r, (3.15) onde h(x) é o vetor das r equações auxlares que representam os balanços de massa e energa, pode-se formular o problema da RD como: mn s / v. S 1 x v h( x v) 0 (3.16) Os valores meddos não satsfazem as condções auxlares. Entretanto os valores corrgdos x x v satsfazem. forma: Lnearzando-se h(x) temos que o problema de mnmzação assume a segunte 1 mn. S. v v x s / h( x) h( x). v 0 x (3.17) 27

41 Aplcando a técnca de multplcadores de Lagrange, podemos obter após dversas manpulações algébrcas uma fórmula para o vetor de correção v e para a matrz de covarânca estmada do erro (S v ), T T 1 v S. H.( H. S. H ). h( x) (3.18) x x T T 1 S v Sx. H.( H. Sx. H ). H. S (3.19) x onde, H h( x) x (3.20) e h(x) H x h 1(x) x1... hr(x) x h 1(x) xn... hr(x) xn (3.21) Identfcação de Erros Grosseros Após a obtenção do vetor de correção v e da matrz de covarânca do erro S v, conforme as equações (3.18) e (3.19) respectvamente, é possível determnar se o vetor de correção está dentro do ntervalo de confança desejado com a probabldade desejada, por exemplo, com a valor de 95%. Observa-se que o vetor de correção (v) elevado ao quadrado é uma varável aleatóra com dstrbução ch-quadrado, a qual depende da probabldade desejada e do 28

42 número de graus de lberdade (número de restrções) dado pelo valor r. Dessa forma, pode-se aplcar o teste de ch-quadrado utlzando a expressão abaxo (VDI-2048, 2000). 2 2 v r,95% (3.22) Se a medda não passar no teste de ch-quadrado, ndca então a presença de um erro sgnfcatvo nessa componente, cujas contradções nas equações do processo estão acma do lmte especfcado, ou seja, com desvo muto grande (Erros Grosseros). Utlzando os elementos da dagonal da matrz de covarânca do erro (S v ) e o tamanho do ntervalo de confança (v ), podem-se determnar quas meddas apresentam erros sgnfcatvos como ndcado na expressão abaxo. v 1,96 2 sv, (3.23) Os elementos que ndcaram erros sgnfcatvos precsam ser analsados ndvdualmente ou em conjunto com sua varável correlaconada para se dentfcar a causa do desvo apresentado. Uma vez dentfcado o elemento e a causa do desvo sgnfcatvo, a matrz de covarânca deve ser novamente calculada e o processo de reconclação recalculado Cálculo do Vetor de Correção e da Matrz de Covarânca dos Valores Corrgdos Após o cálculo do vetor de correção (v) e da matrz de covarânca do erro (Sv), devem-se calcular os valores corrgdos ou reconclados, que são dados por x ~ x υ, (3.24) 29

43 onde x é o vetor de meddas, υ o vetor de correção e x ~ o vetor de meddas corrgdo ou reconclado. Para determnar o ntervalo de confança da varável corrgda é necessáro estmar a matrz de covarânca dos valores corrgdos ~ x, que pode ser obtda a partr dos valores da matrz estmada de covarânca do erro S v e da matrz estmada de covarânca da medda S x, como ndcado a segur: S X ~ S S (3.25) X V Dessa forma, os ntervalos de confança dos valores corrgdos podem ser calculados utlzando os valores da dagonal da matrz ~ x, como ndcado na seção Deve-se notar que o ntervalo de confança dos valores corrgdos é menor do que o dos valores meddos. 3.3 Fundamentos e Consderações sobre outros métodos de Reconclação de Dados e Identfcação de Erros Grosseros O método de reconclação de dados clássco, no nosso caso, tem como prncpal objetvo a elmnação de contradções nos balanços de massa e energa do processo levando-se em conta que os valores a serem corrgdos precsam ter equações auxlares redundantes. Entretanto, o método pressupõe que as meddas são contamnadas com ruído com uma dstrbução Normal com méda zero e varânca conhecda. Na prátca essa premssa nem sempre é válda e a determnação de uma função de dstrbução de probabldade nem sempre é possível. Ademas, a presença de erros grosseros não explctamente dentfcáves podem alterar os valores médos e a estmatva da matrz de covarânca do erro, dessa forma alterando desfavoravelmente a reconclação de dados. Outro fator é a natureza seqüencal do método clássco de Reconclação de Dados, onde váras terações para 30

44 remoção de erros grosseros devem ser fetas para que se chegue a uma condção lvre de erros e que a reconclação de dados possa ser aplcada. Com o ntuto de evtar o processo teratvo utlzado para a Identfcação de Erros Grosseros (IEG) e o conseqüente desvo na estmação dos dados da planta, TJOA e BIEGLER (1991) propuseram um método para RD e IEG, onde a função objetvo ncorpora o prncípo de máxma verossmlhança relatvo à função de Dstrbução Gaussana Contamnada, na qual são levadas em conta as contrbuções devdas a erros aleatóros e erros sstemátcos. O método consste em mnmzar uma função objetvo bvarada consderando-se um peso para cada medda, que é ajustado automatcamente em função do resíduo. Na presença de Erros Grosseros, esse peso é menor, o que fornece uma solução sem desvo e ao mesmo tempo dá da maor robustez ao método. A solução do problema de Reconclação de Dados é determnada por meo de um método de Programação Quadrátca Sucessva (SQP) adaptado à estrutura da função objetvo (TJOA e BIEGLER, 1991). Erros Grosseros são dentfcados por meo de testes estatístcos baseados na estrutura da função objetvo No trabalho de TJOA e BIEGLER (1991) propõe-se o uso de uma função dstrbução gaussana bvarada como ndcada abaxo, 1 2 p 2 f 1 p exp exp 2 2 2, (3.26) 2 2 b 2b onde é o erro da medda, p é a probabldade da ocorrênca de erro grosseros, b é a razão entre o desvo padrão da dstrbução do erro grossero e o desvo padrão do erro aleatóro, b 2 2 é a varânca do erro grossero. Segundo o prncípo da Máxma Verossmlhança, o problema da Reconclação de Dados adqure a segunte forma: 31

45 mn s. t. r 1 h( ~ x, u) 0 ln1 p x u L L 2 exp 2 2 ~ x x u u U U 2 p exp b 2 2 b 2 (3.27) A vantagem desta estratéga é que a nfluênca do erro grossero é consderada no processo de reconclação de dados e a dentfcação de erros grosseros pode ser realzada de forma smultânea. Um método híbrdo de Programação Quadrátca Sucessva (SQP) fo desenvolvdo, cujo desempenho é mas rápdo do que outros métodos de Programação Quadrátca Sucessva. Apesar da efcênca do método híbrdo referencado acma, o problema de reconclação de dados é não convexo e não lnear e não há garanta de que haverá convergênca para uma solução que seja um ótmo global (TJOA e BIEGLER, 1991; ARORA e BIEGLER, 2001). Alguns métodos para a Reconclação de Dados e Identfcação de Erros Grosseros possuem uma natureza combnatóra. Um deles é baseado na classfcação das meddas de processo em dos conjuntos: um conjunto de meddas com falha e outro conjunto de meddas sem falhas (ARORA e BIEGLER, 2001). Cada conjunto de meddas com Falha e sem Falha corresponde a um modelo estatístco e se mas de um modelo pode ser ajustado aos dados de medda, um processo de seleção de modelo será precso para dentfcar o modelo correto. O processo de seleção de modelo permte de forma sstemátca seleconar as meddas consderadas com falha e para a solução do problema pode-se utlzar a técnca de Branch and Bound ou de Programação Msta Intera ou Programação Msta Não Lnear. YAMAMURA et al. (1988) propuseram um método baseado no Crtéro de Informação de Akake (AIC), onde o a solução do problema de dentfcação de erros grosseros é resolvda mnmzando-se o Crtéro de Informação de Akake (AIC) e cujo modelo seleconado também satsfaz as restrções dose balanços de massa e energa. O problema fo formulado como uma estratéga de Programação Quadrátca e utlza a técnca de Branch and Bound. 32

46 O Crtéro de Informação de Akake (AIC) é uma estmatva da dstânca entre o modelo de probabldade verdadero (g(x)) e o modelo de probabldade em consderação (f(x,)), onde g(x) é função densdade de probabldade do modelo verdadero e f(x,) corresponde à famíla paramétrca de funções densdade de probabldade, com parâmetro. Essa estmatva também é conhecda como crtéro de Kullback-Lebler de nformação e possu valor postvo, a menos que os modelos sejam guas em sua quase totaldade (AKAIKE, 1974). O Crtéro de Informação de Akake é defndo como, 2.Log( lkelhood functon( ) ) 2k, AIC k (3.28) onde k é o número de parâmetros ajustáves do vetor. Quando exstem dversas famílas de f(x,), ou seja, exstem város modelos, o melhor modelo ou modelo ótmo corresponde àquele que mnmza o valor de AIC (). Se exstr apenas uma famíla de modelos (f(x,)), o modelo ótmo corresponde àquele com parâmetros correspondentes ao Estmador de Mínmos Quadrados LSE (AKAIKE, 1974). Adante, o Crtéro de Informação de Akake (AIC) terá um papel fundamental no desenvolvmento do método automátco de seleção de modelo, dentfcação de erros grosseros e reconclação de dados robusta, que faz uso de um estmador redescendente robusto. O método de reconclação de dados e dentfcação de erros grosseros proposto por YAMAMURA et al. (1988) consdera dos tpos de classfcação de erros nas meddas ou sensores: a) Sensores Normas, que correspondem a varáves aleatóras com dstrbução Normal com méda zero e varânca conhecda ( 2 ) e b) Sensores com erros sstemátcos, que possuem desvos (), onde > 2. Deve-se observar que se exstem n nstrumentos, nessas condções os erros sstemátcos são representados por uma combnação de 2 n modelos ou possbldades. A função objetvo então é defnda por, 1 n AIC( ) ln(2 ). (3.29)

47 Assm, a formulação do problema proposta por YAMAMURA et al. (1988 ) é defnda pelo problema de mnmzação apresentado abaxo: mn F( j) y j ( jf ) x ( jj ) j A. x j 1 2 b 2 x j jj F 1 2 j J jf x j y j 2 F s. t., (3.30) onde, x é a medda do processo, J é o conjunto de n meddas do processo, ( j) é o conjunto da potênca de J, F é conjunto de nstrumentos com erros sstemátcos e F é o número de elementos em F, y é a razão entre o desvo correspondente aos erros sstemátcos e a varânca. YAMAMURA et al. (1988) propuseram resolver a equação (3.30) utlzando a técnca de Branch and Bound e concluíram que a mesma é efcente. O método detectou e corrgu os erros sstemátcos nos dados meddos, mas o esforço computaconal aumenta de forma sgnfcatva quando o número de sensores ou meddas com erros sstemátcos aumenta. Esse comportamento é explcado pelo aumento exponencal de combnações para a solução do problema. SODERSTROM et al. (2000) propuseram um método cuja função objetvo é smlar à estratéga de mnmzação do AIC como apresentado por YAMAMURA et al. (1988), mas utlzando uma estrutura para uso de Programação Intera Msta. Nesse método os dados do processo são amostrados e organzados em uma matrz, onde as lnhas correspondem aos n valores amostrados e as colunas correspondem às h amostragem dos dados em uma janela de tempo (h). Os dados são adqurdos consderando-se uma estratéga de janela móvel com horzonte h e o problema é resolvdo em ntervalos regulares, o que torna a estratéga partcularmente nteressante e prátca para mplementação do método de forma On-Lne (SODERSTROM et al., 2000). Nesse método, consdera-se que cada medda pode sofrer um desvo (b) e com ajustes na função objetvo é possível estmar o desvo e os valores verdaderos das meddas provenentes do processo. Uma varável dscreta (B) fo ntroduzda como penaldade na função objetvo a fm de representar a presença ou não de desvo. O problema fo resolvdo utlzando uma estratéga de Programação Intera Msta, o que é 34

48 computaconalmente ntensvo, mas com adaptações esse esforço computaconal é reduzdo (SODERSTROM et al., 2000). A formulação matemátca é dada por: mn ~ x,, b A. ~ x h k 1 l1 0 n 1 l ~ x ( x. l m lk b ) l n l1 w B l l s. t. (3.31) O sstema é representado pela matrz A, x m são as meddas do processo, x~ são os valores estmados, b é o desvo, B é uma varável dscreta ndcando a presença ou não de desvo, h é o horzonte de meddas, n é o número de varáves, σ ndca o desvo padrão das meddas. O método apresentou um bom desempenho, mas como menconado anterormente, o mesmo é computaconalmente ntenso, devdo a quantdade de combnações que devem ser processadas para se encontrar uma solução e que aumenta exponencalmente conforme é aumentada a quantdade de varáves. Uma vantagem é que o método pode smultaneamente estmar o estado real das meddas e ndcar a presença de desvo nas mesmas. Esse processo pode anda ser estenddo a processos não lneares e com característcas dnâmcas (SODERSTROM et al., 2000). JOHNSTON e KRAMER (1995) propuseram uma técnca para determnar o estado mas provável das meddas da planta, denomnada Retfcação de Dados (MLR), a qual é baseada na estmação de estado pelo prncípo da Máxma Verossmlhança. O objetvo é maxmzar a função de dstrbução de probabldade do estado das varáves da planta ~ x, dado o conjunto de meddas. Essa técnca explora as semelhanças ou analoga entre o prncípo da máxma verossmlhança e a regressão robusta, que é uma técnca da estatístca robusta desenvolvda para lmtar o efeto de erros grosseros nos dados estmados. O método apresentado por JOHNSTON e KRAMER (1995) mostrou-se efetvo através de exemplos, que utlzam funções de dstrbução gaussana bvarada ou multvarada, pos as mesmas possuem característcas semelhantes às propredades de estmadores robustos, como a função Lorentzana (JOHNSTON e KRAMER, 1995; HUBER, 1981), ndcando um bom desempenho na presença de erros grosseros e 35

49 ndcando o real estado da planta, mesmo sem nformações ela ou do modelo de probabldade. Quando os dados meddos do processo estão corrompdos por erros grosseros, torna-se muto dfícl determnar uma função dstrbução de probabldade e utlzar um estmador dervado dessa mesma função ou mesmo justfcar o seu uso (ARORA e BIEGLER, 2001). Nesses casos, com o ntuto de contornar tal lmtação, pode-se recorrer ao uso de estmadores robustos, pos são largamente ndependentes de uma função de dstrbução de probabldade específca, produzem estmatvas sem desvos, mesmo na presença de um percentual sgnfcatvo de desvos na medda. No processo de estmação o estmador robusto utlza menos peso onde há desvos maores, protegendo a nfluênca de outras meddas com os valores corretos. Dversos trabalhos voltados ao uso de estmadores robustos foram publcados, por exemplo, ALBUQUERQUE e BIEGLER (1996) utlzaram um M-estmador, a função FAIR para lmtar o efeto causado pela presença de erros grosseros. ARORA e BIEGLER (2001) e WONGRAT et al. (2005) aplcaram com sucesso o estmador robusto de três partes de Hampel ao problema de reconclação de dados e dentfcação smultânea de erros grosseros. OZYURT e PIKE (2004) compararam técncas de reconclação de dados e concluíram que técncas que utlzam estmadores robustos apresentam resultados guas ou superores quando comparados aos métodos seqüencas. No trabalho de Prata (2009) e PRATA et al. (2010) o estmador robusto de Welsch fo utlzado com sucesso e em VALDETARO e SCHIRRU (2009) verfcou-se que os resultados obtdos usando o estmador de três partes de Hampel foram também efetvos. Dessa forma, ndcando o potencal de uso desses estmadores. Deve-se ressaltar que neste capítulo, os prncpas métodos que fundamentam o método automátco de Reconclação de Dados Robusta, Identfcação de Erros Grosseros e Seleção de Modelo foram ctados, mas como letura complementar, onde um levantamento bblográfco bem completo fo realzado, pode-se consultar o trabalho de PRATA (2009), PRATA et al. (2009) e PRATA et al. (2010). 36

50 Para apresentar uma vsão amplada do problema de estmação robusta, no próxmo capítulo será apresentado um resumo sobre estatístca robusta e sobre o uso de estmadores robustos. 37

51 CAPÍTULO 4: Estatístca Robusta e Estmadores Robustos Introdução A maora dos métodos de reconclação de dados e dentfcação de erros grosseros pressupõe a exstênca de uma função dstrbução de probabldade conhecda, usualmente a função de probabldade Gaussana, com méda zero e varânca conhecda (σ 2 ). Quando as meddas do processo estão contamnadas pela presença de erros grosseros, a determnação de uma função de probabldade se torna muto dfícl, bem como, o uso de um estmador dervado dessa função (ARORA e BIEGLER, 2001). A presença de pequenos desvos entre o modelo de probabldade real e o modelo consderado, devdo aos dados corrompdos por erros grosseros, pode nfluencar drastcamente e negatvamente os valores estmados. Assm, nesse caso, as técncas da estatístca robusta devem ser utlzadas. A estatístca robusta fo desenvolvda para ldar com tas desvos do modelo de probabldade real e seus desdobramentos e conseqüêncas, sendo que estmatvas estáves e confáves podem ser obtdas com técncas robustas, quando desvos do modelo de probabldade real ocorrem até um determnado ponto (RONCHETTI, 1997b). A base da estatístca robusta remonta ao ano de 1964 relaconada ao trabalho ponero de HUBER (1964, 1981), onde uma generalzação do estmador de máxma verossmlhança fo estabelecda e os estmadores com determnadas propredades foram denomnados M-Estmadores (HAMPEL et al., 1986). HUBER (1981) propôs obter estmadores baseado na déa de substtur o quadrado do erro por outra função com a forma, 38

52 mn T m 1 x T, (4.1) onde ρ é não constante e possu uma função dervada (ψ), de forma que o estmador T satsfaça a segunte equação, m 1 x T 0, (4.2) onde é a dervada de ρ em relação a x, x é o vetor de varáves meddas. Quando a função ρ corresponde a ln(f 0 (x)), onde f 0 (x) é a função de dstrbução Normal, o M- Estmador é o Estmador de Máxma Verossmlhança - MLE (HAMPEL et al., 1986). Adante neste capítulo será apresentada prmeramente uma vsão sucnta sobre estatístca robusta, em especal sobre os estmadores robustos, onde serão mostrados alguns estmadores comumente utlzados, além de outros aspectos sobre a establdade global dos M-Estmadores e outros parâmetros que fornecem nformações qualtatvas e quanttatvas sobre estmadores robustos. 4.2 Estatístca Robusta e Estmadores Robustos A análse estatístca utlza como ferramenta poderosa a regressão lnear e o método de estmação dos mínmos quadrados, que é um método amplamente dfunddo e utlzado. Apesar dsso, o método de mínmos quadrados possu falta de robustez, pos, apenas um desvo em uma das meddas pode alterar os valores estmados de forma sgnfcatva (HAMPEL et al., 1986). Dessa forma apareceu a necessdade de buscar novos estmadores capazes de tratar os dados estatístcos com algum grau de contamnação ou presença de Erros Grosseros. 39

53 Os resultados estatístcos relatvos à efcênca e sensbldade de estmadores em relação à presença de erros grosseros puderam ser meddos a partr de resultados propostos por Hampel (ROUSSEEUW e LEROY, 1987), os quas foram publcados em 1974 (HAMPEL, 1974) na forma de uma função de nfluênca. Dversos outros trabalhos foram publcados posterormente, trazendo resultados mportantes sobre os M- Estmadores. Um mportante conceto é que a função de nfluênca descreve o efeto de uma contamnação nfntesmal em um determnado ponto x e que permte avalar a partr do comportamento nfntesmal o desvo assntótco causado pela contamnação nas observações (OZYURT e PIKE, 2004). A Função de Influênca (IF) de um estmador T sobre uma determnada função de dstrbução F é dada por, T( Ft ) T( F) IF( x, T, F) lm t0 t. (4.3) Onde F t representa a função de dstrbução no tempo t. Smplfcadamente, a função de nfluênca (IF) é a prmera dervada ordnára de uma função de dstrbução (F) relatva a um ponto x em um espaço de probabldades de dmensão nfnta (HAMPEL et al., 1986). A função de Influênca fornece mportantes índces de desempenho em relação aos M-estmadores, que fornecem dados qualtatvos e quanttatvos sobre o comportamento dos mesmos. Os índces mas sgnfcatvos do ponto de vsta da robustez são apresentados a segur (HAMPEL et al., 1986): a) Sensbldade a erros grosseros (γ), que é defndo como o supremo do valor absoluto da função de nfluênca em todo o domíno. O valor de γ mede o efeto que uma determnada contamnação tem sobre o estmador; b) Sensbldade em relação a desvo de medda ( local-shft sensvty ), que mede qual o lmte da nfluênca no estmador se um valor x se afastar do seu 40

54 valor orgnal ( leverage pont ). O valor da sensbldade em relação a desvo de medda (λ) é dado pela nclnação da função de nfluênca no ponto consderado. c) Ponto de rejeção ( rejecton pont ), que está relaconado com a rejeção completa de erros grosseros extremos. O ponto de rejeção ζ é defndo como o ponto c>0 tal que a função de nfluênca é nula para todo valor absoluto de x maor do que c. Todas as observações acma desse valor serão rejetadas completamente. O estudo desses índces permte entender melhor os problemas relaconados aos M-estmadores e desenvolver outros estmadores que possuam comportamento especfco (HAMPEL et al., 1986). A sensbldade a erros grosseros γ é dada por, sup IF( x, T, F). (4.4) x A defnção acma pode ser vsta como um lmte aproxmado do desvo do estmador e, a partr dessa defnção, um mportante passo para dar mas robustez a uma estmador é lmtar o valor absoluto da função de nfluênca (HAMPEL et al., 1986). A sensbldade em relação a desvo de medda ( local-shft sensvty ),é calculada como, sup IF( y, T, F) IF( x, T, F) y x. (4.5) xy O ponto de rejeção ζ é calculado segundo, nf c 0; IF( x, T, F) 0 para x c. (4.6) onde ζ é o menor valor de x tal que a Função de Influênca é nula a partr de um determnado ponto. 41

55 A fgura 4.1 lustra a defnção dos três pontos ndcados acma. Sensbldade à erros grosseros IF Sensbldade à desvos na medda Ponto de rejeção x Fgura 4.1: Função de Influênca e os seus pontos característcos. A função de nfluenca permte a defnção de város índces de desempenho de M-estmadores, mas não fornece nenhuma nformação em relação à establdade global desses estmadores (HAMPEL et al., 1986). Assm torna-se necessáro complementar os índces de desempenho dos M-estmadores com a nformação sobre sua establdade global defnndo o conceto de ponto de ruptura ( breakdown pont ), que ndca o ponto em que o estmador é totalmente não confável, ou seja, a medda da menor fração de contamnação que não nfluenca a estatístca consderada. Sejam m meddas na amostra de dados, k o número de meddas que estão contamnadas e T o estmador consderado. O ponto de ruptura é defndo por k ( T) mn, bas( T) é m nfnto (4.7) onde bas(t) é dado pelo desvo assntótco do estmador T e m k é a razão entre as meddas contamnadas da amostra e o total de amostra, ou seja, o ponto de ruptura é um percentual de contamnação em relação às meddas e seu valor é defndo como o valor 42

56 mínmo em que o grau de contamnação, ou seja, a quantdade de amostras contamnadas em relação ao total de amostras, que pode fazer com que os valores estmados se desvem do valor real da medda por um valor arbtraramente dstante e com a magntude que se quera, perdendo assm sua característca de robustez. Como exemplo, pode-se utlzar o estmador de mínmos quadrados, onde o valor esperado da amostra é dado pelo valor da méda das m amostras. Observa-se que apenas com um erro grossero pode-se alterar o valor estmado tanto quanto se quera. Por consegunte, o ponto de ruptura é dado por: ( T) 1 m, (4.8) sendo que o valor de ruptura tende a zero conforme o número de meddas aumenta. Neste caso, o ponto de ruptura é de 0%. A méda de uma amostra de dados é um estmador que não é lmtado, pos ao se substtur apenas uma medda por um valor arbtráro, a méda sofrerá um desvo tão maor quanto maor for o desvo da medda. Entretanto, a medana é um estmador que possu um valor de ruptura de 50%, ou seja, o estmador é lmtado até quando pelo menos 50% das observações forem alteradas (ROUSSEEOUW e CROUX, 1993). Outros estmadores foram propostos para contornar o problema de robustez do estmador de mínmos quadrados, como por exemplo, o estmador de mínmo valor absoluto (norma L 1 ). Entretanto, esse estmador também possu ponto de ruptura de 0%, pos o mesmo não protege de erros grosseros no exo x das abcssas ( leverage pont ), ou seja, em uma regressão a amostra consste em um conjunto de pontos ordenados (x, y ) e o erro da medda pode se apresentar tanto no valor das ordenadas (y =y+δ y ) quanto no exo das abcssas (x =x+δ x ). O estmador robusto deve apresentar a característca de proteger a estmatva na presença de erros tanto nos valores das ordenadas quanto nos valores das abcssas. Um estmador robusto mportante, muto utlzado na estatístca robusta, é o estmador MAD ( Medan Absolute Devaton ) denomnado Desvo Absoluto da Medana, que defndo por, 43

57 MAD x medana x medana x j. (4.9) O estmador MAD possu ponto de ruptura de 50% com função de nfluênca (IF) mas precsa sobre as dversas classes de estmadores (ROUSSEEOUW e CROUX, 1993). O cálculo do MAD é de fácl mplementação e costuma ser utlzado como estmador robusto do fator de escala (S n ) para normalzação dos resíduos dos estmadores robustos. O cálculo do fator de escala S n (desvo padrão σ) utlzando MAD é dado pela equação abaxo: S n x 1, medana x medana x 1,483MAD 483. (4.10) j Dversos estmadores têm sdo desenvolvdos e são encontrados na lteratura, como por exemplo, em HUBER (1981), BASU e PALIWAL (1989), HAMPEL (1974) e HAMPEL et al. (1986). Dentre os dversos estmadores, destacamos a função FAIR utlzada por ALBUQUERQUE e BIEGLER (1996) e defnda como, 2 (, c ) log1 f c, (4.11) f c f c f onde é o erro da medda e c f uma constante que deve ser ajustada para regular a efcênca e a robustez do estmador. O ajuste da constante c f é feto com base em um compromsso entre esses dos parâmetros (ALBUQUERQUE e BIEGLER, 1996), onde c é proporconal a uma função da Efcênca Assntótca E ( c= f(e) 1.02 ). Outro estmador com destaque é o estmador Normal Contamnada, que é defndo como, 2 2 p 1 pexp exp 2 2 (, p, b, ) ln 2, (4.12) 2 b 2b onde p é a probabldade e b 2 2 é a varânca relatva a contamnação pelo erro grossero (OZYURT e PIKE, 2004). 44

58 Uma subclasse de estmadores cuja função de nfluênca é nula para todos os valores acma de um determnado valor c, a qual é capaz de rejetar erros grosseros acma desse lmte, é a dos estmadores redescendente. Esses estmadores possuem as três característcas relaconadas à robustez menconadas nos tens (a), (b) e (c) acma e város estmadores do tpo redescendente já havam sdo propostos antes da formalzação da função de nfluênca detalhada em HAMPEL (1974). Entre os estmadores redescendentes temos a função seno de Andrew, a função Bweght de Tukey e os estmadores de duas partes e de três partes de Hampel. Esse últmo teve um papel de destaque no estudo sobre robustez conduzdo pela Unversdade de Prnceton (HAMPEL et al., 1986). Dversos autores utlzaram o estmador de três partes de HAMPEL com sucesso no problema de reconclação de dados e na dentfcação de erros grosseros, entre eles podemos ctar ARORA e BIEGLER (2001), WONGRAT et al. (2005) e VALDETARO e SCHIRRU (2009, 2011). Na fgura 4.2 é mostrada a representação gráfca do estmador de três partes de Hampel. A fgura 4.2 abaxo ndca grafcamente a FI do estmador de Hampel de três partes, o que permte fazer uma comparação qualtatva com a fgura 4.1 e vsualzar os três tens relaconados à robustez. Sensbldade à erros grosseros IF Sensbldade à desvos na medda -c -b -a a b c Ponto de rejeção x Fgura 4.2: Função de Influênca do Estmador de Três Partes de Hampel. 45

59 46 Na próxma seção será apresentado o estmador robusto de Hampel e serão fetas outras consderação em relação a esse estmador. 4.3 Estmador Robusto Redescendente de Três Partes de Hampel O estmador de três partes de Hampel é um estmador do tpo M (máxma verossmlhança) e tem assocado sua função característca ψ, que quantfca o efeto do resíduo em relação aos dados estmados. Quando a função característca ψ é nula a partr de um valor c, o estmador é classfcado como sendo do tpo redescendente. Este tpo de estmador possu a propredade de completa rejeção a erros Grosseros, o que é uma característca mportante que pode ser aprovetada na resolução do problema de Reconclação de Dados. O estmador de Hampel de três partes é apresentado na função objetvo F H (uma função de dstrbução de probabldade) como ndcado a segur: c a b c a a b c b b c c a b c a a b b a a a a F H , , , (4.13) onde, é o erro de cada amostra ( M x x ~ ), x~ é o valor estmado da medda e a, b e c são constantes que devem ser encontradas para que o estmador se ajuste o mas próxmo possível à característca estatístca dos dados. As constantes a, b, e c devem satsfazer a segunte relação:. (4.14) a b c. 2

60 Nota-se que no ntervalo [-a, a], o comportamento da f o do estmador é smlar a função objetvo de mínmos quadrados. No ntervalo [-c,-b] e [b,c] a probabldade ca rapdamente e no ntervalo (-,c) e (c, ) permanece pratcamente constante. Essa parte constante é a que tem papel mas sgnfcatvo na característca de robustez do estmador. Esse estmador possu três constantes que devem ser ajustadas, o que aparenta ser uma característca não muto favorável. Entretanto, o ajuste dessas constantes permte sntonzar adequadamente o estmador aos dados estatístcos e também detectar erros grosseros (WONGRAT et al., 2005). Uma vantagem sgnfcatva do estmador redescendente de três partes de Hampel é que o mesmo possu um ponto de corte explícto, c, tel que a medda é consderada um Erro Grossero se o resíduo for maor do que esse valor. c. (4.15) Outros estmadores não possuem ponto de corte ou não o possuem de forma explcta, por exemplo o estmador por mínmos quadrados (LSE), a Função Far, a Função Logístca, o Estmadores de Cauchy, Huber e Welsch. Nestes casos a detecção de Erros Grosseros é feta por crtéros alternatvos como mostrado a segur. 4.4 Dferentes Crtéros para Identfcação de Erros Grosseros Os estmadores redescendentes, aqu especfcamente o estmador redescendente de três partes de Hampel, possuem um ponto de corte explícto ou cut off pont, como apresentado na equação (4.15), onde a partr desse ponto os erros grosseros são completamente rejetados, ou seja, o peso à aquele desvo é nulo. Dessa forma, qualquer valor da medda além desse ponto pode ser consderado um Erro Grossero e sua magntude não será sgnfcatva no cálculo dos valores estmados. No estmador de três partes de HAMPEL esse ponto de corte é um valor explícto e bem determnado, sendo nexstente em dversos estmadores não 47

61 redescendentes. Para estes torna-se necessáro o uso de outros crtéros de Identfcação de Erros Grosseros, alguns dos quas estão apresentados a segur. No caso da aplcação do método de reconclação de dados clássca, a IEG é feta por meo de testes estatístcos, como o teste de ch quadrado, mas por ser um teste de hpótese, o mesmo pode ter suas condções de hpótese voladas ntroduzndo erros de dentfcação (PRATA, 2009). Quando o estmador não possu um ponto de corte explícto, outros crtéros para dentfcação de erros grosseros são utlzados. HAMPEL et al. (1986) consderam entre outros, o método dentfcado como X84, cuja regra de rejeção é baseada na medana ao nvés da méda e desvo padrão. A regra X84 tem como prncípo rejetar qualquer desvo acma de 5,2 desvos da medana ou da MAD, conforme a equação (4.16). (4.16) Outro crtéro consderado para Identfcação de Erros Grosseros é o de Farrs e Law para a Dstrbução Normal Contamnada, onde o ponto de corte (c op ) é defndo de forma equvalente como (OZYURT e PIKE, 2004),. (4.17) O ponto de corte do crtéro de Farrs e Law é dado pela equação abaxo, sendo que os parâmetros p e b são ajustes relatvos à contamnação por EG (PRATA, 2009): (4.18) 48

62 Outro crtéro apresentado por OZYURT e PIKE (2004) é baseado em algumas característcas da Função de Influênca do Estmador Robusto, como o ponto de máxmo, ponto de mínmo, ou pontos de nflexão das dervadas prmera e segunda. Esses pontos podem ser escolhdos de forma sstemátca e quanto menor o ponto de corte, a detecção de Erros Grosseros pode ser melhorada, mas também podendo aumentar a quantdade de falsas detecções de EG e aumentar a varânca do valor estmado. Convém ressaltar que o ponto de corte do crtéro de Farrs e Law se stua na parte descendente da Função de Influênca (OZYURT e PIKE, 2004). Apesar da exstênca de um ponto de corte no estmador redescendente de três partes de Hampel, exstem três constantes (a, b, c) que devem ser ajustadas de forma a garantr um ajuste do estmador aos dados estatístcos. Esse ajuste ou seleção de modelo de probabldade é um ponto fundamental no estudo de estmadores robustos, vsto que se o mesmo não estver corretamente ajustado, os valores estmados poderão ser totalmente nefcazes, por exemplo, apresentando um valor de desvo ( bas ) sgnfcatvo, o que pode ndcar um valor de sensbldade a erros grosseros (γ) alto para a amostra. Assm, na próxma seção será apresentada uma das formas de ajuste das constantes de um estmador robusto, a qual é baseada na mnmzação do índce de um crtéro de nformação, que é uma forma efcente e consagrada para a determnação e ajuste das constates de estmadores. O crtéro utlzado é o Crtéro de Informação de Akake e serão tratados alguns aspectos sobre o ajuste dos estmadores, especfcamente o estmador redescendente de três partes de Hampel. 4.5 Ajuste do Estmador Redescendente de Hampel Os estmadores do tpo redescendentes pertencem a uma ampla famíla de Dstrbuções de Probabldade e, dessa forma, torna-se necessáro realzar o ajuste dos seus parâmetros a fm de ajustá-lo à sére de amostras. No caso do estmador de Hampel é necessáro ajustar as constantes a, b, e c, as quas estão ndcadas na equação (4.13) de forma a ajustar o estmador ao membro correto dessa famíla de Dstrbuções de Probabldade. 49

63 O ajuste dessas constantes pode parecer um problema dos estmadores redescendentes, mas sob outra ótca, esse ajuste do sstema que está sendo montorado serve para melhorar a efcênca na detecção de erros grosseros e noprocesso de reconclação de dados. Observa-se que o problema do ajuste das constates dos estmadores robustos anda é um problema pouco explorado e de alguma forma não fo dada toda a mportânca a esse assunto (RONCHETTI, 1997a). Assm, consderamos que anda exste muto a ser explorado nessa área. Os estmadores robustos do tpo M propostos por HUBER devem satsfazer as equações (4.1) e (4.2), mas para os estmadores redescendentes a solução de n x T 0 não é únca, pos os valores acma de c são todos nulos. Uma forma de n determnar a solução desse problema é encontrar o mínmo global de x T. 1 Outras formas de solução podem ser seleconar soluções próxmas à medana; ou utlzar uma solução aproxmada, por exemplo, usando o método de Newton-Raphson (HAMPEL et al, 1986). 1 Como os estmadores robustos pertencem a uma famíla de dstrbuções, o ajuste dos parâmetros do estmador é de fundamental mportânca. Na fgura 4.3 pode-se verfcar que ao se varar os valores das constantes, a sensbldade a erros grosseros (γ) e o ponto de rejeção são alterados. A sensbldade em relação a desvo de medda ( local-shft sensvty ) não se altera, devdo à proporção mantda entre as constantes a, b e c, nesse exemplo (vde equação 6.6). Dependendo do valor das constantes de ajuste a, b,e c, o valor estmado também pode mudar. Assm, se o estmador não estver com a sntona desses parâmetros feta adequadamente, os valores estmados serão mprecsos e nefcentes, assm como a rejeção a Erros Grosseros. Uma forma de realzar o ajuste adequado dos parâmetros de um estmador fo apresentada por ARORA e BIEGLER (2001) e a mesma utlza um crtéro de nformação para obtenção do melhor ajuste das constantes do estmador robusto de três partes de Hampel. 50

64 Fgura 4.3: Função de Influênca (IF) do Estmador de Três Partes de Hampel em função do ajuste dos parâmetros a, b e c. ARORA e BIEGLER (2001) utlzaram o Crtéro de Informação de Akake (AKAIKE, 1974) e um procedmento em dos passos e teratvo para determnar o melhor. As constantes são escolhdas em um prmero passo e depos de calculados os valores ótmos das constantes a, b, e c, em um segundo passo, utlza-se essas constantes para resolver o problema da reconclação de dados e dentfcação de erros grosseros. O objetvo do prmero passo desse procedmento é mnmzar o crtéro de Akake em relação às constantes de ajuste do estmador. Incalmente devem-se estabelecer dos conjuntos de valores das constantes a, b e c, de forma que um valor mínmo do AIC esteja entre os valores do AIC correspondentes a esses dos valores escolhdos prevamente (AIC abc1 < AIC <AIC abc2 ). Como as constantes a, b e c obedecem a uma relação de proporconaldade (vde equação 6.6), as constantes b e a sãs obtdas dretamente em função do valor atrbuído à constante c. Os valores de AIC de cada extremo são obtdos por meo de testes prévos e uma vez que um valor de mínmo do AIC esteja estmado entre esses dos valores extremos 51

65 do AIC (AIC abc1 e AIC abc2 ), um algortmo de busca, no caso, o da seção áurea, é aplcado para obter as melhores constantes a, b e c que mnmzem o AIC. Após a determnação das constantes a, b e c que mnmzam o AIC, elas devem ser utlzadas no estmador de três partes de Hampel e utlzadas nessa segunda parte do procedmento, na solução do problema da Reconclação de Dados e Identfcação de Erros Grosseros. No trabalho de WONGRAT et al. (2001) fo utlzada a relação obtda por YAMAMURA et al. (1988), onde fo pressuposto que a contamnação do erro possuía dstrbução Normal com méda zero e varânca conhecda. Essa relação é apresentada abaxo e também fo a utlzada no trabalho de VALDETARO e SCHIRRU (2009); AIC m no M x 1 ~ x 2 2. n o, (4.19) onde M x é a -ésma varável medda, x~ é o valor estmado, σ o desvo padrão da - ésma varável, m é o número total de meddas, n o é o número de Erros Grosseros detectados, O prmero termo da equação (4.16) é o crtéro de ajuste, enquanto o segundo termo é uma penaldade. Após a determnação do melhor ajuste para as constantes a, b e c, pode-se utlzar a constante c como ndcado na equação (4.15) para detecção de Erros Grosseros no problema da Reconclação de Dados. 4.6 Consderações sobre os Estmadores Robustos e o método de ajuste das constantes do Estmador Redescendente de Hampel Observando os concetos sobre robustez apresentados em HAMPEL (1974), seção 4.5, os requstos báscos para um estmador robusto são a fraca reação a pequenas perturbações, ou seja, o valor estmado não é alterado na presença de pequenas perturbações ou pequenos desvos na função de probabldade assocada à contamnação do erro e, que sejam seguros na presença de Erros Grosseros em quantdade e com magntude sgnfcatva, o que mplca em um alto ponto de ruptura, ver equação (4.7). 52

66 Os estmadores robustos devem possur um lmte superor em relação à nfluênca relatva de qualquer contamnação, o que corresponde a um valor mínmo da sensbldade a erros grosseros γ, ver equação (4.4). Outro ponto mportante é mpor uma clara separação entre o conjunto de dados meddos ou amostrados e Erros Grosseros, o que sgnfca um adequado e baxo ponto de rejeção ζ, ver equação (4.6), e anda estmar efcentemente a quantdade correta. Convém ressaltar que sensbldade a erros grosseros γ, como ndcado na equação (4.4), é um índce que mede a por nfluênca que uma contamnação determnada pode ter sobre o valor do estmador (HAMPEL et al., 1986) e sendo este fnto pode ser vsto como o desvo assntótco do estmador. Na fgura 4.3, pode-se observar que as característcas da Função de Influênca do estmador de três partes de Hampel mudam ao se varar o valor das constantes a, b e c, sendo que, consderando o ajuste das constantes usando o crtéro de Akake, a mnmzação da constante a, b e c leva a um valor mínmo àa sensbldade a erros grosseros e o ponto de rejeção, conforme explcado acma. Consderando-se as propredades favoráves descrtas acma e nerentes ao Estmador de Três Partes de Hampel e que não estão presentes em uma parcela sgnfcatva de outros, será desenvolvdo no próxmo capítulo um método para efetuar a estratéga de ajuste das constantes do estmador de três partes de Hampel smultaneamente à reconclação robusta de dados e a dentfcação de erros grosseros. O método proposto nesta tese é baseado na mnmzação dreta de um índce de desempenho, que é o Crtéro de Informação de Akake Robusto, e consste em uma característca novadora deste trabalho, a qual é aplcada ao problema de Reconclação de Dados e à Identfcação de Erros Grosseros e apresentada adante. Outro ponto mportante na utlzação de um estmador robusto no problema da reconclação de dados e dentfcação de erros grosseros é que a mesma pode ser não lnear e não convexa, e o cálculo efetuado pelo algortmo de otmzação pode levar a uma solução com um mínmo local. Dessa forma, deve-se recorrer a um algortmo de otmzação global. 53

67 Métodos de otmzação baseados na teora evoluconára como o Algortmo Genétco (GA) e o algortmo baseado em enxame de partículas são algortmos de otmzação globas, portanto, uma alternatva promssora aos métodos tradconas. Baseado em dversos trabalhos utlzando algortmos evoluconáros como o Algortmo Genétco modfcado proposto por WONGRAT et al. (2005) e da efcáca no uso do algortmo de otmzação por enxame de partículas como ndcado nos trabalhos de VALDETARO e SCHIRRU (2009, 2011) e PRATA et al. (2009, 2010), nesta tese será utlzado no seu desenvolvmento o algortmo de otmzação por enxame de partículas padrão. Na próxma seção, será apresentado uma vsão geral do método de otmzação baseada em enxame de partículas que é um algortmo que tem se mostrado robusto quando aplcado a dversos problemas e ele será utlzado na solução do problema de RD e IEG neste trabalho, como será mostrado no capítulo 5. Os estmadores robustos parecem uma alternatva promssora para aplcação no problema da Reconclação de Dados e Identfcação de Erros Grosseros. Porém, a etapa de ajuste das constantes dos estmadores acrescenta uma fase a mas no problema de RD e na IEG. 4.7 Algortmo de Optmzação por Enxame de Partículas Dversas técncas evoluconáras são nspradas na evolução natural que ocorre na natureza, por exemplo, Programação Genétca (PG) e Algortmos Genétcos. Os ndvíduos que pertencem a uma população trazem consgo característcas própras ou codfcadas, que acabarão por fazer parte da solução fnal do problema. Essas característcas são alteradas através de operações semelhantes às transformações que ocorrem nos genes de um ser vvo, por exemplo, mutação, seleção, cruzamento ou crossover e reprodução as quas dependem de uma função de custo ou de ajuste ( ftness ) de cada ndvíduo (SHI e EBERHART, 1998). KENNEDY e EBERHART (1995) propuseram um algortmo dferente baseado no comportamento socal de um grupo ao competr por um determnado recurso. Esse 54

68 algortmo fo baseado no comportamento de um bando de pássaros ao dsputar almento e como já colocado é denomnado Algortmo de Otmzação por Enxame de Partículas ou PSO, que é uma abrevatura do termo em nglês ( Partcle Swarm Optmzaton ). No algortmo PSO não ocorrem manpulações genétcas. Ao nvés dsso, as partículas se movmentam numa estratéga que mstura cooperação e competção entre elas (SHI e EBERHART, 1998). A cada passo, as partículas ou ndvíduos ajustam sua experênca de vôo (posção, dreção e velocdade) baseadas na sua própra experênca ou nas nformações da sua melhor função de custo e nas nformações da melhor função de custo de todo o grupo ou na melhor nformação global. Cada elemento do grupo representa uma partícula e cada uma delas é uma potencal solução para o problema. Cada partícula é tratada como um ponto em um espaço n-dmensonal e a -ésma partícula é representada por: 1, x2, n X x, x (4.20) A equação abaxo representa a taxa de varação da posção (velocdade) para a -ésma partícula. 1, v2, n V v, v (4.21) A melhor posção ndvdual (P ) ou a que possu a melhor função de custo para a partícula consderada está apresentada na equação (4.22) e a melhor posção global (P g ) ou a que possu o melhor ajuste ( ftness ) entre todas as partículas está representada na equação (4.23)., p, 1 2 n P p, p (4.22) g g, x, 1 g 2 gn P x, x (4.23) 55

69 A cada teração (k) a posção e a velocdade são atualzadas conforme as equações abaxo: P( k) X ( k) c. rand. P ( k) X ( ) V ( k 1) wv. ( k) c. rand g k (4.24) X ( k 1) X ( k) V ( k 1), (4.25) onde c 1 e c 2 são duas constantes postvas, rand 1 e rand 2 são dos números aleatóros no ntervalo [0, 1] e w é o fator de nérca. No lado dreto da equação (4.24) o segundo termo representa a parte cogntva em relação ao ndvíduo ou o julgamento ndvdual da partícula. O tercero termo representa o comportamento socal ou global, que ndca a parcela de colaboração entre todos os ndvíduos (SHI e EBERHART, 1998). As constantes c 1 e c 2 podem ser ajustadas para se colocar mas peso na parte relatva ao ndvíduo ou na parte socal, respectvamente. A equação (4.24) ajusta a nova velocdade da partícula em função de três fatores: a) a velocdade da últma teração que pode ser multplcada por um fator de nérca de forma a regular a extensão do espaço de busca; b) a dferença entre a posção atual e a melhor posção do ndvíduo e c) a dferença entre a posção atual da partícula e a melhor posção encontrada entre os elementos do grupo, ou melhor, posção global. A fgura 4.4 ndca a condção ncal da últma teração (k), que corresponde a posção ncal (X ) e a velocdade ncal (V ). Os valores P, P g e X correspondem respectvamente à melhor posção ndvdual, à melhor posção global e à solução do problema ou valor ótmo. 56

70 p X' V (k) p g x (k) Fgura 4.4: Condção ncal para o cálculo da nova posção ndcando a últma posção e a velocdade da últma teração (k). A nova posção é ajustada de acordo com a equação (4.25) e depende da posção atual mas a parcela ndvdual da velocdade calculada na equação (4.24). A fgura 4.5 ndca as três componentes que compõem o cálculo da velocdade ndcado na equação (4.24), que correspondem à velocdade da teração anteror multplcada pelo fator de nérca e pelos termos relatvos à parte cogntva ou do ndvíduo e à parte relatva ao comportamento global. O desempenho da partícula é avalado em função de uma função de custo prevamente determnada e que é função do problema. A fgura 4.6 ndca a nova posção da partícula na teração (k+1) de acordo com a equação (4.25) e a mesma depende da posção atual mas a parcela ndvdual da velocdade calculada na equação (4.24). Pode-se observar que a nova posção corresponde a uma posção ntermedára entre a melhor posção ndvdual e a melhor posção global e essa posção é regulada pelas constantes c 1 e c 2, cujos valores retratam o compromsso entre o comportamento ndvdual e o socal e estão assocados a um efeto estocástco em cada componente. 57

71 p V (k+1) X' o c 1.rand 1.[p - x ] x (k) w.v (k) c 2.rand 2.[p g - x ] p g Fgura 4.5: Representação Gráfca da Velocdade na teração (k+1), conforme a equação (4.24) p X (k+1) X'o V (k+1) P g X (k) Fgura 4.6: Representação gráfca da posção da partícula na teração (k+1), conforme equação (4.25). O algortmo de otmzação por enxame de partículas (PSO) mostra-se robusto e efcente na solução de uma vasta gama de problemas, como problemas não lneares, 58

72 não dferencáves e multmodas. Assm, o algortmo PSO parece uma solução natural para a aplcação na Reconclação de dados ou Reconclação de dados Robusta. Nesta tese será utlzado o algortmo PSO padrão proposto por KENNEDY e EBERHART (1995), da mesma forma que desenvolvdo e utlzado em VALDETARO E SCHIRRU (2009, 2011). As constantes de ajuste são aquelas usualmente recomendadas, por exemplo, em BRATON e KENNEDY (2007) e KENNEDY (2007), cujos valores constantes são: w=0.7298, c1=2.05, c2=

73 CAPÍTULO 5: RECONCILIAÇÃO ROBUSTA DE DADOS COM SELEÇÃO DE MODELO DE PROBABILIDADE SIMULTÂNEA Introdução Conforme fo apresentado no capítulo 4, a etapa de seleção de modelo de probabldade é uma parte crucal no ajuste de estmadores robustos. Na utlzação do estmador de três partes de Hampel ou de outro estmador robusto não há uma função de dstrbução de probabldade defnda a pror. Assm, torna-se dfícl a realzação de testes de hpótese a fm de garantr que uma determnada função de dstrbução seja a mas adequada para a amostra em análse. Em alguns estmadores como o obtdo pela função Far, pode-se relaconar um índce de desempenho, p. ex., a efcênca assntótca, com uma constante de ajuste do estmador, mas esse índce não traz nformações precsas sobre a varânca do mesmo. Dessa forma, outros índces, como a efcênca relatva, são calculados por meo de smulações e pelo uso do método Monte Carlo e as constantes obtdas, pressupondo que o estmador tem uma efcênca pré-determnada, por exemplo 95%, em relação a uma determnada dstrbução (OZYURT e PIKE, 2004). Nos trabalhos de OZYURT e PIKE (2004), BASU e PALIWAL (1989) e PRATA et al. (2008) é possível verfcar a comparação do desempenho de dversos estmadores, como os estmadores de Andrew, de Bsquare, de Welsch e outros obtdos por meo de smulação e testes baseados nas metodologas ndcadas acma. Outros crtéros de seleção de modelos de probabldade são aqueles baseados em um crtéro de nformação, onde este crtéro é utlzado como ajuste ou índce para medr qual modelo se ajusta melhor a um conjunto de dados (HAMPEL et al., 1986 e BOZDOGAN, 2000), ou seja, para uma determnada constante do estmador, o valor do 60

74 índce de desempenho é calculado, por exemplo o valor do AIC, e aquele modelo de probabldade do estmador que obtver o menor índce é o escolhdo. A mnmzação de um crtéro de nformação não traz nformação dreta ou específca sobre algum modelo de probabldade, mas é uma forma adequada de obter o melhor ajuste no senso estatístco para esse modelo (SPANOS, 2010). Na aplcação da estatístca robusta, a nformação sobre a função de dstrbução ou modelo de probabldade adequado em um prmero momento não é o prncpal objetvo, pos parte-se da premssa de que há uma contamnação da amostra e da dfculdade de se obter essa função de dstrbução determnada. Assm, a utlzação de um crtéro de nformação mostra-se um camnho adequado para a seleção de modelo de probabldade com estmadores robustos. Deve-se ressaltar que outros resultados sobre a adequação de uma função estatístca aplcada ao problema devem ser analsados, para dar maor confabldade aos dados estmados. Dversos crtéros são encontrados na lteratura e podem-se ctar o crtéro de MALLOW Cp e o Crtéro de Informação de Akake, que fo descrto na seção 3.3. Esses métodos são consagrados, efcentes, mas são baseados na hpótese que a dstrbução do erro é Normal, com méda zero e varânca conhecda, o que os torna índces sensíves ao erro grossero, vsto que são baseados no estmador de mínmos quadrados (AGOSTINELLI, 2002). A suposção de que o erro possu dstrbução Normal é uma aproxmação que nem sempre ocorre na prátca. Em relação ao Crtéro de Informação de Akake, o mesmo não pode ser utlzado com estmadores robustos (HAMPEL et al., 1986), vsto que o mesmo pressupõe a dstrbução do erro Normal e a presença de Erros Grosseros afeta o seu cálculo. Dessa forma, um crtéro de nformação com característcas mas abrangentes e que possa ser utlzado com estmadores robustos e aplcado à seleção de modelo é desejável. 5.2 Crtéro de Informação de Akake Robusto RONCHETTI (1985 e 1997a) propôs uma versão Robusta do Crtéro de Informação de Akake (AICR), que corresponde exatamente ao estmador de Máxma 61

75 Verossmlhança, só que para os M-estmadores, classe essa, da qual os estmadores robustos fazem parte (HAMPEL et al., 1986). O Crtéro de Informação de Akake Robusto (AICR) é defndo por AICR( k,, ) (2). m 1 x ~ x ( ˆ, ). k, (5.1) onde α é constante, ρ é a função que defne o M-estmador, θ corresponde as constantes de ajuste do M-estmador, m é o número de observações, x são as meddas do processo, x~ correspondem aos valores estmados, ˆ advém de uma estmatva robusta da varânca (σ 2 ) e k é o número de parâmetros ndependentes do estmador (HAMPEL et al., 1986). No trabalho de RONCHETTI (1985), a relação proposta por AKAIKE (1974) e que corresponde bascamente ao crtéro de nformação de KULLBACK-LIEBLER, que ndca a dscrepânca ( dstânca ) entre a função densdade de probabldade verdadera e a função densdade que se deseja ajustar, é defnda a partr da equação abaxo, sendo que o AIC é defndo na equação (3.28): I( q, p) 2( q p) AIC p, AICq,.. 1 (5.2) Substtundo-se o Crtéro de Informação de Akake, pela versão robusta (AICR) apresentada na equação (5.1) a relação acma adqure a segunte forma: I( q, p) 2( q p) AICR p, AICR q,.. 1 (5.3) Comparando as equações (5.2) e (5.3) RONCHETTI (1985) mostra que o Crtéro de Informação de Akake Robusto (AICR) é o correspondente natural do Crtéro de Informação de Akake ao se utlzar estmadores e testes robustos. Pode-se observar na equação (5.1), que o crtéro AICR, da mesma forma que o crtéro AIC, possu dos termos. O prmero é um termo correspondente ao ajuste dos dados e o segundo corresponde a uma penaldade para evtar o ajuste excessvo ou 62

76 solução trval ( sobreajuste ). O valor do índce AICR corresponderá a uma relação ou compromsso entre o melhor valor de ajuste e a penalzação. Neste trabalho a determnação exata do valor da constante α não será aprofundada, mas a mesma é pouco menor do que 2 de acordo com RONCHETTI (1985, 1997a) e no caso da constante do estmador de Huber, a mesma está entre os valores 1.3 e 1.6. O objetvo do processo de seleção de modelo de probabldade baseado no crtéro de nformação de Akake Robusto (AICR) vsa mnmzar o índce AICR, conforme ndcado na equação (5.1), a fm de determnar o modelo de probabldade que se ajusta à maora dos dados meddos, levando em conta que o erro não possu dstrbução normal exata. O valor da constante k para uso na reconclação de dados é dado pelo número de parâmetros do modelo mas o número de erros grosseros dentfcados (n o ), que quando utlza um estmador redescendente, em especal o estmador de três partes de Hampel, é obtdo dretamente pela equação (4.15). 2 Na equação 5.1, a constante α, o valor estmado da varânca ˆ e o valor da constante k são prevamente determnados. Dessa forma, para dentfcar o melhor M- estmador, é necessáro utlzar um algortmo de otmzação global, que nesse trabalho é o algortmo baseado na ntelgênca de exames ou PSO, escolhdo devdo às característcas postvas já dentfcadas em trabalhos anterores de PRATA (2009) e VALDETARO e SCHIRRU (2009). Devdo aos resultados promssores, o algortmo PSO mostrou-se uma alternatva vável e efcente quando aplcado à reconclação de dados e dentfcação de erros grosseros. 5.3 Método smultâneo para Reconclação Robusta de Dados, Identfcação de Erros Grosseros e Seleção de Modelo baseado no Crtéro de Informação de Akake Robusto (AICR) Convém ressaltar que o processo de reconclação de dados fca mas robusto ao se utlzar um M-estmador no lugar da função objetvo baseada no erro quadrátco ou mínmos quadrados ponderados. 63

77 Nesse trabalho, o estmador robusto a ser utlzado é o estmador redescendente de três partes de Hampel, apresentado na equação (4.13). Observando-se a formulação geral apresentada na equação (3.1), o problema da reconclação robusta de dados e dentfcação de erros grosseros adqure a segunte forma: mn ~ x, u, p 1 F h( ~ x, u, p) 0 g( ~ x, u, p) 0 n H x ~ x ( ) ˆ s. t. x u p L L L ~ x u x u p p U U U,, (5.4) onde, x é o valor meddo e ~ x o valor estmado da varável, FH corresponde ao estmador redescendente de três partes de Hampel, ˆ advém de uma estmatva robusta da varânca σ 2, p é o conjunto de parâmetros, u a varável não medda, h o conjunto de restrções de gualdade, g o conjunto de nequações, e os subscrtos L e U correspondem aos lmtes nferores e superores de ~ x, u e p. Consdera-se que as constantes do estmador F H já foram pré-determnadas. Observando os índces AIC e AICR, ambos são consttuídos por duas partes, a prmera parte corresponde ao termo de ajuste e a outra parte a um termo de penaldade, conforme se pode verfcar na equação (5.1). Consderando o problema de reconclação robusta de dados e dentfcação de erros grosseros apresentado na equação (5.4) acma, nota-se que a função objetvo nessa equação corresponde ao prmero termo ou termo de ajuste do Crtéro de Akake Robusto apresentado na equação (5.1), e neste trabalho especfcamente, o estmador (ρ) é o estmador de três partes de Hampel (F H ). Nota-se anda que o segundo termo do AICR (α.k) da equação (5.1) está relaconado com a detecção de erros grosseros, que no caso do estmador redescendente de Hampel está relaconado dretamente com a constante c. 64

78 Como menconado anterormente, o uso de um estmador robusto sem o devdo ajuste das constantes que proporconam a seleção do modelo de probabldade pode ocasonar resultados ndevdos e a utlzação da estratéga de reconclação de dados robusta, como a apresentada acma, na equação (5.4), pode smplesmente ser uma estratéga nefcente ou sem efeto. Entretanto, a mnmzação do índce AICR em relação às varáves de ajuste do estmador é uma forma de buscar o melhor ajuste ou um valor ótmo para esses parâmetros, de forma semelhante à mnmzação do índce AIC apresentado por ARORA e BIEGLER (2001) e WONGRAT et al. (2005) e explcado no tem 4.5. Observando as consderações acma, nota-se que a solução do problema de reconclação robusta de dados apresentado na equação (5.4) corresponde a mnmzar o AICR, a menos de um valor constante (α.k), dado um valor pré-determnado para as constantes de ajuste do M-estmador, enquanto o processo para determnar os valores da constantes de ajuste do M-estmador corresponde a mnmzar o AICR em relação a essas constantes para uma determnada amostra. Assm, baseado nas característcas comuns desses dos problemas, propõe-se neste trabalho a utlzação de uma nova função objetvo para ncorporar à solução do problema da reconclação de dados e dentfcação de erros grosseros a etapa de seleção de modelo de probabldade ou ajuste das constantes do estmador robusto, de forma que a RD e a IEG e a seleção de modelos sejam fetas de forma smultânea. Assm, a nova função objetvo proposta aqu para resolver smultaneamente o problema da reconclação de dados robusta, da dentfcação de erros grosseros e da seleção de modelo de probabldade é formada pelo termo de ajuste do crtéro de nformação AICR, que é o termo comum à formação do índce AICR e a função objetvo do problema de reconclação robusta de dados apresentado na equação (5.4), somada com o segundo termo do índce AICR, que corresponde à penaldade do referdo índce e está assocado à detecção de erros grosseros, além de evtar o ajuste excessvo ou solução trval ( overfttng ). Dessa forma a nova função objetvo adqure a segunte forma, 65

79 m x x ~ mn 2. FH ( x ~, u, p, ˆ 1 h( x ~, u, p) 0 g( x ~, u, p) 0 L, ). n p x u L L L x ~ u p U o x u p U U, U s. t., (5.5) onde, x é o valor meddo e ~ x é o valor estmado da varável, θ corresponde as constantes de ajuste do M-estmador, aqu, F H corresponde ao estmador redescendente de três partes de Hampel, ˆ advém de uma estmatva robusta da varânca σ 2 de cada componente, p é o conjunto de parâmetros, u a varável não medda, h o conjunto de restrções de gualdade, g o conjunto de nequações, e os subscrtos L e U correspondem aos lmtes nferores e superores de ~ x, u, p e θ. Nota-se que a estratéga apresentada no método proposto acma corresponde a mnmzar o Crtéro de Informação de Akake Robusto dretamente, otmzando o valor das constantes de ajuste do estmador e ao mesmo tempo resolvendo o problema da Reconclação de Dados e Identfcação de Erros Grosseros. Deve-se observar que no problema de reconclação de dados apresentado na equação (5.4), o valor do parâmetro θ é fxo, mas na nova função objetvo proposta aqu nesse trabalho, os parâmetros de ajuste (θ) correspondem as constantes de ajuste do M- estmador, que agora, nesse problema, são tratadas como varáves. Na formulação apresentada na equação (5.5), o termo relaconado à penaldade depende da determnação do número de erros grosseros (n o ), que no caso do estmador redescendente de três partes de Hampel pode ser calculado por meo da expressão apresentada na equação (4.15), que ndca o ponto de corte. Caso o valor do resíduo seja maor do que a constante de ajuste c há a ndcação de um erro grossero. Outro aspecto é como deve ser consderada a estmatva das três constantes (a, b e c) do estmador redescendente de três partes de Hampel. No caso de uma busca multdmensonal, o estmador pode perder a característca de resstênca e robustez. ARORA e BIEGLER (2001) sugerem manter uma relação de proporconaldade entre 66

80 essas constantes, como ndcado na equação (5.6). Essa relação de proporconaldade não é consderada ótma, mas pode fornecer um bom ajuste devdo a sua pouca nfluênca na função objetvo (ARORA e BIEGLER, 2001). c c b c c b 2a onde b e a, (5.6) Uma vez estabelecdas as condções relatvas às constantes de ajuste, o problema de reconclação robusta de dados utlzando o estmador de três partes de Hampel, dentfcação de erros grosseros e seleção de modelo smultânea assume a segunte forma, mn ~ x, u, c 2. h( ~ x, u ) 0 g( ~ x, u ) 0 b c 2 a c 4 1 n F H x ( ~ x ˆ, c) 1.9. n c L x u L L c o ~ x u s. t. x u U U (5.7) onde, x é o valor meddo e ~ x é o valor estmado da varável, c é o valor estmado da constante de ajuste do estmador robusto, F H corresponde ao estmador redescendente de três partes de Hampel, ˆ advém de uma estmatva robusta da varânca σ 2, u é a varável não medda, h é o conjunto de restrções de gualdade, g é o conjunto de nequações, e os subscrtos L e U correspondem aos lmtes nferores e superores de ~, u e c. x Deve-se ressaltar que a constante c corresponde à constante de ajuste do M- estmador e aqu a mesma é tratada como varável de decsão. Para o problema de RD e IEG, n o é dado pelo número de parâmetros mas o número de erros grosseros dentfcados. A constante α fo escolhda com um valor pouco menor do que 2, 67

81 conforme ndcado no trabalho de HAMPEL et. al. (1986) e o valor utlzado fo gual a 1,9. Ao resolver o problema acma utlzando o algortmo PSO, a solução ótma é o vetor solução correspondente à melhor posção global entre as dversas partículas. O vetor solução consste em n varáves estmadas mas a varável de ajuste do estmador c, resultando em um vetor solução com n+1 varáves, como ndcado abaxo: x n1 ~ x,x ~ 1 2,x ~,...,x ~,c 3 n (5.8) A utlzação da nova função objetvo proposta neste trabalho e ndcada na equação (5.5) e detalhada na equação (5.7) permte resolver três problemas smultaneamente: o prmero é obter uma solução para o problema da reconclação robusta de dados; o segundo é a seleção do modelo probablístco que melhor se ajusta aos dados estatístcos, assm obtendo o melhor ajuste das constantes do estmador e o tercero é a dentfcação da ocorrênca de erros grosseros dretamente. Dessa forma, para efeto de dentfcação desse novo método, neste trabalho o denomnaremos como método de Reconclação Robusta de Dados com Seleção de Modelo Smultânea (RDSMS). 5.4 Consderações sobre o Método de Reconclação Robusta de Dados com Seleção de Modelo Smultânea (RDSMS) O método RDSMS acrescentou uma melhora em relação a métodos anterores com a ntrodução da etapa de ajuste das constantes do estmador de forma smultânea, elmnando uma etapa préva de ajuste como apresentada no método proposto por ARORA e BIEGLER (2001) e WONGRAT et al. (2005). Consderando que outros métodos de reconclação de dados acabam por utlzar smulações para calcular índces de desempenho, como o cálculo da efcênca relatva, 68

82 a qual é determnada por meo de smulações e uso do método Monte Carlo, o método RDSMS aqu apresentado também mostra vantagens de uso sobre esses métodos (seção 5.1), vsto que o cálculo é feto de forma exata determnando o conjunto prncpal de dados e mnmzando os índces de desempenho do estmador robusto como a sensbldade a erros grosseros e dmnundo o desvo assntótco ( bas ). Outra vantagem é a facldade de mplementação do método RDSMS e também o uso de um algortmo de otmzação global efcente, que é o PSO, mplementado de forma padrão. Como a função objetvo depende de um horzonte de meddas para realzar a estmação robusta dos dados, o método RDSMS pode ser utlzado de forma dnâmca utlzando uma janela de dados de tamanho h, que se desloca a cada teração. Dessa forma, se a característca da estatístca dos dados sofrer alguma alteração, o método RDSMS se auto-ajusta, calculando as constantes do estmador a cada teração. Convém observar que o método RDSMS pode ser aplcado utlzando outros estmadores, mas esse assunto deve ser anda pesqusado em mas detalhes e nesta tese não serão fetas quasquer avalações ou comparações específcas entre dversos estmadores a fm de determnar o melhor tpo de estmador robusto a ser utlzado. Aqu consderamos que o estmador robusto de três partes de Hampel possu excelentes característcas, as quas já foram apresentadas anterormente, e que superam parte consderável dos estmadores robustos. Outra questão em aberto e não abordada neste trabalho, é a relação entre as constantes de ajuste do estmador de Hampel e a proporconaldade entre elas, que pode ser explorada a fm de se obter proporções entre elas que atendam melhores índces de robustez, como a sensbldade a desvos na medda (λ). No próxmo capítulo, serão apresentados os resultados de exemplos smulados e aplcações em cenáro real a fm de mostrar as característcas efetvas do método de Reconclação de Dados Robusta com Seleção de Modelo Smultânea (RDSMS). Serão apresentados os resultados de dos exemplos smulados e um exemplo com dados reas da usna de Angra 2 que utlzam a técnca apresentada nesta tese, com o ntuto de avalar o desempenho do método proposto. 69

83 CAPÍTULO 6: RESULTADOS Introdução Neste capítulo serão apresentados os resultados obtdos com a mplementação do método RDSMS. Para fns de avalação do método proposto, ncalmente será feto um ajuste não smultâneo, baseado na estratéga proposta por ARORA e BIEGLER (2001), mas utlzando o crtéro de nformação robusto (AICR), determnando assm, o valor ótmo das constantes a, b, e c do estmador de três partes de Hampel para o problema consderado. Uma vez determnados os valores ótmos ou quase ótmos das constantes de ajuste, será feta a comparação desses valores ótmos com aqueles obtdos com o método RDSMS proposto neste trabalho. Dessa mesma forma serão analsados dos exemplos. O prmero corresponde a um sstema não lnear, que é bastante utlzado como benchmark por dversos autores para avalar o desempenho de város métodos (PAI e FISHER, 1988). O segundo corresponde a uma realzação do balanço de massa smplfcado de uma turbna a vapor de um crcuto secundáro de uma usna nuclear (NPP) típca, o qual fo baseado na norma VDI-2048 (2000) e usado aqu com dados smulados no cálculo da potênca térmca do reator. O tercero exemplo corresponde a uma realzação de um balanço de massa smplfcado de uma turbna a vapor do crcuto secundáro da usna nuclear de Angra 2, que utlza dados reas obtdos do processo. Estes dados serão utlzados off-lne, ou seja, os dados da planta são gravados em ntervalos regulares em um arquvo e após a gravação dos mesmos, o arquvo gerado é utlzado como entrada para o método desenvolvdo nesse trabalho. O objetvo prncpal desta aplcação é avalar apenas o método proposto neste trabalho em um cenáro realsta, embora smplfcado. 70

84 Convém ressaltar que os dados obtdos da usna de Angra 2 são uma amostragem do processo e não são aqueles aproprados para qualquer avalação ou nferênca sobre as condções da usna ou seu desempenho. 6.2 Exemplo Não lnear (PAI e FISHER, 1988) Este exemplo consdera a aplcação da reconclação de dados e dentfcação de erros grosseros a um sstema não lnear extraído do trabalho de PAI e FISHER (1988) e testado também no trabalho de WONGRAT et al. (2005) com um algortmo genétco modfcado, em ARORA e BIEGLER (2001) com um estmador redescendente e usando um método de otmzação convenconal, em TJOA e BIEGLER (1991), ZHOU et al. (2006), VALDETARO e SCHIRRU (2009) e em dversos outros trabalhos. Neste exemplo será apresentado o resultado da aplcação do método automátco proposto nesta tese (tem 6.3) e também apresentado em VALDETARO e SCHIRRU (2011a e b). O Problema possu cnco varáves meddas (x ) e três varáves não meddas (u ) e ses restrções não lneares, a saber: 2x1 + x2.x3.u1 + u2 - u = 0 (6.1a) x1-0.7x 2 + x3.u1 + x2.u1.u2 + 2x3.u = 0 (6.1b) x 3 1-2x2 + 3x1.x3-2x2u1 - x2.u2.u = 0 (6.1c) 0.5 x3.u1 - x1 + 3x2 + x1.u2 - x3.u = 0 (6.1d) 3 x x1 - x + u2 + 3u = 0 (6.1e) 3 x 3 5-2x3.u2.u = 0 (6.1f) 71

85 O sstema acma possu a segunte solução exata: x e = , ,1.9260,1.4560, (6.2a) u e = , , (6.2b) o valor de As cnco varáves meddas são smuladas de acordo com a equação (6.3), onde x é smulado adconando-se o ruído (η) com desvo padrão σ =0.1 e erro grossero (ι) correspondente a 25σ. x = x e (6.3) Para as varáves não meddas (u ), utlza-se a técnca proposta por PRAKOTPOL e SRINOPHAKUN (2003) para a solução do sstema de equações e obtenção de uma solução vável. Dvdem-se as varáves do problema em dos grupos: varáves meddas, x, e varáves não meddas. Os valores das meddas são aqueles gerados pelo algortmo de otmzação, que aqu é o algortmo baseado na ntelgênca de enxames de partículas. As varáves não meddas são calculadas em função dos valores das varáves meddas por meo da solução smultânea do sstema de equação, que fca reduzdo, após substtur o valor de cada varável ndependente pelo valor gerado pelo PSO. Neste exemplo foram gerados 100 valores para cada componente x de acordo com a equação (6.3), que corresponde ao horzonte de meddas h gual a 100. Esses dados correspondem as varáves meddas e smulam dados adqurdos em tempo real. Cada componente das varáves meddas foram corrompdas por 20 erros grosseros cada, ou seja, os 20 prmeros erros grosseros foram adconados às 20 prmeras meddas da varável x 1, os próxmos 20 erros grosseros foram adconados à varável x 2 após as prmeras 20 meddas de x 2 e assm por dante até a componente x 5 e completar 100 erros grosseros. 72

86 O algortmo fo mplementado para trabalhar como uma janela dnâmca com horzonte de tamanho H cujo valor de H é gual a 100, sendo que, a cada cclo, um novo valor é ldo e o valor mas antgo é descartado, mantendo-se o horzonte de meddas constante. Como a janela dnâmca se desloca uma medda a cada cclo, para que ela possa se deslocar, foram acrescentadas 100 meddas guas às geradas ncalmente para cada componente, totalzando 200 meddas, assm, em um determnado nstante t, o estmador utlza no cálculo da f o as 100 meddas do horzonte de tempo em cada componente desde o nstante t-100 e dentfca o erro grossero no nstante t. O mesmo padrão de ocorrênca dos erros grosseros fo mantdo para efeto de smplfcação e o objetvo é avalar a robustez do estmador na presença dos dversos erros grosseros gerados e também a capacdade do estmador dentfcar corretamente em quas varáves meddas ocorreram erros grosseros no cclo corrente. A função objetvo para o problema proposto reflete o apresentado na equação (5.7) é está ndcado abaxo. mn 2. x, u, c 5 1 H 100 j1 H x ~ x, c1. no F j 9, (6.4) onde F H corresponde ao modelo de dstrbução do estmador redescendente de três partes de Hampel conforme a equação (4.13) e as restrções do problema são dadas pelas equações (6.1a-f) e a relação entra as constantes obedecem a aquelas ndcadas na equação (5.6). Este exemplo fo ncalmente utlzado para avalar o comportamento e desempenho do algortmo baseado em enxame de partículas ao se utlzar na função objetvo o estmador redescendente de três partes de Hampel (4.13). Além dsso, o trabalho servu para verfcar a forma de ajuste das constantes conforme proposto no trabalho de WONGRAT et al. (2005). 73

87 Uma avalação mas detalhada sobre o comportamento e desempenho do algortmo PSO aplcado à reconclação robusta de dados e dentfcação de erros grosseros com o uso do estmador redescendente de Hampel pode ser consultada no trabalho de VALDETARO e SCHIRRU (2009) e na mesma época nos trabalhos de PRATA (2009) e PRATA et al. (2009) menconando o uso do algortmo PSO na reconclação robusta de dados com o estmador de Welsch e estmador quadrátco, respectvamente. O algortmo PSO mplementado fo o PSO padrão com os seguntes parâmetros usuas e constantes: w=0.7298, c1=2.05, c2=2.05. Foram utlzadas 60 partículas (np) e cerca de 120 terações (n) a cada passo. Baseado nos efetvos resultados obtdos no ajuste off-lne em ARORA e BIEGLER (2001), WONGRAT et al. (2005) e VALDETARO e SCHIRRU (2009), a metodologa para valdar o procedmento de reconclação de dados robusta, dentfcação de erros grosseros e seleção de modelo smultâneas fo a de comparar o resultado obtdo com este procedmento, com o resultado da estratéga de ajuste manual ou off-lne como apresentada no tem 4.5, utlzando o índce de desempenho AICR ao nvés do índce AIC. A tabela 6.1 apresenta os resultados do ajuste feto manualmente ou off-lne, que estão apresentados nas lnhas R1 a R8. Em cada lnha, nas colunas de x 1 a x 5 e de u1 a u3, estão ndcadas a melhor posção global entre as partículas (p g ), n o é o número de erros grosseros, AICR é o Crtéro de Informação de Akake Robusto, X e corresponde a solução exata. Na tabela 6.1 abaxo, em relação ao ajuste realzado separadamente ( off-lne ), pode-se determnar que o valor mínmo do AICR encontra-se entre os valores R4 e R6 e há ndcação de que o mesmo esteja muto próxmo ao valor R5. Pode-se notar que para os ajustes a partr de R5 até R8 o valor de AICR aumenta devdo à perda na qualdade da estmação e aumento do número de erros grosseros detectados. Em relação aos valores R1 e R2 o aumento do índce AICR aumenta devdo à nfluênca do termo de ajuste que é mas sgnfcatvo do que o número de erros grosseros e ndca também uma perda na qualdade da estmação. 74

88 Tabela Resultados do ajuste off-lne do estmador redescendente (R1-R8) e valores calculados, obtdos com o método RDSMS (Xopt). Estm. M-estmator constants AICR n o x1 x2 x3 x4 x5 u1 u2 u3 R1 a= b= c= R2 a= b= c= R3 a= b= c= R4 a= b= c= R5 a= b= c= R6 a= b= c= R7 a= b= c= R8 a= b= c= Xe Xopt a= b= c= Eopt 0, , , , , , , ,00241 Após determnar os valores ótmos ou quase ótmos para o ajuste manual ou off-lne, que se stua entre os ajustes R4 e R6, o próxmo passo fo obter o valor ótmo das varáves x 1 a x 5 e u1 a u3 aplcando o método RDSMS, ou método automátco, e avalar seu comportamento e desempenho. O resultado obtdo com a aplcação do método RDSMS está mostrado também na tabela 6.1, na lnha ndcada por X opt e corresponde ao valor esperado e obtdo utlzando o método off-lne, ou seja, entre os valores R4 e R6 e muto perto do valor R5 (c=0.2446). Observa-se anda que na solução X opt, o número de erros grosseros fo estmado corretamente. Exste anda uma pequena dferença entre os resultados do ajuste off-lne e do método automátco, que é atrbuída a pouca precsão do método de busca utlzado no ajuste não smultâneo. A fgura 6.1 apresenta o resultado do ajuste automátco, mostrando um gráfco ndcando o comportamento do índce AICR versus a constante de ajuste do estmador robusto (c) baseado nos valores R1 a R8 da tabela 6.1 e o valor de X opt, que é o valor da constante c obtdo pelo método RDSMS e está ndcado na tabela 7.1 (0.2446, ). O resultado obtdo com o método RDSMS ndca sua efcênca ao detectar o número correto de erros grosseros em cada varável e que os valores estmados estão 75

89 muto próxmos dos valores exatos, ndcados na lnha X e (ver tabela 6.1, E opt = Abs(X e - X opt )). Todos os erros grosseros foram dentfcados, ndcando uma efcênca de 100% na detecção consderando o teste proposto, onde o erro grossero smulava o comportamento de um sensor travado em fundo de escala. Fgura 6.1 Gráfco AICR x constante de ajuste c Os testes foram realzados em um computador Core 2 Duo, 1.6 GHz, e cada passo teve um valor de duração médo de 175 segundos. 6.3 Exemplo de Cálculo da Potênca do Reator baseado na norma VDI Este exemplo consdera a aplcação do método smultâneo para a reconclação de dados, dentfcação de erros grosseros e seleção de modelo de probabldade ao cálculo da potênca térmca de um reator nuclear do tpo PWR, baseado na norma VDI (2000), cujo dagrama fo apresentado no capítulo 2 e apresentado em VALDETARO e SCHIRRU (2011a). 76

90 A utlzação do exemplo baseado na norma VDI-2048 tem como objetvo permtr a comparação e a avalação de desempenho entre o método clássco e o método automátco proposto neste trabalho. O Dagrama Smplfcado do Crcuto Secundáro de uma Usna Nuclear tpo PWR fo apresentado na fgura 2.2 e de acordo com o exemplo da norma VDI-2048 (2000), o balanço de massa está descrto na seção 2.3. As restrções do processo ou os balanços de massa foram determnados nas equações (2.6) a (2.8) e um vetor x de varáves meddas fo formado para a aplcação do método de reconclação de dados: mgv1, mgv2, mag1,mfag2, mv,mc,ma7,ma6,ma5,mhpc, m T X ou. (6.5) x, x, x, x, x, x, x, x, x, x, x Nesse exemplo, os valores exatos das varáves ndcadas na norma VDI-2048 (2000) foram corrompdos por erros aleatóros, sendo que, as varáves de x 1 a x 4 também foram corrompdas por 20 erros grosseros cada. Nestas componentes foram adconados 20 erros grosseros a x 1, mas 20 erros grosseros foram adconados a x 2 e assm por dante, até a componente x 4, totalzando-se 80 erros grosseros. Da mesma forma que no tem anteror, o algortmo fo mplementado para trabalhar como uma janela dnâmca com horzonte de tamanho H cujo valor neste exemplo é gual a 100, sendo que, a cada novo valor ldo, o valor mas antgo é descartado, mantendo-se o horzonte de meddas constante. Como a janela dnâmca se desloca uma medda a cada cclo, para que ela possa se deslocar, foram acrescentadas 100 meddas guas às geradas ncalmente para cada componente, totalzando 200 meddas, assm, em um determnado nstante t, o estmador utlza no cálculo da f o as 100 meddas do horzonte de tempo anterores ao nstante t e dentfca o erro grossero no nstante atual. O mesmo padrão de ocorrênca dos erros grosseros fo mantdo para efeto de smplfcação e o objetvo é avalar a robustez do estmador na presença dos dversos 77

91 erros grosseros gerados nos nstantes passados e também a capacdade do estmador dentfcar corretamente em quas varáves meddas ocorreram erros grosseros no cclo corrente. As quatro varáves meddas foram smuladas de acordo com a equação (6.3), onde o valor de x é smulado adconando-se o valor exato mas o ruído (η) com desvo padrão σ =0.1 e mas o erro grossero (ι) correspondente a 25σ. O algortmo PSO mplementado fo o PSO padrão com os seguntes parâmetros usuas e constantes: w=0.7298, c1=2.05, c2=2.05. Foram utlzadas 120 partículas (np) e cerca de 160 terações (n) a cada passo. O prmero passo fo realzar um ajuste off-lne ou manualmente, de forma semelhante ao proposto em ARORA e BIEGLER (2001) e WONGRAT et al. (2005), mas ao nvés de utlzar o Crtéro de Informação de Akake, fo utlzado o AICR, pos o estmador utlzado é um estmador robusto. A tabela 6.2 apresenta os resultados obtdos com o ajuste off-lne (R1-R9) e entre esses valores de AICR obtdos, pode-se localzar um valor mínmo entre os resultados R6 e R7, para c=0.5 e c=0.25, respectvamente. Tabela Resultados do ajuste off-lne do estmador redescendente (R1-R9) e valores calculados obtdos com o método RDSMS (Xopt). Rx(a.b.c.AICR.no) x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 R1 (2; 4; 8; ; 0) R2 (1; 2; 4; ; 0) R3 (0.75; 1.5; 3; ; 0) R4 (0.5; 1; 2; ; 0) R5 (0.25; 0.5; 1; ; 80) R6 (0.125; 0.25; 0.5; ; 80) R7 (0.0625; 0.125; 0.25; ; 80) R8( ; ; 0.125; ; 364) R9(0.025; 0.05; 0.100; ; 437) Xe Xopt(0.0766; ; ; ; 80) Eopt

92 Da mesma forma que no exemplo anteror apresentado no tem 6.2, o próxmo passo fo obter o valor ótmo das varáves x 1 a x 11 aplcando o método RDSMS e avalar seu comportamento e desempenho. O resultado do ajuste com o método RDSMS está apresentado na lnha X opt da tabela 6.2 e corresponde a um valor ótmo com a constante de ajuste c= Este valor está dentro do ntervalo prevsto no ajuste off-lne realzado na prmera parte deste exemplo, ou seja, entre as meddas R6 e R7 da tabela 6.2. O resultado obtdo com o método RDSMS destaca sua efcênca ao detectar o número correto de erros grosseros em cada varável, que são 80 erros grosseros no total, com os valores estmados (X opt ) muto próxmos dos valores exatos, ndcados na lnha X e (ver tabela 6.2, E opt = Abs(X e -X opt )). Todos os erros grosseros foram dentfcados, ndcando uma efcênca de 100% na detecção consderando o teste proposto. O erro grossero smulava o comportamento de um sensor travado em fundo de escala. A fgura 6.2 apresenta um gráfco ndcando o comportamento do índce AICR versus a constante de ajuste do estmador robusto (c) baseado nos valores R1 a R9 da tabela 6.2 e o valor de X opt calculado pelo método RDSMS ndcado na tabela 6.2 (0.3063, ). É mportante ressaltar que o método RDSMS proposto neste trabalho mostrou comportamento semelhante nos dos exemplos apresentados nos tens 6.2 e 6.3, sendo que os resultados calculados por ele (x opt ) se stuaram entre os valores prevstos no método de ajuste em separado ( off-lne ) e a quantdade de erros grosseros dentfcada fo a correta. Na próxma seção serão fetas consderações relatvas à aplcação do método RDSMS ao cálculo da potênca térmca do reator do tpo PWR, baseado no exemplo extraído da norma VDI 2048 (2000) e exemplfcada nesta seção e no tem

93 Fgura 6.2 Gráfco AICR x constante de ajuste c Consderações sobre o cálculo da potênca térmca do reator A potênca térmca do reator (P R ) pode ser calculada a partr da determnação da carga térmca do Gerador de Vapor ( Q GV ), que endo proporconal à vazão total de água de almentação (m ag = m ag1 + m ag2 ) é calculada pela equação (2.2) e reapresentada abaxo para efeto de maor clareza na exposção, GV hs he mag Q., (6.6) onde h s é a entalpa do fludo na saída do Gerador de Vapor (GV), h e é a entalpa do fludo na entrada do GV.. O valor da entalpa do fludo depende da temperatura e pressão do meo, ou seja, na entrada e na saída do GV, que em condções estáves ou em regme permanente pode-se assumr que são constantes. Como os processos de medção de pressão e temperatura possuem boa precsão e estas varáves são constantes, pode-se assumr que a medda da entalpa também é constante e conhecda com boa precsão. 80

4 Critérios para Avaliação dos Cenários

4 Critérios para Avaliação dos Cenários Crtéros para Avalação dos Cenáros É desejável que um modelo de geração de séres sntétcas preserve as prncpas característcas da sére hstórca. Isto quer dzer que a utldade de um modelo pode ser verfcada

Leia mais

3 Metodologia de Avaliação da Relação entre o Custo Operacional e o Preço do Óleo

3 Metodologia de Avaliação da Relação entre o Custo Operacional e o Preço do Óleo 3 Metodologa de Avalação da Relação entre o Custo Operaconal e o Preço do Óleo Este capítulo tem como objetvo apresentar a metodologa que será empregada nesta pesqusa para avalar a dependênca entre duas

Leia mais

Algarismos Significativos Propagação de Erros ou Desvios

Algarismos Significativos Propagação de Erros ou Desvios Algarsmos Sgnfcatvos Propagação de Erros ou Desvos L1 = 1,35 cm; L = 1,3 cm; L3 = 1,30 cm L4 = 1,4 cm; L5 = 1,7 cm. Qual destas meddas está correta? Qual apresenta algarsmos com sgnfcado? O nstrumento

Leia mais

Curso de extensão, MMQ IFUSP, fevereiro/2014. Alguns exercício básicos

Curso de extensão, MMQ IFUSP, fevereiro/2014. Alguns exercício básicos Curso de extensão, MMQ IFUSP, feverero/4 Alguns exercíco báscos I Exercícos (MMQ) Uma grandeza cujo valor verdadero x é desconhecdo, fo medda três vezes, com procedmentos expermentas dêntcos e, portanto,

Leia mais

2 Incerteza de medição

2 Incerteza de medição 2 Incerteza de medção Toda medção envolve ensaos, ajustes, condconamentos e a observação de ndcações em um nstrumento. Este conhecmento é utlzado para obter o valor de uma grandeza (mensurando) a partr

Leia mais

REGRESSÃO NÃO LINEAR 27/06/2017

REGRESSÃO NÃO LINEAR 27/06/2017 7/06/07 REGRESSÃO NÃO LINEAR CUIABÁ, MT 07/ Os modelos de regressão não lnear dferencam-se dos modelos lneares, tanto smples como múltplos, pelo fato de suas varáves ndependentes não estarem separados

Leia mais

RISCO. Investimento inicial $ $ Taxa de retorno anual Pessimista 13% 7% Mais provável 15% 15% Otimista 17% 23% Faixa 4% 16%

RISCO. Investimento inicial $ $ Taxa de retorno anual Pessimista 13% 7% Mais provável 15% 15% Otimista 17% 23% Faixa 4% 16% Análse de Rsco 1 RISCO Rsco possbldade de perda. Quanto maor a possbldade, maor o rsco. Exemplo: Empresa X va receber $ 1.000 de uros em 30 das com títulos do governo. A empresa Y pode receber entre $

Leia mais

RAD1507 Estatística Aplicada à Administração I Prof. Dr. Evandro Marcos Saidel Ribeiro

RAD1507 Estatística Aplicada à Administração I Prof. Dr. Evandro Marcos Saidel Ribeiro UNIVERIDADE DE ÃO PAULO FACULDADE DE ECONOMIA, ADMINITRAÇÃO E CONTABILIDADE DE RIBEIRÃO PRETO DEPARTAMENTO DE ADMINITRAÇÃO RAD1507 Estatístca Aplcada à Admnstração I Prof. Dr. Evandro Marcos adel Rbero

Leia mais

7 - Distribuição de Freqüências

7 - Distribuição de Freqüências 7 - Dstrbução de Freqüêncas 7.1 Introdução Em mutas áreas há uma grande quantdade de nformações numércas que precsam ser dvulgadas de forma resumda. O método mas comum de resumr estes dados numércos consste

Leia mais

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental.

É o grau de associação entre duas ou mais variáveis. Pode ser: correlacional ou experimental. Prof. Lorí Val, Dr. val@mat.ufrgs.br http://www.mat.ufrgs.br/~val/ É o grau de assocação entre duas ou mas varáves. Pode ser: correlaconal ou expermental. Numa relação expermental os valores de uma das

Leia mais

3 A técnica de computação intensiva Bootstrap

3 A técnica de computação intensiva Bootstrap A técnca de computação ntensva ootstrap O termo ootstrap tem orgem na expressão de língua nglesa lft oneself by pullng hs/her bootstrap, ou seja, alguém levantar-se puxando seu própro cadarço de bota.

Leia mais

CORRELAÇÃO E REGRESSÃO

CORRELAÇÃO E REGRESSÃO CORRELAÇÃO E REGRESSÃO Constata-se, freqüentemente, a estênca de uma relação entre duas (ou mas) varáves. Se tal relação é de natureza quanttatva, a correlação é o nstrumento adequado para descobrr e medr

Leia mais

NOVA METODOLOGIA PARA RECONCILIAÇÃO DE DADOS: CONSTRUÇÃO DE BALANÇÃO HÍDRICOS EM INDÚSTRIA UTILIZANDO O EMSO

NOVA METODOLOGIA PARA RECONCILIAÇÃO DE DADOS: CONSTRUÇÃO DE BALANÇÃO HÍDRICOS EM INDÚSTRIA UTILIZANDO O EMSO I Congresso Baano de Engenhara Santára e Ambental - I COBESA NOVA METODOLOGIA PARA RECONCILIAÇÃO DE DADOS: CONSTRUÇÃO DE BALANÇÃO HÍDRICOS EM INDÚSTRIA UTILIZANDO O EMSO Marcos Vnícus Almeda Narcso (1)

Leia mais

Os modelos de regressão paramétricos vistos anteriormente exigem que se suponha uma distribuição estatística para o tempo de sobrevivência.

Os modelos de regressão paramétricos vistos anteriormente exigem que se suponha uma distribuição estatística para o tempo de sobrevivência. MODELO DE REGRESSÃO DE COX Os modelos de regressão paramétrcos vstos anterormente exgem que se suponha uma dstrbução estatístca para o tempo de sobrevvênca. Contudo esta suposção, caso não sea adequada,

Leia mais

Regressão Múltipla. Parte I: Modelo Geral e Estimação

Regressão Múltipla. Parte I: Modelo Geral e Estimação Regressão Múltpla Parte I: Modelo Geral e Estmação Regressão lnear múltpla Exemplos: Num estudo sobre a produtvdade de trabalhadores ( em aeronave, navos) o pesqusador deseja controlar o número desses

Leia mais

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr. Prof. Lorí Val, Dr. val@mat.ufrgs.br http://www.mat.ufrgs.br/~val/ É o grau de assocação entre duas ou mas varáves. Pode ser: correlaconal ou expermental. Prof. Lorí Val, Dr. UFRG Insttuto de Matemátca

Leia mais

Aula Características dos sistemas de medição

Aula Características dos sistemas de medição Aula - Característcas dos sstemas de medção O comportamento funconal de um sstema de medção é descrto pelas suas característcas (parâmetros) operaconas e metrológcas. Aqu é defnda e analsada uma sére destes

Leia mais

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel MOQ-14 PROJETO e ANÁLISE de EPERIMENTOS Professor: Rodrgo A. Scarpel rodrgo@ta.br www.mec.ta.br/~rodrgo Prncípos de cração de modelos empírcos: Modelos (matemátcos, lógcos, ) são comumente utlzados na

Leia mais

Estatística II Antonio Roque Aula 18. Regressão Linear

Estatística II Antonio Roque Aula 18. Regressão Linear Estatístca II Antono Roque Aula 18 Regressão Lnear Quando se consderam duas varáves aleatóras ao mesmo tempo, X e Y, as técncas estatístcas aplcadas são as de regressão e correlação. As duas técncas estão

Leia mais

Análise Exploratória de Dados

Análise Exploratória de Dados Análse Exploratóra de Dados Objetvos Análse de duas varáves quanttatvas: obter uma reta que se ajuste aos dados segundo o crtéro de mínmos quadrados; apresentar outros crtéros para a determnação de uma

Leia mais

Eletroquímica 2017/3. Professores: Renato Camargo Matos Hélio Ferreira dos Santos.

Eletroquímica 2017/3. Professores: Renato Camargo Matos Hélio Ferreira dos Santos. Eletroquímca 2017/3 Professores: Renato Camargo Matos Hélo Ferrera dos Santos http://www.ufjf.br/nups/ Data Conteúdo 07/08 Estatístca aplcada à Químca Analítca Parte 2 14/08 Introdução à eletroquímca 21/08

Leia mais

DIAGNÓSTICO EM MODELOS LINEARES GENERALIZADOS

DIAGNÓSTICO EM MODELOS LINEARES GENERALIZADOS DIAGNÓSTICO EM MODELOS LINEARES GENERALIZADOS 1 A análse de dagnóstco (ou dagnóstco do ajuste) confgura uma etapa fundamental no ajuste de modelos de regressão. O objetvo prncpal da análse de dagnóstco

Leia mais

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr. Prof. Lorí Val, Dr. val@mat.ufrgs.br http://www.mat.ufrgs.br/~val/ 1 É o grau de assocação entre duas ou mas varáves. Pode ser: correlaconal ou expermental. Numa relação expermental os valores de uma das

Leia mais

Variação ao acaso. É toda variação devida a fatores não controláveis, denominadas erro.

Variação ao acaso. É toda variação devida a fatores não controláveis, denominadas erro. Aplcação Por exemplo, se prepararmos uma área expermental com todo cudado possível e fzermos, manualmente, o planto de 100 sementes seleconadas de um mlho híbrdo, cudando para que as sementes fquem na

Leia mais

2 Metodologia de Medição de Riscos para Projetos

2 Metodologia de Medição de Riscos para Projetos 2 Metodologa de Medção de Rscos para Projetos Neste capítulo remos aplcar os concetos apresentados na seção 1.1 ao ambente de projetos. Um projeto, por defnção, é um empreendmento com metas de prazo, margem

Leia mais

UNIDADE IV DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC)

UNIDADE IV DELINEAMENTO INTEIRAMENTE CASUALIZADO (DIC) UNDADE V DELNEAMENTO NTERAMENTE CASUALZADO (DC) CUABÁ, MT 015/ PROF.: RÔMULO MÔRA romulomora.webnode.com 1. NTRODUÇÃO Este delneamento apresenta como característca prncpal a necessdade de homogenedade

Leia mais

Gráficos de Controle para Processos Autocorrelacionados

Gráficos de Controle para Processos Autocorrelacionados Gráfcos de Controle para Processos Autocorrelaconados Gráfco de controle de Shewhart: observações ndependentes e normalmente dstrbuídas. Shewhart ao crar os gráfcos de controle não exgu que os dados fossem

Leia mais

1. CORRELAÇÃO E REGRESSÃO LINEAR

1. CORRELAÇÃO E REGRESSÃO LINEAR 1 CORRELAÇÃO E REGREÃO LINEAR Quando deseja-se estudar se exste relação entre duas varáves quanttatvas, pode-se utlzar a ferramenta estatístca da Correlação Lnear mples de Pearson Quando essa correlação

Leia mais

Associação entre duas variáveis quantitativas

Associação entre duas variáveis quantitativas Exemplo O departamento de RH de uma empresa deseja avalar a efcáca dos testes aplcados para a seleção de funconáros. Para tanto, fo sorteada uma amostra aleatóra de 50 funconáros que fazem parte da empresa

Leia mais

MODELOS DE REGRESSÃO PARAMÉTRICOS

MODELOS DE REGRESSÃO PARAMÉTRICOS MODELOS DE REGRESSÃO PARAMÉTRICOS Às vezes é de nteresse nclur na análse, característcas dos ndvíduos que podem estar relaconadas com o tempo de vda. Estudo de nsufcênca renal: verfcar qual o efeto da

Leia mais

Figura 8.1: Distribuição uniforme de pontos em uma malha uni-dimensional. A notação empregada neste capítulo para avaliação da derivada de uma

Figura 8.1: Distribuição uniforme de pontos em uma malha uni-dimensional. A notação empregada neste capítulo para avaliação da derivada de uma Capítulo 8 Dferencação Numérca Quase todos os métodos numércos utlzados atualmente para obtenção de soluções de equações erencas ordnáras e parcas utlzam algum tpo de aproxmação para as dervadas contínuas

Leia mais

6 Modelo Proposto Introdução

6 Modelo Proposto Introdução 6 Modelo Proposto 6.1. Introdução Neste capítulo serão apresentados detalhes do modelo proposto nesta dssertação de mestrado, onde será utlzado um modelo híbrdo para se obter prevsão de carga curto prazo

Leia mais

Programa de Certificação de Medidas de um laboratório

Programa de Certificação de Medidas de um laboratório Programa de Certfcação de Meddas de um laboratóro Tratamento de dados Elmnação de dervas Programa de calbração entre laboratóros Programa nterno de calbração justes de meddas a curvas Tratamento dos resultados

Leia mais

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA

1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA 1. ANÁLISE EXPLORATÓRIA E ESTATÍSTICA DESCRITIVA 014 Estatístca Descrtva e Análse Exploratóra Etapas ncas. Utlzadas para descrever e resumr os dados. A dsponbldade de uma grande quantdade de dados e de

Leia mais

CAPÍTULO 2 DESCRIÇÃO DE DADOS ESTATÍSTICA DESCRITIVA

CAPÍTULO 2 DESCRIÇÃO DE DADOS ESTATÍSTICA DESCRITIVA CAPÍTULO DESCRIÇÃO DE DADOS ESTATÍSTICA DESCRITIVA. A MÉDIA ARITMÉTICA OU PROMÉDIO Defnção: é gual a soma dos valores do grupo de dados dvdda pelo número de valores. X x Soma dos valores de x número de

Leia mais

Programa do Curso. Sistemas Inteligentes Aplicados. Análise e Seleção de Variáveis. Análise e Seleção de Variáveis. Carlos Hall

Programa do Curso. Sistemas Inteligentes Aplicados. Análise e Seleção de Variáveis. Análise e Seleção de Variáveis. Carlos Hall Sstemas Intelgentes Aplcados Carlos Hall Programa do Curso Lmpeza/Integração de Dados Transformação de Dados Dscretzação de Varáves Contínuas Transformação de Varáves Dscretas em Contínuas Transformação

Leia mais

2 Agregação Dinâmica de Modelos de Turbinas e Reguladores de Velocidade: Teoria

2 Agregação Dinâmica de Modelos de Turbinas e Reguladores de Velocidade: Teoria Agregação Dnâmca de Modelos de urbnas e Reguladores de elocdade: eora. Introdução O objetvo da agregação dnâmca de turbnas e reguladores de velocdade é a obtenção dos parâmetros do modelo equvalente, dados

Leia mais

5 Relação entre Análise Limite e Programação Linear 5.1. Modelo Matemático para Análise Limite

5 Relação entre Análise Limite e Programação Linear 5.1. Modelo Matemático para Análise Limite 5 Relação entre Análse Lmte e Programação Lnear 5.. Modelo Matemátco para Análse Lmte Como fo explcado anterormente, a análse lmte oferece a facldade para o cálculo da carga de ruptura pelo fato de utlzar

Leia mais

O problema da superdispersão na análise de dados de contagens

O problema da superdispersão na análise de dados de contagens O problema da superdspersão na análse de dados de contagens 1 Uma das restrções mpostas pelas dstrbuções bnomal e Posson, aplcadas usualmente na análse de dados dscretos, é que o parâmetro de dspersão

Leia mais

RECONCILIAÇÃO ROBUSTA DE DADOS UTILIZANDO O SIMULADOR EMSO

RECONCILIAÇÃO ROBUSTA DE DADOS UTILIZANDO O SIMULADOR EMSO RECONCILIAÇÃO ROBUSTA DE DADOS UTILIZANDO O SIMULADOR EMSO I. SARRUF, D. Q. F. MENEZES, L. S. SANTOS e D. M. PRATA Unversdade Federal Flumnense, Departamento de Engenhara Químca e de Petróleo. Unversdade

Leia mais

Introdução às Medidas em Física a Aula

Introdução às Medidas em Física a Aula Introdução às Meddas em Físca 4300152 8 a Aula Objetvos: Experênca Curvas Característcas Meddas de grandezas elétrcas: Estudar curvas característcas de elementos resstvos Utlzação de um multímetro Influênca

Leia mais

UMA ABORDAGEM ALTERNATIVA PARA O ENSINO DO MÉTODO DOS MÍNIMOS QUADRADOS NO NÍVEL MÉDIO E INÍCIO DO CURSO SUPERIOR

UMA ABORDAGEM ALTERNATIVA PARA O ENSINO DO MÉTODO DOS MÍNIMOS QUADRADOS NO NÍVEL MÉDIO E INÍCIO DO CURSO SUPERIOR UNIVERSIDADE FEDERAL DE JUIZ DE FORA INSTITUTO DE CIÊNCIAS EATAS DEPARTAMENTO DE ESTATÍSTICA UMA ABORDAGEM ALTERNATIVA PARA O ENSINO DO MÉTODO DOS MÍNIMOS QUADRADOS NO NÍVEL MÉDIO E INÍCIO DO CURSO SUPERIOR

Leia mais

EXERCÍCIO: VIA EXPRESSA CONTROLADA

EXERCÍCIO: VIA EXPRESSA CONTROLADA EXERCÍCIO: VIA EXPRESSA CONTROLADA Engenhara de Tráfego Consdere o segmento de va expressa esquematzado abaxo, que apresenta problemas de congestonamento no pco, e os dados a segur apresentados: Trechos

Leia mais

ÍNDICE DE CONSISTÊNCIA TEMPORAL: UM NOVO MÉTODO PARA AVALIAÇÃO DA ESTABILIDADE TEMPORAL DE ARMAZENAMENTO DE ÁGUA NO SOLO

ÍNDICE DE CONSISTÊNCIA TEMPORAL: UM NOVO MÉTODO PARA AVALIAÇÃO DA ESTABILIDADE TEMPORAL DE ARMAZENAMENTO DE ÁGUA NO SOLO Anas Eletrônco ÍNDICE DE CONSISTÊNCIA TEMPORAL: UM NOVO MÉTODO PARA AVALIAÇÃO DA ESTABILIDADE TEMPORAL DE ARMAZENAMENTO DE ÁGUA NO SOLO Anderson Takash Hara, Heraldo Takao Hashgut, Antôno Carlos Andrade

Leia mais

ANÁLISE DAS TENSÕES TÉRMICAS EM MATERIAIS CERÂMICOS. Palavras-chave: Tensões térmicas, Propriedades variáveis, Condução de calor, GITT

ANÁLISE DAS TENSÕES TÉRMICAS EM MATERIAIS CERÂMICOS. Palavras-chave: Tensões térmicas, Propriedades variáveis, Condução de calor, GITT ANÁLISE DAS TENSÕES TÉRMICAS EM MATERIAIS CERÂMICOS Dnz, L.S. Santos, C.A.C. Lma, J.A. Unversdade Federal da Paraíba Laboratóro de Energa Solar LES/DTM/CT/UFPB 5859-9 - João Pessoa - PB, Brasl e-mal: cabral@les.ufpb.br

Leia mais

IMPLEMENTAÇÃO DO MÉTODO DE FATORAÇÃO DE INTEIROS CRIVO QUADRÁTICO

IMPLEMENTAÇÃO DO MÉTODO DE FATORAÇÃO DE INTEIROS CRIVO QUADRÁTICO IMPLEMENTAÇÃO DO MÉTODO DE FATORAÇÃO DE INTEIROS CRIVO QUADRÁTICO Alne de Paula Sanches 1 ; Adrana Betâna de Paula Molgora 1 Estudante do Curso de Cênca da Computação da UEMS, Undade Unverstára de Dourados;

Leia mais

Análise de Incertezas I.B De Paula

Análise de Incertezas I.B De Paula Um bom expermentalsta deve fazer todo o esforço possível para mnmzar os erros de seu expermento. Cabe ao expermentalsta a responsabldade de apresentar uma medda da confabldade de seus dados. amos defnr

Leia mais

DELINEAMENTOS EXPERIMENTAIS

DELINEAMENTOS EXPERIMENTAIS SUMÁRIO 1 Delneamentos Expermentas 2 1.1 Delneamento Interamente Casualzado..................... 2 1.2 Delneamento Blocos Casualzados (DBC).................... 3 1.3 Delneamento Quadrado Latno (DQL)......................

Leia mais

Modelo linear normal com erros heterocedásticos. O método de mínimos quadrados ponderados

Modelo linear normal com erros heterocedásticos. O método de mínimos quadrados ponderados Modelo lnear normal com erros heterocedástcos O método de mínmos quadrados ponderados Varâncas homogêneas Varâncas heterogêneas y y x x Fgura 1 Ilustração da dstrbução de uma varável aleatóra y (condconal

Leia mais

Contabilometria. Aula 8 Regressão Linear Simples

Contabilometria. Aula 8 Regressão Linear Simples Contalometra Aula 8 Regressão Lnear Smples Orgem hstórca do termo Regressão Le da Regressão Unversal de Galton 1885 Galton verfcou que, apesar da tendênca de que pas altos tvessem flhos altos e pas axos

Leia mais

INTRODUÇÃO À CALIBRAÇÃO MULTIVARIADA

INTRODUÇÃO À CALIBRAÇÃO MULTIVARIADA INTRODUÇÃO À CALIBRAÇÃO MULTIVARIADA APLICAÇÃO NO CONTROLE DE QUALIDADE DE FÁRMACOS Prof. Dr. Marcelo Martns de Sena MÓDULO 04 Undade Unverstára de Cêncas Eatas e Tecnológcas UnUCET Anápols 1 MÓDULO 04

Leia mais

Prof. Lorí Viali, Dr.

Prof. Lorí Viali, Dr. Prof. Lorí Val, Dr. vall@mat.ufrgs.br http://www.mat.ufrgs.br/~val/ Em mutas stuações duas ou mas varáves estão relaconadas e surge então a necessdade de determnar a natureza deste relaconamento. A análse

Leia mais

Análise de Regressão Linear Múltipla VII

Análise de Regressão Linear Múltipla VII Análse de Regressão Lnear Múltpla VII Aula 1 Hej et al., 4 Seções 3. e 3.4 Hpótese Lnear Geral Seja y = + 1 x 1 + x +... + k x k +, = 1,,..., n. um modelo de regressão lnear múltpla, que pode ser escrto

Leia mais

7 Tratamento dos Dados

7 Tratamento dos Dados 7 Tratamento dos Dados 7.. Coefcentes de Troca de Calor O úmero de usselt local é dado por h( r )d u ( r ) (7-) k onde h(r), o coefcente local de troca de calor é h( r ) q''- perdas T q''- perdas (T( r

Leia mais

O problema da superdispersão na análise de dados de contagens

O problema da superdispersão na análise de dados de contagens O problema da superdspersão na análse de dados de contagens 1 Uma das restrções mpostas pelas dstrbuções bnomal e Posson, aplcadas usualmente na análse de dados dscretos, é que o parâmetro de dspersão

Leia mais

DEFINIÇÃO - MODELO LINEAR GENERALIZADO

DEFINIÇÃO - MODELO LINEAR GENERALIZADO DEFINIÇÃO - MODELO LINEAR GENERALIZADO 1 Um modelo lnear generalzado é defndo pelos seguntes três componentes: Componente aleatóro; Componente sstemátco; Função de lgação; Componente aleatóro: Um conjunto

Leia mais

5 Implementação Procedimento de segmentação

5 Implementação Procedimento de segmentação 5 Implementação O capítulo segunte apresenta uma batera de expermentos prátcos realzados com o objetvo de valdar o método proposto neste trabalho. O método envolve, contudo, alguns passos que podem ser

Leia mais

4.1 Modelagem dos Resultados Considerando Sazonalização

4.1 Modelagem dos Resultados Considerando Sazonalização 30 4 METODOLOGIA 4.1 Modelagem dos Resultados Consderando Sazonalzação A sazonalzação da quantdade de energa assegurada versus a quantdade contratada unforme, em contratos de fornecmento de energa elétrca,

Leia mais

(1) A uma parede totalmente catalítica quanto para uma parede com equilíbrio catalítico. No caso de uma parede com equilíbrio catalítico, tem-se:

(1) A uma parede totalmente catalítica quanto para uma parede com equilíbrio catalítico. No caso de uma parede com equilíbrio catalítico, tem-se: 1 RELATÓRIO - MODIFICAÇÃO DA CONDIÇÃO DE CONTORNO DE ENTRADA: MODELOS PARCIALMENTE CATALÍTICO E NÃO CATALÍTICO PARA ESCOAMENTOS COM TAXA FINITA DE REAÇÃO 1. Condções de contorno Em escoamentos reatvos,

Leia mais

Modelo linear clássico com erros heterocedásticos. O método de mínimos quadrados ponderados

Modelo linear clássico com erros heterocedásticos. O método de mínimos quadrados ponderados Modelo lnear clássco com erros heterocedástcos O método de mínmos quadrados ponderados 1 Varâncas homogêneas Varâncas heterogêneas y y x x Fgura 1 Ilustração da dstrbução de uma varável aleatóra y (condconal

Leia mais

3 Elementos de modelagem para o problema de controle de potência

3 Elementos de modelagem para o problema de controle de potência 3 Elementos de modelagem para o problema de controle de potênca Neste trabalho assume-se que a rede de comuncações é composta por uma coleção de enlaces consttuídos por um par de undades-rádo ndvdualmente

Leia mais

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média.

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média. Estatístca Dscplna de Estatístca 0/ Curso de Admnstração em Gestão Públca Profª. Me. Valéra Espíndola Lessa e-mal: lessavalera@gmal.com Meddas de Dspersão Indcam se os dados estão, ou não, prómos uns dos

Leia mais

4 Discretização e Linearização

4 Discretização e Linearização 4 Dscretzação e Lnearzação Uma vez defndas as equações dferencas do problema, o passo segunte consste no processo de dscretzação e lnearzação das mesmas para que seja montado um sstema de equações algébrcas

Leia mais

Análise de Regressão

Análise de Regressão Análse de Regressão método estatístco que utlza relação entre duas ou mas varáves de modo que uma varável pode ser estmada (ou predta) a partr da outra ou das outras Neter, J. et al. Appled Lnear Statstcal

Leia mais

CONTROLADORES FUZZY. Um sistema de controle típico é representado pelo diagrama de blocos abaixo:

CONTROLADORES FUZZY. Um sistema de controle típico é representado pelo diagrama de blocos abaixo: CONTROLADORES FUZZY Um sstema de controle típco é representado pelo dagrama de blocos abaxo: entrada ou referênca - erro CONTROLADOR snal de controle PLANTA saída A entrada ou referênca expressa a saída

Leia mais

Introdução à Análise de Dados nas medidas de grandezas físicas

Introdução à Análise de Dados nas medidas de grandezas físicas Introdução à Análse de Dados nas meddas de grandezas físcas www.chem.wts.ac.za/chem0/ http://uregna.ca/~peresnep/ www.ph.ed.ac.uk/~td/p3lab/analss/ otas baseadas nos apontamentos Análse de Dados do Prof.

Leia mais

Cap. IV Análise estatística de incertezas aleatórias

Cap. IV Análise estatística de incertezas aleatórias TLF 010/11 Cap. IV Análse estatístca de ncertezas aleatóras Capítulo IV Análse estatístca de ncertezas aleatóras 4.1. Méda 43 4.. Desvo padrão 44 4.3. Sgnfcado do desvo padrão 46 4.4. Desvo padrão da méda

Leia mais

Capítulo 2. APROXIMAÇÕES NUMÉRICAS 1D EM MALHAS UNIFORMES

Capítulo 2. APROXIMAÇÕES NUMÉRICAS 1D EM MALHAS UNIFORMES Capítulo. Aproxmações numércas 1D em malhas unformes 9 Capítulo. AROXIMAÇÕS NUMÉRICAS 1D M MALHAS UNIFORMS O prncípo fundamental do método das dferenças fntas (MDF é aproxmar através de expressões algébrcas

Leia mais

Teoria da Regressão Espacial Aplicada a. Sérgio Alberto Pires da Silva

Teoria da Regressão Espacial Aplicada a. Sérgio Alberto Pires da Silva Teora da Regressão Espacal Aplcada a Modelos Genércos Sérgo Alberto Pres da Slva ITENS DE RELACIONAMENTOS Tópcos Báscos da Regressão Espacal; Banco de Dados Geo-Referencados; Modelos Genércos Robustos;

Leia mais

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel

MOQ-14 PROJETO e ANÁLISE de EXPERIMENTOS. Professor: Rodrigo A. Scarpel MOQ-4 PROJETO e ANÁLISE de EPERIMENTOS Professor: Rodrgo A. Scarpel rodrgo@ta.br www.mec.ta.br/~rodrgo Programa do curso: Semana Conteúdo Apresentação da dscplna. Prncípos de modelos lneares de regressão.

Leia mais

Representação e Descrição de Regiões

Representação e Descrição de Regiões Depos de uma magem ter sdo segmentada em regões é necessáro representar e descrever cada regão para posteror processamento A escolha da representação de uma regão envolve a escolha dos elementos que são

Leia mais

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média.

Ao se calcular a média, moda e mediana, temos: Quanto mais os dados variam, menos representativa é a média. Estatístca Dscplna de Estatístca 0/ Curso Superor de tecnólogo em Gestão Ambental Profª. Me. Valéra Espíndola Lessa e-mal: lessavalera@gmal.com Meddas de Dspersão Indcam se os dados estão, ou não, prómos

Leia mais

MOQ-14 PROJETO E ANÁLISE DE EXPERIMENTOS LISTA DE EXERCÍCIOS 1 REGRESSÃO LINEAR SIMPLES

MOQ-14 PROJETO E ANÁLISE DE EXPERIMENTOS LISTA DE EXERCÍCIOS 1 REGRESSÃO LINEAR SIMPLES MOQ-14 PROJETO E ANÁLISE DE EXPERIMENTOS LISTA DE EXERCÍCIOS 1 REGRESSÃO LINEAR SIMPLES 1. Obtenha os estmadores dos coefcentes lnear e angular de um modelo de regressão lnear smples utlzando o método

Leia mais

Experiência V (aulas 08 e 09) Curvas características

Experiência V (aulas 08 e 09) Curvas características Experênca (aulas 08 e 09) Curvas característcas 1. Objetvos 2. Introdução 3. Procedmento expermental 4. Análse de dados 5. Referêncas 1. Objetvos Como no expermento anteror, remos estudar a adequação de

Leia mais

Covariância na Propagação de Erros

Covariância na Propagação de Erros Técncas Laboratoras de Físca Lc. Físca e Eng. omédca 007/08 Capítulo VII Covarânca e Correlação Covarânca na propagação de erros Coefcente de Correlação Lnear 35 Covarânca na Propagação de Erros Suponhamos

Leia mais

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Classificadores Lineares. Luiz Eduardo S. Oliveira, Ph.D.

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Classificadores Lineares. Luiz Eduardo S. Oliveira, Ph.D. Unversdade Federal do Paraná Departamento de Informátca Reconhecmento de Padrões Classfcadores Lneares Luz Eduardo S. Olvera, Ph.D. http://lesolvera.net Objetvos Introduzr os o conceto de classfcação lnear.

Leia mais

Faculdade de Engenharia Optimização. Prof. Doutor Engº Jorge Nhambiu

Faculdade de Engenharia Optimização. Prof. Doutor Engº Jorge Nhambiu 1 Programação Não Lnear com Restrções Aula 9: Programação Não-Lnear - Funções de Váras Varáves com Restrções Ponto Regular; Introdução aos Multplcadores de Lagrange; Multplcadores de Lagrange e Condções

Leia mais

Equações Simultâneas

Equações Simultâneas Equações Smultâneas Caracterzação. Os modelos de equações smultâneasenvolvem mas de uma varável dependente, ou endógena, sendo necessáras tantas equações quanto for o número de varáves endógenas 2. Uma

Leia mais

Modelo Logístico. Modelagem multivariável com variáveis quantitativas e qualitativas, com resposta binária.

Modelo Logístico. Modelagem multivariável com variáveis quantitativas e qualitativas, com resposta binária. Modelagem multvarável com varáves quanttatvas e qualtatvas, com resposta bnára. O modelo de regressão não lnear logístco ou modelo logístco é utlzado quando a varável resposta é qualtatva com dos resultados

Leia mais

Modelo de Programação Estocástica

Modelo de Programação Estocástica Modelo de Programação Estocástca 23 2 Modelo de Programação Estocástca 2.. Concetos báscos A programação estocástca (PE) é defnda como um modelo de otmzação que apresenta um ou mas parâmetros estocástcos

Leia mais

CURSO A DISTÂNCIA DE GEOESTATÍSTICA

CURSO A DISTÂNCIA DE GEOESTATÍSTICA CURSO A DISTÂNCIA DE GEOESTATÍSTICA Aula 6: Estaconardade e Semvarânca: Estaconardade de a. ordem, Hpótese ntríseca, Hpótese de krgagem unversal, Crtéros para escolha, Verfcação, Representatvdade espacal,

Leia mais

UNIVERSIDADE DE PERNAMBUCO. Física Experimental. Prof o José Wilson Vieira

UNIVERSIDADE DE PERNAMBUCO. Física Experimental. Prof o José Wilson Vieira UNIVERSIDADE DE PERNAMBUCO ESCOLA POLITÉCNICA DE PERNAMBUCO Físca Expermental Prof o José Wlson Vera wlson.vera@upe.br AULA 01: PROCESSOS DE ANÁLISE GRÁFICA E NUMÉRICA MODELO LINEAR Recfe, agosto de 2015

Leia mais

Análise Exploratória de Dados

Análise Exploratória de Dados Análse Exploratóra de Dados Objetvos Análse de duas varáves quanttatvas: traçar dagramas de dspersão, para avalar possíves relações entre as duas varáves; calcular o coefcente de correlação entre as duas

Leia mais

MODELO RECEPTOR MODELO RECEPTOR MODELO RECEPTOR. Princípio do modelo:

MODELO RECEPTOR MODELO RECEPTOR MODELO RECEPTOR. Princípio do modelo: MODELO RECEPTOR Não modela a dspersão do contamnante. MODELO RECEPTOR Prncípo do modelo: Atacar o problema de dentfcação da contrbução da fonte em ordem nversa, partndo da concentração do contamnante no

Leia mais

Capítulo 1. Exercício 5. Capítulo 2 Exercício

Capítulo 1. Exercício 5. Capítulo 2 Exercício UNIVERSIDADE FEDERAL DE GOIÁS CIÊNCIAS ECONÔMICAS ECONOMETRIA (04-II) PRIMEIRA LISTA DE EXERCÍCIOS Exercícos do Gujarat Exercíco 5 Capítulo Capítulo Exercíco 3 4 5 7 0 5 Capítulo 3 As duas prmeras demonstrações

Leia mais

NOTA II TABELAS E GRÁFICOS

NOTA II TABELAS E GRÁFICOS Depto de Físca/UFMG Laboratóro de Fundamentos de Físca NOTA II TABELAS E GRÁFICOS II.1 - TABELAS A manera mas adequada na apresentação de uma sére de meddas de um certo epermento é através de tabelas.

Leia mais

Estudo quantitativo do processo de tomada de decisão de um projeto de melhoria da qualidade de ensino de graduação.

Estudo quantitativo do processo de tomada de decisão de um projeto de melhoria da qualidade de ensino de graduação. Estudo quanttatvo do processo de tomada de decsão de um projeto de melhora da qualdade de ensno de graduação. Rogéro de Melo Costa Pnto 1, Rafael Aparecdo Pres Espíndula 2, Arlndo José de Souza Júnor 1,

Leia mais

Capítulo 2. Modelos de Regressão

Capítulo 2. Modelos de Regressão Capítulo 2 Modelos de regressão 39 Capítulo 2 Modelos de Regressão Objetvos do Capítulo Todos os modelos são errados, mas alguns são útes George E P Box Algumas vezes fcamos assustados quando vemos engenheros

Leia mais

Redução dos Dados. Júlio Osório. Medidas Características da Distribuição. Tendência Central (Localização) Variação (Dispersão) Forma

Redução dos Dados. Júlio Osório. Medidas Características da Distribuição. Tendência Central (Localização) Variação (Dispersão) Forma Redução dos Dados Júlo Osóro Meddas Característcas da Dstrbução Tendênca Central (Localzação) Varação (Dspersão) Forma 1 Meddas Característcas da Dstrbução Meddas Estatístcas Tendênca Central Dspersão

Leia mais

RECONCILIAÇÃO DE DADOS EM COLUNAS DE DESTILAÇÃO UTILIZANDO O SIMULADOR EMSO

RECONCILIAÇÃO DE DADOS EM COLUNAS DE DESTILAÇÃO UTILIZANDO O SIMULADOR EMSO RECONCILIAÇÃO DE DADOS EM COLUNAS DE DESTILAÇÃO UTILIZANDO O SIMULADOR EMSO MENEZES, D. Q. F. 1, SARRUF, I. 1, PEIXOTO, F. C. 1 e PRATA, D. M. 1 1 Unversdade Federal Flumnense, Departamento de Engenhara

Leia mais

2 Modelos de Otimização sob Incerteza 2.1. Introdução

2 Modelos de Otimização sob Incerteza 2.1. Introdução 2 Modelos de Otmzação sob Incerteza 2.. Introdução Modelos de programação matemátca são comumente utlzados para solução de problemas de programação da produção, de logístca, de schedulng e de planejamento

Leia mais

METODOLOGIA PARA O CÁLCULO DE VAZÃO DE UMA SEÇÃO TRANSVERSAL A UM CANAL FLUVIAL. Iran Carlos Stalliviere Corrêa RESUMO

METODOLOGIA PARA O CÁLCULO DE VAZÃO DE UMA SEÇÃO TRANSVERSAL A UM CANAL FLUVIAL. Iran Carlos Stalliviere Corrêa RESUMO Semnáro Anual de Pesqusas Geodéscas na UFRGS, 2. 2007. UFRGS METODOLOGIA PARA O CÁLCULO DE VAZÃO DE UMA SEÇÃO TRANSVERSAL A UM CANAL FLUVIAL Iran Carlos Stallvere Corrêa Insttuto de Geocêncas UFRGS Departamento

Leia mais

3.6. Análise descritiva com dados agrupados Dados agrupados com variáveis discretas

3.6. Análise descritiva com dados agrupados Dados agrupados com variáveis discretas 3.6. Análse descrtva com dados agrupados Em algumas stuações, os dados podem ser apresentados dretamente nas tabelas de frequêncas. Netas stuações devemos utlzar estratégas específcas para obter as meddas

Leia mais

Modelagem do crescimento de clones de Eucalyptus via modelos não lineares

Modelagem do crescimento de clones de Eucalyptus via modelos não lineares Modelagem do crescmento de clones de Eucalyptus va modelos não lneares Joselme Fernandes Gouvea 2 Davd Venanco da Cruz 3 Máco Augusto de Albuquerque 3 José Antôno Alexo da Slva Introdução Os fenômenos

Leia mais

x Ex: A tabela abaixo refere-se às notas finais de três turmas de estudantes. Calcular a média de cada turma:

x Ex: A tabela abaixo refere-se às notas finais de três turmas de estudantes. Calcular a média de cada turma: Professora Janete Perera Amador 1 8 Meddas Descrtvas Vmos anterormente que um conjunto de dados pode ser resumdo através de uma dstrbução de freqüêncas, e que esta pode ser representada através de uma

Leia mais

Análise de Variância. Comparação de duas ou mais médias

Análise de Variância. Comparação de duas ou mais médias Análse de Varânca Comparação de duas ou mas médas Análse de varânca com um fator Exemplo Um expermento fo realzado para se estudar dabetes gestaconal. Desejava-se avalar o comportamento da hemoglobna (HbA)

Leia mais

SELEÇÃO DE MODELOS VOLUMÉTRICOS PARA CLONES DE EUCALYPTUS SPP., NO PÓLO GESSEIRO DO ARARIPE

SELEÇÃO DE MODELOS VOLUMÉTRICOS PARA CLONES DE EUCALYPTUS SPP., NO PÓLO GESSEIRO DO ARARIPE SELEÇÃO DE MODELOS VOLUMÉTRICOS PARA CLONES DE EUCALYPTUS SPP, NO PÓLO GESSEIRO DO ARARIPE Jáder da Slva Jale Joselme Fernandes Gouvea Alne Santos de Melo Denns Marnho O R Souza Kléber Napoleão Nunes de

Leia mais

Cap. 11 Correlação e Regressão

Cap. 11 Correlação e Regressão Estatístca para Cursos de Engenhara e Informátca Pedro Alberto Barbetta / Marcelo Menezes Res / Antono Cezar Borna São Paulo: Atlas, 2004 Cap. 11 Correlação e Regressão APOIO: Fundação de Apoo à Pesqusa

Leia mais