PRÉ - PROCESSAMENTO EFICIENTE PARA UM SISTEMA ONLINE DE CLASSIFICAÇÃO BASEADO EM REDES NEURAIS ARTIFICIAIS. Edmar Egidio Purcino de Souza

Tamanho: px
Começar a partir da página:

Download "PRÉ - PROCESSAMENTO EFICIENTE PARA UM SISTEMA ONLINE DE CLASSIFICAÇÃO BASEADO EM REDES NEURAIS ARTIFICIAIS. Edmar Egidio Purcino de Souza"

Transcrição

1 PPGEE/UFBA PRÉ - PROCESSAMENTO EFICIENTE PARA UM SISTEMA ONLINE DE CLASSIFICAÇÃO BASEADO EM REDES NEURAIS ARTIFICIAIS DISSERTAÇÃO DE MESTRADO Edmar Egidio Purcino de Souza Dissertação de Mestrado apresentada ao Programa de Pós-graduação em Engenharia Elétrica, da Universidade Federal da Bahia, como parte dos requisitos necessários à obtenção do título de Mestre em Engenharia Elétrica. Orientadores: Eduardo F. de Simas Filho Paulo C. M. de Abreu Farias Salvador Julho de 2015

2 de Souza, Edmar Egidio Purcino Pré - Processamento Eficiente para um Sistema Online de Classificação Baseado em Redes Neurais Artificiais/Edmar Egidio Purcino de Souza. Salvador: UFBA/PPGEE, XXV, 127 p.: il.; 29, 7cm. Orientadores: Eduardo F. de Simas Filho Paulo C. M. de Abreu Farias Dissertação (mestrado) UFBA/Programa de Pós Graduação em Engenharia Elétrica, Referências Bibliográficas: p Redes Neurais. 2. Pré-Processamento. 3. ICA. 4. PCA. 5. DWT. 6. Neural Ringer. I. de Simas Filho, Eduardo F. et al.. II. Universidade Federal da Bahia, Programa de Pós Graduação em Engenharia Elétrica. III. Título.

3 PRÉ-PROCESSAMENTO EFICIENTE PARA UM SISTEMA ONLINE DE CLASSIFICAÇÃO BASEADO EM REDES NEURAIS ARTIFICIAIS Edmar Egidio Purcino de Souza DISSERTAÇÃO SUBMETIDA AO CORPO DOCENTE DO PROGRAMA DE PÓS GRADUAÇÃO EM ENGENHARIA ELÉTRICA DA UNIVERSIDADE FE- DERAL DA BAHIA (PPGEE / UFBA) COMO PARTE DOS REQUISITOS NE- CESSÁRIOS PARA A OBTENÇÃO DO GRAU DE MESTRE EM ENGENHARIA ELÉTRICA. Examinada por: Prof. Eduardo Furtado de Simas Filho, D.Sc. (Orientador) Prof. Paulo C. M. de Abreu Farias, D.Sc. (Co-orientador) Prof. Amauri Oliveira, D.Sc. (PPGEE - UFBA) Prof. Bernardo Ordoñez, Dr.Eng. (PPGEE - UFBA) Prof. Rafael Antunes Nóbrega, D.Sc. (PPEE - UFJF) SALVADOR, BA - BRASIL JULHO DE 2015 iii

4 Um homem precisa viajar. Por sua conta, não por meio de histórias, imagens, livros ou TV. Precisa viajar por si, com seus olhos e pés, para entender o que é seu. Para um dia plantar as suas próprias árvores e dar-lhes valor. Conhecer o frio para desfrutar o calor. E o oposto. Sentir a distância e o desabrigo para estar bem sob o próprio teto. Um homem precisa viajar para lugares que não conhece para quebrar essa arrogância que nos faz ver o mundo como o imaginamos, e não simplesmente como é ou pode ser. Que nos faz professores e doutores do que não vimos, quando deveriamos ser alunos, e simplesmente ir ver. Amir Klink iv

5 Agradecimentos Agradeço aos meus pais Edvaldo e Magnólia e à minha irmã Mayara, por todo incentivo dado na persistência em continuar desde os primeiros anos de escola. Meus pais, minha família, sem vocês eu não teria chegado em lugar algum. Agradeço a Laiane, minha namorada, pelo amor, carinho, paciência e compreensão, principalmente nestes últimos anos. Com suas palavras doces e energéticas, eu recuperei forças pra continuar. Aos meus orientadores Eduardo Simas, Paulo Cesar e Seixas, pelo incetivo à pesquisa, pela amizade, por acreditar em mim, pelas conversas pacientes. Agradeço pela oportunidade de conhecer a pesquisa científica em uma nova ótica. Não tenho palavras para agradecer. Aos amigos do LSD da UFBA, em especial a Fábio e Diego pelo trabalho conjunto de pesquisa. Agradeço também aos amigos que fiz no Rio de Janeiro e em Juiz de Fora, no LPS/UFRJ e LPS/UFJF, pelas dicas e orientações, em especial aos companheiros Werner, Ciodaro, João, Moura, Junior, Bené e Luciano, pela ótima receptividade. Aos meus familiares do Rio de janeiro, minha tia Zelita e meus primos Josenaldo e Ana Claudia, pelo abrigo, cuidado e carinho nos momentos que passei no Rio. Agradeço também aos grandes pensadores que admiro, pois os seus legados motivam a minha curiosidade todos os dias, obrigado Darwim, Nietzsche, Hawking, Newton, Fourier, Gauss, Schopenhauer, Einstein e tantos outros que tiveram observações incríveis sobre as ciências, sobre a vida. À mãe natureza. Agradeço ao Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq) e a FAPESB, pelo suporte financeiro. v

6 Resumo da Dissertação apresentada ao PPGEE/UFBA como parte dos requisitos necessários para a obtenção do grau de Mestre em Engenharia Elétrica. PRÉ - PROCESSAMENTO EFICIENTE PARA UM SISTEMA ONLINE DE CLASSIFICAÇÃO BASEADO EM REDES NEURAIS ARTIFICIAIS Edmar Egidio Purcino de Souza Julho/2015 Orientadores: Eduardo F. de Simas Filho Paulo C. M. de Abreu Farias O ATLAS é o maior detector de partículas do acelerador LHC, e tem como um de seus objetivos a caracterização de fenômenos físicos ainda não verificados experimentalmente. Considerando todos os subdetectores do ATLAS, um evento (colisão do LHC) gera aproximadamente 1,5 Mbites de informação. Como a taxa de colisões do LHC chegará a 40 MHz, será gerado 60 TB/s. Para lidar com toda essa informação, é utilizado um sistema online de seleção (filtragem ou trigger) de eventos de interesse. Neste contexto, os elétrons são partículas importantes para o experimento, pois podem estar relacionados a algumas assinaturas de interesse. Sua detecção é baseada principalmente em informações medidas nos calorímetros (subsistema de medição de energia, que no ATLAS é composto por mais de sensores). Em trabalhos anteriores foi proposto um sistema alternativo para detecção de elétrons (Neural Ringer), no qual o perfil de energia medido nos calorímetros é pré-formatado em anéis concêntricos e classificado por redes neurais artificiais, obtendo-se eficiência de discriminação superior ao algoritmo padrão do detector. Neste trabalho é proposta a adição de técnicas de pré-processamento de sinais à cadeia do Neural Ringer, visando a extração de características discriminantes e a compactação da informação. Entre as técnicas de processamento a serem utilizadas estão a Análise de Componentes Principais (PCA), a Transformada Discreta vi

7 de Wavelet (DWT) e a Análise de Componentes Independentes (ICA). Os resultados encontrados mostram que o método proposto é capaz de melhorar a eficiência de discriminação do Neural Ringer, reduzindo a dimensão dos sinais de entrada do classificador e a taxa de erro de classificação. vii

8 Abstract of Dissertation presented to PPGEE/UFBA as a partial fulfillment of the requirements for the degree of Master in Electrical Engineering. EFFICIENT PRE-PROCESSING FOR AN ONLINE CLASSIFICATION SYSTEM BASED ON ARTIFICIAL NEURAL NETWORKS Edmar Egidio Purcino de Souza July/2015 Advisors: Eduardo F. de Simas Filho Paulo C. M. de Abreu Farias The ATLAS is the largest particles detector of the LHC accelerator, and aims to characterize various physical phenomena not yet verified experimentally. Considering all ATLAS subdetectors an event (LHC collision) generates about 1.5 MB of information. As the collisions rate may reach 40 MHz it will be generated at the detector 60 TB/s. In order to deal with all this amount of information an online event selection (filtering or trigger). The electrons are very important particles for the experiment as they are related to rare decays of signatures of interest. Specifically considering electron detection, which is based on information measures in the calorimeters (energy measurement subsystem comprising more than 100,000 sensors). In previous studies it has been proposed an alternative electron detection algorithim (Neural Ringer), in which the energy profile measured at the calorimeters is pre-formatted in concentric rings and classified using neural network, through this method it was achieved discrimination efficiency higher than the standard algorithm. This work proposes the use of techniques statistical signal preprocessing added to the Neural Ringer chain, aiming at extracting discriminant features from the available information. Among the used techniques are Principal Component Analysis (PCA), Discrete Wavelet Transform (DWT) and Independent Component Analysis (ICA). The results show that the proposed method is able to improve the viii

9 efficiency of discrimination Neural Ringer, reducing the magnitude of input signals classifier and the classification error rate. ix

10 Sumário Lista de Figuras Lista de Tabelas xiii xix 1 Introdução Motivação Objetivo Metodologia Organização do Documento Breve Introdução à Física de Altas Energias e ao Detector ATLAS Histórico O Modelo Padrão da Física de Partículas O CERN e o LHC O Detector ATLAS O Sistema de Calorimetria do ATLAS Filtragem Online de Eventos (Trigger) no Detector ATLAS Detecção de Elétrons no ATLAS O Discriminador Padrão para Elétrons no L O Discriminador Neural Ringer Limitações do Neural Ringer Técnicas de Pré - Processamento Utilizadas Pré - Processamento da Informação Processamento Estatístico de Sinais Análise de Componentes Principais x

11 3.2.2 Análise de Componentes Independentes Transformada Discreta de Wavelet Metodologia Utilizada e Bases de Dados Introdução Avaliação de Desempenho dos Classificadores Projetados Curva ROC Índice SP Etapa de Pré-Processamento Etapa de Classificação Classificação Não-Segmentada Classificação Segmentada Treinamento das Redes Neurais Bases de Dados Utilizadas neste Trabalho Dados Simulados Dados Experimentais Análises das Técnicas de Pré-Processamento Resultados com Dados Simulados Base de Dados: Monte Carlo Análises do Conjunto e Análises do Conjunto e Base de Dados: Monte Carlo Resultados com Dados Experimentais Base de Dados Experimentais Análise Comparativa - Dados experimentais Conclusões Trabalhos Futuros Referências Bibliográficas 112 A Trabalhos Publicados 119 A.1 Artigos em Congressos xi

12 A.2 Resumo em Encontro: B Conceitos Teóricos Sobre Redes Neurais e Processamento Estatístico de Sinais 122 B.1 Classificadores Neurais B.2 Processamento Estatístico de Sinais B.2.1 Medidas de Não-Gaussianidade xii

13 Lista de Figuras 2.1 Representação do Modelo Padrão da Física de Partículas, adaptado de [13] Representação gráfica do acelerador LHC no CERN [57] Representação gráfica do detector ATLAS e seus subsistemas, adaptado de [6] Sistema de coordenadas do ATLAS [21] Disposição das camadas dos calorímetros eletromagnético e hadrônico do detector ATLAS Representação da deposição de energia das partículas no sistema de calorimetria do ATLAS [57] Granularidade e segmentação do calorímetro eletromagnético do detector ATLAS, extraído de [6] Esquema do trigger online do ATLAS em três níveis de processamento sequenciais Descrição do Nível 01 de Filtragem Online de Eventos do Detector ATLAS [6] Diagrama do sistema de Trigger online do ATLAS, extraído de [6] Representação da formação dos anéis no calorímetro, extraído de [20] Cadeia de processamento do Neural Ringer, extraído de [21] Perfis de deposição de energia típicos na segunda camada do calorímetro eletromagnético do ATLAS. Extraído de [21] Perfil de deposição de energia de elétrons (a), jatos típicos (b) e jatos atípicos que dificultam o processo de identificação de partículas pelo perfil de energia (c), extraído de [21] xiii

14 3.1 Principais vantagens na utilização de técnicas de pré-processamento de sinais Processo de compactação por PCA, adaptado de [4] Diagrama do modelo básico da ICA, extraído de [21] Fluxo de processamento da DWT. Adaptado de [25] Exemplo de Curvas ROC para dois classificadores distintos Pré-processamento não-segmentado ao classificador Neural Ringer Fluxo de processamento para o sistema de classificação neural segmentado por camada, com etapa de pré-processamento Representação do processo de validação cruzada usado no treinamento do classificador neural Distribuição de sinais de elétrons e jatos em função de Et e η, do conjunto de dados simulados MC Distribuição de sinais de elétrons e jatos em função de Et e η, do conjunto de dados simulados MC Distribuição de sinais de elétrons (run ) e jatos (run ) em função de Et e η do conjunto de dados reais de colisões Organização dos resultados em cada base de dados Curvas de variação dos parâmetros PD(%) e PF(%) (a) e Máximo SP (%) em função do número de neurônios da camada oculta Curva de carga da PCA (a) e Variação do Max SP em função do número de componentes retidos na compactação por PCA - conjunto e Curvas ROC dos classificadores Ringer + PCA/ICA e Neural Ringer para o conjunto de dados e Índices SP (%) encontrados para cada função wavelet utilizada na etapa de pré-processamento - conjunto e Curvas ROC dos classificadores Ringer + DWT, Ringer + DWT/ICA e Neural Ringer xiv

15 5.6 Curva de carga da PCA (a) e variação do máximo SP (b) em função dos componentes principais retidos, dos sinais das camadas mais relevantes para classificação Curvas ROC dos discriminadores projetados com as camadas mais relevantes, em comparação ao Neural Ringer e ao Neural Ringer com pré-processamento por PCA/ICA Curva de variação do índice SP (%) em função do número de neurônios na camada oculta da rede neural combinadora Curvas ROC dos classificadores projetados com estrutura segmentada, em comparação com o Neural Ringer Comparação da eficiência de detecção (a) e falso alarme (b) em função da energia transversa - Et do classificador Ringer + PCA/ICA e Neural Ringer sem pré-processamento Comparação da eficiência de detecção (a) e falso alarme (b) em função de η do classificador Ringer + PCA/ICA e Neural Ringer sem préprocessamento Distribuição em Et (a e b) para os elétrons não detectados pelos classificadores Ringer + PCA/ICA (a) e pelo Neural Ringer (b) Distribuições em Et (a e b) e η (c e d) para jatos classificados incorretamente pelos discriminadores Ringer + PCA/ICA e pelo Neural Ringer Curva de carga da energia armazenada em função do número de componentes principais (a) e curva de variação do índice SP em função do número de componentes principais retidos - conjunto e Curva ROC dos discriminadores Neural Ringer e Ringer + PCA/ICA - conjunto e Curvas ROC dos discriminadores Ringer + DWT (Sym3), Ringer + DWT/ICA (Sym3) e Neural Ringer Curva de carga da PCA para as camadas mais relevantes do conjunto e22 (a) e variação do máximo SP(%) em função do número de componentes principais (b) xv

16 5.18 Curvas ROC dos classificadores projetados com os sinais das camadas mais relevantes em comparação ao Neural Ringer e Ringer + PCA/ICA - conjunto e Curvas ROC dos discriminadores projetados com processamento segmentado Comparação da eficiência de detecção (a) e falso alarme (b) em função da energia transversa - Et do classificador Ringer + PCA/ICA e Neural Ringer sem pré-processamento Comparação da eficiência de detecção (a) e falso alarme (b) em função de η do classificador Ringer + PCA/ICA e Neural Ringer sem préprocessamento Distribuição em Et (a e b) para os elétrons não detectados pelos classificadores Ringer + PCA/ICA (a) e pelo Neural Ringer (b) Distribuições em Et (a e b) e η (c e d) para jatos classificados incorretamente pelos discriminadores Ringer + PCA/ICA e pelo Neural Ringer Curvas de variação dos parâmetros PD(%) e PF(%) (a) e Máximo SP (%) em função do número de neurônios da camada oculta Curva de carga da energia retida por componentes principais (a) e curva de variação do índice SP(%) por componentes principais - conjunto MC Curvas ROC dos classificadores projetado com pré-processamento por ICA/PCA e o Neural Ringer Curva ROC dos classificadores projetados com pré-processamento por ICA/PCA e DWT, em comparação ao Neural Ringer Curva de carga da PCA para as camadas mais relevantes do conjunto e22 (a) e variação do máximo SP(%) em função do número de componentes principais (b) Curvas ROC dos classificadores projetados com os sinais das camadas mais relevantes em comparação ao Neural Ringer Curvas ROC dos discriminadores projetados com processamento segmentado xvi

17 5.31 Curvas de eficiência (a) e falso alarme (b) em dos classificadores Ringer + PCA/ICA e Neural Ringer, em função de Et Curvas de eficiência (a) e falso alarme (b) em dos classificadores Ringer + PCA/ICA e Neural Ringer, em função η Distribuição em Et (a e b) para os elétrons não detectados pelos classificadores Ringer + PCA/ICA (a) e pelo Neural Ringer (b) - conjunto mc Distribuições em Et (a e b) e η (c e d) para jatos classificados incorretamente pelos discriminadores Ringer + PCA/ICA e pelo Neural Ringer - conjunto mc Curva de carga da PCA (a) e Variação do Máximo SP em função do número de componentes retidos na compactação por PCA - Dados experimentais Curva ROC dos discriminadores Neural Ringer e Ringer + PCA/ICA para os dados experimentais Índices SP (%) encontrados para cada função wavelet utilizada na etapa de pré-processamento - conjunto experimental Curvas ROC dos classificadores projetados com pré-processamento por DWT e DWT/ICA Curva de carga da PCA (a) e variação do máximo SP em função do número de componentes principais retidos - conjunto de dados experimentais Curvas ROC dos discriminadores projetados com os sinais das camadas mais relevantes para discriminação, em comparação ao Neural Ringer Curvas ROC dos discriminadores projetados com pré-processamento com estratégia segmentada, para os dados experimentais Curvas de eficiência (a) e falso alarme (b) em dos classificadores Ringer + PCA/ICA e Neural Ringer, em função de Et - dados experimentais Curvas de eficiência (a) e falso alarme (b) em dos classificadores Ringer + PCA/ICA e Neural Ringer, em função η xvii

18 6.10 Distribuição em Et e η para elétrons não detectados pelos classificadores Ringer + PCA/ICA e pelo Neural Ringer Distribuição em Et (a) e η (b) para jatos não classificados incorretamente pelos discriminadores Ringer + PCA/ICA e pelo Neural Ringer.108 B.1 Rede Neural do tipo MLP, completamente conectada B.2 Exemplos de distribuições gaussiana, super gaussiana e sub-gaussiana. 125 xviii

19 Lista de Tabelas 2.1 Número de anéis por camada Comparação dos resultados encontrados no conjunto e Resultados obtidos com o uso de diferentes funções wavelets utilizadas Resultados encontrados com a adição de pré-processamento por DWT Resultados encontrados para o estudo de relevância de discriminação das camadas do calorímetro, para o Neural Ringer Resultados encontrados para o estudo de relevância de discriminação das camadas do calorímetro Resultados encontrados para os classificadores utilizando apenas as camadas mais relevantes para discriminação Resultados encontrados para o classificador segmentado por camada sem etapa de pré-processamento Resultados encontrados da aplicação do pré-processamento por PCA/ICA nos sinais de cada camada do calorímetro separadamente Resultados encontrados para o classificador segmentado com etapa de pré-processamento Resultados encontrados para o classificador segmentado com etapa de pré-processamento em comparação ao Neural Ringer Comparação dos resultados encontrados para o conjunto de dados e Resultados obtidos com o uso das diferentes funções wavelets utilizadas - conjunto e Resultados encontrados com a adição de pré-processamento por DWT Resultados encontrados no estudo de relevância de discriminação das camadas do calorímetro, conjunto e xix

20 5.15 Resultados encontrados para o estudo de relevância de discriminação das camadas do calorímetro, utilizando o classificador Neural Ringer Resultados encontrados para os classificadores utilizando apenas as camadas mais relevantes para discriminação Resultados encontrados da aplicação do pré-processamento por PCA/ICA nos sinais de cada camada do calorímetro separadamente Resultados encontrados para o classificador segmentado com etapa de pré-processamento em comparação ao Neural Ringer Resultados encontrados para o classificador segmentado com etapa de pré-processamento em comparação ao Neural Ringer Comparação dos resultados encontrados com análises sob o conjunto de dados MC Resultados obtidos com o uso das diferentes funções wavelets utilizadas Resultados encontrados com a adição de pré-processamento por DWT - conjunto mc Resultados encontrados para o estudo de relevância de discriminação das camadas do calorímetro, para o Neural Ringer Resultados encontrados para o estudo de relevância de discriminação das camadas do calorímetro, utilizando o classificador Neural Ringer Resultados encontrados para os classificadores utilizando apenas as camadas mais relevantes para discriminação Resultados encontrados da aplicação do pré-processamento por PCA/ICA nos sinais de cada camada do calorímetro separadamente Resultados encontrados para o classificador segmentado com etapa de pré-processamento em comparação ao Neural Ringer Resumo dos resultados encontrados com aplicação de etapa de préprocessamento em comparação ao Neural Ringer - conjunto MC Comparação dos resultados encontrados com análises sob o conjunto de dados experimentais Resultados obtidos com o uso das diferentes funções wavelets utilizadas Resultados encontrados com a adição de pré-processamento por DWT. 99 xx

21 6.4 Resultados encontrados para o estudo de relevância de discriminação entre as camadas do calorímetro, para o Neural Ringer - dados experimentais Resultados encontrados para o estudo de relevância de discriminação das camadas do calorímetro, utilizando o classificador Neural Ringer Resultados encontrados para os classificadores utilizando apenas as camadas mais relevantes para discriminação Resultados encontrados para o classificador segmentado por camada sem etapa de pré-processamento Resultados encontrados da aplicação do pré-processamento por PCA/ICA nos sinais de cada camada do calorímetro separadamente Resultados encontrados para o classificador segmentado com etapa de pré-processamento Resultados encontrados para o classificador segmentado com etapa de pré-processamento em comparação ao Neural Ringer xxi

22 Símbolos e Abreviaturas Símbolos E ev e /j ε(.) E EM E fi E Had E ratio E T H(.) I(.) J(.) kurt(.) p x (x) R shape η θ φ s x y Energia Elétron - Volt Elétron/Jato Operador esperança Energia eletromagnética Eficiência de discriminação da classe i Energia hadrônica Razão de energia Energia transversa Entropia Informação mutua Negentropia Curtose Função de densidade de probabilidade Razão de forma Pseudo-rapidez (sistema de coordenadas do ATLAS) Ângulo polar (sistema de coordenadas do ATLAS) Ângulo azimutal (sistema de coordenadas do ATLAS) Vetor das fontes independentes Vetor dos sinais medidos Vetor dos componentes independentes estimados xxii

23 Abreviaturas ALEPH ALICE ATLAS CERN CMS CTP DSP DWT E1 E2 E3 EEG EF FastICA FPGA H0 H1 H2 HLT ICA JADE LHC L1 L2 L2PU L2SV PCA PS QCD RNA ROC Detector do acelerador LEP Detector do acelerador LHC A Toroidal LHC ApatattuS (Detector do acelerador LHC) Centro Europeu para Pesquisa Nuclear Detector do acelerador LHC Central Trigger Processor LHC Digital signal processing Discrete Wavelet Transform Primeira camada eletromagnética do calorímetro do ATLAS Segunda camada eletromagnética do calorímetro do ATLAS Terceira camada eletromagnética do calorímetro do ATLAS Eletroencefalograma Filtro de Eventos Algoritmo de extração dos componentes independentes Field-Programmable Gate Array Primeira camada hadrônica do calorímetro do ATLAS Segunda camada hadrônica do calorímetro do ATLAS Terceira camada hadrônica do calorímetro do ATLAS High Level Trigger Independent components analysis Joint Approximate Diagonalization of Eigen-matrices Large Hadron Collider Primeiro nível de filtragem do ATLAS Segundo nível de filtragem do ATLAS Unidade de processamento do L2 Supervisor do L2 Principal Components Analysis Camada pre-sampler do ATLAS Eletrodinâmica quântica Rede Neural Artificial Receiver operating characteristic xxiii

24 ROD RoI RPROP SOM SP SUSY TDAQ TOTEM Drivers de saída do sistema de filtragem do ATLAS Região de interesse Resilient back-propagation Mapa auto-organizável Índice Soma-Produto Supersimetria Trigger and data aquisition Experimento do LHC xxiv

25 Capítulo 1 Introdução O desenvolvimento de técnicas de processamento de sinais e inteligência computacional vem contribuindo positivamente ao longo dos anos para avanços em diversas áreas do conhecimento. Neste contexto, o processamento estatístico de sinais encontra aplicações em diferentes problemas, como por exemplo, o tratamento de sinais biomédicos [1], a estimação de sinais em telecomunicações [2] e em detecção de embarcações através de sistemas de sonar passivo [3]. O processamento estatístico é importante em aplicações onde há uma grande quantidade de sinais a serem processados simultaneamente e que necessitam de respostas rápidas, como operações financeiras em bancos, comunicação através de redes sem fio, controle de plantas industriais, instrumentação para física de partículas e até mesmo na computação em nuvem. Em muitos casos a informação de interesse possui rara ocorrência, sendo inserida em meio a grande quantidade de dados gerada na operação do processo. Assim, fazse necessário o uso de técnicas de processamento de sinais para analisar e remover a parcela de informação considerada como ruído de fundo, e então possibilitar uma melhor caracterização dos sinais de interesse. Este trabalho propõe a aplicação de técnicas de processamento de sinais para à seleção online de eventos de interesse num detector de partículas de altas energias. O objetivo é extrair características discriminantes dos sinais gerados nas colisões, que serão utilizadas para alimentar um sistema inteligente de classificação baseado em Redes Neurais Artificiais. Entre as técnicas de processamento utilizadas estão a Análise de Componentes Principais (PCA - Principal Component Analysis)[4], a 1

26 Análise de Componentes Independentes (ICA - Independent Component Analysis)[5] e a Transformada Discreta de Wavelets (DWT - Discrete Wavelet Transform). 1.1 Motivação Os experimentos de Física de Altas Energias (ou HEP, do inglês High Energy Physics) têm como objetivo a investigação das propriedades e das formas de interação entre as partículas elementares. Aceleradores são muito utilizados neste contexto para realizar a colisão de feixes de partículas. Nas colisões, são produzidas diversas outras partículas, cujas assinaturas só podem ser observadas durante curtíssimos intervalos de tempo, pois decaem instantaneamente em outras partículas menos energéticas. A caracterização das assinaturas é realizada por detectores instalados ao redor dos pontos de colisão. Os detectores possuem sistemas de aquisição, processamento e transmissão dos sinais medidos. A partir da análise das informações adquiridas nos detectores é possível realizar a identificação das partículas. A raridade dos eventos de interesse, a alta taxa de colisões e o intenso ruído de fundo (composto de sinais provenientes de assinaturas não relevantes) são algumas características que exigem uma rápida decisão e uma ótima eficiência de classificação do sistema de seleção de eventos em experimentos de física de altas energias. O ambiente de aplicação deste trabalho é o sistema online de seleção de eventos do ATLAS (A Toroidal LHC Aparatus) [6], maior detector de propósito geral do acelerador LHC (Large Hadron Collider) [7]. O LHC iniciou sua operação no final do ano de 2008, no CERN (Organização Europeia para a Pesquisa Nuclear) [8], localizado na fronteira entre a Suíça e a França. O CERN é um dos principais centros de pesquisas em Física de Altas Energias do mundo e realiza diversos experimentos de HEP, muitos deles associados ao acelerador LHC. No LHC, os sinais de interesse estão imersos num intenso ruído de fundo, que ocorrem de modo simultâneo. O problema na detecção de eventos está atrelado ainda à quantidade elevada de dados produzidos durante as colisões, decorrente do grande número de sensores existentes nos detectores. No ATLAS, para lidar com toda a informação gerada, foi projetado um sistema de filtragem (trigger) online, que trabalha em três níveis sequenciais de seleção. O primeiro nível (L1) tem disponível 2

27 uma curta janela de tempo para tomada de decisão, por isso é implementado em hardware dedicado e utiliza critérios mais simples de seleção. O nível 2 (L2) realiza análises mais complexas e dispõe de tempo um pouco maior para processamento. O L2 é implementado em software e juntamente com o terceiro nível, também chamado de Filtro de Eventos (EF) compõem a filtragem de alto nível. Em meio aos diversos canais de interesse para o detector ATLAS, este trabalho está direcionado à seleção de elétrons (canal elétron/jato (e /j)). Os elétrons são partículas que estão ligadas a inúmeros fenômenos, dentre eles a um dos possíveis decaimentos do bóson de Higgs. No entanto, a detecção os elétrons é dificultada pelo ruído de fundo composto por partículas hadrônicas (conhecidos como jatos ), que podem apresentar perfil de energia parecido ao dos elétrons. 1.2 Objetivo Este trabalho tem como objetivo principal a aplicação de técnicas de processamento de sinais que possibilitem um aumento na eficiência da seleção online de elétrons no segundo nível de filtragem (trigger) do ATLAS. Para isso, está sendo proposta a adição de etapas de pré-processamento ao discriminador Neural Ringer. O Neural Ringer é um discriminador desenvolvido para a detecção de elétrons, baseado numa rede neural artificial, que foi proposto como um alternativa ao discriminador padrão do detector por pesquisadores da colaboração ATLAS-Brasil [9]. O pré-processamento deve ser capaz de revelar características discriminantes (contribuindo para aumentar a eficiência de classificação) e diminuir a informação necessária para o processo de decisão (produzindo um sistema que utilize menos recursos computacionais). É também proposta deste trabalho analisar as informações geradas pelas camadas do calorímetro separadamente, explorando toda a segmentação e granularidade disponível, obtendo assim informações especialistas das camadas do sistema de calorimetria. Os objetivos específicos deste trabalho são: 1. Avaliar a eficiência de discriminação de elétrons obtida com a aplicação de técnicas de pré-processamento nos sinais em anéis; 2. Reduzir a quantidade de informação não relevante para o experimento; 3

28 3. Diminuir número de variáveis dos sinais em anéis através da aplicação do préprocessamento; 4. Diminuir a taxa de falso alarme na detecção de elétrons. 1.3 Metodologia Para o desenvolvimento deste trabalho foram utilizados conjuntos de dados simulados e experimentais (disponibilizados pela colaboração ATLAS). Os dados simulados foram gerados a partir de técnicas de Monte Carlo [10], considerando todas as características físicas do detector e do acelerador, representando também as condições de operação para os próximos anos. Foram estudadas diversas estratégias visando o aumento do desempenho do classificador Neural Ringer. Os sinais medidos no sistema de calorimetria do detector ATLAS são pré-processados pelas técnicas PCA, DWT e ICA e então apresentados a uma rede neural artificial. As técnicas foram combinadas, buscando simultaneamente a compactação da informação e a extração das características mais discriminantes dos sinais medidos. Com o objetivo de explorar a segmentação existente no sistema de calorimetria do ATLAS, foram desenvolvidos classificadores especialistas, nos sinais provenientes de cada camada do calorímetro. Também foram realizados estudos de relevância entre as camadas do sistema de calorimetria, para avaliar o impacto dos sinais de cada camada na eficiência do classificador. Os resultados obtidos pela aplicação do pré-processamento proposto são apresentados através de tabelas e gráficos de eficiência que permitem comparação com os resultados do Neural Ringer. 1.4 Organização do Documento No Capítulo 02 será apresentado um breve histórico sobre a Física de partículas, bem como as teorias que cercam os principais assuntos relacionados a este tema. Será também apresentado, o detector de partículas ATLAS e seus subsistemas. No capítulo 03 são apresentados os fundamentos teóricos das técnicas de préprocessamento de sinais utilizadas neste trabalho. 4

29 No capítulo 04 é apresentada a metodologia utilizada no projeto e nos testes do sistema proposto, bem como a apresentação das características dos conjuntos de dados utilizados no trabalho. Os capítulos 05 e 06 mostram os resultados obtidos com dados simulados e experimentais respectivamente, com o uso da metodologia proposta. No capítulo 07 serão apresentadas as conclusões e perspectivas para continuação deste trabalho. 5

30 Capítulo 2 Breve Introdução à Física de Altas Energias e ao Detector ATLAS Neste capítulo será realizada uma breve introdução à Física de Partículas Elementares, com foco no detector ATLAS do LHC. O universo está escrito numa linguagem geométrica e só quem compreender essa linguagem poderá vislumbrar seus mistérios. (Galileo Galilei, ) 2.1 Histórico A origem e a composição da matéria sempre foram questões que motivaram a curiosidade do ser humano desde os tempos mais antigos. Aristóteles (384 a.c a.c.) foi um dos primeiros pensadores que propôs explicações mais compreensivas dentro dos assuntos relativos a Física e a natureza. Seus estudos propuseram a existência de quatro elementos básicos da natureza, a água, a terra, o ar, e o fogo, e cada um desses elementos teria o seu lugar natural no universo. Mais tarde, o filosofo Tales de Mileto (623 a.c a.c.) elaborou propostas através de observações. Tales, empregando os primeiros passos do pensamento teórico evolucionista, afirmava que o princípio de todas as coisas era a água, através de observações realizadas sobre a umidade dos alimentos e das sementes que originavam as plantações [11]. A busca pela compreensão de como surgiu o universo é um assunto que desencadeia diversas teorias, desde os tempos mais remotos envolvendo as áreas das ciências, filosofia e também da religião. A teoria do surgimento do universo mais aceita atu- 6

31 almente na comunidade cientifica é baseada no Big Bang (A Grande Explosão), que foi uma formulação proposta no inicio do século XX pelo Físico Georges Lemaitre ( ) que nomeou a teoria como Hipótese do Átomo Primordial. O Big Bang traz a ideia de que o universo estava inicialmente muito denso e quente e após uma explosão toda a matéria gerada tem se resfriado mantendo a expansão do espaço. Em 1929 o Físico Edwin Hubble apresentou bases observadas para a teoria proposta por Lamaitre, ao descobrir que as chamadas nebulosas eram na verdade novas galáxias fora da Via láctea, e que estas se afastam uma das outras a uma velocidade proporcional à distancia que as separa. Estima-se que a grande explosão tenha ocorrido há mais de 13 bilhões de anos e que a partir do resfriamento do universo foram criadas condições propicias para a geração da matéria, especificamente as partículas quarks e elétrons, que são partículas fundamentais da matéria. A seguir o agregamento de quarks gerou os prótons e os nêutrons que se juntaram e formaram o núcleo dos átomos [11]. Calculase que anos depois os elétrons interagiram com os núcleos formados e então foram gerados os primeiros átomos de hidrogênio e hélio. E o processo de interação continuou dando origem a estrelas, galaxias e nuvens de gás. 2.2 O Modelo Padrão da Física de Partículas Os experimentos de Física de Altas Energias buscam através de uma larga infraestrutura tecnológica, novas descobertas e comprovações das teorias que envolvem os elementos fundamentais da matéria. O modelo Rutherford-Bohr foi publicado em 1913 e nele prótons, nêutrons e elétrons são os componentes elementares do átomo. Experimentos ao longo do século XX foram identificando novos elementos e provando que ainda existiam partículas menores do que as previstas naquele modelo [12]. A teoria mais aceita atualmente na área de física de partículas é o Modelo Padrão, que foi formulado no final dos anos 60 e sintetiza o conhecimento alcançado em pouco mais de um século de pesquisas. De acordo com o Modelo Padrão as partículas que são verdadeiramente elementares são os léptons e quarks, por não possuírem estrutura interna. Além da caracterização pela estrutura interna, o Modelo Padrão descreve a existência dos 7

32 bósons, que são partículas mediadoras de força. Os léptons são partículas de pequena massa e possuem fraca interação com a matéria. Existem seis tipos de léptons conhecidos (elétron, múon, tau, neutrino do elétron, neutrino do múon e neutrino do tau). Assim como os léptons, existem também seis tipos de partículas no grupo dos quarks, o quark up (u), quark down (d), quark charm (c), quark estranho (s), quark bottom (b) e o quark top (t). Os quarks possuem ainda uma propriedade chamada cor e cada um pode apresentar três cores diferentes, o vermelho, verde e o azul, compreendendo portanto dezoito quarks. No entanto, como a cada partícula corresponde uma antipartícula, o modelo prevê a existência de doze léptons e trinta e seis quarks [12]. Os quarks não são observados na matéria de forma isolada estão sempre combinados formando partículas chamadas hádrons. O elétron é o lépton mais conhecido, enquanto o próton e o nêutron os hádrons mais familiares. A estrutura interna do próton é uud, ou seja, dois quarks u e um d; a do nêutron é udd, isto é, dois quarks d e um u. O Modelo Padrão também descreve como as partículas interagem, neste aspecto o modelo apresenta quatro tipos de interações fundamentais na natureza, são elas: a eletromagnética, a gravitacional, a forte e a fraca. A Figura 2.1 apresenta graficamente a organização as partículas que constituem o Modelo Padrão. Figura 2.1: Representação do Modelo Padrão da Física de Partículas, adaptado de [13]. Para explicar o mecanismo de interação entre as forças e as partículas apresentadas, o modelo padrão apresenta ainda as partículas mediadoras, ou também chamadas de partículas virtuais, responsáveis pela transmissão da mensagem da 8

33 força para as partículas interagentes [13]. Essas partículas mediadoras são os fótons na interação eletromagnética, os glúons na interação forte, as partículas W e Z na interação fraca e os grávitons (ainda não detectados experimentalmente) na interação gravitacional. Considerando as partículas e formas de interação já verificadas experimentalmente e uma formulação atualmente aceita pela física teórica (Gauge Invariance), todas as partículas elementares teriam massa nula. Esta previsão contraria os resultados experimentais e somente pode ser corrigida assumindo-se que existe um outro tipo de interação. Esta interação foi prevista pelo cientista inglês Peter Higgs em 1964, tendo como partícula mediadora o bóson de Higgs, que é responsável por fornecer massa às partículas. Recentemente, passados mais de quarenta anos após a publicação de sua teoria, a descoberta experimental do bóson de Higgs aconteceu através de experimentos em altas energias no acelerador de partículas LHC no CERN. Apesar do Modelo Padrão descrever a maioria das interações entre as partículas que constituem a matéria, ainda existem muitas questões a serem resolvidas. As partículas virtuais grávitons, por exemplo, ainda não foram detectadas, deixando uma janela de questionamentos sobre a integração do modelo. O modelo padrão também enfrenta problemas para explicar a ausência de simetria entre a matéria e a antimatéria existente no universo. Apoiando-se na proposta em que o universo começou no Big Bang como uma imensa explosão de energia, ele deveria ter evoluído em partes iguais de matéria e antimatéria. No entanto, estrelas e nebulosas são constituídas de prótons, elétrons e nêutrons e não de suas antipartículas. Essa assimetria não é explicada pelo Modelo Padrão, existe no universo observado muito mais matéria do que antimatéria. Conclui-se que o Modelo Padrão não é uma teoria definitiva, é uma base que explica grande parte das interações sub-atômicas e que, ao longo do tempo, será ajustado de acordo com novas informações e descobertas resultantes de experimentos e novas formulações teóricas. 9

34 2.3 O CERN e o LHC O CERN (Organização Europeia para a Pesquisa Nuclear) localizada na cidade de Genebra na Suiça, é o maior laboratório de experimentos de física de partículas do mundo. No CERN, localiza-se o LHC (Large Hadron Collider), que é o maior acelerador de partículas já constituído. O LHC possui 27 km de extensão e está localizado na fronteira entre os países Suiça e França, num túnel a 150 metros abaixo da superfície. O LHC foi projetado para colidir feixes de partículas com energia de até 14 TeV, numa frequência de 40 x 10 6 vezes por segundo. Figura 2.2: Representação gráfica do acelerador LHC no CERN [57]. A medida do número de colisões por centímetro quadrado produzida a cada segundo é chamado de Luminosidade (L), conforme apresentada pela equação a seguir: L = n( N 1N 2 )f (2.1) A onde n é o número de feixes de partículas, N i o número de partículas por feixe, A a área da seção transversal do feixe e f a frequência de colisão. A luminosidade projetada para o LHC é de cm 2 s 1. O LHC possui seis detectores: ATLAS, CMS, ALICE, TOTEM, LHCb e o LHCf. ATLAS [6]: A Toroidal LHC Apparatus: O ATLAS é um detector com propósitos 10

35 múltiplos, incluindo a detecção do bóson de Higgs. Os principais estudos de interesse são: a origem da massa, espaço de dimensão extra, evidências para candidatos a matéria escura, buracos negros microscópicos e estudo sobre a não similaridade entre a matéria e a antimatéria observada no universo. CMS [14]: Compact Muon Solenoid: É o outro detector de propósito geral do LHC. Entre as suas atribuições estão: o estudo dos aspectos das colisões de íons pesados, buscar evidências que comprovariam uma física além do Modelo Padrão (Supersimetria e as dimensões extras), além da detecção do bóson de Higgs. Embora o CMS possua objetivos semelhantes ao detector ATLAS, são utilizadas técnicas e projetos distintos do sistema magnético do detector. ALICE [15]: A Large Ion Collider Experiment: Especialista na identificação de íons pesados, é uma máquina destinada a explorar eventos físicos na interação núcleonúcleo. TOTEM [16]: Total Elastic and diffractive cross section Measurement: Possui a finalidade de medir o tamanho dos prótons e também, monitorar a luminosidade em operação do LHC. LHCb [17]: LHC beauty é um experimento desenvolvido para explorar os fenômenos que ocorreram depois do Big Bang, principalmente os eventos que permitiram a matéria sobreviver a criar o universo atual. Ele é especializado em aferir medidas precisas da violação CP e de decaimentos raros de hádrons B (compostos com o quark beauty ou b-quark). LHCf [18]: Large Hadron Collider forward: Este experimento utiliza partículas criadas no interior LHC com o objetivo de simular raios cósmicos em condições de laboratório, para analisar a influência destes sinais nos experimentos. O LHC iniciou seu funcionamento em 10 de setembro de 2008, no entanto sua operação foi interrompida devido à problemas elétricos, que ocasionaram vazamento de gases e super-aquecimento de equipamentos. Em 2009 as atividades foram reiniciadas e houveram colisões de partículas com energia total de até 3,5 TeV. A energia total do LHC foi elevada gradualmente até 7 TeV. No início de 2013 houve uma parada na operação para atualização dos equipamentos. As colisões foram reiniciadas em 2015 com o objetivo de atingir energia de até 14 TeV. 11

36 2.4 O Detector ATLAS O ATLAS é o maior detector de partículas de propósito geral do acelerador LHC. Possui 45 metros de comprimento, aproximadamente 25 metros de altura e pesa em torno de toneladas [6]. Uma colaboração de pesquisadores de mais de 38 países, com a contribuição de 174 instituições, é responsável pelo projeto e pela operação do ATLAS. O detector, conforme mostrado na Figura 2.3, possui um formato cilíndrico e é composto por sub-detectores especializados, que são: o detector de traço, os calorímetros eletromagnético e hadrônico, e a câmara de múons. Figura 2.3: Representação gráfica do detector ATLAS e seus subsistemas, adaptado de [6]. O sistema de coordenadas xyz do ATLAS é mostrado na Figura 2.4. O eixo z segue a direção do feixe de partículas e os eixos x e y formam um plano transversal ao feixe. A direção positiva do eixo x é definida apontando do ponto de interação para o centro do anel do LHC, e o eixo y positivo aponta para cima. O ângulo obtido a partir de : φ = arctan( x y ) (2.2) Representa a rotação em torno do eixo de colisão. O ângulo polar θ em relação ao eixo de espalhamento em z é usado no cálculo da chamada pseudo-rapidez η, que 12

37 Figura 2.4: Sistema de coordenadas do ATLAS [21]. representa a direção de projeção das partículas após a colisão. Define-se η por: η = ln( θ 2 ) (2.3) O Sistema de Calorimetria do ATLAS Conceitualmente, calorímetros são equipamentos com espessura suficiente par absorver completamente a energia de uma partícula. A interação da partícula incidente com o calorímetro é um processo em cascata, em que um número muito grande de partículas secundárias é produzido ao longo do detector. O parâmetro que define a qualidade do calorímetro é a resolução em energia. A medida da energia depositada é feita por amostragem ao longo do calorímetro. Existem dois tipos de cascata (ou chuveiros) importantes para esse trabalho: os iniciados por elétrons e fótons, chamados de chuveiro eletromagnéticos; e os iniciados por hádrons, que são os chuveiros hadrônicos. Cada um possui características peculiares, que determinam projetos de calorímetros para partículas eletromagnéticas e hadrônicas. As partículas eletromagnéticas (ex: elétrons e fótons) apresentam perfil de deposição de energia, em geral, concentrado em torno do ponto de colisão. Normalmente, as partículas eletromagnéticas são totalmente absorvidas nos calorímetros eletromagnéticos. As cascatas hadrônicas apresentam formas diversas e iniciam sua interação também com o calorímetro eletromagnético, mas, tipicamente, sua completa absorção somente acontece nas camadas hadrônicas de calorímetro. O tempo de resposta dos sensores é rápido, o que os torna adequados para seleção online de eventos em ambientes de altas taxas de geração de sinais. A segmentação 13

38 Figura 2.5: Disposição das camadas dos calorímetros eletromagnético e hadrônico do detector ATLAS permite também medir a posição e o ângulo de incidência de partícula. A primeira seção do calorímetro (calorímetro eletromagnético) é responsável por determinar a energia e o perfil de deposição de energia das partículas de natureza eletromagnética, como por exemplo elétrons e fótons. Possui quatro camadas com granularidades distintas. A segunda seção do calorímetro (calorímetro hadrônico) é responsável por determinar a energia e o perfil de deposição de energia das partículas da natureza hadrônica, como por exemplo prótons. Possui três camadas com granularidades distintas. Ao todo o sistema de calorímetros do detector ATLAS é sub-dividido em 7 camadas, assim denominadas: PS, E1, E2, E3, H0, H1 e H2. A granularidade (ou a quantidade de células por unidade de área) varia entre as camadas dos calorímetros. Cada camada do calorímetro eletromagnético é dividida em barril e tampa, e do calorímetro hadrônico, em barril e barril estendido. A tampa e o barril eletromagnéticos, utilizam sensores de argônio líquido fazendo parte do conjunto do calorímetro eletromagnético. O argônio líquido é um material absorvedor utilizado, juntamente com eletrodos de chumbo, para captar os íons 14

39 Figura 2.6: Representação da deposição de energia das partículas no sistema de calorimetria do ATLAS [57]. formados durante a interação das partículas incidentes [6]. Nas seções hadrônicas (mais externas), os sensores são telhas de material cintilante que, quando interagem com o chuveiro de partículas produzido na colisão, emitem luz que é captada pelo sistema de detecção. Neste caso, os sinais ópticos são captados por tubos foto-multiplicadores (ou PMT - Photo Multiplier Tubes). Na figura 2.7 é ilustrada a segmentação do calorímetro eletromagnético do detector ATLAS. Conforme ilustrado, a primeira camada eletromagnética possui mais fina segmentação em η possibilitando medição precisa dos locais de colisão nessa coordenada. A segunda camada apresenta células detectoras com maior profundidade, absorvendo maior parcela de energia depositada. A terceira camada captura os detalhes do chuveiro eletromagnético produzido. 2.5 Filtragem Online de Eventos (Trigger) no Detector ATLAS O ATLAS recebe o produto das colisões de feixes de prótons do LHC que podem ocorrer numa taxa de até 40 MHz [7]. Para esta frequência de colisões, o detector gera aproximadamente 60 TB/s, sendo que a maior parte representa ruído de fundo 15

40 Figura 2.7: Granularidade e segmentação do calorímetro eletromagnético do detector ATLAS, extraído de [6]. (informações não relevantes) para a identificação das assinaturas de interesse. Os sistemas de trigger são em geral constituídos de diversas etapas hierárquicas [6], que gradualmente selecionam as assinaturas de interesse para o experimento. No ATLAS o sistema de filtragem (trigger) online foi desenvolvido com três níveis sequenciais, com complexidade e tempo de processamento crescentes, conforme representado na Figura 2.8. O nível mais baixo, opera em curtas janelas de tempo, e a sua filtragem é realizada com base em critérios mais simples, de forma a atender ao tempo máximo permitido para a operação. Nesta etapa é eliminada a informação que possui poucas características semelhantes ao sinal de interesse. Nos níveis posteriores, como a taxa de informação já é reduzida pelo primeiro nível, pode-se implementar soluções de filtragem mais criteriosas, em que a informação será tratada com mais rigor, respeitando também as janelas de tempo disponíveis. Conforme as taxas de entrada de dados, é possível implementar sistemas de alto nível em software, utilizando algoritmos de alta performance para uma filtragem mais refinada. Após as sucessivas etapas de filtragem, os resultados podem ser armazenados para análise offline. 16

41 Figura 2.8: Esquema do trigger online do ATLAS em três níveis de processamento sequenciais. Trigger de Primeiro Nível - Level 1 O primeiro nível de filtragem (L1) usa a informação dos calorímetros e da câmara de múons e reduz a taxa inicial de eventos para 75 khz. Este nível tem sérias restrições quanto ao tempo de processamento, com latência máxima de 2,5us, recebendo a total taxa de eventos do LHC como entrada. O L1 é implementado em hardware (utilizando FPGA - Field Programable Gate Arrays) e identifica as regiões do detector onde possivelmente ocorreram eventos relevantes, chamadas de Regiões de Interesse (Regions of Interest - RoIs). O processo de decisão realizado pelo L1 é executado no Processador de Filtragem Central (CTP - Central Trigger Processor), que combina informações de tipos de objetos conhecidos. O fluxo de processamento do L1 é apresentado na Figura 2.9. As informações sobre a localização geométrica de um candidato a objeto de interesse são armazenadas nos processadores de trigger. Mediante aceitação do evento pelo L1, essas informações serão encaminhadas como RoIs para o L2, onde serão usadas no processo de seleção em um nível de processamento mais criterioso. 17

42 Figura 2.9: Descrição do Nível 01 de Filtragem Online de Eventos do Detector ATLAS [6] Trigger de Alto Nível - HLT No ATLAS, o HLT é constituído pelo níveis L2 e EF (Event Filter) do sistema de trigger online do ATLAS. Os dados provenientes das RoIs são utilizados pelo nível 2 de filtragem (L2), no qual é utilizada toda a granularidade do detector, com o objetivo de reduzir a taxa de eventos para 1 khz. Para esta tarefa, o L2 é implementado em software e executado com processamento distribuído. Neste nível, o tempo máximo para tomada de decisão é 40 ms, e estão disponíveis informações do detector de trajetórias, das câmaras de múons, assim como a total resolução dos calorímetros. Os eventos aprovados no L1 são disponibilizados na forma de fragmentos nos sistemas de leitura (Read-Out Systems - ROS). As RoIs também são enviadas para o construtor de RoI (RoI Builder - RoIB) que agrupa os fragmentos de informação gerados pelos subsistemas detectores do ATLAS e transmite o registro gerado por este agrupamento para um módulo chamado L2SV (supervisor do segundo nível), que gerencia a ação de encaminhar a RoI recebida para uma unidade de processamento do L2 (L2PU). A L2PU é responsável pela validação do registro do L1, usando a plena granularidade dos detectores, e retorna o resultado para o L2SV. 18

43 Após a recepção do resultado o módulo L2SV envia o resultado para o gerenciador de fluxo de dados, chamado DFM (Data Flow Manager), para que o evento seja enviado para o próximo nível de trigger, caso seja aprovado, ou apagado em caso de rejeição. O DFM escolhe um dos processadores SFI (Sub-Farm Input) para que o mesmo solicite aos ROS toda a informação registrada do evento em análise. O fluxo de processamento do HLT é exemplificado na Figura Figura 2.10: Diagrama do sistema de Trigger online do ATLAS, extraído de [6]. O EF têm latência de até quatro segundos para tomada de decisão, assim a taxa de eventos é reduzida para até 300Hz. Os eventos aprovados pelo EF são transmitidos aos processadores SFO (Sub-Farm Output) para que possam ser armazenados em mídia permanente, para futuras análises offline. 2.6 Detecção de Elétrons no ATLAS Os elétrons estão envolvidos em diversos decaimentos raros de interesse para o experimento, como por exemplo o bóson de Higgs. 19

44 A detecção de elétrons baseia-se principalmente no perfil de deposição de energia medido no sistema de calorimetria. São considerados aspectos como a distribuição transversal do chuveiro de partículas e a parcela de energia que atinge as camadas hadrônicas. Os jatos hadrônicos são amplamente produzidos nas colisões do LHC (em taxas até 10 5 vezes maiores que os elétrons) e possuem um perfil de deposição de energia que pode ser semelhante ao do elétron, tornando complicado o processo de identificação. Os problemas abordados como a alta taxa de eventos e a intensa contaminação por ruído de fundo no canal de detecção, reforçam a necessidade de implementação de algoritmos de identificação eficientes. Estas rotinas devem trabalhar dentro das janelas de tempo permitidas para a operação no trigger. A seguir serão descritos alguns dos discriminadores em operação atualmente no ATLAS para a detecção online de elétrons O Discriminador Padrão para Elétrons no L2 O discriminador padrão utilizado no ATLAS para seleção e classificação de partículas eletromagnéticas (elétrons e fótons) no L2 é o T2Calo [19]. Este algoritmo primeiramente elabora um refinamento da posição da RoI selecionada pelo L1 para determinação da célula mais energética (calculo do baricentro do cluster). Esta informação é obtida utilizando as células da segunda camada eletromagnética (E2). Após o refinamento, é iniciado o processo de extração de características do chuveiro de partículas e do perfil longitudinal da RoI em questão. As características extraídas são utilizadas para a classificação elétron/jato. A seguir estas as variáveis serão descritas de forma resumida: R core - Razão de Núcleo A razão de núcleo - R core é calculada na segunda camada eletromagnética. Consiste na razão entre a energia contida numa janela de 3x7 células e a energia numa janela de 7x7 células. Ambas ao redor da célula mais energética [20]. 20

45 E ratio - Razão de Energia A razão de energia é calculada na primeira camada eletromagnética. Consiste na razão entre a diferença da energia das duas células mais energéticas, e a soma da energia dessas células: E ratio = (E 1st E 2nd )/(E 1st + E 2nd ). As células devem estar numa janela de 0,125η x 0,2φ ao redor do baricentro do cluster [20]. E EM - Energia Eletromagnética Total A Energia Eletromagnética Total - E EM é calculada a partir da soma da energia concentrada em janelas de 3x7 células em torno de (η 1 xφ 1 ) nas três camadas eletromagnéticas [21]. E HAD - Energia Hadrônica Total A Energia Hadrônica Total - E HAD é calculada a partir da soma da energia depositada nas três camadas do calorímetro hadrônico e a quantidade de energia depositada nas três camadas do calorímetro eletromagnético, calculada numa janela de 0,2 x 0,2 em (ηxφ) ao redor do centro do cluster [20]. O T2Calo opera com cortes lineares com base nas variáveis listadas acima, levando em consideração as diferenças entre a dispersão do perfil de deposição de energia do chuveiro eletromagnético e dos jatos hadrônicos. Por exemplo, analisando os valores encontrados para as variáveis R core, E ratio e E EM, os eventos são classificados de acordo com a comparação com os valores medidos da RoI em relação a patamares de corte pré-estabelecidos. No caso da variável E HAD a análise é inversa, para a classificação de um evento como elétron, o valor calculado para esta variável deve ser menor que o patamar de corte padrão desta variável. A eficiência de detecção do discriminador T2Calo é limitada por dois aspectos: A utilização de cortes lineares e o pequeno número de parâmetros considerados no processo de decisão. 21

46 2.6.2 O Discriminador Neural Ringer No trabalho [9] foi proposto um sistema de identificação de elétrons alternativo ao discriminador padrão que opera no L2 do detector. O Neural Ringer efetua um préprocessamento topológico da informação de cada camada do calorímetro (extração de características), localizando primeiramente a célula de maior deposição energética na camada e somando o valor das células localizadas em anéis concêntricos a este ponto. Neste procedimento é obtido um total de 100 anéis para cada RoI selecionada pelo L1, considerando uma RoI de tamanho fixo. A Figura 2.11 representa o processo de geração dos anéis. As diferentes granularidades provocam a geração de quantidade distinta de anéis para cada camada do calorímetro, conforme indicado na Tabela 2.1. Figura 2.11: Representação da formação dos anéis no calorímetro, extraído de [20]. Tabela 2.1: Número de anéis por camada. Camadas PS E1 E2 E3 H0 H1 H2 Anéis Após a geração dos sinais em anéis, é realizada a normalização de cada anel pela energia total dos anéis. O vetor de características resultante é utilizado para alimentar um classificador baseado numa rede neural artificial (RNA) feedforward [22] com duas camadas e um único neurônio na saída. O fluxo de processamento 22

47 do Neural Ringer é representado na Figura Utilizando o Neural Ringer, foram obtidos melhores índices de classificação em relação ao discriminador padrão do detector, exibidos com detalhes nos trabalhos [20], [21] e [9]. Figura 2.12: Cadeia de processamento do Neural Ringer, extraído de [21] O processo de anelamento reduz a quantidade de informação a ser analisada no sistema de calorimetria, mediante o agrupamento de diversas células em uma única informação, reduzindo de aproximadamente 1000 células de uma RoI, para 100 anéis (fator de compactação de aproximadamente 10 vezes). O anelador mantém também a interpretação física do processo, pois as relações de profundidade longitudinal e espalhamento lateral do chuveiro de partículas são mantidas. A Figura 2.13 ilustra um exemplo do perfil de deposição de energia típico para elétron e para jato hadrônico, medidos na segunda camada eletromagnética do calorímetro no ATLAS (E2). É possível observar que o perfil energético típico de elétrons possui concentração em torno da RoI, enquanto que o perfil típico de jatos hadrônicos apresentam um espalhamento maior em torno da célula mais quente. O processo de identificação de partículas através do perfil de deposição energético nas camadas do calorímetro, pode ser uma tarefa mais complicada quando os perfis possuem distribuição parecida. A Figura 2.14 (a) mostra o perfil de energia depositado por elétrons típicos em todos os 100 aneis, medidos em uma RoI. Observa-se que a energia é distribuída principalmente nos anéis contidos nas camadas eletromagnéticas do calorímetro, enquanto que a Figura 2.14 (b), apresenta o perfil de jato hadrônico típico, com distribuição da energia em camadas eletromagnéticas e hadrônicas. Finalmente em 2.14 (c), é mostrado o perfil de um jato hadrônico que se assemelha muito ao de um elétron. 23

48 Figura 2.13: Perfis de deposição de energia típicos na segunda camada do calorímetro eletromagnético do ATLAS. Extraído de [21] Figura 2.14: Perfil de deposição de energia de elétrons (a), jatos típicos (b) e jatos atípicos que dificultam o processo de identificação de partículas pelo perfil de energia (c), extraído de [21] 24

49 2.7 Limitações do Neural Ringer O discriminador Neural Ringer apresentou significativas melhorias na eficiência de discriminação no canal elétron/jato, conforme apresentado nos trabalhos [9],[23] e [20]. Todavia, o Neural Ringer gera 100 variáveis para uma única assinatura, enquanto que o algoritmo padrão representa a informação da mesma assinatura em poucas variáveis. Apesar do aumento da eficiência de discriminação, em relação ao algoritmo padrão do L2, a quantidade de informação armazenada pelo Neural Ringer é elevada. Em relação a classificação por redes neurais, em geral o uso de pré-processamento nos sinais de entrada pode facilitar o treinamento e aumentar o desempenho de classificação [24]. Uma etapa de pré-processamento de sinais é útil para redução da dimensão, eliminação de ruídos e de informação redundante [25]. Nesta dissertação é proposta a adição de técnicas de pré-processamento na cadeia de operação do Neural Ringer. As técnicas são baseadas em análises estatísticas de ordem superior (HOS - High Order Statistics), em processamento digital de sinais e em fundamentos da teoria da informação, nas quais o principal objetivo é eliminar a redundância de informação no conjunto de sinais formatados em anéis, reduzir a dimensão da informação a ser armazenada e extrair características essenciais do conjunto de dados para elevar a eficiência do teste de hipóteses, realizado pela RNA. O projeto e os testes dos sistemas propostos foram realizados utilizando bases de dados simuladas e experimentais, que representam condições de ambiente do detector nos últimos anos. Informações detalhadas sobre a fundamentação teórica das técnicas de pré-processamento utilizadas serão apresentadas no Capítulo 03 deste trabalho. 25

50 Capítulo 3 Técnicas de Pré - Processamento Utilizadas Este capítulo apresenta a fundamentação teórica das técnicas de pré-processamento de sinais propostas para a melhoria de desempenho do discriminador Neural Ringer. 3.1 Pré - Processamento da Informação A análise das características presentes em um conjunto de dados permite a descoberta de padrões e tendencias que podem fornecer informações relevantes que ajudem o entendimento do processo físico que gerou os dados [26]. A aplicação da etapa de pré-processamento de dados é utilizada para melhorar a qualidade dos conjuntos, efetuando a eliminação de possíveis ruídos, imperfeições, inconsistências ou redundâncias que podem haver no conjunto de dados a ser usado. A alta dimensionalidade é um dos principais problemas enfrentados em trabalhos que envolvem grandes quantidades de dados [27]. A área de reconhecimento de imagens é um exemplo de campo de pesquisa que normalmente possui problemas com a alta dimensionalidade dos dados. Se cada pixel (unidade básica de uma imagem digital) da imagem for considerado um atributo, cada imagem com 1024 por 1024 pixels teria mais de um milhão de atributos [24]. O efeito do número alto de atributos é descrito pela maldição da dimensionalidade [28]. Quanto maior for a dimensão dos dados de entrada, maior será a complexidade do sistema de classificação, requerendo também maior informação estatística para o 26

51 aprendizado adequado do classificador. Especialmente, em problemas de classificação por Redes Neurais Artificiais, a etapa de pré-processamento pode contribuir para o aumento da eficiência do classificador. Isto porque os sistemas neurais de classificação são projetados a partir de um processo interativo de ajustes de pesos [22]. Portanto o uso de uma etapa de pré-processamento, capaz de evidenciar características mais discriminantes dentro de uma grande base de dados, pode facilitar o processo de treinamento do sistema de classificação. A Figura 3.1 ilustra as vantagens de utilização de etapas de préprocessamento em sistemas de classificação. CONJUNTO DE DADOS PRÉ PROCESSAMENTO INTERPRETAÇÃO / CLASSIFICAÇÃO VANTAGENS: EXTRAÇÃO DE CARACTERÍSTICAS ELIMINAÇÃO DE REDUNDANCIAS REMOÇÃO DE RUÍDO REDUÇÃO DE DIMENSIONALIDADE Figura 3.1: Principais vantagens na utilização de técnicas de pré-processamento de sinais. Este trabalho propõe a adição de uma etapa na cadeia do discriminador Neural Ringer onde será aplicado um pré-processamento aos sinais formatados em anéis, antes da classificação. A seguir serão descritas, as técnicas de pré-processamento propostas para utilização na cadeia do Neural Ringer. 3.2 Processamento Estatístico de Sinais O processamento estatístico de sinais [29] [27], é uma importante ferramenta para a busca de soluções em problemas de classificação envolvendo sinais multidimensionais. 27

52 Dentre as tarefas relacionadas ao processamento estatístico, pode-se destacar os seguintes itens: Estimação de parâmetros em sinais aleatórios: Como propriedades espectrais, distribuição de probabilidade, parâmetros estatísticos, etc [24]. Estimação de Ruído: [29]. Modelagem de Sinais Aleatórios: Identificar o modelo mais adequado ao sinal, estimar os parâmetros do modelo,[22] e [27]. Processamento de Sinais Multivariados: Tratar informações de diversos sensores, eliminar excesso de informação irrelevante (redundância, ruído, etc), minimizar a informação armazenada, revelar as informações relevantes para o problema [24]. Entre as técnicas lineares que buscam, através de premissas distintas, uma nova representação para os sinais multi-dimensionais, pode-se mencionar a Análise de Componentes Principais (ou PCA, do inglês Principal Components Analysis) [4] e a Análise de Componentes Independentes (ou ICA, do inglês Independent Components Analysis) [5] Análise de Componentes Principais Um problema comum em reconhecimento de padrões é a seleção de características ou extração de características. A seleção de características pode ser uma transformação projetada de tal forma que o conjunto de dados pode ser representado por um número reduzido de características efetivas e ainda reter a maioria do conteúdo de informação intrínseco dos dados, ou seja, o conjunto de dados sofre uma redução na dimensionalidade [22]. A Análise de Componentes Principais (PCA) [4] é uma técnica estatística, cujo objetivo é encontrar uma transformação linear tal que os sinais projetados sejam não-correlacionados e grande parcela da energia esteja concentrada num pequeno número de componentes. 28

53 Considerando-se um vetor x = [x 1,..., x n ] T aleatório com n elementos e assumindose que ele tenha média zero), a projeção zi de x na direção de vi é definida por: N z i = vi T x = v ki x k (3.1) Na transformação por PCA, os componentes extraídos z i (i = 1,..., N) devem ser ortogonais e ordenados de forma crescente pela variância das projeções. Deste modo, v 1 pode ser encontrado pela maximização de: k=1 onde C x é a matriz de covariância de x. J P CA i (v 1 ) = E{z 2 i } = E{(v T 1 x) 2 } = v 1 C x v 1 (3.2) A maximização da equação anterior pode ser encontrada a partir da determinação dos autovetores e 1, e 2,..., e n da matriz C x. O ordenamento dos autovetores é, tal que, os autovalores que associados satisfazem d 1 > d 2 >... > d N, assim v i = e i, tornando a decomposição por autovalores da matriz C x equivalente a PCA de x. A Figura 3.2 representa o processo de aplicação da PCA, considerando a aplicação para compactação e a aplicação da inversa da PCA, para retorno a dimensão original do sinal. Figura 3.2: Processo de compactação por PCA, adaptado de [4] A análise de componentes principais é amplamente usada para compactação de informação. Como a PCA projeta os sinais em componentes ordenados por energia, usualmente armazena-se apenas os componentes de maior energia, de modo que o sinal recuperado a partir da informação compactada tenha um erro médio quadrático pequeno, quando comparado ao sinal multidimensional original. 29

54 Aplicações da PCA Diversos trabalhos vem utilizando a PCA em problemas de processamento de sinais. No trabalho [30] foram estudadas diversas técnicas de seleção de variáveis para classificação de eventos com redes neurais, em experimentos de física de altas energias. O objetivo foi verificar quais as melhores técnicas de seleção de características para identificação de quarks, em experimentos do detector ALEPH, no CERN. Dentre as técnicas verificadas a PCA obteve bons resultados. Em [23] a PCA foi utilizada para compactação dos sinais de calorimetria do ATLAS, em seguida, os sinais projetados em seus componentes principais foram usados como entrada para classificadores neurais para realização da decisão elétron/jato. Os resultados obtidos apresentaram eficiência de classificação superior à do sistema padrão de discriminação de eventos utilizado no detector, melhorando o custo computacional e reduzindo a taxa de erros de classificação Análise de Componentes Independentes A análise de componentes independentes (ICA) [5] busca uma transformação onde os componentes na saída sejam mutuamente independentes estatisticamente. A seguir serão descritos brevemente os conceitos estatísticos que fundamentam a técnica da ICA, bem como viabilizam o processo de extração de características de sinais misturados. O princípio da independência estatística estabelece que, duas variáveis aleatórias a e b, são estatisticamente independentes se e somente se [29]: p a,b = p a (a)p b (b) (3.3) onde p a,b (a, b), p a (a) e p b (b) são respectivamente as funções densidade de probabilidade conjunta e marginais (pdf) das variáveis aleatórias a e b respectivamente. Uma condição equivalente é obtida se, para todas as funções, g(a) e h(a), que são absolutamente integráveis, obtém-se a seguinte expressão: onde E{.} é o operador esperança. Eg(a)h(b) = Eg(a)Eh(b) (3.4) 30

55 O conceito de independência envolve o conhecimento de toda a estatística dos dados, sendo mais abrangente que a descorrelação (utilizada pela PCA), que somente utiliza estatística de segunda ordem (variância). A combinação do uso das técnicas PCA com a ICA é uma importante ferramenta para a resolução de problemas em extração de características e separação de sinais [31]. Na ICA, considera-se que um sinal multidimensional x(t) = [x 1 (t),...,x N (t)] T observado (ou medido) é gerado a partir da combinação linear das fontes independentes s(t) = [s 1 (t),...,s N (t)] T : x = As, (3.5) onde A é a matriz de mistura. O objetivo final da ICA é encontrar uma aproximação y das fontes independentes s, utilizando apenas os sinais observados x. y = Wx, (3.6) sendo W a matriz de separação. Se W = A 1, y = s e o problema foi completamente solucionado [5]. Figura 3.3: Diagrama do modelo básico da ICA, extraído de [21] Estimação de Componentes Independentes A ICA, a partir dos sinais observados (x), estima as fontes de sinais independentes (s) que produziram as assinaturas medidas. No processo de extração de informação é comum que os sinais de interesse só estejam acessíveis de forma misturada com outros sinais de diferentes naturezas, de forma que os sinais medidos por sensores são misturas dos sinais originais, ou ruído. 31

56 Os componentes independentes podem ser extraídos de uma mistura, através do princípio da não-gaussianidade. O princípio básico para a extração dos componentes independentes é obtido do teorema do limite central, no qual afirma que a soma de duas variáveis aleatórias independentes é sempre mais próxima de uma distribuição normal do que as variáveis originais [32]. Sabendo que os sinais misturados x i são gerados a partir do somatório ponderado das fontes s i, então x i têm distribuições de probabilidade mais semelhantes à Gaussiana se comparados a s i. Portanto as fontes s i, podem ser obtidas pela maximização da não-gaussianidade [5]. A não-gaussianidade pode ser estimada a partir do calculo de medidas como a Curtose e a Negentropia, para maiores detalhes ver Apêndice B. Alguns algoritmos vem sendo propostos para estimação dos componentes independentes. No trabalho [5] foi realizado um estudo comparativo entre diversos métodos para computação dos componentes independentes, onde foi descrito com detalhes o algoritmo FastICA, no qual apresenta menor custo computacional. Neste trabalho o algoritmo FastICA foi utilizado para a estimação dos componentes independentes. Algoritmo FastICA Para a estimação dos componentes independentes o algoritmo FastICA baseia-se nas propriedades de maximização da não-gaussianidade, através dos métodos curtose e negentropia [5]. As principais vantagens deste sistema é a baixa complexidade computacional e boas características de convergência. O FastICA é formulado executando-se a seguinte rotina: 1. Escolher um vetor de pesos inicial w de modo aleatório; 2. Fazer w + = E{xg(w T x)} - E{xg (w T x)}w ; 3. w = w + / w + ; 4. Se não ocorrer convergência no algoritmo, retornar ao passo 2; Em que para a função g(.) podem ser utilizadas as seguintes funções [32]: g 1 (x) = tgh(a 1 x), (3.7) 32

57 g 2 (x) = xexp( a 2 u 2 /2), (3.8) g 3 (x) = x 3, (3.9) onde 1 a 1 2 e a 2 1. A escolha da não linearidade g(.), pode ser definida de acordo com as seguintes características da operação [32]: g 1 (.): indicada quando não há informação a respeito da estatística dos componentes independente; g 2 (.): indicada quando os componentes independentes são super-gaussianas; g 3 (.): indicada para estimar componentes sub-gaussianas. O algoritmo FastICA apresenta vantagens como paralelismo, é distribuído, computacionalmente simples e requer pouco espaço em memória. Utilizando métodos de ortogonalização deflacionária como o de Gram-Schimidt [5], é possível realizar a estimação de mais de uma componente independente. Algoritmo JADE O algoritmo JADE (Joint Approximate Diagonalization of Eigenmatrices) estatísticas de segunda e quarta ordem são empregadas para a estimação dos componentes independentes através de uma aproximação por tensores. Tensores são generalizações de alta dimensão das matrizes O cumulante de segunda ordem (matriz de covariância) é utilizado para assegurar que as variáveis estão branqueadas. A informação de quarta ordem (obtida pela matriz de tensores de cumulantes de quarta ordem) provê o critério de independência. O tensor cumulante de quarta ordem T 4 é uma matriz de quatro dimensões onde cada elemento é definido por q ijkl = cum(x i, x j, x k, x l ), em que os índices i, j, k e l variam de 1 até N (N é o número de sinais) e cum(x i, x j, x k, x l ) é o cumulante de quarta ordem. Os métodos tensoriais de ICA propõem a diagonalização de T 4 para alcançar a independência estatística. A diagonalização da matriz de correlação C y provoca a descorrelação entre os componentes de y [5]. Para sinais independentes, somente 33

58 quando i = j = k = l os cumulantes de quarta ordem são diferentes de zero. O critério de estimação JADE é obtido através de um procedimento análogo à diagonalização da matriz de covariância. Como T 4 é a contrapartida de quarta ordem da matriz de covariância, a independência pode ser obtida através da diagonalização de T 4. A utilização de métodos tensoriais para estimação dos componentes independentes requer bastante recurso computacional para a decomposição das matrizes de quarta ordem. O algoritmo JADE apresenta uma proposta que solicita menos custos computacionais, propondo um método aproximado para a diagonalização de T 4. O algoritmo JADE busca pela matriz W que minimiza a soma dos quadrados dos elementos não pertencentes à diagonal principal de T (s) 4 (onde T (s) 4 é o tensor de cumulantes de quarta ordem da matriz de estimação das fontes independentes). Os detalhes do algoritmo JADE pode ser verificado no trabalho [33]. Aplicações da ICA Ao longo dos últimos anos [34] veem se desenvolvendo técnicas de processamento da informação denominadas Separação Cega de Fontes (Blind Source Separation - BSS) [35]. O termo Cega refere-se ao fato de não se possuir informação alguma a priori dos sinais originais, nem de como se dá o processo de mistura que produziu os sinais medidos [34]. No trabalho [36] é apresentada a aplicação da ICA para separação de misturas em sinais medidos por um único dispositivo, que carregam informações de diferentes tipos de distúrbios de qualidade de energia elétrica. Foi utilizado o algoritmo SCICA (Single Channel Independent Component Analysis), no qual aplica a ICA convencional a vetores contendo amostras atrasadas de um mesmo sinal medido. O método foi capaz de identificar de maneira não-supervisionada, aproximadamente separar e reconstruir as formas de onda de até três tipos de distúrbios elétricos individuais distintos espectralmente (harmônicos, notching e transitórios oscilatórios). No trabalho [37], foram estudados métodos de remoção de ruído em sinais de eletrocardiogramas (ECG) utilizando a ICA. O algoritmo JADE foi utilizado para estimação ds componentes independentes. Os sinais de ECG foram medidos em um total de dez pacientes diferentes durante 10 segundos, utilizando um total de 10 eletrodos. Os resultados encontrados mostraram que o pré-processamento por ICA 34

59 foi capaz de remover com eficiência o ruído dos sinais de ECG, facilitando a análise médica dos sinais gravados. Aplicações online para detecção e remoção de ruído em ECG, foram sugeridas. No contexto do trigger online do detector ATLAS, no trabalho [38], a utilização de pré-processamento aos sinais de calorimetria, por PCA e ICA foi proposta com o objetivo de melhorar o desempenho do classificador neural, na detecção de elétrons. Os resultados mostraram que o uso de pré-processamento provoca aumento na eficiência de classificação de eventos de interesse, obtendo resultados superiores aos encontrados pelo algoritmo padrão de seleção de eventos utilizado no detector. 3.3 Transformada Discreta de Wavelet Neste trabalho foi utilizada a Transformada Discreta de Wavelet (DWT) para realizar a compactação dos sinais em anéis do calorímetro do ATLAS. O principal objetivo foi reduzir a dimensão dos sinais de calorimetria. A DWT é discreta em tempo e escala. Os coeficientes da DWT podem possuir valores reais, mas os valores de tempo (deslocamento) e escala utilizados para indexar esses coeficientes são inteiros. Diferentemente da transformada de Fourier, cujas funções de base são senoides, as transformadas wavelet se baseiam em pequenas ondas, chamadas de ondaletas ou wavelets, de frequência variada e duração limitada [39]. Um modo eficiente para realizar a DWT é através de filtragens sucessivas do sinal discreto x[n] [39]. Considerando dois filtros digitais, espelhados em quadratura, com sequências de resposta a impulso finitas g[n](passa-baixas) e h[n] (passa-altas), o sinal de interesse x[n] é então decomposto em: y Low [n] = x [k] g [2n k] (3.10) k= y High [n] = x [k] h [2n k] (3.11) k= O filtro passa-baixas produz o sinal de aproximação, enquanto o filtro passaaltas produz o sinal de detalhe [25]. Os coeficientes dos filtros g[n] (coeficientes de aproximação) e h[n] (coeficientes de detalhamento) estão relacionados com as 35

60 funções wavelets utilizadas na decomposição. Após a filtragem o sinal x[n] é subamostrado por um fator de 2 [39], conforme mostra a Figura 3.4. Figura 3.4: Fluxo de processamento da DWT. Adaptado de [25]. Computacionalmente a DWT pode ser implementada a partir da construção de uma matriz com os coeficientes do filtro selecionado (processo idêntico para os filtros passa baixas e passa altas), decimado em 2, para a realização da multiplicação com o sinal x[n]. X = [ ] x[1], x[2], x[3],..., x[n] (3.12) Y = [ ] y[1], y[2], y[3],..., y[n] g[1] g[3] g[2] g[1]... 0 C = g[k 2] g[k 1] g[k] g[k] (3.13) (3.14) Y = C X (3.15) Sendo Y l a matriz que contém a saída do filtro selecionado, C a matriz que contém os coeficientes g[k] do filtro selecionado (sub-amostrada por 2) e X a matriz do sinal discreto de entrada. A multiplicação da matriz C de coeficientes pelo sinal x[n] pode também ser representada pela convolução destas matrizes. A decomposição do sinal de entrada pela DWT pode ser computada em mais níveis, executando o processo de convolução dos coeficientes de aproximação pelos coeficientes do filtro selecionado, realizando a novamente a sub-amostragem [39]. 36

61 Aplicações da DWT A DWT tem sido utilizada nos últimos anos em diversos problemas de processamento de sinais, devido as suas propriedades de análise em multiresolução [39], filtragem [40] e compactação eficiente de sinais. No trabalho [41] foram desenvolvidos algoritmos para aplicações de técnicas de compressão utilizando a transformada discreta de wavelets para registros oscilográficos de sinais de sistemas elétricos de potência, decorrentes de faltas, manobras e de distúrbios de qualidade de energia elétrica. Utilizando dados experimentais, em que os resultados mostraram um bom desempenho em relação a precisão da forma de onda reconstruída com a compactação e redução da quantidade de memória necessária para representar a informação quantificada. Em [42], são apresentados os estudos realizados com a aplicação da transformada wavelet para detecção de falhas no regime não-estacionário de motores elétricos. A transformada wavelet, juntamente com a PCA foram utilizadas para extrair parâmetros de energia e entropia a partir de sinais de vibração. As características extraídas serviram de entrada para o discriminante K-vizinhos, que efetuou a classificação. Foram realizados testes experimentais, para o projeto e teste do sistema de detecção para quatro classes de falhas distintas (duas falhas de natureza mecânica e duas de natureza elétrica). A transformada wavelet foi aplicada até o quarto nível de decomposição nos sinais de vibração do motor, e posteriormente foi aplicada a PCA, para redução da dimensionalidade destes sinais. Os resultados obtidos apresentaram alta taxa de acertos e precisão na detecção de falhas mecânicas e elétricas em motores trifásicos, através da análise de sinais de vibração. No trabalho [43], são apresentados resultados do projeto e teste de um sistema embutido em DSP para apoio a decisão de identificação de defeitos em peças de materiais laminados fibra metal, através de inspeções por emissões de ultrassom. As peças foram inspecionadas por ultrassom e os sinais medidos são pré-processados e classificados por redes neurais artificiais, para a classificação de defeitos. A DWT foi utilizada como pré-processamento dos sinais de ultrassom com o objetivo de extrair e evidenciar características relevantes para aumento na eficiência do classificador neural. Foram utilizadas quatro classes de defeitos, e o uso da DWT promoveu o aumento da taxa de acerto de defeitos pelo classificador. 37

62 Capítulo 4 Metodologia Utilizada e Bases de Dados Este capítulo apresenta a metodologia proposta para o desenvolvimento deste trabalho. Serão também descritas as características das bases de dados utilizadas para os testes e simulações desenvolvidas. 4.1 Introdução O principal objetivo deste trabalho é verificar se existe aumento de eficiência do sistema de classificação Neural Ringer, a partir do uso de técnicas de pré-processamento nos sinais medidos no sistema de calorimetria do ATLAS. O processo de discriminação é basicamente dividido em duas etapas de diferentes propósitos. A primeira consiste na aplicação do pré-processamento nos sinais formatados em anéis, de forma a promover a redução da informação não relevante para o experimento, e também para que as características mais discriminantes dos sinais sejam evidenciadas. Na segunda etapa, os sinais processados são utilizados como entradas para um sistema de classificação baseado em redes neurais artificiais supervisionados, do tipo MLP, no qual o processo de decisão elétron/jato é finalmente realizado. Este estudo foi desenvolvido através de implementações computacionais, utilizando as técnicas propostas, em conjuntos de dados simulados e experimentais, disponibilizados pelo grupo Trigger and Data Acquisition - TDAQ, do ATLAS. 38

63 4.2 Avaliação de Desempenho dos Classificadores Projetados Os parâmetros usados para avaliação de desempenho dos discriminadores projetados são a curva ROC (Receiver Operating Characteristic) [44] [45] e o Índice SP, brevemente descritos a seguir Curva ROC Em problemas de classificação em duas classes (classificação binária), em geral existe uma classe que se deseja detectar (chamada classe positiva) e outra que representa o ruído de fundo para detecção da classe de interesse. Neste caso, a resposta do sistema de classificação pode ser considerada como: Verdadeiros positivos (VP), ou seja, os exemplos da classe positiva classificados corretamente. Verdadeiros negativos (VN), ou seja, os exemplos da classe negativa classificados corretamente. Falsos positivos (FP), ou seja, os exemplos cuja classe verdadeira é negativa mas que foram classificados incorretamente como pertencendo à classe positiva. Falsos negativos (FN), ou seja, os exemplos pertencentes à classe positiva que foram incorretamente classificados como sendo da classe negativa. A curva ROC é um gráfico bidimensional, plotado em um espaço denominado espaço ROC, com eixos X e Y, representando a taxa de falsos positivos (TFP) e a taxa de verdadeiros positivos (TVP), respectivamente. Neste trabalho a classe de interesse é composta pelas assinaturas de elétrons. Assim a TFP é associada à probabilidade de falso alarme (PF), ou seja, a probabilidade de classificação de um jato hadrônico como sendo elétron e a TVP é associada à probabilidade de detecção (PD), que é a classificação correta de um elétron. As eficiências obtidas para elétrons e jatos podem ser definidas respectivamente como 39

64 Ef e = P D e Ef j = 1 P F. T F P = P F (4.1) T V P = P D (4.2) A curva ROC mostra como as probabilidades de detecção (PD) e falso alarme (PF) variam de acordo com o patamar de decisão do discriminador. A eficiência de um classificador pode ser estimada a partir da área sob a curva ROC, quanto maior a área mais eficiente é o discriminador. 100 Probabilidade de Detecção (%) Classificador A Classificador B Probabilidade de Falso Alarme (%) Figura 4.1: Exemplo de Curvas ROC para dois classificadores distintos Índice SP O índice SP é um parâmetro utilizado para a definição do patamar de decisão ótimo em um determinado classificador. Para cada valor do patamar de decisão, dentro da sua faixa de excursão (neste trabalho esta faixa é definida entre -1 e 1), é possível calcular os valores dos índices SP correspondentes. O máximo SP encontrado indica um patamar que apresenta alta eficiência de discriminação para as duas classes. O índice SP é calculado conforme definido na equação: SP = ( 1 2 ) (Ef e + Ef j ) Ef e Ef j, (4.3) 40

65 Quanto maior o valor do máximo SP, mais eficiente é o classificador em termos da minimização do erro para as duas classes [21]. Um classificador ideal tem o SP = Etapa de Pré-Processamento Para realizar a redução da dimensão da informação, neste trabalho foram utilizadas a Análise de Componentes Principais (PCA) e a Transformada Discreta de Wavelet (DWT). Para a avaliação da eficiência dos níveis de compactação para o problema em questão, foram realizadas analises de variação do índice SP(%), PD(%) e PF(%). Os resultados encontrados serão expostos em gráficos e tabelas. A identificação de elétrons a partir de informações do sistema de calorimetria configura-se em um problema multidimensional, devido a grande quantidade de informação produzida e distribuída em múltiplas variáveis. Para viabilizar a análise são utilizadas técnicas que tornam a estrutura essencial dos dados mais evidentes. As técnicas de processamento multidimensional buscam uma transformação que promova uma nova representação tal que a informação característica seja mais acessível. A etapa de extração de características dos sinais formatados em anéis é realizada utilizando a Análise de Componentes Independentes (ICA). O algoritmo FastICA [5] foi utilizado para a estimação dos componentes independentes, por apresentar boa precisão e rapidez, mesmo em problemas com alta dimensionalidade. 4.4 Etapa de Classificação Levando em consideração que cada camada do calorímetro do ATLAS tem propriedades físicas diferentes, os classificadores deste trabalho foram projetados com duas topologias distintas, conforme mostrado a seguir Classificação Não-Segmentada O modo não-segmentado, utiliza a informação dos sinais pré-formatados em anéis gerados para todas as camadas do calorímetro, no qual a etapa de pré-processamento 41

66 executa os seus algoritmos em todos os anéis (sem distinção entre as camadas). Para cada evento, as informações dos 100 anéis são concatenadas num único vetor de características. Os sinais resultantes do pré-processamento são as entradas do classificador neural do tipo MLP, conforme a 4.2, mostrada a seguir: Figura 4.2: Pré-processamento não-segmentado ao classificador Neural Ringer. Ainda, no processamento não-segmentado, foram realizadas também avaliações sobre a influência na eficiência de classificação dos sinais obtidos em cada camada do calorímetro. Este processo foi realizado através da execução de toda a cadeia de processamento com apenas os sinais medidos em uma única camada, e por fim realizado a análise da eficiência obtida. Após a verificação das camadas do calorímetro que obtiveram maiores eficiências no processo de classificação, foi realizado a concatenação dos vetores destas camadas, e então executado toda a cadeia de processamento do sistema de classificação. As RNAs utilizadas neste processo de discriminação são treinadas especificamente com os sinais da camada selecionada. Com este procedimento é possível avaliar as reais necessidades de uso de todos os anéis para o processo de classificação, tornando possível a seleção de camadas mais relevantes, caracterizando um efeito de compactação por relevância das camadas dos sinais medidos no calorímetro Classificação Segmentada Cada camada do calorímetro apresenta características próprias como os tipos de sensores utilizados e a granularidade das células. Conforme descrito, o Neural Ringer utiliza sem distinção as características de todas as camadas. Como as camadas são sobrepostas, o evento que se desenvolve muitas vezes interage com diversas camadas, podendo ocorrer redundância nas informações coletadas. 42

67 PRÉ PROCESSAMENTO PRÉ PROCESSAMENTO PRÉ PROCESSAMENTO A principal motivação para o uso de segmentação na classificação, consiste na exploração das características específicas verificadas nos sensores que medem energia, que variam em cada camada e posição de interação no calorímetro. Utilizar classificadores especialistas nas características de instrumentação de cada camada, pode melhorar a identificação de eventos mensurados no calorímetro. Utilizando classificadores neurais segmentados também possibilita verificar quais camadas possuem maior importância ao processo de classificação. É possível fazer combinações de algumas camadas, as mais relevantes, e ainda assim conseguir resultados próximos aos dos classificadores que utilizam todas as camadas de forma concatenada [46]. Com o uso de menor quantidade de informação, contribui-se para reduzir o tempo de processamento, o que é um requisito importante para a aplicação. CAMADA DE ENTRADA DOS CLASSIFICADORES SEGMENTADOS ANÉIS CAMADA PS ANÉIS CAMADA E1 SAÍDA RNA COMBINADORA ANÉIS CAMADA H2 Figura 4.3: Fluxo de processamento para o sistema de classificação neural segmentado por camada, com etapa de pré-processamento. Neste trabalho o sistema de classificação segmentada foi implementado utilizandose os sinais medidos de cada camada do calorímetro para alimentar separadamente 43

68 classificadores neurais (num total de sete, um para cada camada). As saídas das camadas ocultas dos sete classificadores são utilizadas como entrada para uma nova rede neural, que combina as características de cada camada para produzir a decisão final (rede combinadora). 4.5 Treinamento das Redes Neurais O treinamento da rede neural foi realizado executando-se método de validação cruzada [24], usado para estimar a flutuação estatística do conjunto de sinais no desempenho dos classificadores. O método realiza primeiramente a divisão de todo o conjunto de dados em N subgrupos com aproximadamente o mesmo número de elementos. Em seguida, é definido um número de sorteios (neste caso foram utilizados 10 sorteios). São selecionados os conjuntos de treino e teste (usado também como validação) de cada subgrupo. Na sequência é treinado um discriminador neural para cada sorteio, utilizando os subgrupos definidos anteriormente. O desempenho final é dado pela média dos desempenhos observados sobre cada subconjunto de teste. O processo de validação cruzada é exemplificado na Figura 4.4. O algoritmo de treinamento utilizado foi o RPROP (Resilient Back-Propagaion) [47] e todos os neurônios utilizam função de ativação tangente hiperbólica. Os detalhes do método de treinamento podem ser verificados no Apêndice B deste trabalho. Figura 4.4: Representação do processo de validação cruzada usado no treinamento do classificador neural. 44

69 4.6 Bases de Dados Utilizadas neste Trabalho Para o projeto e teste dos algoritmos de trigger em experimentos de física de altas energias, são utilizados dados simulados que tentam representar as características atuais e futuras do detector. Neste trabalho foram utilizadas bases de dados simulados a partir de técnicas de Monte Carlo, geradas em 2011 e 2012, nas quais simulam as condições e cenários de operação para os próximos anos. Dados experimentais também são utilizados para o desenvolvimento e aprimoramento dos algoritmos de detecção de partículas, permitindo a análise de eficiência dos sistemas de classificação em relação as condições atuais de operação do experimento. A aquisição dos dados experimentais, usados para as análises dos sistemas de detecção de eventos propostos neste trabalho, foi realizada em rodadas de colisões ocorridas no ano de A seguir serão descritas de forma detalhada, as bases de dados utilizadas nas análises deste trabalho. Seleção dos Conjuntos de Sinais Os conjuntos de sinais de elétrons e jatos são separados através de critérios de seleção dos algoritmos de classificação de eventos do ambiente offline. O offline consiste em um conjunto de algoritmos com alto poder computacional, que opera em ambiente com menos restrições quanto a tempo e capacidade de processamento, realizando a avaliação das informações fornecidas pelo sistema de trigger online. A resposta dos sistemas offline são utilizadas pelos Físicos como parecer final para as análises que realizam. As classes de eventos (elétrons e jatos) selecionadas pelos algoritmos do ambiente offline são utilizadas para efetuar o treinamento dos classificadores, que irão processar a informação no trigger online. No processo de seleção pelos critérios do offline, as RoIs selecionadas pelo L1 do trigger online são relacionadas com os eventos reconstruídos no ambiente offline, através de suas posições de interação no detector, nos planos η e φ. Assim, uma RoI é considerada um elétron caso o seu evento associado, identificado no offline tenha sido aceito pelo critério mais seletivo de classificação de elétrons (elétron tight). Por sua vez, uma RoI é considerada ruído de fundo caso o evento associado, 45

70 visualizado no offline, tenha sido rejeitado, tanto pelo critério menos seletivo de classificação de elétrons (elétron loose), quanto pelo critério loose de fótons. As RoIs que não satisfazem as condições acima são evitadas para o treinamento das redes neurais que operarão no L2 do HLT Dados Simulados A energia da colisão de prótons para as bases de dados foi ajustada para 14 TeV, com luminosidade máxima de Com estes níveis de energia e luminosidade, é possível que ocorra aumento considerável no empilhamento de eventos, ou seja, o sinal medido de um evento pode carregar informações de eventos anteriores. A sobreposição da informação pode interferir na correta classificação do sinal medido. Neste conjunto de dados simulados, um evento pode carregar a informação dos últimos 36 eventos provocando aumento no ruído de fundo no processo de detecção. Estas condições adversas são interessantes para o correto ajuste dos algoritmos de identificação de partículas, pois eles podem ser projetados de acordo com condições operacionais futuras do experimento. Conjunto Monte Carlo 2011 No conjunto de dados MC 2011, a classe de elétrons possui aproximadamente assinaturas provenientes do decaimento do bóson Z em um elétron e um pósitron (Z e + e ). Nesta base de dados, foram realizados dois cortes em energia, que selecionaram respectivamente as assinaturas com energia transversa (E T ) acima de 10GeV (e10) e assinaturas com E T maior que 22 GeV (e22), sendo o conjunto e22 um sub-conjunto do e10. A classe de jatos hadrônicos possui aproximadamente assinaturas, e foi gerada sob as mesmas condições do detector utilizadas para a geração de eventos da classe de elétrons. Os jatos foram simulados com energia transversa concentrada em 17 GeV, caracterizando o ruído de fundo do decaimento do bóson Z. O conjunto de dados e10 simula uma configuração pouco restritiva para o primeiro nível de filtragem e, para isso, foi realizado um corte mais livre em energia, contendo informações de partículas com baixa E T e alto nível de ruído. 46

71 O conjunto e22 simula um corte mais severo no primeiro nível, sendo selecionados eventos com mais alta E T. Deste modo, nesta base de dados encontram-se jatos hadrônicos com perfil de energia bastante semelhante ao perfil de elétrons, dificultando a decisão dos sistemas de classificação. A Figura 4.5(a) apresenta as distribuições em energia transversa para elétrons e jatos do conjunto de dados simulados MC É possível verificar a concentração de maior número de jatos nas faixas de energia menores, enquanto que os elétrons apresentam maior concentração na faixa de 10 a 60 GeV. Na Figura 4.5(b) são apresentadas as distribuições de elétrons e jatos em função da posição de interação no detector (η). Verifica-se que há uma redução na quantidade de eventos registrados nas regiões de η -1,5 e 1,5 (região do crack do detector). Figura 4.5: Distribuição de sinais de elétrons e jatos em função de Et e η, do conjunto de dados simulados MC Conjunto Monte Carlo 2012 O conjunto de dados Monte Carlo 2012, é constituído por sinais simulados no final ano de A energia transversa dos sinais deste conjunto é maior que 24 GeV. O conjunto de elétrons nesta base de dados possui amostras. O conjunto de 47

72 jatos, possui nesta base de dados 433 assinaturas, as quais também foram geradas com energia transversa maior que 24 GeV. Esta baixa quantidade de assinaturas de ruído de fundo pode reduzir o desempenho no treinamento dos classificadores. Este conjunto de dados representa condições de detecção mais difíceis, onde o empilhamento de eventos possui alta taxa de ocorrência. O principal objetivo de utilização desta base de dados, é verificar o desempenho dos discriminadores em um ambiente com taxa significativas de empilhamento de eventos, que será um fenômeno presente ao passo que se aumenta os níveis de energia das colisões de prótons no LHC. A Figura 4.6 mostra a distribuição dos eventos em função da energia transversa e em função da posição de interação no detector Elétrons Jatos 10 4 Elétrons Jatos 10 4 Contagem Contagem Et[GeV] (a) η (b) Figura 4.6: Distribuição de sinais de elétrons e jatos em função de Et e η, do conjunto de dados simulados MC Dados Experimentais Os dados reais foram obtidos através do execução do algoritmo do Neural Ringer em dados experimentais gravados no ambiente offline. O conjunto de sinais eletromagnéticos foi extraído da colisão identificada por , no qual gerou grande quantidade de eventos considerados eletromagnéticos pelo sistema offline. Para o 48

73 conjunto de jatos, foram extraídos os eventos produzidos na rodada de colisão identificada por , na qual produziu grande quantidade de eventos considerados como jatos pelo offline. Todas as rodadas de colisões ocorreram o mesmo período no ano de 2011, preservando assim as mesmas condições operacionais nos conjuntos de dados de elétrons e jatos(mesma luminosidade, mesmo sistema de filtragem, mesmas características do hardware de detecção por calorimetria, etc). Com estas seleções os anéis do Neural Ringer foram construídos, gerando as bases de dados utilizadas neste trabalho. A Figura 4.7 mostra a distribuição dos eventos do conjunto de dados experimentais, em função da energia transversa e em função da posição de interação no detector. Figura 4.7: Distribuição de sinais de elétrons (run ) e jatos (run ) em função de Et e η do conjunto de dados reais de colisões. 4.7 Análises das Técnicas de Pré-Processamento Neste trabalho, foram realizadas combinações de técnicas de pré- processamento, com intuito de verificar a melhor estratégia para aumento da eficiência de classi- 49

74 ficação do Neural Ringer. Análises de relevância das variáveis de entrada do classificador foram realizadas, em busca da redução de informação não relevante nos sinais em anéis. Para cada base de dados foram realizadas as análises de relevância, para as estratégia de processamento não-segmentada e segmentada. Os resultados encontrados estão organizados conforme ilustra a Figura 4.8. PROCESSAMENTO NÃO - SEGMENTADO PROCESSAMENTO SEGMENTADO Pré - processamento por PCA/ICA Pré - processamento por DWT Análise de relevância das camadas do calorímetro Pré - processamento por PCA/ICA Pré - processamento por DWT Pré - processamento por PCA/ICA Pré - processamento por DWT Análise de relevância das camadas do calorímetro Utilizando rede combinadora Pré - processamento por PCA/ICA Pré - processamento por DWT Análise Comparativa dos resultados Figura 4.8: Organização dos resultados em cada base de dados. 50

75 Capítulo 5 Resultados com Dados Simulados Nesta seção serão apresentados os resultados obtidos do projeto de pesquisa, encontrados através das análises realizadas em bases de dados simulados. 5.1 Base de Dados: Monte Carlo Análises do Conjunto e10 Na análise relativa ao conjunto de dados e10, foi inicialmente definida a estrutura da RNA a ser utilizada. A determinação do número de neurônios da camada oculta foi realizada através de um estudo de avaliação do índice SP e das probabilidades de detecção (PD) e falso alarme (PF). Conforme indicado na Figura 5.1, o uso de 18 neurônios na camada oculta apresentou melhor desempenho, onde os parâmetros máximo SP(%) e PD (%) apresentaram os melhores resultados em função da minimização da PF(%) nas simulações. Com a estrutura da rede definida, serão apresentados a seguir, os resultados encontrados com a adição de pré - processamento aos sinais de entrada da rede neural. Pré-Processamento por PCA/ICA Um estudo para verificação do melhor nível de compactação usando a Análise de Componentes Principais foi desenvolvido. Esta análise foi realizada incrementandose gradualmente o número de componentes, utilizados para alimentar a rede neural. Para cada grupo foi também aplicada a Análise de Componentes Independentes 51

76 Detecção (%) Falso Alarme (%) Número de Neurônios Ocultos Número de Neurônios Ocultos (a) Máximo SP (%) Número de Neurônios Ocultos (b) Figura 5.1: Curvas de variação dos parâmetros PD(%) e PF(%) (a) e Máximo SP (%) em função do número de neurônios da camada oculta. (ICA), visando a extração das características relevantes do conjunto selecionado. A cada teste realizado os parâmetros de avaliação índice SP (%), PD (%) e PF(%) foram observados. A partir deste processo é possível verificar a quantidade de componentes principais suficientes para reter as informações mais relevantes. A Figura 5.2 (a) apresenta a curva de carga da energia armazenada, em função do número de componentes principais retidos nos sinais do conjunto e10. Na Figura 5.2 (b) é mostrado que com o uso de 40 componentes principais é obtido o máximo índice SP (%). Utilizando apenas 40 das 100 variáveis é possível manter 99% da energia total do conjunto. Verifica-se que é possível realizar um considerável grau de compactação, eliminando redundâncias das informações do conjunto de sinais. Conforme mostrado na Tabela 5.1 é possível verificar que para uma mesma taxa de detecção a taxa de falso alarme do classificador com pré-processamento por PCA/ICA é diminuída, em relação ao Neural Ringer sem pré-processamento, reduzindo também o número de variáveis de entrada para o classificador neural. A Figura 5.3 mostra as curvas ROC dos classificadores Neural Ringer e do discri- 52

77 Energia Retida (%) Máximo SP (%) Componentes PCA (a) Componentes PCA (b) Figura 5.2: Curva de carga da PCA (a) e Variação do Max SP em função do número de componentes retidos na compactação por PCA - conjunto e10. Tabela 5.1: Comparação dos resultados encontrados no conjunto e10. Discriminadores Max SP(%) PD(%) PF(%) P F P D=99,75(%) N de Var. Neural Ringer 99,65 ±0,04 99,75 0,38 0, Ringer + PCA/ICA 99,77 ±0,02 99,78 0,18 0,17 40 minador neural com a adição da etapa de pré-processamento por PCA/ICA (Ringer + PCA/ICA), ambos sobre os dados do conjunto e10. A redução do conjunto para uso de 40 componentes principais, resultou em um decréscimo na probabilidade de falso alarme (PF(%)), bem como um considerável aumento no índice SP (%) em relação ao discriminador Neural Ringer sem pré-processamento. Observa-se que, a eficiência do método proposto é superior ao Neural Ringer principalmente para baixos valores de PF (%). 53

78 100 Probabilidade de Detecção (%) Ringer + PCA/ICA Neural Ringer Probabilidade de Falso Alarme (%) Figura 5.3: Curvas ROC dos classificadores Ringer + PCA/ICA e Neural Ringer para o conjunto de dados e10. Pré-Processamento por DWT De forma a avaliar quais as melhores funções wavelets para uso no pré-processamento foram testadas as famílias de Wavelets Daubechies, Symlets e Coiflets, e para cada uma destas famílias, foram usadas três funções Wavelets para avaliação de desempenho. A Figura 5.4 apresenta o índice Máximo SP (%) encontrado para diferentes funções wavelet-mãe utilizadas na etapa de pré-processamento para o classificador neural. Os resultados mostram que as funções wavelet Db1, Symlet 3 e Coiflet 2 apresentam melhores resultados para o máximo SP, em cada família wavelets usadas. A Tabela 5.2 apresenta a comparação dos índices SP(%), PD(%) e PF(%) encontrados para as diversas funções wavelets utilizadas no pré-processamento. Verifica-se que o uso da função wavelet Symlet 3 apresenta menor nível de PF(%) em relação as demais testadas. Em comparação com o Neural Ringer, o uso do pré-processamento com a DWT (Sym3) provocou uma redução de 0,12 % em PF(%), considerando o mesmo nível de PD(%) para os dois classificadores na comparação. A Tabela 5.3 apresenta os resultados da aplicação da ICA, nos sinais pré - processados pela DWT (Sym3).Esta simulação foi realizada para verificar possível aumento na eficiência de discriminação do classificador, com a aplicação da ICA para extração 54

79 Máximo SP Máximo SP (%) Haar Db2 Db5 Sym2 Sym3 Sym4 Coif1 Coif2 Coif3 Figura 5.4: Índices SP (%) encontrados para cada função wavelet utilizada na etapa de pré-processamento - conjunto e10. Tabela 5.2: Resultados obtidos com o uso de diferentes funções wavelets utilizadas. Discriminadores Max SP(%) PD(%) PF(%) N de Var. Neural Ringer 99,65 ±0,4 99,75 0, Ringer+dB1 99,72 ±0,2 99, Ringer+dB2 99,72 ±0,5 99,75 0,35 50 Ringer+dB5 99,69 ±0,3 99,75 0,49 50 Ringer+Sym2 99,72±0,2 99,75 0,37 50 Ringer+Sym3 99,72±0,5 99,75 0,26 50 Ringer+Sym4 99,71±0,3 99,75 0,36 50 Ringer+Coif1 99,69 ±0,2 99,75 0,35 50 Ringer+Coif2 99,70 ±0,5 99,75 0,34 50 Ringer+Coif3 99,70 ±0,3 99,75 0,37 50 das características discriminantes dos sinais pré-processados pela DWT. Os resultados mostram que não houveram ganhos significativos em eficiência, em relação ao classificador projetado com os sinais pré-processados somente pela DWT. Realizando mais um nível de decomposição dos sinais em anéis, pela transformada discreta de wavelets e aplicando a ICA na saída do filtro, foram obtidos os resultados apresentados na Tabela 5.3. Com a aplicação de mais um estágio de filtragem, a eficiência de discriminação permaneceu levemente inferior ao Neural 55

80 Ringer sem pré-processamento, reduzindo o número de variáveis de entrada para 25 (compactação de 75% no conjunto original de dados). Tabela 5.3: Resultados encontrados com a adição de pré-processamento por DWT. Discriminadores Max SP(%) PD(%) PF(%) N de Var. Neural Ringer 99,65 ±0,04 99,75 0, Ringer + DWT (Sym3) /ICA 99,72 ±0,02 99,75 0,26 50 Ringer + DWT (Sym3) (2 LVL)/ICA 99,62 ±0,05 99,75 0, Probabilidade de Detecção (%) Ringer + DWT/ICA Ringer + DWT (2 LVL)/ICA Neural Ringer Ringer + PCA/ICA Probabilidade de Falso Alarme (%) Figura 5.5: Curvas ROC dos classificadores Ringer + DWT, Ringer + DWT/ICA e Neural Ringer. Compactação por Relevância das Camadas do Calorímetro Com o objetivo de avaliar a relevância de cada camada do calorímetro na eficiência do sistema de classificação, inicialmente foram efetuados treinamentos do classificador (sem pré-processamento) retirando a informação de uma das camadas do calorímetro. O objetivo foi verificar o impacto desta retirada na eficiência de classificação, em comparação ao Neural Ringer (treinado com os sinais de todas as camadas). A estrutura da RNA utilizada foi igual à usada no Neural Ringer sem etapa de pré-processamento (02 camadas com 18 neurônios na camada oculta e 01 neurônio 56

81 na cada de saída). A Tabela 5.4 apresenta os valores do Máx SP (%), da probabilidade de detecção (PD( %)) e da probabilidade de falso alarme (PF(%)) para cada classificador projetado. Os resultados mostram que a remoção dos sinais da camada H1 provoca um aumento de 0,03% no índice SP, em relação ao Neural Ringer. Todavia, para o mesmo ponto de eficiência de detecção (99,75 %) o Neural Ringer apresenta um valor de 0,24 ponto percentual menor para o falso alarme. Em termos de relevância, é possível observar que os piores resultados em relação a diminuição do índice SP e aumento do falso alarme (fixando PD em 99,75 %) ocorreram quando o processamento foi realizado com ausência dos sinais das camadas E1 (SP = 99,24 % / PF = 2,50 %), E2 (SP = 99,56 % / PF = 1,03 %) e H0 (SP = 99,58 % / PF = 1,02 %). Com base nos resultados conclui-se que os sinais das camadas E1, E2 e H0 são os mais significativos para a classificação de eventos pelo Neural Ringer. Tabela 5.4: Resultados encontrados para o estudo de relevância de discriminação das camadas do calorímetro, para o Neural Ringer. N o Anéis CAMADA RET. MÁX. SP (%) PD(%) PF (%) P F P D=99,75(%) 92 PS 99,65 ± 0,18 99,69 0,33 0,46 36 E1 99,24 ± 0,24 99,19 0,60 2,50 92 E2 99,56 ± 0,21 99,52 0,35 1,03 92 E3 99,67 ± 0,15 99,63 0,28 0,64 96 H0 99,58 ± 0,29 99,58 0,32 1,02 96 H1 99,68 ± 0,18 99,66 0,24 0,62 96 H2 99,67 ± 0,10 99,68 0,30 0, ,65 ±0,04 99,75 0,38 0,38 No segundo procedimento para avaliação da relevância das camadas do calorímetro, foi realizado uma análise da eficiência de discriminação para cada uma das sete camadas individualmente. Os sinais em anéis gerados em cada camada foram utilizados separadamente como entrada, para o processo de treinamento e teste de um classificador neural. No total, sete classificadores neurais foram projetados (um para cada camada), com uma estrutura de duas camadas, 10 neurônios na camada oculta e 01 único neurônio na camada de saída. O máximo SP foi avaliado, permitindo verificar a importância individual de cada camada no processo geral de classificação. 57

82 A Tabela 5.5 apresenta os valores do índice SP (%), PD (%) e PF(%) obtidos a partir do processo de treinamento de redes neurais com os sinais separados por camada do calorímetro. Observa-se que os sinais extraídos das camadas E1, E2 e H0 produzem maiores valores para o índice SP, indicando maior capacidade de discriminação para a separação elétron/jato. Esse resultado está condizente com o encontrado na análise anterior. Tabela 5.5: Resultados encontrados para o estudo de relevância de discriminação das camadas do calorímetro. N o Anéis CAMADA MÁX. SP (%) PD(%) PF (%) 08 PS 81,41 ± 0,70 73,12 9,63 64 E1 97,78 ± 0,75 97,86 2,11 08 E2 95,61 ± 0,28 95,59 4,28 08 E3 84,64 ± 0,24 86,76 16,67 04 H0 93,63 ± 0,30 96,89 9,50 04 H1 84,48 ± 0,15 90,55 20,99 04 H2 66,68 ± 0,10 69,10 35, TODAS 99,65 ±0,04 99,75 0,38 Considerando os resultados obtidos na análise de relevância das camadas do calorímetro, foram desenvolvidos dois classificadores neurais, com e sem a etapa de pré-processamento por PCA/ICA. Para esta análise os sinais de entrada utilizados, foram os extraídos das camadas mais relevantes (E1, E2 e H0), concatenados em um único vetor para cada classificador. Para o classificador projetado com pré-processamento por PCA/ICA, foi realizado a avaliação do número de componentes principais, que maximiza o índice SP. Os resultados desta avaliação são apresentados nas Figuras 5.6 (a) e 5.6 (b), que mostram a curva de carga com a energia retida em função do número de componentes principais e a variação do índice SP,também em função do número de componentes principais retidos. Conclui-se que utilizando 31 componentes principais (99% da energia retida do conjunto), alcança-se o máximo índice SP. A Tabela 5.6 apresenta os valores de Máx SP, PD(%) e PF(%) dos classificadores projetados com as camadas mais relevantes do calorímetro. Na Figura 5.7 são mostradas as curvas ROC dos classificadores projetados somente com as camadas mais relevantes, em comparação com o Neural Ringer e com 58

83 Energia Retida (%) Número de Componentes Principais (a) Máximo SP (%) Número de Componentes Principais (b) Figura 5.6: Curva de carga da PCA (a) e variação do máximo SP (b) em função dos componentes principais retidos, dos sinais das camadas mais relevantes para classificação. Tabela 5.6: Resultados encontrados para os classificadores utilizando apenas as camadas mais relevantes para discriminação. DISCRIMINADOR MÁX. SP (%) PD(%) PF (%) P F P D=99,75(%) N Var. Neural Ringer 99,65 ±0, ,38 0, Ring. E1,E2,H0 99,57 ±0,24 99,57 0,34 1,36 76 Ring.+PCA/ICA E1,E2,H0 99,57 ± 0,02 99,48 0,29 1,02 31 Ring.+DWT/ICA E1,E2,H0 99,17 ± 0,04 99,03 0,68 3,85 38 o classificador com pré-processamento por PCA/ICA. Os resultados encontrados mostram que a eficiência de detecção dos classificadores que utilizam apenas as camadas E1,E2 e H0, não superam os demais discriminadores, entretanto os resultados ainda são atrativos, pois a eficiência do classificador permanece próxima ao Neural Ringer, utilizando apenas poucas variáveis para o processo de discriminação. Em comparação ao total de 100 anéis, o uso do pré-processamento por PCA/ICA nos sinais das camadas mais relevantes proporciona um nível de compactação de 69%. 59

84 Probabilidade de Detecção (%) E1,E2,H0 - N. Ringer E1,E2,H0 - Ringer + PCA/ICA Neural Ringer Ringer + PCA/ICA E1,E2,H0 - Ringer + DWT/ICA Probabilidade de Falso Alarme (%) Figura 5.7: Curvas ROC dos discriminadores projetados com as camadas mais relevantes, em comparação ao Neural Ringer e ao Neural Ringer com pré-processamento por PCA/ICA. Processamento Segmentado Com o objetivo de melhor explorar a segmentação da informação disponível nos calorímetros, nesta análise são apresentados os resultados obtidos com a arquitetura de classificação segmentada, conforme mencionado no Capítulo 04. A estrutura do processamento segmentado consiste na utilização de redes neurais treinadas especificamente com os sinais de cada camada do calorímetro. As saídas de cada RNA são utilizadas como entrada para uma outra RNA (rede combinadora), configurando um segundo estágio de processamento. Nas 07 RNAs projetadas para cada camada do calorímetro foram utilizados dez neurônios na camada oculta e na rede combinadora, foram realizados testes para verificar a variação do índice SP por número de neurônios ocultos utilizados. A configuração que obteve o melhor resultado em termos de índice SP foi a rede com uso de 10 neurônios na camada oculta. A Figura 5.8 mostra o comportamento do índice SP, em função do número de neurônios na camada oculta da rede combinadora. Para a determinação desta estrutura, as redes foram treinadas sem uso de pré-processamento. A Tabela 5.7 apresenta os resultados encontrados para o discriminador com estrutura segmentada, em comparação ao Neural Ringer. Os resultados apresentam 60

85 Máximo SP (%) Número de Neurônios Ocultos Figura 5.8: Curva de variação do índice SP (%) em função do número de neurônios na camada oculta da rede neural combinadora. melhorias nos índices de eficiência ao utilizar a estrutura de rede segmentada para a classificação dos sinais em anéis.a estratégia segmentada apresenta um aumento de 0,07 ponto percentual no índice SP em relação ao Neural Ringer. Verifica-se também uma redução de 0,04 ponto percentual na taxa de falso alarme em relação aos resultados do Neural Ringer. Tabela 5.7: Resultados encontrados para o classificador segmentado por camada sem etapa de pré-processamento. DISCRIMINADOR MÁX. SP (%) PD(%) PF (%) P F P D=99,75(%) Neural Ringer 99,65 ±0, ,38 0,38 Ringer SEG. 99,72 ±0,02 99,69 0,21 0,34 Adicionando a cadeia de pré-processamento por PCA/ICA na estrutura de rede segmentada, cada classificador foi treinado variando-se o número de componentes apresentados na entrada. Este processo foi realizado com o objetivo de encontrar o melhor nível de compactação dos sinais em anéis, extraídos em cada camada. A Tabela 5.8, apresenta os valores encontrados dos níveis de compactação por camada, que possuem os melhores resultados para o índice SP. Considerando a quantidade de componentes principais selecionados em todas as 61

86 camadas, a compactação por PCA apresenta uma redução total de 53% no conjunto de dados, em relação aos 100 anéis utilizados pelo Neural Ringer. Especificamente na camada E1, o pré-processamento por PCA/ICA provocou a compactação de aproximadamente 71%, em relação aos 64 anéis que compõem esta camada do calorímetro. Tabela 5.8: Resultados encontrados da aplicação do pré-processamento por PCA/ICA nos sinais de cada camada do calorímetro separadamente. ANÉIS COMP. PCA CAMADA MÁX. SP (%) PD(%) PF (%) PS 81,35 ± 0,08 73,62 10, E1 97,69 ± 0,04 98,07 2, E2 95,64 ± 0,02 95,99 4, E3 85,31 ± 0,09 88,47 17, H0 94,43 ± 0,03 96,55 7, H1 85,30 ± 0,14 91,18 20, H2 64,60 ± 0,08 69,17 39,57 A Tabela 5.9 apresenta os resultados encontrados para o classificador segmentado com pré-processamento por PCA/ICA (Ringer SEG. + PCA/ICA), nos sinais de cada camada do calorímetro. Os resultados mostram um amento no índice SP do classificador segmentado com etapa de pré-processamento em relação ao Neural Ringer, e também ao classificador com estratégia segmentada, sem pré-processamento. Em relação ao Neural Ringer, o índice SP do classificador Ringer SEG. + PCA/ICA, incrementou um aumento de 0,9 %, reduzindo também o falso alarme em 0,17%. Estes resultados confirmam a melhoria de classificação, baseada em segmentação da informação do sistema de calorimetria do ATLAS. A Figura 5.9 apresenta a curva ROC dos classificadores segmentados, projetados com e sem a etapa de pré-processamento por PCA/ICA, em comparação com o Neural Ringer. Observa-se que o classificador Ringer SEG. + PCA/ICA apresenta valores de probabilidade de detecção maiores em relação aos demais classificadores, em regiões de falso alarme menor, indicando maior eficiência de detecção com a minimização do falso alarme. Em resumo a proposta de uso de redes neurais com estrutura segmentada, utilizando pré-processamento estatístico apresenta melhorias consideráveis na eficiência 62

87 Tabela 5.9: Resultados encontrados para o classificador segmentado com etapa de pré-processamento. DISCRIMINADOR MÁX. SP (%) PD(%) PF (%) P F P D=99,75(%) N Var. N. Ringer 99,65 ±0, ,38 0, Ring. SEG. 99,72 ±0,02 99,69 0,21 0, Ring. SEG.+PCA/ICA 99,74 ±0,02 99,74 0,19 0,21 47 Ring. SEG.+DWT/ICA 99,68 ±0,02 99,64 0,22 0,58 50 Ring. SEG. E1,E2,H0 99,59 ±0,09 99,60 0,38 0,34 76 Ring. SEG. E1,E2,H0 +PCA/ICA 99,62 ±0,02 99,65 0,34 0,21 27 de detecção e redução do falso alarme. Os resultados mostraram que o uso dessa estratégia melhora os índices de desempenho do classificador em 0,9% em relação ao Neural Ringer e possibilita uma taxa de compactação de aproximadamente 53% do conjunto de dados utilizados Probabiliade dedetecção (%) Ringer Seg. Ringer Seg. + PCA/ICA E1,E2,H0 - Ringer + PCA/ICA E1,E2,H0 - Neural Ringer Seg. Neural Ringer Ringer Seg. + DWT/ICA Probabiliade de Falso Alarme (%) Figura 5.9: Curvas ROC dos classificadores projetados com estrutura segmentada, em comparação com o Neural Ringer. 63

88 Análise Comparativa - Conjunto e10 A seguir são apresentadas de modo resumido os melhores resultados de eficiência dos classificadores projetados, em comparação com o Neural Ringer sem pré-processamento. A Tabela 5.10 apresenta os índices SP (%) para os discriminadores que se destacaram, utilizando a base dados e10. Tabela 5.10: Resultados encontrados para o classificador segmentado com etapa de pré-processamento em comparação ao Neural Ringer. DISCRIMINADOR MÁX. SP (%) PD(%) PF (%) P F P D=99,75(%) N Var. N. Ringer 99,65±0,04 99,75 0,38 0, Ring.+PCA/ICA 99,77 ±0,02 99,78 0,18 0,17 40 Ring. + DWT (Sym3) /ICA 99,72±0,02 99,75 0,26 0,26 50 Ring. (E1/E2/H0) 99,57±0,24 99,57 0,34 1,36 76 Ring.+PCA/ICA (E1/E2/H0) 99,57±0,02 99,48 0,29 1,02 31 Ring.+DWT/ICA (E1/E2/H0) 99,17±0,04 99,03 0,68 3,85 38 Ring. SEG. 99,72±0,02 99,69 0,21 0, Ring. SEG.+PCA/ICA 99,74±0,02 99,74 0,19 0,21 47 Ring. SEG.+DWT/ICA 99,68±0,02 99,64 0,22 0,58 50 Ring. SEG. E1,E2,H0 99,59 ±0,09 99,60 0,38 0,34 76 Ring. SEG. E1,E2,H0 +PCA/ICA 99,62 ±0,02 99,65 0,34 0,21 27 Verifica-se que o uso do pré-processamento por PCA/ICA atingiu o melhor resultado em eficiência dentre os classificadores listados. Este método proporciona uma redução de 60(%) no conjunto de dados e10, onde o índice SP foi elevado em 0,12 ponto percentual em relação ao classificador Neural Ringer. Considerando o classificador Ringer + PCA/ICA serão apresentadas nas próximas seções as análises comparativas ao Neural Ringer, em relação a qualidade de classificação de eventos e as eficiências em função de parâmetros físicos do detector. Análises Considerando Parâmetros Físicos Na Figura 5.10 (a) é apresentada a eficiência de detecção encontrada para os classificadores Ringer+ PCA/ICA e Neural Ringer, em função da energia transversa dos si- 64

89 nais medidos no calorímetro. Verifica-se que o discriminador com pré-processamento apresenta melhor eficiência de detecção em faixas de energia menores (0 a 20 GeV), em relação ao Neural Ringer. Para as demais faixas de energia os classificadores tem aproximadamente a mesma eficiência. Na Figura 5.10 (b) é verificado que o uso da cadeia de pré-processamento oferece redução na taxa da probabilidade de falso alarme (%), na faixa de energia de 10 GeV a 30 GeV, ocasionando a diminuição de armazenamento de eventos não interessantes para o experimento. Nas figuras 5.11 (a) e 5.11 (b) são realizadas as comparações da eficiência de detecção (a) e do falso alarme (b) dos classificadores Ringer + PCA/ICA e Neural Ringer, em função de η. Nesta análise, também é possível observar que o uso da etapa de pré-processamento por PCA/ICA contribui para melhorias na eficiência de detecção de elétrons e na redução do falso alarme. A redução da taxa de falso alarme é verificada nos intervalos de η em [-1,5, -1] e [1, 1,5] nos quais a detecção correta de eventos é prejudicada (redução no falso alarme de 1.3 % para η negativo e 1,0 % para η positivo). Nesta região do calorímetro a resolução dos sensores é diminuída (região do crack ), devido ao local ser designado para passagem dos cabos e fibras de comunicação ótica do calorímetro. Elétrons não Detectados A classificação correta de elétrons é um parâmetro importante no experimento, pois caso um elétron que seja produto de uma propriedade física ainda não conhecida não seja detectado, as análises físicas podem ficar incompletas ou incoerentes. Em relação a erros de classificação de elétrons, o discriminador Neural Ringer sem préprocessamento deixou de classificar corretamente um total de 31 elétrons, considerando o conjunto de teste utilizado ( amostras) para esta análise, equivalendo a 99,79% de acerto. As Figuras 5.12 (a) e 5.12 (b) apresentam a distribuição de elétrons não detectados em função da energia, para o classificadores Neural Ringer +PCA/ICA e Neural Ringer sem etapa de pré-processamento. Em ambos os classificadores, a maioria dos elétrons não detectados concentram-se na faixa de energia abaixo de 20 GeV, faixa em que a incidência de jatos hadrônicos é maior, provocando aumento no erro de classificação. Nesta análise verifica-se que para o Neural Ringer 65

90 Probabilidade de Detecção (%) Ringer + PCA/ICA Neural Ringer Probabilidade de Falso Alarme (%) Ringer + PCA/ICA Neural Ringer Et [GeV] (a) Et [GeV] (b) Figura 5.10: Comparação da eficiência de detecção (a) e falso alarme (b) em função da energia transversa - Et do classificador Ringer + PCA/ICA e Neural Ringer sem pré-processamento. Probabiliade de Detecção (%) η (a) 2.5 Probabilidade de Falso Alarme (%) Ringer +PCA/ICA Neural Ringer Ringer+PCA/ICA Neural Ringer η (b) Figura 5.11: Comparação da eficiência de detecção (a) e falso alarme (b) em função de η do classificador Ringer + PCA/ICA e Neural Ringer sem pré-processamento. 66

91 Contagem Contagem Ringer + PCA/ICA: Elétrons não detectados Energia [GeV] (a) x Ringer + PCA/ICA: Elétrons não Detectados η (c) Contagem Contagem Neural Ringer: Elétrons não detectados Energia [GeV] (b) x Neural Ringer: Elétrons não detectados η (d) Figura 5.12: Distribuição em Et (a e b) para os elétrons não detectados pelos classificadores Ringer + PCA/ICA (a) e pelo Neural Ringer (b). sem pré-processamento, no total 04 elétrons com Et acima de 30 GeV não foram detectados. Considerando o mesmo conjunto utilizado no teste do classificador Neural Ringer sem pré-processamento, o classificador Ringer + PCA/ICA não detectou um total de 28 elétrons, alcançando a taxa de 99,81 % de acerto. No conjunto de elétrons não detectados, apenas 02 possuem Et acima de 30 GeV, como mostra a Figura 5.12 (b). Semelhante ao Neural Ringer, a maioria dos eventos perdidos concentram-se abaixo em faixas de energia inferiores (0 a 20 GeV). Uma característica do classificador Ringer + PCA/ICA é que não houveram elétrons perdidos com energia acima de 45 GeV, que caracteriza-se como ponto positivo para o discriminador com préprocessamento, levando em consideração a ocorrência de novas propriedades físicas em faixas de energia mais elevadas. Em termos de acertos para classificação de elétrons, o classificador com pré-processamento atinge 99,81 % utilizando apenas 40% do conjunto de teste, contra 99,79 % de acerto de elétrons do Neural Ringer, que utiliza os 100 anéis para a classificação. Nas Figuras 5.12 (c) e 5.12 (d) são apresentadas as distribuições de elétrons 67

92 Contagem Contagem Et [GeV] (a) Ringer + PCA/ICA: Jatos classificados incorretamente Ringer + PCA/ICA: Jatos classificados incorretamente η (c) Contagem Contagem Et [GeV] (b) Neural Ringer: Jatos classificados incorretamente Neural Ringer: Jatos classificados incorretamente η (d) Figura 5.13: Distribuições em Et (a e b) e η (c e d) para jatos classificados incorretamente pelos discriminadores Ringer + PCA/ICA e pelo Neural Ringer. não detectados em função da sua posição de interação no calorímetro (η), para o discriminador Neural Ringer com e sem pré-processamento. Jatos Classificados Incorretamente A classificação correta de jatos também é um parâmetro muito importante, pois determina a confiança no classificador nos termos de separação correta entre partículas de naturezas diferentes (eletromagnéticas e hadrônicas). A classificação errônea de um sinal hadrônico como eletromagnético pode levar a equívocos, nos termos da análise das propriedades físicas da partícula. O classificador Neural Ringer, sem etapa de pré-processamento atingiu a taxa de acertos de jatos em 99,32 %, em um conjunto de testes com eventos. Desse conjunto, 274 jatos foram classificados incorretamente como elétrons. As Figuras 5.13(a) e 5.13 (b) mostram a distribuição dos jatos classificados erroneamente, em relação a energia transversa para os classificadores Ringer + PCA/ICA e Neural Ringer respectivamente. É verificado que o uso da cadeia de pré-processamento reduz o quantitativo de erros de classificação de jatos, onde foi alcançado 99,55% de acertos para a mesma base de dados utilizados no teste do 68

93 Neural Ringer. O Ringer + PCA/ICA classificou incorretamente 181 jatos, 93 erros a menos em relação ao classificador Neural Ringer sem pré-processamento. Nas Figuras 5.13 (c) e 5.13 (d) são apresentadas as distribuições dos jatos classificados incorretamente em função da sua posição de interação no calorímetro (η), para os classificadores Ringer + PCA/ICA e Neural Ringer respectivamente. Nesta análise é possível verificar que o uso do pré-processamento por PCA/ICA diminui os erros de classificação de jatos, praticamente em todas as regiões de η, com melhoras significativas na janela de η[ 1, 5 a 1, 5]. A principal vantagem, além do aumento da eficiência de classificação, é que utilizando-se a cadeia de pré-processamento somente 40 % da base de dados se faz necessário realizar o armazenamento (compactação), para análises mais criteriosas no sistema offline Análises do Conjunto e22 Na análise do conjunto e22, foi mantida a estrutura rede neural projetada para os dados do conjunto e10 (o conjunto de sinais e22 é um subconjunto da base de dados e10). Com a configuração de 18 neurônios na camada oculta e um neurônio na saída, foi avaliada a eficiência de discriminação com a aplicação das técnicas de pré-processamento. Pré-processamento por PCA/ICA A Figura 5.14 apresenta a curva de variação do índice SP, em função do número de componentes principais retidos do conjunto e22. O melhor desempenho foi alcançado com a retenção de 35 componentes, resultando em um percentual de 65% de compactação dos sinais a serem processados pela rede neural. A Tabela 5.11 apresenta os resultados encontrados em comparação ao Neural Ringer. O uso da PCA/ICA reduz a PF(%) em 0,03 ponto percentual para a mesma taxa de detecção (99,75%) dos classificadores. O aumento da eficiência do classificador com a aplicação da PCA/ICA nos sinais em anéis é mostrado na Figura 5.15, que apresenta as curvas ROC dos discriminadores Neural Ringer e Ringer + PCA/ICA. Confirma-se a melhoria de eficiência para menores valores de PF, após o pré-processamento dos sinais em relação ao classificador Neural Ringer. 69

94 Energia Retida (%) Máximo SP (%) Número de Componentes Principais (a) Número de Componentes Principais (b) Figura 5.14: Curva de carga da energia armazenada em função do número de componentes principais (a) e curva de variação do índice SP em função do número de componentes principais retidos - conjunto e22. Tabela 5.11: Comparação dos resultados encontrados para o conjunto de dados e22. Discriminadores Max SP(%) PD(%) PF(%) P F P D=99,42(%) N Var. Neural Ringer 99,09 ±0,06 99,42 0,97 0, Ringer + PCA/ICA 99,26 ±0,11 99,54 0,64 0,57 35 Pré-processamento por DWT Na Tabela 5.12 são apresentados os resultados encontrados com a aplicação da DWT no pré-processamento dos sinais em anéis do conjunto e22. Os resultados das análises mostram que o uso das funções wavelets db2, Sym3 e Coif1, proporcionam os melhores resultados em relação ao índice SP, dentre as demais funções de suas famílias. O classificador Ringer + DWT (sym3), apresentou o melhor desempenho, superando o Neural Ringer em 0,14 ponto percentual em relação ao índice SP. Foram também realizados testes, aplicando a ICA nos sinais pré-processados pela DWT, contudo os resultados em termos de eficiência não melhoraram. A Figura 5.16, apresenta as curvas ROC do classificadores Ringer + DWT (Sym3), Ringer + DWT/ICA (Sym3) e Neural Ringer. A curva ROC do classificador com pré- 70

95 Probabilidade de Detecção (%) Ringer + PCA/ICA Neural Ringer Probabilidade de Falso Alarme (%) Figura 5.15: Curva ROC dos discriminadores Neural Ringer e Ringer + PCA/ICA - conjunto e22. processamento por DWT apresenta maior área, o que caracteriza o aumento da eficiência destes discriminadores, em relação ao Neural Ringer Probabilidade de Detecção (%) Neural Ringer Ringer + DWT(Sym3) Ringer + DWT (Sym3)/ICA Probabilidade de Falso Alarme (%) Figura 5.16: Curvas ROC dos discriminadores Ringer + DWT (Sym3), Ringer + DWT/ICA (Sym3) e Neural Ringer. A Tabela 5.13 apresenta o resumo dos resultados encontrados com a aplicação 71

96 Tabela 5.12: Resultados obtidos com o uso das diferentes funções wavelets utilizadas - conjunto e22. Discriminadores Max SP(%) PD(%) PF(%) N Var. Neural Ringer 99,09 ±0,06 99,42 0, Ringer+dB1 99,11 ±0,11 99,46 1,00 50 Ringer+dB2 99,20 ±0,07 99,21 0,57 50 Ringer+dB5 99,15 ±0,08 99,19 0,60 50 Ringer+Sym2 99,19± ,32 0,66 50 Ringer+Sym3 99,23±0,08 99,28 0,54 50 Ringer+Sym4 99,19±0,06 99,33 0,74 50 Ringer+Coif1 99,17 ±0,09 99,52 0,87 50 Ringer+Coif2 99,21 ±0,06 99,38 0,74 50 Ringer+Coif3 99,11 ±0,11 99,40 0,80 50 da DWT no pré-processamento dos sinais em anéis. A aplicação da DWT como pré-processamento dos sinais provocou um aumento da eficiência do discriminador em relação ao Neural Ringer, reduzindo a taxa de PF, no qual reduz também a dimensão dos sinais do conjunto de dados em 50% (compactação). Tabela 5.13: Resultados encontrados com a adição de pré-processamento por DWT. Discriminadores Max SP(%) PD(%) PF(%) N Var. Neural Ringer 99,09 ±0,06 99,42 0, Ringer + DWT (Sym3) 99,23 ±0,08 99,28 0,54 50 Ringer + DWT (Sym3) /ICA 98,66 ±0,20 98,66 0,97 50 Compactação por Relevância das Camadas do Calorímetro Nesta análise foram realizadas avaliações para mensurar a relevância de discriminação dos sinais em anéis de cada camada do sistema de calorimetria, do conjunto e22. A Tabela 5.14 mostra que a remoção dos sinais das camadas PS, H1 e H2 provoca um aumento no índice SP, em relação ao Neural Ringer. Todavia, no caso da retirada dos sinais da camada H1, para PD (99,42 %) o Neural Ringer apresenta um valor de PF 0,02 ponto percentual menor. Outro resultado observado é que para os casos em que os sinais das camadas E1, 72

97 Tabela 5.14: Resultados encontrados no estudo de relevância de discriminação das camadas do calorímetro, conjunto e22. N o Anéis CAMADA RET. MÁX. SP (%) PD(%) PF (%) P F P D=99,42(%) 92 PS 99,04 ± 0,15 99,53 1,04 0,97 36 E1 98,42 ± 0,14 98,88 1,71 2,77 92 E2 98,81 ± 0,17 99,41 1,20 1,21 92 E3 98,98 ± 0,11 99,35 1,04 1,24 96 H0 98,68 ± 0,12 99,03 1,37 2,11 96 H1 99,11 ± 0,09 99,62 1,14 0,99 96 H2 99,13 ± 0,20 99,60 0,97 0, ,09 ±0,06 99,42 0,97 0,97 E2 e E3 estiveram presentes em conjunto, o índice máximo SP se manteve próximo ou superior ao encontrado pelo Neural Ringer, mostrando que as informações dessas camadas possuem contribuição significativa para a classificação. É possível observar que de modo contrário, quando os sinais em anéis das camadas E1, E2 e H0 são retirados, o índice SP diminui, caracterizando a relevância destes sinais no processo de discriminação. A Tabela 5.15 apresenta os resultados encontrados para a análise de relevância de discriminação de cada camada separadamente, do conjunto e22. Foi realizado o treinamento e teste de um classificador, alimentado apenas com os sinais de cada camada individualmente. Nesta análise, também é possível verificar que os melhores índices SP foram encontrados utilizando as camadas E1, E2 e H0, confirmando uma maior relevância destes sinais para o processo de classificação. Treinando um classificador somente os sinais das camadas E1, E2 e H0 concatenados (ver Tabela 5.16 ) observou-se que não houve redução considerável de eficiência. O classificador Ringer + P CA/ICA E1/E2/H0 obteve índice SP próximo ao alcançado pelo Neural Ringer (0,06 ponto percentual abaixo), com ligeiro aumento na PF (0,3 ponto percentual). A Figura 5.17 apresenta a curva de carga (a) e a curva de variação do máximo SP em função do número de componentes principais retidos do conjunto de sinais formados pelas camadas E1, E2 e H0. Verifica-se que o melhor desempenho é alcançado com a utilização de 36 componentes principais, compreendendo uma compactação de 66 % em relação ao conjunto dos 100 anéis originais. A Figura 5.18 apresenta as curvas ROC dos classificadores 73

98 Tabela 5.15: Resultados encontrados para o estudo de relevância de discriminação das camadas do calorímetro, utilizando o classificador Neural Ringer. N o Anéis CAMADA MÁX. SP (%) PD(%) PF (%) 08 PS 82,86 ± 0,27 92,75 25,56 64 E1 96,19 ± 0,21 97,17 4,05 08 E2 96,27 ± 0,15 97,26 4,06 08 E3 83,84 ± 0,18 89,49 21,08 04 H0 89,94 ± 0,20 94,96 14,38 04 H1 77,29 ± 0,27 87,12 31,10 04 H2 62,62 ± 0,36 77,71 50, TODAS 99,09 ±0,06 99,42 0,97 desenvolvidos com os sinais das camadas mais relevantes, em comparação com o Neural Ringer. Energia Retida (%) Número de Componentes Principais (a) Máximo SP (%) Número de Componentes Principais (b) Figura 5.17: Curva de carga da PCA para as camadas mais relevantes do conjunto e22 (a) e variação do máximo SP(%) em função do número de componentes principais (b). 74

99 Tabela 5.16: Resultados encontrados para os classificadores utilizando apenas as camadas mais relevantes para discriminação. DISCRIMINADOR MÁX. SP (%) PD(%) PF (%) P F P D=99,42(%) Neural Ringer 99,09 ±0,06 99,42 0,97 0,97 Neural Ringer E1,E2,H0 98,86 ±0,08 99,13 1,71 1,66 Ringer+PCA/ICA E1,E2,H0 99,03 ± 0,09 99,26 0,97 1,27 Ringer+DWT E1,E2,H0 98,00 ± 0,13 98,23 1,74 4, Probabilidade de Detecção (%) E1/E2/H0 - Ringer + DWT E1/E2/H0 - Neural Ringer E1/E2/H0 - Ringer + PCA/ICA Neural Ringer Ringer + PCA/ICA Probabilidade de Falso Alarme (%) Figura 5.18: Curvas ROC dos classificadores projetados com os sinais das camadas mais relevantes em comparação ao Neural Ringer e Ringer + PCA/ICA - conjunto e22. Processamento Segmentado Na análise segmentada para o conjunto e22 foi utilizada a mesma estrutura das redes neurais, aplicadas ao conjunto e10. As redes neurais projetadas para cada camada possuem 10 neurônios na camada o oculta e um neurônio na saída. As saídas da camada oculta de cada rede especialista alimentam um classificador, que também possui 10 neurônios na camada oculta (rede combinadora), e um único neurônio na saída. Na Tabela 5.17 são apresentados os resultados obtidos com o processo de clas- 75

100 sificação baseado na informação individual de cada camada, com etapa de préprocessamento por PCA/ICA, para o conjunto e22. O objetivo desta análise foi verificar a melhor quantidade de variáveis em cada camada para serem consideradas na análise segmentada. Novamente, é percebido que as camadas E1, E2 e H0 possuem índices SP melhores em relação às demais camadas. Utilizando o préprocessamento por PCA/ICA a quantidade de variáveis necessárias é reduzida em 50% em relação ao Neural Ringer. Tabela 5.17: Resultados encontrados da aplicação do pré-processamento por PCA/ICA nos sinais de cada camada do calorímetro separadamente. ANÉIS COMP. PCA CAMADA MÁX. SP (%) PD(%) PF (%) PS 82,92 ± 0,30 91,16 24, E1 96,84 ± 0,09 97,37 3, E2 96,33 ± 0,20 97,20 3, E3 83,85 ± 0,25 87,60 18, H0 89,92 ± 0,25 94,16 13, H1 77,24 ± 0,34 83,44 27, H2 62,61 ± 0,41 73,50 46,10 Na Tabela 5.18 e na Figura 5.19 é apresentado um resumo dos resultados obtidos no processamento segmentado para o conjunto e22. Pode se observar que o classificador Ringer SEG. + PCA/ICA obteve o melhor desempenho, reduzindo a PF em 0,32 ponto percentual em relação ao Neural Ringer, para PD = 99,42%. Tabela 5.18: Resultados encontrados para o classificador segmentado com etapa de pré-processamento em comparação ao Neural Ringer. DISCRIMINADOR MÁX. SP (%) PD(%) PF (%) P F P D=99,42(%) N Var. Neural Ringer 99,09 ±0,06 99,42 0,97 0, Ringer SEG. 99,20 ±0,08 99,59 0,97 0, Ringer SEG. + PCA/ICA 99,25 ±0,08 99,47 0,70 0,65 50 Ringer SEG.+ DWT (Sym3) 99,01 ±0,04 99,38 0,99 1,03 50 Ringer SEG. E1,E2,H0 99,09 ±0,1 99,37 0,87 0,34 76 Ringer SEG. E1,E2,H0 + PCA/ICA 99,06 ±0,05 99,39 1,03 0,

101 Probabilidade de Detecção (%) Ringer SEG. + PCA/ICA Ringer SEG. Ringer SEG (E1/E2/H0) Ringer SEG + PCA/ICA (E1/E2/H0) Neural Ringer Ringer SEG. + DWT Probabilidade de Falso Alarme (%) Figura 5.19: Curvas ROC dos discriminadores projetados com processamento segmentado. Análise Comparativa - Conjunto e22 São apresentados a seguir os melhores resultados de eficiência dos classificadores projetados, em comparação com o Neural Ringer sem pré-processamento. A Tabela 5.19 apresenta os índices SP (%) para os discriminadores projetados. Dentre os classificadores que mais se destacaram, o discriminador Ringer + PCA/ICA obteve o melhor desempenho, superando em eficiência o Neural Ringer. Este método proporciona uma redução de 65(%) no número de variáveis necessárias para a decisão, elevando o índice SP em 0,55 ponto percentual em relação ao classificador Neural Ringer. A seguir serão demonstradas as análises comparativas do discriminador Ringer + PCA/ICA em relação ao Neural Ringer, considerando a eficiência de classificação em função de parâmetros físicos do detector. Análises Considerando Parâmetros Físicos Na Figura 5.20 (a) é apresentada a eficiência de detecção encontrada para os classificadores Ringer+ PCA/ICA e Neural Ringer, em função da energia transversa para o conjunto e22. O discriminador com pré-processamento apresenta melhor eficiência 77

102 Tabela 5.19: Resultados encontrados para o classificador segmentado com etapa de pré-processamento em comparação ao Neural Ringer. DISCRIMINADOR MÁX. SP (%) PD(%) PF (%) P F P D=99,42(%) Neural Ringer 99,09 ±0,06 99,42 0,97 0,97 Ringer + PCA/ICA 99,26 ±0,11 99,54 0,64 0,57 Ringer + DWT (Sym3) 99,23 ±0,08 99,28 0,54 0,62 Neural Ringer E1,E2,H0 98,86 ±0,08 99,13 1,71 1,97 Ringer+PCA/ICA E1,E2,H0 99,03 ±0,09 99,26 0,97 1,27 Ringer+DWT (Sym3)E1,E2,H0 98,00 ±0,13 98,23 1,74 4,08 Ringer SEG. 99,20 ±0,08 99,59 0,97 0,91 Ringer SEG. + PCA/ICA 99,25 ±0,08 99,47 0,70 0,65 Ringer SEG.+ DWT (Sym3) 99,01 ±0,04 99,38 0,99 1,03 Ringer SEG. E1,E2,H0 99,09 ±0,1 99,37 0,87 0,34 Ringer SEG. E1,E2,H0 + PCA/ICA 99,06 ±0,05 99,39 1,03 0,34 Ringer SEG. E1/E2/H0 + DWT (Sym3) 98,47 ±0,18 98,55 1,34 1,91 de detecção em faixas de energia menores (20 a 50 GeV), em relação ao Neural Ringer. Para as demais faixas de energia os classificadores tem eficiência semelhante. Na Figura 5.20 (b) é verificado que o uso da cadeia de pré-processamento oferece redução na taxa da PF(%), na faixa de energia de 20 GeV a 40 GeV. As Figuras 5.21 (a) e 5.21 (b) mostram as comparações da PD (a) e da PF (b) dos classificadores Ringer + PCA/ICA e Neural Ringer, em função de η. A redução da taxa de PF é verificada nos intervalos de η em [-1,5, -1] e [0, 1]. Elétrons não Detectados As Figuras 5.22 (a) e 5.22 (b) apresentam a distribuição de elétrons não detectados em função da energia, para o classificadores Neural Ringer +PCA/ICA e Neural Ringer sem etapa de pré-processamento. Em relação a erros de classificação de elétrons, o discriminador Neural Ringer sem pré-processamento deixou de classificar corretamente um total de 47 elétrons, considerando o conjunto de teste utilizado para esta análise ( amostras), equivalendo a 99,64% de acerto. Considerando o mesmo conjunto utilizado no teste do classificador Neural Ringer 78

103 100 4 Probabilidade de Detecção (%) Ringer + PCA/ICA Neural Ringer Probabilidade de Falso Alarme (%) Ringer +PCA/ICA Neural Ringer Et [GeV] (a) Et [GeV] (b) Figura 5.20: Comparação da eficiência de detecção (a) e falso alarme (b) em função da energia transversa - Et do classificador Ringer + PCA/ICA e Neural Ringer sem pré-processamento. sem pré-processamento, o classificador Ringer + PCA/ICA não detectou um total de 33 elétrons, alcançando a taxa de 99,75 % de acerto. Nas Figuras 5.22 (c) e 5.22 (d) são apresentadas as distribuições de elétrons não detectados em função da sua posição de interação no calorímetro (η), para o discriminador Neural Ringer com e sem pré-processamento. Jatos Classificados Incorretamente O classificador Neural Ringer, sem etapa de pré-processamento atingiu a taxa de acertos de jatos em 99,27 %, em um conjunto de testes com 3009 eventos, em que 22 jatos foram classificados incorretamente como elétrons. As Figuras 5.23(a) e 5.23 (b) mostram a distribuição dos jatos classificados erroneamente, em relação a energia transversa para os classificadores Ringer + PCA/ICA e Neural Ringer respectivamente. O uso de pré-processamento por PCA/ICA reduz o quantitativo de erros de classificação de jatos, onde foi alcançado 99,53% de acertos para a mesma base de dados 79

104 Probabilidade de Detecção (%) Probabilidade de Falso Alarme (%) Ringer + PCA/ICA Neural Ringer η (a) Ringer + PCA/ICA Neural Ringer η (b) Figura 5.21: Comparação da eficiência de detecção (a) e falso alarme (b) em função de η do classificador Ringer + PCA/ICA e Neural Ringer sem pré-processamento. Contagem Et [GeV] (a) Ringer + PCA/ICA: Elétrons não detectados Contagem Neural Ringer: Elétrons não detectados Et [GeV] (b) Contagem Ringer + PCA/ICA: Elétrons não detectados η (c) Contagem Neural Ringer: Elétrons não detectados η (d) Figura 5.22: Distribuição em Et (a e b) para os elétrons não detectados pelos classificadores Ringer + PCA/ICA (a) e pelo Neural Ringer (b). 80

105 5 4 Ringer + PCA/ICA: Jatos classificados incorretamente 5 4 Neural Ringer: Jatos classificados incorretamente Contagem 3 2 Contagem Et [GeV] (a) Et [GeV] (b) 5 4 Ringer + PCA/ICA: Jatos classificados incorretamente 5 4 Neural Ringer: Jatos classificados incorretamente Contagem 3 2 Contagem η (c) η (d) Figura 5.23: Distribuições em Et (a e b) e η (c e d) para jatos classificados incorretamente pelos discriminadores Ringer + PCA/ICA e pelo Neural Ringer. utilizados no teste do Neural Ringer. O Ringer + PCA/ICA classificou incorretamente 14 jatos. Nas Figuras 5.23 (c) e 5.23 (d) são apresentadas as distribuições dos jatos classificados incorretamente em função da sua posição de interação no calorímetro (η), para os classificadores Ringer + PCA/ICA e Neural Ringer respectivamente. 5.2 Base de Dados: Monte Carlo 2012 Utilizando a base de dados simulados Monte Carlo 2012 (MC12), foi re-avaliada a estrutura da RNA. Novamente, a escolha do número de neurônios da camada oculta foi realizada considerando o índice SP, a PD e a PF para diferentes configurações do classificador Neural Ringer sem pré-processamento, conforme indicado na Figura 5.1. A estrutura com 18 neurônios na camada oculta obteve os melhores resultados, no que tange a minimização da PF e aumento da PD. Esta estrutura foi utilizada nas demais simulações realizadas com a base de dados MC12. 81

106 Detecção (%) Falso Alarme (%) Número de Neurônios Ocultos Número de Neurônios Ocultos (a) Máximo SP(%) Número de Neurônios Ocultos (b) Figura 5.24: Curvas de variação dos parâmetros PD(%) e PF(%) (a) e Máximo SP (%) em função do número de neurônios da camada oculta. Pré-Processamento por PCA/ICA A Figura 5.25 (a) apresenta a curva de carga da energia armazenada, em função do número de componentes principais retidos nos sinais do conjunto MC12. Na Figura 5.25 (b) é mostrado que a máxima eficiência é encontrada utilizando-se 20 componentes principais (99% da energia do conjunto). A Tabela 5.20 apresenta os valores do índice SP, PD e PF obtidas pelos discriminadores Ringer + PCA/ICA e Neural Ringer. Verifica-se que para uma mesma taxa de PD a taxa de PF do classificador com pré-processamento cresce ligeiramente, em relação ao Neural Ringer. Todavia para valores de PD menores, a redução da PF é significativa, mostrando que o classificador com pré-processamento possui maior eficiência nas faixas de PD próximas 92,37%. Através da análise da curva ROC, mostrada na Figura 5.26 observa-se que a eficiência do Neural Ringer decresce rapidamente, ao passo que a PF diminui. 82

107 Energia Retida (%) Número de Componentes Principais (a) Máximo SP (%) Número de Componentes Principais (b) Figura 5.25: Curva de carga da energia retida por componentes principais (a) e curva de variação do índice SP(%) por componentes principais - conjunto MC12. Tabela 5.20: Comparação dos resultados encontrados com análises sob o conjunto de dados MC12. Discriminadores Max SP(%) PD(%) PF(%) P F P D=97,13(%) N Var. Neural Ringer 84,50 ±1,35 97,13 22,12 22, Ringer + PCA/ICA 88,77 ±1,27 92,37 12,03 23,46 20 Pré-Processamento por DWT Visando verificar qual a melhor função wavelet - mãe a ser considerada no préprocessamento, foram realizados testes para avaliação dos índices de eficiência obtidos por diferentes funções. A Tabela 5.21 apresenta a comparação dos índices SP, PD e PF encontrados para as funções wavelets utilizadas no pré-processamento. Verifica-se que o uso da função wavelet Coif2 apresenta maior índice SP em relação às demais testadas. Em comparação com o Neural Ringer, o uso do pré-processamento com a DWT (Coif2) provocou um aumento de 2,47 pontos percentuais no índice SP. A Figura 5.27 apresenta as curvas ROC dos classificadores projetados com pré- 83

108 100 Probabilidade de Detecção (%) Neural Ringer Ringer + PCA/ICA Probabilidade de Falso Alarme (%) Figura 5.26: Curvas ROC dos classificadores projetado com pré-processamento por ICA/PCA e o Neural Ringer. Tabela 5.21: Resultados obtidos com o uso das diferentes funções wavelets utilizadas. Discriminadores Max SP(%) PD(%) PF(%) Neural Ringer 84,50 ±1,35 97,13 22,12 Ringer+dB1 87,06 ±1,68 92,60 14,29 Ringer+dB2 86,74 ±1,93 93,99 13,89 Ringer+dB5 86,44 ±1,26 94,60 17,51 Ringer+Sym2 86,14±1,34 95,01 16,67 Ringer+Sym3 86,97±0,84 94,39 18,05 Ringer+Sym4 86,38±1,38 95,40 18,06 Ringer+Coif1 85,76 ±1,23 93,73 18,89 Ringer+Coif2 87,18 ±1,70 95,58 15,74 Ringer+Coif3 86,87 ±0,96 95,61 19,35 processamento por PCA/ICA e DWT. Observa-se que o classificador Ringer + PCA/ICA obtêm melhores valores de PD para menores faixas de PF, em relação aos demais discriminadores. Nesta base de dados, o uso do pré-processamento por PCA/ICA provoca uma redução de 80% no número de atributos de entrada para o classificador, melhorando ainda a eficiência de classificação, comparando-se com o Neural Ringer. 84

109 100 Probabilidade de Detecção (%) Neural Ringer Ringer + PCA/ICA Ringer + DWT (Coif2) Probabilidade de Falso Alarme (%) Figura 5.27: Curva ROC dos classificadores projetados com pré-processamento por ICA/PCA e DWT, em comparação ao Neural Ringer. Tabela 5.22: Resultados encontrados com a adição de pré-processamento por DWT - conjunto mc12. Discriminadores Max SP(%) PD(%) PF(%) N Var. Neural Ringer 84,50 ±1,35 97,13 22, Ringer + DWT (Coif2) 87,18 ±1,70 95,58 15,74 50 Ringer + DWT (Coif2) /ICA 84,90 ±1,49 94,85 19,91 50 Compactação por Relevância das Camadas do Calorímetro Novamente, visando avaliar a relevância dos sinais de cada camada do calorímetro e sua contribuição no processo geral de classificação elétron/jato, foram repetidos os procedimentos utilizados com as bases de dados e10 e e22. A estrutura da RNA utilizada neste procedimento foi semelhante a usada no Neural Ringer sem etapa de pré-processamento (02 camadas com 18 neurônios na camada oculta e 01 neurônio na cada de saída). A Tabela 5.23 apresenta os valores dos índices SP, PD e PF para cada avaliação realizada. Em termos de relevância, é possível observar que os piores resultados em relação a diminuição do índice SP e aumento da PF (fixando PD em 97,13 85

110 %) ocorreram quando o processamento foi realizado com ausência dos sinais das camadas E1, E2 e H0. Os resultados mostram que, possivelmente, os sinais destas camadas são os mais significativos para a classificação de eventos pelo Neural Ringer. É possível observar que de modo contrário, quando os sinais em anéis das camadas E1, E2 e H0 são retirados, o índice SP diminui. Tabela 5.23: Resultados encontrados para o estudo de relevância de discriminação das camadas do calorímetro, para o Neural Ringer. N o Anéis CAMADA RET. MÁX. SP (%) PD(%) PF (%) P F P D=97,13(%) 92 PS 83,87 ± 1,12 97,36 25,93 24,89 36 E1 82,52 ± 1,56 95,06 24,35 32,95 92 E2 82,56 ± 1,39 96,04 25,00 30,13 92 E3 84,35 ± 0,77 95,55 23,61 28,74 96 H0 80,07 ± 1,37 93,12 28,11 36,42 96 H1 84,38 ± 1,23 96,61 23,61 24,93 96 H2 83,67 ± 1,33 95,88 23,15 27, ,50 ±1,35 97,13 22,12 22,12 A Tabela 5.24 apresenta os resultados encontrados para a análise de relevância de discriminação de cada camada separadamente. Nesta abordagem, verifica-se também que os melhores índices SP foram encontrados no processamento das camadas E1, E2 e H0, confirmando uma maior capacidade de discriminação destes sinais do conjunto MC12, para o processo geral de classificação. A Tabela 5.25 apresenta os resultados obtidos com o processo de classificação que utiliza somente os sinais das camadas mais relevantes comparando com o Neural Ringer. Não houveram reduções consideráveis de eficiência do classificador ao se considerar apenas os sinais das camadas E1, E2 e H0. O classificador Ringer + P CA/ICA E1/E2/H0 obteve índice SP próximo ao alcançado pelo Neural Ringer. A Figura 5.28 apresenta a curva de carga (a) e a curva de variação do máximo SP em função do número de componentes principais retidos do conjunto de sinais formados pelas camadas E1, E2 e H0. Verifica-se que o melhor desempenho é alcançado com a utilização de 12 componentes principais, correspondendo a uma compactação de 88 % em relação ao conjunto dos 100 anéis originais. A Figura 5.29 apresenta 86

111 Tabela 5.24: Resultados encontrados para o estudo de relevância de discriminação das camadas do calorímetro, utilizando o classificador Neural Ringer. N o Anéis CAMADA MÁX. SP (%) PD(%) PF (%) 08 PS 69,31 ± 1,17 69,23 26,85 64 E1 77,88 ± 1,54 89,45 29,17 08 E2 77,78 ± 1,40 83,59 23,15 08 E3 64,18 ± 1,51 65,31 33,33 04 H0 75,89 ± 0,58 75,65 21,76 04 H1 66,92 ± 1,19 66,18 28,70 04 H2 61,77 ± 2,15 69,37 40, TODAS 84,50 ±1,35 97,13 22,12 as curvas ROC dos classificadores desenvolvidos com os sinais das camadas mais relevantes, em comparação com o Neural Ringer. Tabela 5.25: Resultados encontrados para os classificadores utilizando apenas as camadas mais relevantes para discriminação. DISCRIMINADOR MÁX. SP (%) PD(%) PF (%) P F P D=97,13(%) N Var. Neural Ringer 84,50 ±1,35 97,13 22,12 22, N. Ringer E1,E2,H0 80,54 ±1,72 93,59 26,44 31,12 76 Ring.+PCA/ICA E1,E2,H0 83,52 ± 1,07 86,99 16,09 24,17 12 Ring.+DWT (Coif2)E1,E2,H0 83,31 ± 11,95 94,89 21,84 24,29 38 Processamento Segmentado Na análise segmentada para o conjunto MC12 foi utilizada a mesma estrutura das RNAs, aplicadas ao conjunto e10 e e22. Os classificadores projetados para cada camada possuem 10 neurônios na camada o oculta e um único neurônio na camada de saída. As saídas da camada oculta de cada rede especialista, são utilizadas como entradas de um classificador, que também possui 10 neurônios na camada oculta (rede combinadora), e um único neurônio na saída. Na Tabela 5.26 são apresentados os resultados encontrados com o processo de 87

112 Energia Retida (%) Máximo SP (%) Número de Componentes Principais (a) Número de Componentes Principais (b) Figura 5.28: Curva de carga da PCA para as camadas mais relevantes do conjunto e22 (a) e variação do máximo SP(%) em função do número de componentes principais (b) Probabilidade de Detecção (%) Neural Ringer Ringer - E1/E2/H0 Ringer + PCA/ICA - E1/E2/H0 Ringer + DWT(Coif2) - E1/E2/H Probabilidade de Falso Alarme (%) Figura 5.29: Curvas ROC dos classificadores projetados com os sinais das camadas mais relevantes em comparação ao Neural Ringer. classificação individual de cada camada, aplicando pré-processamento por PCA/ICA, para verificar a melhor quantidade de componentes. Novamente, as camadas E1, 88

113 E2 e H0 possuem índices SP melhores em relação as demais. Utilizando o préprocessamento por PCA/ICA nos sinais em anéis de cada camada de forma separada, a quantidade de variáveis necessárias é reduzida em um total de 65% em relação ao Neural Ringer. Tabela 5.26: Resultados encontrados da aplicação do pré-processamento por PCA/ICA nos sinais de cada camada do calorímetro separadamente. ANÉIS COMP. PCA CAMADA MÁX. SP (%) PD(%) PF (%) PS 70,30 ± 0,77 67,18 23, E1 78,16 ± 1,62 89,99 25, E2 78,37 ± 1,71 83,61 23, E3 64,27 ± 1,83 60,32 30, H0 75,91 ± 1,56 76,48 20, H1 67,34 ± 2,25 66,88 29, H2 62,88 ± 1,59 69,61 40,38 Na Tabela 5.27 são apresentados os resultados obtidos com a análise segmentada para os sinais do conjunto mc12, bem como os resultados obtidos através do uso de apenas os sinais das camadas mais relevantes no processamento. A Figura 5.30 apresenta as curvas ROC dos discriminadores projetados com o processamento segmentado, em comparação ao Neural Ringer. O discriminador Ringer Seg. + PCA/ICA, obteve melhor desempenho dentre os classificadores projetados na análise segmentada. O desempenho obtido foi superior ao Neural Ringer, mostrando a viabilidade da proposta. A PF é reduzida consideravelmente em relação ao Neural Ringer (cerca de 7%), para um mesmo nível de PD. O uso de pré-processamento por DWT e a utilização somente dos sinais das camadas mais relevantes também apresentaram resultados interessantes, em que a eficiência dos classificadores foram mantidas próximas à encontrada pelo Neural Ringer, usando uma quantidade menor de variáveis no processo de classificação. 89

114 Tabela 5.27: Resultados encontrados para o classificador segmentado com etapa de pré-processamento em comparação ao Neural Ringer. DISCRIMINADOR MÁX. SP (%) PD(%) PF (%) P F P D=97,13(%) N Var. N. Ringer 84,50±1,35 97,13 22,12 22, Ring. SEG. 86,41±2,41 97,52 18,43 18, Ring. SEG.+PCA/ICA 87,26±2,00 96,61 14,35 15,74 35 Ring. SEG.+DWT (Coif2) 84,53±1,47 95,42 22,58 30,41 50 Ring. SEG. E1,E2,H0 84,70±1,24 94,94 20,37 26,85 76 Ring. SEG. E1,E2,H0 +PCA/ICA 85,02±1,04 94,09 21,19 30,87 12 Ring. SEG. E1,E2,H0 +DWT (Coif2) 83,28±2,02 96,75 23,15 24, Probabilidade de Detecção (%) Ringer SEG. + DWT(Coif2) Ringer SEG (E1/E2/H0) + PCA/ICA Ringer SEG + PCA/ICA 87.5 Ringer SEG (E1/E2/H0) Neural Ringer Ringer SEG (E1/E2/H0) + DWT(Coif2) Ringer SEG Probabilidade de Falso Alarme (%) Figura 5.30: Curvas ROC dos discriminadores projetados com processamento segmentado. Comparações Finais - Conjunto Monte Carlo 2012 A seguir os melhores resultados de eficiência dos classificadores projetados com base de dados MC12 serão apresentados, em comparação com o Neural Ringer sem préprocessamento. A Tabela 5.28 apresenta os índices SP, PD e PF para os discriminadores projetados. Dentre os classificadores que mais se destacaram, o discriminador Ringer + PCA/ICA obteve o melhor desempenho, superando em eficiência o Neural Ringer. Este método proporciona uma redução de 80(%) no número de variáveis necessárias para a decisão. Neste caso o índice SP foi elevado em 3,27 pontos percentuais em 90

115 relação ao classificador Neural Ringer. Com este classificador é verificado também considerável redução na PF, para valores menores de PD, em relação ao Neural Ringer. A seguir serão demonstradas as análises comparativas do discriminador Ringer + PCA/ICA ao Neural Ringer, no que diz respeito a qualidade de classificação de eventos e as eficiências de detecção e falso alarme, em função de parâmetros físicos do detector. Tabela 5.28: Resumo dos resultados encontrados com aplicação de etapa de préprocessamento em comparação ao Neural Ringer - conjunto MC12. DISCRIMINADOR MÁX. SP (%) PD(%) PF (%) P F P D=97,13(%) N Var. N. Ringer 84,50 ±1,35 97,13 22,12 22, Ring.+PCA/ICA 88,77±1,27 92,37 12,03 23,46 20 Ring. + DWT (Coif2) 87,18±1,70 95,58 15,74 22,39 50 Ring. E1,E2,H0 80,54±1,72 93,59 26,44 31,12 76 Ring.+PCA/ICA E1,E2,H0 83,52±1,07 86,99 16,09 24,17 12 Ring.+DWT (Coif2)E1,E2,H0 83,31±11,95 94,89 21,84 24,29 38 Ring. SEG. 86,41±2,41 97,52 18,43 18, Ring. SEG.+PCA/ICA 87,26±2,00 96,61 14,35 15,74 35 Ring. SEG.+DWT (Coif2) 84,53±1,47 95,42 22,58 30,41 50 Ring. SEG. E1,E2,H0 84,70±1,24 94,94 20,37 26,85 38 Ring. SEG. E1,E2,H0 +PCA/ICA 85,02±1,04 94,09 21,19 30,87 76 Ring. SEG. E1,E2,H0 +DWT (Coif2) 83,28±2,02 96,75 23,15 24,54 38 Análises Considerando Parâmetros Físicos Na Figura 5.31 (a) é apresentada a eficiência de detecção encontrada para os classificadores Ringer+ PCA/ICA e Neural Ringer, em função da energia transversa do conjunto mc12. O discriminador com pré-processamento apresenta melhor eficiência de detecção em praticamente toda a faixa de energia do conjunto, em relação ao Neural Ringer. Na Figura 5.31 (b) é verificado que o uso da cadeia de pré-processamento oferece redução na taxa da PF(%), em toda a faixa de energia, comparando-se ao Neural Ringer. As figuras 5.32 (a) e 5.32 (b) mostram as comparações da PD (a) e da PF (b) dos classificadores Ringer + PCA/ICA e Neural Ringer, em função de η. A redução da taxa de PF é verificada também em toda a faixa de η. Elétrons não Detectados As Figuras 5.33 (a) e 5.33 (b) apresentam a distribuição dos elétrons classificados incorretamente em função da energia, para o classificadores Neural Ringer+PCA/ICA 91

116 Probabilidade de Deteccao (%) Ringer + PCA/ICA Neural Ringer Et[GeV] (a) Probabilidade de Falso Alarme (%) Ringer + PCA/ICA Neural Ringer Et[GeV] (b) Figura 5.31: Curvas de eficiência (a) e falso alarme (b) em dos classificadores Ringer + PCA/ICA e Neural Ringer, em função de Et. Probabilidade de Detecção (%) Falso Alarme (%) η (a) Neural Ringer Ringer + PCA/ICA Neural Ringer Ringer + PCA/ICA η (b) Figura 5.32: Curvas de eficiência (a) e falso alarme (b) em dos classificadores Ringer + PCA/ICA e Neural Ringer, em função η. 92

117 e Neural Ringer sem etapa de pré-processamento. O discriminador Neural Ringer sem pré-processamento deixou de classificar corretamente um total de 1528 elétrons, considerando o conjunto de teste utilizado para esta análise com amostras, equivalendo a 93,01% de acerto. Considerando o mesmo conjunto utilizado no teste do classificador Neural Ringer sem pré-processamento, o classificador Ringer + PCA/ICA não detectou um total de 536 elétrons, alcançando a taxa de 97,55 % de acerto. Nas Figuras 5.33 (c) e 5.33 (d) são apresentadas as distribuições de elétrons não detectados em função de η, para os discriminadores Neural Ringer e Ringer + PCA/ICA. Contagem Ringer + PCA/ICA: Elétrons não detectados Et [GeV] (a) Contagem Neural Ringer: Elétrons não detectados Et [GeV] (b) Contagem Ringer + PCA/ICA: Elétrons não detectados η (c) Contagem Neural Ringer: Elétrons não detectados η (d) Figura 5.33: Distribuição em Et (a e b) para os elétrons não detectados pelos classificadores Ringer + PCA/ICA (a) e pelo Neural Ringer (b) - conjunto mc12. Jatos Classificados Incorretamente O classificador Neural Ringer, sem etapa de pré-processamento atingiu a taxa de acertos de jatos de 86,21 %, em um conjunto de testes com 174 eventos (24 jatos foram classificados incorretamente como elétrons). O uso de pré-processamento por PCA/ICA reduz o quantitativo de erros de classificação de jatos, neste caso foi alcançado 92,53% de acerto (classificou incorretamente 13 jatos hadrônicos). 93

118 As Figuras 5.34(a) e 5.34 (b) mostram a distribuição destes jatos, em função da energia transversa para os classificadores Ringer + PCA/ICA e Neural Ringer respectivamente. Nas Figuras 5.34 (c) e 5.34 (d) são apresentadas as distribuições dos jatos classificados incorretamente em função da sua posição de interação no calorímetro (η), para os classificadores Ringer + PCA/ICA e Neural Ringer, respectivamente. Contagem Ringer + PCA/ICA: Jatos classificados incorretamente Contagem Neural Ringer: Jatos classificados incorretamente Et[GeV] (a) EtGeV] (b) 5 4 Ringer + PCA/ICA: Jatos classificados incorretamente 5 4 Neural Ringer: Jatos classificados incorretamente Contagem 3 2 Contagem η (c) η (d) Figura 5.34: Distribuições em Et (a e b) e η (c e d) para jatos classificados incorretamente pelos discriminadores Ringer + PCA/ICA e pelo Neural Ringer - conjunto mc12. 94

119 Capítulo 6 Resultados com Dados Experimentais 6.1 Base de Dados Experimentais Nesta seção serão apresentados os resultados obtidos através da aplicação da metodologia proposta para os sinais medidos no detector ATLAS. Pré-Processamento por PCA/ICA De forma a avaliar os melhores níveis de compactação através da Análise de Componentes Principais, com a utilização dos dados experimentais, foi realizado procedimento semelhante ao executado nos dados simulados. A Figura 6.1 (a) apresenta a curva de carga que mostra a energia retida por número de componentes principais agrupados. É possível observar na Figura 6.1 (b) que a melhor eficiência do classificador com pré-processamento por PCA/ICA é encontrada utilizando-se 40 componentes principais, garantindo um grau de compactação dos sinais medidos em 60% em relação aos 100 anéis considerados pelo classificador Neural Ringer. A Tabela 6.1 apresenta os resultados encontrados, para o classificador Ringer + PCA/ICA, em comparação com o classificador Neural Ringer. A utilização da etapa de pré-processamento produziu um aumento de 0,23 ponto percentual no índice SP, em relação ao Neural Ringer. O classificador com pré-processamento possibilita a redução da taxa de falso alarme, em relação ao Neural Ringer, considerando o 95

120 Energia Retida (%) Máximo SP (%) Componentes PCA (a) Componentes PCA (b) Figura 6.1: Curva de carga da PCA (a) e Variação do Máximo SP em função do número de componentes retidos na compactação por PCA - Dados experimentais. mesmo nível de probabilidade de detecção (96,65 %). Este aumento de eficiência é possível observar também através da análise das curvas ROC, apresentadas na Figura 6.2. Neste caso verifica-se melhores níveis de PD(%) encontrados para o classificador com pré-processamento, especificamente na faixa de PF de 04% a 10% Probabilidade de Detecção (%) Neural Ringer Ringer + PCA/ICA Probabilidade de Falso Alarme (%) Figura 6.2: Curva ROC dos discriminadores Neural Ringer e Ringer + PCA/ICA para os dados experimentais. 96

121 Tabela 6.1: Comparação dos resultados encontrados com análises sob o conjunto de dados experimentais. Discriminadores Max SP(%) PD(%) PF(%) P F P D=96,65(%) N Var. Neural Ringer 95,12 ±0,05 96,65 6,25 6, Ringer + PCA/ICA 95,35 ±0,04 96,91 6,03 5,79 40 Pré-Processamento por DWT A Figura 6.3 apresenta os níveis de eficiência encontrados para os classificadores projetados com pré-processamento por DWT, de acordo com as funções mãe wavelets testadas Máximo SP(%) Máximo SP 94.9 Haar Db2 Db5 Sym2 Sym3 Sym4 Coif1 Coif2 Coif3 Figura 6.3: Índices SP (%) encontrados para cada função wavelet utilizada na etapa de pré-processamento - conjunto experimental. Na Tabela 6.2 são apresentados os resultados dos índices de eficiência dos classificadores treinados com os coeficientes da DWT. Verifica-se que as eficiências encontradas são mantidas próximas ao valor encontrado para o Neural Ringer. O uso das funções wavelets Db1, Sym4, e Coif1 apresentaram, dentre as funções da suas famílias, os melhores resultados para o índice SP(%), sendo que a utilização das funções Db1 e Sym4 superam em eficiência o classificador Neural Ringer. A Figura 6.4 apresenta as Curvas ROC de comparação entre os classificadores projetados com pré-processamento por DWT (sym4) e DWT (sym4) +ICA. Observa-se 97

122 Tabela 6.2: Resultados obtidos com o uso das diferentes funções wavelets utilizadas. Discriminadores Max SP(%) PD(%) PF(%) Neural Ringer 95,12 ±0, ,25 Ringer+DWT(Db1) 95,15 ±0,03 95,96 5,55 Ringer+DWT(Db2) 95,09 ±0,04 96,33 6,03 Ringer+DWT(Db5) 95,14 ±0,05 96,55 6,11 Ringer+DWT(Sym2) 95,12±0,06 96,66 6,21 Ringer+DWT(Sym3) 95,02±0,02 96,56 6,45 Ringer+DWT(Sym4) 95,17±0,03 96,65 6,13 Ringer+DWT(Coif1) 95,12 ±0,05 96,79 6,33 Ringer+DWT(Coif2) 95,09 ±0,05 96,14 5,84 Ringer+DWT(Coif3) 94,94 ±0,03 95,95 5,95 neste contexto, um leve decréscimo na eficiência do classificador ocasionado pela inserção da ICA como mais uma etapa de pré-processamento. Neste caso, nas análises comparativas posteriores, entre os classificadores, para o uso de pré-processamento por DWT, não serão abordadas a inclusão da ICA em conjunto com a DWT Probabiliade de Detecção (%) Ringer + DWT (sym4) Ringer + DWT/ICA (sym4) Neural Ringer Probalidade de Falso Alarme (%) Figura 6.4: Curvas ROC dos classificadores projetados com pré-processamento por DWT e DWT/ICA. 98

123 Tabela 6.3: Resultados encontrados com a adição de pré-processamento por DWT. Discriminadores Max SP(%) PD(%) PF(%) N Var. Neural Ringer 95,12 ±0,05 96,65 6, Ringer + DWT (Sym4) 95,17 ±0,05 96,79 6,33 50 Ringer + DWT (Sym4) /ICA 95,07 ±0,08 96,57 6,48 50 Compactação por Relevância das Camadas do Calorímetro Do mesmo modo realizado para análise dos dados simulados, para o conjunto experimental também foi analisado o impacto individual dos sinais de cada camada do calorímetro na eficiência de classificação geral do Neural Ringer. A Tabela 6.4 apresenta os resultados encontrados do estudo de relevância dos sinais das camadas. Verifica-se que a retirada das camadas E1, E2 e H0 proporcionam uma queda no índice SP(%) do classificador projetado. Verifica-se também que a presença dos sinais destas camadas incrementam eficiência em termos de SP para o classificador. Tabela 6.4: Resultados encontrados para o estudo de relevância de discriminação entre as camadas do calorímetro, para o Neural Ringer - dados experimentais. N o Anéis CAMADAS MÁX. SP (%) PD(%) PF (%) P F P D=96,65(%) 92 PS 99,65 ± 0,18 99,69 0,33 0,46 36 E1 99,24 ± 0,24 99,19 0,60 2,50 92 E2 99,56 ± 0,21 99,52 0,35 1,03 92 E3 99,67 ± 0,15 99,63 0,28 0,64 96 H0 99,58 ± 0,29 99,58 0,32 1,02 96 H1 99,68 ± 0,18 99,66 0,24 0,62 96 H2 99,67 ± 0,10 99,68 0,30 0, ,12 ±0,05 96,65 6,25 6,25 A Tabela 6.5 apresenta os resultados encontrados com discriminadores projetados sem pré-processamento para cada camada do calorímetro individualmente. É possível verificar que o melhor desempenho é encontrado nos discriminadores projetados com os sinais das camadas E1, E2 e H0, confirmando a melhor relevância de discriminação dos anéis que compõem estas camadas. Considerando a relevância de discriminação dos sinais das camadas E1, E2 e H0, 99

124 Tabela 6.5: Resultados encontrados para o estudo de relevância de discriminação das camadas do calorímetro, utilizando o classificador Neural Ringer. N o Anéis CAMADA MÁX. SP (%) PD(%) PF (%) 08 PS 77,19 ± 0,04 83,62 28,82 64 E1 91,10 ± 0,04 93,18 10,82 08 E2 91,63 ± 0,05 93,40 10,00 08 E3 80,05 ± 0,06 86,20 25,62 04 H0 84,72 ± 0,03 89,69 20,03 04 H1 75,11 ± 0,10 82,01 31,18 04 H2 61,36 ± 0,08 72,85 48,89 Energia Retida (%) Máximo SP (%) Número de Componentes Principais (a) Número de Componentes Principais (b) Figura 6.5: Curva de carga da PCA (a) e variação do máximo SP em função do número de componentes principais retidos - conjunto de dados experimentais. foi projetado um classificador somente com os sinais destas camadas como entrada. Foram aplicadas as técnicas de pré-processamento PCA/ICA e DWT,para verificar possível melhoria na eficiência do discriminador projetado. A Figura 6.5 (a) apresenta a curva de carga da PCA, considerando o conjunto de dados formado apenas pelos sinais em anéis das camadas mais relevantes, reduzindo o conjunto original para 76 anéis. 100

125 O Máximo SP(%) foi encontrado utilizando-se 20 componentes principais das 76 variáveis do conjunto,conforme apresentado no gráfico da Figura 6.5 (b), proporcionando neste caso um nível de compactação de 80% em relação aos 100 anéis originais e de aproximadamente 73% em relação as camadas mais relevantes. A Tabela 6.6 apresenta os resultados encontrados para as eficiências dos classificadores projetados com os sinais das camadas mais relevantes para discriminação. Os resultados mostram que o classificador projetado com a aplicação da PCA/ICA no conjunto de dados composto pelos sinais das camadas E1,E2 e H0 proporciona resultados de eficiência superiores ao Neural Ringer, que utiliza os 100 anéis para classificação (índice SP com 0,10 ponto percentual superior em relação ao Neural Ringer). O classificador Ringer + PCA/ICA E1,E,H0, necessitou apenas de 20% do conjunto de dados, obtendo melhor desempenho (20 componentes principais). Utilizando o pré-processamento estatístico o falso alarme é reduzido em 0,15% em relação ao Neural Ringer, para o mesmo ponto de PD (96,65%). Tabela 6.6: Resultados encontrados para os classificadores utilizando apenas as camadas mais relevantes para discriminação. DISCRIMINADOR MÁX. SP (%) PD(%) PF (%) P F P D=96,65(%) N Var. N. Ringer 95,12±0,05 96,65 6,25 6, N. Ringer E1,E2,H0 94,99±0,06 96,07 5,83 6,52 76 Ring.+PCA/ICA E1,E2,H0 95,22±0,06 96,55 5,96 6,10 20 Ring.+DWT E1,E2,H0 94,63±0,06 95,90 6,37 7,33 36 A Figura 6.6 apresenta as curvas ROC dos classificadores projetados com os sinais das camadas mais relevantes em comparação com o Neural Ringer. Nesta análise foi observado que a curva ROC dos discriminador Ringer + PCA/ICA E1,E2,H0 apresenta ligeiras melhorias para os valores de PD,em relação aos demais classificadores. Processamento Segmentado Para as análises de processamento segmentado, foi realizado processo semelhante ao procedimento executado com os dados simulados. Os resultados encontrados 101

126 98 96 Probablidade de Detecção (%) E1,E2,H0 - Neural Ringer E1,E2,H0 - Ringer + PCA/ICA E1,E2,H0 - Ringer + DWT(sym4) Neural Ringer Probabilidade de Falso Alarme (%) Figura 6.6: Curvas ROC dos discriminadores projetados com os sinais das camadas mais relevantes para discriminação, em comparação ao Neural Ringer. para esta abordagem são apresentados na Tabela 6.7. Verifica-se ligeiro aumento na eficiência, em relação ao Neural Ringer. Tabela 6.7: Resultados encontrados para o classificador segmentado por camada sem etapa de pré-processamento. DISCRIMINADOR MÁX. SP (%) PD(%) PF (%) P F P D=96,65(%) Neural Ringer 95,12 ±0,05 96,65 6,25 6,25 Ringer SEG. 95,13 ±0,03 96,83 6,46 6,30 Aplicando o pré-processamento por PCA/ICA em cada camada separadamente obtêm-se os níveis de eficiência apresentados na Tabela 6.8. Foi realizado um estudo variando-se o número de componentes principais, de forma a encontrar o melhor índice SP, de acordo com o a quantidade de componentes agrupados em cada camada. As camadas E1, E2 e H0 apresentam maior índice SP em relação as demais camadas do calorímetro mostrando elevada relevância no processo de discriminação geral do classificador. Através da aplicação da PCA/ICA o número de componentes totais utilizados 102

127 Tabela 6.8: Resultados encontrados da aplicação do pré-processamento por PCA/ICA nos sinais de cada camada do calorímetro separadamente. ANÉIS COMP. PCA CAMADA MÁX. SP (%) PD(%) PF (%) PS 77,17 ± 0,05 84,57 29, E1 91,38 ± 0,06 93,58 10, E2 91,64 ± 0,14 93,74 10, E3 80,09 ± 0,09 86,67 26, H0 84,72 ± 0,02 89,78 20, H1 75,18 ± 0,03 81,99 31, H2 61,41 ± 0,09 71,48 47,57 somam-se 58, que significa uma compactação de 42%. Os resultados do classificador segmentado, projetado com os dados pré-processados, são apresentados na Tabela 6.9, na qual são mostrados os resultados encontrados para o uso das técnicas PCA/ICA e DWT como pré-processamento. É observado que o uso da PCA/ICA incrementa elevação no índice SP (%), superando a eficiência do classificador sem pré-processamento. Tabela 6.9: Resultados encontrados para o classificador segmentado com etapa de pré-processamento. DISCRIMINADOR MÁX. SP (%) PD(%) PF (%) P F P D=96,65(%) N Var. N. Ringer 95,12±0,05 96,65 6,25 6, Ring. SEG. 95,13±0,03 96,83 6,46 6, Ring. SEG.+PCA/ICA 95,19 ±0,08 96,88 6,17 5,98 40 Ring. SEG.+DWT( Sym4 ) 95,04±0,07 96,57 6,63 6,88 50 Ring. SEG. E1,E2,H0 94,98±0,11 95,17 6,98 7,13 76 Ring. SEG. E1,E2,H0 +PCA/ICA 95,07 ±0,09 95,21 6,87 6,94 20 Ring. SEG. E1,E2,H0 +DWT (Sym4) 95,01 ±0,04 95,75 6,92 7,11 38 A Figura 6.7 mostra as curvas ROC, para os discriminadores segmentados projetados. Observa-se que as curvas são bastante parecidas, com ligeiro ganho em eficiência para o classificador Ringer SEG.+ PCA/ICA, o qual apresentou aumento do índice SP de 0,07 ponto percentual em relação ao Neural Ringer sem préprocessamento. 103

128 99 Probabilidade de Detecção (%) Ringer SEG. + PCA/ICA Neural Ringer SEG. Neural Ringer Probabilidade de Falso Alarme (%) Figura 6.7: Curvas ROC dos discriminadores projetados com pré-processamento com estratégia segmentada, para os dados experimentais Análise Comparativa - Dados experimentais Os melhores resultados obtidos com os dados experimentais são comparados na Tabela Pode-se observar que o discriminador Ringer + PCA/ICA obteve o melhor desempenho, superando em eficiência o Neural Ringer. A aplicação da PCA/ICA nos sinais em anéis proporciona uma redução de 60% no conjunto de dados experimentais e, ao mesmo tempo, o índice SP foi elevado em 0,23 ponto percentual em relação ao classificador Neural Ringer. A seguir serão apresentadas as análises comparativas do discriminador Ringer + PCA/ICA e do Neural Ringer, considerando classificação de eventos e eficiências de detecção e falso alarme, em função de parâmetros físicos do detector. Análises Considerando Parâmetros Físicos Na Figura 6.8 (a) é apresentada a eficiência de detecção encontrada para os classificadores Ringer+ PCA/ICA e Neural Ringer, em função da energia transversa do conjunto de dados experimentais. O discriminador Ringer + PCA/ICA apresenta melhor eficiência de detecção em praticamente toda a faixa de energia do conjunto, 104

129 Tabela 6.10: Resultados encontrados para o classificador segmentado com etapa de pré-processamento em comparação ao Neural Ringer. DISCRIMINADOR MÁX. SP (%) PD(%) PF (%) P F P D=96,65(%) N Var. N. Ringer 95,12±0,05 96,65 6,25 6, Ringer+PCA/ICA 95,35 ±0,04 96,91 6,03 5,79 40 Ringer + DWT (Sym4) 95,17 ±0,05 96,79 6,33 6,11 50 Neural Ringer E1,E2,H0 94,99 ±0,06 96,07 5,83 6,52 76 Ringer+PCA/ICA E1,E2,H0 95,22 ± 0,06 96,55 5,96 6,10 20 Ringer+DWT( Sym4 ) E1,E2,H0 94,63 ± 0,06 95,90 6,37 7,33 50 Ringer SEG. 95,13 ±0,03 96,83 6,46 6, Ringer SEG. + PCA/ICA 95,19 ±0,08 96,88 6,17 5,98 40 Ringer SEG.+ DWT( Sym4 ) 95,04 ±0,07 96,57 6,63 6,88 50 Ringer SEG. E1,E2,H0 94,98 ±0,11 95,17 6,98 7,13 76 Ringer SEG. E1,E2,H0 +PCA/ICA 95,07±0,09 95,21 6,87 6,94 20 Ringer SEG. E1,E2,H0 +DWT (Sym4) 95,01±0,04 95,75 6,92 7,11 38 em relação ao Neural Ringer. Na Figura 6.8 (b) é verificado que o uso da cadeia de pré-processamento oferece redução na taxa da PF(%), em toda a faixa de energia, comparando-se ao Neural Ringer. As Figuras 6.9 (a) e 6.9 (b) mostram as comparações da PD (a) e da PF (b) dos classificadores Ringer + PCA/ICA e Neural Ringer, em função de η. A redução da taxa de PF é verificada também em toda a faixa de η. Elétrons não Detectados As Figuras 6.10(a) e 6.10(b) apresentam a distribuição de elétrons não detectados em função da energia, para os classificadores Neural Ringer e Ringer + PCA/ICA. O Neural Ringer não detectou elétrons, do conjunto de teste utilizado (com assinaturas de elétrons), representando um perda de 3,27 % de informação relevante. O classificador Ringer + PCA/ICA deixou de classificar corretamente elétrons, ocasionando uma perda de 3,02 %, reduzindo o erro de classificação em 305 assinaturas de elétrons em relação ao Neural Ringer. Jatos Classificados Incorretamente As Figuras 6.11(a) e 6.11 (b) mostram a distribuição dos jatos classificados incorretamente, em relação a energia transversa (a) para os classificadores Ringer + PCA/ICA e Neural Ringer respectivamente e em relação a posição de interação no detector (b). O uso de pré-processamento por PCA/ICA reduz ligeiramente quan- 105

130 Probabilidade de Detecção (%) Ringer + PCA/ICA Neural Ringer Probabilidade de Falso Alarme (%) Neural Ringer Ringer + PCA/ICA Et [GeV] (a) Et[GeV] (b) Figura 6.8: Curvas de eficiência (a) e falso alarme (b) em dos classificadores Ringer + PCA/ICA e Neural Ringer, em função de Et - dados experimentais. Probabilidade de Detecção (%) Probabilidade de Falso Alarme (%) Ringer + PCA/ICA 94 Neural Ringer η (a) η (b) Ringer + PCA/ICA Neural Ringer Figura 6.9: Curvas de eficiência (a) e falso alarme (b) em dos classificadores Ringer + PCA/ICA e Neural Ringer, em função η. 106

131 Figura 6.10: Distribuição em Et e η para elétrons não detectados pelos classificadores Ringer + PCA/ICA e pelo Neural Ringer. titativo de erros de classificação de jatos,em relação ao Neural Ringer. O Ringer + PCA/ICA classificou incorretamente 313 jatos hadrônicos, 28 a menos que o classificador sem pré-processamento. 107

132 Figura 6.11: Distribuição em Et (a) e η (b) para jatos não classificados incorretamente pelos discriminadores Ringer + PCA/ICA e pelo Neural Ringer. 108

133 Capítulo 7 Conclusões O Grande Colisor de Hadrons (LHC - Large Hadron Collider) que iniciou a suas atividades em 2009, retornou a operação no ano de 2015, após uma parada em 2013 para atualização de equipamentos e sistemas. Com as atualizações a energia das colisões de prótons poderão chegar ao nível máximo para o qual o LHC foi projetado (14 TeV). Neste trabalho é abordado um dos problemas importantes no detector ATLAS do LHC, que consiste na identificação online de eventos, em um ambiente com alta taxa de produção de informação. No ATLAS o sistema de filtragem online (trigger) é dividido em três níveis sequenciais, que reduzem gradualmente o ruído de fundo (informação não relevante para o experimento). O trigger online deve ser eficiente na identificação das informações de interesse, deve possuir baixa aceitação de ruído de fundo e ainda, efetuar com rapidez a tomada de decisão. Os elétrons são partículas importantes para o experimento, pois estão presentes em diversos decaimentos de assinaturas de interesse. No trabalho [9] foi proposto um algoritmo chamado Neural Ringer com funcionamento no segundo nível de filtragem online(l2) para a identificação de elétrons, alternativo ao sistema padrão que opera neste nível de trigger online do ATLAS. O algoritmo realiza um processamento topológico em anéis concêntricos das informações do calorímetro. Os sinais em anéis alimentam um classificador baseado em redes neurais artificiais (RNA). Neste contexto, este trabalho propôs o uso de técnicas de pré-processamento de sinais, na cadeia do Neural Ringer. Foram avaliadas diversas estratégias visando 109

134 o aumento da eficiência do discriminador. Foram utilizadas as técnicas de préprocessamento Análise de Componentes Principais (PCA), Análise de Componentes Independentes (ICA) e Transformada Discreta de Wavelets (DWT) buscando especificamente a extração das características mais relevantes e redução de redundância. Os resultados encontrados mostraram o aumento da eficiência do classificador ao ser aplicado o pré-processamento por PCA/ICA, em todos os conjuntos de dados utilizados no trabalho (simulados e experimentais). Foram encontrados elevados níveis de compactação da informação a ser processada pela RNA, proporcionando aumento da eficiência de detecção de elétrons e redução do falso alarme. Considerando a base de dados simulados e10, foi alcançado para a estratégia de processamento não segmentada, no melhor caso uma taxa de 60% de redução no número de variáveis de entrada para o classificador neural. Com essa estratégia, a mesma taxa de redução, foi encontrada na análise realizada para o conjunto de dados experimentais. Para o conjunto de dados simulados MC12, foi encontrada uma redução de 100 para 20 variáveis de entrada do classificador, juntamente com uma melhoria de 4,27 pontos percentuais em relação ao Neural Ringer. A proposta de utilizar a informação dos calorímetros de forma segmentada, também apresentou resultados interessantes no desempenho em comparação ao Neural Ringer, reduzindo o as taxas de falso alarme. Estudos de avaliação de relevância das informações das camadas do calorímetro mostraram boa alternativa no que diz respeito à redução da informação a ser considerada para seleção elétron/jato. Foi observado em todas as bases de dados, que as camadas E1, E2 e H0 possuem maior relevância dentre as demais camadas do calorímetro e a utilização de somente os sinais medidos nestas camadas proporcionam desempenho próximo ao Neural Ringer. Foi verificado que o uso do pré-processamento melhora os níveis de detecção em relação ao Neural Ringer, em faixas baixas de energia em que a incidência do ruído de fundo é maior, tornando a detecção da física de interesse tarefa complicada [48]. Em relação a posição de interação do evento com o sistema de calorimetria, foram obtidos resultados de eficiência superiores ao Neural Ringer principalmente para detecção na região do crack do calorímetro. 110

135 7.1 Trabalhos Futuros Com base nas melhorias de eficiência de classificação, obtidas com a aplicação do préprocessamento na cadeia do Neural Ringer, novas propostas podem ser implementadas. Outras técnicas como Fatoração de Matrizes Não-Negativas [49] e Principais Componentes Discriminantes [4], podem proporcionar melhorias de desempenho ao classificador. É possível também avaliar outras propostas para o discriminante. Os Mapas Auto-Organizáveis [24] e Máquinas de Vetor de Suporte [22] podem ser alternativas ao classificador neural com múltiplas camadas, implementado no Neural Ringer. Devido às diferentes características dos sensores, que variam ao longo do calorímetro, é possível também desenvolver classificadores especialistas em regiões pré-determinadas do detector. A mesma análise pode ser expandida para faixas de energia, em que podem ser desenvolvidos sistemas de classificação especialistas em faixas determinadas de energia transversa das partículas. 111

136 Referências Bibliográficas [1] ESCUDERO J., HORNERO R., A. D., Artifact removal in magnetoencephalogram background activity with independet component analysis, IEEE Transactions on Biomedical Engineering, v. 54, pp , [2] SARPERI L., ZHU X., N. A. K., Blind OFDM receiver based on independent component analysis for MIMO systems, IEEE Transactions on Wireless Communications, v. 6, pp , [3] MOURA, N. N., SIMAS FILHO, E. F., SEIXAS, J. M., Independent Component Analysis for Passive Sonar Signal Processing, Advances in Sonar Technology, Sergio R. Silva, Ed., v. 1, pp , [4] JOLLIFFE, I. T., Principal Component Analysis. 2nd ed. Springer: Nova York, Estados Unidos, [5] HYVARINEN A., KARHUNEN, J. O. E., Independent Component Analysis. Wiley: Nova York, Estados Unidos, [6] ATLAS COLABORATION, ATLAS Experiment at CERN Large Hadron Collider, Journal of Instrumentation, v. 3, n. S08003, pp , [7] EVANS, L., BRYANT, P., LHC Machine, Journal of Instrumentation, v. 3, n. S08001, pp , [8] CERN-COLABORATION, CERN Homepage, Disponível em :< Acesso em: 11 de agosto de [9] ANJOS, A. R. D., TORRES, R., SEIXAS, J. M., Neural triggering system operating on high resolution calorimetry information,. 112

137 [10] ROBERT, C., CASELLA, G., Monte Carlo Statistical Methods. Springer- Verlag: Nova York, Estados Unidos, [11] HAWKING, S., MLODINOW, L., O Grande Projeto. Nova Fronteira: Rio de Janeiro, [12] PERKINS, D. H., Introduction to high-energy physics. Cambridge, University Press: Cambridge, Cambridge, [13] MOREIRA, M. A., O Modelo Padrão da Física de Partículas, Revista Brasileira de Ensino de Física, v. 31, n. 1306, [14] CMS COLABORATION, The CMS Experiment at the CERN Large Hadron Collider, Journal of Instrumentation, v. 3, n. S08004, [15] ALICE COLABORATION, The ALICE Experiment at CERN Large Hadron Collider, Journal of Instrumentation, v. 3, n. S08002, pp , [16] TOTEM COLABORATION, The TOTEM Experiment at the CERN Large Hadron Collider, Journal of Instrumentation, v. 3, n. S08007, [17] CERN, L. E., Large Hadron Collider beauty Experiment, Disponível em :http : //lhcb public.web.cern.ch/lhcb public/. Acesso em: 11 de agosto de [18] LHCF COLABORATION, The LHCf detector at the CERN Large Hadron Collider, Journal of Instrumentation, v. 3, n. S08006, [19] ATLAS COLABORATION, ATLAS High Level Trigger, Data Acquisition and Controls Technical Design Report. Tech. Rep., CERN, Genbra, Suíça, [20] XAVIER T., C., Identificação Online de Sinais Baseada em Calorimetria de Altas Energias e com Fina Segmentação. Tese de Doutorado, COPPE/UFRJ: Rio de Janeiro, dezembro, [21] SIMAS FILHO, E. F., Análise não-linear de componentes independentes para uma filtragem online basada em calorimetria de alta energia e com fina 113

138 segmentação. Tese de Doutorado, COPPE/UFRJ: Rio de Janeiro, dezembro, [22] HAYKIN, S., Neural Netoworks and Learning Machines. Prentice Hall: Nova Jersey, Estados Unidos, [23] XAVIER, T. C., ANJOS, A. R. D., SEIXAS, J. M., Discriminadores Neurais de Partículas para Um Detector Submetido a uma Alta Taxa de Eventos. Simpósio Brasileiro de Automação Inteligente, [24] FACELLI, K., LORENA, A. C., GAMA, J., et al., Inteligência Artificial Uma Abordagem de Aprendizado de Máquina. v. 1. LTC: Rio de Janeiro, [25] WEEKS, M., Processamento Digital de Sinais Utilizando Matlab e Wavelets. LTC: Rio de Janeiro, [26] CASELLA, G., BERGER, R. L., Inferência Estatística. Cengage Learning: São Paulo, [27] SHANMUGAN, K., BREIPOHL, A. M., Random Signals - detection, estimation and data analysis. Wiley, [28] BELLMAN, R., Dynamic Programming. Princeton University Press: Princeton, [29] TREES, H. L. V., Detection, Estimation, and Modulation Theory. v. 1. JOHN WILEY and SONS: Canadá, [30] PRORIOL, J., Selection of variables for neural network analysis. Comparison of several methods with high energy physics data, Nuclear Instruments and Methods in Research A, v. 361, pp , [31] CHOI, S., CICHOCKI, A., H.PARK, et al., Blind Source Separation and Independent Component Analysis: A Review, Neural Information Processing - Letters and Reviews, v. 6, pp , [32] HYVARINEN, A., Fast and Robust Fixed-Point Algorithms for Independent Component Analysis, IEEE Transactions on Neural Networks, v. 10, pp ,

139 [33] CARDOSO, J. F., SOULOUMIAC, A., Blind Beamforming for Non-gaussian Signals, IEEE Procedings-F, v. 140, pp , [34] DA SILVA, A. P. O., Uma Implementação da Análise de Componentes Inteligentes em Plataforma de Hardware Reconfigurável. Dissertação de Mestrado, UFRN: Natal, [35] BELOUCHRANI, A., MERAIM, A., F.CARDOSO, J., et al., A Blind Source Separation Technique Using Second-Order Statistics, IEEE Transactions on Signal Processing, v. 45, pp , [36] LIMA A., RABELO R., C. D., A., C., Filtragem de Distúrbios Elétricos Baseada na Análise de Componentes Independentes de Canal Único, In: Congresso Brasileiro de Automática, pp , [37] HE, T., CLIFFORD, G., TARASSENKO, L., Application of ICA in removing artefacts from the ECG, Neural Computing and Applications, v. 15, pp , [38] TORRES, R. C., Sistema online de filtragem em um ambiente com alta taxa de eventos e fina granularidade. Tese de Doutorado, COPPE/UFRJ: Rio de Janeiro, março, [39] DINIZ, P. S. R., DA SILVA, E. A. B., NETTO, S. L., Processamento digital de sinais: projeto e análise de sistemas. Bookman: Porto Alegre, [40] GONZALEZ, R. C., WOODS, R. E., Processamento Digital de Imagens. Pearson Prentice Hall: São Paulo, [41] ANGARITA, J. A. C., BERGER, P. A., NASCIMENTO, F. A. O., Algoritmo Híbrido de Compressão de Sinais de Pertubações em Sistemas de Energia Elétrica. In: Congresso Brasileiro de Automática, pp. 1 5, [42] VARANIS, M. V. M., Detecção de falhas em motores elétricos utilizando a transformada wavelet packet e métodos de redução de dimensionalidade. Tese de Doutorado, FEM/UNICAMP: Campinas, agosto,

140 [43] JUNIOR, M. M. S., CRUZ, F. C., FILHO, E. F. S., et al., Neural Decision Support System for Ultrasound Nondestructive Evaluation Embedded in a DSP, IEEE International Instrumentation and Measurement Technology Conference, Pisa, Italia, v. 1, pp , [44] WANDISHIN, M. S., MULLEN, S. J., Multiclass ROC Analysis, Weather and Forecasting, v. 24, pp , [45] FAWCETT, T., An introduction to ROC analysis, Pattern Recognition Letters 27, v. 27, pp , [46] FILHO, E. F. S., CALÔBA, L., SEIXAS, J. M., Combinação de Classificadores Neurais Segmentados com Pré-processamento por Análise de Componentes Independentes para um Sistema Online de Filtragem. In: Congresso Brasileiro de Redes Neurais e Inteligência Computacional, pp. 1 5, [47] RIEDMILLER, M., BRAUN, H., A direct adaptive method for faster backpropagation learning, the RPROP algorithm. In: Proc. of Int. Conf. on Neural Networks, v. 559, n , pp , [48] WIGMANS, R., Calorimetry: Energy Measurement in Particle Physics. Clarendon Press: Gloucestershire: Reino Unido, [49] CICHOCKY A., Z. R., Nonnegative Matrix and Tensor Factorizations: Applications to Exploratory Multi-way Data Analysis and Blind Source Separation. Wiley: West Sussex, Reino Unido, [50] SOUZA, E. E. P., FILHO, E. F. S., FARIAS, P., et al., Sistema Neural para Seleção Online de Eventos com Pré-Processamento através da DWT, XX Congresso Brasileiro de Automática, Belo Horizonte/MG, v. 1, pp , [51] SILVA, F. B., SOUZA, E. E. P., FILHO, E. F. S., et al., Sistema Neural Segmentado de Detecção Online Utilizando Pré-Processamento Estatístico, XX Congresso Brasileiro de Automática, Belo Horizonte/MG, v. 1, pp ,

141 [52] SOUZA, E. E. P., FILHO, E. F. S., FARIAS, P., et al., Otimização do Sistema Neural de Seleção Online de Eventos num Detector de Partículas através do Processamento Estatístico de Sinais, Congresso Brasileiro de Inteligência Computacional, Ipojuca/PE, v. 1, pp. 1 6, [53] SOUZA, E. E. P., SILVA, F. B., FILHO, E. F. S., et al., Efeitos do Pré Processamento Estatístico para o Sistema Neural de Filtragem Online do ATLAS, Encontro de Físicos do Norte e Nordeste, Salvador/BA, v. 1, [54] LIMA JR, H. SEIXAS, J., A segmented princiapl component analysis applied to calorimetry information at ATLAS, Nuclear Instruments and Methods in Physics Research A, v. 559, pp , [55] MARZBAN, C., The ROC Curve and the Area under It as Performance Measures, Weather and Forecasting, v. 24, pp , [56] PAPOULIS, A., Probability, Randon Variables and Stochastic Processes. McGraw-Hill: Nova York, Estados Unidos, [57] CERN-COLABORATION, ATLAS Homepage, Disponível em :< Acesso em: 15 de julho de [58] CBPF, CBPF Homepage, Disponível em: < http : //portal.cbpf.br >. Acesso em: 11 de maio de [59] SUYAMA, R., Proposta de métodos de separação cega de fontes para misturas convolutivas e não-lineares. Tese de Doutorado, FEEC/UNICAMP: Campinas, dezembro, [60] ATLAS COLABORATION, ATLAS Level-1 Trigger Group. Level-1 Trigger Technical Design Report. CERN/ATLAS TDR-12, [61] ATLAS COLABORATION, Observation of a new particle in the search for the Standart Model Higgs boson with the ATLAS detector at the LHC, Physics Letters B 716,

142 [62] ATLAS COLABORATION, A Particle Consistent with the Higgs Boson Observed with the ATLAS Detector at the Large Hadron Collider, Science 338, [63] THE CMS COLABORATION, Evidence for the direct decay of the 125 GeV Higgs boson to fermions, Nature Physics, [64] ATLAS COLABORATION, Measurement of Higgs boson production in the diphoton decay channel in pp collisions at center-of-mass energies of 7 and 8 TeV with the ATLAS detector. Physical Review D 90, , [65] ATLAS COLABORATION, Measurement of Higgs boson production and couplings in the four-lepton channel in pp collisions at center-of-mass energies of 7 and 8 TeV with the ATLAS detector. Physical Review D 91, ,

143 Apêndice A Trabalhos Publicados Seguem abaixo os resumos dos trabalhos científicos publicados com os resultados encontrados da pesquisa, que fundamentou esta dissertação. Os trabalhos estão em ordem cronológica, iniciando pelo mais recente. A.1 Artigos em Congressos 1. Edmar Egidio, Eduardo Simas, Paulo C. M. A. Farias, José M. Seixas. Sistema Neural de Seleção Online de Eventos com Pré-Processamento Através da DWT. XI Congresso Brasileiro de Automática. Belo Horizonte - MG, Setembro de Resumo: Neste artigo foi proposto a utilização da Transformada Discreta de Wavelets (DWT) como etapa de pré-processamento aos sinais gerados em anéis. Foram estudas as diversas funções mãe wavelets, com o objetivo de verificar quais coeficientes do filtro passa baixas promoveria melhor desempenho no sistema de classificação. Foram também combinadas as técnicas de processamento estatístico de sinais (análise de componentes principais e análise de componentes independentes) em conjunto com a DWT. Os resultados encontrados mostram que o método proposto é obtêm melhor eficiência de discriminação em relação ao Neural Ringer. 119

144 2. Edmar Egidio, Fábio Batista, Diego Teles, Eduardo Simas, Paulo C. M. A. Farias, José M. Seixas. Sistema Neural Segmentado de Detecção Online Utilizando Pré-processamento Estatístico. XI Congresso Brasileiro de Automática. Belo Horizonte - MG, Setembro de Resumo: Neste trabalho foi proposto a utilização de classificadores segmentados em alternativamente ao Neural Ringer. Adicionalmente, técnicas de processamento estatístico de sinais (análise de componentes principais e análise de componentes independentes) foram utilizadas para reduzir a redundância entre as características de entrada, possibilitando uma eficiente compactação da informação. Resultados com base nos dados simulados indicam que o método proposto é capaz de alcançar uma maior eficiência de discriminação se comparado à configuração original. 3. Edmar Egidio, Fábio Batista, Eduardo Simas, P.C.M.A. Farias, José M. Seixas. Otimização do Sistema Neural de Seleção de Eventos num Detector de Partículas de Altas Energias. XI Congresso Brasileiro de Inteligencia Computacional. Ipojuca - PE, Setembro de Resumo: Este trabalho apresenta os resultados obtidos com a aplicação das técnicas de préprocessamento estatístico PCA e ICA ao sistema Neural Ringer. Foram utilizadas bases de dados simulados produzidas em Os resultados encontrados apresentaram vantagens na utilização do pré-processamento em relação a compactação dos sinais, redução de ruído e aumento na probabilidade de detecção de elétrons, a partir de informações de calorimetria do ATLAS. 120

145 A.2 Resumo em Encontro: Edmar Egidio, Fábio Batista, Eduardo Simas, P.C.M.A. Farias, José M. Seixas. Efeitos do Pré-Processamento Estatístico para o Sistema Neural de Filtragem Online do ATLAS. Encontro de Físicos do Norte Nordeste, Salvador-BA, Novembro de Resumo: Neste resumo foram apresentados os resultados das análises iniciais da pesquisa, com base na aplicação de pré-processamento ao sistema Neural Ringer. Foram apresentadas as melhorias encontradas com a aplicação da proposta, na probabilidade de detecção de elétrons em função da energia das partículas e da posição de interação no detector. 121

146 Apêndice B Conceitos Teóricos Sobre Redes Neurais e Processamento Estatístico de Sinais B.1 Classificadores Neurais As redes neurais artificiais (RNAs) são sistemas computacionais distribuídos compostos de unidades de processamento simples e interconectadas [22]. As unidade são dispostas em uma ou mais camadas interligadas por um grande número de conexões, geralmente unidirecionais. Na maioria das arquiteturas, essas conexões, que simulam as sinapses biológicas, possuem pesos associados, que ponderam a entrada recebida por cada neurônio da rede. Os pesos podem assumir valores positivos ou negativos, dependendo de o comportamento da conexão ser excitatório ou inibitório, respectivamente [24]. Os pesos têm seus valores ajustados em um processo de aprendizado e codificam o conhecimento adquirido pela rede. Uma RNA é portanto caracterizada por dois aspectos básicos: arquitetura e aprendizado. Enquanto que a arquitetura está relacionada ao tipo e número de unidades de processamento e a forma com que os neurônios estão conectados, o aprendizado diz respeito as regras utilizadas para o ajuste dos pesos da rede e que informação é usada pelas regras [22]. O neurônio é a unidade de processamento fundamental de uma RNA [47]. Cada terminal de entrada do neurônio, simulam os dentritos do neurônio biológico, rece- 122

147 bem um valor. Os valores recebidos são ponderados e combinados por uma função matemática fa, equivalendo ao processo de soma. A saída da função é a resposta do neurônio para a entrada, várias funções diferentes podem ser utilizadas. Em uma RNA os neurônios podem estar dispostos em uma ou mais camadas. Quando duas ou mais camadas são utilizadas, um neurônio pode receber em seus terminais de entrada valores de saída de neurônios da camada anterior e/ou enviar seu valor de saída para terminais de entrada de neurônios da camada seguinte. Redes Perceptron Multicamadas A primeira RNA a ser implementada foi a rede perceptron, que consiste numa rede com apenas uma camada de neurônios. A rede perceptron é treinada por um algoritmo supervisionado de correção de erros e usa a função de ativação do tipo limiar. Durante o seu treinamento, para um objeto x i os pesos são ajustados de acordo com a equação a seguir: w j (t + 1) = w j (t) + ηx i (yi f(x i )) (B.1) em que w j (t) é o peso da j-ésima conexão de entrada no instante de tempo t, η é uma taxa de aprendizado, x j i é o valor do j -ésimo atributo do vetor de entrada X i, f(x i ) é a saída produzida pela rede no instante de tempo t e y i é a saída desejada para a rede (o rótulo de X i ). As redes do tipo perceptron multicamadas (MLP, do inglês multilayer perceptron) apresentam uma ou mais camadas intermediárias de neurônios e uma camada de saída. A arquitetura mais comum é a completamente conectada, de forma que os neurônios de uma cada i estão conectados a todos os neurônios da camada i + 1. Numa MLP a função implementada por um neurônio de uma dada camada é a combinação das funções realizadas pelos neurônios da camada anterior que estão conectadas a ele. O algoritmo utilizado para efetuar o treinamento da RNA, foi o back-propagation. O algoritmo é constituído de duas fases, uma fase para frente (forward), e uma fase para trás (backward). Na fase forward cada sinal de entrada é apresentado a rede [24]. O sinal é primeiramente recebido por cada um dos neurônios da primeira 123

148 Figura B.1: Rede Neural do tipo MLP, completamente conectada. camada intermediária da rede, quando é ponderado pelo peso associado a suas conexões de entrada correspondentes. Cada neurônio nessa camada aplica a função de ativação a sua entrada total e produz um valor de saída, que é usado como valor de entrada pelos neurônios da camada seguinte. Esse processo continua até que os neurônios da camada de saída indica o erro cometido pela rede para o objeto apresentado. O valor do erro de cada neurônio da camada de saída é então usado na fase backward, para ajustar seus pesos de entrada [22]. O ajuste prossegue da camada de saída até a primeira camada intermediária. O ajuste dos pesos é realizado com a operação da equação a seguir: w j (t + 1) = w j l(t) + ηx j δ l (B.2) no qual w j (t) é o peso entre o neurônio l e o j-ésimo atributo de entrada ou a saída do j-ésimo neurônio da camada anterior, δ l indica o erro associado ao l-ésimo neurônio e x j indica a entrada recebida por esse neurônio. A função de ativação usada em cada neurônio foi a tangente hiperbólica. Os ciclos de apresentação dos dados de treinamento e eventuais ajustes de pesos no back-propagation são iterados até que seja atingido algum critério de parada. Diferentes critérios de parada podem ser utilizados, como por exemplo, um número máximo de ciclos ou uma taxa máxima de erro [24]. 124

ESTUDOS DO MODELO PADRÃO NO EXPERIMENTO LHCb. Murilo Rangel

ESTUDOS DO MODELO PADRÃO NO EXPERIMENTO LHCb. Murilo Rangel ESTUDOS DO MODELO PADRÃO NO EXPERIMENTO LHCb Murilo Rangel Fundamental Elementar Indivisível Século IV a.c. 2 Idade Média 3 Física Previsão Compreensão Descrição Século XVIII 4 Unificação Uma Teoria Século

Leia mais

Otimização do Sistema Neural de Seleção Online de Eventos num Detector de Partículas através do Processamento Estatístico de Sinais

Otimização do Sistema Neural de Seleção Online de Eventos num Detector de Partículas através do Processamento Estatístico de Sinais Otimização do Sistema Neural de Seleção Online de Eventos num Detector de Partículas através do Processamento Estatístico de Sinais Edmar E. P. Souza, Eduardo F. Simas Filho, P. C. M. A. Farias Laboratório

Leia mais

Discriminação Neural de Elétrons no Segundo Nível de Trigger do ATLAS

Discriminação Neural de Elétrons no Segundo Nível de Trigger do ATLAS XXVI ENFPC/O274 1 Discriminação Neural de Elétrons no Segundo Nível de Trigger do ATLAS A. dos Anjos, R. C. Torres, B. C. Ferreira, T. C. Xavier, and J. M. de Seixas Laboratório de Processamento de Sinais/COPPE/EP/Universidade

Leia mais

Partículas e Campos. Panoramas da Física

Partículas e Campos. Panoramas da Física Partículas e Campos Panoramas da Física Programa - Física de partículas, teoria de campos e além. - Interações fundamentais e o modelo padrão. - Interações eletromagnéticas. - Interações fracas e o Higgs.

Leia mais

www.fisicanaveia.com.br dulcidio@fisicamoderna.com.br www.twitter.com/dulcidio www.facebook.com/dulcidiobrazjr www.cern.ch [A] Lugar mais frio da galáxia (- 71 o C) [B] Um dos lugares mais quentes no Universo

Leia mais

ANÁLISE NÃO-LINEAR DE COMPONENTES INDEPENDENTES PARA UMA FILTRAGEM ONLINE BASEADA EM CALORIMETRIA DE ALTA ENERGIA E COM FINA SEGMENTAÇÃO

ANÁLISE NÃO-LINEAR DE COMPONENTES INDEPENDENTES PARA UMA FILTRAGEM ONLINE BASEADA EM CALORIMETRIA DE ALTA ENERGIA E COM FINA SEGMENTAÇÃO COPPE/UFRJ ANÁLISE NÃO-LINEAR DE COMPONENTES INDEPENDENTES PARA UMA FILTRAGEM ONLINE BASEADA EM CALORIMETRIA DE ALTA ENERGIA E COM FINA SEGMENTAÇÃO Eduardo Furtado de Simas Filho Tese de Doutorado apresentada

Leia mais

A Partícula Elementar. Ricardo D Elia Matheus

A Partícula Elementar. Ricardo D Elia Matheus A Partícula Elementar Ricardo D Elia Matheus Dentro das Coisas Átomos? Uma tabela para os Átomos Além do átomo http://htwins.net/scale2/ http://htwins.net/scale2/lang.html http://htwins.net/scale2/ Dentro

Leia mais

A teoria de quase tudo. Gláuber Carvalho Dorsch

A teoria de quase tudo. Gláuber Carvalho Dorsch A teoria de quase tudo Gláuber Carvalho Dorsch Parque Botânico da Vale 10 de Março de 2019 O Modelo Padrão da Física de Partículas: Uma teoria de quase tudo O Modelo Padrão da Física de Partículas: Uma

Leia mais

Estudo da Produção do Boson de Higgs no LHCb. Nina O Neill - UFRJ - Bolsista faperj Professor Orientador: Murilo Rangel

Estudo da Produção do Boson de Higgs no LHCb. Nina O Neill - UFRJ - Bolsista faperj Professor Orientador: Murilo Rangel Estudo da Produção do Boson de Higgs no LHCb Nina O Neill - UFRJ - Bolsista faperj Professor Orientador: Murilo Rangel O LHC 2 O Large Hadron Collider (LHC) é um gigantesco acelerador de partículas situado

Leia mais

Interna'onal Masterclasses

Interna'onal Masterclasses Interna'onal Masterclasses 10 th Edi'on 2014 Interna'onal Masterclasses hands on par'cle physics 2014 Edi'on Programa A Estrutura Elementar da Matéria Do que o mundo é feito: q As parbculas e suas interações

Leia mais

Introdução Altas Energias

Introdução Altas Energias Introdução à Física de Altas Energias São Paulo Regional Analysis Center Programa Introdução Uma visão geral das partículas e suas interações Aceleradores e Detectores Como explorar o interior da matéria

Leia mais

Partículas Elementares

Partículas Elementares Partículas Elementares Átomos consistem de elétrons que formam as camadas eletrônicas, e núcleos, compostos por prótons e nêutrons que, por sua vez,consistem de quarks ( dos tipos u e d, ou seja,up e down).

Leia mais

Léptons e Quarks: os constituintes básicos de todo o Universo

Léptons e Quarks: os constituintes básicos de todo o Universo Léptons e Quarks: os constituintes básicos de todo o Universo Vimos que, segundo o modelo de Bohr, os átomos são formados por elétrons que estão em órbita em torno de um núcleo que, por sua vez, é formado

Leia mais

Partículas Elementares

Partículas Elementares Partículas Elementares 1 Introdução Oscar J. P. Éboli Instituto de Física USP Há milhares de anos a humanidade pergunta-se quais são os blocos fundamentais que compõem toda a matéria e eventualmente o

Leia mais

Trigger de elétrons (primeiro e segundo níveis), calorimetria com multi-anodos

Trigger de elétrons (primeiro e segundo níveis), calorimetria com multi-anodos Werner Spolidoro Freund Instrumentação Cientifica em Física de Altas Energias no Brasil Trigger de elétrons (primeiro e segundo níveis), calorimetria com multi-anodos 11/08/2017 Sumário Introdução Motvação

Leia mais

Os fundamentos da Física Volume 3 1. Resumo do capítulo

Os fundamentos da Física Volume 3 1. Resumo do capítulo Os fundamentos da Física Volume 1 Capítulo 0 Física Nuclear AS FORÇAS FUNDAMENTAIS DA NATUREZA Força nuclear forte Mantém a coesão do núcleo atômico. Intensidade 10 8 vezes maior do que a força gravitacional.

Leia mais

Questionário de Revisão do Capítulo 1

Questionário de Revisão do Capítulo 1 Questionário de Revisão do Capítulo 1 1) Os elementos básicos da matéria que formam o nosso planeta são: a. Átomos e moléculas compostos por fótons, nêutrons e quarks. b. Átomos e moléculas compostos por

Leia mais

O COMEÇO DO UNIVERSO. O BIG-BANG Parte II

O COMEÇO DO UNIVERSO. O BIG-BANG Parte II O COMEÇO DO UNIVERSO O BIG-BANG Parte II RESUMO DA HISTÓRIA DO UNIVERSO Era da radiação Época Tempo Densidade Temperatura Característica principal (após o Big- Bang) (kg/m 3 ) (K) Planck 0-10 -43 s - 10

Leia mais

Química Básica: Profa. Alessandra Barone

Química Básica: Profa. Alessandra Barone Química Básica: Átomo Profa. Alessandra Barone www.profbio.com.br Átomo Fermions: formam a matéria Bósons: intermedeiam forças Quarks e leptons -Glúone fóton Partículas Quark up Quark down Quark charmoso

Leia mais

SISTEMA NEURAL PARA SELEÇÃO ONLINE DE EVENTOS COM PRÉ-PROCESSAMENTO ATRAVÉS DA DWT

SISTEMA NEURAL PARA SELEÇÃO ONLINE DE EVENTOS COM PRÉ-PROCESSAMENTO ATRAVÉS DA DWT SISTEMA NEURAL PARA SELEÇÃO ONLINE DE EVENTOS COM PRÉ-PROCESSAMENTO ATRAVÉS DA DWT Edmar E. P. de Souza, Eduardo F. S. Filho, P. C. M. A. Farias, José M. Seixas Universidade Federal da Bahia Laboratório

Leia mais

Masterclass - Aprendendo a Trabalhar com os Dados do LHC/CERN

Masterclass - Aprendendo a Trabalhar com os Dados do LHC/CERN Masterclass Manaus - AM LISHEP 2015 Masterclass - Aprendendo a Trabalhar com os Dados do LHC/CERN Marcia Begalli & Vitor Oguri Isabella Ferreira, Mariana Soeiro João Pedro G. Pinheiro IF-UERJ O Masterclass

Leia mais

REDUÇÃO DE DIMENSIONALIDADE NUM DETECTOR FINAMENTE SEGMENTADO UTILIZANDO A ANÁLISE DE COMPONENTES PRINCIPAIS NÃO-LINEARES

REDUÇÃO DE DIMENSIONALIDADE NUM DETECTOR FINAMENTE SEGMENTADO UTILIZANDO A ANÁLISE DE COMPONENTES PRINCIPAIS NÃO-LINEARES REDUÇÃO DE DIMENSIONALIDADE NUM DETECTOR FINAMENTE SEGMENTADO UTILIZANDO A ANÁLISE DE COMPONENTES PRINCIPAIS NÃO-LINEARES Danilo L de Souza, José Manoel Seixas Laboratório de Processamento de Sinais, COPPE/POLI

Leia mais

Disciplina: Processamento Estatístico de Sinais (ENGA83) - Aula 03 / Detecção de Sinais

Disciplina: Processamento Estatístico de Sinais (ENGA83) - Aula 03 / Detecção de Sinais Disciplina: Processamento Estatístico de Sinais (ENGA83) - Aula 03 / Detecção de Sinais Prof. Eduardo Simas (eduardo.simas@ufba.br) Programa de Pós-Graduação em Engenharia Elétrica/PPGEE Universidade Federal

Leia mais

Capítulo 38 Fótons e Ondas de Matéria Questões Múltipla escolha cap. 38 Fundamentos de Física Halliday Resnick Walker

Capítulo 38 Fótons e Ondas de Matéria Questões Múltipla escolha cap. 38 Fundamentos de Física Halliday Resnick Walker Capítulo 38 Fótons e Ondas de Matéria Questões Múltipla escolha cap. 38 Fundamentos de Física Halliday Resnick Walker 1) Qual é o nome das partículas associadas ao campo eletromagnético? a) Fônons. b)

Leia mais

Interação Radiação-Matéria p/ Física de Partículas. Thiago Tomei IFT-UNESP Março 2009

Interação Radiação-Matéria p/ Física de Partículas. Thiago Tomei IFT-UNESP Março 2009 Interação Radiação-Matéria p/ Física de Partículas Thiago Tomei IFT-UNESP Março 009 Sumário Definição de detecção. Interações fundamentais. Processos de interação. Processos eletromagnéticos. Excitação/ionização.

Leia mais

Aula 14. Partículas, e o início do Universo...

Aula 14. Partículas, e o início do Universo... Aula 14 Partículas, e o início do Universo... Partículas elementares Década de trinta, Átomo Novas partículas Prótons Nêutrons Elétrons Problema quase resolvido?? múon píon káon sigma... Partículas instáveis,com

Leia mais

A distância Sol-Terra para um observador fixo na Terra é L0 com velocidade v = 0,6c, essa distância é de 10

A distância Sol-Terra para um observador fixo na Terra é L0 com velocidade v = 0,6c, essa distância é de 10 1.Com relação à teoria da relatividade especial e aos modelos atômicos podemos afirmar que: ( ) A velocidade da luz no vácuo independe da velocidade da fonte de luz. ( ) As leis da física são as mesmas

Leia mais

UNIVERSIDADE FEDERAL DO RIO DE JANEIRO ESCOLA POLITÉCNICA

UNIVERSIDADE FEDERAL DO RIO DE JANEIRO ESCOLA POLITÉCNICA UNIVERSIDADE FEDERAL DO RIO DE JANEIRO ESCOLA POLITÉCNICA DEPARTAMENTO DE ELETRÔNICA E DE COMPUTAÇÃO DISCRIMINADORES NEURAIS DE PARTÍCULAS PARA UM DETECTOR SUBMETIDO A UMA ALTA TAXA DE EVENTOS Autor: Thiago

Leia mais

Física de Partículas 1: Os constituintes da matéria

Física de Partículas 1: Os constituintes da matéria Física de Partículas 1: Os constituintes da matéria Foto CERN L. Peralta O Big Bang Física de Partículas As diferentes escalas Uma equação para o electrão A equação de Dirac admite 2 tipos de soluções

Leia mais

Física IV para Engenharia Elétrica. 2º Semestre de Instituto de Física - Universidade de São Paulo

Física IV para Engenharia Elétrica. 2º Semestre de Instituto de Física - Universidade de São Paulo 1 Física IV para Engenharia Elétrica 2º Semestre de 2014 Instituto de Física - Universidade de São Paulo Professor: Valdir Guimarães E-mail: valdirg@if.usp.br Aula 10 Física das Partículas elementares

Leia mais

Física de Partículas

Física de Partículas Física de Partículas 24 a aula (2ª Parte) Física IV - Eng.Elétrica 2014 Professor Alvaro Vannucci Vimos na última aula... Mais de 300 novas partículas foram descobertas nas últimas décadas, sendo a grande

Leia mais

Visitas Virtuais ao experimento ATLAS. Denis Oliveira Damazio

Visitas Virtuais ao experimento ATLAS. Denis Oliveira Damazio Visitas Virtuais ao experimento ATLAS Denis Oliveira Damazio Fazer visitas reais ao CERN Não é muito caro. vindo da Europa Não exige longos períodos longe de trabalho/ escola. Facilidade de meios de transporte

Leia mais

Olhando além: em busca de dimensões extras

Olhando além: em busca de dimensões extras Olhando além: em busca de dimensões extras Seminários de Grupo 1 Introdução 2 Dimensões Extras 3 Procurando nos experimentos 4 Resultados e Cálculos futuros 5 Sumário e Perspectivas A motivação Estudo

Leia mais

Detecção de um decaimento raro em CMS

Detecção de um decaimento raro em CMS Detecção de um decaimento raro em CMS Colaboração CMS, CERN 19 Julho 2013 CMS detectou um importante e raro decaimento previsto pelo Modelo Padrão da física de partículas. A medida do decaimento de mesões

Leia mais

interação forte (no interior dos núcleos) não depende das massas nem das cargas elétricas

interação forte (no interior dos núcleos) não depende das massas nem das cargas elétricas Vitor Oguri prótons e nêutrons - mesmo spin ( J = ½ ) interação forte (no interior dos núcleos) não depende das massas nem das cargas elétricas prótons e nêutrons, genericamente conhecidos como núcleons,

Leia mais

Máquinas de Aprendizado Extremo para Classificação Online de Eventos no detector ATLAS

Máquinas de Aprendizado Extremo para Classificação Online de Eventos no detector ATLAS XXXV SIMPÓSIO BRASILEIRO DE TELECOMUNICAÇÕES E PROCESSAMENTO DE SINAIS - SBrT217, 3-6 DE SETEMBRO DE 217, SÃO PEDRO, SP Máquinas de Aprendizado Extremo para Classificação Online de Eventos no detector

Leia mais

O COMEÇO DO UNIVERSO. O BIG-BANG Parte I

O COMEÇO DO UNIVERSO. O BIG-BANG Parte I O COMEÇO DO UNIVERSO O BIG-BANG Parte I A RADIAÇÃO CÓSMICA DE FUNDO Como podemos observar o universo a distâncias bem maiores do que o mais distante quasar detectado?! Resposta: através de um experimento

Leia mais

Theory Portugues BR (Brazil) Por favor, leia as instruções gerais que se encontram no envelope separado antes de iniciar este problema.

Theory Portugues BR (Brazil) Por favor, leia as instruções gerais que se encontram no envelope separado antes de iniciar este problema. Q3-1 LHC - Grande Colisor de Hádrons (10 pontos). Por favor, leia as instruções gerais que se encontram no envelope separado antes de iniciar este problema. Neste problema, iremos estudar a física do acelerador

Leia mais

Química Básica: Átomo. Profa. Alessandra Barone

Química Básica: Átomo. Profa. Alessandra Barone Química Básica: Átomo Profa. Alessandra Barone www.profbio.com.br Átomo Fermions: formam a matéria Bósons: intermedeiam forças Quarks e leptons - Glúon e fóton Partículas Quark up Quark down Quark charmoso

Leia mais

Descoberta do núcleo. Forças nucleares. Nuclídeos experimento de Rutherford Núcleo pequeno e positivo

Descoberta do núcleo. Forças nucleares. Nuclídeos experimento de Rutherford Núcleo pequeno e positivo Descoberta do núcleo 1911- experimento de Rutherford Núcleo pequeno e positivo Raio nuclear: fentometro (1 fm = 10-15 m) Razão entre os raios (r): r núcleo / r átomo = 10-4 Forças nucleares Prótons muito

Leia mais

3 Chuveiros Extensivos de Ar

3 Chuveiros Extensivos de Ar 3 Chuveiros Extensivos de Ar Chuveiros extensivos de ar são cascatas de partículas que se propagam pela atmosfera. Elas são geradas pela interação dos raios cósmicos primários de alta energia com as moléculas

Leia mais

Disciplina: Processamento Estatístico de Sinais (ENGA83) - Aula 05 / Detecção Binária Baseada em

Disciplina: Processamento Estatístico de Sinais (ENGA83) - Aula 05 / Detecção Binária Baseada em Disciplina: Processamento Estatístico de Sinais (ENGA83) - Aula 05 / Detecção Binária Baseada em Múltiplas Observações e Detecção com Múltiplas Hipóteses Prof. Eduardo Simas (eduardo.simas@ufba.br) Programa

Leia mais

INTRODUÇÃO A FÍSCA DE PARTÍCULAS ELEMENTARES Autores: Michele Soares Silva 1 ; Edison Tadeu Franco 2 1

INTRODUÇÃO A FÍSCA DE PARTÍCULAS ELEMENTARES Autores: Michele Soares Silva 1 ; Edison Tadeu Franco 2 1 RESUMO 25 a 28 de novembro de 2014 Câmpus de Palmas INTRODUÇÃO A FÍSCA DE PARTÍCULAS ELEMENTARES Autores: Michele Soares Silva 1 ; Edison Tadeu Franco 2 1 Aluna do Curso de Licenciatura em Física; Campus

Leia mais

O Modelo-Padrão, Além. Sua Influência nos Processos EMs. (EMs no Século XXI) J. A. Helayël-Neto CBPF GFT JLL PVNC

O Modelo-Padrão, Além. Sua Influência nos Processos EMs. (EMs no Século XXI) J. A. Helayël-Neto CBPF GFT JLL PVNC O Modelo-Padrão, Além e Sua Influência nos Processos EMs (EMs no Século XXI) J. A. Helayël-Neto CBPF GFT JLL PVNC #1. Interações Fundamentais O que são as Interações Fundamentais : Gravitação Eletrofraca

Leia mais

Universidade Federal de Juiz de Fora. Programa de Pós-Graduação em Engenharia Elétrica. Mestrado em Engenharia Elétrica

Universidade Federal de Juiz de Fora. Programa de Pós-Graduação em Engenharia Elétrica. Mestrado em Engenharia Elétrica Universidade Federal de Juiz de Fora Programa de Pós-Graduação em Engenharia Elétrica Mestrado em Engenharia Elétrica Cândida Aparecida Delgado Meneghin ESTUDO DOS ALGORITMOS DE CLASSIFICAÇÃO DE ELÉTRONS

Leia mais

AULA 01 TEORIA ATÔMICA COMPLETA

AULA 01 TEORIA ATÔMICA COMPLETA AULA 01 TEORIA ATÔMICA COMPLETA - ESTRUTURA ATÔMICA; - MODELOS ATÔMICOS; - ESPECTROSCOPIA ATÔMICA; - PROPRIEDADES ONDULATÓRIAS DOS ELÉTRONS; - NÚMEROS QUÂNTICOS E DISTRIBUIÇÃO ELETRÔNICA. QUÍMICA estudo

Leia mais

Universidade Federal do Rio de Janeiro. Escola Politécnica. Departamento de Eletrônica e de Computação

Universidade Federal do Rio de Janeiro. Escola Politécnica. Departamento de Eletrônica e de Computação Universidade Federal do Rio de Janeiro Escola Politécnica Departamento de Eletrônica e de Computação Validação do Sistema de Filtragem Online de um Detector de Partículas de Altas Energias Autor: Orientador:

Leia mais

MONITORAÇÃO ONLINE E PROCESSAMENTO DISTRIBUÍDO PARA UM AMBIENTE COM ALTA TAXA DE EVENTOS E FINA SEGMENTAÇÃO. Herman Pessoa Lima Júnior

MONITORAÇÃO ONLINE E PROCESSAMENTO DISTRIBUÍDO PARA UM AMBIENTE COM ALTA TAXA DE EVENTOS E FINA SEGMENTAÇÃO. Herman Pessoa Lima Júnior MONITORAÇÃO ONLINE E PROCESSAMENTO DISTRIBUÍDO PARA UM AMBIENTE COM ALTA TAXA DE EVENTOS E FINA SEGMENTAÇÃO Herman Pessoa Lima Júnior TESE SUBMETIDA AO CORPO DOCENTE DA COORDENAÇÃO DOS PROGRAMAS DE PÓS-GRADUAÇÃO

Leia mais

GRAVITAÇÃO E TEORIAS DE GAUGE

GRAVITAÇÃO E TEORIAS DE GAUGE GRAVITAÇÃO E TEORIAS DE GAUGE Victor O. Rivelles rivelles@fma.if.usp.br Instituto de Física Universidade de São Paulo O LHC O LHC é um acelerador de partículas dedicado. Projetado para detectar o Higgs

Leia mais

Apostila de Química 11 Atomística

Apostila de Química 11 Atomística Apostila de Química 11 Atomística 1.0 Filósofos Leucipo e Demócrito, Grécia 400 a.c. A matéria é formada por pequenas partículas que sempre existiram e que seriam indestrutíveis, os átomos. Esses filósofos

Leia mais

Teorias de Unificação

Teorias de Unificação Teorias de Unificação Sérgio Mittmann dos Santos Oficina de Astronomia UNISINOS Março de 2004 Sumário Introdução Partículas fundamentais As 4 interações fundamentais da natureza General Theory of Relativity

Leia mais

Interações fundamentais da natureza

Interações fundamentais da natureza Interações fundamentais da natureza Segundo o entendimento científico atual, todos os fenômenos físicos observados, da colisão de galáxias à interação entre os constituintes de um próton, são originados

Leia mais

O LADO ESCURO DO UNIVERSO. Pedro Abreu LIP/IST, Lisboa Escola de Profs no CERN em Língua Portuguesa 2013

O LADO ESCURO DO UNIVERSO. Pedro Abreu LIP/IST, Lisboa Escola de Profs no CERN em Língua Portuguesa 2013 O LADO ESCURO DO UNIVERSO Pedro Abreu LIP/IST, Lisboa Escola de Profs no CERN em Língua Portuguesa 2013 (Heinrich Wilhelm Olbers, 1823) Universo Porque é que o Universo é escuro? E porque era isto um paradoxo?

Leia mais

O que é o desbalanço de Matéria e Anti-matéria no Universo? Ignacio Bediaga Centro Brasileiro de Pesquisas Físicas

O que é o desbalanço de Matéria e Anti-matéria no Universo? Ignacio Bediaga Centro Brasileiro de Pesquisas Físicas O que é o desbalanço de Matéria e Anti-matéria no Universo? Ignacio Bediaga Centro Brasileiro de Pesquisas Físicas "Do que a matéria é feita?" O Átomo dinâmico do Séc XX Partículas alfa Rutherford: Átomo

Leia mais

Das partículas às estrelas. Evaldo M. F. Curado Centro Brasileiro de Pesquisas Físicas

Das partículas às estrelas. Evaldo M. F. Curado Centro Brasileiro de Pesquisas Físicas Das partículas às estrelas Evaldo M. F. Curado Centro Brasileiro de Pesquisas Físicas resumo natureza - física ordens de magnitude partículas - átomos fenômenos curiosos -> partícula-onda objetos macroscópicos

Leia mais

Big Science e a formação do modelo de partículas elementares

Big Science e a formação do modelo de partículas elementares www.scientiaplena.org.br VOL. 13, NUM. 01 2017 doi: 10.14808/sci.plena.2017.012724 Big Science e a formação do modelo de partículas elementares Big Science and formation elementary particles model R.C.

Leia mais

Tabela 4.1: Resumo com as condições de rodada do LHC para 2010.

Tabela 4.1: Resumo com as condições de rodada do LHC para 2010. 4 O Experimento LHCb Para estudar as interações fundamentais das partículas, criar partículas mais massivas bem como os estados de antimatéria, é preciso recriar algumas condições energéticas que existiam

Leia mais

Átomo nosso de cada dia: os átomos de núcleos estáveis e os de núcleos instáveis. Profa. Kátia Aquino

Átomo nosso de cada dia: os átomos de núcleos estáveis e os de núcleos instáveis. Profa. Kátia Aquino Átomo nosso de cada dia: os átomos de núcleos estáveis e os de núcleos instáveis Profa. Kátia Aquino Resumo da evolução do modelo atômico (fonte:www.cjtmidia.com/quimicavançada/ano1/10.html) 2 Modelo padrão

Leia mais

J.M. Seixas COPPE/Poli - UFRJ. O Impacto da Inteligência Artificial e Robótica no Futuro do Emprego e Trabalho 30 de outubro, 2017

J.M. Seixas COPPE/Poli - UFRJ. O Impacto da Inteligência Artificial e Robótica no Futuro do Emprego e Trabalho 30 de outubro, 2017 J.M. Seixas COPPE/Poli - UFRJ O Impacto da Inteligência Artificial e Robótica no Futuro do Emprego e Trabalho 30 de outubro, 2017 Aplicações: Energia (Smart-cities, Monitoração não-invasiva de carga elétrica,

Leia mais

Estrutura da Matéria Prof. José Antonio Souza

Estrutura da Matéria Prof. José Antonio Souza Estrutura da Matéria Prof. José Antonio Souza Aula 1 Estrutura do Universo Interações fundamentais O Universo geocentrismo vs heliocentrismo Nicolau Copérnico Tycho Brahe Galileu e Galilei Ptolomeu afirmava

Leia mais

Introdução às interações de partículas carregadas Parte 1. FÍSICA DAS RADIAÇÕES I Paulo R. Costa

Introdução às interações de partículas carregadas Parte 1. FÍSICA DAS RADIAÇÕES I Paulo R. Costa Introdução às interações de partículas carregadas Parte 1 FÍSICA DAS RADIAÇÕES I Paulo R. Costa Sumário Introdução Radiação diretamente ionizante Partículas carregadas rápidas pesadas Partículas carregadas

Leia mais

Ronald Cintra Shellard CBPF

Ronald Cintra Shellard CBPF Ronald Cintra Shellard CBPF Paradoxo: Quanto mais sabemos, mais extensa é nossa ignorância Arnold Zukerfeld CMS ATLAS Em 2312 a descoberta do Higgs será lembrada como evento marcante em um período terrível!

Leia mais

Sumário. núcleons propriedades dos núcleos modelos nucleares energia de ligação

Sumário. núcleons propriedades dos núcleos modelos nucleares energia de ligação 9. O núcleo atômico Sumário núcleons propriedades dos núcleos modelos nucleares energia de ligação Experiência de Geiger-Marsden (1911) descoberta do núcleo atômico espalhamento de partículas alfa por

Leia mais

ENXERGANDO O NÚCLEO ATÔMICO

ENXERGANDO O NÚCLEO ATÔMICO ENXERGANDO O NÚCLEO ATÔMICO José Ricardo Marinelli Depto. de Física UFSC Florianópolis SC Uma pergunta que comumente ocorre a um estudante ou mesmo qualquer pessoa que se interesse em aprender alguma coisa

Leia mais

Laboratório Física Geral

Laboratório Física Geral Laboratório Física Geral 1 Apresentação Professora Helena Malbouisson Graduação UFRJ Doutorado UERJ - Fermilab Pós doutorado Universidade de Nebraska - CERN Trabalho de pesquisa atual: Busca por Supersimetria

Leia mais

FORMAÇÃO DE ELEMENTOS QUÍMICOS NO UNIVERSO

FORMAÇÃO DE ELEMENTOS QUÍMICOS NO UNIVERSO FORMAÇÃO DE ELEMENTOS QUÍMICOS NO UNIVERSO Eder Cassola Molina Universidade de São Paulo Instituto de Astronomia, Geofísica e Ciências Atmosféricas Departamento de Geofísica Elementos Químicos número atômico

Leia mais

Leis de Biot-Savart e de Ampère

Leis de Biot-Savart e de Ampère Leis de Biot-Savart e de Ampère 1 Vimos que uma carga elétrica cria um campo elétrico e que este campo exerce força sobre uma outra carga. Também vimos que um campo magnético exerce força sobre uma carga

Leia mais

Do que é constituída a Matéria?

Do que é constituída a Matéria? Escola Almirante Barroso, Vitória, 20 de Setembro de 2017 A diversidade Pedras e folhas Existe uma imensa diversidade de manifestações da matéria na natureza. A diversidade Pedras e folhas A diversidade

Leia mais

GRAVITAÇÃO QUÂNTICA. Victor O. Rivelles. Instituto de Física Universidade de São Paulo. IFSC-20/04/04 p.

GRAVITAÇÃO QUÂNTICA. Victor O. Rivelles. Instituto de Física Universidade de São Paulo. IFSC-20/04/04 p. IFSC-20/04/04 p.1/30 GRAVITAÇÃO QUÂNTICA Victor O. Rivelles rivelles@fma.if.usp.br Instituto de Física Universidade de São Paulo IFSC-20/04/04 p.2/30 ROTEIRO Gravitação Teoria Quântica de Campos Modêlo

Leia mais

O Big Bang e a Evolução do Universo

O Big Bang e a Evolução do Universo FSC1057: Introdução à Astrofísica O Big Bang e a Evolução do Universo Rogemar A. Riffel Modelos do Universo Universo estacionário (imutável no tempo). Herman Bondi (1919-2005), Thomas Gold (1920-2004)

Leia mais

UNIVERSIDADE FEDERAL DA BAHIA. Linton Thiago Costa Esteves

UNIVERSIDADE FEDERAL DA BAHIA. Linton Thiago Costa Esteves UNIVERSIDADE FEDERAL DA BAHIA ESCOLA POLITÉCNICA PROGRAMA DE PÓS-GRADUAÇÃO EM ENGENHARIA ELÉTRICA Linton Thiago Costa Esteves MÓDULO DE CONTROLE E ENCAPSULAMENTO DE INFORMAÇÕES PARA UM SISTEMA DIGITAL

Leia mais

Física D Extensivo V. 8

Física D Extensivo V. 8 Física D Extensivo V. 8 Exercícios 0) C f R X > f WZ 0) B 03) E 04) E raios X > luz Raios X são radiações eletromagnéticas com um comprimento de onda muito curto, aproximadamente de 0,06 até 0 Å. Formam-se

Leia mais

Energia certa significa: quando a energia do fóton corresponde à diferença nos níveis de energia entre as duas órbitas permitidas do átomo de H.

Energia certa significa: quando a energia do fóton corresponde à diferença nos níveis de energia entre as duas órbitas permitidas do átomo de H. ESPECTROSCOPIA II A relação da luz com as linhas espectrais O que acontece se átomos de H forem bombardeados por fótons? R. Existem três possibilidades: 1) a maioria dos fótons passa sem nenhuma interação

Leia mais

O Bóson de Brout- Englert-Higgs

O Bóson de Brout- Englert-Higgs O Bóson de Brout- Englert-Higgs Leandro de Paula leandro@if.ufrj.br Mestrado Profissional de Ensino de Física 15 de abril de 2014 Plano das Apresentação Introdução Simetrias e leis de conservação O Modelo

Leia mais

Química Geral -Aula 2 Átomo e estrutura atômica. *Mas afinal, de que são feitas as coisas?

Química Geral -Aula 2 Átomo e estrutura atômica. *Mas afinal, de que são feitas as coisas? Química Geral -Aula 2 Átomo e estrutura atômica *Mas afinal, de que são feitas as coisas? Átomo na Grécia antiga 2 teorias (Demócrito, Leucipo e Aristóteles) Demócrito, Leucipo e Aristóteles Átomo como

Leia mais

O Big Bang e a Evolução do Universo II

O Big Bang e a Evolução do Universo II Fundamentos de Astronomia e Astrofísica O Big Bang e a Evolução do Universo II Rogério Riffel http://astro.if.ufrgs.br Modelos do Universo Universo estacionário (imutável no tempo).herman Bondi (1919 2005),

Leia mais

Partículas Elementares (2015/2016)

Partículas Elementares (2015/2016) Partículas Elementares (2015/2016) Introdução Mário Pimenta, Jorge Romão, Ruben Conceição A Física de Partículas Ordens de grandeza Super-cordas? Partículas Núcleos Átomos células 1 Ano-luz Terra-Sol Terra

Leia mais

Cosmologia: o princípio e o fim

Cosmologia: o princípio e o fim Cosmologia: o princípio e o fim The biggest misunderstanding about Big-Bang is that it began as a lump of matter somewhere in the void space. It was not just matter that were created. So in the sense that

Leia mais

Espectro Eletromagnético. Professor Leonardo

Espectro Eletromagnético. Professor Leonardo Espectro Eletromagnético VÉSPERA- VERÃO 2010 EFEITO FOTO ELÉTRICO VÉSPERA- VERÃO 2010 VÉSPERA- VERÃO 2010 Efeito Fotoelétrico Problemas com a Física Clássica 1) O aumento da intensidade da radiação incidente

Leia mais

Aula-11. (quase) Tudo sobre os átomos

Aula-11. (quase) Tudo sobre os átomos Aula-11 (quase) Tudo sobre os átomos Algumas propriedades: Átomos são estáveis (quase sempre) Os átomos se combinam (como o fazem é descrito pela mecânica quântica) Os átomos podem ser agrupados em famílias

Leia mais

Teoria de Cordas e Supercordas. Henrique Boschi Filho Instituto de Física UFRJ

Teoria de Cordas e Supercordas. Henrique Boschi Filho Instituto de Física UFRJ Teoria de Cordas e Supercordas Henrique Boschi Filho Instituto de Física UFRJ III Encontro de Ciências do Universo, Núcleo de Pesquisas em Ciências, 4 de Julho de 2015 Ideia Central A hipótese central

Leia mais

Experimentos em Física de Altas Energias. probabilidades e distribuições método de Monte Carlo geração de eventos e cálculo de integrais

Experimentos em Física de Altas Energias. probabilidades e distribuições método de Monte Carlo geração de eventos e cálculo de integrais Vitor Oguri Experimentos em Física de Altas Energias caráter probabilístico convolução dos dados simulações de eventos Métodos estatísticos probabilidades e distribuições método de Monte Carlo geração

Leia mais

O COMEÇO DO UNIVERSO O BIG-BANG

O COMEÇO DO UNIVERSO O BIG-BANG O COMEÇO DO UNIVERSO O BIG-BANG ESTÁGIOS INICIAIS DO UNIVERSO No modelo padrão do Big-Bang, de acordo com as equações de Friedmann, os estágios iniciais do universo são caracterizados por condições de

Leia mais

Partículas, Forças e Aceleradores

Partículas, Forças e Aceleradores Partículas, Forças e Aceleradores Ignacio Bediaga Olimpi ada Brasileira de Fi sica 2017 https://www.facebook.com/renafae-1040734626012590/ O que sabemos da formação da matéria Universo. O que é um acelerador

Leia mais

Corrente Elétrica - ENEM - Fixação

Corrente Elétrica - ENEM - Fixação 1. (Uece 017) Uma corrente elétrica percorre um chuveiro elétrico construído com um resistor ôhmico. A corrente elétrica pode ser medida em unidades de a) ampères/segundo. b) volts/segundo. c) coulombs/segundo.

Leia mais

WORKSHOP RENAFAE Instrumentação Cientifica em Física de Altas Energias no Brasil (11/08/2017 ) NEUTRINOS ANGRA

WORKSHOP RENAFAE Instrumentação Cientifica em Física de Altas Energias no Brasil (11/08/2017 ) NEUTRINOS ANGRA WORKSHOP RENAFAE 2017 - Instrumentação Cientifica em Física de Altas Energias no Brasil (11/08/2017 ) NEUTRINOS ANGRA Situação atual, transferência para Angra II e perspectivas futuras Prof. Rafael Antunes

Leia mais

O bóson de Higgs e a massa das coisas

O bóson de Higgs e a massa das coisas O bóson de Higgs e a massa das coisas F.S. Navarra Instituto de Física Universidade de São Paulo navarra@if.usp.br Parte I O lado qualitativo O Modelo Padrão Portadores de força Matéria: quarks e leptons

Leia mais

Dosimetria e Proteção Radiológica

Dosimetria e Proteção Radiológica Dosimetria e Proteção Radiológica Prof. Dr. André L. C. Conceição Departamento Acadêmico de Física (DAFIS) Programa de Pós-Graduação em Engenharia Elétrica e Informática Industrial (CPGEI) Universidade

Leia mais

QUÍMICA I. Teoria atômica Capítulo 6. Aula 2

QUÍMICA I. Teoria atômica Capítulo 6. Aula 2 QUÍMICA I Teoria atômica Capítulo 6 Aula 2 Natureza ondulatória da luz A teoria atômica moderna surgiu a partir de estudos sobre a interação da radiação com a matéria. A radiação eletromagnética se movimenta

Leia mais

Vida e matéria. Aula de hoje

Vida e matéria. Aula de hoje Vida e matéria Aula de hoje Energia e matéria são constituintes essenciais do universo e dos seres vivos. A energia fornece força para manter as estruturas juntas ou separadas, e mover as coisas de um

Leia mais

Galáxias

Galáxias Galáxias http://astro.if.ufrgs.br/galax/index.htm Maria de Fátima Oliveira Saraiva Departamento de Astronomia - IF-UFRGS Via Láctea A Via Láctea não é mais do que um conjunto de inúmeras estrelas distribuídas

Leia mais

Thaisa Storchi Bergmann

Thaisa Storchi Bergmann Thaisa Storchi Bergmann Membro da Academia Brasileira de Ciências Prêmio L Oreal/UNESCO For Women in Science 2015 3/9/16 Thaisa Storchi Bergmann, Uma breve história do Universo, Parte I 1 Uma brevíssima

Leia mais

Arquitetura do Universo Nascimento e Estrutura do Universo

Arquitetura do Universo Nascimento e Estrutura do Universo Unidade 1 Arquitetura do Universo Nascimento e Estrutura do Universo s O Big Bang O Universo tem uma história! Uma história com cerca de 15 mil milhões de anos. Começou com o Big Bang, não tendo parado

Leia mais

Cap. 42 Física Nuclear

Cap. 42 Física Nuclear Radiação Fukushima (2011) Cap. 42 Física Nuclear A descoberta do núcleo. Propriedades do núcleo: Núcleons; Carta de nuclídeos; Raio; Massa; Energia de ligação; Força forte. Decaimento radioativo: Decaimento

Leia mais

Lista de Exercícios 5 Corrente elétrica e campo magnético

Lista de Exercícios 5 Corrente elétrica e campo magnético Lista de Exercícios 5 Corrente elétrica e campo magnético Exercícios Sugeridos (13/04/2010) A numeração corresponde ao Livros Textos A e B. A22.5 Um próton desloca-se com velocidade v = (2 î 4 ĵ + ˆk)

Leia mais

Relembrando as interações fundamentais

Relembrando as interações fundamentais Relembrando as interações fundamentais As interações fundamentais da Natureza atuam em diferentes objetos de acordo com suas cargas, cujo termo possui um significado mais amplo do que o da carga elétrica.

Leia mais

MÓDULO 1 FÍSICA, PARA QUE SERVE ISSO? PROF.EMERSON

MÓDULO 1 FÍSICA, PARA QUE SERVE ISSO? PROF.EMERSON MÓDULO 1 FÍSICA, PARA QUE SERVE ISSO? PROF.EMERSON INTRODUÇÃO À FÍSICA DEFINIÇÃO A FÍSICA é a ciência das coisas naturais, cujo objetivo é a formação de leis que regem os fenômenos da natureza, estudando

Leia mais

Fundamentos de Mineração de Dados

Fundamentos de Mineração de Dados Fundamentos de Mineração de Dados Prof. Ricardo Fernandes ricardo.asf@ufscar.br O que é Mineração de Dados? Uso de ferramentas matemáticas, clássicas ou inteligentes, no processo de descoberta de conhecimento

Leia mais

Formação de galáxias

Formação de galáxias Galáxias distantes Formação de grandes estruturas Hidrodinâmica e astrofísica do gás Cenário Monolítico e formação hierárquica Matéria escura fria e quente Formação de galáxias Formação de galáxias Gastão

Leia mais