SISTEMA NEURAL SEGMENTADO DE DETECÇÃO ONLINE DE ELÉTRONS UTILIZANDO PRÉ-PROCESSAMENTO ESTATÍSTICO



Documentos relacionados
Eduardo F. Simas F., José Manoel de Seixas, Luiz Pereira Calôba Laboratório de Processamento de Sinais, COPPE/Poli-UFRJ Rio de Janeiro-RJ,


FILTRAGEM ONLINE DE EVENTOS RAROS E/OU EXÓTICOS BASEADA EM DADOS DE CALORIMETRIA DE ALTA ENERGIA EM UM DETECTOR FINAMENTE SEGMENTADO

Laboratório de Processamento de Sinais (LPS), Escola Politécnica/COPPE, UFRJ 1. s: 2. Universidade de Wisconsin.

ESTUDOS SOBRE A IMPLEMENTAÇÃO ONLINE DE UMA TÉCNICA DE ESTIMAÇÃO DE ENERGIA NO CALORÍMETRO HADRÔNICO DO ATLAS

O Experimento CMS Parte 2/2

MLP (Multi Layer Perceptron)

Otimização do Sistema Neural de Seleção Online de Eventos num Detector de Partículas através do Processamento Estatístico de Sinais

3 Metodologia de Previsão de Padrões de Falha

3 Classificação Resumo do algoritmo proposto

Figura 5.1.Modelo não linear de um neurônio j da camada k+1. Fonte: HAYKIN, 2001

6 Construção de Cenários

Projeto de Redes Neurais e MATLAB

Matlab - Neural Networw Toolbox. Ana Lívia Soares Silva de Almeida

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

Redes Neurais Aplicadas na Separação de Partículas em Calorímetros Cintilantes

Multiplexador. Permitem que vários equipamentos compartilhem um único canal de comunicação

PALAVRAS-CHAVE: Massas Nodulares, Classificação de Padrões, Redes Multi- Layer Perceptron.

Redes Neurais Construtivas. Germano Crispim Vasconcelos Centro de Informática - UFPE

Análise de componentes independentes aplicada à avaliação de imagens radiográficas de sementes

UM CLASSIFICADOR NEURONAL COMPACTO E EFICIENTE COM CAPACIDADE DE IDENTIFICAR CONTAMINAÇÃO EM DADOS EXPERIMENTAIS

5 SIMULAÇÃO DE UM SISTEMA WDM DE DOIS CANAIS COM O SOFTWARE VPI

Modelos Pioneiros de Aprendizado

IW10. Rev.: 02. Especificações Técnicas

Aumento da Capacidade de Armazenamento do SPRACE

MODIFICAÇÃO DO TESTE DE NORMALIDADE DE SHAPIRO-WILK MULTIVARIADO DO SOFTWARE ESTATÍSTICO R

Faculdade de Engenharia Optimização. Prof. Doutor Engº Jorge Nhambiu

um experimento dedicado a estudar a composição de partículas primárias de raios cósmicos e interações hadrônicas de altas energias.

Capítulo 3. Avaliação de Desempenho. 3.1 Definição de Desempenho

O AMPLIFICADOR LOCK-IN

SISTEMA NEURAL PARA SELEÇÃO ONLINE DE EVENTOS COM PRÉ-PROCESSAMENTO ATRAVÉS DA DWT

Cálculo de volume de objetos utilizando câmeras RGB-D

Aprendizagem de Máquina

Módulo 4. Construindo uma solução OLAP

SEGMENTAÇÃO DE IMAGENS EM PLACAS AUTOMOTIVAS

Análise e visualização de dados utilizando redes neurais artificiais auto-organizáveis

Inteligência Artificial. Redes Neurais Artificiais

4 Segmentação Algoritmo proposto

SERVIÇO DE ANÁLISE DE REDES DE TELECOMUNICAÇÕES APLICABILIDADE PARA CALL-CENTERS VISÃO DA EMPRESA

ADM041 / EPR806 Sistemas de Informação

O tornado de projeto é admitido, para fins quantitativos, com as seguintes características [15]:

Disciplina: Introdução à Informática Profª Érica Barcelos

2. Função Produção/Operação/Valor Adicionado

5 Extraindo listas de produtos em sites de comércio eletrônico

Universidade Tecnológica Federal do Paraná UTFPR Programa de Pós-Graduação em Computação Aplicada Disciplina de Mineração de Dados

PÓS GRADUAÇÃO EM CIÊNCIAS DE FLORESTAS TROPICAIS-PG-CFT INSTITUTO NACIONAL DE PESQUISAS DA AMAZÔNIA-INPA. 09/abril de 2014

DESENVOLVIMENTO DE UM SOFTWARE NA LINGUAGEM R PARA CÁLCULO DE TAMANHOS DE AMOSTRAS NA ÁREA DE SAÚDE

Estudo do grande colisor de hádrons

Correlação Canônica. Outubro / Versão preliminar. Fabio Vessoni. fabio@mv2.com.br (011) MV2 Sistemas de Informação

ERP Enterprise Resource Planning

Revista Hispeci & Lema On Line ano III n.3 nov ISSN unifafibe.com.br/hispecielemaonline Centro Universitário UNIFAFIBE Bebedouro-SP

Quadro de consulta (solicitação do mestre)

4 Arquitetura básica de um analisador de elementos de redes

Sistema Banco de Preços Manual do Usuário OBSERVATÓRIO

UNICENTRO-CEDETEG Departamento de Física. Projeto de Ensino. Ensino de Física: O futuro da energia - A antimatéria

ORGANIZAÇÃO DE COMPUTADORES MÓDULO 10

5 Resultados. 1 Os resultados apresentados foram obtidos com 1 rodada do simulador.

Sistemas de Detecção de Intrusão SDI

5 A Utilização da Técnica do Espaço Nulo e dos Atributos Baseados na Escolha de Coeficientes de Autocorrelações

Protocolo em Rampa Manual de Referência Rápida

Universidade Federal do Paraná Departamento de Informática. Reconhecimento de Padrões. Revisão de Probabilidade e Estatística

Visualização Científica. Pedro de Botelho Marcos Março/2008. Núcleo de Computação Científica Tópicos Avançados em Computação II

3.4 O Princípio da Equipartição de Energia e a Capacidade Calorífica Molar

Experimento do DZero (CMS?) Pedro Mercadante (UNESP)

Sistema de Numeração e Conversão entre Sistemas. Prof. Rômulo Calado Pantaleão Camara. Carga Horária: 60h

SISTEMA DIGITAL PARA REDUÇÃO DO EMPILHAMENTO EM MEDIÇÕES DE ENERGIA NUM DETECTOR DE PARTÍCULAS

Avaliando o que foi Aprendido

3 Estratégia para o enriquecimento de informações

Curva ROC. George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE

Análise de Redes Sociais

Ivan Guilhon Mitoso Rocha. As grandezas fundamentais que serão adotadas por nós daqui em frente:

Considerações Finais. Capítulo Principais conclusões

RESUMO 2 - FÍSICA III

INSPEÇÃO BASEADA EM RISCO SEGUNDO API 581 APLICAÇÃO DO API-RBI SOFTWARE

2 Diagrama de Caso de Uso

Redes Neurais. Profa. Flavia Cristina Bernardini

3 Um Framework Orientado a Aspectos para Monitoramento e Análise de Processos de Negócio

5 Resultados Avaliação Baseada na Taxa de Igual Erro

Admistração de Redes de Computadores (ARC)

BCC202 - Estrutura de Dados I

Histogramas. 12 de Fevereiro de 2015

Universidade Federal de Pernambuco

Do neurônio biológico ao neurônio das redes neurais artificiais

UNIVERSIDADE FEDERAL DE SANTA CATARINA

PESQUISA OPERACIONAL: UMA ABORDAGEM À PROGRAMAÇÃO LINEAR. Rodolfo Cavalcante Pinheiro 1,3 Cleber Giugioli Carrasco 2,3 *

Comparação entre a Máscara de Nitidez Cúbica e o Laplaciano para Realce de Imagens Digitais

Reconhecimento de Padrões Utilizando Filtros Casados

Especificação técnica de Videodetecção ECD/DAI

Árvores Binárias de Busca

LEI DE OHM. Professor João Luiz Cesarino Ferreira. Conceitos fundamentais

2 Avaliação de desempenho de uma rede de telecomunicações

Funções de Posicionamento para Controle de Eixos

Sistemas Computacionais II Professor Frederico Sauer

Aula 2 RNA Arquiteturas e Treinamento

PROCESSO DE DESENVOLVIMENTO DE SOFTWARE. Modelos de Processo de Desenvolvimento de Software

1. Avaliação de impacto de programas sociais: por que, para que e quando fazer? (Cap. 1 do livro) 2. Estatística e Planilhas Eletrônicas 3.

Simulação Computacional de Sistemas, ou simplesmente Simulação

Filtros de sinais. Conhecendo os filtros de sinais.

Transcrição:

SISTEMA NEURAL SEGMENTADO DE DETECÇÃO ONLINE DE ELÉTRONS UTILIZANDO PRÉ-PROCESSAMENTO ESTATÍSTICO Diego C. Teles, Fabio Batista, Edmar E. P. de Souza, Eduardo F. Simas Filho, P. C. M. A. Farias, José M. de Seixas Universidade Federal da Bahia Laboratório de Sistemas Digitais - PPGEE/UFBA Salvador, Bahia, Brasil Universidade Federal do Rio de Janeiro Laboratório de Processamento de Sinais - COPPE/UFRJ Rio de Janeiro, Rio de Janeiro, Brasil Emails: diegocarlosteles@gmail.com, engfabiobatista@gmail.com, edmar.egidio@cern.ch, eduardo.simas@ufba.br, paulo.farias@ufba.br, seixas@lps.ufrj.br Abstract ATLAS is one of the main particle detectors of the LHC (Large Hadron Collider), located at CERN (European Center for Nuclear Research). In ATLAS the energy measurement is performed by the calorimeter system, which is composed of seven layers and more than 100,000 sensors. The energy deposition profiles measured at the calorimeter are very important for particle identification. Considering specifically the detection of electromagnetic particles (electrons and photons) at LHC, the background noise (composed mainly of hadronic jets) is produced at rates that are several orders of magnitude higher than the physics of interest. The Neural Ringer is an electromagnetic particle discriminator operating at ATLAS online selection (trigger) system. It comprises a topological (ring-like) processing of the calorimeter cells and a neural network classifier. In order to properly make use of the calorimeter segmentation, it is proposed in this article a segmented classification scheme. The information from each calorimeter layer was processed separately and used to feed neural classifiers (a total of seven classifiers were trained, one for each layer). The outputs from each layer-level classifier were used to feed another neural network (in a second classification stage), which combines the segmented features in order to produce the final decision. Statistical signal processing techniques (such as principal component analysis and independent component analysis) were applied to reduce the redundancy among the input features and allow efficient signal compaction. The experimental results indicates that the proposed method is able to achieve higher discrimination efficiency when compared to the original setup. Keywords Online filtering, particle physics, Neural Networks, ICA, PCA. Resumo O ATLAS é um dos principais detectores de partículas do acelerador LHC (Large Hadron Collider), localizado no CERN (Centro Europeu para Pesquisa Nuclear). No ATLAS a medição da energia das partículas geradas nas colisões, é realizada pelo seu sistema de calorimetria, composto por sete camadas sobrepostas e com mais de 100.000 sensores. O perfil de deposição de energia medido nos calorímetros é muito importante para a identificação das partículas incidentes. Considerando especificamente a detecção de partículas eletromagnéticas (elétrons e fótons) no LHC, o ruído de fundo (composto principalmente de jatos hadrônicos) é produzido em taxas que são muitas ordens de grandeza superiores às da física de interesse. O Neural Ringer é um discriminador de partículas eletromagnéticas que opera no sistema online de seleção de eventos (trigger) do ATLAS. Ele compreende um arranjo topológico (em forma de anéis) das células do calorímetro e um classificador baseado numa rede neural artificial. Com o objetivo de melhor explorar a segmentação da informação disponível nos calorímetros, é proposto nesse artigo uma arquitetura de classificação segmentada. A informação proveniente de cada camada do calorímetro é processada separadamente e utilizada para alimentar classificadores neurais (num total de sete, um para cada camada). As saídas de cada classificador segmentado são utilizadas para alimentar uma outra rede neural (formando um segundo estágio de classificação), que combina as características segmentadas para produzir a decisão final. Adicionalmente, técnicas de processamento estatístico de sinais (análise de componentes principais e análise de componentes independentes) foram utilizadas para reduzir a redundância entre as características de entrada, possibilitando uma eficiente compactação da informação. Resultados experimentais indicam que o método proposto é capaz de alcançar uma maior eficiência de discriminação se comparado à configuração original. Palavras-chave Filtragem online, física de partículas, Redes Neurais, ICA, PCA. 1 Introdução A busca pela compreensão dos fenômenos da natureza tem motivado a humanidade na criação de inúmeras teorias. Um dos temas que mais aguça a curiosidade do ser humano é a constituição fundamental da matéria. A Física de Altas Energias (High Energy Physics - HEP) lida com este problema e a validação dos modelos teóricos depende da comprovação experimental. Os experimentos de HEP usualmente envolvem o uso de aceleradores de partículas. O acelerador LHC (Large Hadron Collider) (Evans and Bryant, 2008), é o maior já construído, com 27 km de comprimento, e atingindo energia de até 14 TeV. O LHC conta com alguns detectores nos pontos de colisão, um dos principais é o ATLAS (A Toroidal LHC Aparatus) (Colaboration, 2008). O ATLAS foi projetado para ser um detector de uso geral, ou seja, possui capacidade de detectar diversos tipos de partículas. Para isso, o detector foi projetado no formato cilíndrico e conta com 2493

os seguintes subdetectores: detector de traços; calorímetro (medidor de energia altamente segmentado); e a câmara de múons (ver Figura 1). 2 Seleção Online de Eventos baseada em Calorimetria Calorímetros são projetados para medir os perfis de deposição de energia das partículas incidentes à medida que elas interagem com o material do detector (Koletsou, 2011). O calorímetro do Atlas é dividido em 7 camadas, 4 eletromagnéticas (PS, E1, E2, E3), e 3 hadrônicas (H0, H1, H2), cada uma com características distintas, na Figura 2 é possível ter uma visão geral da distribuição das camadas no calorímetro (Hernandez, 2013). Figura 1: Detector ATLAS e seus sub-detectores. Os perfis de deposição de energia medidos nos calorímetros são muito importantes para a detecção das assinaturas de interesse. A adequada identificação de partículas eletromagnéticas (elétrons e fótons) é fundamental para o desempenho geral do detector, pois elas estão envolvidas em diversos decaimentos de interesse. O LHC realiza a colisão de feixes de prótons, e neste caso, a geração de partículas conhecidas como jatos hadrônicos é muito intensa. Os jatos podem apresentar o perfil de deposição de energia semelhante ao de elétrons, dificultando a identificação destas partículas. Devido a alta taxa de eventos (que pode gerar até 60 TB de informação por segundo) o detector ATLAS utiliza um sistema de detecção online (trigger) que compreende três estágios sequenciais para adequada seleção das informações de interesse. O Neural Ringer é um discriminador de partículas eletromagnéticas que opera no segundo nível de trigger do ATLAS e combina o processamento topológico das informações medidas (a partir da formação de anéis concêntricos de sensores ao redor do ponto de colisão) com um classificador Neural MLP (Multi-layer perceptron). Este trabalho apresenta uma proposta de modificação no sistema de classificação utilizado no Neural Ringer a partir da utilização de classificadores específicos para cada camada do calorímetro. O objetivo é extrair características de cada segmento do detector e, assim, melhorar o desempenho do sistema de classificação. Adicionalmente, serão utilizadas técnicas de préprocessamento estatístico (análise de componentes independentes e análise de componentes principais) cujo objetivo é aumentar a eficiência dos classificadores, removendo o ruído de medição e a redundância de informação. Resultados obtidos com uma base de dados simulada são utilizados para mostrar a eficiência do método proposto. Figura 2: Distribuição das camadas no calorímetro do detector ATLAS (corte transversal). O sistema de seleção online (trigger) do detector ATLAS foi projetado para operar com severas restrições de tempo de processamento, pois a taxa de eventos considerados como ruído de fundo (não relevantes para o experimento) é muitas ordens de grandeza superior à dos eventos relevantes. O trigger do ATLAS conta com 3 níveis sequênciais (conforme descrito na Figura 3). O primeiro nível (L1- Level One), conta com o menor tempo de latência (da ordem de 2,5µs), e a maior taxa de filtragem. O processamento é feito em hardware de alta velocidade (utilizando FP- GAs). O L1 é responsável por informar ao segundo nível (L2 - Level Two), a localização de regiões do detector com grandes possibilidades de terem ocorrido eventos de interesse, regiões estas chamadas de RoI (Regions of Interest). Contando com o tempo maior de processamento (da ordem de 40ms), e implementado em software, o L2 processa as informações contidas nas RoIs informadas pelo L1. O terceiro nível (chamado EF - Event Filter), com o maior tempo de processamento ( 4s) utiliza toda a informação do evento para tomar a decisão final de aceitação ou rejeição da assinatura em análise 2494

Figura 3: Esquema do trigger online do ATLAS em três níveis de processamento sequenciais. 2.1 O discriminador Neural Ringer O Neural Ringer é um algoritmo de classificação projetado para a detecção de partículas eletromagnéticas (elétrons ou fótons) no L2 do ATLAS (dos Anjos et al., 2006). A sua proposta é fazer uma extração de características através de um arranjo topológico dos sinais medidos no calorímetro, com a construção de anéis concêntricos a partir do perfil de deposição de energia. Posteriormente, as informações dos anéis são processadas por uma rede neural artificial para a realização do teste de hipóteses, definindo assim a natureza da partícula. O teste de hipóteses é realizado por uma rede neural supervisionada na arquitetura Perceptron de Múltiplas Camadas (MLP - Multi-Layer Perceptron). O processo de anelamento consiste, primeiramente, na seleção das RoIs ao redor da célula mais energética de cada camada. Esta célula é então considerada como sendo o primeiro anel. As células ao redor do primeiro anel definem o segundo anel e assim sucessivamente (até cobrir toda a janela da RoI). A energia amostrada pelas células pertencentes a um dado anel é somada, produzindo o sinal de energia em anéis. Os vários sinais em anéis de cada camada são concatenados em um único vetor com 100 anéis, a Figura 4 mostra a formação de anéis de algumas camadas. É importante frisar que devido à diferença de granularidade entre as camadas, um numero diferente de anéis é gerado para cada camada. A Tabela 1 ilustra essa diferença. Tabela 1. Número de anéis por camada. Camadas PS E1 E2 E3 H0 H1 H2 Anéis 08 64 08 08 4 4 4 Antes da utilização nos sistemas de classifica- Figura 4: Exemplos da construção e concatenação dos anéis. ção, os sinais em anéis precisam ser normalizados. A normalização utilizada neste trabalho foi a divisão da energia de cada anel (E a i) pela energia total do evento: 100 E Ni = E ai / E ai (1) i=1 Essa normalização reduz a influência da energia de cada evento, mantendo assim a proporção de energia contida em cada anel. 3 Classificadores Segmentados Cada camada do calorímetro apresenta características próprias como os tipos de sensores utilizados e a granularidade das células. Conforme descrito, o Neural Ringer utiliza sem distinção as características de todas as camadas. Como as camadas são sobrepostas, e o evento que se desenvolve muitas vezes interage com diversas camadas, pode ocorrer redundância nas informações coletadas. A análise utilizando classificadores neurais segmentados (Torres et al., 2010) tem o objetivo de verificar quais camadas possuem características mais importantes ao processo de classificação, ou seja, é possível fazer combinações de algumas camadas, as mais relevantes, e ainda assim conseguir resultados próximos aos dos classificadores que utilizam todas as camadas de forma concatenada. Com o uso de menor quantidade de informação, contribui-se para reduzir o tempo de processamento, o que é um requisito importante para a aplicação. As saídas de cada rede neural especialista (aqui chamadas de ELNN - Expert Layer Neural Networks) são utilizadas como entradas para uma 2495

ordenados de forma decrescente pela variância das projeções. Para tornar a variância independente da norma de v i, faz se: Figura 5: Representação de classificadores neurais segmentados. segunda rede neural (Rede Neural Combinadora) para realização do teste de hipóteses propriamente dito (decisão), conforme mostrado na Figura 5. 4 Pré-Processamento Estatístico No trabalho (Simas Filho et al., 2007), foi sugerido a aplicação de técnicas de pré-processamento aos sinais em anéis antes do classificador neural. As técnicas utilizadas foram adotadas visando obter a extração de características relevantes e a redução da dimensão dos sinais. As técnicas utilizadas para redução da dimensão foram: PCA (Principal Component Analysis)(Jolliffe, 2008) e PCD (Principal Component of Discrimination). Para a extração de características foi utilizada a ICA (Independent Component Analysis)(Hyvärinen et al., 2001). A utilização em conjunto das técnicas possibilitou um aumento na eficiência de classificação bem como uma redução no tempo de processamento. Neste trabalho, foram utilizadas as técnicas ICA e PCA como uma etapa de préprocessamento para os classificadores segmentados. 4.1 Análise de Componentes Principais A PCA (Análise de Componentes Principais) é uma transformação linear que projeta um sinal multidimensional em componentes não correlacionados e ordenados pela variância (Jolliffe, 2008). Considerando-se um vetor x = [x 1,..., x n ] T aleatório com n elementos e assumindo-se que ele tenha média nula: E{x} = 0 (2) onde E{.} é o operador esperança. Se x x E{x}. A projeção z i de x na direção de v i é definida por: z i = v T i x = N v ki x k (3) k=1 Na transformação por PCA, os componentes extraídos z i (i = 1,..., N) devem ser ortogonais e v i v i v i (4) Fazendo-se com que v i = 1, torna-se a variância função apenas da direção das projeções. Como E{x} = 0, então E{z i } = 0, logo a variância da projeção z i é calculada por E{zi 2}. O primeiro vetor da base v 1 de componentes principais pode ser encontrado pela maximização: J P CA i (v 1 ) = E{z 2 i } = E{(v T 1 x) 2 } = v T 1 C x v 1 (5) onde C x é a matriz de covariância de x. A maximização da equação anterior pode ser encontrada a partir da determinação dos autovetores e 1, e 2,..., e n da matriz C x. O ordenamento dos autovetores é, tal que, os autovalores que associados satisfazem d 1 > d 2 >... > d N, assim v i = e i, tornando a decomposição por autovalores da matriz C x equivalente a PCA de x. Em aplicações de compactação, a parcela contendo a menor variância é descartada, mantendo assim os componentes com maior nível de energia. 4.2 Análise de Componentes Independentes A ICA é uma técnica utilizada em processamento de sinais multidimensionais na busca por uma transformação linear na qual os componentes na saída são mutuamente independentes (Hyvärinen et al., 2001). A ICA vem sendo aplicada na solução de diversos problemas na área de processamento de sinais, principalmente em extração de características (Simas Filho et al., 2007). Na ICA, considera-se que um sinal multidimensional x(t) = [x 1 (t),..., x N (t)] T observado (ou medido) é gerado a partir da combinação linear das fontes independentes s(t) = [s 1 (t),..., s N (t)] T : x = As, (6) onde A é a matriz de mistura. O objetivo final da ICA é encontrar uma aproximação y das fontes independentes s, utilizando apenas os sinais observados x. y = Wx, (7) sendo W a matriz de separação. Se W = A 1, y = s e o problema foi completamente solucionado (Hyvärinen et al., 2001). 5 Metodologia e Parâmetros de avaliação da eficiência dos classificadores Os dados utilizados foram produzidos por simulações de Monte Carlo, pela colaboração do ATLAS, utilizando os simuladores Pythia (que produz as 2496

colisões) e Geant (que realiza a interação das partículas com o detector. Nos dados utilizados o sinal de interesse são elétrons gerados no decaimento do bóson Z em 2 elétrons e o ruído de fundo para a identificação são jatos hadrônicos. Foram utilizados dois conjuntos distintos de dados simulados do L2. A separação foi realizada de acordo com o valor da energia transversa dos eventos. O conjunto e10 é composto por assinaturas que possuem energia transversa maior que 7GeV e o conjunto e22 é formado por sinais que possuem energia transversa maior que 20GeV. Cada um deles representa uma configuração de operação real do detector. As assinaturas e10 representam um corte de primeiro nível menos restritivo, que pode ser utilizado sempre que há a necessidade de uma maior aceitação de eventos de interesse. O conjunto e22 é representativo de um corte de primeiro nível mais forte, no qual um menor número de assinaturas é aceito para análise posterior. No processo de treinamento da rede neural foi utilizada a metade do conjunto de dados (treino) e outra metade foi utilizada para as etapas de teste e validação das redes. O algoritmo de treinamento utilizado foi o RPROP (resilient backpropagation) (Riedmiller and Braun, 1993). Apesar do algoritmo RPROP ser uma técnica muito difundida, é possível que o algoritmo sofra com a incidência de mínimos locais, devido ao uso da função de otimização do tipo gradiente descendente. Para minimizar este problema, o processo de treinamento das redes neurais foi repetido 10 vezes e a melhor rede neural foi escolhida, levando em consideração a avaliação dos melhores índice SP encontrados. O índice SP (Soma Produto) é um parâmetro de avaliação de eficiência de classificadores definido por: alarme (PF) à medida que se varia o patamar de decisão. A eficiência de um classificador, a partir da curva ROC, é calculada baseando-se a área sob a curva. Quanto maior essa área, mais eficiente é o classificador. Na estrutura da rede neural, foram utilizados dez neurônios na camada oculta, em cada classificador especialista treinado. Na rede combinadora, foram realizados testes, verificando a eficiência por número de neurônios ocultos utilizados. A configuração ótima para o conjunto de dados e10 ocorreu na utilização de 10 neurônios, também na rede combinadora, conforme mostra a Figura 6. Já no conjunto e22, os melhores resultados em eficiência foram encontrados utilizando nove neurônios na camada oculta da rede combinadora (ver Figura 7). Figura 6: Max SP(%) por número de neurônios na camada oculta da Rede Combinadora - Conjunto e10. SP = ( 1 2 ) (Ef e + Ef j ) Ef e Ef j, (8) O SP foi utilizado neste trabalho como parâmetro para escolher o patamar de decisão ótimo para um dado classificador. Variando-se o patamar de decisão em toda sua faixa de excursão calculam-se os valores do SP correspondentes. O SP máximo indica um patamar que apresenta alta eficiência para as duas classes. A função de custo utilizada foi a MSE (mean squared error) e as saídas alvo (target) da rede foram definidas da seguinte forma: para elétrons= 1, jatos = 1. Para a avaliação da eficiência dos classificadores foram utilizados os parâmetros índice SP (Soma Produto) (dos Anjos, 2006) e curva ROC (Receiver Operating Characteristic) (Trees, 2001). A curva ROC apresenta a relação entre a probabilidade de detecção (PD) e a probabilidade de falso Figura 7: Max SP(%) por número de neurônios na camada oculta da Rede Combinadora - Conjunto e22 2497

6 Resultados O pré-processamento estatístico através da aplicação em conjunto das análises de componentes principais (PCA) e de componentes independentes (ICA) foi aplicado em cada camada do sistema de calorimetria, separadamente. Os classificadores segmentados foram treinados variandose o número de componentes apresentados na entrada. Neste caso, foram encontrados níveis de compactação ótimos (através da avaliação do máximo índice SP), que reduziram a dimensão dos dados extraídos nas camadas do calorímetro. As Tabelas 2 e 3 mostram os resultados obtidos para os conjuntos e10 e e22, respectivamente. Percebese que, em alguns casos é possível reduzir a informação armazenada por camada em mais de 70 % (para a camada E1). Tabela 2. Número de componentes retidos por camada, após aplicação do pré-processamento por ICA/PCA - Conjunto e10. Camadas PS E1 E2 E3 H0 H1 H2 Componentes 5 18 5 8 4 4 3 Redução (%) 37,5 71,9 37,5 0,0 0,0 50,0 25,0 Tabela 3. Número de componentes retidos por camada, após aplicação do pré-processamento por ICA/PCA - Conjunto e22. Camadas PS E1 E2 E3 H0 H1 H2 Componentes 5 14 5 6 4 4 3 Redução (%) 37,5 78,1 37,5 25,0 0,0 0,0 25,0 da eficiência no classificador proposto. É interessante observar que, para as assinaturas e10, considerando uma detecção de 97,5 %, a aceitação de ruído de fundo (falso alarme) foi reduzida quase pela metade. Figura 9: Curva ROC do classificador projetado ELNN e o Neural Ringer - Conjunto e10. Figura 8: Descrição do projeto do classificador segmentado com Pré-Processamento. Após os classificadores segmentados, foi adicionada a rede combinadora (formando a arquitetura da ELNN mostrada na Figura 8). O último estágio de classificação foi alimentado com as informações obtidas dos classificadores especialistas em cada camada. A partir deste sistema de classificação de múltiplos níveis, foi atingido um aumento na eficiência de detecção, conforme é possível observar a patir da comparação das Curvas ROC dos classificadores ELNN e Neural Ringer tanto para o conjunto e10 como para o e22, conforme pode-se observar nas Figuras 9 e 10, respectivamente. A Tabela 4, mostra os máximos SP encontrados para os discriminadores projetados, nas análises dos conjuntos e10 e e22, verificando o aumento Figura 10: Curva ROC do classificador projetado ELNN e o Neural Ringer - Conjunto e22. Tabela 4. Comparação dos métodos aplicados no conjunto de dados e10 e e22. Discriminadores Max SP(%) PD(%) PF(%) E10-Ringer 99.69 +/-0.4 99.75 0.38 E10+ELNN 99.78 +/-0.2 99.75 0.21 E22-Ringer 99.67 +/-0.5 99.73 0.41 E22+ELNN 99.68 +/-0.5 99.73 0.38 Em discriminadores de partículas, é importante também observar o comportamento do classificador proposto em função da energia total do evento, devido a possibilidades de ocorrência de novas propriedades físicas, em determinadas faixas de energia transversa. Conforme mostrado na Figura 11, observa-se também o aumento na eficiência de detecção, em 2498

função da energia dos sinais estudados, utilizando o classificador ELNN em comparação com o Neural Ringer. O discriminante proposto se destaca em relação ao aumento da probabilidade de detecção de elétrons, principalmente para baixas energias, na faixa de 10 a 25 GeV, onde o perfil de elétrons costuma ser mais semelhante ao de jatos hadrônicos, indicando que o classificador proposto é mais robusto a este aspecto que o Neural Ringer. pelos dados simulados e por discussões e sugestões sobre este trabalho. Referências Colaboration, A. (2008). Atlas experiment at cern large hadron collider, Journal of Instrumentation 3(S08003): 1 407. dos Anjos, A. R. (2006). Sistema de filtragem online aplicada a um ambiente com alta taxa de eventos. dos Anjos, A., Torres, R. and Seixas, J. M. (2006). Neural triggering system operating on high resolution calorimetry information, Nuc. Inst. and Methods in Physics Research A 559(1): 134 138. Evans, L. and Bryant, P. (2008). Lhc machine, Journal of Instrumentation 3(S08001): 1 158. Hernandez, Y. (2013). The atlas tile calorimeter performance at lhc, Nuc. Inst. and Methods In Physics Research. Figura 11: Curva de eficiência de detecção (%) por energia total - Conjunto e10. 7 Conclusões A eficiência na detecção dos eventos de interesse é um aspecto fundamental para detectores de partículas. Neste trabalho, foi proposta a utilização de uma nova arquitetura de classificação para o problema da seleção online de eventos no detector ATLAS. Foram utilizados classificadores especialistas nas informações de cada camada do detector. Para combinar as informações obtidas de modo segmentado, foi utilizado um outro classificador neural. A análise dos resultados obtidos indica que a arquitetura proposta contribui para um aumento na eficiência de detecção de partículas eletromagnéticas (elétrons e fótons). Foi observado, ainda, que a adição de uma etapa de pré-processamento estatístico, utilizando as análises de componentes independentes (ICA) e de componentes principais (PCA) contribuiu para uma redução da informação necessária para o problema, o que é um aspecto importante na aplicação, que apresenta severas restrições quanto ao tempo de resposta dos algoritmos de classificação. Hyvärinen, A., Karhunen, J. and Oja, E. (2001). Independent Component Analysis. Jolliffe, I. (2008). Principal Component Analysis, Springer. Koletsou, I. (2011). The atlas liquid argon calorimeter at the lhc, Nuc. Inst. and Methods in Physics Research 628: 351 354. Riedmiller, M. and Braun, H. (1993). A direct adaptive method for faster backpropagation learning, the rprop algorithm, Proc. of Int. Conf. on Neural Networks (1): 586 591. Simas Filho, E. F., Caloba, L. P. and Seixas, J. M. (2007). Independent component analysis applied for online filtering on a high events rate and segmented information environment, Proceedings of the VIII Brazilian Conference on Neural Networks - CBRN. Torres, R. C., Simas Filho, E. F., Lima, D. E. F. and Seixas, J. M. (2010). Signal processing, In-Tech, India, pp. 337 358. Trees, H. L. V. (2001). Detection, Estimation, and Modulation Theory, Vol. 1. Agradecimentos Os autores agradecem ao apoio financeiro do CNPq, FAPESB, RENAFAE e Vale S/A. Agradecemos também à colaboração do detector ATLAS 2499