Aprendizagem automática Mapas auto-organizativos (SOMs)



Documentos relacionados
Redes Neurais. Mapas Auto-Organizáveis. 1. O Mapa Auto-Organizável (SOM) Prof. Paulo Martins Engel. Formação auto-organizada de mapas sensoriais

Palavras-chave: self-organizing maps, p-median, construção de regiões

3. Metodologia 3.1. Análise exploratória de dados

Aula 2 RNA Arquiteturas e Treinamento

Análise e visualização de dados utilizando redes neurais artificiais auto-organizáveis

Matlab - Neural Networw Toolbox. Ana Lívia Soares Silva de Almeida

MLP (Multi Layer Perceptron)

Scale-Invariant Feature Transform

Hamming. Kohonen. LVQ. Counterpropagation. ART1. Retropropagação

Redes Neuronais. Redes neuronais artificiais. Redes neuronais artificiais. Redes neuronais artificiais

TIC Unidade 2 Base de Dados. Informação é todo o conjunto de dados devidamente ordenados e organizados de forma a terem significado.

CONTABILIDADE GERAL e GESTÃO PREVISIONAL PARA ESNL Versões 5.220/5.230

ORANGE TREES IMAGE SEGMENTATION WITH SELF-ORGANIZED MAPS ABSTRACT

Reabilitação e Reforço de Estruturas

Informação Geográfica (SIG) Inês Pinto Instituto de Investigação Cientifica Tropical

Pré processamento de dados II. Mineração de Dados 2012

Modelos não recorrentes RNA Feed-Forward: MLP - Backpropagation, RProp,CasCor (HiperPlanos) RBF Radial Basis Function (Clusters)

Reconhecimento de Objectos

Classificação da imagem (ou reconhecimento de padrões): objectivos Métodos de reconhecimento de padrões

Computação Adaptativa

Identificação de Caracteres com Rede Neuronal Artificial com Interface Gráfica

Redes. Redes não aleatórias

Gestão por Processos ISO 9001: 2000

Exercícios Práticos de. Químio-informática. Prof. João Aires de Sousa

Reconhecimento de Padrões

MANUAL DE UTILIZAÇÃO DA BALANÇA ELECTRÓNICA MEDINES JA2

Departamento de Ciências e Tecnologias

Curso EFA Técnico/a de Informática - Sistemas. Óbidos

Cadeira de Tecnologias de Informação. Conceitos fundamentais de sistemas e tecnologias de informação e de gestão do conhecimento.

A VISTA BACKSTAGE PRINCIPAIS OPÇÕES NO ECRÃ DE ACESSO

Contabilidade é entendida como um sistema de recolha, classificação, interpretação e exposição de dados económicos.

Sistemas de Apoio à Decisão Redes de Kohonen (SOM) V 1.0, V.Lobo, EN/ISEGI, 2005

CORSAN GESTÃO DE CUSTOS

TÍTULO: SIMULAÇÃO DE METODOLOGIA BASEADA EM REDES DE KOHONEN PARA IDENTIFICAÇÃO DE CORRENTES DE INRUSH NA PROTEÇÃO DE TRANSFORMADORES DE POTÊNCIA

PDA CAM MANUAL DO UTILIZADOR

1. As Áreas Funcionais e Ambiente Organizacional

Cátia Homem, 9 de Janeiro de 2008 Página 1

A A A A A A A A A A A A A A A MATEMÁTICA

Reconhecimento de Padrões. Reconhecimento de Padrões

PERFIL PROFISSIONAL TÉCNICO(A) DE INFORMÁTICA - INSTALAÇÃO E GESTÃO DE REDES

IMPLEMENTAÇÃO. Acção de Formação do Grupo de Trabalho. Sensibilização Sensibilização Geral para a Qualidade. Qualidade.

PROJECTOS DE INVESTIGAÇÃO CIENTÍFICA E DESENVOLVIMENTO TECNOLÓGICO

Qual o efeito da radiação solar na evaporação da água?

Figura 1: Bosque de Casal do Rei, alguns meses após o incêndio que ocorreu no Verão de 2005.

UTILIZAÇÃO DO ALGORITMO SELF- ORGANIZING MAP NA CARACTERIZAÇÃO DE ORGANIZAÇÕES PUBLICAS PORTUGUESAS, USANDO INFORMAÇÃO FINANCEIRA

Criação de Páginas Web - MS Word 2000

Introdução a Datamining (previsão e agrupamento)

CURSO PROFISSIONAL TÉCNICO DE DESIGN GRÁFICO. Planificação anual

27/10/2014. Gestão da Qualidade. Qualidade e Produtividade. Qualidade e Produtividade. Qualidade e Produtividade. Qualidade e Produtividade

ADMINISTRAÇÃO E GESTÃO ESCOLAR. Prof. Bento

Evolução via Selecção Natural (Darwin) - sobrevivem os mais aptos (fittest )

Redes de Computadores

Aplicações de Programação CNC/ISO com Microcomputador

Introdução à Responsabilidade Social das Pequenas e Médias Empresas

Avaliação do potencial produtivo em montados de sobro com recurso a redes neuronais artificiais

Sistemas de Nomes Planos

Escola Secundária de Emídio Navarro

RECURSOS HUMANOS Avaliação do desempenho

AS QUATRO FORÇAS FUNDAMENTAIS DA NATUREZA

Aplicações Práticas com Redes Neurais Artificiais em Java

Projeto de Redes Neurais e MATLAB

Controlo da Qualidade da Água de Abastecimento Público Concelho de Oliveira de Azeméis

Redes neurais auto-organizáveis para classificação de sinais eletrocardiográficos atriais

MIG - Metadados para Informação Geográfica

Escola Secundária Vitorino Nemésio

UNISINOS - UNIVERSIDADE DO VALE DO RIO DOS SINOS

CALIBRAÇÃO DO SISTEMA - SCANNER MONITOR 2 CLÁUDIO MELO

Ciências da Linguagem e da Cognição

Classificação / Indexação

Figura 5.1.Modelo não linear de um neurônio j da camada k+1. Fonte: HAYKIN, 2001

GeoMafra Portal Geográfico

Universidade Federal Rural de Pernambuco Departamento de Estatística e Informática

Engenharia de Software

FORMAÇÃO EM TÉCNICAS DE PLANEAMENTO DE REDES PRIMÁRIAS DE FAIXAS DE GESTÃO DE COMBUSTÍVEL FASE II ELABORAÇÃO DE PLANOS DE RPFGC

Capítulo. Gestão de recursos de dados

Redes de Computadores Grupo de Redes de Computadores

Google Earth Search Engine: Classificação de imagens Aéreas

Introdução à Multimédia conceitos

Automatismos Industriais

Revisão Inteligência Artificial ENADE. Prof a Fabiana Lorenzi Outubro/2011

Self Organizing Maps - Redes de Kohonen

1 ACADEMIA AGROGESTÃO Formação em informática aplicada à agricultura A G R O G E S T Ã O - Apoio Técnico e Administrativo

COMPETÊNCIAS ESPECÍFICAS

A Gestão, os Sistemas de Informação e a Informação nas Organizações

Aplicações Informáticas B

Introdução a Datamining (previsão e agrupamento)

O Geoportal do projeto DESOURB. Vila Real, 18 de setembro de 2012

TUTORIAL CORTADORA LASER. Software de Edição e Output ADOBE ILLUSTRATOR. 1. Abrir o programa ADOBE ILLUSTRATOR localizado na barra de tarefas

22/Abr/2015 Aula /Abr/2015 Aula 14

HIDRALERTA SISTEMA DE PREVISÃO E ALERTA DE INUNDAÇÕES EM ZONAS COSTEIRAS E PORTUÁRIAS

FAPESP FUNDAÇÃO DE AMPARO À PESQUISA DO ESTADO DE SÃO PAULO UNIVERSIDADE DE SÃO PAULO INSTITUTO DE MATEMÁTICA E ESTATÍSTICA (IME) GeoGrid

Medidas e Incertezas

UNIVERSIDADE FEDERAL DE OURO PRETO ESCOLA DE MINAS COLEGIADO DO CURSO DE ENGENHARIA DE CONTROLE E AUTOMAÇÃO - CECAU DIEGO GOMES COELHO

SISTEMA DE POSICIONAMENTO LOCAL BASEADO EM REDES WI-FI

UVW 9. SÍNTESE DE IMPACTES

ESCOLA SECUNDÁRIA C/ 3º CICLO DE MANUEL DA FONSECA, SANTIAGO DO CACÉM

Critérios Específicos de Avaliação Disciplinas: Educação Física (2º ciclo, 3º ciclo e Secundário)

Exemplos de aplicação. Mineração de Dados 2013

Acrescente. Valor. à Sua. Organização. Obtenha Melhores Resultados com a Formação Esri Portugal

Caracterização semântica de sinais acústicos Aplicação à classificação automática de peças cerâmicas

Transcrição:

Aprendizagem automática Mapas auto-organizativos (SOMs) 1

Redes neuronais de Kohonen self-organizing maps (SOMS) Visão algébrica dum conjunto de informação (valores, sinais, magnitudes,...) vs. Visão topológica da informação (relações entre dados) 2

Redes neuronais de Kohonen self-organizing maps (SOMS) Compressão da informação Mapeamento numa superfície 2D. Self-Organized Topological Features Maps (!!!) Preservação da topologia. 3

Redes neuronais de Kohonen Arquitectura Uma única camada de neurónios. 4

Redes neuronais de Kohonen Arquitectura Uma única camada de neurónios. n pesos para cada neurónio (n = número de inputs) 5

Redes neuronais de Kohonen Topologia Definição de distância entre neurónios Neurónio 1ª vizinhança 2ª vizinhança O output de cada neurónio só influencia neurónios próximos. 6

Redes neuronais de Kohonen Objectivo Mapear sinais semelhantes em neurónios próximos 7

Redes neuronais de Kohonen Sinais semelhantes em neurónios próximos Sinais semelhantes correspondem à mesma classe? NÃO SIM 8

Redes neuronais de Kohonen Superfície toroidal Vizinhança 2ª vizinhança 1ª vizinhança Neurónio 9

Redes neuronais de Kohonen Aprendizagem competitiva Após input, um só neurónio é activado (neurónio central ou vencedor) Neurónio central é o que tiver pesos mais semelhantes ao input. Tradicionalmente, semelhança = distância Euclideana n w i x i= 1 ( i ) 2 n nº de inputs w valor do peso x valor do input 10

Redes neuronais de Kohonen Aprendizagem competitiva 11

Redes neuronais de Kohonen Aprendizagem competitiva Pesos do neurónio central são corrigidos de modo a torná-los ainda mais semelhantes ao input. Pesos de neurónios vizinhos também são adaptados com o mesmo objectivo mas em menor escala. Neurónio 1ª vizinhança 2ª vizinhança 12

Redes neuronais de Kohonen Aprendizagem competitiva A correção dos neurónios vizinhos após activação de um neurónio depende de: 1. Distância ao neurónio vencedor (quanto mais longe menor a correcção) 2. Tempo de treino (no início do treino aplicam-se correcções mais drásticas) 3. Diferença entre o peso e o input (quanto maior a diferença maior a correcção). 13

Redes neuronais de Kohonen Normalização dos dados A activação de neurónios e as correcções dependem da distância Euclideana. Se um descritor variar numa escala muito maior que outro, o primeiro vai ter mais influência no resultado. Logo, para todos os descritores estarem em igualdade é necessário NORMALIZAR previamente os dados. 14

Redes neuronais de Kohonen Normalização dos dados Exemplo de normalização: 1. encontrar o valor máximo (MAX) e mínimo (MIN) para um descritor. 2. substituir cada valor x por (x-min)/(max-min) (passa a variar entre 0 e 1) ou por 0.1 + 0.8 (x-min)/(max-min) (passa a variar entre 0.1 e 0.9, útil para redes BPG) 15

Redes neuronais de Kohonen Normalização dos dados Outro exemplo de normalização (normalização z): 1. encontrar o valor médio (aver) e o desvio padrão (sd) para um descritor. 2. substituir cada valor x por (x-aver)/sd (o descritor normalizado passa a ter média = 0 e desvio padrão = 1) 16

Redes neuronais de Kohonen: Aplicação Classificação geográfica de petróleos para identificação da origem de derrames de petróleos brutos. A partir de características químicas de petróleos. Base de dados com características químicas de petróleos de diferentes origens Amostra (características químicas) REDES NEURONAIS Classe geográfica A. M. Fonseca, J. L. Biscaya, J. Aires-de-Sousa, A. M. Lobo,"Geographical classification of crude oils by Kohonen self-organizing maps", Anal. Chim. Acta 2006, 556 (2), 374-382. 17

Características químicas de petróleos Teor em vários compostos determinados por cromatografia gasosa / espectrometria de massa (GC / MS) Exemplos (22R)17α(H),21β(H)-30,31-Bishomohopano / 17α(H),21β(H)-Hopano 18α(H)-Oleanano / 17α(H),21β(H)-Hopano 1-Isopropil-2-metilnaftaleno H H 3-Metilfenantreno 1-Metildibenzotiofeno H H 18α(H)-Oleanano 3- Metilfenantreno 18

Rede neuronal de Kohonen Input do vector Neurónio vencedor Descritores GC/MS de uma amostra de petróleo Pesos 19

Resultados Conjunto de treino: 133 amostras 20 origens geográficas diferentes 21 descritores de GC/MS Bom agrupamento 97% previsões correctas Conjunto de teste: 55 amostras 70% previsões correctas 20

Rede neuronal Counterpropagation (CPG) SOM com uma camada de output Camada de input Camada de output 21

Treino de uma rede neuronal CPG Apresentação do input input output Correcção dos pesos na camada de input Correcção dos pesos correspondentes na camada de output 22

Previsão por uma rede neuronal CPG Apresentação do input input previsão 23

Rede neuronal CPG com múltiplos outputs Treino Neurónio vencedor Previsão Camada de input Camada de output 24

CPGNN: aplicação Previsão da capacidade para ligar a GPCR (G-Protein-Coupled Receptors) P.Selzer, P. Ertl, QSAR Comb. Sci. 2005, 24, 270-276; J. Chem. Inf. Model. 2006, 46 (6), 2319-2323. 25

CPGNN: aplicação Previsão da capacidade para ligar a GPCR (G-Protein-Coupled Receptors) P.Selzer, P. Ertl, QSAR Comb. Sci. 2005, 24, 270-276; J. Chem. Inf. Model. 2006, 46 (6), 2319-2323. Rede CPG de tamanho 250 250 Conjunto de treino: 24870 moléculas aleatoriamente retiradas de catálogos ( drug-like ) 1709 moléculas ligandos de GPCR Input: 225 descritores (códigos RDF) Output: 9 níveis (GPCR e subfamília adrenalin, bradykinin, dopamine, endothelin, histamine, opioid, serotonin, vasopressin ). Valores binários (0/1) consoante SIM ou NÃO. 26

CPGNN: aplicação à previsão de ligandos de GPCR Resultados: 1º nível de output (ligando de GPCR) Os valores dos pesos estão traduzidos em cores. Zonas activadas por ligandos P.Selzer, P. Ertl, QSAR Comb. Sci. 2005, 24, 270-276; J. Chem. Inf. Model. 2006, 46 (6), 2319-2323. 27

CPGNN: aplicação à previsão de ligandos de GPCR Resultados: níveis de output nº 4 ( dopamine ) e nº 7 ( opioid ) P.Selzer, P. Ertl, QSAR Comb. Sci. 2005, 24, 270-276; J. Chem. Inf. Model. 2006, 46 (6), 2319-2323. 28

CPGNN: aplicação à previsão de ligandos de GPCR Resultados: Conjunto de teste (25096 não-gpcr e 1490 GPCR) 71% dos ligandos correctamente previstos 18% falsos positivos P.Selzer, P. Ertl, QSAR Comb. Sci. 2005, 24, 270-276; J. Chem. Inf. Model. 2006, 46 (6), 2319-2323. 29

SOMs no programa JATOON http://www.dq.fct.unl.pt/staff/jas/jatoon Paste dos dados 30

SOMs no programa JATOON http://www.dq.fct.unl.pt/staff/jas/jatoon Visualização da distribuição dos objectos. Neurónios coloridos de acordo com as classes dos objectos que os activam. 31

SOMs no programa JATOON http://www.dq.fct.unl.pt/staff/jas/jatoon Distribuição dos objectos. 32

SOMs no programa JATOON http://www.dq.fct.unl.pt/staff/jas/jatoon Inspecção dos pesos num determinado nível da camada de input. 33