Otimização de Árvores Sintáticas aplicada à Detecção de Células Cancerígenas

Documentos relacionados

SIGM-TREE: OTIMIZAÇÃO DE ÁRVORES SINTÁTICAS APLICADA À CLASSIFICAÇÃO DE PADRÕES

Simulador de Redes Neurais Multiplataforma

Redes Neurais Artificiais na Engenharia Nuclear 2 Aula-1 Ano: 2005

Modelos Pioneiros de Aprendizado

Carga horária : 4 aulas semanais (laboratório) Professores: Custódio, Daniel, Julio foco: introdução a uma linguagem de programação Linguagem Java

Redes Neurais. A IA clássica segue o paradigma da computação simbólica

Projeto de Redes Neurais e MATLAB

Figura 5.1.Modelo não linear de um neurônio j da camada k+1. Fonte: HAYKIN, 2001

Aplicação de Redes Neurais Artificiais na Caracterização de Tambores de Rejeito Radioativo

Análise de Pontos de Função. Por Denize Terra Pimenta

Tomografia por emissão de pósitrons (PET) Pedro Bastos Costa

Aprendizagem de Máquina

Disciplina: Redes de Comunicação. Curso Profissional Técnico de Gestão e Programação de Sistemas Informáticos. Setembro 2013

DESENHO TÉCNICO. Aula 03

QUALIDADE DE SOFTWARE

DESENHO TÉCNICO. Aula 03

Capítulo 2. VARIÁVEIS DO TIPO INTEIRO

VÃOS DESNIVELADOS, UTILIZANDO PERFIL DE PROJETO DIGITAL, SOFTWARE EM AMBIENTE VISUAL E BASE DE DADOS RELACIONAL

Aula 4 Conceitos Básicos de Estatística. Aula 4 Conceitos básicos de estatística

PROCEDIMENTOS DE AUDITORIA INTERNA

Cotagem de dimensões básicas

3.4 Representação física: alocação encadeada (dinâmica) Ptlista - variável ponteiro externa que indica o início da lista.

Sumário. Introdução ao Microsoft Project. 1 Microsoft Project, gerenciamento de projetos e você 3. 2 Visão geral do Project 11.

3DODYUDVFKDYH Visão Computacional, Inteligência Artificial, Redes Neurais Artificiais.

Engenharia de Software II

ORGANIZAÇÃO DE COMPUTADORES MÓDULO 1

3 Metodologia. 3.1 Tipo de Pesquisa

Reconhecimento de Padrões Utilizando Filtros Casados

CADERNOS DE INFORMÁTICA Nº 1. Fundamentos de Informática I - Word Sumário

Planificação de. Aplicações Informáticas B

PALAVRAS-CHAVE: Massas Nodulares, Classificação de Padrões, Redes Multi- Layer Perceptron.

3 Estratégia para o enriquecimento de informações

MODELO: TERMO DE ABERTURA DE PROJETO

OTIMIZAÇÃO DA DOSE GLANDULAR MÉDIA NA MAMA E DA QUALIDADE DA IMAGEM NOS SISTEMAS DE MAMOGRAFIA DIGITAL

Internet. Gabriela Trevisan Bacharel em Sistemas de Infomação

Requisitos de Software

O BANCO DO DESENVOLVIMENTO PROVA DISCURSIVA LEIA ATENTAMENTE AS INSTRUÇÕES ABAIXO.

Figure 2 - Nós folhas de uma árvore binária representando caracteres ASCII

RGF SISTEMAS DE INFORMÁTICA LTDA SISARQ SISTEMA DE CONTROLE DE ARQUIVO DESLIZANTE PARAÍSO DO TOCANTINS-TO

Cotagem de elementos

Prof. Me. Marcos Echevarria

ESTEREOSCOPIA INTRODUÇÃO. Conversão de um par de imagens (a)-(b) em um mapa de profundidade (c)

Prof. Fernando Lopes. Unidade II. Administração de Cargos e

INFORMÁTICA. Prof.: MARCIO HOLLWEG CONCEITOS DE INTERNET E INTRANET

Donare Sistema de Gerenciamento de Ações Humanitárias

Qualidade é o grau no qual um conjunto de características inerentes satisfaz a requisitos. ISO 9001:2008

ANEXOS. Decisão de Execução da Comissão

Gestão por Competências

2 Gerenciamento de Log 2.1 Definições básicas

NBR 8196 (Ago 1992) Conceito Escala é a relação entre as medidas do desenho de um objeto e seu tamanho real:

Do neurônio biológico ao neurônio das redes neurais artificiais

Introdução. Capítulo. 1.1 Considerações Iniciais

Solicitação de Propostas. Apoio à Conexão de Unidades de Ensino e Pesquisa a Redes Estaduais

Programação Orientada a Objeto

Regras Métodos Identificadores Variáveis Constantes Tipos de dados Comandos de atribuição Operadores aritméticos, relacionais e lógicos

E/S CPU. Memória (Instruções e dados) 2 PARADIGMA IMPERATIVO. Instruções e dados. Resultados das operações. Unidade lógica e aritmética

Pesquisa sobre Segurança do Paciente em Hospitais (HSOPSC)

Processo: Vendas Lista de casamento

Engenharia de Software II

Ambiente de Simulação Virtual para Capacitação e Treinamento na Manutenção de. Disjuntores de Subestações de Energia Elétrica,

Aula 4 Estatística Conceitos básicos

Critérios para Cadastro no Gemini da Rede de Distribuição Subterrânea (RDS) - Savassi Belo Horizonte - MG

Computador E/S, Memória, Barramento do sistema e CPU Onde a CPU Registradores, ULA, Interconexão interna da CPU e Unidade de controle.

A solução que faltava para seu estúdio fotográfico

Os Estilos de Pesquisa na Computação. TCC Profº Carlos José Maria Olguín

Quais as diferenças entre os formatos de imagem PNG, JPG, GIF, SVG e BMP?

The art of handling. Energia

Introdução à Computação: Sistemas de Computação

APPLICATION OF AN INTELLIGENT COMPUTATIONAL METHODS IN DIAGNOSIS OF CANCEROUS LESIONS

Campus Capivari Análise e Desenvolvimento de Sistemas (ADS) Prof. André Luís Belini prof.andre.luis.belini@gmail.com /

Considerações sobre redimensionamento de motores elétricos de indução

G E S T Ã O POR P R O Ç E S S O S MÉTODOS PROCESSOS. Organização, Sistemas, Métodos & Processos ORGANIZAÇÃ0 SISTEMAS

Gestão da Qualidade em Projetos

natureza do projeto e da aplicação métodos e ferramentas a serem usados controles e produtos que precisam ser entregues

TCC CURSO POS-GRADUAÇÃO ESPECIALIZAÇÃO DESIGN INSTRUCIONAL ROTEIRO DO PROJETO DE DESIGN INSTRUCIONAL DE UM CURSO

INSTRUMENTOS USADOS Lápis e lapiseiras Os lápis médios são os recomendados para uso em desenho técnico, a seleção depende sobretudo de cada usuário.

RVCC ESCOLAR BÁSICO GUIA DE APOIO

Classificação de Pesos Padrão PARTE 2. Carlos Alexandre Brero de Campos Instituto de Pesos e Medidas do Estado do Paraná

Acompanhamento e Execução de Projetos

Nota Técnica 113/2007 SRD/SRE/ANEEL Metodologia para Projeção de Investimentos para o Cálculo do Fator X Contribuição da Audiência Publica 052/2007

O diagrama ASM contém dois elementos básicos: o bloco de estado e o bloco de decisão.

Programação em papel quadriculado

Capítulo 13 Pastas e Arquivos

- Aulas 57, 58, 59 e 60 - Técnicas de programação. Funções

Gestão de Pessoas - Ênfase em Recrutamento, Seleção e Integração de novos funcionários.

Realizado de 25 a 31 de julho de Porto Alegre - RS, ISBN

UTILIZANDO O HISTOGRAMA COMO UMA FERRAMENTA ESTATÍSTICA DE ANÁLISE DA PRODUÇÃO DE ÁGUA TRATADA DE GOIÂNIA

Programação Funcional. Aula 5. Funções Recursivas. José Romildo Malaquias. Departamento de Computação Universidade Federal de Ouro Preto 2011.

Tencologia em Análise e Desenvolvimento de Sistemas Disciplina: WEB I Conteúdo: Arquitetura de Software Aula 03

RELATÓRIO DE AUDITORIA RA 01/2016

Palavras chave: defeitos de solda, pulso eco, redes neurais artificiais, transformada de wavelet

Desenvolvimento Institucional: A Importância dos INDICADORES DE GESTÃO

2. A influência do tamanho da palavra

Canvas e Elevator Pitch: como uma organização cria, entrega e captura valor. Poli.Design

Trabalho de laboratório Avaliação semestral Exame final MÉDIA PONDERADA CONCEITO

ALGORITMOS E FLUXOGRAMAS

TUTORIAL AMBIENTE WEB PORTUGOL

CENARIO INDUSTRIAL TECNOLOGIA RELACIONAMENTO COMPETÊNCIA

Transcrição:

Trabalho de Pesquisa Operacional Otimização de Árvores Sintáticas aplicada à Detecção de Células Cancerígenas Juliana Oliveira Ferreira Bacharelado em Ciência da Computação UNIFAL MG

Objetivo Gerar uma técnica eficiente para o reconhecimento de células com câncer maligno, baseando se em características básicas da célula. Poder identificar quais características das células são realmente necessárias para distinguir as com câncer maligno, das com câncer benigno.

Representação Baseada em Árvores Sintáticas A árvore armazena expressões que contém : Funcões Matemáticas Constantes Variáveis (características do objeto a ser identificado) Toda árvore terá como raiz a função sigmóide logística.

Representação Pai Info Tipo Função Matemática FilhoE FilhoD Pai Pai Info Info Posicao

Gramática Esta pesquisa utiliza Gramática Livre de Contexto (Gramática da Árvore Sintática) para gerar a Linguagem reconhecida pelo sistema. G = {V,T,R,P} V = {<ROOT>, <SIGM>, <EXP>, <BINARY>, <UNARY>, <LEAF>, <SUM>, <SUB>,<PROD>, <CONST>, <VAR>} T = R U {x1,x2,...,xn} U {(,)} P = <ROOT>

Gramática O conjunto de regras R é formado pelas fórmulas a seguir:

Problemas com a Gramática Na primeira Gramatica utilizada, as funções matemáticas eram: Adição Subtração Multiplicação Divisão Potenciação Raiz Tratar Exceções.

Base de Dados Este trabalho utiliza a base de testes com dados reais, conhecida como Proben1, publicada no Relatório Técnico de Prechelt (1994), focando na base de células cancerígenas. A base de testes descreve informações retiradas de células de câncer de mama, obtidas através de imagens digitalizadas. Para cada uma das 699 amostras da base, são informadas 9 características das células, como por exemplo, espessura, uniformidade, formato, etc. Para cada célula, é também indicado se a mesma possuía câncer maligno ou benigno.

Base de Dados A Base de Dados câncer é composta por 3 arquivos que possuem os mesmos dados, porém em ordem diferentes, para avaliar a real capacidade de classificação do Sistema. Cada Arquivo é dividido em três partes: Conjunto de Treinamento Conjunto de Validação Conjunto de Teste

Algoritmo de Treinamento Início Cria Árvore Inicial Fim SIM Condição de Parada Não Cria Nova Árvore foi atendida? na Vizinhança Não Nova Árvore é melhor que atual? Árvore Atual passa a ser Nova Árvore Sim

Solução Inicial(Inicialização da Árvore) Nenhuma heurística foi utilizada para gerar a árvore inicial O método aqui utilizado é baseado no Algoritmo Ramped Half and half (RHH), explicado em Eiben (2003) na forma Full method. A árvore é gerada aleatoriamente com altura 3.

Condição de Parada É analisada pelo conjunto de Validação Pode ser verificada de duas maneiras: Quantidade de acerto Valor do SSE

Quantidade de Acerto Para cada célula faca se ((expressão.pocessa(padrao i) > 0,5) e (padrao i == 1)) ou ((expressão.pocessa(padrao i) < 0,5) e (padrao i == 0))entao quantidade de acertos = quantidade de acerto + 1; end end

Valor do SSE Soma dos Erros Quadráticos (Sum Square Error SSE). Largamente utilizada na arquitetura de diferentes Redes Neurais Artificiais. Mais detalhes podem ser obtidos em Haykin (1998). n SSE= i=1 esperado i obtido i 2

Otimização(Condição de Troca) Assim como nas Redes Neurais Artificiais, este classificador está sujeito ao erro, que deve ser minimizado. No caso desta pesquisa, a minimização é focada na localização de fórmulas mais adequadas para a classificação. Para analisar essas fórmulas é usado o conjunto de treinamento

Otimização(Condição de Troca) Existem três formas de analisar se uma árvore é melhor que a outro: Quantidade de acerto Valor do SSE Quantidade de acerto e Valor do SSE

Navegação no Espaço de Busca Durante o processo de busca, este trabalho causa perturbações na melhor árvore conhecida (árvore atual), com o objetivo de criar uma árvore em sua vizinhança.

Mutação 1 Arvore Atual: Arvore Nova: sigm * - s8 33,4 s1

Mutação 1 Arvore Atual: sigm Arvore Nova: sigm * - s8 * - s8 33,4 s1 33,4 s1

Mutação 1 Arvore Atual: sigm Arvore Nova: sigm * - s8 * - s8 33,4 s1 33,4 s1

Mutação 1 Arvore Atual: sigm Arvore Nova: sigm * - s8 - * 33,4 s1 33,4 s1

Mutação 1 Arvore Atual: sigm Arvore Nova: sigm * - s8 - * + 33,4 s1 33,4 s1 s2 7,03

Mutação 2 Arvore Atual: Arvore Nova: sigm * - s8 33,4 s1

Mutação 2 Arvore Atual: sigm Arvore Nova: sigm * - s8 * - s8 33,4 s1 33,4 s1

Mutação 2 Arvore Atual: sigm Arvore Nova: sigm * - s8 * - s8 33,4 s1 33,4 s1

Mutação 2 Arvore Atual: sigm Arvore Nova: sigm * - s8 - * s2 33,4 s1 33,4 s1

Algoritmo Subida na Encosta As árvores aceitas como atual sempre melhoram na medida em que o código é executado, sendo assim esta implementação utiliza um Algoritmo de Subida na Encosta.

Algoritmo Subida na Encosta Problema: Ficar preso em Mínimos e Máximos locais. Solução???

Resultados Maiores Percentuais de Acerto Arquivo Percentual de Acerto Características utilizadas cancer1.dt 99,42 % 7 cancer2.dt 96,55 % 8 cancer3.dt 97,12 % 8

Resultados Cancer1 SSE e Quantidade de Acerto Porcentagem de acerto Variáveis utilizadas 98,85% 9 99,42% 7 98,85% 8

Resultados Cancer1 SSE Porcentagem de acerto Variáveis utilizadas 96,55% 8 97,13% 9 93,10% 8

Resultados Cancer1 Quantidade de Acerto Porcentagem de acerto Variáveis utilizadas 96,55% 9 98,28% 8 97,70% 9

Bibliografia Eiben, E., Smith, J. E., Introduction to Evolutionary Computing. Natural Computing Series. MIT Press. Springer. Berlin. 2003. Prechelt, L., Proben1: A set of Neural Network Benchmark Problems and Benchmarking Rules. Technical Report 21/94, Fakultät für Informatik, Universität Karlsruhe, 76128 Karlsruhe, Germany, September, 1994. Oliveira, H. C. B. de; Otimização de Árvores Sintáticas Aplicada ao Problema de Classificação de Padrões; XL Simpósio Brasileiro de Pesquisa Operacional. 2008. Prechelt, L., Proben1: A set of Neural Network Benchmark Problems and Benchmarking Rules. Technical Report 21/94, Fakultät für Informatik, Universität Karlsruhe, 76128 Karlsruhe, Germany, September, 1994.