SIGM-TREE: OTIMIZAÇÃO DE ÁRVORES SINTÁTICAS APLICADA À CLASSIFICAÇÃO DE PADRÕES

Tamanho: px
Começar a partir da página:

Download "SIGM-TREE: OTIMIZAÇÃO DE ÁRVORES SINTÁTICAS APLICADA À CLASSIFICAÇÃO DE PADRÕES"

Transcrição

1 SIGM-TREE: OTIMIZAÇÃO DE ÁRVORES SINTÁTICAS APLICADA À CLASSIFICAÇÃO DE PADRÕES Juliana Oliveira Ferreira 1 Humberto César Brandão de Oliveira 2 Melise Maria Veiga de Paula 3 Universidade Federal de Alfenas Departamento de Ciências Exatas Rua Gabriel Monteiro da Silva, 714 Alfenas MG Brasil CEP: { 1 juliana@bcc.unifal-mg.edu.br, 2 humberto.brandao@gmail.com, 3 melisepaula@gmail.com } RESUMO Esta pesquisa investiga a otimização de Árvores Sintáticas para o problema de Classificação de Padrões. As Árvores Sintáticas utilizadas têm o propósito de representar expressões aritméticas baseadas em uma específica Linguagem Livre de Contexto, e estas, ao serem processadas informam se determinado padrão pertence ou não à determinada classe. O principal objetivo da pesquisa é mostrar que é possível classificar padrões não linearmente separáveis com algoritmos diferentes da Programação Genética e das Redes Neurais. Ao final, este trabalho faz uma comparação com outros classificadores divulgados na literatura. Os resultados obtidos pela otimização de Árvores Sintáticas são promissores, se mostrando robustos se comparados a outros sistemas utilizados sobre as mesmas bases de dados. PALAVRAS CHAVE. Classificação de Padrões, Otimização, Aplicações à Saúde. ABSTRACT This research investigates Parse trees optimization applied to the pattern classification problem. The parse trees are used to represent arithmetic expressions based on a specific context-free language, and these, when processed, infer if a certain pattern belongs or not to a specific class. The main aim of the research is to show that it is possible classify patterns not linearly separable with different algorithms of the Genetic Programming and the Neural Nets. In the end, this work presents a comparison between the approach presented and other classifiers in the literature. The results obtained using parse tree optimization are promising, being this approach robust if compared to other systems using the same data base. PALAVRAS CHAVE. Pattern Classification, Optimization, Applications to Health. XLI SBPO Pesquisa Operacional na Gestão do Conhecimento Pág. 1478

2 1. Introdução A busca por ferramentas para o problema de Classificação de Padrões vem crescendo a cada dia e, nas últimas décadas, diferentes abordagens vêm sendo consideradas para auxiliar a análise deste problema em diferentes contextos. No que se refere à aplicação, na medicina, por exemplo, pode-se determinar, com considerável precisão, se determinado paciente é diabético ou não de acordo com determinadas características ou, ate mesmo, determinar se um tumor retirado de um paciente representa uma anomalia maligna ou benigna antes mesmo do resultado da biópsia, fornecendo mais tempo de tratamento adequado a este paciente. Por outro lado, em relação às abordagens definidas para solucionar o problema, historicamente, diferentes métodos foram criados para a classificação automática em diversas áreas do conhecimento como na Programação Genética [Koza (1992)] [Teredesai (2004)] e nos diferentes tipos de Redes Neurais [Haykin (1998)]. Na busca por sistemas mais robustos, novos algoritmos e modelos de treinamento de máquinas artificiais ainda vêm sendo discutidos. Alinhados a esta tendência, o objetivo deste trabalho foi desenvolver uma técnica para o reconhecimento de padrões, que utiliza a base de dados reais, conhecida como Proben1, publicada no Relatório Técnico de Prechelt (1994), focando na base de células cancerígenas e diabetes. Este artigo está organizado como se segue: na seção 2, é apresentado o conceito de classificadores de padrões, sendo este, o problema ao qual a pesquisa busca solucionar, na seção 3, é detalhada a técnica proposta e também a base de dados utilizada para realizar os testes e, na seção 4, é apresentado os resultados obtidos e uma comparação com alguns classificadores existentes na literatura. 2. Revisão Bibliográfica Como o principal objetivo deste trabalho é o desenvolvimento de uma técnica para resolver o problema de classificação de padrões, esta seção busca esclarecer este problema. Outros conceitos importantes são apresentados ao longo do texto Classificação de Padrões Diversas técnicas surgiram com o objetivo de armazenar em um computador o conhecimento necessário para, futuramente, se classificar determinado objeto baseando-se em determinadas características. Os Sistemas Classificadores começam sem nenhum conhecimento, e através de algoritmos de treinamento buscam novas soluções que possam classificar determinadas classes. Essas técnicas consistem, basicamente, em encontrar propriedades comuns entre um conjunto de instâncias em um banco de dados, que são previamente conhecidas, e os classificar em diferentes categorias de acordo com algumas características disponíveis, permitindo assim a classificação de novas entradas. Uma das técnicas mais estudadas atualmente é a Rede Neural Perceptron Multicamada (Multilayer Perceptron MLP). Concorrentemente, outras técnicas vêm sendo desenvolvidas com o intuito de fazer das máquinas verdadeiros bancos de conhecimento. Como exemplo, Redes de Função de Base Radial (Radial Basis Function RBF), Máquina de Vetor Suporte (Support Vector Machine SVM) e a técnica do vizinho mais próximo (knn) Nunes (2004). 3. O Sistema Classificação de Padrões Baseado em Árvores Sintáticas Nesta seção, será apresentada a técnica desenvolvida nesta pesquisa. Contudo, para facilitar o entendimento, serão descritas as informações referentes à base de dados utilizada para realizar os experimentos Base de dados Este trabalho utiliza uma base de dados com dados reais, conhecida como Proben1, publicada no Relatório Técnico de Prechelt (1994), focando na base de células cancerígenas e na base de diabetes. Esta base de dados pode ser encontrada no seguinte link: ftp://ftp.ira.uka.de/pub/neuron/proben1.tar.gz. XLI SBPO Pesquisa Operacional na Gestão do Conhecimento Pág. 1479

3 A base de dados de células cancerígenas descreve informações retiradas de células de câncer de mama, obtidas através de imagens digitalizadas. Para cada uma das 699 amostras da base, são informadas 9 características das células, sendo estas: espessura da massa celular, uniformidade do tamanho da célula, uniformidade do formato da célula, adesão marginal, tamanho de uma célula epitelial, núcleo vazio, cromatina branda, nucléolo normal e mitose. Além de indicar se a mesma possui câncer maligno ou benigno. Das 699 células, 65% possuem câncer benigno. Já a base de dados de diabetes descreve informações pessoais de pacientes além de informações de exames médicos. Nesta base, existem dados de 768 pacientes, sendo que 500 destes pertencem à classe dos não-diabéticos (65,10%) e 268 à classe dos diabéticos (34,90%). Para cada uma das 768 amostras da base, são informadas 8 características dos pacientes, sendo estas: quantidade de gravidez, concentração plasmática de glicose de 2h no teste oral de tolerância a glicose, pressão sanguínea diastólica, espessamento da prega cutânea do tríceps, insulina sérica de 2h, índice de massa corpórea, função de continuidade de diabetes e idade. Além de indicar se o mesmo possui diabetes ou não. Os dados de cada base são divididos em 3 conjuntos: 1. Conjunto de treinamento - utilizado durante o processo de otimização, ou seja, são os dados utilizados para encontrar a melhor solução para distinguir os objetos em diferentes classes; 2. Conjunto de validação são os dados utilizados para parar o processo de otimização,esses dados determinam o momento de finalizar o algoritmo; 3. Conjunto de teste são os dados utilizados para avaliar a capacidade de generalização da melhor solução encontrada pelo conjunto de treinamento; Ambas as bases de dados são compostas por 3 arquivos (cancer1, cancer2, cancer3 e diabetes1, diabetes2, diabetes3). Os três arquivos de cada base de dados possuem os mesmos dados, porém, os padrões encontram-se em ordem diferentes. Esta ordenação diferente é utilizada para que o conjunto de treinamento, validação e teste alterem de acordo com o arquivo utilizado, evitando que os padrões mais fáceis de classificar fiquem todos no conjunto de treinamento. Desta forma é possível avaliar a real capacidade do classificador e a generalização deste Técnica de Classificação de Padrões baseada em Árvores Sintáticas Nesta seção, inicialmente, será apresentado a forma de representação computacional utilizada na definição da técnica elaborada. A seguir, a técnica será descrita Árvores Sintáticas (Representação Computacional) Árvores Sintáticas são amplamente utilizadas em otimização na área denominada Programação Genética que foi proposta, inicialmente, por Koza (1992). Na grande maioria destes trabalhos, as árvores sintáticas são utilizadas para representar programas de computadores, onde o principal objetivo é a criação de um algoritmo que seja capaz de realizar determinada tarefa corretamente. Ou seja, um construtor automático de algoritmos. No entanto, as árvores sintáticas não se restringem a somente representar algoritmos. Podem ser representados sem dificuldades sistemas formais recursivos, como por exemplo: fórmulas aritméticas, fórmulas booleanas, entre outras [Eiben (2003)]. Nesta trabalho, cada árvore representa uma fórmula aritmética, como mostrado na Figura 1. Basicamente, a árvore armazena uma expressão que contém funções matemáticas, constantes e componentes dos padrões (características do objeto/padrão a ser identificado mapeadas em números reais). Figure 1. Representação da função g(x,y) = x*y+3. XLI SBPO Pesquisa Operacional na Gestão do Conhecimento Pág. 1480

4 O objetivo do classificador binário é identificar se uma célula cancerígena possui câncer maligno ou câncer benigno. Além disso, é necessário identificar se um paciente é diabético ou não. Portanto, para uma base (câncer), foram definidas duas classes: classe 1 representando câncer maligno e a classe 0 como câncer benigno. Já para a classificação de pacientes diabéticos, a classe diabético foi definida como classe 0 e a classe não diabético foi definida como classe 1. Com base nesta informação, foi definido que toda árvore tem como raiz a função sigmóide logística definida na equação (1), para que a expressão possa sempre retornar um valor entre 0 e 1. Após o processamento da expressão, o valor retornado é comparado a constante 0,5. Caso o valor retornado seja maior que 0,5, o padrão pertence a classe 1, caso contrário, o padrão pertence a classe 0. Vale ressaltar que o EXP da expressão é o valor retornado pela sub-árvore abaixo da sigmóide. SIGM 1 (1) = ( -1 EXP ( 1+ e ) ) Além de classificar o padrão/objeto, o algoritmo pode identificar que algumas características não são realmente necessárias para distinguir uma classe da outra. Suponha que um médico especialista selecione a espessura, a uniformidade e o formato de uma célula cancerígena como características importantes para saber se a célula possui câncer maligno ou benigno. A técnica utilizada pode indicar, por exemplo, que apenas a espessura e o formato são necessários para classificar com alto grau de exatidão o tipo de câncer. Esta distinção pode representar uma considerável redução de custos na coleta e análise de características de futuros pacientes. Assim como todos os outros sistemas de classificação, o classificador descrito neste trabalho está sujeito a erro, que deve ser minimizado. Esta minimização foi definida a partir da localização de fórmulas mais adequadas para a classificação. As operações específicas para manipulação de Árvores Sintáticas que são aplicadas no processo de otimização foram definidas a partir de dois operadores: Mutação 1 e Mutação 2. Os dois operadores serão detalhados na seção Na seção3.2.2, abaixo, será descrito o universo de expressões possíveis Gramática Para facilitar a representação dos indivíduos em PG, foi introduzida a abordagem orientada a gramáticas [Whigham (1996)] [Wong (2000)]. As gramáticas auxiliam o processo de criação aleatória de indivíduos, impedindo que o sistema aceite expressões inválida. Essas Gramáticas formais são compostas por quatro componentes: V: Símbolos não terminais (variáveis); T: Símbolos terminais; R: Um conjunto de Regras; P: Símbolo de Partida. Neste trabalho, foi utilizada a Gramática Livre de Contexto (GAS - Gramática da Árvore Sintática) para gerar a Linguagem reconhecida pelo sistema. GAS é formalmente descrita nas seguintes formulas: GAS = { V,T,R,P} (2) V =< ROOT >,< SIGM >,< EXP >,< BINARY >,<UNARY >,< LEAF >, (3) < SUM >,< SUB >,< PROD > { s,s,s,,s } {(, )} T = R n (4) P = < ROOT > (5) O conjunto de regras R é formado pelas fórmulas a seguir: < ROOT > < SIGM > (6) 1 (7) < SIGM > ( -1 <EXP> ) ( 1+ e ) < EXP > (< BINARY >) (< UNARY >) (< LEAF >) (8) XLI SBPO Pesquisa Operacional na Gestão do Conhecimento Pág. 1481

5 < BINARY > < SUM > < SUB > < PROD > (9) < UNARY > < SIGM > (10) < LEAF > < CONST > < VAR > (11) < SUM > < EXP > + < EXP > (12) < SUB > < EXP > < EXP > (13) < PROD > < EXP > < EXP > (14) < CONST > { y y R} (15) < VAR > s1 s2... s n (16) Como já descrito anteriormente, toda raiz<root> é representada apenas pela função sigmoidal <SIGM>. A sigmoidal por sua vez pode abrigar qualquer expressão matemática dentro desta linguagem descrita pela gramática, incluindo os operadores binários (multiplicação <PROD>, soma <SUM> e subtração <SUB>) e constantes. As constantes estão sempre presentes nas folhas das Árvores Sintáticas e são divididas em duas classes: constantes reais <CONST> e constantes que representam características do padrão analisado <VAR> (vetor s). O não terminal <VAR> é fundamental para a classificação dos padrões. No exemplo da classificação de células cancerígenas (maligno ou benigno), esta regra implicaria em apenas três componentes: s 1 sendo a espessura, s 2 sendo uniformidade e s 3 sendo formato. Portanto, a quantidade de regras do não terminal <VAR> (n) varia com o problema que está sendo tratado, ou seja, com a cardinalidade de características consideradas para classificação. Em estágios iniciais desta pesquisa, adaptações desta linguagem foram analisadas com o intuito de aumentar o poder de classificação do método estudado, sendo observado que uma gramática simples possui o mesmo potencial das demais, porém não é necessário tratar exceções como divisão por 0, por exemplo Algoritmo de Treinamento O algoritmo de treinamento proposto nesta seção tem um objetivo básico: encontrar uma Árvore Sintática adaptada ao problema de classificação. A Figura3 apresenta um fluxograma geral do algoritmo de otimização. Basicamente, o algoritmo segue os seguintes passos: Figura 3. Algoritmo de Treinamento da Árvore Sintática XLI SBPO Pesquisa Operacional na Gestão do Conhecimento Pág. 1482

6 No passo 1, é criado um conjunto de árvores iniciais denominado população. Em seguida, no passo 2, a condição de parada é verificada, se atendida, a melhor árvore é apresentada e o algoritmo é encerrado, caso contrario, ocorre um laço de repetições: passo 3: seleciona uma árvore denominada pai aleatoriamente passo 4: seleciona um operador de mutação (operador que modifica a árvore pai) passo 5: cria uma árvore modificando a árvore pai passos 6, 7, 8, 9 e 10: se o operador de mutação for Mutação 1 e a nova árvore for melhor do que a árvore pai, a árvore pai é substituída pela nova árvore que passa a fazer parte da população, caso contrario, a nova árvore é descartada e a árvore pai continua fazendo parte da população. Se o operador de mutação for Mutação 2 e a nova árvore for melhor do que a pior árvore da população, a nova árvore substitui a pior árvore da população. Depois de avaliar a nova árvore e colocá-la ou não na população, é verificado novamente se a condição de parada foi atingida. Este laço de repetição ocorre ate que essa condição de parada seja atingida. Abaixo são descritos todas essas etapas com mais detalhes Solução Inicial (Inicialização do vetor de Árvores) O primeiro passo é criar um vetor de árvores (população). A criação dessas árvores não usa nenhuma heurística, deixando este papel para o algoritmo de otimização. O método utilizado para criação inicial dessas árvores foi baseado no Algoritmo Ramped Half-and-half (RHH) [Eiben (2003)], onde o autor descreve duas formas para criação das árvores: Full method e Grow method. Este trabalho utiliza apenas o Full method para a criação das primeiras árvores. Neste algoritmo, as árvores criadas possuem altura fixa, representada pelo parâmetro D max que foi definido com o valor Avaliação da Qualidade da Árvore Sintática (Função Objetivo) A métrica utilizada no algoritmo para avaliar a qualidade das árvores geradas é a quantidade de acertos e a bem conhecida Soma dos Erros Quadráticos (Sum Square Error - SSE), muito utilizada na arquitetura de diferentes Redes Neurais Artificiais. Mais detalhes podem ser obtidos em Haykin (1998). A métrica SSE é descrita na equação 17. n (17) 2 SSE = ( esperado ( i) obtido ( i)) = i 1 Foram definidas três tipos diferentes de análise para selecionar a melhor árvore: Escolhe a árvore com menor SSE; Escolhe a árvore com maior percentual de acerto; Escolhe a árvore com menor SSE e maior percentual de acerto; O tipo de análise deve ser selecionada antes da execução do algoritmo Encontrando novas Árvores Para a diversificação no espaço de busca são criadas novas árvores. Para isto, é escolhido aleatoriamente uma árvore da população. A criação da nova árvore pode ser feita de duas formas: Mutação 1 (Mutação Simples): O algoritmo de vizinhança cria um clone da árvore selecionada, escolhe um nó k aleatoriamente desta árvore clone e substitui este nó por um nó do mesmo tipo, ou seja, se o nó escolhido for uma função matemática, é selecionado, aleatoriamente, outra função matemática para substituí-lo, se o nó for uma variável ou constante, é selecionada uma variável ou uma constante, aleatoriamente, para substituí-la. Mutação 2: O algoritmo de vizinhança cria um clone da árvore selecionada, escolhe um nó k da árvore clone aleatoriamente e substitui a sub-árvore com raiz k por uma nova árvore criada pelo Algoritmo Grow method (cria árvores com altura entre 1 e D max ) ou pelo Algoritmo Full method. Um exemplo deste operador de vizinhança pode ser visto na Figura 4. XLI SBPO Pesquisa Operacional na Gestão do Conhecimento Pág. 1483

7 Figura 4. Criando uma Árvore na vizinhança da árvore base. É importante ressaltar, que a escolha do método de mutação a ser utilizado é efetuada aleatoriamente Condição de Parada A massa de dados utilizada foi dividida em três partes, sendo o conjunto de validação responsável pela parada do algoritmo. Esta parada ocorre quando alguma das árvores da população atingir a quantidade de acerto do conjunto de validação determinada pelo usuário, ou quando o tempo máximo de execução do algoritmo é atingido. Neste trabalho, a condição de parada utilizada foi acertar 100% do conjunto de validação ou atingir o tempo de 40 segundos de execução. A estratégia de utilizar o conjunto de validação para definição do critério de parada, evita que o algoritmo encontre uma Árvore Sintática especialista no conjunto de treinamento, condição indesejável quando o objetivo é a generalização. 4. Resultados e comparação com outros métodos Os experimentos foram realizados utilizando a base de dados proben1. Estes resultados estão descritos nas tabelas 1 e 2. A técnica definida neste trabalho está representada pela sigla ST, com as seguintes variações: ST1: sistema classifica a melhor árvore pela quantidade de acerto. ST2: sistema classifica a melhor árvore pela quantidade de acerto e o valor do SSE. ST3: sistema classifica a melhor árvore pelo valor do SSE. Para comparar os resultados obtidos, foram considerados os seguintes classificadores (Tsakonas, 2006, Lin, 2007): 1. ES1 até ES6 (Programação Genética em Camadas) Classificadores baseado na Programação Genética Multi-populacional com diferentes configurações paramétricas. 2. DT (Árvores de Decisão) As árvores de decisões são classificadores que representam uma tabela de decisão sob a forma de uma árvore. Ou seja, árvores que representam fórmulas booleanas. 3. FRBS (Sistemas Fuzzy Baseados em Regras) A Lógica Fuzzy tem como objetivo modelar o modo aproximado de raciocínio, tentando imitar a habilidade humana de tomar decisões racionais em um ambiente de incerteza e imprecisão. A Idéia principal é que todas as coisas admitem graus. 4. ANN - (Perceptron Multicamada com Backpropagation) As redes neurais artificiais são inspiradas no sistema nervoso biológico. São estruturas baseadas em ligações. Nós simples (neurônios) são interligados para formar uma rede de nós sendo esta estruturada baseada no cérebro humano. 5. FPN (Redes Fuzzy-Petri com Programação Genética) Sistema híbrido envolvendo redes Petri com lógica Fuzzy e Programação Genética. XLI SBPO Pesquisa Operacional na Gestão do Conhecimento Pág. 1484

8 Os dados apresentados relacionados aos classificadores utilizados para comparação foram obtidos a partir de trabalhos encontrados na literatura (Tsakonas, 2006, Lin, 2007). Deste modo, as médias apresentadas foram obtidas com diferentes quantidades de execuções. Para ST, o experimento foi realizado considerando 500 execuções, já para os outros classificadores, foram realizadas 10 execuções. Essa diferença pode tornar a media do ST mais confiável e proporcionar um resultado melhor para a melhor árvore, devido ao fato de se executar o algoritmo um número maior de vezes. A Tabela1 apresenta a média e o desvio padrão do percentual de acerto dos classificadores. A Tabela 2 apresenta os melhores resultados obtidos (maior percentual de acerto atingido) por cada classificador, alem de apresentar a quantidade de características dos padrões utilizadas para cada fórmula encontrada no ST. É importante ressaltar que o conjunto de validação determina a parada do algoritmo e o conjunto de Teste avalia a generalização do método. Tabela 1. Média e Desvio padrão de todos os classificadores (DP = Desvio Padrão) Câncer1 Câncer2 Câncer3 Diabetes1 Diabetes2 Diabetes3 Media DP Media DP Media DP Media DP Media DP Media DP ST1 97,78 0,78 94,64 0,92 95,92 0,86 74,06 2,72 71,58 1,95 75,44 2,3 ST2 98,23 0,65 94,82 0,79 95,69 0,81 74,02 2,46 72,03 2,05 76,21 1,86 ST3 97,62 1,43 95,42 0,73 95,74 0,67 74,3 2,33 72,66 1,80 77,53 1,1 Outros Sistemas ES1 97,7 0,72 94,89 0,69 96,32 0,78 72,5 2,76 71,25 2,44 75,16 2,53 ES2 97,7 0,54 94,6 0,48 96,09 0,71 72,71 2,04 71,46 1,8 75,99 2,72 ES3 97,82 0,85 94,89 0,92 96,38 0,61 73,91 2,24 71,46 1,32 75,36 1,32 ES4 97,76 0,79 94,94 0,59 96,61 0,57 73,13 1,98 71,88 1,15 75,16 2,13 ES5 97,7 0,77 94,77 0,74 96,32 0,40 72,08 1,94 72,29 2,19 75,16 1,04 ES6 97,82 0,80 94,83 0,47 96,03 0,69 71,98 2,44 72,08 1,63 75,47 1,91 DT 96, ,32 2,18 95,61 1,36 68,3 3,24 68,7 3,48 71,21 5,11 FRBS 95,61 1,42 95,55 1,23 95,1 0,83 73,53 3,4 75,22 1,22 75,75 1,64 ANN 94,34 1,24 91,7 2,16 94,72 1,7 75,46 1,26 74,59 1,15 71,24 1,84 FPN 95,69 0,94 95,17 1,19 95,58 1,43 73,18 2,56 72,92 2,65 71,79 2,16 Tabela 2. Maiores Percentuais de acerto atingido e quantidade de características utilizada na formula encontrada (M = Percentual de acerto da melhor árvore, C = Quantidade de características do padrão utilizadas na melhor árvore) Câncer1 Câncer2 Câncer3 Diabetes1 Diabetes2 Diabetes3 M C M C M C M C M C M C ST1 99, , , , , ,73 8 ST2 99, , , , ,6 5 81,25 6 ST3 99, , ,7 9 80, ,6 6 80,73 8 Outros Sistemas ES1 98,85 96,55 97,13 78,13 75,52 77,60 ES2 98,85 95,4 97,13 75,00 75,00 78,65 ES3 99,43 95,98 97,13 77,60 73,96 78,65 ES4 98,85 95,98 97,13 76,04 73,96 78,65 ES5 98,28 95,98 97,13 75,52 75,00 77,08 ES6 98,85 95,4 97,13 76,56 74,48 77,60 DT 97,71 98,28 97,71 73,3 74,35 80,11 FRBS 97,71 98,28 96,56 78,02 76,44 78,01 ANN 97,13 97,13 98,86 77,49 76,97 75,92 FPN 97,13 97,71 97,71 76,97 76,97 75,92 A seguir são apresentados 6 gráficos referentes aos arquivos cancer1, cancer2, cancer3, diabetes1, diabetes2 e diabetes3, respectivamente. Os gráficos representam os resultados apresentados nas tabelas 1 e 2. XLI SBPO Pesquisa Operacional na Gestão do Conhecimento Pág. 1485

9 Câncer1 Média Melhor Resultado 99,43 99,43 99,43 99,43 98,85 98,85 98,85 98,85 98,23 98,28 97,78 97,62 97,7 97,7 97,82 97,76 97,82 97,7 97,71 97,71 97,13 97,13 96,21 95,61 95,69 94,34 ST1 ST2 ST3 EA 1 EA 2 EA 3 EA 4 EA 5 EA 6 DT FRBS ANN FPN Gráfico 1. Média e Melhor resultado do arquivo Câncer Câncer2 97,13 97,13 97,13 96,55 95,98 95,98 95,98 95,42 95,4 95,4 94,64 94,81 94,89 94,6 94,89 94,94 94,77 94,83 Média Melhor Resultado 98,28 98,28 97,71 97,13 95,55 95,32 95,17 91, ST1 ST2 ST3 EA 1 EA 2 EA 3 EA 4 EA 5 EA 6 DT FRBS ANN FPN Gráfico 2. Média e Melhor resultado do arquivo Câncer Câncer3 Média Melhor Resultado 98,86 98,28 98,28 95,92 97,7 97,71 97,71 97,13 97,13 97,13 97,13 97,13 97,13 96,32 96,09 96,32 96,56 95,69 95,74 96,38 96,61 96,03 95,61 95,58 95,1 94,72 ST1 ST2 ST3 EA 1 EA 2 EA 3 EA 4 EA 5 EA 6 DT FRBS ANN FPN Gráfico 3. Média e Melhor resultado do arquivo Câncer3 XLI SBPO Pesquisa Operacional na Gestão do Conhecimento Pág. 1486

10 ,69 79,69 74,06 74,02 74,3 80,73 Diabetes1 Média Melhor Resultado 78,13 77,6 78,02 77,49 76,04 76,56 76, ,52 75,46 73,91 72,5 72,71 73,13 73,3 73,53 73,18 72,08 71,98 68,3 Acerto ST1 ST2 ST3 EA 2 EA 3 EA 4 EA 5 EA 6 DT FRBS ANN FPN Gráfico 4. Média e Melhor resultado do arquivo Diabetes Diabetes2 Média Melhor Resultado 78,13 77,6 77,6 76,44 76,97 76,97 75, ,22 74,59 73,96 73,96 74,48 74,35 72,66 72,92 71,58 72,03 71,25 71,46 71,46 71,88 72,29 72,08 68,7 ST1 ST2 ST3 EA 1 EA 2 EA 3 EA 4 EA 5 EA 6 DT FRBS ANN FPN Gráfico5. Média e Melhor resultado do arquivo Diabetes ,73 81,25 80,73 78,65 78,65 78,65 77,53 77,6 77,08 77,6 76,21 75,44 75,99 75,16 75,36 75,16 75,16 75,47 Diabetes3 Média Melhor Resultado 80,11 78,01 75,75 75,92 75,92 71,21 71,24 71,79 ST1 ST2 ST3 EA 1 EA 2 EA 3 EA 4 EA 5 EA 6 DT FRBS ANN FPN Gráfico6. Média e Melhor resultado do arquivo Diabetes3 Os gráficos a seguir apresentam o intervalo de confiança (IC) para cada arquivo da base de dados Câncer e da base de dados Diabetes. Para a elaboraçao dos gráficos de IC foi realizado um estudo ao qual foi detectado que as amostras adquiridas no experimento seguem uma distribuição Gaussiana (possuem normalidade) e, devido a esta normalidade, foi possivel XLI SBPO Pesquisa Operacional na Gestão do Conhecimento Pág. 1487

11 analisar, através de meios estatísticos, que 95% dos elementos encontram-se entre [(Média 1,96 * Desvio Padrão), (Média + 1,96 * Desvio Padrão)]. Assim, os gráficos a seguir demonstram um intervalo de confiança de 95%. Para os outros trabalhos, também foi assumido que existe normalidade nas amostras. Gráfico 7. Intervalo de Confiança dos resultados encontrados 5. Conclusão Este trabalho apresenta um classificador de Padrões baseado em Árvores Sintáticas. O algoritmo de otimização cria árvores adaptadas para classificar com satisfatório grau de precisão células que possuem câncer maligno ou benigno e pacientes que são diabéticos ou não. Os resultados obtidos pelo classificador desta pesquisa são satisfatórios, apresentando robustez se comparado a outras pesquisas que trabalham com as mesmas bases de dados. Uma das principais vantagens do método proposto neste trabalho é a seleção automática de características importantes para a classificação. Para o problema estudado, apenas 7 das 9 características da base de teste cancer1 foram utilizadas na melhor expressão do algoritmo ST1 e ST2 que obteve uma alta taxa de precisão (99,43% de acerto no conjunto de testes). Desta forma, pode-se diminuir o custo na coleta de informações, antes do processo de futuras classificações. Além desta vantagem, o método aqui proposto, necessita de um baixo tempo de execução para encontrar boas soluções. Para as árvores encontradas, foi necessário em média 40 segundos de processamento. Como trabalho futuro, espera-se uma melhora nas médias alcançadas e a adaptação da técnica para um classificador n-ário. Esta adaptação tem por finalidade permitir a classificação dos padrões em varias classes e não apenas 2 como no classificador binário. XLI SBPO Pesquisa Operacional na Gestão do Conhecimento Pág. 1488

12 6. Referências Eiben, A.E. e Smith, J. E., Introduction to Evolutionary Computing. Natural Computing Series, MIT Press. Springer. Berlin, Haykin, S., Neural Networks: A comprehensive Foundation, 2nd Edition, Prentice Hall, Koza, J. R., Genetic Programming: On the Programming of Computers by Means of Natural Selection, MIT Press, Cambridge, MA, USA, Lin, J.Y., KE, H.R., Chien, B.C. e Yang, W.P.(2007), Designing a classifier by a layered multipopulation genetic programming approach, Pattern Recognition 40 (2007) Nunes,C. M. (2004), Seleção de primitivas utilizando algoritmo Subida na Encosta otimizado em problemas de Reconhecimento de caracteres, Dissertação de Mestrado apresentada ao Programa de Pós-Graduação da Universidade Católica do Paraná. Prechelt, L. Proben1: A set of Neural Network Benchmark Problems and Benchmarking Rules, Technical Report 21/94, Fakultät für Informatik, Universität Karlsruhe, Karlsruhe, Germany, September, Teredesai, A. e Govindaraju, V. (2004), Issues in evolving gp based classifiers for a pattern recognition task, In: Proceedings of the 2004 IEEE Congress on Evolutionary Computation, p Tsakonas, A. (2006), A comparison of classification accuracy of four genetic programming evolved intelligent structures, Inf. Sci. 176 (2006) Whigham, P. A. (1996), Grammatical bias for evolutionary learning, Tese de doutorado. Universidade New South Wales, Austrália. Wong, M. L. e Leung, K. S. (2000), Data mining using grammar based genetic programming and applications, Kluwer Academic Publishers. XLI SBPO Pesquisa Operacional na Gestão do Conhecimento Pág. 1489

Otimização de Árvores Sintáticas aplicada à Detecção de Células Cancerígenas

Otimização de Árvores Sintáticas aplicada à Detecção de Células Cancerígenas Trabalho de Pesquisa Operacional Otimização de Árvores Sintáticas aplicada à Detecção de Células Cancerígenas Juliana Oliveira Ferreira Bacharelado em Ciência da Computação UNIFAL MG Objetivo Gerar uma

Leia mais

UMA ABORDAGEM DE PODA PARA MÁQUINAS DE APRENDIZADO EXTREMO VIA ALGORITMOS GENÉTICOS

UMA ABORDAGEM DE PODA PARA MÁQUINAS DE APRENDIZADO EXTREMO VIA ALGORITMOS GENÉTICOS UMA ABORDAGEM DE PODA PARA MÁQUINAS DE APRENDIZADO EXTREMO VIA ALGORITMOS GENÉTICOS Alisson S. C. Alencar, Ajalmar R. da Rocha Neto Departamento de Computação, Instituto Federal do Ceará (IFCE). Programa

Leia mais

Figura 5.1.Modelo não linear de um neurônio j da camada k+1. Fonte: HAYKIN, 2001

Figura 5.1.Modelo não linear de um neurônio j da camada k+1. Fonte: HAYKIN, 2001 47 5 Redes Neurais O trabalho em redes neurais artificiais, usualmente denominadas redes neurais ou RNA, tem sido motivado desde o começo pelo reconhecimento de que o cérebro humano processa informações

Leia mais

Regras Métodos Identificadores Variáveis Constantes Tipos de dados Comandos de atribuição Operadores aritméticos, relacionais e lógicos

Regras Métodos Identificadores Variáveis Constantes Tipos de dados Comandos de atribuição Operadores aritméticos, relacionais e lógicos Lógica Aula 2 Técnicas de Programação Criando algoritmos Regras Métodos Identificadores Variáveis Constantes Tipos de dados Comandos de atribuição Operadores aritméticos, relacionais e lógicos Criando

Leia mais

Simulador de Redes Neurais Multiplataforma

Simulador de Redes Neurais Multiplataforma Simulador de Redes Neurais Multiplataforma Lucas Hermann Negri 1, Claudio Cesar de Sá 2, Ademir Nied 1 1 Departamento de Engenharia Elétrica Universidade do Estado de Santa Catarina (UDESC) Joinville SC

Leia mais

Estudo de Casos 57. 5.1. Estudo de Caso 1: Velocidade Intervalar e Espessura da Camada

Estudo de Casos 57. 5.1. Estudo de Caso 1: Velocidade Intervalar e Espessura da Camada Estudo de Casos 57 5 Estudo de Casos Neste capítulo são relatados três estudos de caso com sismogramas de referência sintéticos que têm como objetivo avaliar o modelo proposto. Na descrição dos estudos

Leia mais

Redes Neurais. A IA clássica segue o paradigma da computação simbólica

Redes Neurais. A IA clássica segue o paradigma da computação simbólica Abordagens não simbólicas A IA clássica segue o paradigma da computação simbólica Redes Neurais As redes neurais deram origem a chamada IA conexionista, pertencendo também a grande área da Inteligência

Leia mais

Aplicação de Ensembles de Classificadores na Detecção de Patologias na Coluna Vertebral

Aplicação de Ensembles de Classificadores na Detecção de Patologias na Coluna Vertebral Aplicação de Ensembles de Classificadores na Detecção de Patologias na Coluna Vertebral Hedenir M. Pinheiro Instituto de Informática Universidade Federal de Goiás (UFG) Caixa Postal 131 74001-970 Goiânia

Leia mais

Redes Neurais Artificiais: Funções de Base Radial

Redes Neurais Artificiais: Funções de Base Radial Treinamento COELCE CEFET UFC MÓDULO II 2008.1 Redes Neurais Artificiais: Funções de Base Radial Prof. Dr. Guilherme de Alencar Barreto Depto. Engenharia de Teleinformática (DETI/UFC) URL: www.deti.ufc.br/~guilherme

Leia mais

Modelos Pioneiros de Aprendizado

Modelos Pioneiros de Aprendizado Modelos Pioneiros de Aprendizado Conteúdo 1. Hebb... 2 2. Perceptron... 5 2.1. Perceptron Simples para Classificaçãod e Padrões... 6 2.2. Exemplo de Aplicação e Motivação Geométrica... 9 2.3. Perceptron

Leia mais

Redes Neurais Artificiais na Engenharia Nuclear 2 Aula-1 Ano: 2005

Redes Neurais Artificiais na Engenharia Nuclear 2 Aula-1 Ano: 2005 Redes Neurais Artificiais na Engenharia Nuclear 1 - Apresentação do Professor: dados, lista de E-mail s, etc. - Apresentação da Turma: Estatística sobre origem dos alunos para adaptação do curso - Apresentação

Leia mais

Aula 4 Estatística Conceitos básicos

Aula 4 Estatística Conceitos básicos Aula 4 Estatística Conceitos básicos Plano de Aula Amostra e universo Média Variância / desvio-padrão / erro-padrão Intervalo de confiança Teste de hipótese Amostra e Universo A estatística nos ajuda a

Leia mais

E/S CPU. Memória (Instruções e dados) 2 PARADIGMA IMPERATIVO. Instruções e dados. Resultados das operações. Unidade lógica e aritmética

E/S CPU. Memória (Instruções e dados) 2 PARADIGMA IMPERATIVO. Instruções e dados. Resultados das operações. Unidade lógica e aritmética 2 PARADIGMA IMPERATIVO 2.1 CONCEITO As linguagens que pertencem ao paradigma imperativo tomam por base a perspectiva da máquina. Ou seja, no modo como o computador executa programas em linguagem de máquina.

Leia mais

Algoritmos Estruturas Seqüenciais. José Gustavo de Souza Paiva

Algoritmos Estruturas Seqüenciais. José Gustavo de Souza Paiva Algoritmos Estruturas Seqüenciais José Gustavo de Souza Paiva 1 Introdução Objetivo básico da computação auxiliar os seres humanos em trabalhos repetitivos e braçais, diminuindo i i d esforços e economizando

Leia mais

Programação I. Departamento de Engenharia Rural Centro de Ciências Agrárias

Programação I. Departamento de Engenharia Rural Centro de Ciências Agrárias Departamento de Engenharia Rural Centro de Ciências Agrárias Programação I Prof. Bruno Vilela Oliveira bruno@cca.ufes.br http://www.brunovilela.webnode.com.br Aulas 2-3-4-5-6-7-8 Lógica Algoritmos Portugol

Leia mais

3 Estratégia para o enriquecimento de informações

3 Estratégia para o enriquecimento de informações 34 3 Estratégia para o enriquecimento de informações Podemos resumir o processo de enriquecimento de informações em duas grandes etapas, a saber, busca e incorporação de dados, como ilustrado na Figura

Leia mais

Trabalho de Implementação Jogo Reversi

Trabalho de Implementação Jogo Reversi Trabalho de Implementação Jogo Reversi Paulo Afonso Parreira Júnior {paulojr@comp.ufla.br} Rilson Machado de Olivera {rilson@comp.ufla.br} Universidade Federal de Lavras UFLA Departamento de Ciência da

Leia mais

ALGORITMOS E FLUXOGRAMAS

ALGORITMOS E FLUXOGRAMAS ALGORITMOS E FLUXOGRAMAS Prof. André Backes INTRODUÇÃO Computadores = cérebros eletrônicos? Computadores são máquinas e, por si sós, não podem ser inteligentes. Alguém as projetou e deu a ela todas as

Leia mais

Lista de Exercícios Tratamento de Incerteza baseado em Probabilidade

Lista de Exercícios Tratamento de Incerteza baseado em Probabilidade Lista de Exercícios Tratamento de Incerteza baseado em Probabilidade 1) Explique o termo probabilidade subjetiva no contexto de um agente que raciocina sobre incerteza baseando em probabilidade. 2) Explique

Leia mais

Aprendizagem de Máquina

Aprendizagem de Máquina Aprendizagem de Máquina Professor: Rosalvo Ferreira de Oliveira Neto Disciplina: Inteligência Artificial Tópicos 1. Definições 2. Tipos de aprendizagem 3. Paradigmas de aprendizagem 4. Modos de aprendizagem

Leia mais

LÓGICA DE PROGRAMAÇÃO. Vitor Valerio de Souza Campos

LÓGICA DE PROGRAMAÇÃO. Vitor Valerio de Souza Campos LÓGICA DE PROGRAMAÇÃO Vitor Valerio de Souza Campos Exemplos de algoritmos Faça um algoritmo para mostrar o resultado da multiplicação de dois números. Algoritmo em descrição narrativa Passo 1 Receber

Leia mais

Extração de Conhecimento & Mineração de Dados

Extração de Conhecimento & Mineração de Dados Extração de Conhecimento & Mineração de Dados Nesta apresentação é dada uma breve introdução à Extração de Conhecimento e Mineração de Dados José Augusto Baranauskas Departamento de Física e Matemática

Leia mais

PALAVRAS-CHAVE: Massas Nodulares, Classificação de Padrões, Redes Multi- Layer Perceptron.

PALAVRAS-CHAVE: Massas Nodulares, Classificação de Padrões, Redes Multi- Layer Perceptron. 1024 UMA ABORDAGEM BASEADA EM REDES PERCEPTRON MULTICAMADAS PARA A CLASSIFICAÇÃO DE MASSAS NODULARES EM IMAGENS MAMOGRÁFICAS Luan de Oliveira Moreira¹; Matheus Giovanni Pires² 1. Bolsista PROBIC, Graduando

Leia mais

A presente seção apresenta e especifica as hipótese que se buscou testar com o experimento. A seção 5 vai detalhar o desenho do experimento.

A presente seção apresenta e especifica as hipótese que se buscou testar com o experimento. A seção 5 vai detalhar o desenho do experimento. 4 Plano de Análise O desenho do experimento realizado foi elaborado de forma a identificar o quão relevantes para a explicação do fenômeno de overbidding são os fatores mencionados na literatura em questão

Leia mais

Manual do Usuário - ProJuris Web - Biblioteca Jurídica Página 1 de 20

Manual do Usuário - ProJuris Web - Biblioteca Jurídica Página 1 de 20 As informações contidas neste documento estão sujeitas a alterações sem o prévio aviso, o que não representa um compromisso da Virtuem Informática. As pessoas, organizações ou empresas e eventos de exemplos

Leia mais

Programação Estruturada. Programação Estruturada. Idéias Básicas da Programação Estruturada

Programação Estruturada. Programação Estruturada. Idéias Básicas da Programação Estruturada Programação Estruturada Programação Estruturada Paradigmas de Linguagens de Programação As linguagens desse paradigma são muitas vezes chamadas de linguagens convencionais, procedurais ou imperativas.

Leia mais

Aula 4 Conceitos Básicos de Estatística. Aula 4 Conceitos básicos de estatística

Aula 4 Conceitos Básicos de Estatística. Aula 4 Conceitos básicos de estatística Aula 4 Conceitos Básicos de Estatística Aula 4 Conceitos básicos de estatística A Estatística é a ciência de aprendizagem a partir de dados. Trata-se de uma disciplina estratégica, que coleta, analisa

Leia mais

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE

TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE TÓPICOS AVANÇADOS EM ENGENHARIA DE SOFTWARE Engenharia de Computação Professor: Rosalvo Ferreira de Oliveira Neto Estudos Comparativos Recentes - Behavior Scoring Roteiro Objetivo Critérios de Avaliação

Leia mais

2 Gerenciamento de Log 2.1 Definições básicas

2 Gerenciamento de Log 2.1 Definições básicas 2 Gerenciamento de Log 2.1 Definições básicas Os logs são fontes riquíssimas de informação e são gerados pelos servidores e pelas aplicações conforme eventos significativos acontecem. Em [1], log é definido

Leia mais

Metodologia para seleção de amostras de contratos de obras públicas (jurisdicionados) utilizando a programação linear aplicativo Solver

Metodologia para seleção de amostras de contratos de obras públicas (jurisdicionados) utilizando a programação linear aplicativo Solver REVISTA Metodologia para seleção de amostras de contratos de obras públicas (jurisdicionados) utilizando a programação linear aplicativo Solver André Mainardes Berezowski 1 Resumo Trata da apresentação

Leia mais

1 INTRODUÇÃO 1.1 CONCEITO DE PARADIGMAS DE LINGUAGEM DE PROGRAMAÇÃO PARADIGMAS DE LINGUAGEM DE PROGRAMAÇÃO

1 INTRODUÇÃO 1.1 CONCEITO DE PARADIGMAS DE LINGUAGEM DE PROGRAMAÇÃO PARADIGMAS DE LINGUAGEM DE PROGRAMAÇÃO 1 INTRODUÇÃO 1.1 CONCEITO DE PARADIGMAS DE LINGUAGEM DE PROGRAMAÇÃO Desde o seu surgimento, o manuseio da computação é baseado em linguagens de programação. Ela permite que sejam construídos aplicativos

Leia mais

Introdução. Capítulo. 1.1 Considerações Iniciais

Introdução. Capítulo. 1.1 Considerações Iniciais Capítulo 1 Introdução 1.1 Considerações Iniciais A face humana é uma imagem fascinante, serve de infinita inspiração a artistas há milhares de anos. Uma das primeiras e mais importantes habilidades humanas

Leia mais

Algoritmos e Programação Parte Teórica

Algoritmos e Programação Parte Teórica Universidade Federal do Vale do São Francisco Curso de Engenharia da Produção / Elétrica Algoritmos e Programação Parte Teórica Prof. Jorge Cavalcanti jorge.cavalcanti@univasf.edu.br www.univasf.edu.br/~jorge.cavalcanti

Leia mais

Questionário de Avaliação de Maturidade Setorial: Modelo PRADO-MMGP

Questionário de Avaliação de Maturidade Setorial: Modelo PRADO-MMGP DARCI PRADO Questionário de Avaliação de Maturidade Setorial: Modelo PRADO-MMGP Versão 1.6.4 Setembro 2009 Extraído do Livro "Maturidade em Gerenciamento de Projetos" 2ª Edição (a publicar) Autor: Darci

Leia mais

AMOSTRAGEM ESTATÍSTICA EM AUDITORIA PARTE ll

AMOSTRAGEM ESTATÍSTICA EM AUDITORIA PARTE ll AMOSTRAGEM ESTATÍSTICA EM AUDITORIA PARTE ll! Os parâmetros para decisão do auditor.! Tipos de planos de amostragem estatística em auditoria. Francisco Cavalcante(f_c_a@uol.com.br) Administrador de Empresas

Leia mais

ARQUITETURA DE COMPUTADORES

ARQUITETURA DE COMPUTADORES 1 ARQUITETURA DE COMPUTADORES U C P Prof. Leandro Coelho Plano de Aula 2 Aula Passada Definição Evolução dos Computadores Histórico Modelo de Von-Neumann Básico CPU Mémoria E/S Barramentos Plano de Aula

Leia mais

Resolução de sistemas lineares

Resolução de sistemas lineares Resolução de sistemas lineares J M Martínez A Friedlander 1 Alguns exemplos Comecemos mostrando alguns exemplos de sistemas lineares: 3x + 2y = 5 x 2y = 1 (1) 045x 1 2x 2 + 6x 3 x 4 = 10 x 2 x 5 = 0 (2)

Leia mais

Do neurônio biológico ao neurônio das redes neurais artificiais

Do neurônio biológico ao neurônio das redes neurais artificiais Do neurônio biológico ao neurônio das redes neurais artificiais O objetivo desta aula é procurar justificar o modelo de neurônio usado pelas redes neurais artificiais em termos das propriedades essenciais

Leia mais

Administração da Produção I

Administração da Produção I Administração da Produção I Manutenção Manutenção Manutenção: Termo usado para abordar a forma pela qual organizações tentam evitar as falhas cuidando de suas instalações físicas. É uma parte importante

Leia mais

2 Classificação de Imagens de Sensoriamento Remoto

2 Classificação de Imagens de Sensoriamento Remoto 2 Classificação de Imagens de Sensoriamento Remoto 2.1. Processamento Digital de Imagens Processamento Digital de Imagens entende-se como a manipulação de uma imagem por computador de modo que a entrada

Leia mais

CADERNOS DE INFORMÁTICA Nº 1. Fundamentos de Informática I - Word 2010. Sumário

CADERNOS DE INFORMÁTICA Nº 1. Fundamentos de Informática I - Word 2010. Sumário CADERNO DE INFORMÁTICA FACITA Faculdade de Itápolis Aplicativos Editores de Texto WORD 2007/2010 Sumário Editor de texto... 3 Iniciando Microsoft Word... 4 Fichários:... 4 Atalhos... 5 Área de Trabalho:

Leia mais

Complexidade de Algoritmos

Complexidade de Algoritmos Complexidade de Algoritmos Complexidade de Algoritmos Envolvendo Estruturas de Dados Elementares Prof. Osvaldo Luiz de Oliveira Estas anotações devem ser complementadas por apontamentos em aula. Vetor

Leia mais

MODELOS PROBABILÍSTICOS MAIS COMUNS VARIÁVEIS ALEATÓRIAS DISCRETAS

MODELOS PROBABILÍSTICOS MAIS COMUNS VARIÁVEIS ALEATÓRIAS DISCRETAS MODELOS PROBABILÍSTICOS MAIS COMUNS VARIÁVEIS ALEATÓRIAS DISCRETAS Definições Variáveis Aleatórias Uma variável aleatória representa um valor numérico possível de um evento incerto. Variáveis aleatórias

Leia mais

Banco de Dados I 2007. Módulo V: Indexação em Banco de Dados. (Aulas 1, 2 e 3) Clodis Boscarioli

Banco de Dados I 2007. Módulo V: Indexação em Banco de Dados. (Aulas 1, 2 e 3) Clodis Boscarioli Banco de Dados I 2007 Módulo V: Indexação em Banco de Dados (Aulas 1, 2 e 3) Clodis Boscarioli Agenda: Estruturas de Índices; Conceitos; Tipos de Índices: Primários; Secundários; Clustering; Multiníveis;

Leia mais

UNIÃO EDUCACIONAL DO NORTE UNINORTE AUTOR (ES) AUTOR (ES) TÍTULO DO PROJETO

UNIÃO EDUCACIONAL DO NORTE UNINORTE AUTOR (ES) AUTOR (ES) TÍTULO DO PROJETO UNIÃO EDUCACIONAL DO NORTE UNINORTE AUTOR (ES) AUTOR (ES) TÍTULO DO PROJETO RIO BRANCO Ano AUTOR (ES) AUTOR (ES) TÍTULO DO PROJETO Pré-Projeto de Pesquisa apresentado como exigência no processo de seleção

Leia mais

Preparação do Trabalho de Pesquisa

Preparação do Trabalho de Pesquisa Preparação do Trabalho de Pesquisa Ricardo de Almeida Falbo Metodologia de Pesquisa Departamento de Informática Universidade Federal do Espírito Santo Pesquisa Bibliográfica Etapas do Trabalho de Pesquisa

Leia mais

O Tema Progresso e o Princípio de Gerenciar por Estágios. Palavras Chave: Estágios de Gerenciamento. Progresso. Controle. Projetos. PRINCE2.

O Tema Progresso e o Princípio de Gerenciar por Estágios. Palavras Chave: Estágios de Gerenciamento. Progresso. Controle. Projetos. PRINCE2. O Tema Progresso e o Princípio de Gerenciar por Estágios Ronielton Rezende Oliveira 1 Management Plaza Internacional 2 Resumo PRINCE2 é um método estruturado e não proprietário para gerenciamento de projetos

Leia mais

Simulado Banco de Dados I Bimestre 1 Capítulo 1 Projeto Lógico de Banco de Dados

Simulado Banco de Dados I Bimestre 1 Capítulo 1 Projeto Lógico de Banco de Dados Simulado Banco de Dados I Bimestre 1 Capítulo 1 Projeto Lógico de Banco de Dados 01) Defina com suas próprias palavras: a) Banco de Dados b) Sistema Gerenciador de Banco de Dados c) Sistema de Banco de

Leia mais

Engenharia de Software II

Engenharia de Software II Engenharia de Software II Aula 28 Revisão para a Prova 2 http://www.ic.uff.br/~bianca/engsoft2/ Aula 28-28/07/2006 1 Matéria para a Prova 2 Gestão de projetos de software Conceitos (Cap. 21) Métricas (Cap.

Leia mais

Guia de utilização da notação BPMN

Guia de utilização da notação BPMN 1 Guia de utilização da notação BPMN Agosto 2011 2 Sumário de Informações do Documento Documento: Guia_de_utilização_da_notação_BPMN.odt Número de páginas: 31 Versão Data Mudanças Autor 1.0 15/09/11 Criação

Leia mais

Objetivo: descrever como abrir uma solicitação de suporte técnico através da internet.

Objetivo: descrever como abrir uma solicitação de suporte técnico através da internet. Suporte Técnico Hotline Como abrir uma solicitação Denilson Pegaia Objetivo: descrever como abrir uma solicitação de suporte técnico através da internet. Aviso: Este documento apresenta dicas e exemplos

Leia mais

Carga horária : 4 aulas semanais (laboratório) Professores: Custódio, Daniel, Julio foco: introdução a uma linguagem de programação Linguagem Java

Carga horária : 4 aulas semanais (laboratório) Professores: Custódio, Daniel, Julio foco: introdução a uma linguagem de programação Linguagem Java Carga horária : 4 aulas semanais (laboratório) Professores: Custódio, Daniel, Julio foco: introdução a uma linguagem de programação Linguagem Java 1 Objetivo: O aluno deverá adquirir capacidades e habilidades

Leia mais

Roteiro SENAC. Análise de Riscos. Planejamento do Gerenciamento de Riscos. Planejamento do Gerenciamento de Riscos

Roteiro SENAC. Análise de Riscos. Planejamento do Gerenciamento de Riscos. Planejamento do Gerenciamento de Riscos SENAC Pós-Graduação em Segurança da Informação: Análise de Riscos Parte 2 Leandro Loss, Dr. Eng. loss@gsigma.ufsc.br http://www.gsigma.ufsc.br/~loss Roteiro Introdução Conceitos básicos Riscos Tipos de

Leia mais

Relatório Trabalho Prático 2 : Colônia de Formigas para Otimização e Agrupamento

Relatório Trabalho Prático 2 : Colônia de Formigas para Otimização e Agrupamento Relatório Trabalho Prático 2 : Colônia de Formigas para Otimização e Agrupamento Ramon Pereira Lopes Rangel Silva Oliveira 31 de outubro de 2011 1 Introdução O presente documento refere-se ao relatório

Leia mais

Sistema de Controle de Cédulas e Moedas Encaminhadas para Exame de Legitimidade

Sistema de Controle de Cédulas e Moedas Encaminhadas para Exame de Legitimidade Sistema de Controle de Cédulas e Moedas Encaminhadas para Exame de Legitimidade Nota Técnica 26/06/2001 Departamento do Meio Circulante - MECIR 1 / 10 SUBSTITUIÇÃO DA TRANSAÇÃO PCIR577 PELA TROCA DE MENSAGENS

Leia mais

2. Objetivos do Sistema

2. Objetivos do Sistema Desenvolvimento de Um Programa Interpretador e Resolvedor para Máquinas de Estado Finito Adriana Postal 1, Ana Paula Fredrich 1, Cassiano Cesar Casagrande 1, Evaristo Wychoski Benfatti 1, Josué Pereira

Leia mais

PORTABILIDADE NUMÉRICA UMA SOLUÇÃO ORIENTADA PELA SIMPLICIDADE, QUALIDADE E BAIXO CUSTO

PORTABILIDADE NUMÉRICA UMA SOLUÇÃO ORIENTADA PELA SIMPLICIDADE, QUALIDADE E BAIXO CUSTO PORTABILIDADE NUMÉRICA UMA SOLUÇÃO ORIENTADA PELA SIMPLICIDADE, QUALIDADE E BAIXO CUSTO 1 Introdução A portabilidade é a facilidade que possibilita ao assinante de telefonia manter o número do seu telefone

Leia mais

Considerações sobre redimensionamento de motores elétricos de indução

Considerações sobre redimensionamento de motores elétricos de indução Considerações sobre redimensionamento de motores elétricos de indução Artigo publicado na revista Lumiere Electric edição nº 166 Aplicações de investimentos dentro das empresas sempre são questionadas

Leia mais

Aula 9 ESCALA GRÁFICA. Antônio Carlos Campos

Aula 9 ESCALA GRÁFICA. Antônio Carlos Campos Aula 9 ESCALA GRÁFICA META Apresentar as formas de medição da proporcionalidade entre o mundo real e os mapas através das escalas gráficas. OBJETIVOS Ao final desta aula, o aluno deverá: estabelecer formas

Leia mais

UMA HEURÍSTICA GRASP PARA O PROBLEMA ESTENDIDO DE SEQUENCIAMENTO DE CARROS

UMA HEURÍSTICA GRASP PARA O PROBLEMA ESTENDIDO DE SEQUENCIAMENTO DE CARROS UMA HEURÍSTICA GRASP PARA O PROBLEMA ESTENDIDO DE SEQUENCIAMENTO DE CARROS Lucas Middeldorf Rizzo Universidade Federal de Minas Gerais Av. Antônio Carlos, 6627 - Pampulha - Belo Horizonte - MG CEP 31270-901

Leia mais

Engenharia de Software II

Engenharia de Software II Engenharia de Software II Aula 14 Revisão http://www.ic.uff.br/~bianca/engsoft2/ Aula 14-07/05/2006 1 Processo de Software Qual é a diferença entre uma atividade de arcabouço e uma atividade guarda chuva?

Leia mais

Gerenciamento de Projeto: Planejando os Riscos. Prof. Msc Ricardo Britto DIE-UFPI rbritto@ufpi.edu.br

Gerenciamento de Projeto: Planejando os Riscos. Prof. Msc Ricardo Britto DIE-UFPI rbritto@ufpi.edu.br Gerenciamento de Projeto: Planejando os Riscos Prof. Msc Ricardo Britto DIE-UFPI rbritto@ufpi.edu.br Sumário Introdução Planejar o Gerenciamento dos Riscos. Identificar os Riscos Realizar a Análise Qualitativa

Leia mais

2 Fundamentação Conceitual

2 Fundamentação Conceitual 2 Fundamentação Conceitual 2.1 Computação Pervasiva Mark Weiser define pela primeira vez o termo Computação Ubíqua ou Computação Pervasiva (Ubiquitous Computing) em (10). O autor inicia o trabalho com

Leia mais

VISÃO GERAL DE BANCO DE DADOS

VISÃO GERAL DE BANCO DE DADOS Banco de Dados BD_A007 Visão Geral de Banco de Dados 02 de março de 2005 VISÃO GERAL DE BANCO DE DADOS Relação de siglas utilizadas neste trabalho: ABD: Administrador de Banco de Dados. BD: Banco de Dados.

Leia mais

aplicada a problemas de poluição do ar

aplicada a problemas de poluição do ar Biomatemática 17 (2007), 21 34 ISSN 1679-365X Uma Publicação do Grupo de Biomatemática IMECC UNICAMP Programação matemática fuzzy aplicada a problemas de poluição do ar Luiza A. Pinto Cantão 1, Depto.

Leia mais

Projeto de inovação do processo de monitoramento de safra da Conab

Projeto de inovação do processo de monitoramento de safra da Conab Projeto de inovação do processo de monitoramento de safra da Conab Projeto elaborado por Lorenzo Seguini lorenzo_seguini@yahoo.it Projeto Diálogos Setoriais União Europeia - Brasil 1 Sumário 1. Introdução...3

Leia mais

Guia do professor. Introdução

Guia do professor. Introdução Guia do professor Introdução Um dos objetivos comuns ao ensino de química e de física é a caracterização da matéria a partir de suas propriedades. Uma substância pode ser definida como uma porção de matéria

Leia mais

Eduardo Camponogara. DAS-5103: Cálculo Numérico para Controle e Automação. Departamento de Automação e Sistemas Universidade Federal de Santa Catarina

Eduardo Camponogara. DAS-5103: Cálculo Numérico para Controle e Automação. Departamento de Automação e Sistemas Universidade Federal de Santa Catarina Eduardo Camponogara Departamento de Automação e Sistemas Universidade Federal de Santa Catarina DAS-5103: Cálculo Numérico para Controle e Automação 1/48 Sumário Arredondamentos Erros 2/48 Sumário Arredondamentos

Leia mais

Prof. Daniela Barreiro Claro

Prof. Daniela Barreiro Claro Prof. Daniela Barreiro Claro SQL, SQL3 e OQL são linguagens declarativas O SGBD deve processar e otimizar estas consultas antes delas serem efetivamente executadas Uma consulta possui muitas estratégias

Leia mais

Objetivos Específico

Objetivos Específico Banco de Dados Ementa (DBA) Conceitos Gerais sobre Banco de Dados Instalação e configuração da Ferramenta de Banco de Dados. Elaboração de projeto de Banco de Dados. Implementação do projeto de Banco de

Leia mais

O processo envolve quatro questões básicas:

O processo envolve quatro questões básicas: Planejamento de RH O planejamento de recursos humanos coleta e utiliza informações para apoiar as decisões sobre os investimentos que devem ser feitos com atividades de RH O processo envolve quatro questões

Leia mais

FERRAMENTAS DA QUALIDADE

FERRAMENTAS DA QUALIDADE FERRAMENTAS DA QUALIDADE Docente: Dr. José Carlos Marques Discentes: Estêvão Andrade N.º 2089206 Maria da Luz Abreu N.º 2405797 Teodoto Silva N.º 2094306 Vitalina Cunha N.º 2010607 FERRAMENTAS DA QUALIDADE

Leia mais

Teste de Software Parte 1. Prof. Jonas Potros

Teste de Software Parte 1. Prof. Jonas Potros Teste de Software Parte 1 Prof. Jonas Potros Cronograma Verificação e Validação Teste de Software: Definição e Conceitos Técnicas de Teste Fases de Teste Processo de Teste Automatização do Processo de

Leia mais

ESTUDO DE CASO: LeCS: Ensino a Distância

ESTUDO DE CASO: LeCS: Ensino a Distância ESTUDO DE CASO: LeCS: Ensino a Distância HERMOSILLA, Lígia Docente da Faculdade de Ciências Jurídicas e Gerenciais de Garça FAEG - Labienópolis - CEP 17400-000 Garça (SP) Brasil Telefone (14) 3407-8000

Leia mais

Administração da Produção I

Administração da Produção I Administração da Produção I Manutenção Manutenção Manutenção: Termo usado para abordar a forma pela qual organizações tentam evitar as falhas cuidando de suas instalações físicas. É uma parte importante

Leia mais

TÉCNICAS DE PROGRAMAÇÃO

TÉCNICAS DE PROGRAMAÇÃO TÉCNICAS DE PROGRAMAÇÃO (Adaptado do texto do prof. Adair Santa Catarina) ALGORITMOS COM QUALIDADE MÁXIMAS DE PROGRAMAÇÃO 1) Algoritmos devem ser feitos para serem lidos por seres humanos: Tenha em mente

Leia mais

Gravando Dados e Cópias de CD s com o Nero 6.0 Disciplina Operação de Sistemas Aplicativos I

Gravando Dados e Cópias de CD s com o Nero 6.0 Disciplina Operação de Sistemas Aplicativos I CENTRO ESTADUAL DE EDUCAÇÃO TECNOLÓGICA PAULA SOUZA Escola Técnica Estadual de Avaré ETE-AVARÉ CURSO DE TÉCNICO EM INFORMÁTICA NÚCLEO DE APOIO Gravando Dados e Cópias de CD s com o Nero 6.0 Disciplina

Leia mais

Atuadores: Atuadores: Atuadores:

Atuadores: Atuadores: Atuadores: Ministério da Educação Instituto Federal de Educação, Ciência e Tecnologia Sudeste de Minas Gerais - Campus Rio Pomba Bacharelado em Ciência da Computação Inteligência Artificial (Lista 1) Prof. Alex F.

Leia mais

Gerenciamento de Projetos Modulo II Clico de Vida e Organização

Gerenciamento de Projetos Modulo II Clico de Vida e Organização Gerenciamento de Projetos Modulo II Clico de Vida e Organização Prof. Walter Cunha falecomigo@waltercunha.com http://waltercunha.com Bibliografia* Project Management Institute. Conjunto de Conhecimentos

Leia mais

5 Considerações finais

5 Considerações finais 5 Considerações finais A dissertação traz, como foco central, as relações que destacam os diferentes efeitos de estratégias de marca no valor dos ativos intangíveis de empresa, examinando criticamente

Leia mais

MS777: Projeto Supervisionado Estudos sobre aplicações da lógica Fuzzy em biomedicina

MS777: Projeto Supervisionado Estudos sobre aplicações da lógica Fuzzy em biomedicina MS777: Projeto Supervisionado Estudos sobre aplicações da lógica Fuzzy em biomedicina Orientador: Prof. Dr. Laécio C. Barros Aluna: Marie Mezher S. Pereira ra:096900 DMA - IMECC - UNICAMP 25 de Junho de

Leia mais

Manual das planilhas de Obras v2.5

Manual das planilhas de Obras v2.5 Manual das planilhas de Obras v2.5 Detalhamento dos principais tópicos para uso das planilhas de obra Elaborado pela Equipe Planilhas de Obra.com Conteúdo 1. Gerando previsão de custos da obra (Módulo

Leia mais

ESTUDO DE VIABILIDADE. Santander, Victor - Unioeste Aula de Luiz Eduardo Guarino de Vasconcelos

ESTUDO DE VIABILIDADE. Santander, Victor - Unioeste Aula de Luiz Eduardo Guarino de Vasconcelos ESTUDO DE VIABILIDADE Santander, Victor - Unioeste Aula de Luiz Eduardo Guarino de Vasconcelos Objetivos O que é um estudo de viabilidade? O que estudar e concluir? Benefícios e custos Análise de Custo/Benefício

Leia mais

SISTEMA DE PROGRAMAÇÃO E PLANEJAMENTO DE INSPEÇÃO DE

SISTEMA DE PROGRAMAÇÃO E PLANEJAMENTO DE INSPEÇÃO DE SISTEMA DE PROGRAMAÇÃO E PLANEJAMENTO DE INSPEÇÃO DE TUBULAÇÃO Romildo Rudek Junior Petrobras S.A. UN-REPAR Tadeu dos Santos Bastos Petrobras S.A. UN-REVAP Rui Fernando Costacurta Petrobras S.A. UN-REPAR

Leia mais

DESENVOLVENDO COMPETÊNCIAS MATEMÁTICAS Marineusa Gazzetta *

DESENVOLVENDO COMPETÊNCIAS MATEMÁTICAS Marineusa Gazzetta * DESENVOLVENDO COMPETÊNCIAS MATEMÁTICAS Marineusa Gazzetta * RESUMO: Neste texto apresento algumas considerações sobre as competências e habilidades matemáticas a serem desenvolvidas no Ensino Fundamental,

Leia mais

PROCEDIMENTOS DE AUDITORIA INTERNA

PROCEDIMENTOS DE AUDITORIA INTERNA 1/8 Sumário 1 Objetivo 2 Aplicação 3 Documentos complementares 4 Definições 5 Procedimento 1 Objetivo Este Procedimento tem como objetivo descrever a rotina aplicável aos procedimentos de auditoria interna

Leia mais

Auditoria de Segurança e Saúde do Trabalho da SAE/APO sobre Obra Principal, Obras Complementares, Obras do reservatório e Programas Ambientais

Auditoria de Segurança e Saúde do Trabalho da SAE/APO sobre Obra Principal, Obras Complementares, Obras do reservatório e Programas Ambientais 1 / 10 1 OBJETIVO: Este procedimento visa sistematizar a realização de auditorias de Saúde e Segurança do Trabalho por parte da SANTO ANTÔNIO ENERGIA SAE / Gerência de Saúde e Segurança do Trabalho GSST,

Leia mais

Desenvolvimento de uma Etapa

Desenvolvimento de uma Etapa Desenvolvimento de uma Etapa A Fase Evolutiva do desenvolvimento de um sistema compreende uma sucessão de etapas de trabalho. Cada etapa configura-se na forma de um mini-ciclo que abrange as atividades

Leia mais

Medição tridimensional

Medição tridimensional A U A UL LA Medição tridimensional Um problema O controle de qualidade dimensional é tão antigo quanto a própria indústria, mas somente nas últimas décadas vem ocupando a importante posição que lhe cabe.

Leia mais

ITIL v3 - Operação de Serviço - Parte 1

ITIL v3 - Operação de Serviço - Parte 1 ITIL v3 - Operação de Serviço - Parte 1 É na Operação de Serviço que se coordena e realiza as atividades e processos necessários para fornecer e gerenciar serviços em níveis acordados com o usuário e clientes

Leia mais

BIOESTATÍSTICA: ARMADILHAS E COMO EVITÁ-LAS

BIOESTATÍSTICA: ARMADILHAS E COMO EVITÁ-LAS ESTATÍSTICA BIOESTATÍSTICA: ARMADILHAS E COMO EVITÁ-LAS Carlos Alberto Mourão Júnior * Introdução Neste artigo procuramos enfocar alguns pontos críticos referentes à bioestatística que devem ser levados

Leia mais

Curva ROC. George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE

Curva ROC. George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE Curva ROC George Darmiton da Cunha Cavalcanti Tsang Ing Ren CIn/UFPE Introdução ROC (Receiver Operating Characteristics) Curva ROC é uma técnica para a visualização e a seleção de classificadores baseado

Leia mais

4 Avaliação Experimental

4 Avaliação Experimental 4 Avaliação Experimental Este capítulo apresenta uma avaliação experimental dos métodos e técnicas aplicados neste trabalho. Base para esta avaliação foi o protótipo descrito no capítulo anterior. Dentre

Leia mais

Tópicos Avançados em Banco de Dados Gerenciamento de Transações em Banco de Dados. Prof. Hugo Souza

Tópicos Avançados em Banco de Dados Gerenciamento de Transações em Banco de Dados. Prof. Hugo Souza Tópicos Avançados em Banco de Dados Gerenciamento de Transações em Banco de Dados Prof. Hugo Souza Até agora vimos como é formada a infraestrutura física e lógica das bases de dados com os principais componentes

Leia mais

Planificação de. Aplicações Informáticas B

Planificação de. Aplicações Informáticas B Escola básica e secundária de Velas Planificação de Aplicações Informáticas B Ano letivo 2011/2012 1- Introdução à Programação Planificação de Aplicações Informáticas B Unidade Sub-Unidades Objetivos Conteúdos

Leia mais

MANUAL DE UTILIZAÇÃO. Produtos: Saúde Pró Faturamento Saúde Pró Upload. Versão: 20130408-01

MANUAL DE UTILIZAÇÃO. Produtos: Saúde Pró Faturamento Saúde Pró Upload. Versão: 20130408-01 Produtos: Saúde Pró Upload Versão: 20130408-01 Sumário 1 APRESENTAÇÃO... 3 2 LOGIN... 4 3 VALIDADOR TISS... 7 4 CONFIGURAÇÃO DO SISTEMA... 10 4.1 DADOS CADASTRAIS MATRIZ E FILIAL... 11 4.2 CADASTRO DE

Leia mais

A otimização é o processo de

A otimização é o processo de A otimização é o processo de encontrar a melhor solução (ou solução ótima) para um problema. Eiste um conjunto particular de problemas nos quais é decisivo a aplicação de um procedimento de otimização.

Leia mais